CN113132762B - 留存行为因素分析方法、装置、电子设备和可读存储介质 - Google Patents
留存行为因素分析方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN113132762B CN113132762B CN202110413278.1A CN202110413278A CN113132762B CN 113132762 B CN113132762 B CN 113132762B CN 202110413278 A CN202110413278 A CN 202110413278A CN 113132762 B CN113132762 B CN 113132762B
- Authority
- CN
- China
- Prior art keywords
- data
- retention
- behavior
- user
- live broadcast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014759 maintenance of location Effects 0.000 title claims abstract description 255
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000556 factor analysis Methods 0.000 title claims abstract description 33
- 230000009471 action Effects 0.000 claims abstract description 93
- 230000001364 causal effect Effects 0.000 claims abstract description 64
- 230000006399 behavior Effects 0.000 claims description 249
- 238000012545 processing Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 38
- 230000000717 retained effect Effects 0.000 description 34
- 238000010586 diagram Methods 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012384 transportation and delivery Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Graphics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种留存行为因素分析方法、装置、电子设备和可读存储介质,通过获取数据统计周期内用户直播行为对应的直播行为数据,并获取与数据统计周期对应的留存统计周期内用户留存行为对应的留存数据。根据直播行为数据和留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值,根据因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。本方案通过基于直播行为数据和留存数据,得到量化形式的因果关联数值,进而得到判断结果,如此,从因果关系出发、以量化数值方式,可准确判断出导致留存行为的用户行为。
Description
技术领域
本申请涉及直播技术领域,具体而言,涉及一种留存行为因素分析方法、装置、电子设备和可读存储介质。
背景技术
在网络直播领域,直播平台上用户的留存率可以作为有效衡量主播的用户粘性的核心指标。有效提升用户的留存率对于平台运营、主播发展都尤为重要。想要能够有效提升用户的留存率,首先需要确定导致用户在平台上留存的关键因素。
目前,现有的对于用户留存的分析方法中,往往是通过在不同留存情况下获取用户的行为差异,将存在差异的行为作为导致留存的因素。这种方式并未考虑行为数据本身也会被留存行为所影响,并不能准确判断出导致留存行为的用户行为。
发明内容
本申请的目的包括,例如,提供了一种留存行为因素分析方法、装置、电子设备和可读存储介质,其能够准确判断出导致留存行为的用户直播行为。
本申请的实施例可以这样实现:
第一方面,本申请提供一种留存行为因素分析方法,所述方法包括:
获取数据统计周期内用户直播行为对应的直播行为数据;
获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据;
根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值;
根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。
在可选的实施方式中,所述直播行为数据包括第一数据统计周期内的第一直播行为数据、第二数据统计周期内的第二直播行为数据;
所述留存数据包括与第一数据统计周期对应的第一留存统计周期内的第一留存数据、与所述第二数据统计周期对应的第二留存统计周期内的第二留存数据;
所述根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值的步骤,包括:
根据所述第一直播行为数据、第二直播行为数据、第一留存数据以及第二留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值。
在可选的实施方式中,所述根据所述第一直播行为数据、第二直播行为数据、第一留存数据以及第二留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值的步骤,包括:
在所述第二直播行为数据相对于所述第一直播行为数据存在差异,且所述第二留存数据相对于所述第一留存数据存在差异时,获得多个用户中在所述第二留存统计周期相较于所述第一留存统计周期流失的目标用户的人数;
根据所述目标用户的人数以及所述多个用户的总人数,得到用户的直播行为与留存行为之间的因果关联数值。
在可选的实施方式中,所述根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素的步骤,包括:
获取预先设置的假设判断结果,所述假设判断结果为用户的直播行为为导致用户的留存行为的因素,或用户的直播行为不为导致用户的留存行为的因素;
检测所述因果关联数值是否小于预设阈值,若小于所述预设阈值,则拒绝所述假设判断结果。
在可选的实施方式中,所述方法还包括:
计算所述直播行为数据和所述留存数据之间的相关性数值;
在所述相关性数值大于或等于预设数值时,执行根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值的步骤。
在可选的实施方式中,所述直播行为数据包含多个用户的直播指标数值,所述留存数据包含所述多个用户的留存数值;
所述计算所述直播行为数据和所述留存数据之间的相关性数值的步骤,包括:
分别对由所述多个直播指标数值构成的第一向量和由多个留存数值构成的第二向量进行中心化处理;
计算中心化处理后的第一向量的第一长度,以及中心化处理后的第二向量的第二长度;
根据所述第一向量和第二向量中心化处理的结果以及所述第一长度、第二长度,得到所述直播行为数据和所述留存数据之间的相关性数值。
在可选的实施方式中,所述留存统计周期为所述数据统计周期结束之后的预设时段;
所述获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据的步骤,包括:
针对各所述用户,检测该用户在所述数据统计周期结束之后的预设时段内是否具有登录操作,若检测到登录操作,则将该用户的留存行为对应的留存数据设置为第一预设数值,否则,将该用户的留存数据设置为第二预设数值。
在可选的实施方式中,所述直播行为数据包括登录行为数据、观看行为数据、弹幕行为数据或付费行为数据中的至少一种。
第二方面,本申请提供一种留存行为因素分析装置,所述装置包括:
第一数据获取模块,用于获取数据统计周期内用户直播行为对应的直播行为数据;
第二数据获取模块,用于获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据;
第一计算模块,用于根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值;
判断模块,用于根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。
第三方面,本申请提供一种电子设备,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行前述实施方式中任意一项所述的方法步骤。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有机器可执行指令,所述机器可执行指令被执行时实现前述实施方式中任意一项所述的方法步骤。
本申请实施例的有益效果包括,例如:
本申请实施例提供一种留存行为因素分析方法、装置、电子设备和可读存储介质,通过获取数据统计周期内用户直播行为对应的直播行为数据,并获取与数据统计周期对应的留存统计周期内用户留存行为对应的留存数据。根据直播行为数据和留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值,根据因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。本方案通过基于直播行为数据和留存数据,得到量化形式的因果关联数值,进而得到判断结果,如此,从因果关系出发、以量化数值方式,可准确判断出导致留存行为的用户行为。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的留存行为因素分析方法的应用场景示意图;
图2为本申请实施例提供的留存行为因素分析方法的流程图;
图3为本申请实施例提供的留存行为因素分析方法中,相关性检测方法的流程图;
图4为图3中步骤S210包含的子步骤的流程图;
图5为本申请实施例提供的直播行为数据与留存数据之间的相关性数值的示意图;
图6为图2中步骤S130包含的子步骤的流程图;
图7为图2中步骤S140包含的子步骤的流程图;
图8为本申请实施例提供的电子设备的结构框图;
图9为本申请实施例提供的留存行为因素分析装置的功能模块框图。
图标:100-直播提供终端;200-直播服务器;110-存储介质;120-处理器;130-留存行为因素分析装置;131-第一数据获取模块;132-第二数据获取模块;133-第一计算模块;134-判断模块;140-通信接口;300-直播接收终端。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
请参阅图1,为本申请实施例提供的留存行为因素分析方法的一种可能的应用场景示意图,该场景中包括直播提供终端100、直播服务器200、直播接收终端300。直播服务器200分别与直播提供终端100和直播接收终端300通信连接,用于为直播提供终端100以及直播接收终端300提供直播服务。例如,直播提供终端100可以将直播视频流发送给直播服务器200,观众可以通过直播接收终端300访问直播服务器200以观看直播视频。
其中,直播服务器200推送的直播视频流可以是当前正在直播平台中直播的视频流或者直播完成后形成的完整视频流。
可以理解,图1所示的场景仅为一种可行的示例,在其它可行的实施例中,该场景也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。
本实施例中,直播提供终端100和直播接收终端300可以是,但不限于,智能手机、个人数字助理、平板电脑、个人计算机、笔记本电脑、虚拟现实终端设备、增强现实终端设备等。
其中,直播提供终端100和直播接收终端300中可以安装用于提供互联网直播服务的互联网产品,例如,互联网产品可以是计算机或智能手机中使用的与互联网直播服务相关的应用程序APP、Web网页、小程序等。
本实施例中,在该场景中还可以包括用于采集主播视频帧的视频采集设备,视频采集设备可以是,但不限于摄像头、数码照相机的镜头、监控摄像头或者网络摄像头等。
视频采集设备可以直接安装或集成于直播提供终端100。例如,视频采集设备可以是配置在直播提供终端100上的摄像头,直播提供终端100中的其他模块或组件可以经由内部总线接收从视频采集设备处发送的视频、图像。或者,视频采集设备也可以独立于直播提供终端100,两者之间通过有线或无线的方式进行通信。
图2示出了本申请实施例提供的留存行为因素分析方法的流程示意图,该留存行为因素分析方法可由图1中所示的直播服务器200执行。应当理解,在其它实施例中,本实施例的留存行为因素分析方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。该留存行为因素分析方法的详细步骤介绍如下。
步骤S110,获取数据统计周期内用户直播行为对应的直播行为数据。
步骤S120,获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据。
步骤S130,根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值。
步骤S140,根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。
在直播领域中,对于用户在直播平台上的留存情况的研究十分重要,其中,用户在直播平台上的直播行为与用户的留存行为之间往往是存在关联,而某些直播行为可能是直接导致用户留存行为的原因。
在本实施例中,所述的用户主要是指观看直播的观众,而用户的留存则指的是观众的留存情况。可以通过采集直播平台上历史已产生的用户的直播行为数据和留存数据,用以判断直播行为是否为导致用户的留存行为的因素。本实施例中,可以针对直播平台上多个用户的直播行为数据和留存数据进行处理,例如直播平台上的五十个用户或一百个用户等不限。
其中,数据统计周期可以是以当前时间点为节点的一段历史时段,如当前时间点的历史一个月、历史两个月等不限。而与数据统计周期对应的留存统计周期可以是在数据统计周期结束之后的一段时段。例如,若当前时间点记为t(以天为单位),数据统计周期为当前时间点的历史两个月前,则该数据统计周期可记为(t-60,t-30)。若与该数据统计周期对应的留存统计周期为数据统计周期结束之后的一周,则该留存统计周期可记为(t-30,t-23)。
可选地,数据统计周期和留存统计周期的设置方式可以根据需求进行设置,本实施例对此不作具体限制。
可选地,本实施例中,直播行为数据可包括登录行为数据、观看行为数据、弹幕行为数据或付费行为数据中的至少一种。
其中,登录行为数据可以包括用户在设定时段内的登录天数,该设定时段可对应上述的数据统计周期,如历史前一个月、历史前两个月至历史前一个月之间等。
观看行为数据可以包括设定时段内观看主播数、设定时段内观看品类数、设定时段内日均观看时长等中的一种或多种。其中,所述的品类可包括如歌曲、舞蹈、美食、运动、教育等,主播可以在各个品类下进行相关内容直播。
此外,所述的弹幕行为数据可包括设定时段内发弹幕次数,如历史前一个月发弹幕次数或历史前两个月至历史前一个月之间发弹幕次数等。
所述的付费行为数据可包括设定时段内送礼物次数、设定时段内充值次数、设定时段内消费金额等。例如,历史前一个月内送礼物次数、充值次数或消费金额等,或历史前两个月至历史前一个月之间送礼物次数、充值次数或消费金额等。
本实施例上述的直播行为数据仅为举例说明,实际执行过程中可根据需求进行设置。在执行过程中,直播行为数据可以设置为上述任意一种或多种,可针对所设置的各种直播行为数据进行处理,以判断各直播行为数据对应的直播行为是否为导致留存行为的因素。
在获得历史一段时段内用户的直播行为数据,以及在该时段之后的一段时期内用户对应的留存数据后,可以基于直播行为数据和留存数据,采用因果推断分析方法,计算直播行为与留存行为之间的因果关联数值。进而根据因果关联数值判断直播行为是否为导致留存行为的因素。
本实施例中,基于直播行为数据和留存数据,采用因果推断方法得到量化形式的因果关联数值,进而得到判断结果。从因果关系出发、以量化数值方式,可准确判断出导致留存行为的用户直播行为。
在判断用户的某种直播行为是否为导致留存行为的因素时,首先,该种直播行为应当是与留存行为具有相关性的,也即,在两者之间存在较高的相关性的情况下,两者之间可能存在因果关系。基于此考虑,请参阅图3,本实施例所提供的留存行为因素分析方法还包括以下步骤:
步骤S210,计算所述直播行为数据和所述留存数据之间的相关性数值。
步骤S220,检测所述相关性数值是否大于或等于预设数值,若大于或等于预设数值,则执行上述步骤S130。
作为一种可能的实现方式,本实施例中,可采用pearson相关性分析方法实现直播行为数据和留存数据之间相关性的计算。
由上述可知,直播行为数据可以是采集的直播平台上的多个用户的行为数据,将直播行为数据转换为对应的直播指标数值,则直播行为数据包含多个用户的直播指标数值。例如,直播行为数据可以是直播平台上的一百个用户的直播行为数据,具体地,例如可以是一百个用户在一个月内的登录天数。
相应地,留存数据可以是该一百个用户在留存统计周期内的留存数值。由上述可知,留存统计周期可以是数据统计周期结束之后的预设时段,例如数据统计周期结束之后的一周。用户的留存数据可以通过以下方式获得:
针对各个用户,检测该用户在数据统计周期结束之后的预设时段内是否具有登录操作,若检测到登录操作,则将该用户的留存行为对应的留存数据设置为第一预设数值,否则,将该用户的留存数据设置为第二预设数值。
作为一种可能的实现方式,本实施例中,可检测各个用户在数据统计周期结束后的一周内是否有登录操作,若有登录操作,表明该用户在该留存统计周期内留存。而若未检测到用户具有登录操作,表明该用户在该留存统计周期内未留存。
本实施例中,在确定用户在留存统计周期内留存时,可相应地将该用户的留存数值设置为1,即上述的第一预设数值可设置为1。而若用户在留存统计周期内未留存,则可将该用户的留存数值设置为0,即上述的第二预设数值可设置为0。
当然,上述的第一预设数值和第二预设数值并不限定为1和0,也可以根据需求设置为其他的适宜的数值,本实施例对此不作限制。
本实施例中,将留存数据转换为对应的数值形式,有利于后续相关性数值以及因果关联数值的计算,以量化形式准确表征因果关联。
通过上述处理后,用户的直播行为数据可为由多个直播指标数值(如多个用户各自在30天内的登录天数)构成的向量,而用户的留存数据可为由该多个用户各自对应的留存数值构成的向量。
在此基础上,请参阅图4,可通过以下方式计算得到直播行为数据和留存数据之间的相关性数值:
步骤S211,分别对由所述多个直播指标数值构成的第一向量和由多个留存数值构成的第二向量进行中心化处理。
步骤S212,计算中心化处理后的第一向量的第一长度,以及中心化处理后的第二向量的第二长度。
步骤S213,根据所述第一向量和第二向量中心化处理的结果以及所述第一长度、第二长度,得到所述直播行为数据和所述留存数据之间的相关性数值。
本实施例中,可将直播行为数据包含的多个直播指标数值记为数组X,该数组X可包含n个用户各自的直播指标数值,X=(x1、x2……xn)。相应地,留存数据包含的多个留存数值可记为数组Y,该数组Y可包含该n个用户各自的留存数值,Y=(y1、y2……yn)。
本实施例中,对第一向量和第二向量进行中心化处理可以通过以下方式实现:
可计算多个直播指标数值的第一平均值,以及多个留存数值的第二平均值。针对各个直播指标数值,可利用各个直播指标数值减去得到的第一平均值,并利用各个留存数值减去得到的第二平均值。以此,实现多个直播指标数值和多个留存数值的中心化处理。
在此基础上,在计算中心化处理后的第一向量的第一长度时,可针对第一向量中的各个直播指标数值,在上述利用各个直播指标数值减去第一平均值的基础上,可对其进行平方并累加后再开根号,也即,在第一向量进行中心化之后,计算其向量模作为所述第一长度。
同理,在计算中心化处理后的第二向量的第二长度时,针对第二向量中的各个留存数值,在上述利用各个留存数值减去第二平均值的基础上,可对其进行平方并累加后再开根号,也即,在第二向量进行中心化之后,计算其向量模作为所述第二长度。
在上述基础上,可将第一向量和第二向量中,相对应的直播指标数值和留存数值,在中心化处理后相乘以作为分子。将得到的第一长度和第二长度相乘作为分母,从而得到直播行为数据和留存数据之间的相关性数值。
作为一种可能的实现方式,可按以下计算公式计算得到直播行为数据和留存数据之间的相关性数值:
通过以上方式,不仅可以计算各类直播行为数据与留存数据之间的相关性数值,还可以计算任意两类直播行为数据之间的相关性数值,如图5所示,示例性示出了多种不同种类的直播行为数据与留存数据之间的相关性数值,以及不同种类直播行为数据相互之间的相关性数值。其中,不同种类直播行为数据之间的相关性数值的计算方式,与直播行为数据与留存数据之间的相关性数值的计算方式相同,在此不再进行赘述。
如图5中所示,其中,每个方格中的数值表示其所在行及所在列的直播行为数据(或留存数据)与留存数据(或直播行为数据)之间的相关性数值。例如,图5中第一行、第二列的方格中的数值0.4,表示的是30天登陆天数与30天日均观看时长之间的相关性数值。
其中,相关性数值越大,表明两者之间越相关,其相关性数值越接近于1。反之,相关性数值越小,表明两者之间越不相关,其相关性数值越接近于0。如图5中所示,各个种类的直播行为数据与自身之间应当是全相关的,因此,各个种类的直播行为数据与自身之间的相关性数值为1。
具体实施时,对于所针对的直播行为数据,可以在该直播行为数据与留存数据之间的相关性数值大于或等于预设数值时,即两者之间相关性较高时,再执行后续的因果关系的检测。如此,可以进一步提高得到的结果的准确性,且可以减少后续的处理负担。
例如,由图5中的示例性数值可知,在多个种类的直播行为数据中,其中,30天或7天登陆天数与留存数据之间的相关性数值为0.66,30天观看品类个数与留存数据之间的相关性数值为0.44,30天观看主播数与留存数据之间的相关性数值为0.37,30天日均观看时长与留存数据之间的相关性数值为0.26。
以上四个种类的直播行为数据与留存数据之间的相关性数值较高,表明该四个种类的直播行为数据与留存数据之间的相关性较高。
本实施例中,通过以上方式若确定待处理的直播行为数据与留存数据之间的相关性数值大于或等于预设数值后,可再基于直播行为数据和留存数据,计算得到直播行为与留存行为之间的因果关联数值。
直播行为是否为导致留存行为的因素,需要通过直播行为数据的变化所导致的留存数据的相应变化情况来判断。因此,在本实施例中,用于计算因果关联数值的直播行为数据包括第一数据统计周期内的第一直播行为数据、第二数据统计周期内的第二直播行为数据。而留存数据包括与第一数据统计周期对应的第一留存统计周期内的第一留存数据、与第二数据统计周期对应的第二留存统计周期内的第二留存数据。
例如,第一数据统计周期可为历史前三个月至历史前两个月之间,对应的第一留存统计周期可为该第一数据统计周期结束之后的一周,第二数据统计周期可为历史前两个月至历史前一个月之间,对应的第二留存统计周期可为该第二数据统计周期结束之后的一周。
作为一种可能的实现方式,可以根据第一直播行为数据、第二直播行为数据、第一留存数据以及第二留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值。
本实施例中,第一留存数据可包含多个用户在第一留存统计周期内的留存数据,而第二留存数据包含该多个用户在第二留存统计周期内的留存数据。
请参阅图6,在基于上述信息,计算所述因果关联数值时,可以通过以下方式实现:
步骤S131,在所述第二直播行为数据相对于所述第一直播行为数据存在差异,且所述第二留存数据相对于所述第一留存数据存在差异时,获得多个用户在所述第二留存统计周期相较于所述第一留存统计周期流失的目标用户的人数。
步骤S132,根据所述目标用户的人数以及所述多个用户的总人数,得到用户的直播行为与留存行为之间的因果关联数值。
本实施例中,可采用granger因果推断分析方法进行直播行为数据和留存数据之间的因果关系的判断。在本实施例中,以直播行为数据为用户在30天内的登录天数为例进行说明。例如,第一直播行为数据可以是历史前三个月至历史前两个月之间多个用户的登录天数,第二直播行为数据可为历史前两个月至历史前一个月之间该多个用户的登录天数。
其中,第二直播行为数据相较第一直播行为数据存在差异,且第二留存数据相对于第一留存数据存在差异的判断方式可以是,例如,多个用户的第二直播行为数据的平均值较第一直播行为数据的平均值存在差异、多个用户的第二留存数据的平均值较第一留存数据的平均值存在差异,或者是针对各个用户而言,该用户的第二直播行为数据相较其第一直播行为数据存在差异、其第二留存数据相较其第一留存数据存在差异。
例如,若针对30个用户而言,假设用户在第一数据统计周期内的登录天数为3天,在第二数据统计周期内的登录天数为5天,即第二直播行为数据相较第一直播行为数据存在差异。在此情形下,若该30个用户中具有一个用户在第一留存统计周期内为留存状态,而在第二留存统计周期内为流失状态,也即,第二留存数据相对于第一留存数据存在差异,而该用户即为多个用户中的目标用户,可获得这类目标用户的人数。
也即,表明在用户的登录天数提升的情况下,其中,具有一个用户不会进行留存,该用户的个数除以多个用户的总人数得到的值为0.033,该值即为所述因果关联数值。该因果关联数值表征,用户的直播行为与用户的留存行为,如“30天内登录天数的增加,且不会留存”的概率为0.033。
而基于上述得到的直播行为与留存行为之间的因果关联数值判断直播行为是否为导致用户的留存行为的因素时,具体地判断方式如下,请参阅图7:
步骤S141,获取预先设置的假设判断结果,所述假设判断结果为用户的直播行为为导致用户的留存行为的因素,或用户的直播行为不为导致用户的留存行为的因素。
步骤S142,检测所述因果关联数值是否小于预设阈值,若小于所述预设阈值,则执行以下步骤S143,否则,执行以下步骤S144。
步骤S143,拒绝所述假设判断结果。
步骤S144,接受所述假设判断结果。
在本实施例中,在针对待处理的直播行为以及留存行为,会预先设置一个假设判断结果,例如,以上述为例,对于“30天内登录天数的增加,且不会留存”的直播行为和留存行为,假设判断结果可为该直播行为可导致留存行为的因素。当然,也可以根据实际情况,将假设判断结果设置为直播行为不为导致留存行为的因素。
而得到的因果关联数值,若大于或等于预设阈值,则表明可以接受原假设判断,而若小于预设阈值,则表明可以拒绝原假设判断。
例如,原假设判断结果为某一直播行为并非导致留存行为的因素,在经过计算之后,直播行为数据与留存行为数据之间的因果关联数值大于或等于预设阈值,则可以接受原假设判断结果,若小于预设阈值,则可拒绝原假设判断结果。
本实施例中,经过实验检测判断,在上述的多种类的直播行为数据中,其中,如30天登陆天数、30天日均观看时长、30天观看品类数以及30天充值次数,可以确定为用户是否留存的留存行为的因素。
本实施例中,采用因果推断的方法,利用量化形式的因果关联数值,以判断直播行为和留存行为之间的因果关系,可以科学、有效地得到导致留存行为的直播行为。
并且,本实施例还结合相关性判断方法,首先判断直播行为与留存行为之间的相关性,在相关性满足一定条件下,执行后续的因果判断。可以进一步地提高因果判断结果的准确性,且降低后续的处理负担。
请参阅图8,为本申请实施例提供的电子设备的示例性组件示意图,该电子设备可为图1中所示的直播服务器200。该电子设备可包括存储介质110、处理器120、留存行为因素分析装置130及通信接口140。本实施例中,存储介质110与处理器120均位于电子设备中且二者分离设置。然而,应当理解的是,存储介质110也可以是独立于电子设备之外,且可以由处理器120通过总线接口来访问。可替换地,存储介质110也可以集成到处理器120中,例如,可以是高速缓存和/或通用寄存器。
留存行为因素分析装置130可以理解为上述电子设备,或电子设备的处理器120,也可以理解为独立于上述电子设备或处理器120之外的在电子设备控制下实现上述留存行为因素分析方法的软件功能模块。
如图9所示,上述留存行为因素分析装置130可以包括第一数据获取模块131、第二数据获取模块132、第一计算模块133和判断模块134。下面分别对该留存行为因素分析装置130的各个功能模块的功能进行详细阐述。
第一数据获取模块131,用于获取数据统计周期内用户直播行为对应的直播行为数据。
可以理解,该第一数据获取模块131可以用于执行上述步骤S110,关于该第一数据获取模块131的详细实现方式可以参照上述对步骤S110有关的内容。
第二数据获取模块132,用于获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据。
可以理解,该第二数据获取模块132可以用于执行上述步骤S120,关于该第二数据获取模块132的详细实现方式可以参照上述对步骤S120有关的内容。
第一计算模块133,用于根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值。
可以理解,该第一计算模块133可以用于执行上述步骤S130,关于该第一计算模块133的详细实现方式可以参照上述对步骤S130有关的内容。
判断模块134,用于根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。
可以理解,该判断模块134可以用于执行上述步骤S140,关于该判断模块134的详细实现方式可以参照上述对步骤S140有关的内容。
在一种可能的实现方式中,所述直播行为数据包括第一数据统计周期内的第一直播行为数据、第二数据统计周期内的第二直播行为数据,所述留存数据包括与第一数据统计周期对应的第一留存统计周期内的第一留存数据、与所述第二数据统计周期对应的第二留存统计周期内的第二留存数据;
上述第一计算模块133可以通过以下方式计算得到所述因果关联数值:
根据所述第一直播行为数据、第二直播行为数据、第一留存数据以及第二留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值。
在一种可能的实现方式中,上述第一计算模块133具体可以用于:
在所述第二直播行为数据相对于所述第一直播行为数据存在差异,且所述第二留存数据相对于所述第一留存数据存在差异时,获得多个用户中在所述第二留存统计周期相较于所述第一留存统计周期流失的目标用户的人数;
根据所述目标用户的人数以及所述多个用户的总人数,得到用户的直播行为与留存行为之间的因果关联数值。
在一种可能的实现方式中,上述判断模块134具体可以用于通过以下方式判断用户的直播行为是否为导致用户的留存行为的因素:
获取预先设置的假设判断结果,所述假设判断结果为用户的直播行为为导致用户的留存行为的因素,或用户的直播行为不为导致用户的留存行为的因素;
检测所述因果关联数值是否小于预设阈值,若小于所述预设阈值,则拒绝所述假设判断结果。
在一种可能的实现方式中,所述留存行为因素分析装置130还可以包括第二计算模块,该第二计算模块可以用于:
计算所述直播行为数据和所述留存数据之间的相关性数值;
在所述相关性数值大于或等于预设数值时,所述第一计算模块133执行根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值的步骤。
在一种可能的实现方式中,所述直播行为数据包含多个用户的直播指标数值,所述留存数据包含所述多个用户的留存数值,上述第二计算模块具体可以用于:
分别对由所述多个直播指标数值构成的第一向量和由多个留存数值构成的第二向量进行中心化处理;
计算中心化处理后的第一向量的第一长度,以及中心化处理后的第二向量的第二长度;
根据所述第一向量和第二向量中心化处理的结果以及所述第一长度、第二长度,得到所述直播行为数据和所述留存数据之间的相关性数值。
在一种可能的实现方式中,所述留存统计周期为所述数据统计周期结束之后的预设时段,上述第二数据获取模块132可以用于通过以下方式获取留存数据:
针对各所述用户,检测该用户在所述数据统计周期结束之后的预设时段内是否具有登录操作,若检测到登录操作,则将该用户的留存行为对应的留存数据设置为第一预设数值,否则,将该用户的留存数据设置为第二预设数值。
在一种可能的实现方式中,所述直播行为数据包括登录行为数据、观看行为数据、弹幕行为数据或付费行为数据中的至少一种。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
进一步地,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有机器可执行指令,机器可执行指令被执行时实现上述实施例提供的留存行为因素分析方法。
具体地,该计算机可读存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该计算机可读存储介质上的计算机程序被运行时,能够执行上述留存行为因素分析方法。关于计算机可读存储介质中的及其可执行指令被运行时,所涉及的过程,可以参照上述方法实施例中的相关说明,这里不再详述。
综上所述,本申请实施例提供的留存行为因素分析方法、装置、电子设备和可读存储介质,通过获取数据统计周期内用户直播行为对应的直播行为数据,并获取与数据统计周期对应的留存统计周期内用户留存行为对应的留存数据。根据直播行为数据和留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值,根据因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素。本方案通过基于直播行为数据和留存数据,得到量化形式的因果关联数值,进而得到判断结果,如此,从因果关系出发、以量化数值方式,可准确判断出导致留存行为的用户行为。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种留存行为因素分析方法,其特征在于,所述方法包括:
获取数据统计周期内用户直播行为对应的直播行为数据,所述用户为观看直播的观众;
获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据;
根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值;
根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素;
所述直播行为数据包括第一数据统计周期内的第一直播行为数据、第二数据统计周期内的第二直播行为数据,所述留存数据包括与第一数据统计周期对应的第一留存统计周期内的第一留存数据、与所述第二数据统计周期对应的第二留存统计周期内的第二留存数据,所述计算得到用户的直播行为与留存行为之间的因果关联数值的步骤,包括:
在所述第二直播行为数据相对于所述第一直播行为数据存在差异,且所述第二留存数据相对于所述第一留存数据存在差异时,获得多个用户中在所述第二留存统计周期相较于所述第一留存统计周期流失的目标用户的人数,根据所述目标用户的人数以及所述多个用户的总人数,得到用户的直播行为与留存行为之间的因果关联数值。
2.根据权利要求1所述的留存行为因素分析方法,其特征在于,所述根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素的步骤,包括:
获取预先设置的假设判断结果,所述假设判断结果为用户的直播行为为导致用户的留存行为的因素,或用户的直播行为不为导致用户的留存行为的因素;
检测所述因果关联数值是否小于预设阈值,若小于所述预设阈值,则拒绝所述假设判断结果。
3.根据权利要求1所述的留存行为因素分析方法,其特征在于,所述方法还包括:
计算所述直播行为数据和所述留存数据之间的相关性数值;
在所述相关性数值大于或等于预设数值时,执行根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值的步骤。
4.根据权利要求3所述的留存行为因素分析方法,其特征在于,所述直播行为数据包含多个用户的直播指标数值,所述留存数据包含所述多个用户的留存数值;
所述计算所述直播行为数据和所述留存数据之间的相关性数值的步骤,包括:
分别对由多个直播指标数值构成的第一向量和由多个留存数值构成的第二向量进行中心化处理;
计算中心化处理后的第一向量的第一长度,以及中心化处理后的第二向量的第二长度;
根据所述第一向量和第二向量中心化处理的结果以及所述第一长度、第二长度,得到所述直播行为数据和所述留存数据之间的相关性数值。
5.根据权利要求1所述的留存行为因素分析方法,其特征在于,所述留存统计周期为所述数据统计周期结束之后的预设时段;
所述获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据的步骤,包括:
针对各所述用户,检测该用户在所述数据统计周期结束之后的预设时段内是否具有登录操作,若检测到登录操作,则将该用户的留存行为对应的留存数据设置为第一预设数值,否则,将该用户的留存数据设置为第二预设数值。
6.根据权利要求1-5任意一项所述的留存行为因素分析方法,其特征在于,所述直播行为数据包括登录行为数据、观看行为数据、弹幕行为数据或付费行为数据中的至少一种。
7.一种留存行为因素分析装置,其特征在于,所述装置包括:
第一数据获取模块,用于获取数据统计周期内用户直播行为对应的直播行为数据,所述用户为观看直播的观众;
第二数据获取模块,用于获取与所述数据统计周期对应的留存统计周期内用户留存行为对应的留存数据;
第一计算模块,用于根据所述直播行为数据和所述留存数据,计算得到用户的直播行为与留存行为之间的因果关联数值;
判断模块,用于根据所述因果关联数值判断用户的直播行为是否为导致用户的留存行为的因素;
所述直播行为数据包括第一数据统计周期内的第一直播行为数据、第二数据统计周期内的第二直播行为数据,所述留存数据包括与第一数据统计周期对应的第一留存统计周期内的第一留存数据、与所述第二数据统计周期对应的第二留存统计周期内的第二留存数据,所述第一计算模块用于:
在所述第二直播行为数据相对于所述第一直播行为数据存在差异,且所述第二留存数据相对于所述第一留存数据存在差异时,获得多个用户中在所述第二留存统计周期相较于所述第一留存统计周期流失的目标用户的人数,根据所述目标用户的人数以及所述多个用户的总人数,得到用户的直播行为与留存行为之间的因果关联数值。
8.一种电子设备,其特征在于,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行权利要求1-6中任意一项所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可执行指令,所述机器可执行指令被执行时实现权利要求1-6中任意一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110413278.1A CN113132762B (zh) | 2021-04-16 | 2021-04-16 | 留存行为因素分析方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110413278.1A CN113132762B (zh) | 2021-04-16 | 2021-04-16 | 留存行为因素分析方法、装置、电子设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113132762A CN113132762A (zh) | 2021-07-16 |
CN113132762B true CN113132762B (zh) | 2022-08-19 |
Family
ID=76776920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110413278.1A Active CN113132762B (zh) | 2021-04-16 | 2021-04-16 | 留存行为因素分析方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113132762B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113626705B (zh) * | 2021-08-10 | 2023-10-20 | 广州虎牙科技有限公司 | 用户留存分析方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2889822A1 (en) * | 2013-12-28 | 2015-07-01 | Evolv Inc. | Employee value-retention risk calculator |
CN108322780A (zh) * | 2018-01-24 | 2018-07-24 | 广州虎牙信息科技有限公司 | 平台用户行为的预测方法、存储介质和终端 |
CN110049372A (zh) * | 2019-04-23 | 2019-07-23 | 广州虎牙信息科技有限公司 | 主播稳定留存率的预测方法、装置、设备及存储介质 |
CN112132622A (zh) * | 2020-09-25 | 2020-12-25 | 北京达佳互联信息技术有限公司 | 数据预估方法及装置 |
-
2021
- 2021-04-16 CN CN202110413278.1A patent/CN113132762B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2889822A1 (en) * | 2013-12-28 | 2015-07-01 | Evolv Inc. | Employee value-retention risk calculator |
CN108322780A (zh) * | 2018-01-24 | 2018-07-24 | 广州虎牙信息科技有限公司 | 平台用户行为的预测方法、存储介质和终端 |
CN110049372A (zh) * | 2019-04-23 | 2019-07-23 | 广州虎牙信息科技有限公司 | 主播稳定留存率的预测方法、装置、设备及存储介质 |
CN112132622A (zh) * | 2020-09-25 | 2020-12-25 | 北京达佳互联信息技术有限公司 | 数据预估方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113132762A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110475155B (zh) | 直播视频热度状态识别方法、装置、设备及可读介质 | |
CN113590497A (zh) | 业务服务的测试方法、装置、电子设备及存储介质 | |
WO2020257991A1 (zh) | 用户识别方法及相关产品 | |
CN112580668B (zh) | 一种背景欺诈检测方法、装置及电子设备 | |
CN109102324B (zh) | 模型训练方法、基于模型的红包物料铺设预测方法及装置 | |
CN113076416A (zh) | 信息热度评估方法、装置和电子设备 | |
CN113132762B (zh) | 留存行为因素分析方法、装置、电子设备和可读存储介质 | |
CN115445212A (zh) | 一种游戏礼包的推送方法、装置、计算机设备和存储介质 | |
CN110245684B (zh) | 数据处理方法、电子设备和介质 | |
CN112434717A (zh) | 一种模型训练方法及装置 | |
CN111803956B (zh) | 游戏外挂行为的确定方法、装置、电子设备及存储介质 | |
CN112395552B (zh) | 数据处理方法以及装置 | |
CN111309706A (zh) | 模型训练方法、装置、可读存储介质及电子设备 | |
CN110717653A (zh) | 风险识别方法及装置和电子设备 | |
CN111833232B (zh) | 一种图像处理装置 | |
CN111125193A (zh) | 多媒体非正常评论的识别方法、装置、设备及存储介质 | |
CN110083517B (zh) | 一种用户画像置信度的优化方法及装置 | |
CN108958929B (zh) | 应用算法库的方法、装置、存储介质及电子设备 | |
CN113342762A (zh) | 针对商户好友的共享消息的智能处理方法及相关装置 | |
CN113360356B (zh) | 阅读作弊行为的识别方法、计算设备及计算机存储介质 | |
CN110569475A (zh) | 一种网民影响力的评估方法、装置、设备和存储介质 | |
CN110852807A (zh) | 用户确定方法、装置、计算机设备及存储介质 | |
CN112165456B (zh) | 一种劫持流量识别方法、装置及电子设备 | |
CN111126107A (zh) | 一种信息确定方法、装置及电子设备 | |
CN118194003A (zh) | 特征选择方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |