CN113542779A - 用户数据的预测方法、计算机设备及存储装置 - Google Patents

用户数据的预测方法、计算机设备及存储装置 Download PDF

Info

Publication number
CN113542779A
CN113542779A CN202110625327.8A CN202110625327A CN113542779A CN 113542779 A CN113542779 A CN 113542779A CN 202110625327 A CN202110625327 A CN 202110625327A CN 113542779 A CN113542779 A CN 113542779A
Authority
CN
China
Prior art keywords
time
anchor
historical
relation
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110625327.8A
Other languages
English (en)
Other versions
CN113542779B (zh
Inventor
李永建
程允胜
仇贲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Technology Co Ltd
Original Assignee
Guangzhou Huya Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Technology Co Ltd filed Critical Guangzhou Huya Technology Co Ltd
Priority to CN202110625327.8A priority Critical patent/CN113542779B/zh
Publication of CN113542779A publication Critical patent/CN113542779A/zh
Application granted granted Critical
Publication of CN113542779B publication Critical patent/CN113542779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • H04N21/44224Monitoring of user activity on external systems, e.g. Internet browsing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种用户数据的预测方法、计算机设备及存储装置。该方法包括:获取在预设历史时间内目标用户的主播关系指数;其中,所述主播关系指数用于表示目标用户与主播之间的关系强度;基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据;基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。因此,上述方案能够实现预测用户与品类之间的关系强度。

Description

用户数据的预测方法、计算机设备及存储装置
技术领域
本申请涉及直播技术领域,特别是涉及一种用户数据的预测方法、计算机设备及存储装置。
背景技术
随着互联网技术的不断发展,视频直播行业越来越多地受到人们关注。主播可以在直播平台进行直播,用户可以在直播平台观看直播,而直播平台具有多元化的直播内容,例如在线娱乐、音乐直播或者游戏直播等,且直播的发展周期较长,如主播成长、用户培养都需要较长的周期,使得难以通过短期的变化预测用户长期的变化趋势。
发明内容
本申请主要解决的技术问题是提供一种用户数据的预测方法、计算机设备及存储装置,能够实现预测用户与品类之间的关系强度。
为了解决上述问题,本申请第一方面提供了一种用户数据的预测方法,该方法包括:获取在预设历史时间内目标用户的主播关系指数;其中,所述主播关系指数用于表示目标用户与主播之间的关系强度;基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据;基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。
为了解决上述问题,本申请第二方面提供了一种计算机设备,该计算机设备包括相互耦接的存储器和处理器,存储器中存储有程序数据,处理器用于执行程序数据以实现上述区块链共识节点的确定方法中的任一步骤。
为了解决上述问题,本申请第三方面提供了一种用户数据的预测装置,该装置包括:获取模块、特征模块和预测模块,其中,获取模块用于获取在预设历史时间内目标用户的主播关系指数;其中,主播关系指数用于表示目标用户与主播之间的关系强度;特征模块用于基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据;预测模块用于基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。
上述方案,通过获取在预设历史时间内目标用户的主播关系指数,基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据,基于特征数据进行品类关系预测,得到目标用户在预设未来时间内目标用户与品类的关系强度,可以利用主播关系指数得到的特征数据预测预设未来时间内的目标用户与品类的关系强度,故实现预测用户与品类的关系强度,而且基于主播关系指数确定用户与品类件的关系强度,也可以提高对用户与品类间关系强度预测的准确性。
附图说明
为了更清楚地说明本申请中的技术方案,下面将对实施例描述中所需要的附图作简单的介绍,显而易见地,下面描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请用户数据的预测方法第一实施例的流程示意图;
图2是本申请图1中步骤S11一实施例的流程示意图;
图3是本申请图1中步骤S12一实施例的流程示意图;
图4是本申请预设滑窗采集方式一实施例的图例示意图;
图5是本申请预设滑窗采集方式又一实施例的图例示意图;
图6是本申请预设滑窗采集方式再一实施例的图例示意图;
图7是本申请预设滑窗采集方式再一实施例的图例示意图;
图8是本申请用户数据的预测方法第二实施例的流程示意图;
图9是本申请用户数据的预测装置一实施例的结构示意图;
图10是本申请用户数据的预测装置另一实施例的结构示意图;
图11是本申请计算机设备一实施例的结构示意图;
图12是本申请存储装置一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请提供以下实施例,下面对各实施例进行具体说明。
请参阅图1,图1是本申请用户数据的预测方法第一实施例的流程示意图。该方法可以包括以下步骤:
S11:获取在预设历史时间内目标用户的主播关系指数;其中,主播关系指数用于表示目标用户与主播之间的关系强度。
用户可以在直播平台中进行直播或观看直播,直播平台可以是直播应用程序或直播网页端,用户可以通过终端设备进入直播平台,终端设备可以是智能手机、平板电脑或其他具有相应操作系统的电子设备。
直播平台的用户一般包括观众用户和主播用户,主播用户为直播内容提供的用户,观众用户为观看直播内容的用户。目标用户可以是直播平台上的任意观众用户。
目标用户的主播关系指数可以用于表示目标用户与主播之间的关系强度。其中,用户的主播关系指数可以反映用户与直播之间的相互关系强度,关系指数的数值越大,反映用户与直播之间的相互关系强度越强,反之,则反映用户与直播之间的相互关系强度越弱。主播关系指数是能够定量的衡量用户与主播、品类、平台之间的粘性强弱的一个综合型指标,可以表示用户当前的状态。在一些实施例中,目标用户的主播关系指数还可以表示用户未来时间内对主播的留存概率。
在对用户数据的预测时,可以获取在预设历史时间内目标用户的主播关系指数,其中,预设历史时间可以是当前时间的过去30天、20天等,本申请以预设历史时间可以是当前时间的过去30天为例进行说明,本申请对此不做限制。
S12:基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据。
在直播中,可以包括多个直播品类的直播,例如直播品类可以包括游戏、户外、音乐、美食等,主播可以在某个品类下进行直播。用户与主播之间的关系指数可以会受到直播品类的影响。因此,可以获取用户与品类间的特征数据进行预测。
基于在预设历史时间内的主播关系指数,可以得到在预设历史时间内目标用户与品类间的特征数据。其中,目标用户与品类间的特征数据可以包括每个品类下目标用户的主播关系指数,可以用于表示目标用户与品类间之间的关系强度。
在一些应用场景中,可以对预设历史内的主播关系指数进行统计,以得到在预设历史时间内的目标用户与品类间的特征数据。
S13:基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。
获取的在预设历史时间内目标用户与品类间的特征数据后,可以基于将特征数据进行品类关系预测,例如将特征数据输入关系指数预测模型进行预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度,以预测得到在预设未来时间内目标用户与品类间的关系强度。其中,预设未来时间可以为当前时间的未来30天,当然,预设未来时间也可以是20天、25天等,本申请对此不做限制。
在本实施例中,获取在预设历史时间内目标用户的主播关系指数,基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据,基于特征数据进行品类关系预测,得到目标用户在预设未来时间内目标用户与品类的关系强度,可以利用主播关系指数得到的特征数据预测预设未来时间内的目标用户与品类的关系强度,故实现预测用户与品类的关系强度,而且基于主播关系指数确定用户与品类件的关系强度,也可以提高对用户与品类间关系强度预测的准确性,从而更全面的对用户及品类进行评估及调整。
在一些实施例中,请参阅图2,上述步骤S11获取在预设历史时间内目标用户的主播关系指数,还可以包括以下步骤:
S111:获取位于历史子时间之前的第一时间段内的关系特征信息。
其中,历史子时间属于预设历史时间,预设历史时间可以是预设的时间区间,例如,预设历史时间可以是当前时间的过去30天,历史子时间可以包括当前时间的过去30天内的每一天。另外,第一时间段可以是预设的时间区间,例如第一时间段可以是前一周时间。获取在预设历史时间内目标用户的主播关系指数时,可以获取位于当前时间的过去30天中每一天的前一周的关系特征信息。
可选地,目标用户可以是在第一时间段内有观看直播行为的观众用户,在第一时间段内没有观看直播行为的用户可以视为不活跃的用户,使得可以减少对不活跃用户的关系特征信息的获取。
可选地,关系特征信息可以包括以下至少一种:目标用户的第一特征、主播的第二特征以及目标用户与主播之间的交互特征。
其中,第一特征包括以下至少一者:第一时间段的每天是否上线、第一时间段的上线天数、第一时间段的上线时长、第一时间段直播的点击次数、第一时间段观看的主播数、第一时间段观看的品类数、第一时间段的观看时长、第一时间段的观看直播的最大时长等。第一时间段的观看时长可以包括第一时间段的观看多个直播的时长,第一时间段的观看直播的最大时长可以包括第一时间段内观看直播中最大的时长。本申请第一特征还可以包括目标用户其他的特征信息,在此不做限制。
第二特征包括以下至少一者:主播等级、主播订阅数、主播的平均用户观看时长、主播的平均每天观看时长、主播的第一时间段的观看时长、第一时间段的独立访客数、第一时间段的开播天数等。本申请第二特征还可以包括主播其他的特征信息,在此不做限制。
交互特征包括以下至少一者:目标用户点击所述主播的次数、目标用户在第一时间段观看主播的时长、目标用户是否订阅主播、目标用户在第一时间段向主播发送的弹幕数、目标用户在第一时间段对主播的送礼数等。其中,目标用户在第一时间段观看主播的时长可以包括目标用户在第一时间段观看主播的天数、第一时间段观看主播小时数、第一时间段观看主播的总时长等。对主播的送礼可以是虚拟礼物的形式。本申请交互特征还可以包括目标用户与主播之间其他的特征信息,在此不做限制。
S112:利用关系特征信息,得到历史子时间的主播关系指数,其中,预设历史时间内的主播关系指数包括预设历史时间内包含的历史子时间的主播关系指数。
利用上述关系特征信息,也即是,利用目标用户的第一特征、主播的第二特征以及目标用户与主播之间的交互特征中的至少一种,对关系特征信息进行主播关系预测,预测得到历史子时间的主播关系指数。而预设历史时间内的主播关系指数包括预设历史时间内包含的历史子时间的主播关系指数,从而得到在预设历史时间内目标用户的主播关系指数。
其中,主播关系预测是由利用第一预测模型执行的,得到历史子时间的主播关系指数。可选地,历史子时间的主播关系指数表示在历史子时间之后的第二时间段内目标用户与主播之间的关系强度。
其中,第一预测模型可以是基于GBDT(Gradient Boosting Decision Tree,梯度提升决策树)算法进行拟合的二分类模型,可以利用第一预测模型预测第二时间段内目标用户与主播之间的关系强度,可以输出一个数值,也即是表示第二时间段内目标用户对主播的留存概率。
具体地,例如预设历史时间为当前时间的过去30天,历史子时间属于过去30天,如历史子时间为T,获取T时间之前第一时间段内如前一周的关系特征信息,将关系特征信息输入第一预测模型进行主播关系预测,利用第一预测模型执行,以得到在历史子时间T之后的第二时间段目标用户与主播之间的关系强度,其中,第二时间段可以是历史子时间段之后的未来30天。也即是,在预设历史时间的每一个历史子时间,都利用关系特征信息,在历史子时间预测的该历史子时间未来30天的关系指数;即利用当前日期T的前一周(T-6至T)的关系特征信息,得到当前日期T的未来30天(T+1至T+30)的关系指数。
例如,预设历史时间为3月1日至3月30日,历史子时间T为3月1日时,可以获取位于历史子时间T之前的第一时间段内的关系特征信息,也即是获取2月24日至3月1日的关系特征信息,基于关系特征信息,预测得到第二时间段3月2日至3月31日的用户对主播的留存概率,可以表示第二时间段内目标用户与主播之间的关系强度,也即是目标用户对主播在历史子时间3月1日的主播关系指数。对预设历史时间内的每一个历史子时间进行预测,以得到目标用户对主播在历史子时间3月1日至3月30日每一天的主播关系指数。
本实施例中,通过获取位于历史子时间之前的第一时间段内的关系特征信息,利用关系特征信息,得到历史子时间的主播关系指数,对预设历史时间内的每一历史子时间获取主播关系指数,可以得到更准确的预设历史时间内的主播关系指数。
在一些实施例中,请参阅图3,上述步骤S12还可以包括以下步骤:
S121:基于在预设历史时间内的主播关系指数,得到预设历史时间内各历史子时间的初始特征数据,其中,特征数据包括各历史子时间目标用户的历史品类关系指数。
在基于在预设历史时间内的主播关系指数,得到预设历史时间内各历史子时间的初始特征数据,其中,特征数据包括各历史子时间目标用户的历史品类关系指数。具体地,可以基于历史子时间内属于品类的主播关系指数,得到历史子时间的历史品类关系指数,例如对历史子时间内的目标用户与主播的主播关系指数进行统计,对属于每一品类的主播关系指数进行求和,从而得到历史子时间内的历史品类关系指数。
在一些实施例中,初始特征数据还包括历史子时间的主播关系指数和,基于历史子时间内的所有主播关系指数,得到历史子时间的主播关系指数和,也即是得到历史子时间内的总的主播关系指数。
S122:利用预设滑窗采集方式对预设历史时间内的历史品类关系指数进行采集,以得到衍生特征数据。
其中,预设滑窗采集方式包括至少一种,每种预设滑窗采集方式对应的窗口的长度不同、且对应的滑动间隔的长度不同,其中,长度为包含历史子时间的个数。在一些实施例中,对应的滑动间隔的长度可以为1天、2天、3天、4天、5天等,对应的窗口的长度可以为1天、3天、5天、7天、10天等。在本申请中,可以根据具体的应用场景设置对应的窗口的长度和/或对应的滑动间隔的长度,本申请对此不做限制。
例如以预设历史时间为过去30天,则包含的历史子时间的个数为30个。则预设滑窗采集方式可以包括以下至少一种:对应的窗口的长度为1天、且对应的滑动间隔的长度为1天;对应的窗口的长度为3天、且对应的滑动间隔的长度为2天;对应的窗口的长度为5天、且对应的滑动间隔的长度为3天;对应的窗口的长度为7天、且对应的滑动间隔的长度为4天;对应的窗口的长度为10天、且对应的滑动间隔的长度为5天。
可选地,对于每种预设滑窗采集方式,利用预设滑窗采集方式对应的窗口和滑动间隔在预设历史时间内采集得到若干组历史品类关系指数,其中,每组品类关系指数对应于一滑动位置的窗口,包括窗口在预设历史时间中对应的历史子时间的历史品类关系指数。
请参阅图4至图7,对以上预设滑窗采集方式的部分进行举例说明。其中,请参阅图4,以对应的窗口的长度为3天、且对应的滑动间隔的长度为2天为例,可以为获取1至3日、3至5日、5至7日、7至9日、…、27至29日等每组的历史品类关系指数进行采集,1至3日可以作为一滑动位置的窗口,也即是1至3日为一组,采集得到1至3日组别的品类关系指数,1至3日组别的品类关系指数可以包括历史子时间1日、2日、3日的历史品类关系指数。从而在预设历史时间内可以采集得到若干组历史品类关系指数。
请参阅图5,以对应的窗口的长度为5天、且对应的滑动间隔的长度为3天为例,可以为获取1至5日、4至8日、7至11日、10至14日等每组的历史品类关系指数进行采集。请参阅图6,以对应的窗口的长度为7天、且对应的滑动间隔的长度为4天为例,可以为获取1至7日、5至11日等每组的历史品类关系指数进行采集。请参阅图7,以对应的窗口的长度为10天、且对应的滑动间隔的长度为5天为例,可以为获取1至10日、6至15日等每组的历史品类关系指数进行采集。以此方式,利用预设滑窗采集方式对应的窗口和滑动间隔在预设历史时间内可以采集得到若干组历史品类关系指数。
对于每组历史品类关系指数,获取组历史品类关系指数的平均品类关系指数,以作为衍生特征数据。请参阅图4至图7,以对应的窗口的长度为3天、且对应的滑动间隔的长度为2天为例,对于1至3日组别的历史品类关系指数,获取此组历史品类关系指数的平均关系指数,也即是获取历史子时间1日、2日、3日的历史品类关系指数的平均关系指数,从而将平均关系指数作为此组的衍生特征数据,从而得到若干组历史品类关系指数的平均品类关系指数,以得到衍生特征数据。
对于每种预设滑窗采集方式,对应的窗口的长度为1天、且对应的滑动间隔的长度为1天的预设滑窗采集方式,如1日至30日的每天为一组的历史品类关系指数,也即是平均关系指数,以及每组品类的关系指数总和,可以获取得到60维衍生特征数据;对应的窗口的长度为3天、且对应的滑动间隔的长度为2天的预设滑窗采集方式,可以得到14维衍生特征数据;对应的窗口的长度为5天、且对应的滑动间隔的长度为3天的预设滑窗采集方式,可以得到9维衍生特征数据;对应的窗口的长度为7天、且对应的滑动间隔的长度为4天的预设滑窗采集方式,可以得到6维衍生特征数据;对应的窗口的长度为10天、且对应的滑动间隔的长度为5天的预设滑窗采集方式,可以得到5维衍生特征数据。若以上述每种预设滑窗采集方式获取衍生特征数据,则可总获取94维衍生特征数据。
S123:将历史品类关系指数和衍生特征数据中的一种或多种,作为特征数据。
将历史品类关系指数和衍生特征数据中的一种或多种,作为特征数据,例如可以将上述采集获取的94维衍生特征数据作为特征数据,也可以将衍生数据及历史子时间内的历史品类关系指数作为特征数据。
本实施例中,利用预设滑窗采集方式对预设历史时间内的历史品类关系指数进行采集,以得到衍生特征数据,对于每种预设滑窗采集方式,利用预设滑窗采集方式对应的窗口和滑动间隔在预设历史时间内采集得到若干组历史品类关系指数,通过联合/组合预设历史时间内的信息的方式提供额外的关系指数趋势特征,可以加快第二预测模型收敛,并取得更好的效果;此外,利用预设滑窗采集方式对预设历史时间内的历史品类关系指数进行采集,该采集方式弱化了异常值的影响,可以提高第二预测模型的鲁棒性,使第二预测模型的预测更加稳定。
在一些实施例中,上述步骤S13基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,还可以包括以下步骤:
利用第二预测模型对特征数据进行品类关系预测,得到目标用户的预测品类关系指数。其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。例如得到的预测品类关系指数可以是预设未来时间内的日均品类关系指数,如预设未来时间为30天,则得到的日均品类关系指数可以为在未来30天内用户在品类的关系指数求和后在30天内的平均关系指数值。
其中,第二预测模型可以是神经网络模型,例如第二预测模型可以是多层感知器(MLP,Multilayer Perceptron)模型,例如是两层MLP模型,其两层的神经元个数可以分别为64个和16个。在一些实施例中,可以对第二预测模型进行训练。其中,目标函数可以是MAE(Mean Absolute Error,平均绝对误差)或RMSE(Root Mean Squared Logarithmic Error,均方根对数误差)。例如,训练数据集可以是2020年11月30日之前的7天,也即是11月24日至11月30日有观看直播行为的用户的特征数据,例如用户为5千万,直播品类的种类为50种,则可以获取用户在每一直播品类的特征数据,每个用户可以构成50条样本特征数据,则一共可构成25亿条样本特征数据。可将其中取样16万用户的800万条样本特征数据作为训练数据集,剩下的样本特征数据作为测试数据集。特征数据可以为过去30天用户的94维的与品类间的特征数据,目标数据为预测品类关系指数,例如是未来30天内用户与品类的关系强度。通过上述训练数据集、测试数据集、特征数据及目标数据对第二预测模型进行训练,以得到符合预测要求的第二预测模型。
请参阅图8,图8是本申请用户数据的预测方法第二实施例的流程示意图。该方法可以包括以下步骤:
S21:获取在预设历史时间内目标用户的主播关系指数;其中,主播关系指数用于表示目标用户与主播之间的关系强度。
S22:基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据。
S23:基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。
该实施例中,步骤S21至步骤S23的具体实施方式可参考上述实施例中步骤S11至步骤S13的实施过程,在此不再赘述。
在本实施例中,步骤S23在基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数之后,还可以包括以下至少一个步骤:
S24:利用目标用户的预测品类关系指数,确定目标用户的用户质量。
利用目标用户的预测品类关系指数,预测品类关系指数可以反映目标用户的流量价格,可以确定目标用户质量,衡量目标用户的长期价值。在一些实施例中,还可以利用目标用户的预测品类关系指数,对直播的推广进行评估,评估获取的用户成本和收益是否达到预期,以根据评估结果调整推广直播品类、直播渠道或直播分发策略等。
S25:基于目标用户的预测品类关系指数,确定目标用户的兴趣品类或与兴趣品类的关联品类;以及,将兴趣品类或关联品类的信息推荐给目标用户。
可以基于目标用户的预测品类关系指数,可以确定目标用户的感兴趣的兴趣品类的直播或者与兴趣品类的关联品类,例如预测得到目标用户对某一直播品类的关系强度达到第一预设强度值,则可以认为该品类的直播为目标用户的兴趣品类,或者目标用户对某一直播品类的关系强度长期超过第一预测强度值,则可以确定该品类的直播为目标用户的兴趣品类;若目标用户对某些品类的关系强度达到第二预设强度值,则可以确定该品类的直播为目标用户兴趣品类的关联品类。其中,第二预设强度值低于第一预设强度值。另外,还可以将兴趣品类或关联品类的信息推荐给目标用户,例如预测目标用户的兴趣品类为游戏品类,获取其兴趣品类的关联品类为音乐品类,则可以将游戏品类或音乐品类的信息推荐给目标用户。此外,若音乐品类的流量收益大于游戏品类的流量收益时,还可以增大音乐品类的信息推荐给目标用户,以将目标用户引流到价值更高的音乐品类。在一些实施例中,将兴趣品类的关联品类的信息推荐给目标用户,使得引导目标用户发现用户的潜在兴趣,从而使得目标用户继续留在直播平台,可以减低用户流失率。
对于上述实施例,请参阅图9,本申请还提供一种用户数据的预测装置。该用户数据的预测装置30包括:获取模块31、特征模块32和预测模块33,其中,获取模块31用于获取在预设历史时间内目标用户的主播关系指数;其中,主播关系指数用于表示目标用户与主播之间的关系强度;特征模块32用于基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据;预测模块33用于基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,其中,预测品类关系指数用于表示在预设未来时间内目标用户与品类的关系强度。
可选地,获取模块31用于获取在预设历史时间内目标用户的主播关系指数,可以包括:获取位于历史子时间之前的第一时间段内的关系特征信息;利用关系特征信息,得到历史子时间的主播关系指数,其中,预设历史时间内的主播关系指数包括预设历史时间内包含的历史子时间的主播关系指数。
其中,历史子时间属于预设历史时间,关系特征信息包括以下至少一种:目标用户的第一特征、主播的第二特征以及目标用户与主播之间的交互特征。其中,第一特征包括以下至少一者:第一时间段的每天是否上线、第一时间段的上线天数、第一时间段的上线时长、第一时间段直播的点击次数、第一时间段观看的主播数、第一时间段观看的品类数、第一时间段的观看时长、第一时间段的观看直播的最大时长。第二特征包括以下至少一者:主播等级、订阅数、平均用户观看时长、平均每天观看时长、第一时间段的观看时长、第一时间段的独立访客数、第一时间段的开播天数。交互特征包括以下至少一者:目标用户点击主播的次数、目标用户在第一时间段观看主播的时长、目标用户是否订阅主播、目标用户在第一时间段向主播发送的弹幕数、目标用户在第一时间段对主播的送礼数。
可选地,获取模块31用于利用关系特征信息,得到历史子时间的主播关系指数,包括:对关系特征信息进行主播关系预测,得到历史子时间的主播关系指数;其中,主播关系预测是由利用第一预测模型执行的,和/或,历史子时间的主播关系指数表示在历史子时间之后的第二时间段内目标用户与主播之间的关系强度。
可选地,特征模块32用于基于在预设历史时间内的主播关系指数,得到在预设历史时间内目标用户与品类间的特征数据,包括:基于在预设历史时间内的所述主播关系指数,得到预设历史时间内各历史子时间的初始特征数据,其中,特征数据包括各历史子时间目标用户的历史品类关系指数;利用预设滑窗采集方式对预设历史时间内的历史品类关系指数进行采集,以得到衍生特征数据;将历史品类关系指数和衍生特征数据中的一种或多种,作为特征数据。
可选地,特征模块32用于基于在预设历史时间内的主播关系指数,得到预设历史时间内各历史子时间的初始特征数据,包括:基于历史子时间内属于品类的主播关系指数,得到历史子时间的历史品类关系指数;
可选地,初始特征数据还包括历史子时间的主播关系指数和,特征模块32用于基于在预设历史时间内的主播关系指数,得到预设历史时间内各历史子时间的初始特征数据,还包括:基于历史子时间内的所有主播关系指数,得到历史子时间的主播关系指数和。
可选地,预设滑窗采集方式包括至少一种,每种预设滑窗采集方式对应的窗口的长度不同、且对应的滑动间隔的长度不同,其中,长度为包含历史子时间的个数。利用预设滑窗采集方式对预设历史时间内的历史品类关系指数进行采集,以得到衍生特征数据,包括:对于每种预设滑窗采集方式,利用预设滑窗采集方式对应的窗口和滑动间隔在预设历史时间内采集得到若干组历史品类关系指数,其中,每组品类关系指数对应于一滑动位置的窗口,包括窗口在预设历史时间中对应的历史子时间的历史品类关系指数;对于每组历史品类关系指数,获取组历史品类关系指数的平均品类关系指数,以作为衍生特征数据。
可选地,预测模块33用于基于特征数据进行品类关系预测,得到目标用户的预测品类关系指数,包括:利用第二预测模型对特征数据进行品类关系预测,得到目标用户的预测品类关系指数。
在一些实施例中,请参阅图10,用户数据的预测装置30还可以包括评估模块34和推荐模块35,评估模块34用于利用目标用户的预测品类关系指数,确定目标用户的用户质量。可选地,评估模块34还可以用于基于目标用户的预测品类关系指数,确定目标用户的兴趣品类或与兴趣品类的关联品类;推荐模块35用于将兴趣品类或关联品类的信息推荐给目标用户。
对于上述实施例,本申请提供一种计算机设备,请参阅图11,图11是本申请计算机设备一实施例的结构示意图。该计算机设备300包括存储器301和处理器302,其中,存储器301和处理器302相互耦接,存储器301中存储有程序数据,处理器302用于执行程序数据以实现上述任一实施例中的步骤。
在本实施例中,处理器302还可以称为CPU(Central Processing Unit,中央处理单元)。处理器302可能是一种集成电路芯片,具有信号的处理能力。处理器302还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器302也可以是任何常规的处理器等。
该实施例的具体实施方式可参考上述实施例的实施过程,在此不再赘述。
对于上述实施例的方法,其可以采用计算机程序的形式实现,因而本申请提出一种存储装置,请参阅图12,图12是本申请存储装置一实施例的结构示意图。该存储装置400中存储有能够被处理器运行的程序数据401,程序数据可被处理器执行以实现上述权能配置方法任一实施例的步骤。
该实施例的具体实施方式可参考上述实施例的实施过程,在此不再赘述。
本实施例存储装置400可以是U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储程序数据的介质,或者也可以为存储有该程序数据的服务器,该服务器可将存储的程序数据发送给其他设备运行,或者也可以自运行该存储的程序数据。
在本申请所提供的几个实施例中,应该理解的,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储装置中,该存储装置是一种计算机可读取存储介质。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (11)

1.一种用户数据的预测方法,其特征在于,包括:
获取在预设历史时间内目标用户的主播关系指数;其中,所述主播关系指数用于表示所述目标用户与主播之间的关系强度;
基于在所述预设历史时间内的所述主播关系指数,得到在所述预设历史时间内所述目标用户与品类间的特征数据;
基于所述特征数据进行品类关系预测,得到所述目标用户的预测品类关系指数,其中,所述预测品类关系指数用于表示在预设未来时间内所述目标用户与所述品类的关系强度。
2.根据权利要求1所述的方法,其特征在于,所述获取在预设历史时间内目标用户的主播关系指数,包括:
获取位于历史子时间之前的第一时间段内的关系特征信息,其中,所述历史子时间属于所述预设历史时间,所述关系特征信息包括以下至少一种:所述目标用户的第一特征、所述主播的第二特征以及所述目标用户与所述主播之间的交互特征;
利用所述关系特征信息,得到所述历史子时间的所述主播关系指数,其中,所述预设历史时间内的所述主播关系指数包括所述预设历史时间内包含的所述历史子时间的所述主播关系指数。
3.根据权利要求2所述的方法,其特征在于,所述第一特征包括以下至少一者:所述第一时间段的每天是否上线、所述第一时间段的上线天数、所述第一时间段的上线时长、所述第一时间段直播的点击次数、所述第一时间段观看的主播数、所述第一时间段观看的品类数、所述第一时间段的观看时长、所述第一时间段的观看直播的最大时长;
所述第二特征包括以下至少一者:主播等级、订阅数、平均用户观看时长、平均每天观看时长、所述第一时间段的观看时长、所述第一时间段的独立访客数、所述第一时间段的开播天数;
所述交互特征包括以下至少一者:所述目标用户点击所述主播的次数、所述目标用户在所述第一时间段观看所述主播的时长、所述目标用户是否订阅所述主播、所述目标用户在所述第一时间段向所述主播发送的弹幕数、所述目标用户在所述第一时间段对所述主播的送礼数。
4.根据权利要求2所述的方法,其特征在于,所述利用所述关系特征信息,得到所述历史子时间的所述主播关系指数,包括:
对所述关系特征信息进行主播关系预测,得到所述历史子时间的所述主播关系指数;
其中,所述主播关系预测是由利用第一预测模型执行的,和/或,所述历史子时间的主播关系指数表示在所述历史子时间之后的第二时间段内所述目标用户与所述主播之间的关系强度。
5.根据权利要求1所述的方法,其特征在于,所述基于在所述预设历史时间内的所述主播关系指数,得到在所述预设历史时间内所述目标用户与品类间的特征数据,包括:
基于在所述预设历史时间内的所述主播关系指数,得到所述预设历史时间内各历史子时间的初始特征数据,其中,所述特征数据包括各历史子时间所述目标用户的历史品类关系指数;
利用预设滑窗采集方式对所述预设历史时间内的历史品类关系指数进行采集,以得到衍生特征数据;
将所述历史品类关系指数和所述衍生特征数据中的一种或多种,作为所述特征数据。
6.根据权利要求5所述的方法,其特征在于,所述基于在所述预设历史时间内的所述主播关系指数,得到所述预设历史时间内各历史子时间的初始特征数据,包括:
基于所述历史子时间内属于所述品类的所述主播关系指数,得到所述历史子时间的历史品类关系指数;
所述初始特征数据还包括所述历史子时间的主播关系指数和,所述基于在所述预设历史时间内的所述主播关系指数,得到所述预设历史时间内各历史子时间的初始特征数据,还包括:
基于所述历史子时间内的所有所述主播关系指数,得到所述历史子时间的主播关系指数和。
7.根据权利要求5所述的方法,其特征在于,所述预设滑窗采集方式包括至少一种,每种所述预设滑窗采集方式对应的窗口的长度不同、且对应的滑动间隔的长度不同,其中,所述长度为包含所述历史子时间的个数;
所述利用预设滑窗采集方式对所述预设历史时间内的历史品类关系指数进行采集,以得到衍生特征数据,包括:
对于每种所述预设滑窗采集方式,利用所述预设滑窗采集方式对应的窗口和滑动间隔在所述预设历史时间内采集得到若干组历史品类关系指数,其中,每组品类关系指数对应于一滑动位置的窗口,包括所述窗口在所述预设历史时间中对应的所述历史子时间的历史品类关系指数;
对于每组所述历史品类关系指数,获取所述组历史品类关系指数的平均品类关系指数,以作为所述衍生特征数据。
8.根据权利要求1所述的方法,其特征在于,所述基于所述特征数据进行品类关系预测,得到所述目标用户的预测品类关系指数,包括:
利用第二预测模型对所述特征数据进行品类关系预测,得到所述目标用户的预测品类关系指数;
和/或,在所述基于所述特征数据进行品类关系预测,得到所述目标用户的预测品类关系指数之后,所述方法还包括以下至少一个步骤:
利用所述目标用户的预测品类关系指数,确定所述目标用户的用户质量;
基于所述目标用户的预测品类关系指数,确定所述目标用户的兴趣品类或与所述兴趣品类的关联品类;以及,将所述兴趣品类或所述关联品类的信息推荐给所述目标用户。
9.一种用户数据的预测装置,其特征在于,包括:
获取模块,用于获取在预设历史时间内目标用户的主播关系指数;其中,所述主播关系指数用于表示所述目标用户与主播之间的关系强度;
特征模块,用于基于在所述预设历史时间内的所述主播关系指数,得到在所述预设历史时间内所述目标用户与品类间的特征数据;
预测模块,用于基于所述特征数据进行品类关系预测,得到所述目标用户的预测品类关系指数,其中,所述预测品类关系指数用于表示在预设未来时间内所述目标用户与所述品类的关系强度。
10.一种计算机设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序数据,所述处理器用于执行所述程序数据以实现权利要求1至8任一项所述方法的步骤。
11.一种存储装置,其特征在于,存储有能够被处理器运行的程序数据,所述程序数据用于实现权利要求1至8任一项所述方法的步骤。
CN202110625327.8A 2021-06-04 2021-06-04 用户数据的预测方法、计算机设备及存储装置 Active CN113542779B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110625327.8A CN113542779B (zh) 2021-06-04 2021-06-04 用户数据的预测方法、计算机设备及存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110625327.8A CN113542779B (zh) 2021-06-04 2021-06-04 用户数据的预测方法、计算机设备及存储装置

Publications (2)

Publication Number Publication Date
CN113542779A true CN113542779A (zh) 2021-10-22
CN113542779B CN113542779B (zh) 2023-07-28

Family

ID=78095155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110625327.8A Active CN113542779B (zh) 2021-06-04 2021-06-04 用户数据的预测方法、计算机设备及存储装置

Country Status (1)

Country Link
CN (1) CN113542779B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587530A (zh) * 2018-11-22 2019-04-05 广州虎牙信息科技有限公司 一种数据处理方法、装置、终端设备和存储介质
CN109783686A (zh) * 2019-01-21 2019-05-21 广州虎牙信息科技有限公司 行为数据处理方法、装置、终端设备和存储介质
CN110049372A (zh) * 2019-04-23 2019-07-23 广州虎牙信息科技有限公司 主播稳定留存率的预测方法、装置、设备及存储介质
CN110830812A (zh) * 2019-10-31 2020-02-21 广州市网星信息技术有限公司 相似主播分类模型训练方法、主播推荐方法及相关装置
CN112261423A (zh) * 2020-10-16 2021-01-22 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587530A (zh) * 2018-11-22 2019-04-05 广州虎牙信息科技有限公司 一种数据处理方法、装置、终端设备和存储介质
CN109783686A (zh) * 2019-01-21 2019-05-21 广州虎牙信息科技有限公司 行为数据处理方法、装置、终端设备和存储介质
CN110049372A (zh) * 2019-04-23 2019-07-23 广州虎牙信息科技有限公司 主播稳定留存率的预测方法、装置、设备及存储介质
CN110830812A (zh) * 2019-10-31 2020-02-21 广州市网星信息技术有限公司 相似主播分类模型训练方法、主播推荐方法及相关装置
CN112261423A (zh) * 2020-10-16 2021-01-22 北京百度网讯科技有限公司 用于推送信息的方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN113542779B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN110781321B (zh) 一种多媒体内容推荐方法及装置
Meade et al. Forecasting in telecommunications and ICT—A review
Li et al. Giant fight: Customer churn prediction in traditional broadcast industry
CN105493057B (zh) 利用精确性控制的内容选择
CN111711828A (zh) 一种信息处理方法、装置和电子设备
CN109299356B (zh) 基于大数据的活动推荐方法、装置、电子设备及存储介质
CN101802856A (zh) 测定基于位置的广告活动
CN111898032A (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN109636477B (zh) 一种广告投放缺量的预警方法和装置
CN111798280B (zh) 多媒体信息推荐方法、装置和设备及存储介质
KR20190065181A (ko) 광고 계약 중개 및 광고 성과 측정 시스템, 방법 및 그 프로그램을 기록한 컴퓨터 판독 가능 매체
CN107948752A (zh) 订阅主播排序方法、装置和终端
CN110598120A (zh) 基于行为数据的理财推荐方法及装置、设备
EP3806017A1 (en) Methods, platforms and systems for paying persons for use of their personal intelligence profile data
CN106960033B (zh) 一种给信息流标注标签的方法和装置
CN113297486A (zh) 一种点击率预测方法及相关装置
CN111768250A (zh) 方法、装置、计算机可读介质及电子设备
CN113542779B (zh) 用户数据的预测方法、计算机设备及存储装置
CN111552835A (zh) 文件推荐方法、装置及服务器
CN112015970A (zh) 产品推荐方法、相关设备及计算机存储介质
CN112948701B (zh) 信息推荐装置、方法、设备及存储介质
CN108984756B (zh) 信息处理方法、介质、装置和计算设备
US20220408134A1 (en) A Method and System for Providing Advertisements
CN113836391B (zh) 资源推荐方法、装置、计算机设备及存储介质
KR102334864B1 (ko) 부동산 시세 예측 시스템 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant