发明内容
为了克服现有金融产品的推送技术存在的成本高、随机无序和效果差的技术缺陷,本申请提供一种降低投放量和成本、提高内容相关度和改善推送效果的基于大数据的推送方法及系统来解决上述不足。
为了达到上述目的,本申请采用以下技术方案:
根据本申请的一个方面,提供了一种基于大数据的推送方法,包括:
确定内部用户画像信息,所述内部用户画像信息为基于相同的用户ID将第一用户信息与第二用户信息关联后得到的用户画像,所述第一用户信息具体为第一方用户数据,所述第二用户信息具体为第二方用户数据,所述第一用户信息和所述第二用户信息均基于用户ID索引得到;
基于预设的产品分类表识别所有的贷款业务产品的产品标签,所述预设的产品分类表用于根据产品ID进行匹配相应的贷款用途、贷款期限、担保方式、还款方式,每个贷款业务产品与一个唯一的产品ID对应;
分别建立产品浏览关联表和产品购买关联表,所述产品浏览关联表用于表示所有用户相邻两次的产品浏览情况,所述产品购买关联表用于表示所有用户相邻两次的产品购买情况;
响应于针对用户触发的产品浏览请求,更新浏览统计表,所述浏览统计表用于记录在预设周期内基于产品标签值进行统计得到的多个产品浏览总次数,每个产品标签值均对应有产品浏览总次数;
若产品浏览总次数超过预设次数阈值,则将该产品浏览总次数对应的产品标签值确定为目标产品标签值,并结合产品浏览关联表和产品购买关联表进行筛选用户标签值以得到至少一个目标用户标签值,对浏览统计表进行数据重置,否则不做处理;
基于目标用户标签值进行内部推送响应。
优选地,还包括:基于预训练的人群分类标签映射模型,对内部用户画像信息进行划分,为每个用户ID确定相应的人群分类标签,所述人群分类标签映射模型为预先使用包含内部用户画像信息和对应该内部用户画像信息的人群分类标签的多组数据学习训练得出的模型,人群分类标签的分类情况由外部用户画像信息得到,所述外部用户画像信息为预先通过用户画像得到;
基于内部推送响应率进行外部推送响应。
优选地,所述产品浏览关联表以的阵列形式进行表示,通过所有浏览情况的浏览标点对产品浏览关联表进行赋予权重值,每个用户ID均配有对应的浏览标点,每个浏览标点由第一行序号和第一列序号进行组合,第一行序号与用户上一次浏览的产品ID对应,第一列序号与用户本次浏览的产品ID对应;
所述产品购买关联表以的阵列形式进行表示,通过所有购买情况的购买标点对产品购买关联表进行赋予权重值,每个用户ID均配有对应的购买标点,每个购买标点由第二行序号和第二列序号进行组合,第二行序号与用户上一次购买的产品ID对应,第二列序号与用户本次购买的产品ID对应;
所述第一行序号、所述第一列序号、所述第二行序号、所述第二列序号的取值范围均为[1,],每个浏览标点在用户每次浏览产品时进行更新,每个购买标点在用户每次购买产品成功时进行更新;
所述通过所有浏览情况的浏览标点对产品浏览关联表进行赋予权重值,具体表示为:
;
表示对应产品浏览关联表中第一行序号为/>、第一列序号为/>的权重值,表示对应产品浏览关联表中第一行序号为/>、第一列序号为/>的初始值,/>表示对应产品浏览关联表中第一行序号为/>的浏览标点的数量和,/>表示对应产品浏览关联表中第一列序号为/>的浏览标点的数量和;
所述通过所有购买情况的购买标点对产品购买关联表进行赋予权重值,具体表示为:
;
表示对应产品购买关联表中第二行序号为/>、第二列序号为/>的权重值,表示对应产品购买关联表中第二行序号为/>、第二列序号为/>的初始值,/>表示对应产品购买关联表中第二行序号为/>的购买标点的数量和,/>表示对应产品购买关联表中第二列序号为/>的购买标点的数量和。
优选地,在更新浏览统计表时,通过从产品浏览请求中提取产品ID,进而将与产品ID对应的产品标签中所有可选择的产品标签值进行累加1,具体表示为:
;
表示更新后对应第/>个产品标签值的产品浏览总次数,表示更新前对应第/>个产品标签值的产品浏览总次数;/>,/>表示所有产品标签值的类目总数。
优选地,在结合产品浏览关联表和产品购买关联表进行筛选用户标签值以得到至少一个目标用户标签值中,具体包括:
基于产品浏览关联表,寻找权重值最高值对应的第一目标坐标,将浏览标点与第一目标坐标相同的用户ID进行筛选,进而建立第一目标用户筛选表;
对第一目标用户筛选表进行统计用户标签值,并对大于或等于第一预设频次的用户标签值赋予目标标识;
基于产品购买关联表,寻找权重值最高值对应的第二目标坐标,将购买标点与第二目标坐标相同的用户ID进行筛选,进而建立第二目标用户筛选表;
对第二目标用户筛选表进行统计用户标签值并对大于或等于第二预设频次的用户标签值赋予目标标识;
基于第一目标用户筛选表和第二目标用户筛选表,将具有目标标识的所有用户标签值作为目标用户标签值,将具有目标标识的用户标签值中存在重复的情况进行剔除重复的用户标签值,以使目标用户标签值均不同。
优选地,在基于目标用户标签值进行内部推送响应中,具体包括:
设置多个预设活跃时间范围,建立多个推送子队列,每个推送子队列与一个预设活跃时间范围唯一对应,进而构成内部推送响应队列;
依次遍历所有的目标用户标签值,获取目标用户标签值对应的用户ID作为目标ID,从内部用户画像信息中筛选出所有的目标ID以构成目标内部用户集合;
依次遍历目标内部用户集合,获取与目标ID对应的周均活跃时间,若周均活跃时间的初始时间点处于一个预设活跃时间范围内则将该目标ID添加至与该预设活跃时间范围对应的推送子队列内;
对产品标签值与目标产品标签值相同的产品进行筛选,基于浏览次数和购买次数进行筛选以得到第一目标推送产品和第二目标推送产品,所述第一目标推送产品对应浏览次数最高的贷款业务产品,所述第二目标推送产品对应购买次数最高的贷款业务产品;
基于预设活跃时间范围对内部推送响应队列进行推送第一目标推送产品和第二目标推送产品。
优选地,在基于内部推送响应率进行外部推送响应中,具体包括:
统计内部推送响应率;
若内部推送响应率超过预设响应率阈值,则将所有存在点击反馈的用户ID进行汇总,分别获取相应的人群分类标签,并统计人群分类标签的频次,根据频次数值按照从大到小的顺序进行排名,将排名在预设排名数量内的人群分类标签均作为目标外部标签,若内部推送响应率小于预设响应率阈值,则不做处理并结束当前流程;
将所有的目标外部标签进行汇总并发送至外部推广平台,外部推广平台用于对属于目标外部标签的用户群体进行广告投放;
所述内部推送响应率用于表示对应内部推送响应的正反馈结果,所述内部推送响应率表示为:
;
为内部推送响应率,/>表示内部推送响应后存在点击反馈的用户数量,/>表示内部推送响应时内部推送响应队列中需要推送的用户总数量。
根据本申请的另一个方面,还提供了一种基于大数据的推送系统,所述系统用于执行上述任一所述的方法,所述系统包括:
用户画像模块,用于确定内部用户画像信息;
产品标签识别模块,用于基于预设的产品分类表识别所有的贷款业务产品的产品标签;
用户行为关联模块,用于分别建立产品浏览关联表和产品购买关联表;
浏览统计模块,用于响应于针对用户触发的产品浏览请求,更新浏览统计表;
产品浏览响应模块,用于判断若产品浏览总次数超过预设次数阈值,则将该产品浏览总次数对应的产品标签值确定目标产品标签值,并结合产品浏览关联表和产品购买关联表进行筛选用户标签值以得到至少一个目标用户标签值,对浏览统计表进行数据重置,否则不做处理;
内部推送响应模块,用于基于目标用户标签值进行内部推送响应;
外部推送响应模块,基于内部推送响应率进行外部推送响应。
根据本申请的另一个方面,还提供了一种终端,包括:至少一个存储器和至少一个处理器;
至少一个存储器用于存储程序代码,至少一个处理器用于调用至少一个存储器所存储的程序代码执行上述所述的方法。
根据本申请的另一个方面,还提供了一种存储介质,所述存储介质用于存储程序代码,所述程序代码用于执行上述所述的方法。
本申请与现有技术相比,具有如下优点和有益效果:
(1)本申请提供一种基于大数据的推送方法及系统,通过浏览统计表判断产品浏览总次数超过预设次数阈值时确定目标产品标签值和目标用户标签值,基于目标用户标签值进行内部推送响应,通过构成目标内部用户集合,提高了推送时的精准性,基于预设活跃时间范围对内部推送响应队列进行推送第一目标推送产品和第二目标推送产品,进而当进行推送时只需要将信息推送给符合目标用户标签值的用户即可,而无需大规模投放,这样降低了投放量和成本,优化了运营效率,提高了推送内容的相关度,改善推送效果,解决了现有的推送技术存在成本高、随机无序和效果差的问题。
(2)本申请还利用人群分类标签映射模型为每个用户ID确定相应的人群分类标签,进而得到由内部用户画像信息映射到外部用户画像信息的人群分类标签,使得内部用户画像信息与外部用户画像信息进行关联,提高了推送产品与用户之间的匹配相关度,提高了整体的用户体验度,降低了用户的反感,基于内部推送响应率进行外部推送响应,提高了外部广告投放的精准性,使得更有效地推送至潜在客户,提高了推送营销效率,解决了现有的推送技术存在成本高、随机无序和效果差的问题,满足了金融产品的推送需要。
具体实施方式
在本公开的描述中,需要说明的是,下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例1
如图1所示,本实施例1提供了一种基于大数据的推送方法,该方法包括:
步骤S100、确定内部用户画像信息,接收外部用户画像信息,内部用户画像信息为基于相同的用户ID将第一用户信息与第二用户信息关联后得到的用户画像,外部用户画像信息为预先通过用户画像得到;
在本实施例中,执行主体为处理装置,且该处理装置具体为用于数据处理和分析并提供内容推送服务的服务器,该处理装置还与多个手机终端连接,手机终端为每个用户使用。
在本实施例中,第一用户信息具体为第一方用户数据,即对应当前服务器在与用户交互过程中通过自身业务积累的用户数据。示例性的,第一方用户数据为每个手机终端与当前服务器交互时在产生注册、登录、浏览、点击等用户操作时收集的数据;
具体而言,与第一用户信息对应的用户标签包括:身份信息类、信用评估类、资产类、贷款需求类、行为偏好类、风险偏好类、活动反馈类;例如,身份信息类包括姓名、性别、年龄、学历、职业等基本信息,信用评估类包括信用评分、信用等级、逾期次数等信用评估指标信息,资产类包括收入水平、资产状况、房产车辆等财产信息,贷款需求类包括贷款用途、贷款期限、利率等贷款需求信息,行为偏好类包括用户在银行或其他金融机构的行为记录,如查询次数、交易次数、投资偏好等,风险偏好类包括用户对不同风险等级的贷款产品的偏好,活动反馈类包括用户对银行营销活动的参与情况、对优惠政策的参与情况。
相应的,用户标签值则为对应用户标签的具体分类情况,例如对应性别的用户标签值可以为男,或者为女;对应年龄的用户标签值为0-7岁、7-15岁、16-18岁、19-25岁、26-35岁、36-50岁、51-60岁、61岁及以上;例如对应职业的用户标签值可以为医生、老师、工程师、自由职业者等等,在此并不对具体的用户标签值进行限定,此处仅为了说明每个用户标签具有相应的一组用户标签值,每个用户在每个用户标签中具有一个用户标签值。
在本实施例中,第二用户信息具体为第二方用户数据,即对应具有代理合作关系的服务器在与用户交互过程中收集的数据,例如通过与其他机构合作获取的用户数据。示例性的,第二方用户数据为每个手机终端与具有代理合作关系的服务器交互时在产生注册、登录、浏览、点击等用户操作时收集的数据;
具体而言,与第二用户信息对应的用户标签包括:社交媒体类、电商类、物流类、征信类、投资类、保险类;例如,社交媒体类包括用户在社交媒体平台上的行为数据、兴趣爱好等,电商类包括用户在电商平台的购物行为、购买偏好等,物流类包括用户的物流行为数据、收货地址等,征信类包括用户的征信报告、借贷历史等,投资类包括用户的投资行为数据、风险承受能力等,保险类包括用户的保险购买行为、保障需求等。
在本实施例中,第一用户信息和第二用户信息均以用户ID进行索引得到相应的数据,同一个用户使用相同的用户ID,每个用户ID唯一;
在本实施例中,内部用户画像信息和外部用户画像信息进行用户画像的过程均为现有技术,示例性的,用户画像的过程,具体包括:
数据收集:收集原始数据,原始数据为关于用户的信息,即包括人口统计信息、行为数据、社交媒体数据等;
数据清洗:对收集到的原始数据进行清洗得到清洗后数据,包括去除重复数据、纠正错误数据、删除不相关的数据等,以确保数据的准确性和有效性;
数据整合:将清洗后数据整合在一起,建立一个统一的数据库或数据仓库,以便后续的分析和处理;
分析用户画像:基于数据分析和挖掘,识别出不同的用户群体和他们的特征,并根据这些特征制定相应的营销策略;
验证优化:创建用户画像后,进行验证和优化,通过A/B测试等方式来验证画像的有效性,并根据测试结果进行调整优化;
通过多次反复进行数据收集、数据清洗、数据整合、分析用户画像、验证优化的步骤进而完善最终的用户画像。
需要说明的是,当前服务器为自身企业使用的服务器,具有代理合作关系的服务器为非自身企业使用的服务器,例如是技术外包使用、合作企业使用的这类无法直接由自身企业收集用户数据的服务器。
在本实施例中,外部用户画像信息具体为利用第三方数据服务商获取的第三方用户数据进行用户画像得到,与外部用户画像信息对应的人群分类标签包括:人群统计类、消费习惯类、兴趣爱好类、行业职业类、设备信息类、位置信息类、网络行为类;例如,人群统计类包括用户的地域分布、年龄结构、性别比例等,消费习惯类包括用户的消费行为数据、消费偏好等,兴趣爱好类包括用户在旅游、健身、娱乐等方面的兴趣爱好,行业职业类包括用户的行业分布、职业类型等,设备信息类包括用户的设备信息,如设备型号、操作系统等,位置信息类包括用户的位置信息,如经度纬度、区域定位等,网络行为类包括用户在网络上的行为数据,如网页浏览时长、点击率等。
还需要说明的是,本申请中的第一用户信息、第二用户信息以及外部用户画像信息均已通过用户授权的情况进行获取,并且外部用户画像信息将身份信息类进行数据脱敏,例如将姓名、身份证、就职公司名称等涉及隐私的数据进行过滤,通过过滤涉及隐私的数据以提高数据隐私的安全性。外部用户画像信息为针对外部的群体,在用户数量上超过内部用户画像信息所对应的用户数量。
步骤S200、基于预设的产品分类表识别所有的贷款业务产品的产品标签;在本实施例中,预设的产品分类表用于根据产品ID进行匹配相应的贷款用途、贷款期限、担保方式、还款方式,每个贷款业务产品与一个唯一的产品ID对应。示例性的,对于房贷,贷款用途为购买房屋,贷款期限为长周期(15-30年),担保方式为抵押物担保,还款方式可以选择等额本息还款或等额本金还款,其中贷款期限可以根据借款人的年龄、信用状况和房产情况进行确定,在此仅举例不做限定。示例性的,对于车贷,贷款用途为购买车辆,贷款期限为中周期(1-5年),担保方式为抵押物担保,还款方式可以选择等额本息还款或等额本金还款,其中贷款期限可以根据车辆价值、借款人的信用状况和收入情况进行确定。示例性的,对于留学贷,贷款用途为支付留学费用,贷款期限为中周期(1-5年),担保方式可以选择担保人担保或抵押物担保,还款方式可以选择按月付息。相应的,其他类型的贷款业务产品,如装修贷、旅游贷、医疗贷等都具有相应的贷款用途、贷款期限、担保方式、还款方式。
在本实施例中,每个产品标签具有多个相应的产品标签值进行选择,例如:贷款用途包括消费、经营、购买房屋、购买车辆等;贷款期限包括短周期、中周期和长周期,短周期对应的期限在一年以内,中周期对应的期限在一年以上五年以下,长周期对应的期限在五年以上;担保方式包括无担保贷款、质押担保、抵押物担保和担保人担保,无担保贷款为基于借款人的信用记录和财务状况提供贷款;还款方式包括等额本息还款、等额本金还款、按月付息等。还需要说明的是,贷款期限、担保方式、还款方式最终会在申请具体的贷款业务产品时确定,贷款用途、贷款期限、担保方式、还款方式为对应的产品标签,以贷款用途为例,消费、经营、购买房屋、购买车辆均为对应产品标签为贷款用途时的产品标签值。
步骤S300、分别建立产品浏览关联表和产品购买关联表,产品浏览关联表用于表示所有用户相邻两次的产品浏览情况,产品购买关联表用于表示所有用户相邻两次的产品购买情况;
如图2所示,在本实施例中,产品浏览关联表以的阵列形式进行表示,通过所有浏览情况的浏览标点对产品浏览关联表进行赋予权重值,每个用户ID均配有对应的浏览标点,每个浏览标点由第一行序号和第一列序号进行组合,第一行序号与用户上一次浏览的产品ID对应,第一列序号与用户本次浏览的产品ID对应,同一个产品ID所对应的第一行序号和第一列序号的数值相同;应当明白,第一行序号和第一列序号的取值范围均为[1,]。以任意一个用户ID为例,通过设置一个关于浏览标点的浏览三元组数据,进而无需为每个用户ID建立一个/>的阵列形式的数据,减少了数据库的存储压力,示例性的,浏览三元组数据为<用户ID,第一行序号,第一列序号>,若第一行序号或第一列序号出现0时,表示无效数据,此时通过标记以提示不作使用。例如第一行序号和第一列序号均为0时,表示用户缺少浏览记录;例如第一行序号为0且第一列序号不为0时,表示用户只有1次浏览记录。
示例性的,在产品浏览关联表中,第一行序号为a1至ax,第一列序号为b1至by,均对应取值[1,],每个坐标均对应一个权重值。
在本实施例中,通过所有浏览情况的浏览标点对产品浏览关联表进行赋予权重值,具体表示为:
;
第一行序号与用户上一次浏览的产品ID对应,第一列序号与用户本次浏览的产品ID对应,表示对应产品浏览关联表中第一行序号为/>、第一列序号为/>的权重值,表示对应产品浏览关联表中第一行序号为/>、第一列序号为/>的初始值,/>表示对应产品浏览关联表中第一行序号为/>的浏览标点的数量和,/>表示对应产品浏览关联表中第一列序号为/>的浏览标点的数量和;
在本实施例中,对应产品浏览关联表中第一行序号为、第一列序号为/>的初始值,具体为通过以下方式得到:对每个坐标进行初始化赋值为0,依次遍历所有用户ID,在对应第一行序号、第一列序号的坐标进行赋值累加1,进而确定所有坐标的初始值。示例性的,假设/>为5,则分别对应5个产品ID;相应的,在产品浏览关联表中,第一行序号取值为1至5,第一列序号取值为1至5,若总共有10个用户,对应的浏览三元组数据依次为<用户ID1,1,2>、<用户ID2,1,2>、<用户ID3,2,3>、<用户ID4,1,2>、<用户ID5,1,2>、<用户ID6,1,2>、<用户ID7,5,5>、<用户ID8,3,5>、<用户ID9,3,5>、<用户ID10,1,2>;那么最终所有坐标的初始值为以下情况:/>,/>,/>,/>,而其余坐标的初始值均为0,从而/>可以用于反映浏览三元组数据为相同浏览行为的用户数量,越大则表明该坐标对应的浏览行为的用户数量越多。/>用于反映同一个用户上一次浏览的产品ID传递至不同用户本次浏览的产品ID的分散程度;/>用于反映不同用户上一次浏览的产品ID转化至本次浏览的产品ID的聚合程度。
如图3所示,产品购买关联表以的阵列形式进行表示,通过所有购买情况的购买标点对产品购买关联表进行赋予权重值,每个用户ID均配有对应的购买标点,每个购买标点由第二行序号和第二列序号进行组合,第二行序号与用户上一次购买的产品ID对应,第二列序号与用户本次购买的产品ID对应,同一个产品ID所对应的第二行序号和第二列序号的数值相同;应当明白,第二行序号和第二列序号的取值范围均为[1,/>]。以任意一个用户ID为例,通过设置一个关于购买标点的购买三元组数据,进而无需为每个用户ID建立一个/>的阵列形式的数据,减少了数据库的存储压力,示例性的,购买三元组数据为<用户ID,第二行序号,第二列序号>。若第二行序号或第二列序号出现0时,表示无效数据,此时通过标记以提示不作使用。例如第二行序号和第二列序号均为0时,表示用户缺少购买记录;例如第二行序号为0且第二列序号不为0时,表示用户只有1次购买记录。
示例性的,在产品购买关联表中,第二行序号为a1至ax,第二列序号为b1至by,均对应取值[1,],每个坐标均对应一个权重值。
在本实施例中,通过所有购买情况的购买标点对产品购买关联表进行赋予权重值,具体表示为:
;
第二行序号与用户上一次购买的产品ID对应,第二列序号与用户本次购买的产品ID对应,表示对应产品购买关联表中第二行序号为/>、第二列序号为/>的权重值,表示对应产品购买关联表中第二行序号为/>、第二列序号为/>的初始值,/>表示对应产品购买关联表中第二行序号为/>的购买标点的数量和,/>表示对应产品购买关联表中第二列序号为/>的购买标点的数量和;
在本实施例中,对应产品购买关联表中第二行序号为、第二列序号为/>的初始值,具体为通过以下方式得到:对每个坐标进行初始化赋值为0,依次遍历所有用户ID,在对应第二行序号、第二列序号的坐标进行赋值累加1,进而确定所有坐标的初始值。此处对初始值的赋值情况与/>类似,在此不做赘述。/>用于反映同一个用户上一次购买的产品ID传递至不同用户本次购买的产品ID的分散程度;/>用于反映不同用户上一次购买的产品ID转化至本次购买的产品ID的聚合程度。
在本实施例中,在用户每次浏览产品时进行更新与用户ID对应的浏览标点,在用户每次购买产品成功时进行更新与用户ID对应的购买标点。示例性的,用户每次浏览产品时会触发产品浏览请求,通过对产品浏览请求进行响应时更新该用户ID对应的浏览标点;用户每次购买产品成功时通过设置针对产品购买成功的事件进行触发更新该用户ID对应的购买标点。
步骤S400、响应于针对用户触发的产品浏览请求,更新浏览统计表,其中浏览统计表用于记录在预设周期内基于产品标签进行统计得到的多个产品浏览总次数,每个产品标签值均对应有产品浏览总次数;
在本实施例中,每个产品浏览总次数与一个产品标签值对应,在更新浏览统计表时,通过从产品浏览请求中提取产品ID,进而将与产品ID对应的产品标签中所有可选择的产品标签值进行累加1,具体表示为:
;
表示更新后对应第/>个产品标签值的产品浏览总次数,表示更新前对应第/>个产品标签值的产品浏览总次数;/>,/>表示所有产品标签值的类目总数;
示例性的,与产品ID对应的产品标签中所有可选择的产品标签值分别为第2、5、9个产品标签值,则相应对第2、5、9个产品标签值的产品浏览总次数进行累加1。
在本步骤中,预设周期可以根据实际情况设置,预设周期设置的数值至少为7天,例如7天、10天、15天、30天等,在此不做限定。
步骤S500、若产品浏览总次数超过预设次数阈值,则将该产品浏览总次数对应的产品标签值确定为目标产品标签值,并结合产品浏览关联表和产品购买关联表进行筛选用户标签值以得到至少一个目标用户标签值,对浏览统计表进行数据重置;否则不做处理;
在本实施例中,在结合产品浏览关联表和产品购买关联表进行筛选用户标签值以得到至少一个目标用户标签值中,具体包括:
步骤S501、基于产品浏览关联表,寻找权重值最高值对应的第一目标坐标,将浏览标点与第一目标坐标相同的用户ID进行筛选,进而建立第一目标用户筛选表;
步骤S502、对第一目标用户筛选表进行统计用户标签值,并对大于或等于第一预设频次的用户标签值赋予目标标识;在本步骤中,第一预设频次为根据第一目标用户筛选表的用户ID数量进行设置,例如可以设置为第一目标用户筛选表的用户ID数量乘以30%的数值、或第一目标用户筛选表的用户ID数量乘以40%的数值,在此不做具体限定。
步骤S503、基于产品购买关联表,寻找权重值最高值对应的第二目标坐标,将购买标点与第二目标坐标相同的用户ID进行筛选,进而建立第二目标用户筛选表;
步骤S504、对第二目标用户筛选表进行统计用户标签值并对大于或等于第二预设频次的用户标签值赋予目标标识;在本步骤中,第二预设频次为根据第二目标用户筛选表的用户ID数量进行设置,例如可以设置为第二目标用户筛选表的用户ID数量乘以30%的数值、第二目标用户筛选表的用户ID数量乘以40%的数值,在此不做具体限定。
步骤S505、基于第一目标用户筛选表和第二目标用户筛选表,将具有目标标识的所有用户标签值作为目标用户标签值,将具有目标标识的用户标签值中存在重复的情况进行剔除重复的用户标签值,以使目标用户标签值均不同。
在本实施例中,对浏览统计表进行数据重置,具体为对浏览统计表内的所有产品浏览总次数进行重置为0,并重新根据预设周期进行统计。
在本实施例中,预设次数阈值可以根据上个月的月活量进行设置,例如设置为上个月的月活量的10%,也可以设置一个固定值,例如50万次、100万次等,在此不做限定。
步骤S600、基于目标用户标签值进行内部推送响应;
在基于目标用户标签值进行内部推送响应中,具体包括:
步骤S601、设置多个预设活跃时间范围,建立多个推送子队列,每个推送子队列与一个预设活跃时间范围唯一对应,进而构成内部推送响应队列;
步骤S602、依次遍历所有的目标用户标签值,获取目标用户标签值对应的用户ID作为目标ID,从内部用户画像信息中筛选出所有的目标ID以构成目标内部用户集合;
步骤S603、依次遍历目标内部用户集合,获取与目标ID对应的周均活跃时间,若周均活跃时间的初始时间点处于一个预设活跃时间范围内则将该目标ID添加至与该预设活跃时间范围对应的推送子队列内;
在本步骤中,周均活跃时间为用户在一周时间里进行登录的时长情况,用于反映用户登录时间的活跃情况,包括初始时间点和结束时间点,实际应用时,可以采用上一周时间进行记录,或者采用历史相邻几周时间进行取均值的方式进行记录周均活跃时间,本领域技术人员可根据实际情况进行调整,在此不做限定。多个预设活跃时间范围均分别对应一周内划分的时间范围。示例性的,以周一这天为例,可以划分为:周一凌晨时段、周一上午时段、周一下午时段、周一晚上时段,其余时间按照类似划分,从而将一周划分为7*4个预设活跃时间范围。
步骤S604、对产品标签值与目标产品标签值相同的产品进行筛选,基于浏览次数和购买次数进行筛选以得到第一目标推送产品和第二目标推送产品,第一目标推送产品对应浏览次数最高的贷款业务产品,第二目标推送产品对应购买次数最高的贷款业务产品;
步骤S605、基于预设活跃时间范围对内部推送响应队列进行推送第一目标推送产品和第二目标推送产品。
具体而言,通过构成内部推送响应队列,以确定用户推送的时间,使推送更符合用户使用习惯,通过推送时间定制化的推送方式提高用户粘性,避免错误时间段进行推送使用户产生反感情绪,达到提高推送用户体验度的效果;通过构成目标内部用户集合,提高了推送时的精准性,避免了大量的无效推送,同时利用精准推送提高了老用户的维护效果,进而在后续基于预设活跃时间范围对内部推送响应队列进行推送第一目标推送产品和第二目标推送产品时,优化了运营效率并降低运营成本。
实施例2
如图4所示,本实施例2为了提高营销效率,在实施例1提供的一种基于大数据的推送方法的基础上进行外部推送响应,该方法还包括:
步骤S700、基于预训练的人群分类标签映射模型,对内部用户画像信息进行划分,为每个用户ID确定相应的人群分类标签;
在本实施例中,人群分类标签映射模型用于对内部用户画像信息映射为外部用户画像信息,外部用户画像信息为针对人群的标签,内部用户画像信息为针对个人的标签,该人群分类标签映射模型为预先使用多组数据通过机器学习训练得出,在训练时,多组数据包括多个包含内部用户画像信息和对应该内部用户画像信息的人群分类标签。人群分类标签的分类情况由外部用户画像信息得到,外部用户画像信息为预先通过用户画像得到;需要说明的是,对应该内部用户画像信息的人群分类标签,可以通过问卷形式让内部用户画像信息对应的用户进行填写得到。
实际应用时,通过对内部用户画像信息进行划分得到相应的人群分类标签,形成由内部用户画像信息到外部用户画像信息的映射关系,提高后续外部推送时的广告精准度,提高了外部推送的广告效率。
步骤S800、基于内部推送响应率进行外部推送响应,具体包括:
步骤S801、统计内部推送响应率,内部推送响应率用于表示对应内部推送响应的正反馈结果;所述正反馈结果为用户对产品表现认可的反馈结果。
在本步骤中,内部推送响应率表示为:
;
为内部推送响应率,/>表示内部推送响应后存在点击反馈的用户数量,/>表示内部推送响应时内部推送响应队列中需要推送的用户总数量,/>为通过统计目标内部用户集合中的用户总数量进行确定。
步骤S802、若内部推送响应率超过预设响应率阈值,则将所有存在点击反馈的用户ID进行汇总,分别获取相应的人群分类标签,并统计人群分类标签的频次,根据频次数值按照从大到小的顺序进行排名,将排名在预设排名数量内的人群分类标签均作为目标外部标签,若内部推送响应率小于预设响应率阈值,则不做处理并结束当前流程;示例性的,预设响应率阈值可以设置为40%、50%等;预设排名数量可以设置为3,进而将频次排名前3的人群分类标签均作为目标外部标签,在此不做限定。
步骤S803、将所有的目标外部标签进行汇总并发送至外部推广平台,外部推广平台用于对属于目标外部标签的用户群体进行广告投放。
应当明白,关于外部推广平台如何实现广告投放的技术方案为现有技术,并且不在本申请的保护范围内。示例性的,外部推广平台可以为短视频平台、社交媒体平台、广告交易平台、新闻媒体平等。短视频平台为用于通过短视频平台进行推广,例如抖音、快手等;社交媒体平台为用于通过社交媒体平台进行推广,例如微信朋友圈、广点通等;广告交易平台为用于通过广告交易平台进行推广,例如百度广告管家、广点通等;新闻媒体平台为用于通过搜索引擎进行推广,例如百度搜索、百度联盟、百度百科等。
具体而言,利用人群分类标签映射模型为每个用户ID确定相应的人群分类标签,进而得到由内部用户画像信息映射到外部用户画像信息的人群分类标签,基于内部推送响应率进行外部推送响应,提高了外部广告投放的精准性,使得更有效地推送至潜在客户,提高了推送营销效率。
本申请所提及的外部推送为对外面的媒体渠道进行打广告获取新用户。所提及的内部推送为对现有的用户进行针对性的推送维护旧用户。
实施例3
如图5所示,本实施例3提供了一种基于大数据的推送系统,该系统用于执行上述实施例2中的方法,该系统包括:
用户画像模块,用于确定内部用户画像信息,接收外部用户画像信息;
产品标签识别模块,用于基于预设的产品分类表识别所有的贷款业务产品的产品标签;
用户行为关联模块,用于分别建立产品浏览关联表和产品购买关联表,产品浏览关联表用于表示所有用户相邻两次的产品浏览情况,产品购买关联表用于表示所有用户相邻两次的产品购买情况;
浏览统计模块,用于响应于针对用户触发的产品浏览请求,更新浏览统计表,其中浏览统计表用于记录在预设周期内基于产品标签进行统计得到的多个产品浏览总次数;
产品浏览响应模块,用于判断若产品浏览总次数超过预设次数阈值,则将该产品浏览总次数对应的产品标签值确定目标产品标签值,并结合产品浏览关联表和产品购买关联表进行筛选用户标签值以得到至少一个目标用户标签值,对浏览统计表进行数据重置,否则不做处理;
内部推送响应模块,用于基于目标用户标签值进行内部推送响应;
外部推送响应模块,基于内部推送响应率进行外部推送响应。
实施例4
如图6所示,本实施例提供了一种终端,包括:至少一个存储器和至少一个处理器;其中,至少一个存储器用于存储程序代码,至少一个处理器用于调用至少一个存储器所存储的程序代码执行上述实施例中的任一种基于大数据的推送方法。
实施例5
本实施例提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库为物理层用于存储各种数据库。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于大数据的推送方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
实施例6
本实施例提供了一种存储介质,该存储介质用于存储程序代码,程序代码用于执行上述的基于大数据的推送方法。
上述实施例为本申请较佳的实施方式,但本申请的实施方式并不受上述实施例的限制,其他的任何未背离本申请的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本申请的保护范围之内。