CN113705682B - 用户行为特征的处理方法及装置 - Google Patents
用户行为特征的处理方法及装置 Download PDFInfo
- Publication number
- CN113705682B CN113705682B CN202111000424.4A CN202111000424A CN113705682B CN 113705682 B CN113705682 B CN 113705682B CN 202111000424 A CN202111000424 A CN 202111000424A CN 113705682 B CN113705682 B CN 113705682B
- Authority
- CN
- China
- Prior art keywords
- user
- target
- training
- class
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 203
- 238000000034 method Methods 0.000 claims abstract description 63
- 230000006399 behavior Effects 0.000 claims description 376
- 238000012549 training Methods 0.000 claims description 364
- 238000012360 testing method Methods 0.000 claims description 200
- 238000002372 labelling Methods 0.000 claims description 73
- 238000011156 evaluation Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims 1
- 238000011112 process operation Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 43
- 238000007499 fusion processing Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 19
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000011176 pooling Methods 0.000 description 11
- 238000010606 normalization Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000002268 wool Anatomy 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
- G06F18/256—Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了用户行为特征的处理方法及装置,该方法包括:获取目标用户的用户行为特征,用户行为特征包括用户行为统计特征以及用户行为轨迹特征;通过类别预测模型中的第一类别预测子模型,对目标用户的用户行为统计特征进行预测处理,得到目标用户被识别为目标预设类别的第一概率;通过类别预测模型中的第二类别预测子模型,对目标用户的用户行为轨迹特征进行预测处理,得到目标用户被识别为目标预设类别的第二概率;通过类别预测模型对第一概率与第二概率进行融合处理,得到目标用户的识别结果;基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,可以增强营销的效果,提高营销成功率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种用户行为特征的处理方法及装置。
背景技术
随着计算机技术的飞速发展,业务人员可以通过互联网平台开展营销活动,以吸引平台中的用户参与活动。一般来说,业务人员开展的营销活动在吸引高质量用户的参与时,也会吸引有营销欺诈倾向的低质量用户的参与,其中,有营销欺诈倾向的低质量用户俗称的“羊毛党”,是指有选择地参与在平台中开展的营销活动,以相对较低的成本甚至零成本换取利益的用户。一场营销活动中,由于低质量用户的参与,会影响该营销活动对于高质量用户的营销效果,进而使得营销收益减少,营销成功率降低。
发明内容
本申请实施例提供一种用户行为特征的处理方法、装置、设备及存储介质,可以增强营销的效果,提高营销成功率。
一方面,本申请实施例提供了一种用户行为特征的处理方法,包括:
获取目标用户的用户行为特征,所述用户行为特征包括用户行为统计特征以及用户行为轨迹特征;
通过类别预测模型中的第一类别预测子模型,对所述目标用户的用户行为统计特征进行预测处理,得到所述目标用户被识别为目标预设类别的第一概率;
通过所述类别预测模型中的第二类别预测子模型,对所述目标用户的用户行为轨迹特征进行预测处理,得到所述目标用户被识别为所述目标预设类别的第二概率;
通过所述类别预测模型对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果;
基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作。
一方面,本申请实施例提供了一种用户行为特征的处理装置,其特征在于,包括:
所述用户行为特征的处理装置包括获取单元以及处理单元,所述获取单元以及所述处理单元用于执行上述用户行为特征的处理方法。
一方面,本申请实施例提供了一种用户行为特征的处理设备,其特征在于,所述用户行为特征的处理设备包括输入接口和输出接口,还包括:
处理器,适于实现一条或多条指令;以及,
计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行上述用户行为特征的处理方法。
一方面,本申请实施例提供了一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行上述用户行为特征的处理方法。
一方面,本申请实施例提供了一种计算机程序产品或计算机程序,所述计算机程序产品或所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;用户行为特征的处理设备的处理器从所述计算机可读存储介质中读取所述计算机指令,所述处理器执行所述计算机指令,所述计算机指令被处理器执行时,用于执行上述用户行为特征的处理方法。
本申请实施例中,可以通过类别预测模型中的第一类别预测子模型,对目标用户的用户行为统计特征进行预测处理,得到目标用户被识别为目标预设类别的第一概率;通过类别预测模型中的第二类别预测子模型,对目标用户的用户行为轨迹特征进行预测处理,得到目标用户被识别为目标预设类别的第二概率;通过类别预测模型对第一概率与第二概率进行融合处理,得到目标用户的识别结果,可提高目标用户的识别准确性。在此基础上,可以基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,即可以针对不同的目标用户执行个性化的营销处理操作,可以增强营销的效果,提高营销成功率,进而提高用户平台的用户粘度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种用户行为特征的处理系统的结构示意图;
图2是本申请实施例提供的一种训练得到第一类别预测子模型以及第二类别预测子模型的流程示意图;
图3a是本申请实施例提供的一种保险业务平台的主页类型的平台页面的示意图;
图3b是本申请实施例提供的一种活动相关类型的平台页面的示意图;
图3c是本申请实施例提供的另一种活动相关类型的平台页面的示意图;
图3d是本申请实施例提供的一种付费相关类型的平台页面的示意图;
图4a是本申请实施例提供的一种训练用户单次使用目标业务平台时对于各个页面类别的平台页面的浏览时长的示意图;
图4b是本申请实施例提供的另一种训练用户单次使用目标业务平台时对于各个页面类别的平台页面的浏览时长的示意图;
图5是本申请实施例提供的一种通过CNN模型对训练用户的用户行为轨迹特征进行处理的示意图;
图6是本申请实施例提供的一种类别预测模型的构建流程示意图;
图7a是本申请实施例提供的一种对第三概率与第四概率进行融合处理的示意图;
图7b本申请实施例提供的一种得到测试用户的识别结果的示意图;
图8本申请实施例提供的一种用户行为特征的处理方法的流程示意图;
图9本申请实施例提供的一种得到目标用户的识别结果的示意图;
图10是本申请实施例提供的一种用户行为特征的处理装置的结构示意图;
图11是本申请实施例提供的一种用户行为特征的处理设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了增强营销的效果,提高营销成功率,本申请实施例基于对目标用户的用户行为特征的分析提出了一种用户行为特征的处理方案,可以通过类别预测模型对目标用户的用户行为特征进行分析,预测得到目标用户的识别结果,进而可以基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作。
上述用户行为特征的处理方案可以通过用户行为特征的处理设备执行,其中,该用户行为特征的处理设备可以包括智能手机、平板电脑、笔记本电脑、台式计算机、智能车载以及智能可穿戴设备中的任意一种或多种;也可以为服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
基于上述用户行为特征的处理方案,本申请实施例提供了一种用户行为特征的处理系统,参见图1,为本申请实施例提供的一种用户行为特征的处理系统的结构示意图。图1所示的用户行为特征的处理系统可以包括用户行为特征的处理设备101以及终端设备102。其中,用户行为特征的处理设备101可以是服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器;终端设备102可以包括智能手机、平板电脑、笔记本电脑、台式计算机、智能车载以及智能可穿戴设备中的任意一种或多种。用户行为特征的处理设备101以及终端设备102之间可以通过有线或无线通信方式进行直接或间接地通信连接,本申请在此不做限制。
在一个实施例中,终端设备102中运行有支持开展营销活动的目标业务平台;目标业务平台可以为任意业务相关的业务平台,例如可以为与保险业务相关的保险业务平台;目标业务平台中开展的营销活动是与目标业务平台中提供的目标业务相关的营销活动,例如,若目标业务平台为与保险业务相关的保险业务平台,则该保险业务平台中开展的营销活动是与保险业务相关的营销活动;目标业务平台可以为提供目标业务的应用所对应的应用平台,也可以为提供同一目标业务的网站所对应的网站平台,也可以为提供同一目标业务的小程序所对应的小程序平台,例如,若目标业务平台为与保险业务相关的保险业务平台,若针对该保险业务开发了保险业务应用、保险业务网站以及保险业务小程序,则该保险业务平台可以为保险业务应用对应的应用平台,可以为保险业务网站对应的网站平台,也可以为保险业务小程序对应的小程序平台。
进一步的,目标用户可以通过其终端设备102与目标业务平台进行交互,即目标用户可以通过其终端设备102参与目标业务平台中开展的营销活动;通过目标业务平台中开展的营销活动可以刺激目标业务平台中的目标用户为目标业务平台所提供的付费业务进行付费,即通过目标业务平台中开展的营销活动可以刺激目标业务平台中的目标用户向付费用户的转化,其中,目标用户为目标业务平台中的任一用户。举例来说,若目标业务平台为与保险业务相关的保险业务平台,则通过在该保险业务平台中开展的营销活动可以刺激该保险业务平台中的目标用户为该保险业务平台所提供的保险业务进行付费,例如,进行保险产品的购买等。
在一个实施例中,用户行为特征的处理设备101与目标业务平台相对应,为目标业务平台提供服务支持,具体可以为目标服务平台中营销活动的开展提供服务支持,举例来说,若目标业务平台为与保险业务相关的保险业务平台,则用户行为特征的处理设备101为该保险业务平台对应的用户行为特征的处理设备,为该保险业务平台提供服务支持,又如,若目标业务平台为与游戏业务相关的游戏业务平台,则用户行为特征的处理设备101为该游戏业务平台对应的用户行为特征的处理设备,为该游戏业务平台提供服务支持。
在一个实施例中,目标用户可以通过其终端设备102与目标业务平台进行交互;用户行为特征的处理设备101可以通过类别预测模型对目标用户的用户行为特征进行分析,预测得到目标用户的识别结果,进而可以基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,例如,向目标用户分配一定资源量的资源。
其中,类别预测模型是基于第一类别预测子模型以及第二类别预测子模型构建的,第一类别预测子模型是基于包括了训练用户的用户行为统计特征以及训练用户的标注类别的第一训练样本对初始第一类别预测子模型进行训练得到的二分类模型,第二类别预测子模型是基于包括了训练用户的用户行为轨迹特征以及训练用户的标注类别的第二训练样本对初始第二类别预测子模型进行训练得到的二分类模型。基于此,本申请实施例对训练得到第一类别预测子模型以及第二类别预测子模型的过程进行介绍,如图2所示,为本申请实施例提供的一种训练得到第一类别预测子模型以及第二类别预测子模型的流程示意图。图2所示的训练得到第一类别预测子模型以及第二类别预测子模型的流程可以由用户行为特征的处理设备执行,也可以由其余能实现训练得到第一类别预测子模型以及第二类别预测子模型这一流程的任何电子设备执行,本申请实施例以用户行为特征的处理设备进行介绍。图2所示的训练得到第一类别预测子模型以及第二类别预测子模型的流程可包括如下步骤:
S201,获取第一训练样本以及第二训练样本。
其中,第一训练样本包括训练用户的用户行为统计特征以及训练用户的标注类别,第二训练样本包括训练用户的用户行为轨迹特征以及训练用户的标注类别。第一训练样本用于对初始第一类别预测子模型进行训练,以得到第一类别预测子模型,第二训练样本用于对初始第二类别预测子模型进行训练,以得到第二类别预测子模型;其中,训练用户的标注类别为预设类别中的一个,由于第一类别预测子模型以及第二类别预测子模型为二分类模型,所以预设类别可以包括正类别和负类别,训练用户的标注类别为正类别时,表征基于该训练用户得到的第一训练样本为正样本,基于该训练用户得到的第二训练样本为正样本,训练用户的标注类别为负类别时,表征基于该训练用户得到的第一训练样本为负样本,基于该训练用户得到的第二训练用户为负样本。在不同的业务需求中,正类别和负类别具有不同的业务含义,例如,若期望训练得到的第一类别预测子模型以及第二类别预测子模型能够对目标业务平台中的目标用户的付费倾向进行预测,则该正类别可以表征付费类别,该负类别可以表征非付费类别。
在一个实施例中,训练用户的用户行为统计特征用于对初始第一类别预测子模型进行训练,以得到第一类别预测子模型,其中,训练用户的用户行为统计特征指的是:训练用户在浏览不同页面类别的平台页面的过程中,统计到的关于各个页面类别的平台页面的浏览特征,可以表征训练用户对于目标业务平台中各个页面类别的平台页面的浏览情况,其中,可以根据不同的业务需求设定不同的页面类别,例如,若目标业务平台为保险业务平台,则可以将保险业务平台中的平台页面划分为主页类别的平台页面(即平台主页),付费相关类别的平台页面(包括保险产品的支付页以及保险产品的详情页等)、活动相关类别的平台页面(包括与保险业务平台中开展的营销活动相关的页面)、业务知识相关类别的平台页面(例如包括保险相关知识的页面)以及其他类别的平台页面。如图3a所示,为本申请实施例提供的一种保险业务平台的主页类别的平台页面的示意图,如图3b所示,为本申请实施例提供的一种活动相关类别的平台页面的示意图,如图3c所示,为本申请实施例提供的另一种活动相关类别的平台页面的示意图,如图3d所示,为本申请实施例提供的一种付费相关类别的平台页面的示意图,具体为保险产品支付页的示意图。
在一个实施例中,训练用户的用户行为统计特征可以包括浏览时长特征,该浏览时长特征表征训练用户在预设时间段内,对于目标业务平台中各个页面类别的平台页面的浏览时长,其中,预设时间段为根据具体需求进行设定的时间段,例如可以将训练用户首次使用目标业务平台的时间点确定为起始时间点,将起始时间点之后的三个月的时间确定为预设时间段;举例来说,若训练用户在预设时间段内,对于目标业务平台中的付费相关类别的平台页面的浏览时长为120秒,则训练用户对于付费相关类别的平台页面的浏览时长特征为120秒。还可以包括浏览次数特征,该浏览次数特征表征训练用户在预设时间段内,对于目标业务平台中各个页面类别的平台页面的浏览次数;举例来说,若训练用户在预设时间段内,对于目标业务平台中的付费相关类别的平台页面的浏览次数为5次,则训练用户对于付费相关类别的平台页面的浏览次数特征为5次。还可以包括单次浏览最大时长特征,该单次浏览最大时长特征表征训练用户在预设时间段内,对于目标业务平台中某个页面类别的平台页面进行多次浏览时,单次浏览该页面类别的平台页面的最大时长;举例来说,若训练用户在预设时间段内,对于目标业务平台中的付费相关类别的平台页面进行了5次浏览,该5次浏览的浏览时长分别为120秒、60秒、40秒、30秒以及10秒,则训练用户对于付费相关类别的平台页面的单次浏览最大时长特征为120秒。
进一步的,训练用户的用户行为统计特征还可以包括单次浏览轨迹特征,该单次浏览轨迹特征表征训练用户在预设时间段内,对目标业务平台的单次使用中对各个页面类别的平台页面的浏览顺序,其中,对目标业务平台的单次使用是指:训练用户从开启目标业务平台到关闭目标业务平台这段时间内对于目标业务平台的使用;举例来说,若训练用户开启目标业务平台之后,第一个访问的平台页面为主页类别的平台页面、第二个访问的平台页面为活动相关类别的平台页面、第三个访问的平台页面为付费相关类别的平台页面,然后训练用户关闭了目标业务平台,那么,训练用户针对目标业务平台的该次使用所产生的单次浏览轨迹特征为:主页类别的平台页面、活动相关类别的平台页面、付费相关类别的平台页面。进一步的,可以预先对目标业务平台中各个页面类别的平台页面进行编码,那么可以将训练用户的单次浏览轨迹特征用编码的形式进行表示,举例来说,若将主页类别的平台页面编码为1,将付费相关类别的平台页面编码为2、将活动相关类别的平台页面编码为3、将业务知识相关类别的平台页面编码为4,以及将其他类别的平台页面编码为5,则以编码的形式表征训练用户的单次浏览轨迹特征可以为:13200。又如,若训练用户开启目标业务平台之后,第一个访问的平台页面为主页类别的平台页面、第二个访问的平台页面为付费相关类别的平台页面、第三个访问的平台页面为业务知识相关类别的平台页面,第四个访问的平台页面为活动相关类别的平台页面、第五个访问的平台页面为其他类别的平台页面,则以编码的形式表征训练用户的单次浏览轨迹特征可以为:12435。其中,采用编码的形式表征单次浏览轨迹特征,使得可以将以编码形式表征的单次浏览轨迹特征输入至初始第一类别预测子模型中进行处理,应当了解的是,本申请实施例中所提及的用户行为统计特征都应该是能直接输入至模型进行处理的特征。
进一步的,用户行为统计特征还可以包括单次浏览目的页特征,该单次浏览目的页特征表征训练用户在预设时间段内,对目标业务平台的单次使用中浏览时长最大的页面类别的平台页面;举例来说,如图4a所示,为本申请实施例提供的一种训练用户单次使用目标业务平台时对于各个页面类别的平台页面的浏览时长的示意图,该训练用户对目标业务平台的此次使用中,对主页类别的平台页面的浏览时长为50秒,对付费相关类别的平台页面的浏览时长为300秒,对活动相关类别的平台页面的浏览时长为0秒,对业务知识相关类别的平台页面的浏览时长为600秒,以及对其他类别的平台页面的浏览时长为0秒,则可以将业务知识相关类别的平台页面确定为该训练用户对于目标业务平台的该次浏览所产生的单次浏览目的页特征,以编码的形式表征训练用户的单次浏览目的页特征可以为00010,其中,00010分别与主页类别的平台页面,付费相关类别的平台页面、活动相关类别的平台页面、业务知识相关类别的平台页面、其他类别的平台页面相对应。又如,如图4b所示,为本申请实施例提供的另一种训练用户单次使用目标业务平台时对于各个页面类别的平台页面的浏览时长的示意图,该训练用户对目标业务平台的此次使用中,对主页类别的平台页面的浏览时长为5秒,对付费相关类别的平台页面的浏览时长为0秒,对活动相关类别的平台页面的浏览时长为300秒,对业务知识相关类别的平台页面的浏览时长为0秒,以及对其他类别的平台页面的浏览时长为0秒,则可以将活动相关类别的平台页面确定为该训练用户对于目标业务平台的该次浏览所产生的单次浏览目的页特征,以编码的形式表征训练用户的单次浏览目的页特征可以为00100。其中,采用编码的形式表征的单次浏览目的页特征,可以直接输入至初始第一类别预测子模型中进行处理。
可选的,训练用户的用户行为统计特征还可以包括参加活动次数特征、付费业务浏览次数特征、官方账号关注情况特征以及活动获利特征等,其中,参加活动次数特征表征训练用户在预设时间段内参加目标业务平台中开展的营销活动的次数,付费业务浏览次数特征表征训练用户在预设时间段内浏览目标业务平台中的付费业务的次数,例如,若目标业务平台为保险业务平台,则保险业务平台中的付费业务可以为保险产品等,官方账号关注情况特征表征训练用户是否关注目标业务平台的官方账号,例如,是否关注目标业务平台的官方公众号等,活动获利特征表征训练用户在预设时间段内参与目标业务平台中开展的营销活动所获得的资源。
在一个实施例中,训练用户的用户行为轨迹特征用于对初始第二类别预测子模型进行训练,以得到第二类别预测子模型,其中,用户行为轨迹特征指的是:训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征,可以表征训练用户对于目标业务平台中的各个平台页面的浏览情况,具体可以表征训练用户在预设时间段内对于目标业务平台中的预设数量的平台页面的浏览顺序以及该训练用户在该预设数量的平台页面中的浏览时长。进一步的,可以基于矩阵的形式表示训练用户的用户行为轨迹特征,基于矩阵的形式表示的训练用户的用户行为轨迹特征包括训练用户在预设时间段内所浏览的目标业务平台中的预设数量的平台页面的页面标识,以及该训练用户在该预设数量的平台页面中的浏览时长。其中,平台页面的页面标识用于唯一标识该平台页面,可以通过对平台页面进行编码得到;可以根据具体需求确定预设数量,例如,可以将预设数量设定为500,则可以获取训练用户在预设时间段内所浏览的目标业务平台中的500个平台页面的页面标识。其中,采用矩阵的形式表征训练用户的用户行为轨迹特征,使得可以将以矩阵形式表征的训练用户的用户行为轨迹特征输入至初始第二类别预测子模型中进行处理,应当了解的是,本申请实施例中所提及的用户行为轨迹特征都应该是能直接输入至模型进行处理的特征。
举例来说,若设定训练用户的用户行为轨迹特征包括训练用户在预设时间段内浏览的目标业务平台中的3个平台页面的页面标识,以及训练用户在该3个平台页面中的每个平台页面的浏览时长,若该训练用户在预设时间段内从早到晚依次浏览的3个平台页面的页面标识分别为8,9,10,该训练用户在该3个平台页面中的每个平台页面的浏览时长为10秒,5秒,30秒,则基于矩阵的形式表示训练用户的用户行为轨迹特征可以为
在一个实施例中,用户行为特征的处理设备对于训练用户的用户行为统计特征以及训练用户的用户行为轨迹特征的获取,可以包括:获取训练用户的用户行为原始特征,训练用户的用户行为原始特征指的是:训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征的原始特征数据;将训练用户的用户行为原始特征,按照各个页面类别进行特征统计处理,得到训练用户的用户行为统计特征;将训练用户的用户行为原始特征进行特征转换处理,得到训练用户的用户行为轨迹特征。其中,可以通过对目标业务平台中的各个平台页面进行埋点,得到训练用户的用户行为原始特征,即该训练用户的用户行为原始特征为基于埋点得到的数据。
具体的,用户行为特征的处理设备将训练用户的用户行为原始特征,按照各个页面类别进行特征统计处理,得到训练用户的用户行为统计特征时,可以基于上述提及的训练用户的用户行为统计特征中所包括的各个特征项,将训练用户的用户行为原始特征,按照各个页面类别进行统计处理,得到训练用户的用户行为统计特征数据;并将得到的训练用户的用户行为统计特征数据进行特征转换处理,得到训练用户的用户行为统计特征,即得到可以输入至初始第一类别预测子模型进行处理的训练用户的用户行为统计特征。具体的,用户行为特征的处理设备可以基于上述提及的训练用户的用户行为轨迹特征中所包括的特征项,将训练用户的用户行为原始特征进行特征转换处理,得到训练用户的用户行为轨迹特征,即得到可以输入至初始第二类别预测子模型进行处理的训练用户的用户行为轨迹特征。
在一个实施例中,第一训练样本中可以包括正样本和负样本,第二训练样本中可以包括正样本和负样本,用户行为特征的处理设备获取第一训练样本以及第二训练样本的过程中,当获取的第一训练样本和第二训练样本均为正样本时,可以包括:从存在目标用户行为的用户中确定训练用户;获取训练用户的用户行为特征,训练用户的用户行为特征包括训练用户的用户行为统计特征以及训练用户的用户行为轨迹特征;训练用户的用户行为特征为训练用户产生目标用户行为之前的用户行为特征;标注训练用户的标注类别;基于训练用户的用户行为统计特征以及训练用户的标注类别,确定出第一训练样本,以及基于训练用户的用户行为轨迹特征以及训练用户的标注类别,确定出第二训练样本。
其中,若预设类别包括付费类别和非付费类别,则目标用户行为指的是付费行为,用户行为特征的处理设备可以从存在付费行为的用户中确定训练用户,进一步的,用户行为特征的处理设备可以从在目标业务平台中存在付费行为的用户中确定一定数量的训练用户,即将在目标业务平台中存在付费行为的用户中的一定数量的用户确定为训练用户,可选的,对于训练用户的数量的确定可以根据具体的需求进行具体的设定,例如,可以将在目标业务平台中存在付费行为的用户中的90%的用户确定为训练用户。进一步的,可以采取随机抽取的方式从在目标业务平台中存在付费行为的用户中确定一定数量的训练用户。
举例来说,若目标业务平台中存在付费行为的用户为用户1、用户2、用户3、用户4、用户5、用户6、用户7、用户8、用户9以及用户10,若采用随机抽取的方式从在目标业务平台中存在付费行为的用户中随机抽取90%的用户确定为训练用户,那么确定出的训练用户的一种情况可以为用户1、用户2、用户3、用户4、用户5、用户6、用户7、用户8以及用户9,确定出的训练用户的另一种情况可以为用户2、用户3、用户4、用户5、用户6、用户7、用户8、用户9以及用户10。
在一个实施例中,用户行为特征的处理设备获取训练用户的用户行为特征时,可以获取训练用户在预设时间段内的用户行为特征。其中,预设时间段为根据具体需求进行设定的时间段,当训练用户存在付费行为,则训练用户的用户行为特征还为训练用户产生付费行为之前的用户行为特征。举例来说,若将训练用户首次使用目标业务平台的时间点确定为起始时间点,将起始时间点之后的三个月的时间确定为预设时间段,由于训练用户的用户行为特征还为训练用户产生付费行为之前的用户行为特征,则在此种情况下,训练用户的用户行为特征为在预设时间段内训练用户产生付费行为之前的用户行为特征;又如可以将训练用户产生付费行为的时间点确定为结束时间点,将结束时间点之前的30天的时间确定为预设时间段,则在此种情况下,训练用户的用户行为特征为在预设时间段内的用户行为特征;又如可以将训练用户首次使用目标业务平台的时间点确定为起始时间点,可以将训练用户产生付费行为的时间点确定为结束时间点,将起始时间点至结束时间点之间的时间段确定为预设时间段,则在此种情况下,训练用户的用户行为特征为在预设时间段内的用户行为特征。
进一步的,当训练用户为存在付费行为的训练用户时,用户行为特征的处理设备所标注的训练用户的标注类别为预设类别中的正类别,若用0表征负类别,用1表示正类别,则将训练用户的标注类别标注为1。
在一个实施例中,用户行为特征的处理设备获取第一训练样本以及第二训练样本的过程中,当获取的第一训练样本和第二训练样本均为负样本时,可以包括:从不存在目标用户行为的用户中确定训练用户;获取训练用户的用户行为特征,训练用户的用户行为特征包括训练用户的用户行为统计特征以及训练用户的用户行为轨迹特征;标注训练用户的标注类别;基于训练用户的用户行为统计特征以及训练用户的标注类别,确定出第一训练样本,以及基于训练用户的用户行为轨迹特征以及训练用户的标注类别,确定出第二训练样本。
其中,用户行为特征的处理设备从不存在目标用户行为的用户中确定训练用户的过程与上述从存在目标用户行为的用户中确定训练用户的过程类似,在此不再赘述。
在一个实施例中,用户行为特征的处理设备获取训练用户的用户行为特征时,可以获取训练用户在预设时间段内的用户行为特征。其中,预设时间段为根据具体需求进行设定的时间段。举例来说,若将训练用户首次使用目标业务平台的时间点确定为起始时间点,将起始时间点之后的三个月的时间确定为预设时间段,则在此种情况下,训练用户的用户行为特征为在预设时间段内的用户行为特征;又如可以将用户行为特征的处理设备获取训练用户的用户行为特征时对应的时间点确定为结束时间点,将结束时间点之前的30天的时间确定为预设时间段,则在此种情况下,训练用户的用户行为特征为在预设时间段内的用户行为特征;又如可以将训练用户首次使用目标业务平台的时间点确定为起始时间点,可以将用户行为特征的处理设备获取训练用户的用户行为特征时对应的时间点确定为结束时间点,将起始时间点至结束时间点之间的时间段确定为预设时间段,则在此种情况下,训练用户的用户行为特征为在预设时间段内的用户行为特征。由于存在付费行为的训练用户以及不存在付费行为的训练用户所对应的预设时间段不同,因此需要将存在付费行为的训练用户以及不存在付费行为的训练用户的用户行为特征进行归一化处理,具体的,可以将各个训练用户的用户行为特征的特征值除以各个训练用户对应的预设时间段。
进一步的,当训练用户为不存在付费行为的训练用户时,用户行为特征的处理设备所标注的训练用户的标注类别为预设类别中的负类别,若用0表征负类别,用1表示正类别,则将训练用户的标注类别标注为0。
在一个实施例中,用户行为特征的处理设备在获取第一训练样本以及第二训练样本时,可以只从目标业务平台内的用户中确定训练用户,由此可以保证第一训练样本以及第二训练样本中的数据均是来源于目标业务平台内的数据,所训练得到的第一类别预测子模型以及第二类别预测子模型可以对目标业务平台内的用户进行准确的预测,即保证对于目标业务平台内的用户的预测准确性。可选的,用户行为特征的处理设备在获取第一训练样本以及第二训练样本时,可以从目标业务平台内的用户中确定训练用户,并从在目标业务平台外对目标业务平台所提供的业务进行使用的用户中确定训练用户,由此可以使第一训练样本以及第二训练样本中的数据更加全面,所训练得到的第一类别预测子模型以及第二类别预测子模型可以对用户进行更加全面以及准确的预测。
S202,将训练用户的用户行为统计特征作为输入,将训练用户的标注类别作为期望输出,基于第一训练样本对初始第一类别预测子模型进行训练,得到第一类别预测子模型。
其中,训练用户的用户行为统计特征指的是:训练用户在浏览不同页面类别的平台页面的过程中,统计到的关于各个页面类别的平台页面的浏览特征。
在一个实施例中,第一类别预测子模型为可以实现二分类的模型,例如可以为提升树模型(Gradient Boosting Decision Tree,GBDT),提升树模型是以决策树模型为基学习器,基于提升算法(Boosting算法)的一种集成学习模型,例如可以采用GBDT模型中的LightGBM模型(Light Gradient Boosting Machine)。
在一个实施例中,用户行为特征的处理设备基于第一训练样本对初始第一类别预测子模型进行训练,得到第一类别预测子模型,可以包括:将训练用户的用户行为统计特征作为输入,通过初始第一类别预测子模型对训练用户的用户行为统计特征进行处理,得到训练用户被识别为目标预设类别的第一训练概率,其中,目标预设类别为预设类别中的正类别,例如可以表征付费类别;基于第一训练概率以及训练用户的标注类别确定第一损失函数的损失值,基于不同第一训练样本所产生的第一损失函数的损失值朝着减小第一损失函数的损失值的方向对初始第一类别预测子模型进行训练,直至模型收敛,从而得到第一类别预测子模型。可选的,第一损失函数可以为二分类交叉熵损失函数。其中,基于训练用户的用户行为统计特征对初始第一类别子模型进行训练,是期望根据训练用户在浏览不同页面类别的平台页面的过程中,统计到的关于各个页面类别的平台页面的浏览特征,全面的学习训练用户所具有的浏览特征。
S203,将训练用户的用户行为轨迹特征作为输入,将训练用户的标注类别作为期望输出,基于第二训练样本对初始第二类别预测子模型进行训练,得到第二类别预测子模型。
其中,用户行为轨迹特征指的是:训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征。
在一个实施例中,由于第二类别预测子模型对用户行为轨迹特征进行处理,用户行为轨迹特征可以表征训练用户在预设时间段内对于目标业务平台中的预设数量的平台页面的浏览顺序,所以第二类别预测子模型为可以学习顺序特征的二分类的模型,例如可以为卷积神经网络(Convolutional Neural Network,CNN)模型、循环神经网络(RecurrentNeuralNetwork,RNN)模型等。
在一个实施例中,用户行为特征的处理设备基于第二训练样本对初始第二类别预测子模型进行训练,得到第二类别预测子模型,可以包括:将训练用户的用户行为轨迹特征作为输入,通过初始第二类别预测子模型对训练用户的用户行为轨迹特征进行处理,得到训练用户被识别为目标预设类别的第二训练概率,其中,目标预设类别为预设类别中的正类别,例如可以表征付费类别;基于第二训练概率以及训练用户的标注类别确定第二损失函数的损失值,基于不同第二训练样本所产生的第二损失函数的损失值朝着减小第二损失函数的损失值的方向对初始第二类别预测子模型进行训练,直至模型收敛,从而得到第二类别预测子模型。可选的,第二损失函数可以为二分类交叉熵损失函数。其中,基于训练用户的用户行为轨迹特征对初始第二类别子模型进行训练,是期望根据训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征,对训练用户在预设时间段内对于目标业务平台中的预设数量的平台页面的浏览顺序以及该训练用户在该预设数量的平台页面中的浏览时长进行针对性的学习。
在一个实施例中,若第二类别预测子模型为CNN模型,如图5所示,为本申请实施例提供的一种通过CNN模型对训练用户的用户行为轨迹特征进行处理的示意图,用户行为特征的处理设备将训练用户的用户行为轨迹特征作为输入,通过初始第二类别预测子模型对训练用户的用户行为轨迹特征进行处理,得到训练用户被识别为目标预设类别的第二训练概率,可以包括:将训练用户的用户行为轨迹特征输入多个结构网络进行处理,将通过多个结构网络处理之后的输出通过全链接层(Dense层)进行处理,得到训练用户被识别为目标预设类别的第二训练概率。其中,一个结构网络中包括一个1维卷积神经网络、一个归一化层(Batch Normalization层)以及一个最大池化层(1D-max pool层),其中,1维卷积神经网络可以捕捉训练用户的用户行为轨迹特征的先后顺序关系。结构网络的数量可以根据具体的训练需求进行设定,例如,本申请实施例中可以采用4个结构网络,那么用户行为特征的处理设备可以将训练用户的用户行为轨迹特征通过第一个结构网络进行处理;将通过第一个结构网络进行处理之后的输出通过第二个结构网络进行处理;将通过第二个结构网络进行处理之后的输出通过第三个结构网络进行处理;将第三个结构网络进行处理之后的输出通过第四个结构网络进行处理;将第四个结构网络处理之后的输出通过全链接层进行处理,得到训练用户被识别为目标预设类别的第二训练概率。
以第一个结构网络为例,用户行为特征的处理设备将训练用户的用户行为轨迹特征通过第一个结构网络进行处理时,可以将训练用户的用户行为轨迹特征通过第一个结构网络中的1维卷积神经网络进行处理,将通过该1维卷积神经网络进行处理之后的输出通过第一个结构网络中的归一化层进行处理,最后将该归一化层进行处理之后的输出通过第一个结构网络中的最大池化层进行处理。不同结构网络中包括的1维卷积神经网络、归一化层以及最大池化层的网络参数可以根据具体的训练需求进行设定,例如,若采用4个结构网络,那么可以设定第一个结构网络中的1维卷积神经网络的卷积核大小为1*2,卷积核个数为32个,最大池化层的池化核大小为1*2;可以设定第二个结构网络中的1维卷积神经网络的卷积核大小为1*2,卷积核个数为64个,最大池化层的池化核大小为1*2;可以设定第三个结构网络中的1维卷积神经网络的卷积核大小为1*2,卷积核个数为128个,最大池化层的池化核大小为1*2;可以设定第四个结构网络中的1维卷积神经网络的卷积核大小为1*2,卷积核个数为256个,最大池化层的池化核大小为1*2。
本申请实施例中,用户行为特征的处理设备可以在获取了包括训练用户的用户行为统计特征以及训练用户的标注类别的第一训练样本之后,将训练用户的用户行为统计特征作为输入,将训练用户的标注类别作为期望输出,基于第一训练样本对初始第一类别预测子模型进行训练,得到第一类别预测子模型;可以在获取了包括训练用户的用户行为轨迹特征以及训练用户的标注类别的第二训练样本之后,将训练用户的用户行为轨迹特征作为输入,将训练用户的标注类别作为期望输出,基于第二训练样本对初始第二类别预测子模型进行训练,得到第二类别预测子模型,使得训练得到的第一类别预测子模型以及训练得到的第二类别预测子模型在使用时,可以分别得到目标用户被识别为目标预设类别的第一概率以及第二概率。
基于上述训练得到的第一类别预测子模型以及第二类别预测子模型可以构建类别预测模型,如图6所示,为本申请实施例提供的一种类别预测模型的构建流程示意图。图6所示的类别预测模型的构建流程可以由用户行为特征的处理设备执行,也可以由其余能实现类别预测模型的构建流程的任何电子设备执行,本申请实施例以用户行为特征的处理设备进行介绍。图6所示类别预测模型的构建流程可包括如下步骤:
S601,通过第一类别预测子模型,对第一测试样本进行测试处理,得到测试用户被识别为目标预设类别的第三概率。
其中,第一测试样本包括测试用户的用户行为统计特征以及测试用户的标注类别。第一测试样本用于对第一类别预测子模型进行测试,以确定类别预测模型的目标模型参数。其中,测试用户的标注类别为预设类别中的一个,预设类别可以包括正类别和负类别,测试用户的标注类别为正类别时,表征基于该测试用户得到的第一测试样本为正样本,测试用户的标注类别为负类别时,表征基于该测试用户得到的第一测试样本为负样本。在不同的业务需求中,正类别和负类别具有不同的业务含义,例如,若第一类别预测子模型能够对目标业务平台中的目标用户的付费倾向进行预测,则该正类别可以表征付费类别,该负类别可以表征非付费类别。
在一个实施例中,测试用户的用户行为统计特征可以包括浏览时长特征、浏览次数特征、浏览最大时长特征、单次浏览轨迹特征、单次浏览目的页特征等,可选的,测试用户的用户行为统计特征还可以包括参加活动次数特征、付费业务浏览次数特征、官方账号关注情况特征以及活动获利特征等。
在一个实施例中,目标预设类别为预设类别中的正类别,若正类别为付费类别,则通过第一类别预测子模型对第一测试样本进行测试处理,得到的测试用户被识别为目标预设类别的第三概率可以表征通过第一类别预测子模型预测得到的测试用户的付费倾向,第三概率越大,表征付费倾向越大。
S602,通过第二类别预测子模型,对第二测试样本进行测试处理,得到测试用户被识别为目标预设类别的第四概率。
其中,第二测试样本包括测试用户的用户行为轨迹特征以及测试用户的标注类别。第二测试样本用于对第二类别预测子模型进行测试,以确定类别预测模型的目标模型参数。其中,测试用户的标注类别为预设类别中的一个,预设类别可以包括正类别和负类别,测试用户的标注类别为正类别时,表征基于该测试用户得到的第二测试样本为正样本,测试用户的标注类别为负类别时,表征基于该测试用户的第二测试样本为负样本。在不同的业务需求中,正类别和负类别具有不同的业务含义,例如,若第二类别预测子模型能够对目标业务平台中的目标用户的付费倾向进行预测,则该正类别可以表征付费类别,该负类别可以表征非付费类别。
在一个实施例中,目标预设类别为预设类别中的正类别,若正类别为付费类别,则通过第二类别预测子模型对第二测试样本进行测试处理,得到的测试用户被识别为目标预设类别的第四概率可以表征通过第二类别预测子模型预测得到的测试用户的付费倾向,第四概率越大,表征付费倾向越大。
在一个实施例中,在步骤S601以及步骤S602之前,用户行为特征的处理设备可以对第一测试样本以及第二测试样本进行获取,若所要获取的第一测试样本以及第二测试样本均为正样本,则用户行为特征的处理设备可以从存在目标用户行为的用户中确定测试用户;获取测试用户的用户行为特征,测试用户的用户行为特征包括测试用户的用户行为统计特征以及测试用户的用户行为轨迹特征;测试用户的用户行为特征为测试用户产生目标用户行为之前的用户行为特征;标注测试用户的标注类别;基于测试用户的用户行为统计特征以及测试用户的标注类别,确定出第一测试样本,以及基于测试用户的用户行为轨迹特征以及测试用户的标注类别,确定出第二测试样本。其中,确定第一测试样本的过程与获取第一训练样本的过程类似,确定第二测试样本的过程与获取第二训练样本的过程类似,在此不再赘述。第一测试样本与第一训练样本为不同用户对应的样本,第二测试样本与第二训练样本为不同用户对应的样本。可选的,可以将在目标业务平台中存在付费行为的用户中的一定数量的的用户确定为训练用户,可以将在目标业务平台中存在付费行为的用户中除开被确定为训练用户之后剩余的用户确定为测试用户。
S603,基于第三概率以及第四概率,确定类别预测模型的目标模型参数。
其中,类别预测模型的目标模型参数包括第一类别预测子模型的第一目标权重以及第二类别预测子模型的第二目标权重。
具体实现中,用户行为特征的处理设备基于第三概率以及第四概率,确定类别预测模型的目标模型参数,可以包括:采用多个候选模型参数中的每个候选模型参数,分别对第三概率与第四概率进行融合处理,以得到测试用户的多个识别结果;基于测试用户的标注类别以及测试用户的多个识别结果,计算每个候选模型参数下的类别预测模型的模型评价指标;将每个候选模型参数下的类别预测模型的模型评价指标中,最佳模型评价指标对应的候选模型参数,确定为类别预测模型的目标模型参数。其中,每个候选模型参数包括第一类别预测子模型的第一候选权重以及第二类别预测子模型的第二候选权重。
在一个实施例中,用户行为特征的处理设备采用多个候选模型参数中的每个候选模型参数,分别对第三概率与第四概率进行融合处理,以得到测试用户的多个识别结果,可以包括:采用多个候选模型参数中每个候选模型参数中的第一候选权重以及第二候选权重,分别对第三概率以及第四概率进行加权运算,得到测试用户被识别为目标预设类别的加权概率;将测试用户被识别为目标预设类别的加权概率确定为每个候选模型参数下的测试用户的识别结果,以得到测试用户的多个识别结果。
以一个测试用户和一个候选模型参数为例,如图7a所示,为本申请实施例提供的一种对第三概率与第四概率进行融合处理的示意图,采用一个第一候选权重以及一个第二候选权重,分别对第三概率以及第四概率进行加权运算,得到测试用户被识别为目标预设类别的加权概率;如图7b所示,为本申请实施例提供的一种得到测试用户的识别结果的示意图,通过第一类别预测子模型,对该测试用户的用户行为统计特征进行测试处理,得到测试用户被识别为目标预设类别的第三概率;通过第二类别预测子模型,对该测试用户的用户行为轨迹特征进行测试处理,得到测试用户被识别为目标预设类别的第四概率,采用一个第一候选权重以及一个第二候选权重,分别对第三概率以及第四概率进行加权运算,得到测试用户被识别为目标预设类别的加权概率;将测试用户被识别为目标预设类别的加权概率确定为该一个候选模型参数下的测试用户的识别结果。
具体实现中,用户行为特征的处理设备采用一个候选模型参数中的一个第一候选权重以及一个第二候选权重,对第三概率以及第四概率进行加权运算,得到测试用户被识别为目标预设类别的加权概率时,可以采用该一个第一候选权重以及该一个第二候选权重,对第三概率以及第四概率进行加权求和,具体实现中,可以用第一候选权重乘以第三概率加上第二候选权重乘以第四概率,得到测试用户被识别为目标预设类别的加权概率。举例来说,若第三概率为0.6,第四概率为0.8,第一候选权重为0.4,第二候选权重为0.6,则测试用户被识别为目标预设类别的加权概率为0.72(0.4*0.6+0.6*0.8)。
进一步的,用户行为特征的处理设备在基于测试用户的标注类别以及测试用户的多个识别结果,计算每个候选模型参数下的类别预测模型的模型评价指标的过程中,模型评价指标为用于评价类别预测模型的性能的指标,例如可以为模型评价指标AUC(AreaUnder Curve),提升图(Lift Chart),测试用户的标注类别中被标注为正类别的测试用户的召回率(Recall)等指标。其中,AUC被定义为受试者工作特征曲线(Receiver OperatingCharacteristic Curve,ROC曲线)下的面积,AUC的值越大表征模型的性能越好。
以模型评价指标AUC为例,用户行为特征的处理设备基于测试用户的标注类别以及测试用户的多个识别结果,计算每个候选模型参数下的类别预测模型的模型评价指标,可以包括:基于测试用户的标注类别以及测试用户的多个识别结果,绘制每个候选模型参数对应的受试者工作特征曲线;计算每个候选模型参数对应的受试者工作特征曲线下的面积,并将每个候选模型参数对应的受试者工作特征曲线下的面积,确定为每个候选模型参数下的类别预测模型的模型评价指标。以计算一个候选模型参数下的类别预测模型的模型评价指标为例,则用户行为特征的处理设备基于多个测试用户的标注类别以及该多个测试用户在该候选模型参数下的识别结果绘制该候选模型参数对应的ROC曲线,并计算该候选模型参数对应的ROC曲线下的面积;并将该候选模型参数对应的ROC曲线下的面积,确定为该候选模型参数下的类别预测模型的模型评价指标。
进一步的,用户行为特征的处理设备将每个候选模型参数下的类别预测模型的模型评价指标中,最佳模型评价指标对应的候选模型参数,确定为类别预测模型的目标模型参数,即将每个候选模型参数下的类别预测模型的模型评价指标中,最佳模型评价指标对应的候选模型参数中的第一候选权重确定为类别预测模型的第一目标权重,将最佳模型评价指标对应的候选模型参数中的第二候选权重确定为类别预测模型的第二目标权重。若模型评价指标为模型评价指标AUC,则最佳模型评价指标为最大AUC。举例来说,若存在3个候选模型参数,分别为候选模型参数1、候选模型参数2以及候选模型参数3,其中,候选模型参数1中的第一候选权重1为0.4,第二候选权重1为0.6,候选模型参数2中的第一候选权重2为0.5,第二候选权重2为0.5,候选模型参数3中的第一候选权重3为0.6,第二候选权重3为0.4;若候选模型参数1下的类别预测模型的AUC最大,则将候选模型参数1确定为类别预测模型的目标模型参数,即将第一候选权重1(0.4)确定为类别预测模型的第一目标权重,将第二候选权重2(0.6)确定为类别预测模型的第二目标权重。
可选的,用户行为特征的处理设备可以基于交叉验证法获取不同的第一测试样本以及第二测试样本,以基于获取到的不同的第一测试样本以及第二测试样本确定类别预测模型的目标模型参数,例如可以采用五折交叉验证法或者十折交叉验证法等;基于交叉验证法确定类别预测模型的目标模型参数准确性更高。
S604,基于类别预测模型的目标模型参数、第一类别预测子模型以及第二类别预测子模型,构建类别预测模型。
本申请实施例中,用户行为特征的处理设备可以通过第一类别预测子模型,对第一测试样本进行测试处理,得到测试用户被识别为目标预设类别的第三概率;通过第二类别预测子模型,对第二测试样本进行测试处理,得到测试用户被识别为目标预设类别的第四概率;然后可以基于第三概率以及第四概率,确定类别预测模型的目标模型参数;基于类别预测模型的目标模型参数、第一类别预测子模型以及第二类别预测子模型,构建类别预测模型,使得构建得到的类别预测模型在使用时,可以得到目标用户被识别为目标预设类别的概率,即可以得到目标用户的识别结果。
基于上述构建的类别预测模型以及上述用户行为特征的处理方案,本申请实施例提供了一种用户行为特征的处理方法,参见图8,为本申请实施例提供的一种用户行为特征的处理方法的流程示意图。图8所示的用户行为特征的处理方法可由用户行为特征的处理设备执行。图8所示的样本处理方法可包括如下步骤:
S801,获取目标用户的用户行为特征。
其中,用户行为特征包括用户行为统计特征以及用户行为轨迹特征。
在一个实施例中,目标用户可以为目标业务平台中的任一用户,目标用户的用户行为统计特征可以包括浏览时长特征、浏览次数特征、浏览最大时长特征、单次浏览轨迹特征、单次浏览目的页特征等,可选的,目标用户的用户行为统计特征还可以包括参加活动次数特征、付费业务浏览次数特征、官方账号关注情况特征以及活动获利特征等。目标用户的用户行为统计特征以及目标用户的用户行为轨迹特征中的特征项与训练用户的用户行为统计特征以及训练用户的用户行为轨迹特征中的特征项相同,获取目标用户的用户行为特征与上述获取训练用户的用户行为特征类似,在此不再赘述。
在一个实施例中,用户行为特征的处理设备在获取目标用户的用户行为特征之前,可以对目标业务平台中的用户进行筛选,得到筛选后的用户,并从筛选后的用户中确定目标用户,进而获取目标用户的用户行为特征;其中,目标用户可以为筛选后的用户中的任一用户。对目标业务平台中的用户进行筛选,是为了将低质量用户进行筛除,以使用户行为特征的处理设备不采用本申请实施例提供的用户行为特征的处理方法对低质量用户的付费倾向进行预测,从而节约用户行为特征的处理设备的处理资源。其中,低质量用户可以包括有营销欺诈倾向的低质量用户(即羊毛党)、低账号质量用户、猫池用户、任务平台用户、可疑用户(例如注册号码存在风险的用户、互联网协议地址(InternetProtocolAddress,IP地址)可疑的用户、终端设备可疑的用户、网络信息可疑的用户)等。可选的,可以通过对目标业务平台中的用户的用户画像进行分析,以实现对目标业务平台中的用户的筛选。
S802,通过类别预测模型中的第一类别预测子模型,对目标用户的用户行为统计特征进行预测处理,得到目标用户被识别为目标预设类别的第一概率。
S803,通过类别预测模型中的第二类别预测子模型,对目标用户的用户行为轨迹特征进行预测处理,得到目标用户被识别为目标预设类别的第二概率。
S804,通过类别预测模型对第一概率与第二概率进行融合处理,得到目标用户的识别结果。
其中,目标预设类别为预设类别中的正类别,用户行为特征的处理设备通过类别预测模型对第一概率与第二概率进行融合处理,得到目标用户的识别结果,可以包括:通过类别预测模型,采用第一类别预测子模型的第一目标权重以及第二类别预测子模型的第二目标权重,对第一概率以及第二概率进行加权运算,得到目标用户被识别为目标预设类别的加权概率;将目标用户被识别为目标预设类别的加权概率确定为目标用户的识别结果。用户行为特征的处理设备通过类别预测模型,采用第一目标权重以及第二目标权重,对第一概率以及第二概率进行加权运算时,可以采用第一目标权重以及第二目标权重,对第一概率以及第二概率进行加权求和,具体实现中,可以用第一目标权重乘以第一概率加上第二目标权重乘以第二概率,得到目标用户被识别为目标预设类别的加权概率。举例来说,若第一概率为0.6,第二概率为0.8,第一目标权重为0.4,第二目标权重为0.6,则目标用户被识别为目标预设类别的加权概率为0.72(0.4*0.6+0.6*0.8)。目标用户的识别结果越大,表征目标用户的付费倾向越大。
如图9所示,为本申请实施例提供的一种得到目标用户的识别结果的示意图,用户行为特征的处理设备通过类别预测模型中的第一类别预测子模型,对目标用户的用户行为统计特征进行预测处理,得到目标用户被识别为目标预设类别的第一概率;通过类别预测模型中的第二类别预测子模型,对目标用户的用户行为轨迹特征进行预测处理,得到目标用户被识别为目标预设类别的第二概率;采用第一目标权重以及第二目标权重,对第一概率以及第二概率进行加权运算,得到目标用户被识别为目标预设类别的加权概率;将目标用户被识别为目标预设类别的加权概率确定为目标用户的识别结果。
S805,基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作。
在一个实施例中,用户行为特征的处理设备基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,可以包括:确定目标用户的识别结果所属的目标概率范围,将目标概率范围对应的营销策略确定为目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作。其中,目标概率范围为预先划分的多个概率范围中的一个,可以根据具体需求划分得到多个概率范围。举例来说,若预先划分得到4个概率范围,分别为[0,0.25],(0.25,0.5],(0.5,0.75]以及(0.75,1],且4个概率范围分别对应营销策略1、营销策略2、营销策略3以及营销策略4;若目标用户的识别结果为0.72,则将营销策略3确定为目标营销策略,并对目标用户执行营销策略3对应的营销处理操作。
在一个实施例中,用户行为特征的处理设备基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,可以包括:基于目标用户的识别结果确定目标用户的目标用户等级,目标用户等级为目标用户的识别结果所属的目标概率范围所对应的用户等级;将目标用户等级对应的营销策略确定为目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作。举例来说,若预先划分得到4个概率范围,分别为[0,0.25],(0.25,0.5],(0.5,0.75]以及(0.75,1],且4个概率范围对应的用户等级分别为1级、2级、3级以及4级,各个用户等级对应的营销策略分别为营销策略1、营销策略2、营销策略3以及营销策略4;若目标用户的识别结果为0.72,则目标用户的目标用户等级为3级,将营销策略3确定为目标营销策略,并对目标用户执行营销策略3对应的营销处理操作。
在一个实施例中,用户行为特征的处理设备基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,可以包括:基于目标用户的识别结果对应的目标资源量,向目标用户分配满足目标资源量的资源。举例来说,若预测得到目标用户的识别结果越大,表征目标用户的付费倾向越高,那么,在目标业务平台中开展营销活动时,可以向目标用户分配更多的资源,以刺激目标用户为目标业务平台中所提供的付费业务进行付费;若预测得到目标用户的识别结果越小,表征目标用户的付费倾向越低,那么,在目标业务平台中开展营销活动时,可以向目标用户分配较少的资源,以节约营销活动所产生的成本,通过给不同的用户分配不同资源量的资源,可以增强营销效果。
在一个实施例中,用户行为特征的处理设备基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,可以包括:基于目标用户的识别结果对应的目标资源获取概率,确定是否向所述目标用户分配目标资源。举例来说,若预测得到目标用户的识别结果越大,表征目标用户的付费倾向越高,那么,在目标业务平台中开展营销活动时,可以增大目标用户的资源获取概率,以刺激目标用户为目标业务平台中所提供的付费业务进行付费,例如在一个抽奖活动中,可以增大目标用户抽中的概率;若预测得到目标用户的识别结果越小,表征目标用户的付费倾向越低,那么,在目标业务平台中开展营销活动时,可以减小目标用户的资源获取概率,以节约营销活动所产生的成本,通过给不同的用户设置不同的资源获取概率,可以增强营销效果。
本申请实施例中,可以通过类别预测模型中的第一类别预测子模型,对目标用户的用户行为统计特征进行预测处理,得到目标用户被识别为目标预设类别的第一概率;通过类别预测模型中的第二类别预测子模型,对目标用户的用户行为轨迹特征进行预测处理,得到目标用户被识别为目标预设类别的第二概率;通过类别预测模型对第一概率与第二概率进行融合处理,得到目标用户的识别结果,可提高目标用户的识别准确性。在此基础上,可以基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,即可以针对不同的目标用户执行个性化的营销处理操作,可以增强营销的效果,提高营销成功率,进而提高用户平台的用户粘度。
基于上述方法实施例,本申请实施例提供了一种用户行为特征的处理装置。参见图10,为本申请实施例提供的一种用户行为特征的处理装置的结构示意图,该用户行为特征的处理装置可包括获取单元1001以及处理单元1002。图10所示的用户行为特征的处理装置可运行如下单元:
获取单元1001,用于获取目标用户的用户行为特征,所述用户行为特征包括用户行为统计特征以及用户行为轨迹特征;
处理单元1002,用于通过类别预测模型中的第一类别预测子模型,对所述目标用户的用户行为统计特征进行预测处理,得到所述目标用户被识别为目标预设类别的第一概率;
所述处理单元1002,还用于通过所述类别预测模型中的第二类别预测子模型,对所述目标用户的用户行为轨迹特征进行预测处理,得到所述目标用户被识别为所述目标预设类别的第二概率;
所述处理单元1002,还用于通过所述类别预测模型对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果;
所述处理单元1002,还用于基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作。
在一个实施例中,所述处理单元1002通过所述类别预测模型对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果时,具体执行如下操作:
通过所述类别预测模型,采用所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重,对所述第一概率以及所述第二概率进行加权运算,得到所述目标用户被识别为所述目标预设类别的加权概率;
将所述目标用户被识别为所述目标预设类别的加权概率确定为所述目标用户的识别结果。
在一个实施例中,所述处理单元1002通过类别预测模型中的第一类别预测子模型,对所述目标用户的用户行为统计特征进行预测处理,得到所述目标用户被识别为目标预设类别的第一概率之前,还用于:
通过所述第一类别预测子模型,对第一测试样本进行测试处理,得到测试用户被识别为所述目标预设类别的第三概率,所述第一测试样本包括所述测试用户的用户行为统计特征以及所述测试用户的标注类别;
通过所述第二类别预测子模型,对第二测试样本进行测试处理,得到所述测试用户被识别为所述目标预设类别的第四概率,所述第二测试样本包括所述测试用户的用户行为轨迹特征以及所述测试用户的标注类别;
基于所述第三概率以及所述第四概率,确定所述类别预测模型的目标模型参数,所述类别预测模型的目标模型参数包括所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重;
基于所述类别预测模型的目标模型参数、所述第一类别预测子模型以及所述第二类别预测子模型,构建所述类别预测模型。
在一个实施例中,所述处理单元1002基于所述第三概率以及所述第四概率,确定所述类别预测模型的目标模型参数时,具体执行如下操作:
采用多个候选模型参数中的每个候选模型参数,分别对所述第三概率与所述第四概率进行融合处理,以得到所述测试用户的多个识别结果;
基于所述测试用户的标注类别以及所述测试用户的多个识别结果,计算所述每个候选模型参数下的类别预测模型的模型评价指标;
将所述每个候选模型参数下的类别预测模型的模型评价指标中,最佳模型评价指标对应的候选模型参数,确定为所述类别预测模型的目标模型参数。
在一个实施例中,所述处理单元1002基于所述测试用户的标注类别以及所述测试用户的多个识别结果,计算所述每个候选模型参数下的类别预测模型的模型评价指标时,具体执行如下操作:
基于所述测试用户的标注类别以及所述测试用户的多个识别结果,绘制所述每个候选模型参数对应的受试者工作特征曲线;
计算所述每个候选模型参数对应的受试者工作特征曲线下的面积,并将所述每个候选模型参数对应的受试者工作特征曲线下的面积,确定为所述每个候选模型参数下的类别预测模型的模型评价指标。
在一个实施例中,所述处理单元1002,还用于从存在目标用户行为的用户中确定所述测试用户;
所述获取单元1001,还用于获取所述测试用户的用户行为特征,所述测试用户的用户行为特征包括所述测试用户的用户行为统计特征以及所述测试用户的用户行为轨迹特征;所述测试用户的用户行为特征为所述测试用户产生所述目标用户行为之前的用户行为特征;
所述处理单元1002,还用于标注所述测试用户的标注类别;
所述处理单元1002,还用于基于所述测试用户的用户行为统计特征以及所述测试用户的标注类别,确定出所述第一测试样本,以及基于所述测试用户的用户行为轨迹特征以及所述测试用户的标注类别,确定出所述第二测试样本。
在一个实施例中,所述获取单元1001,还用于获取第一训练样本以及第二训练样本,所述第一训练样本包括训练用户的用户行为统计特征以及所述训练用户的标注类别,所述第二训练样本包括所述训练用户的用户行为轨迹特征以及所述训练用户的标注类别;
所述处理单元1002,还用于将所述训练用户的用户行为统计特征作为输入,将所述训练用户的标注类别作为期望输出,基于所述第一训练样本对初始第一类别预测子模型进行训练,得到所述第一类别预测子模型;所述训练用户的用户行为统计特征指的是:所述训练用户在浏览不同页面类别的平台页面的过程中,统计到的关于各个页面类别的平台页面的浏览特征;
所述处理单元1002,还用于将所述训练用户的用户行为轨迹特征作为输入,将所述训练用户的标注类别作为期望输出,基于所述第二训练样本对初始第二类别预测子模型进行训练,得到所述第二类别预测子模型;所述用户行为轨迹特征指的是:所述训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征。
在一个实施例中,所述获取单元1001,还用于:
获取所述训练用户的用户行为原始特征,所述训练用户的用户行为原始特征指的是:所述训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征的原始特征数据;
将所述训练用户的用户行为原始特征,按照所述各个页面类别进行特征统计处理,得到所述训练用户的用户行为统计特征;
将所述训练用户的用户行为原始特征进行特征转换处理,得到所述训练用户的用户行为轨迹特征。
在一个实施例中,所述处理单元1002基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作时,具体执行如下操作:
基于所述目标用户的识别结果对应的目标资源量,向所述目标用户分配满足所述目标资源量的资源;
或者,基于所述目标用户的识别结果对应的目标资源获取概率,确定是否向所述目标用户分配目标资源。根据本申请的一个实施例,图2、图6以及图8所示的用户行为特征的处理方法所涉及各个步骤可以是由图10所示的用户行为特征的处理装置中的各个单元来执行的。例如,图2所示的步骤S201可由图10所示的用户行为特征的处理装置中的获取单元1001来执行,图2所示的步骤S202至步骤S203可由图10所示的用户行为特征的处理装置中的处理单元1002来执行。再如,图6所示的步骤S601至步骤S604可由图10所示的用户行为特征的处理装置中的处理单元1002来执行。又如,图8所示的步骤S801可由图10所示的用户行为特征的处理装置中的获取单元1001来执行,图8所示的步骤S802至步骤S805可由图10所示的用户行为特征的处理装置中的处理单元1002来执行。
根据本申请的另一个实施例,图10所示的用户行为特征的处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,基于逻辑功能划分的用户行为特征的处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2、图6以及图8所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图10中所示的用户行为特征的处理装置,以及来实现本申请实施例用户行为特征的处理方法。所述计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质装载于上述计算设备中,并在其中运行。
本申请实施例中,可以通过类别预测模型中的第一类别预测子模型,对目标用户的用户行为统计特征进行预测处理,得到目标用户被识别为目标预设类别的第一概率;通过类别预测模型中的第二类别预测子模型,对目标用户的用户行为轨迹特征进行预测处理,得到目标用户被识别为目标预设类别的第二概率;通过类别预测模型对第一概率与第二概率进行融合处理,得到目标用户的识别结果,可提高目标用户的识别准确性。在此基础上,可以基于目标用户的识别结果对应的目标营销策略,对目标用户执行目标营销策略对应的营销处理操作,即可以针对不同的目标用户执行个性化的营销处理操作,可以增强营销的效果,提高营销成功率,进而提高用户平台的用户粘度。
基于上述的方法实施例以及装置实施例,本申请还提供了一种用户行为特征的处理设备。参见图11,为本申请实施例提供的一种用户行为特征的处理设备的结构示意图。图11所示的用户行为特征的处理设备可至少包括处理器1101、输入接口1102、输出接口1103以及计算机存储介质1104。其中,处理器1101、输入接口1102、输出接口1103以及计算机存储介质1104可通过总线或其他方式连接。
计算机存储介质1104可以存储在用户行为特征的处理设备的存储器中,计算机存储介质1104用于存储计算机程序,计算机程序包括程序指令,处理器1101用于执行计算机存储介质1104存储的程序指令。处理器1101(或称CPU(Central Processing Unit,中央处理器))是用户行为特征的处理设备的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现上述用户行为特征的处理方法流程或相应功能。
本申请实施例还提供了一种计算机存储介质(Memory),计算机存储介质是用户行为特征的处理设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器1101加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速随机存取存储器(random access memory,RAM)存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
在一个实施例中,可由处理器1101以及输入接口1102加载并执行计算机存储介质中存放的一条或多条指令,以实现上述有关图2、图6以及图8的用户行为特征的处理方法实施例中的方法的相应步骤,具体实现中,计算机存储介质中的一条或多条指令由处理器1101以及输入接口1102加载并执行如下步骤:
输入接口1102,用于获取目标用户的用户行为特征,所述用户行为特征包括用户行为统计特征以及用户行为轨迹特征;
处理器1101,用于通过类别预测模型中的第一类别预测子模型,对所述目标用户的用户行为统计特征进行预测处理,得到所述目标用户被识别为目标预设类别的第一概率;
所述处理器1101,还用于通过所述类别预测模型中的第二类别预测子模型,对所述目标用户的用户行为轨迹特征进行预测处理,得到所述目标用户被识别为所述目标预设类别的第二概率;
所述处理器1101,还用于通过所述类别预测模型对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果;
所述处理器1101,还用于基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作。
在一个实施中,所述处理器1101通过所述类别预测模型对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果时,具体执行如下操作:
通过所述类别预测模型,采用所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重,对所述第一概率以及所述第二概率进行加权运算,得到所述目标用户被识别为所述目标预设类别的加权概率;
将所述目标用户被识别为所述目标预设类别的加权概率确定为所述目标用户的识别结果。
在一个实施例中,所述处理器1101通过类别预测模型中的第一类别预测子模型,对所述目标用户的用户行为统计特征进行预测处理,得到所述目标用户被识别为目标预设类别的第一概率之前,还用于:
通过所述第一类别预测子模型,对第一测试样本进行测试处理,得到测试用户被识别为所述目标预设类别的第三概率,所述第一测试样本包括所述测试用户的用户行为统计特征以及所述测试用户的标注类别;
通过所述第二类别预测子模型,对第二测试样本进行测试处理,得到所述测试用户被识别为所述目标预设类别的第四概率,所述第二测试样本包括所述测试用户的用户行为轨迹特征以及所述测试用户的标注类别;
基于所述第三概率以及所述第四概率,确定所述类别预测模型的目标模型参数,所述类别预测模型的目标模型参数包括所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重;
基于所述类别预测模型的目标模型参数、所述第一类别预测子模型以及所述第二类别预测子模型,构建所述类别预测模型。
在一个实施例中,所述处理器1101基于所述第三概率以及所述第四概率,确定所述类别预测模型的目标模型参数时,具体执行如下操作:
采用多个候选模型参数中的每个候选模型参数,分别对所述第三概率与所述第四概率进行融合处理,以得到所述测试用户的多个识别结果;
基于所述测试用户的标注类别以及所述测试用户的多个识别结果,计算所述每个候选模型参数下的类别预测模型的模型评价指标;
将所述每个候选模型参数下的类别预测模型的模型评价指标中,最佳模型评价指标对应的候选模型参数,确定为所述类别预测模型的目标模型参数。
在一个实施例中,所述处理器1101基于所述测试用户的标注类别以及所述测试用户的多个识别结果,计算所述每个候选模型参数下的类别预测模型的模型评价指标时,具体执行如下操作:
基于所述测试用户的标注类别以及所述测试用户的多个识别结果,绘制所述每个候选模型参数对应的受试者工作特征曲线;
计算所述每个候选模型参数对应的受试者工作特征曲线下的面积,并将所述每个候选模型参数对应的受试者工作特征曲线下的面积,确定为所述每个候选模型参数下的类别预测模型的模型评价指标。
在一个实施例中,所述处理器1101,还用于从存在目标用户行为的用户中确定所述测试用户;
所述输入接口1102,还用于获取所述测试用户的用户行为特征,所述测试用户的用户行为特征包括所述测试用户的用户行为统计特征以及所述测试用户的用户行为轨迹特征;所述测试用户的用户行为特征为所述测试用户产生所述目标用户行为之前的用户行为特征;
所述处理器1101,还用于标注所述测试用户的标注类别;
所述处理器1101,还用于基于所述测试用户的用户行为统计特征以及所述测试用户的标注类别,确定出所述第一测试样本,以及基于所述测试用户的用户行为轨迹特征以及所述测试用户的标注类别,确定出所述第二测试样本。
在一个实施例中,所述输入接口1102,还用于获取第一训练样本以及第二训练样本,所述第一训练样本包括训练用户的用户行为统计特征以及所述训练用户的标注类别,所述第二训练样本包括所述训练用户的用户行为轨迹特征以及所述训练用户的标注类别;
所述处理器1101,还用于将所述训练用户的用户行为统计特征作为输入,将所述训练用户的标注类别作为期望输出,基于所述第一训练样本对初始第一类别预测子模型进行训练,得到所述第一类别预测子模型;所述训练用户的用户行为统计特征指的是:所述训练用户在浏览不同页面类别的平台页面的过程中,统计到的关于各个页面类别的平台页面的浏览特征;
所述处理器1101,还用于将所述训练用户的用户行为轨迹特征作为输入,将所述训练用户的标注类别作为期望输出,基于所述第二训练样本对初始第二类别预测子模型进行训练,得到所述第二类别预测子模型;所述用户行为轨迹特征指的是:所述训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征。
在一个实施例中,所述输入接口1102,还用于:
获取所述训练用户的用户行为原始特征,所述训练用户的用户行为原始特征指的是:所述训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征的原始特征数据;
将所述训练用户的用户行为原始特征,按照所述各个页面类别进行特征统计处理,得到所述训练用户的用户行为统计特征;
将所述训练用户的用户行为原始特征进行特征转换处理,得到所述训练用户的用户行为轨迹特征。
在一个实施例中,所述处理器1101基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作时,具体执行如下操作:
基于所述目标用户的识别结果对应的目标资源量,向所述目标用户分配满足所述目标资源量的资源;
或者,基于所述目标用户的识别结果对应的目标资源获取概率,确定是否向所述目标用户分配目标资源。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。用户行为特征的处理设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该用户行为特征的处理设备执行上述如图2、图6或图8所示的方法实施例。其中,计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种用户行为特征的处理方法,其特征在于,包括:
通过类别预测模型中的第一类别预测子模型,对第一测试样本进行测试处理,得到测试用户被识别为目标预设类别的第三概率,所述第一测试样本包括所述测试用户的用户行为统计特征以及所述测试用户的标注类别;
通过所述类别预测模型中的第二类别预测子模型,对第二测试样本进行测试处理,得到所述测试用户被识别为所述目标预设类别的第四概率,所述第二测试样本包括所述测试用户的用户行为轨迹特征以及所述测试用户的标注类别;
采用多个候选模型参数中的每个候选模型参数,分别对所述第三概率与所述第四概率进行融合处理,以得到所述测试用户的多个识别结果;
基于所述测试用户的标注类别以及所述测试用户的多个识别结果,绘制所述每个候选模型参数对应的受试者工作特征曲线;
计算所述每个候选模型参数对应的受试者工作特征曲线下的面积,并将所述每个候选模型参数对应的受试者工作特征曲线下的面积,确定为所述每个候选模型参数下的类别预测模型的模型评价指标;
将所述每个候选模型参数下的类别预测模型的模型评价指标中,最佳模型评价指标对应的候选模型参数,确定为所述类别预测模型的目标模型参数,所述类别预测模型的目标模型参数包括所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重;
基于所述类别预测模型的目标模型参数、所述第一类别预测子模型以及所述第二类别预测子模型,构建类别预测模型;
获取目标用户的用户行为特征,所述用户行为特征包括用户行为统计特征以及用户行为轨迹特征;
通过所述第一类别预测子模型,对所述目标用户的用户行为统计特征进行预测处理,得到所述目标用户被识别为目标预设类别的第一概率;
通过所述第二类别预测子模型,对所述目标用户的用户行为轨迹特征进行预测处理,得到所述目标用户被识别为所述目标预设类别的第二概率;
通过所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重,对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果;
基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作。
2.如权利要求1所述的方法,其特征在于,所述通过所述类别预测模型对所述第一概率与所述第二概率进行融合处理,得到所述目标用户的识别结果,包括:
通过所述类别预测模型,采用所述第一类别预测子模型的第一目标权重以及所述第二类别预测子模型的第二目标权重,对所述第一概率以及所述第二概率进行加权运算,得到所述目标用户被识别为所述目标预设类别的加权概率;
将所述目标用户被识别为所述目标预设类别的加权概率确定为所述目标用户的识别结果。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
从存在目标用户行为的用户中确定所述测试用户;
获取所述测试用户的用户行为特征,所述测试用户的用户行为特征包括所述测试用户的用户行为统计特征以及所述测试用户的用户行为轨迹特征;所述测试用户的用户行为特征为所述测试用户产生所述目标用户行为之前的用户行为特征;
标注所述测试用户的标注类别;
基于所述测试用户的用户行为统计特征以及所述测试用户的标注类别,确定出所述第一测试样本,以及基于所述测试用户的用户行为轨迹特征以及所述测试用户的标注类别,确定出所述第二测试样本。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一训练样本以及第二训练样本,所述第一训练样本包括训练用户的用户行为统计特征以及所述训练用户的标注类别,所述第二训练样本包括所述训练用户的用户行为轨迹特征以及所述训练用户的标注类别;
将所述训练用户的用户行为统计特征作为输入,将所述训练用户的标注类别作为期望输出,基于所述第一训练样本对初始第一类别预测子模型进行训练,得到所述第一类别预测子模型;所述训练用户的用户行为统计特征包括:所述训练用户在浏览不同页面类别的平台页面的过程中,统计到的关于各个页面类别的平台页面的浏览特征;
将所述训练用户的用户行为轨迹特征作为输入,将所述训练用户的标注类别作为期望输出,基于所述第二训练样本对初始第二类别预测子模型进行训练,得到所述第二类别预测子模型;所述用户行为轨迹特征包括:所述训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
获取所述训练用户的用户行为原始特征,所述训练用户的用户行为原始特征包括:所述训练用户在浏览不同平台页面的过程中,统计到的关于各个平台页面的浏览特征的原始特征数据;
将所述训练用户的用户行为原始特征,按照所述各个页面类别进行特征统计处理,得到所述训练用户的用户行为统计特征;
将所述训练用户的用户行为原始特征进行特征转换处理,得到所述训练用户的用户行为轨迹特征。
6.如权利要求1所述的方法,其特征在于,所述基于所述目标用户的识别结果对应的目标营销策略,对所述目标用户执行所述目标营销策略对应的营销处理操作,包括:
基于所述目标用户的识别结果对应的目标资源量,向所述目标用户分配满足所述目标资源量的资源;
或者,基于所述目标用户的识别结果对应的目标资源获取概率,确定是否向所述目标用户分配目标资源。
7.一种用户行为特征的处理装置,其特征在于,包括:
所述用户行为特征的处理装置包括获取单元以及处理单元,所述获取单元以及所述处理单元用于执行如权利要求1-6中任一项所述的用户行为特征的处理方法。
8.一种用户行为特征的处理设备,其特征在于,所述用户行为特征的处理设备包括输入接口和输出接口,还包括:
处理器,适于实现一条或多条指令;以及,
计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如权利要求1-6中任一项所述的用户行为特征的处理方法。
9.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如权利要求1-6中任一项所述的用户行为特征的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111000424.4A CN113705682B (zh) | 2021-08-27 | 2021-08-27 | 用户行为特征的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111000424.4A CN113705682B (zh) | 2021-08-27 | 2021-08-27 | 用户行为特征的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113705682A CN113705682A (zh) | 2021-11-26 |
CN113705682B true CN113705682B (zh) | 2024-05-14 |
Family
ID=78656413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111000424.4A Active CN113705682B (zh) | 2021-08-27 | 2021-08-27 | 用户行为特征的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705682B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019242222A1 (zh) * | 2018-06-21 | 2019-12-26 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN110728323A (zh) * | 2019-10-12 | 2020-01-24 | 中诚信征信有限公司 | 目标类型用户的识别方法、装置、电子设备及存储介质 |
CN111553754A (zh) * | 2020-07-10 | 2020-08-18 | 支付宝(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置 |
CN111831967A (zh) * | 2020-06-19 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种到店识别方法、装置、电子设备及介质 |
CN111861487A (zh) * | 2020-07-10 | 2020-10-30 | 中国建设银行股份有限公司 | 金融交易数据处理方法、欺诈行为的监测方法和装置 |
CN112488163A (zh) * | 2020-11-17 | 2021-03-12 | 中国平安财产保险股份有限公司 | 一种异常账号的识别方法、装置、计算机设备及存储介质 |
-
2021
- 2021-08-27 CN CN202111000424.4A patent/CN113705682B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019242222A1 (zh) * | 2018-06-21 | 2019-12-26 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN110728323A (zh) * | 2019-10-12 | 2020-01-24 | 中诚信征信有限公司 | 目标类型用户的识别方法、装置、电子设备及存储介质 |
CN111831967A (zh) * | 2020-06-19 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种到店识别方法、装置、电子设备及介质 |
CN111553754A (zh) * | 2020-07-10 | 2020-08-18 | 支付宝(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置 |
CN111861487A (zh) * | 2020-07-10 | 2020-10-30 | 中国建设银行股份有限公司 | 金融交易数据处理方法、欺诈行为的监测方法和装置 |
CN112488163A (zh) * | 2020-11-17 | 2021-03-12 | 中国平安财产保险股份有限公司 | 一种异常账号的识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113705682A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108427708B (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN106651057B (zh) | 一种基于安装包序列表的移动端用户年龄预测方法 | |
WO2022252363A1 (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN111681091B (zh) | 基于时间域信息的金融风险预测方法、装置及存储介质 | |
CN109033408B (zh) | 信息推送方法及装置、计算机可读存储介质、电子设备 | |
CN112633962B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN110288459A (zh) | 贷款预测方法、装置、设备及存储介质 | |
CN108629379A (zh) | 一种个人征信评估方法及系统 | |
CN112148992A (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN106095939A (zh) | 账户权限的获取方法和装置 | |
CN110675252A (zh) | 风险评估方法、装置、电子设备及存储介质 | |
CN112487284A (zh) | 银行客户画像生成方法、设备、存储介质及装置 | |
CN112258238A (zh) | 用户生命价值周期检测方法、装置和计算机设备 | |
CN114417174B (zh) | 内容推荐方法、装置、设备及计算机存储介质 | |
CN115965463A (zh) | 模型训练方法、装置、计算机设备及存储介质 | |
CN111061948A (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN109146667B (zh) | 一种基于量化统计的外部接口综合应用模型的构建方法 | |
CN114693409A (zh) | 产品匹配方法、装置、计算机设备、存储介质和程序产品 | |
CN117291428B (zh) | 一种基于企业管理app的数据后台管理系统 | |
CN113450158A (zh) | 银行活动信息推送方法及装置 | |
CN113569162A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113705682B (zh) | 用户行为特征的处理方法及装置 | |
CN116821759A (zh) | 类别标签的识别预测方法、装置和处理器及电子设备 | |
CN110717787A (zh) | 一种用户的分类方法及装置 | |
CN111522747A (zh) | 一种应用程序的处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |