CN112950258B - 活动分析方法、装置和电子设备 - Google Patents
活动分析方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112950258B CN112950258B CN202110156441.0A CN202110156441A CN112950258B CN 112950258 B CN112950258 B CN 112950258B CN 202110156441 A CN202110156441 A CN 202110156441A CN 112950258 B CN112950258 B CN 112950258B
- Authority
- CN
- China
- Prior art keywords
- user
- probability
- characteristic information
- target activity
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title claims abstract description 293
- 238000004458 analytical method Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000004044 response Effects 0.000 claims description 42
- 238000005070 sampling Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims 2
- 230000008901 benefit Effects 0.000 description 19
- 238000012360 testing method Methods 0.000 description 18
- 238000011156 evaluation Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000006399 behavior Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000035045 associative learning Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000528 statistical test Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005498 polishing Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013102 re-test Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Finance (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种活动分析方法、装置和电子设备,方法包括:从第一用户群中抽取多个用户,计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率;计算多个用户与第二用户群在对目标活动产生响应的条件下具有用户特征信息的差距;在差距小于预设阈值时,将第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率;计算第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,据此分析是否针对第一用户群实施目标活动。本发明能够避免由于第一用户群与第二用户群之间存在差异,导致盲目套用数据造成第一用户群对目标活动的响应不及预期。
Description
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种活动分析方法、装置、电子设备及计算机可读介质。
背景技术
随着互联网的发展,人们的生活越来越多的与互联网紧密联系在了一起,在这个快节奏的时代,对新老用户的精细化、精准化运营越来越为重要。譬如,2019年某头部互联网公司跟全国性大型晚会达成合作,投入几十亿元及数万名公司员工,尽管在初期实现用户增长,但营销活动过后用户留存及转化不及预期,而假如前期实施相关数据调研,结合科学有效的统计推断方法,可以降低无效投入,提高收益转化等。
因此,需要一种新的技术方案,来解决对用户实施各类活动时,对效果转化预估不够科学,盲目采用历史经验,造成资源投放浪费不合理等问题。
发明内容
本发明旨在解决益对用户实施各类活动时,对效果转化预估不够科学,盲目采用历史经验,造成资源投放浪费不合理等问题,实现新老用户目标转化情况精准预估,实现精细化用户运营。
为了解决上述技术问题,本发明第一方面提出一种活动分析方法,所述方法包括:从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;计算所述多个用户在对所述目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率之间的差距;在所述差距小于预设阈值时,将所述第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,作为所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;根据所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,计算所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率;根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析是否针对所述第一用户群实施所述目标活动。
根据本发明的一种优选实施方式,还包括:在所述差距大于预设阈值时,判断当前是否满足重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率的条件,并在当前满足所述条件时,返回所述从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率。
根据本发明的一种优选实施方式,还包括:在当前不满足所述条件时,对所述第一用户群进行重复抽样,统计每个抽样用户是否具有用户特征信息以及是否对目标活动产生响应,根据统计结果计算所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率。
根据本发明的一种优选实施方式,所述条件包括:重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率所占用的计算资源超过预设第一限制值。
根据本发明的一种优选实施方式,所述条件包括:重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率所消耗的计算时间超过预设第二限制值。
根据本发明的一种优选实施方式,所述目标活动需投入活动资源,所述分析是否针对所述第一用户群实施所述目标活动,包括:根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析投入所述活动资源实施所述目标活动所产生的结果,根据结果判断是否需要投入所述活动资源实施所述目标活动。
根据本发明的一种优选实施方式,在所述从第一用户群中抽取多个用户之前,还包括:根据所述目标活动的属性,从多种用户特征信息中选出具有对应属性的用户特征信息,以用于对所述多个用户进行统计。
为了解决上述技术问题,本发明第二方面提出一种活动分析装置,所述装置包括:第一概率计算模块,从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;差距计算模块,计算所述多个用户在对所述目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率之间的差距;概率设置模块,在所述差距小于预设阈值时,将所述第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,作为所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;第二概率计算模块,根据所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,计算所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率;活动分析模块,根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析是否针对所述第一用户群实施所述目标活动。
根据本发明的一种优选实施方式,还包括:条件判断模块,在所述差距大于预设阈值时,判断当前是否满足重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率的条件,并在当前满足所述条件时,所述第一概率计算模块重新从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率。
根据本发明的一种优选实施方式,还包括:第三概率计算模块,在当前不满足所述条件时,对所述第一用户群进行重复抽样,统计每个抽样用户是否具有用户特征信息以及是否对目标活动产生响应,根据统计结果计算所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率。
根据本发明的一种优选实施方式,所述条件包括:重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率所占用的计算资源超过预设第一限制值。
根据本发明的一种优选实施方式,所述条件包括:重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率所消耗的计算时间超过预设第二限制值。
根据本发明的一种优选实施方式,所述目标活动需投入活动资源,所述活动分析模块根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析投入所述活动资源实施所述目标活动所产生的结果,根据结果判断是否需要投入所述活动资源实施所述目标活动。
根据本发明的一种优选实施方式,还包括:特征选择模块,在所述从第一用户群中抽取多个用户之前,根据所述目标活动的属性,从多种用户特征信息中选出具有对应属性的用户特征信息,以用于对所述多个用户进行统计。
为了解决上述技术问题,本发明第三方面提出一种电子设备,其包括处理器以及存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行上述的方法。
为了解决上述技术问题,本发明第四方面提出一种计算机可读存储介质,该所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现上述的方法。
根据本发明的技术方案,没有直接将第二用户群的数据套用在第一用户群上,避免了由于第一用户群与第二用户群之间存在差异、两个用户群对目标活动的响应存在显著差别,导致盲目套用数据造成第一用户群对目标活动的响应情况不及预期,本发明中基于少量样本用户可以高效计算样本用户在对目标活动产生响应的条件下具有用户特征信息的概率,并将其与第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率进行比较,如果二者差距较小,说明样本用户与第二用户群之间差异较小,也即第一用户群与第二用户群无显著差异,此时可以直接为第一用户群套用第二用户群的概率数据,并基于此进行后续的活动分析,根据本实施例的技术方案,基于少量样本用户进行的估算分析效率较高,能够准确分析不同用户群之间是否存在显著差异,从而有利于实现新老用户目标转化情况精准预估,实现精细化用户运营。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是根据本发明的一个实施例的活动分析方法的流程图;
图2是根据本发明的一个实施例的活动分析方法的流程图;
图3是根据本发明的一个实施例的活动分析装置的框图;
图4是根据本发明的一个实施例的活动分析装置的框图;
图5是根据本发明的一个实施例的电子设备的框图;
图6是根据本发明的一个实施例的计算机可读存储介质的示意图。
具体实施方式
现在将参考附图来更加全面地描述本发明的示例性实施例,虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以以任何合适的方式结合到一个或更多其他的实施例中。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
在决策是否对第一用户群实施目标活动时,需要依据第一用户群在对目标活动产生响应的条件下具备用户特征信息的概率进行分析,而第二用户群在对目标活动产生响应的条件下具备用户特征信息的概率已知的,在第一用户群与第二用户群之间不存在明显差异的情况下,可以直接将第二用户群的概率数据作为第一用户群的概率数据,因此,本发明的活动分析方案中,首先从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率,由于抽取用户数量较少,因此可以快速计算出多个用户在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群的估算数据;计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率之间的差距,在差距小于预设阈值时,说明抽取的多个用户与第二用户群没有显著差异,也即第一用户群与第二用户群没有显著差异,所以将第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率;;基于贝叶斯定理,根据第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率,计算第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率;根据第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,分析是否针对第一用户群实施目标活动,此方案避免了第一用户群与第二用户群存在差异,却将第二用户群的概率数据套用在第一用户群之上,造成最终分析是否实施目标活动的决策产生错误。
如图1所示,本发明的一个实施例中提供了一种活动分析方法,方法包括:
步骤S110,从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,对目标活动的类型不进行限制,比较常见的是对用户开展的营销活动;在本实施例中,由于需要针对第一用户群分析是否实施目标活动,所以第一用户群通常为新用户,在互联网营销活动中,新用户为未被营销触达过的用户,或者在历史上曾经被营销过但是近期没有被营销触达的用户,相比于老用户,客群质量可能发生明显变化,该部分用户相关信息量比较稀疏或者可信度不高,譬如注册不足7天的新用户,没有被做过任何营销活动;在本实施例中,通过用户画像对用户信息进行标签化处理,具体表现为企业通过收集分析消费者的社会属性、生活习惯、消费行为等主要信息的数据后,抽象出一个用户的商业全貌,帮助企业快速精准定位到用户群体及用户需求,而用户特征信息即为用户画像的特征信息,比如年龄、性别、地域、婚姻等基本信息,登录、浏览、收藏、加购等行为信息,还可以是用户生命周期、用户价值等模型预测信息等等;在本实施例中,用户对目标活动的响应可以通过变量λ表示:在互联网营销活动中,其表现为一个可以量化的商业促活营销目标变量,具体可以是用户响应率、用户点击率,也可以是DAU(Daily Active User,日活跃用户)、MAU(Monthly Active User,月活跃用户)等。
步骤S120,计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率之间的差距。
在本实施例中,第二用户群为老用户,即短期内被营销触达过的用户,有真实的目标变量λ分布的用户,该部分用户信息量比较丰富,譬如过去30天已经被营销触达过的用户,历史积累了这部分用户的响应转化情况。
本实施例中,基于统计显著性原则(在统计学中,给到零假设为真的情况下,拒绝零假设的概率,通常用α值来表示,当p值小于α值时,拒绝零假设,接受备择假设)进行分析判断,当两个概率差距较小时,说明统计检验不存在显著性差异,即第一用户群与第二用户群之间不存在显著差异,那么第一用户群与第二用户群对目标活动的响应情况基本一致。
步骤S130,在差距小于预设阈值时,将第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,由于已经判断出第一用户群与第二用户群对目标活动的响应情况基本一致,那么可以借鉴历史经验,即将第二用户群的概率数据套用在第一用户群上。
步骤S140,根据第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率,计算第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率。
在本实施例中,可以基于贝叶斯定理计算出第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,贝叶斯定理:给定一些条件下事件发生的概率,其中A和B为随机事件,且P(B)不为零。P(A|B)是指在事件B发生的情况下事件A发生的概率,公式表示为
在本实施例中,以B为具备用户特征信息,A为对目标活动响应,则P(B|A)在上一步骤中已经确定,而由于已经统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,所以可以估算出P(A)和P(B),代入贝叶斯公式后可以计算出P(A|B)。
步骤S150,根据第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,分析是否针对第一用户群实施目标活动。
在本实施例中,在准确掌握了第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率的情况下,可以准确分析是否针对第一用户群实施目标活动。
根据本发明的技术方案,没有直接将第二用户群的数据套用在第一用户群上,避免了由于第一用户群与第二用户群之间存在差异、两个用户群对目标活动的响应存在显著差别,导致盲目套用数据造成第一用户群对目标活动的响应情况不及预期,本发明中基于少量样本用户可以高效计算样本用户在对目标活动产生响应的条件下具有用户特征信息的概率,并将其与第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率进行比较,如果二者差距较小,说明样本用户与第二用户群之间差异较小,也即第一用户群与第二用户群无显著差异,此时可以直接为第一用户群套用第二用户群的概率数据,并基于此进行后续的活动分析,根据本实施例的技术方案,基于少量样本用户进行的估算分析效率较高,能够准确分析不同用户群之间是否存在显著差异,从而有利于实现新老用户目标转化情况精准预估,实现精细化用户运营。
如图2所示,本发明的一个实施例中提供了一种活动分析方法,方法包括:
步骤S210,根据目标活动的属性,从多种用户特征信息中选出具有对应属性的用户特征信息,以用于对多个用户进行统计。
在本实施例中,假设前期有一定的数据积累,并且可以根据用户信息给出基础的用户画像,由于用户画像的特征信息较多,包括基本属性、行为属性、产品偏好、兴趣偏好、用户生命周期、用户价值等,可以根据目标活动的类型、规模等属性,从多种特征信息中选择同样属性的特征信息,使目标活动和用户特征信息之间具有较高的一致性,有利于对用户目标活动响应情况进行更准确的分析。
步骤S220,从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率。
步骤S230,计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率之间的差距。
在本实施例中,例如,假设老用户(对应第二用户群)的用户特征信息evidenceold、目标响应变量λold,以及新用户(对应第一用户群)的用户特征信息evidencenew,及老用户的条件概率P(evidenceold|λold),现在要计算新用户的条件概率分布P(λnew|evidencenew);在本实施例中,通过抽样的方式随机抽取一定量新用户进行A/B试验,统计假设检验判断P(evidenceold|λold)=P(evidencenew|λnew)是否成立。这里的P(evidencenew|λnew)是从对新用户随机抽样得到的,本质上是样本的条件概率值,这里通过样本(抽样用户)的条件概率估算总体(新用户群)的条件概率。例如,随机抽取1000个新用户投放运动鞋广告,10个用户点击,10个用户中8个为男性,那么P(男性|点击)就等于8/10=0.8,这样就得到了条件概率P(evidencenew|λnew)。
步骤S240,在差距小于预设阈值时,将第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,差距较小说明新老用户群没有显著差异,此时套用贝叶斯公式估算出P(λnew|evidencenew),该值反映了新用户群在具有特征信息evidencenew后的目标响应变量λnew的情况。
步骤S250,在差距大于预设阈值时,判断当前是否满足重新抽取多个用户并计算其在对目标活动产生响应的条件下具有用户特征信息的概率的条件,并在当前满足条件时,返回从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,差距较大表示显著性检验不通过,说明老用户客群old和新用户客群new存在差异,不能直接引用历史经验λold|evidenceold来判断,如果条件允许,可以重复抽样并再次进行试验,避免首次抽样中存在随机因素影响,造成基于首次抽样估算的概率不准确,得到抽样结果后再次计算相关统计量
步骤S260,在当前不满足条件时,对第一用户群进行重复抽样,统计每个抽样用户是否具有用户特征信息以及是否对目标活动产生响应,根据统计结果计算第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,对上述条件不进行限制,该条件可以是以下内容:
(1)重新抽取多个用户并计算其在对目标活动产生响应的条件下具有用户特征信息的概率所占用的计算资源超过预设第一限制值。即重新抽取用户并计算响应概率的资源过高,会造成资源浪费,此时不再重新抽取用户并重新计算。
(2)重新抽取多个用户并计算其在对目标活动产生响应的条件下具有用户特征信息的概率所消耗的计算时间超过预设第二限制值。即重新抽取用户并计算响应概率的耗时过长,会造成效率降低,此时不再重新抽取用户并重新计算。
步骤S270,根据第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率,计算第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率。
在本实施例中,通过多次抽样计算确认第一用户群与第二用户群具有显著差别、无法直接套用第二用户群的经验数据之后,需要基于第一用户群整体来计算其在具有用户特征信息的条件下对目标活动产生响应的情况。在本实施例中,对第一用户群进行重复抽样,具体可以采用bootstrapping算法(即自助法,从给定训练集中有放回的均匀抽样,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中,可以从单个样本中产生多个样本,测试解决方案的稳定性,在有限样本下获得更加精确的估计)。对新用户群使用bootstrapping方法,有放回重复抽样,获得随机变量λbootstrap和λbootstrap|evidencebootstrap的统计信息,套用公式计算出相关概率。
步骤S280,根据第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,分析投入活动资源实施目标活动所产生的结果,根据结果判断是否需要投入活动资源实施目标活动。
在本实施例中,目标活动需投入活动资源,包括资金、人员等。在本实施例中,可以基于以下的成本收益矩阵,来计算损益情况,决定是否投放资源开展营销活动,成本收益矩阵如下:
分类 | 投放 | 不投放 |
成本 | cads=crelease+csilent | csilent |
目标变量 | λads | λsilent |
收益 | yads=λads*user_cnt | ysilent=λsilent*user_cnt |
净利 | rads=yads-cads | rsilent=ysilent-csilent |
其中,crelease是营销资源投放成本,csilent是不投入营销资源时的成本;对于新用户来说,λnew就是λads,是对新用户群投入营销资源时的用户的交易转化率,而λsilent是基于历史经验的统计数据,user_cnt为新用户群人数,yads=λads*user_cnt,表示投入营销资源时的收益,λsilent=λsilent*user_cnt,表示不投入营销资源时的收益;rads=yads-cads,表示投入营销资源时的净利,rsilent=ysilent-csilent,表示不投入营销资源时的净利,最终根据净利多少决定是否投入资源实施活动。
通过本实施例的技术方案,通过贝叶斯定理的整体应用,利用A|B试验得到新用户对目标活动的条件响应概率,充分利用已知先验信息和用户特征信息,提高推断的准确性;当多次试验条件不具备或者成本过高时,通过bootstrapping方法,在有限样本下获得更科学的估计;通过成本收益矩阵的应用,清晰对比出是否进行营销资源投放的投入产出情况,科学分配广告营销资源。
本实施例的一个具体实现方式如下:
例如,有100个老用户,其中5个对营销活动发生响应,那么P(λold)=0.052,而在100个老用户中,60个具有相关用户画像特征信息(例如,浏览、收藏、加购行为等),那么P(evidenceold)=0.6;在响应活动的5个老用户中,4个具有上述用户画像特征信息,则P(evidenceold|λold)=0.8;假如已知老用户具有相关用户信息,那么用户响应的条件概率为可见在引入用户画像特征信息后,用户响应的概率从/>提高到/>可见用户画像特征信息的引入增强了对用户响应的判断,有利于精准化选取目标客群或者舍弃非目标客群。对于老用户而言,P(evidenceold|λold)是已知的,而对于新用户则需要通过随机抽样A/B试验,判断P(evidencenew|λnew)是否等于P(evidenceold|λold);如果新老用户群的条件响应概率没有明显变化,直接应用贝叶斯公式得到相关结果;如果统计检验显示存在显著性差异,判断是否可以再次进行相关试验,如果可以再次试验,得到再次试验的估计量P(evidencenew|λnew)和P(λnew),如果不能再次试验,直接应用bootstrapping方法得到相关估计量P(evidencebootstrap|λbootstrap),应用贝叶斯公式得出相关结果。
通过以上技术方案,有利于实现用户投入产出的精准化预估,以此决策是否进行资源投放,以及投放的目标用户群、用户群规模等,甚至可以反推产品运营对产品进行打磨迭代,提升用户体验和效果转化;采用贝叶斯推断,有效的利用先验信息和已知条件下的其他信息,使统计推断结果更加准确可信,而当不具备再次对新用户客群进行试验条件时,采用bootstarpping方法,尽可能获得接近P(evidencenew|λnew)真实值的估计值,减少抽样的随机因素干扰。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由数据处理设备(包括计算机)执行的程序,即计算机程序。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
如图3所示,本发明的一个实施例中提供了一种活动分析装置,装置包括:
第一概率计算模块310,从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,对目标活动的类型不进行限制,比较常见的是对用户开展的营销活动;在本实施例中,由于需要针对第一用户群分析是否实施目标活动,所以第一用户群通常为新用户,在互联网营销活动中,新用户为未被营销触达过的用户,或者在历史上曾经被营销过但是近期没有被营销触达的用户,相比于老用户,客群质量可能发生明显变化,该部分用户相关信息量比较稀疏或者可信度不高,譬如注册不足7天的新用户,没有被做过任何营销活动;在本实施例中,通过用户画像对用户信息进行标签化处理,具体表现为企业通过收集分析消费者的社会属性、生活习惯、消费行为等主要信息的数据后,抽象出一个用户的商业全貌,帮助企业快速精准定位到用户群体及用户需求,而用户特征信息即为用户画像的特征信息,比如年龄、性别、地域、婚姻等基本信息,登录、浏览、收藏、加购等行为信息,还可以是用户生命周期、用户价值等模型预测信息等等;在本实施例中,用户对目标活动的响应可以通过变量λ表示:在互联网营销活动中,其表现为一个可以量化的商业促活营销目标变量,具体可以是用户响应率、用户点击率,也可以是DAU(Daily Active User,日活跃用户)、MAU(Monthly Active User,月活跃用户)等。
差距计算模块320,计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率之间的差距。
在本实施例中,第二用户群为老用户,即短期内被营销触达过的用户,有真实的目标变量λ分布的用户,该部分用户信息量比较丰富,譬如过去30天已经被营销触达过的用户,历史积累了这部分用户的响应转化情况。
本实施例中,基于统计显著性原则(在统计学中,给到零假设为真的情况下,拒绝零假设的概率,通常用α值来表示,当p值小于α值时,拒绝零假设,接受备择假设)进行分析判断,当两个概率差距较小时,说明统计检验不存在显著性差异,即第一用户群与第二用户群之间不存在显著差异,那么第一用户群与第二用户群对目标活动的响应情况基本一致。
概率设置模块330,在差距小于预设阈值时,将第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,由于已经判断出第一用户群与第二用户群对目标活动的响应情况基本一致,那么可以借鉴历史经验,即将第二用户群的概率数据套用在第一用户群上。
第二概率计算模块340,根据第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率,计算第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率。
在本实施例中,可以基于贝叶斯定理计算出第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,贝叶斯定理:给定一些条件下事件发生的概率,其中A和B为随机事件,且P(B)不为零。P(A|B)是指在事件B发生的情况下事件A发生的概率,公式表示为
在本实施例中,以B为具备用户特征信息,A为对目标活动响应,则P(B|A)在上一步骤中已经确定,而由于已经统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,所以可以估算出P(A)和P(B),代入贝叶斯公式后可以计算出P(A|B)。
活动分析模块350,根据第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,分析是否针对第一用户群实施目标活动。
在本实施例中,在准确掌握了第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率的情况下,可以准确分析是否针对第一用户群实施目标活动。
根据本发明的技术方案,没有直接将第二用户群的数据套用在第一用户群上,避免了由于第一用户群与第二用户群之间存在差异、两个用户群对目标活动的响应存在显著差别,导致盲目套用数据造成第一用户群对目标活动的响应情况不及预期,本发明中基于少量样本用户可以高效计算样本用户在对目标活动产生响应的条件下具有用户特征信息的概率,并将其与第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率进行比较,如果二者差距较小,说明样本用户与第二用户群之间差异较小,也即第一用户群与第二用户群无显著差异,此时可以直接为第一用户群套用第二用户群的概率数据,并基于此进行后续的活动分析,根据本实施例的技术方案,基于少量样本用户进行的估算分析效率较高,能够准确分析不同用户群之间是否存在显著差异,从而有利于实现新老用户目标转化情况精准预估,实现精细化用户运营。
如图4所示,本发明的一个实施例中提供了一种活动分析装置,装置包括:
特征选择模块410,根据目标活动的属性,从多种用户特征信息中选出具有对应属性的用户特征信息,以用于对多个用户进行统计。
在本实施例中,假设前期有一定的数据积累,并且可以根据用户信息给出基础的用户画像,由于用户画像的特征信息较多,包括基本属性、行为属性、产品偏好、兴趣偏好、用户生命周期、用户价值等,可以根据目标活动的类型、规模等属性,从多种特征信息中选择同样属性的特征信息,使目标活动和用户特征信息之间具有较高的一致性,有利于对用户目标活动响应情况进行更准确的分析。
第一概率计算模块420,从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率。
差距计算模块430,计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率之间的差距。
在本实施例中,例如,假设老用户(对应第二用户群)的用户特征信息evidenceold、目标响应变量λold,以及新用户(对应第一用户群)的用户特征信息evidencenew,及老用户的条件概率P(evidenceold|λold),现在要计算新用户的条件概率分布P(λnew|evidencenew);在本实施例中,通过抽样的方式随机抽取一定量新用户进行A/B试验,统计假设检验判断P(evidenceold|λold)=P(evidencenew|λnew)是否成立。这里的P(evidencenew|λnew)是从对新用户随机抽样得到的,本质上是样本的条件概率值,这里通过样本(抽样用户)的条件概率估算总体(新用户群)的条件概率。例如,随机抽取1000个新用户投放运动鞋广告,10个用户点击,10个用户中8个为男性,那么P(男性|点击)就等于8/10=0.8,这样就得到了条件概率P(evidencenew|λnew)。
概率设置模块440,在差距小于预设阈值时,将第二用户群在对目标活动产生响应的条件下具有用户特征信息的概率,作为第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,差距较小说明新老用户群没有显著差异,此时套用贝叶斯公式估算出P(λnew|evidencenew),该值反映了新用户群在具有特征信息evidencenew后的目标响应变量λnew的情况。
条件判断模块450,在差距大于预设阈值时,判断当前是否满足重新抽取多个用户并计算其在对目标活动产生响应的条件下具有用户特征信息的概率的条件,并在当前满足条件时,第一概率计算模块420从第一用户群中抽取多个用户,统计多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算多个用户在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,差距较大表示显著性检验不通过,说明老用户客群old和新用户客群new存在差异,不能直接引用历史经验λold|evidenceold来判断,如果条件允许,可以重复抽样并再次进行试验,避免首次抽样中存在随机因素影响,造成基于首次抽样估算的概率不准确,得到抽样结果后再次计算相关统计量
第三概率计算模块460,在当前不满足条件时,对第一用户群进行重复抽样,统计每个抽样用户是否具有用户特征信息以及是否对目标活动产生响应,根据统计结果计算第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率。
在本实施例中,对上述条件不进行限制,该条件可以是以下内容:
(1)重新抽取多个用户并计算其在对目标活动产生响应的条件下具有用户特征信息的概率所占用的计算资源超过预设第一限制值。即重新抽取用户并计算响应概率的资源过高,会造成资源浪费,此时不再重新抽取用户并重新计算。
(2)重新抽取多个用户并计算其在对目标活动产生响应的条件下具有用户特征信息的概率所消耗的计算时间超过预设第二限制值。即重新抽取用户并计算响应概率的耗时过长,会造成效率降低,此时不再重新抽取用户并重新计算。
第二概率计算模块470,根据第一用户群在对目标活动产生响应的条件下具有用户特征信息的概率,计算第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率。
在本实施例中,通过多次抽样计算确认第一用户群与第二用户群具有显著差别、无法直接套用第二用户群的经验数据之后,需要基于第一用户群整体来计算其在具有用户特征信息的条件下对目标活动产生响应的情况。在本实施例中,对第一用户群进行重复抽样,具体可以采用bootstrapping算法(即自助法,从给定训练集中有放回的均匀抽样,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中,可以从单个样本中产生多个样本,测试解决方案的稳定性,在有限样本下获得更加精确的估计)。对新用户群使用bootstrapping方法,有放回重复抽样,获得随机变量λbootstrap和λbootstrap|evidencebootstrap的统计信息,套用公式计算出相关概率。
活动分析模块480,根据第一用户群在具有用户特征信息的条件下对目标活动产生响应的概率,分析投入活动资源实施目标活动所产生的结果,根据结果判断是否需要投入活动资源实施目标活动。
在本实施例中,目标活动需投入活动资源,包括资金、人员等。在本实施例中,可以基于以下的成本收益矩阵,来计算损益情况,决定是否投放资源开展营销活动,成本收益矩阵如下:
分类 | 投放 | 不投放 |
成本 | cads=crelease+csilent | csilent |
目标变量 | λads | λsilent |
收益 | yads=λads*user_cnt | ysilent=λsilent*user_cnt |
净利 | rads=yads-cads | rsilent=ysilent-csilent |
其中,crelease是营销资源投放成本,csilent是不投入营销资源时的成本;对于新用户来说,λnew就是λads,是对新用户群投入营销资源时的用户的交易转化率,而ysilent是基于历史经验的统计数据,user_cnt为新用户群人数,yads=λads*user_cnt,表示投入营销资源时的收益,ysilent=λsilent*user_cnt,表示不投入营销资源时的收益;rads=yads-cads,表示投入营销资源时的净利,rsilent=ysilent-csilent,表示不投入营销资源时的净利,最终根据净利多少决定是否投入资源实施活动。
通过本实施例的技术方案,通过贝叶斯定理的整体应用,利用A|B试验得到新用户对目标活动的条件响应概率,充分利用已知先验信息和用户特征信息,提高推断的准确性;当多次试验条件不具备或者成本过高时,通过bootstrapping方法,在有限样本下获得更科学的估计;通过成本收益矩阵的应用,清晰对比出是否进行营销资源投放的投入产出情况,科学分配广告营销资源。
本实施例的一个具体实现方式如下:
例如,有100个老用户,其中5个对营销活动发生响应,那么P(λold)=0.052,而在100个老用户中,60个具有相关用户画像特征信息(例如,浏览、收藏、加购行为等),那么P(evidenceold)=0.6;在响应活动的5个老用户中,4个具有上述用户画像特征信息,则P(evidenceold|λold)=0.8;假如已知老用户具有相关用户信息,那么用户响应的条件概率为可见在引入用户画像特征信息后,用户响应的概率从/>提高到/>可见用户画像特征信息的引入增强了对用户响应的判断,有利于精准化选取目标客群或者舍弃非目标客群。对于老用户而言,P(evidenceold|λold)是已知的,而对于新用户则需要通过随机抽样A/B试验,判断P(evidencenew|λnew)是否等于P(evidenceold|λold);如果新老用户群的条件响应概率没有明显变化,直接应用贝叶斯公式得到相关结果;如果统计检验显示存在显著性差异,判断是否可以再次进行相关试验,如果可以再次试验,得到再次试验的估计量P(evidencenew|λnew)和P(λnew),如果不能再次试验,直接应用bootstrapping方法得到相关估计量P(evidencebootstrap|λbootstrap),应用贝叶斯公式得出相关结果。
通过以上技术方案,有利于实现用户投入产出的精准化预估,以此决策是否进行资源投放,以及投放的目标用户群、用户群规模等,甚至可以反推产品运营对产品进行打磨迭代,提升用户体验和效果转化;采用贝叶斯推断,有效的利用先验信息和已知条件下的其他信息,使统计推断结果更加准确可信,而当不具备再次对新用户客群进行试验条件时,采用bootstarpping方法,尽可能获得接近P(evidencenew|λnew)真实值的估计值,减少抽样的随机因素干扰。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的实体形式的实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图5是根据本发明的一种电子设备的示例性实施例的结构框图。图5显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,该示例性实施例的电子设备200以通用数据处理设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,所述存储单元220存储有计算机可读程序,其可以是源程序或都只读程序的代码。所述程序可以被处理单元210执行,使得所述处理单元210执行本发明各种实施方式的步骤。例如,所述处理单元210可以执行如图1或图2所示的步骤。
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、显示器、网络设备、蓝牙设备等)通信,使得用户能经由这些外部设备300与该电子设备200交互,和/或使得该电子设备200能与一个或多个其它数据处理设备(例如路由器、调制解调器等等)进行通信。这种通信可以通过输入/输出(I/O)接口250进行,还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)进行。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,电子设备200中可使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
图6是本发明的一个计算机可读介质实施例的示意图。如图6所示,所述计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。当所述计算机程序被一个或多个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;计算所述多个用户在对所述目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率之间的差距;在所述差距小于预设阈值时,将所述第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,作为所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;根据所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,计算所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率;根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析是否针对所述第一用户群实施所述目标活动。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台数据处理设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以执行计算机程序的方法、装置、电子设备或计算机可读介质来实现。可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现本发明的一些或者全部功能。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种活动分析方法,其特征在于,包括:
从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;
计算所述多个用户在对所述目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率之间的差距;
在所述差距小于预设阈值时,将所述第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,作为所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;
根据所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,计算所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率;
根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析是否针对所述第一用户群实施所述目标活动。
2.根据权利要求1所述的活动分析方法,其特征在于,还包括:
在所述差距大于预设阈值时,判断当前是否满足重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率的条件,并在当前满足所述重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件时,返回所述从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率。
3.根据权利要求2所述的活动分析方法,其特征在于,还包括:
在当前不满足所述重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件时,对所述第一用户群进行重复抽样,统计每个抽样用户是否具有用户特征信息以及是否对目标活动产生响应,根据统计结果计算所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率。
4.根据权利要求2或3所述的活动分析方法,其特征在于,所述重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件包括:
重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率所占用的计算资源超过预设第一限制值。
5.根据权利要求2或3所述的活动分析方法,其特征在于,所述重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件包括:
重新抽取所述多个用户并计算其在对所述目标活动产生响应的条件下具有所述用户特征信息的概率所消耗的计算时间超过预设第二限制值。
6.根据权利要求1所述的活动分析方法,其特征在于,
所述目标活动需投入活动资源;
所述分析是否针对所述第一用户群实施所述目标活动,包括:根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析投入所述活动资源实施所述目标活动所产生的结果,根据结果判断是否需要投入所述活动资源实施所述目标活动。
7.根据权利要求1所述的活动分析方法,其特征在于,在所述从第一用户群中抽取多个用户之前,还包括:
根据所述目标活动的属性,从多种用户特征信息中选出具有对应属性的用户特征信息,以用于对所述多个用户进行统计。
8.一种活动分析装置,其特征在于,包括:
第一概率计算模块,从第一用户群中抽取多个用户,统计所述多个用户是否具有用户特征信息以及是否对目标活动产生响应,并计算所述多个用户在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;
差距计算模块,计算所述多个用户在对所述目标活动产生响应的条件下具有用户特征信息的概率与已知的第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率之间的差距;
概率设置模块,在所述差距小于预设阈值时,将所述第二用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,作为所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率;
第二概率计算模块,根据所述第一用户群在对所述目标活动产生响应的条件下具有所述用户特征信息的概率,计算所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率;
活动分析模块,根据所述第一用户群在具有所述用户特征信息的条件下对所述目标活动产生响应的概率,分析是否针对所述第一用户群实施所述目标活动。
9.一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110156441.0A CN112950258B (zh) | 2021-02-04 | 2021-02-04 | 活动分析方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110156441.0A CN112950258B (zh) | 2021-02-04 | 2021-02-04 | 活动分析方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112950258A CN112950258A (zh) | 2021-06-11 |
CN112950258B true CN112950258B (zh) | 2024-02-20 |
Family
ID=76244040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110156441.0A Active CN112950258B (zh) | 2021-02-04 | 2021-02-04 | 活动分析方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112950258B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113448872B (zh) * | 2021-07-22 | 2022-04-29 | 网易(杭州)网络有限公司 | 一种测试的执行方法、装置、设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297320A (zh) * | 2012-03-05 | 2013-09-11 | 北京千橡网景科技发展有限公司 | 用于组织活动的方法和设备 |
US8655695B1 (en) * | 2010-05-07 | 2014-02-18 | Aol Advertising Inc. | Systems and methods for generating expanded user segments |
CN104424354A (zh) * | 2013-08-27 | 2015-03-18 | 国际商业机器公司 | 使用用户操作生成模型检测异常用户行为的方法和系统 |
CN107657048A (zh) * | 2017-09-21 | 2018-02-02 | 北京麒麟合盛网络技术有限公司 | 用户识别方法及装置 |
CN108520048A (zh) * | 2018-03-30 | 2018-09-11 | 掌阅科技股份有限公司 | 基于电子书的活动内容推送方法及电子设备 |
WO2020112150A1 (en) * | 2018-11-29 | 2020-06-04 | Didi Research America, Llc | System and method for customizing information feed |
CN111538909A (zh) * | 2020-06-22 | 2020-08-14 | 中国银行股份有限公司 | 一种信息推荐方法及装置 |
CN111681025A (zh) * | 2020-04-16 | 2020-09-18 | 上海淇玥信息技术有限公司 | 资源发放方法及其装置、电子设备、计算机可读存储介质 |
CN111831896A (zh) * | 2019-06-27 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种信息推送方法、装置、电子设备和存储介质 |
CN111882420A (zh) * | 2020-05-26 | 2020-11-03 | 马上消费金融股份有限公司 | 响应率的生成方法、营销方法、模型训练方法及装置 |
CN111949879A (zh) * | 2020-08-14 | 2020-11-17 | 汉海信息技术(上海)有限公司 | 推送消息的方法、装置、电子设备及可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9560413B2 (en) * | 2014-02-24 | 2017-01-31 | Rovi Guides, Inc. | Systems and methods for notifying a user when activity level exceeds an authorization level |
KR102063901B1 (ko) * | 2014-03-24 | 2020-01-08 | 삼성전자주식회사 | 액티비티 알림 제공 방법 및 이를 위한 디바이스 |
US20160210657A1 (en) * | 2014-12-30 | 2016-07-21 | Anto Chittilappilly | Real-time marketing campaign stimuli selection based on user response predictions |
US20190251581A1 (en) * | 2018-02-14 | 2019-08-15 | Cognant Llc | System and method for client application user acquisition |
-
2021
- 2021-02-04 CN CN202110156441.0A patent/CN112950258B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8655695B1 (en) * | 2010-05-07 | 2014-02-18 | Aol Advertising Inc. | Systems and methods for generating expanded user segments |
CN103297320A (zh) * | 2012-03-05 | 2013-09-11 | 北京千橡网景科技发展有限公司 | 用于组织活动的方法和设备 |
CN104424354A (zh) * | 2013-08-27 | 2015-03-18 | 国际商业机器公司 | 使用用户操作生成模型检测异常用户行为的方法和系统 |
CN107657048A (zh) * | 2017-09-21 | 2018-02-02 | 北京麒麟合盛网络技术有限公司 | 用户识别方法及装置 |
CN108520048A (zh) * | 2018-03-30 | 2018-09-11 | 掌阅科技股份有限公司 | 基于电子书的活动内容推送方法及电子设备 |
WO2020112150A1 (en) * | 2018-11-29 | 2020-06-04 | Didi Research America, Llc | System and method for customizing information feed |
CN111831896A (zh) * | 2019-06-27 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种信息推送方法、装置、电子设备和存储介质 |
CN111681025A (zh) * | 2020-04-16 | 2020-09-18 | 上海淇玥信息技术有限公司 | 资源发放方法及其装置、电子设备、计算机可读存储介质 |
CN111882420A (zh) * | 2020-05-26 | 2020-11-03 | 马上消费金融股份有限公司 | 响应率的生成方法、营销方法、模型训练方法及装置 |
CN111538909A (zh) * | 2020-06-22 | 2020-08-14 | 中国银行股份有限公司 | 一种信息推荐方法及装置 |
CN111949879A (zh) * | 2020-08-14 | 2020-11-17 | 汉海信息技术(上海)有限公司 | 推送消息的方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
Personalized Product Service Scheme Recommendation Based on Trust and Cloud Model;Xiaoming Du等;《IEEE Access》;第8卷;第82581-82591页 * |
互联网企业如何服务于中小零售银行数字化转型;雷健雄;《上海商业》(第03期);第19-22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112950258A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McMahan et al. | Ad click prediction: a view from the trenches | |
CN111611478B (zh) | 信息推荐方法、装置和电子设备 | |
CN109461023B (zh) | 流失用户挽回方法及装置、电子设备、存储介质 | |
CN112270545A (zh) | 基于迁移样本筛选的金融风险预测方法、装置和电子设备 | |
US10657559B2 (en) | Generating and utilizing a conversational index for marketing campaigns | |
CN112508580A (zh) | 基于拒绝推断方法的模型构建方法、装置和电子设备 | |
Chen et al. | Marked self-exciting point process modelling of information diffusion on Twitter | |
CN111210335A (zh) | 用户风险识别方法、装置及电子设备 | |
CN110135912B (zh) | 一种信息推送方法、装置、服务器和存储介质 | |
CN111371767A (zh) | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 | |
WO2017071369A1 (zh) | 一种预测用户离网的方法和设备 | |
JPWO2014103560A1 (ja) | 分析装置、分析プログラム、分析方法、推定装置、推定プログラム、及び、推定方法。 | |
CN111210336A (zh) | 用户风险模型生成方法、装置及电子设备 | |
CN103617146B (zh) | 一种基于硬件资源消耗的机器学习方法及装置 | |
CN111881175A (zh) | 一种标签模型验证方法、装置及设备 | |
CN112950258B (zh) | 活动分析方法、装置和电子设备 | |
CN115983900A (zh) | 用户营销策略的构建方法、装置、设备、介质和程序产品 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN112488865A (zh) | 基于金融时间节点的金融风险预测方法、装置和电子设备 | |
CN111382909A (zh) | 基于生存分析模型扩展坏样本的拒绝推断方法及相关设备 | |
CN110910241A (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN113298120B (zh) | 基于融合模型的用户风险预测方法、系统和计算机设备 | |
CN114757695A (zh) | 用户购买行为预测模型的构建方法、装置及计算机设备 | |
Inoue et al. | Estimating customer impatience in a service system with unobserved balking | |
CN115271282A (zh) | 基于模糊逻辑的客户价值确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |