CN111612366A - 渠道质量评估方法、装置、电子设备及存储介质 - Google Patents

渠道质量评估方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111612366A
CN111612366A CN202010460787.5A CN202010460787A CN111612366A CN 111612366 A CN111612366 A CN 111612366A CN 202010460787 A CN202010460787 A CN 202010460787A CN 111612366 A CN111612366 A CN 111612366A
Authority
CN
China
Prior art keywords
user
users
application program
days
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010460787.5A
Other languages
English (en)
Other versions
CN111612366B (zh
Inventor
林敏�
欧阳秀平
王君实
刘卉芳
廖娟
冯烨
王皓天
闫猛
邹俊德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202010460787.5A priority Critical patent/CN111612366B/zh
Publication of CN111612366A publication Critical patent/CN111612366A/zh
Application granted granted Critical
Publication of CN111612366B publication Critical patent/CN111612366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q50/40

Abstract

本申请提供一种渠道质量评估方法、装置、电子设备及存储介质,通过获取通过待评估渠道发展的M个用户开户N天内的通信行为信息;根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户。因此,上述方法对待评估渠道发展的M个用户开户N天内的用户的行为质量方面对渠道进行评估,实现对渠道质量的早期监控,提高了评估效率。

Description

渠道质量评估方法、装置、电子设备及存储介质
技术领域
本申请实施例涉及数据分析技术领域,尤其涉及一种渠道质量评估方法、装置、电子设备及存储介质。
背景技术
目前,运营商发展新用户的渠道数量较多,如何在用户发展早期评价和监控新用户质量,评估渠道的质量已经成为运营商关注的重要问题。一个优秀的渠道不仅要有稳定的新增用户和活跃用户,还应在数据上体现用户的行为的真实性。
现有技术中,运营商通过观察用户在新入网至少3个月的用户通信行为是否会出现异常,来评价用户质量,从而评估渠道的质量。
但是,现有技术中对用户的观察期较长,不能做到在用户发展早期便对该渠道进行监控,评估效率低。
发明内容
本申请实施例提供一种渠道质量评估方法、装置、电子设备及存储介质,以解决现有技术中因观察期较长导致的渠道评估效率较低的问题。
第一方面,本申请实施例提供一种渠道质量评估方法,包括:获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1;根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
可选地,所述根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分,包括:根据每个样本用户的用于标识用户为真实用户或虚假用户的信息,确定所述样本用户为真实用户或虚假用户;针对每个应用程序,根据如下公式一获取真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率;根据真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率,获取每天各应用程序的贡献度。
Figure BDA0002510886030000021
公式一中,Pik表示真实用户中使用第i个应用程序的概率;Ki表示一天内所述多个样本用户中使用第i个应用程序的真实用户的人数;K表示所述多个样本用户中真实用户的总人数;Piq表示所述虚假用户中使用第i个应用程序的概率;Qi表示一天内所述多个样本用户中使用第i个应用程序的虚假用户的人数;Q表示所述多个样本用户中虚假用户的总人数。
根据每天各应用程序的贡献度及如下公式二,获取每天各应用程序评分。
Figure BDA0002510886030000022
公式二中,APPi评分表示一天的第i个应用程序评分;min(APP贡献度)表示一天中各应用程序的贡献度的最小值;APPi贡献度表示一天所述第i个应用程序的贡献度。
根据所述多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位;根据所述每天各应用程序评分以及所述开户N天内每天各应用程序的使用次数档位,获取开户N天内每天的应用程序使用总得分。
可选地,所述根据所述多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位,包括:根据所述样本用户开户N天内每天各应用程序的使用次数,获取所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数;根据所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取所述样本用户开户N天内每天各应用程序的使用次数档位。
可选地,所述方法,还包括:根据所述多个样本用户中每个样本用户的所述通信行为信息,获得部分样本用户中每个样本用户的平均通话次数;根据每个样本用户的平均通话次数以及所述每天的应用程序使用总得分,确定样本用户的用户类型,所述用户类型为应用程序与语音均不活跃用户,或者,应用程序活跃用户,或者,语音活跃用户,或者,应用程序与语音均活跃用户;将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型;所述针对M个用户中的每个用户,根据所述用户的所述通信行为信息、开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户,包括:根据所述每个用户的所述通信行为信息,获得每个用户的平均通话次数;根据每个用户的平均通话次数以及所述样本用户每天的应用程序使用总得分,确定所述用户的用户类型;根据所述用户的用户类型,确定所述用户类型对应的真实用户预测模型;根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及所述用户的用户类型对应的真实用户预测模型,预测所述用户是否为真实用户。
可选地,将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型,包括:根据属于同一用户类型的部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的初始真实用户预测模型;根据属于同一用户类型的另一部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,校正所述用户类型对应的初始真实用户预测模型,获得所述用户类型的真实用户预测模型。
可选地,根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量,包括:根据所述M个用户中真实用户的数量以及所述M,获取所述M个用户中真实用户的数量与所述M的比值;根据所述M个用户中真实用户的数量与所述M的比值,评估所述渠道的质量。
可选地,每天的通信行为信息包括如下至少一项:每天通话次数、每天流量、每天各应用程序的使用次数、充值金额以及用于标识用户为真实用户或虚假用户的信息。
第二方面,本申请实施例提供一种渠道质量评估装置,包括:获取模块、处理模块和评估模块。
所述获取模块,用于获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1;以及根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分。
所述处理模块,用于针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的。
所述评估模块,用于根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
可选地,所述获取模块,具体用于:根据每个样本用户的用于标识用户为真实用户或虚假用户的信息,确定所述样本用户为真实用户或虚假用户;以及针对每个应用程序,根据如下公式一获取真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率;根据真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率,获取每天各应用程序的贡献度。
Figure BDA0002510886030000041
公式一中,Pik表示真实用户中使用第i个应用程序的概率;Ki表示一天内所述多个样本用户中使用第i个应用程序的真实用户的人数;K表示所述多个样本用户中真实用户的总人数;Piq表示所述虚假用户中使用第i个应用程序的概率;Qi表示一天内所述多个样本用户中使用第i个应用程序的虚假用户的人数;Q表示所述多个样本用户中虚假用户的总人数。
所述获取模块,具体用于:根据每天各应用程序的贡献度及如下公式二,获取每天各应用程序评分。
Figure BDA0002510886030000042
公式二中,APPi评分表示一天的第i个应用程序评分;min(APP贡献度)表示一天中各应用程序的贡献度的最小值;APPi贡献度表示一天所述第i个应用程序的贡献度。
所述获取模块,具体用于:根据所述多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位;以及根据所述每天各应用程序评分以及所述开户N天内每天各应用程序的使用次数档位,获取开户N天内每天的应用程序使用总得分。
可选地,所述获取模块,具体用于:根据所述样本用户开户N天内每天各应用程序的使用次数,获取所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数;以及根据所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取所述样本用户开户N天内每天各应用程序的使用次数档位。
可选地,所述处理模块,还用于:根据所述多个样本用户中每个样本用户的所述通信行为信息,获得部分样本用户中每个样本用户的平均通话次数;以及根据每个样本用户的平均通话次数以及所述每天的应用程序使用总得分,确定样本用户的用户类型,所述用户类型为应用程序与语音均不活跃用户,或者,应用程序活跃用户,或者,语音活跃用户,或者,应用程序与语音均活跃用户;以及将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型。
所述处理模块,具体用于:根据所述每个用户的所述通信行为信息,获得每个用户的平均通话次数;以及根据每个用户的平均通话次数以及所述样本用户每天的应用程序使用总得分,确定所述用户的用户类型;以及根据所述用户的用户类型,确定所述用户类型对应的真实用户预测模型;以及根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及所述用户的用户类型对应的真实用户预测模型,预测所述用户是否为真实用户。
可选地,所述处理模块,具体用于:根据属于同一用户类型的部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的初始真实用户预测模型;以及根据属于同一用户类型的另一部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,校正所述用户类型对应的初始真实用户预测模型,获得所述用户类型的真实用户预测模型。
可选地,所述评估模块,具体用于:根据所述M个用户中真实用户的数量以及所述M,获取所述M个用户中真实用户的数量与所述M的比值;以及根据所述M个用户中真实用户的数量与所述M的比值,评估所述渠道的质量。
可选地,每天的通信行为信息包括如下至少一项:每天通话次数、每天流量、每天各应用程序的使用次数、充值金额以及用于标识用户为真实用户或虚假用户的信息。
第三方面,本申请实施例提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中的程序指令,执行如本申请第一方面所述的渠道质量评估方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请第一方面所述的渠道质量评估方法。
第五方面,本申请实施例提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备实施如第一方面本申请实施例所述的渠道质量评估方法。
本申请实施例提供的渠道质量评估方法、装置、电子设备及存储介质,通过获取通过待评估渠道发展的M个用户开户N天内的通信行为信息;根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。因此,上述方法对待评估渠道发展的M个用户开户N天内的用户的行为质量方面对渠道进行评估,实现对渠道质量的早期监控,提高了评估效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景示意图;
图2为本申请一实施例提供的渠道质量评估方法的流程示意图;
图3为本申请另一实施例提供的渠道质量评估方法的流程示意图;
图4为本申请一实施例提供的渠道质量评估装置的结构示意图;
图5为本申请一实施例提供的电子设备的结构示意图;
图6为本申请另一实施例提供的电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请实施例可以应用于电子设备中,图1为本申请一实施例提供的应用场景示意图,如图1所示。图1中的电子设备可以包括:计算机、服务器等,对此本申请不做限制。
现有技术中,运营商通过观察用户在新入网至少3个月的用户通信行为是否会出现异常,来评价用户的行为的真实性,从而评估渠道的质量。但是,现有技术中对用户的观察期较长,不能做到在用户发展早期便对该渠道进行评估监控,评估效率低。
基于该技术问题,本申请提出了一种渠道质量评估方法,主要在用户发展早期(例如入网8天内),对用户在新入网3个月内的用户的行为真实性进行评估,从而进一步的实现渠道质量的评估,该评估方法可以高准确率地预测出用户的真实性,实现对渠道质量的早期监控,以渠道新发展用户真实性评价运营商代理渠道发展质量,缩短了对新发展用户的观察期,提高了评估效率。
下面结合几个具体的实施例对本申请的技术方案进行描述。
图2为本申请一实施例提供的渠道质量评估方法的流程示意图,如图2所示,本申请实施例的方法可以包括:
S201、获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1的整数。
根据待评估渠道新发展的M个用户,获取M个用户开户之日D1至开户DN天内的通信行为信息。其中,N为大于等于1,小于等于8的整数。其中,开户之日例如为用户开卡之日。
S202、根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分。
首先获取多个样本用户开户T1至TN天内的通信行为信息。然后根据多个样本用户开户T1至TN天内的通信行为信息,对多个样本用户开户T1至TN天内的通信行为信息进行相应的处理,获取开户T1至TN天内每天的应用程序使用总得分。其中,对多个样本用户开户T1至TN天内的通信行为信息进行相应的处理过程参见下述实施例中的相关描述。其中,上述应用程序例如可以为终端设备中的微信应用软件等。
S203、针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户。
针对待评估渠道新发展的M个用户中的每个用户,根据S201中所获取的待评估渠道新发展的每个用户开户D1至DN天内的通信行为信息、S202中所获取的开户T1至TN天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测待评估渠道新发展的M个用户中的每个用户是否为真实用户。
其中,上述预先训练得到的真实用户预测模型是根据多个样本用户开户T1至TN天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户T1至TN天内每天的应用程序使用总得分,采用机器学习建模得到的。其中,机器学习建模算法例如可以是梯度提升迭代决策树(Gradient Boosting Decision Tree,GBDT)算法,具体原理属于现有技术,此处不再赘述。
S204、根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
根据S203中预先训练得到的真实用户预测模型所预测的待评估渠道新发展的M个用户中的真实用户的数量以及新发展的用户的总数量M,评估待评估渠道的质量。
本实施例中,通过获取通过待评估渠道发展的M个用户开户N天内的通信行为信息;根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。因此,上述方法对待评估渠道发展的M个用户开户N天内的用户的行为质量方面对渠道进行评估,实现对渠道质量的早期监控,提高了评估效率。
图3为本申请一实施例提供的渠道质量评估方法的流程示意图,如图3所示,在图2所示实施例的基础上,本申请实施例的方法可以包括:
S301、获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1。
S301的具体实现过程可以参见图2所示实施例中的相关描述,此处不再赘述。
S302、根据每个样本用户的用于标识用户为真实用户或虚假用户的信息,确定所述样本用户为真实用户或虚假用户。
根据多个样本用户的通信行为信息中用于标识每个用户为真实用户或虚假用户的标识信息,将多个样本用户中的每个样本用户划分为两类,即确定多个样本用户中的每个样本用户是真实用户还是虚假用户。
S303、针对每个应用程序,根据如下公式1获取真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率。
Figure BDA0002510886030000101
针对多个样本用户开户T1至TN天内通信行为信息中的每日所使用的每个应用程序,按照上述公式一计算开户T1至TN天内每天多个样本用户中真实用户使用该应用程序的概率,以及开户T1至TN天内每天多个样本用户中虚假用户使用该应用程序的概率。
公式1中,Pik表示真实用户中使用第i个应用程序的概率;Ki表示一天内所述多个样本用户中使用第i个应用程序的真实用户的人数;K表示所述多个样本用户中真实用户的总人数;Piq表示所述虚假用户中使用第i个应用程序的概率;Qi表示一天内所述多个样本用户中使用第i个应用程序的虚假用户的人数;Q表示所述多个样本用户中虚假用户的总人数。
S304、根据真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率,获取每天各应用程序的贡献度。
根据S303中所获取的真实用户使用每个应用程序的概率及虚假用户使用每个应用程序的概率,采用如下公式2计算开户T1至TN天内每天个应用程序对判别多个样本用户中真实用户的贡献度。
APPi贡献度=Pik-Piq 公式2
公式2中,Pik表示真实用户中使用第i个应用程序的概率;Piq表示所述虚假用户中使用第i个应用程序的概率;APPi贡献度表示一天所述第i个应用程序的贡献度。
S305、根据每天各应用程序的贡献度,获取每天各应用程序评分。
根据S304中获得的每天各应用程序的贡献度,对每天各应用程序的贡献度进行负值处理,即采用如下公式3计算每天各应用程序的新贡献度。然后对每天各应用程序的新贡献度,采用如下公式4进行归一化处理,获取每天各应用程序评分。其中,每个应用程序评分例如表1所示。
APPi新贡献度=APPi贡献度+|min(APP贡献度)| 公式3
Figure BDA0002510886030000111
公式3中,|min(APP贡献度)|表示对一天中各应用程序的贡献度求取的最小值进行绝对值运算;APPi贡献度表示一天所述第i个应用程序的贡献度;APPi新贡献度表示一天所述第i个应用程序的新贡献度;公式4中,APPi评分表示一天的第i个应用程序评分。
下面以一天中样本用户所使用的3个应用程序例如为APP1、APP2以及APP3为例,对上述公式3及公式4进行解释说明。
首先,根据上述公式2,获取第一个应用程序例如为APP1的贡献度APP1贡献度、第二个应用程序例如为APP2的贡献度APP2贡献度以及第三个应用程序例如为APP3的贡献度APP3贡献度。
其次,对上述三个应用程序的贡献度例如为APP1贡献度、APP2贡献度以及APP3贡献度求取最小值,获取一天中上述三个应用程序的贡献度的最小值例如为min(APP贡献度),并对所获取的最小值例如为min(APP贡献度)求取绝对值。
然后,对上述三个应用程序的贡献度例如为APP1贡献度、APP2贡献度、APP3贡献度以及三个应用程序的贡献度的最小值例如为min(APP贡献度),利用上述公式3,分别获取一天内上述各三个应用程序的新贡献度例如为APP1新贡献度、APP2新贡献度以及APP3新贡献度,其中,APP1新贡献度、APP2新贡献度以及APP3新贡献度具体计算分别如下所示。
APP1新贡献度=APP1贡献度+|min(APP贡献度)|
APP2新贡献度=APP2贡献度+|min(APP贡献度)|
APP3新贡献度=APP3贡献度+|min(APP贡献度)|
最后,对上述APP1新贡献度、APP2新贡献度以及APP3新贡献度求和,获取公式4中的分母例如为∑APPi新贡献度=APP1新贡献度+APP2新贡献度+APP3新贡献度。然后再根据上述公式4获取一天的上述三个应用中每个应用程序评分例如为APP1评分、APP2评分以及APP3评分。其中,APP1评分、APP2评分以及APP3评分具体计算分别如下所示。
Figure BDA0002510886030000112
Figure BDA0002510886030000121
Figure BDA0002510886030000122
表1开户T1至TN天内每天各应用程序评分
app_id T0 T1 T2 T3 T4 T5 T6 T7
65 0.18 0.21 0.23 0.25 0.28 0.31 0.35 0.40
23 0.17 0.21 0.23 0.24 0.27 0.30 0.34 0.38
7000 0.17 0.20 0.21 0.23 0.25 0.27 0.30 0.34
22 0.16 0.18 0.20 0.21 0.23 0.26 0.29 0.32
1272 0.15 0.17 0.19 0.20 0.22 0.25 0.28 0.31
486 0.15 0.18 0.19 0.20 0.22 0.24 0.27 0.30
1646 0.15 0.17 0.19 0.20 0.22 0.24 0.27 0.30
1275 0.15 0.18 0.19 0.21 0.23 0.26 0.29 0.32
…… …… …… …… …… …… …… …… ……
表1中,app_id表示各应用程序的编号;T0至T7表示开户8天内的每一天的天数编号;0.18及0.21等表示每天各应用程序的评分,例如,0.18表示编号为65的应用程序所对应的开户第一天的评分。
S306、根据多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位。
根据多个样本用户开户N天内通信行为信息中的每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位。
可选地,S306的一种可能的实现方式为:
S306a、根据所述样本用户开户N天内每天各应用程序的使用次数,获取所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数。
例如,一天内100个样本用户使用了第i个应用程序,按照样本用户的概率从高到底排序,若25%的样本用户对第i个应用程序的使用次数在50次以上,那么100个样本用户中第25个样本用户使用第i个应用程序的次数为对应的上四分位数,即上四位数例如为50。若50%的样本用户对第i个应用程序的使用次数在50次以上,那么100个样本用户中第50个样本用户使用第i个应用程序的次数为对应的中位数。若75%的样本用户对第i个应用程序的使用次数在50次以上,那么100个样本用户中第75个样本用户使用第i个应用程序的次数为对应的下四分位数。
依次按照上述方法,根据样本用户开户N天内每天各应用程序的使用次数,获取样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数。
S306b、根据所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取所述样本用户开户N天内每天各应用程序的使用次数档位。
根据S306a中所获取的样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取样本用户开户N天内每天各应用程序的使用次数档位。
具体的,若样本用户开户N天内每天各应用程序的使用次数大于等于上四分位数,则样本用户开户N天内每天各应用程序的使用次数档位例如为4档。若样本用户开户N天内每天各应用程序的使用次数小于上四分位数,则样本用户开户N天内每天各应用程序的使用次数档位例如为3档。若样本用户开户N天内每天各应用程序的使用次数小于中位数,则样本用户开户N天内每天各应用程序的使用次数档位例如为2档。若样本用户开户N天内每天各应用程序的使用次数小于下四分位数,则样本用户开户N天内每天各应用程序的使用次数档位例如为0档。
S307、根据所述每天各应用程序评分以及所述开户N天内每天各应用程序的使用次数档位,获取开户N天内每天的应用程序使用总得分。
根据S305中所获取的每天各应用程序评分以及S306中的开户N天内每天各应用程序的使用次数档位,采用如下公式11计算开户N天内每天的应用程序使用总得分。
APP总得分=∑(APPi评分×APPi使用次数档位) 公式11
公式11中,APPi总得分表示一天的应用程序使用总得分;APPi评分表示一天的第i个应用程序评分;APPi使用次数档位表示一天的第i个应用程序的使用次数档位。
S308、根据多个样本用户中每个样本用户的所述通信行为信息,获得部分样本用户中每个样本用户的平均通话次数。
根据多个样本用户中每个样本用户开户N天内的通信行为信息,获得多个样本用户中的部分样本用户中每个样本用户的平均通话次数,其中,上述部分样本用户例如可以为多个样本用户中的70%的样本用户。
S309、根据每个样本用户的平均通话次数以及所述每天的应用程序使用总得分,确定样本用户的用户类型。
根据S307中的每天的应用程序使用总得分以及S308中的样本用户中每个样本用户的平均通话次数,采用k-means聚类方法确定多个样本用户的用户类型。k-means聚类方法原理属于现有技术,此处不再赘述。其中,用户类型为应用程序与语音均不活跃用户,或者,应用程序活跃用户,或者,语音活跃用户,或者,应用程序与语音均活跃用户。
具体的,应用程序与语音均不活跃用户例如为第一类用户,该类用户的每天的应用程序使用总得分较低,每个样本用户的平均通话次数较少。应用程序活跃用户例如为第二类用户,该类用户的每天的应用程序使用总得分较高,每个样本用户的平均通话次数较少。语音活跃用户例如为第三类用户,该类用户的每天的应用程序使用总得分较低,每个样本用户的平均通话次数较高。应用程序与语音均活跃用户例如为第四类用户,该类用户的每天的应用程序使用总得分较高,每个样本用户的平均通话次数较高。
S310、将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型。
根据上述S309中的任一同一用户类型的样本用户开户N天内的通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,对每一类型的部分样本用户采用机器学习训练建模,并不断调整建模过程中的相应参数,获得不同用户类型对应的真实用户预测模型。需要说明的是,每一种类型的用户对应有一种真实用户预测模型,那么上述四种用户类型对应训练可获得四种真实用户预测模型,每种真是用户预测模型可用于预测不同类型的用户的真实性。
可选地,S310的一种可能的实现方式为:
S310a、根据属于同一用户类型的部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的初始真实用户预测模型。
根据属于同一用户类型的部分样本用户例如70%的样本用户中每个样本用户的通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,采用机器学习训练建模,获得不同用户类型对应的真实用户预测模型。
S310b、根据属于同一用户类型的另一部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,校正所述用户类型对应的初始真实用户预测模型,获得所述用户类型的真实用户预测模型。
根据属于同一用户类型的部分样本用户例如剩余的30%的样本用户中每个样本用户的通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,对机器学习建模中的相应参数做相应的调整,以校正不同用户类型对应的初始真实用户预测模型,获得不同用户类型的真实用户预测模型。
S311、针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户。
S311的具体实现过程可以参见图2所示实施例中的相关描述,此处不再赘述。
可选地,S311的一种可能的实现方式为:
S311a、根据所述每个用户的所述通信行为信息,获得每个用户的平均通话次数。
S311b、根据每个用户的平均通话次数以及所述样本用户每天的应用程序使用总得分,确定所述用户的用户类型。
S311a至S311b的具体实现过程可以参见图3所示实施例中的S308至S309的相关描述,此处不再赘述。需要说明的是S311a至S311b中的用户是待评估渠道新发展的M个用户。
S311c、根据所述用户的用户类型,确定所述用户类型对应的真实用户预测模型。
根据S311b中所确定的新发展的用户类型以及S310中所获得的样本用户类型对应的真实用户预测模型,确定新发展的用户类型对应的真实用户预测模型。
S311d、根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及所述用户的用户类型对应的真实用户预测模型,预测所述用户是否为真实用户。
根据S311c中所确定的真实用户预测模型、M个用户的通信行为信息以及所述样本用户开户N天内每天的应用程序使用总得分,预测M个用户为真实用户还是虚假用户。
S312、根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
可选地,S312的一种可能的实现方式为:
S312a、根据所述M个用户中真实用户的数量以及所述M,获取所述M个用户中真实用户的数量与所述M的比值。
根据上述S311d中预测出的M个用户中真实用户的数量以及所述M值,计算M个用户中真实用户的数量与所述M的比值。
S312b、根据所述M个用户中真实用户的数量与所述M的比值,评估所述渠道的质量。
根据所述M个用户中真实用户的数量与所述M的比值,即计算渠道真实率,评估所述渠道的质量。然后根据上述渠道真实率对各个渠道实施以下监控政策:每日监控,当渠道真实率有异动时,对该渠道的代理商进行电话询问,并分析原因;每周发邮件通报各渠道真实率现状;每月评价各渠道真实率差距,对真实率排名靠后的渠道进行问责,要求限期整改;每季度对各渠道进行考核,对优质渠道进行奖励。
可选地,上述任一实施例中所述的每天的通信行为信息包括如下至少一项:每天通话次数、每天流量、每天各应用程序的使用次数、充值金额以及用于标识用户为真实用户或虚假用户的信息。
可选地,所真实用户标识例如是从开户起未来3个月内未出现过三无、双低、零出账或销户中任一状态,则将该用户定义为真实用户,反之,则为虚假用户。其中,所述三无例如是当月无通话、无流量、无主动发送短信;双低指当月使用语音小于10分钟、使用流量小于10M;零出账分为预付费用户(先充话费才能使用的用户)的零出账与后付费用户(该月出账后交话费即可,不能欠费)的零出账,预付费用户的零出账指赠款销账后账单收入不大于0,后付费用户的零出账指赠款销账前账单收入不大于0;销户即离网。
本实施例中,通过获取通过待评估渠道发展的M个用户开户N天内的通信行为信息;根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。因此,上述方法对待评估渠道发展的M个用户开户N天内的用户的行为质量方面对渠道进行评估,实现对渠道质量的早期监控,提高了评估效率。
图4为本申请一实施例提供的渠道质量评估装置的结构示意图,如图4所示,本实施例的渠道质量评估装置400包括:获取模块410、处理模块420和评估模块430。
所述获取模块410,用于获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1;以及根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分。
所述处理模块420,用于针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的。
所述评估模块430,用于根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
可选地,所述获取模块410,具体用于:根据每个样本用户的用于标识用户为真实用户或虚假用户的信息,确定所述样本用户为真实用户或虚假用户;以及针对每个应用程序,根据如下公式一获取真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率;根据真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率,获取每天各应用程序的贡献度。
Figure BDA0002510886030000181
公式一中,Pik表示真实用户中使用第i个应用程序的概率;Ki表示一天内所述多个样本用户中使用第i个应用程序的真实用户的人数;K表示所述多个样本用户中真实用户的总人数;Piq表示所述虚假用户中使用第i个应用程序的概率;Qi表示一天内所述多个样本用户中使用第i个应用程序的虚假用户的人数;Q表示所述多个样本用户中虚假用户的总人数。
所述获取模块410,具体用于:根据每天各应用程序的贡献度及如下公式二,获取每天各应用程序评分;
Figure BDA0002510886030000182
公式二中,APPi评分表示一天的第i个应用程序评分;min(APP贡献度)表示一天中各应用程序的贡献度的最小值;APPi贡献度表示一天所述第i个应用程序的贡献度。
所述获取模块410,具体用于:根据所述多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位;以及根据所述每天各应用程序评分以及所述开户N天内每天各应用程序的使用次数档位,获取开户N天内每天的应用程序使用总得分。
可选地,所述获取模块410,具体用于:根据所述样本用户开户N天内每天各应用程序的使用次数,获取所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数;以及根据所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取所述样本用户开户N天内每天各应用程序的使用次数档位。
可选地,所述处理模块420,还用于:根据所述多个样本用户中每个样本用户的所述通信行为信息,获得部分样本用户中每个样本用户的平均通话次数;以及根据每个样本用户的平均通话次数以及所述每天的应用程序使用总得分,确定样本用户的用户类型,所述用户类型为应用程序与语音均不活跃用户,或者,应用程序活跃用户,或者,语音活跃用户,或者,应用程序与语音均活跃用户;以及将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型。
所述处理模块420,具体用于:根据所述每个用户的所述通信行为信息,获得每个用户的平均通话次数;以及根据每个用户的平均通话次数以及所述样本用户每天的应用程序使用总得分,确定所述用户的用户类型;以及根据所述用户的用户类型,确定所述用户类型对应的真实用户预测模型;以及根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及所述用户的用户类型对应的真实用户预测模型,预测所述用户是否为真实用户。
可选地,所述处理模块420,具体用于:根据属于同一用户类型的部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的初始真实用户预测模型;以及根据属于同一用户类型的另一部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,校正所述用户类型对应的初始真实用户预测模型,获得所述用户类型的真实用户预测模型。
可选地,所述评估模块430,具体用于:根据所述M个用户中真实用户的数量以及所述M,获取所述M个用户中真实用户的数量与所述M的比值;以及根据所述M个用户中真实用户的数量与所述M的比值,评估所述渠道的质量。
可选地,每天的通信行为信息包括如下至少一项:每天通话次数、每天流量、每天各应用程序的使用次数、充值金额以及用于标识用户为真实用户或虚假用户的信息。
本实施例的装置,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本申请一实施例提供的电子设备的结构示意图,如图5所示,本实施例的电子设备500可以包括:存储器510和处理器520。
存储器510,用于存储程序指令;
处理器520,用于调用所述存储器中的程序指令,执行:
获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1;根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
可选地,所述处理器520,具体用于:根据每个样本用户的用于标识用户为真实用户或虚假用户的信息,确定所述样本用户为真实用户或虚假用户;以及针对每个应用程序,根据如下公式一获取真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率;根据真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率,获取每天各应用程序的贡献度。
Figure BDA0002510886030000201
公式一中,Pik表示真实用户中使用第i个应用程序的概率;Ki表示一天内所述多个样本用户中使用第i个应用程序的真实用户的人数;K表示所述多个样本用户中真实用户的总人数;Piq表示所述虚假用户中使用第i个应用程序的概率;Qi表示一天内所述多个样本用户中使用第i个应用程序的虚假用户的人数;Q表示所述多个样本用户中虚假用户的总人数。
所述处理器520,具体用于:根据每天各应用程序的贡献度及如下公式二,获取每天各应用程序评分。
Figure BDA0002510886030000202
公式二中,APPi评分表示一天的第i个应用程序评分;min(APP贡献度)表示一天中各应用程序的贡献度的最小值;APPi贡献度表示一天所述第i个应用程序的贡献度。
所述处理器520,具体用于:根据所述多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位;以及根据所述每天各应用程序评分以及所述开户N天内每天各应用程序的使用次数档位,获取开户N天内每天的应用程序使用总得分。
可选地,所述处理器520,具体用于:根据所述样本用户开户N天内每天各应用程序的使用次数,获取所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数;以及根据所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取所述样本用户开户N天内每天各应用程序的使用次数档位。
可选地,所述处理器520,还用于根据所述多个样本用户中每个样本用户的所述通信行为信息,获得部分样本用户中每个样本用户的平均通话次数;以及根据每个样本用户的平均通话次数以及所述每天的应用程序使用总得分,确定样本用户的用户类型,所述用户类型为应用程序与语音均不活跃用户,或者,应用程序活跃用户,或者,语音活跃用户,或者,应用程序与语音均活跃用户;以及将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型。
所述处理器520,具体用于:根据所述每个用户的所述通信行为信息,获得每个用户的平均通话次数;以及根据每个用户的平均通话次数以及所述样本用户每天的应用程序使用总得分,确定所述用户的用户类型;以及根据所述用户的用户类型,确定所述用户类型对应的真实用户预测模型;以及根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及所述用户的用户类型对应的真实用户预测模型,预测所述用户是否为真实用户。
可选地,所述处理器520,具体用于:根据属于同一用户类型的部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的初始真实用户预测模型;以及根据属于同一用户类型的另一部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,校正所述用户类型对应的初始真实用户预测模型,获得所述用户类型的真实用户预测模型。
可选地,所述处理器520,具体用于:根据所述M个用户中真实用户的数量以及所述M,获取所述M个用户中真实用户的数量与所述M的比值;以及根据所述M个用户中真实用户的数量与所述M的比值,评估所述渠道的质量。
可选地,每天的通信行为信息包括如下至少一项:每天通话次数、每天流量、每天各应用程序的使用次数、充值金额以及用于标识用户为真实用户或虚假用户的信息。
本实施例的电子设备,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本申请另一实施例提供的电子设备的结构示意图。参照图6所示,电子设备600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述任一实施例中的渠道质量评估方法的技术方案。
电子设备600还可以包括一个电源组件626被配置为执行电子设备600的电源管理,一个有线或无线网络接口650被配置为将电子设备600连接到网络,和一个输入输出(I/O)接口658。电子设备600可以操作基于存储在存储器632的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一施例中的渠道质量评估方法的技术方案。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读内存(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种渠道质量评估方法,其特征在于,包括:
获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,其中,N、M均为大于等于1的整数;
根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;
针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;
根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
2.根据权利要求1所述的方法,其特征在于,所述根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分,包括:
根据每个样本用户的用于标识用户为真实用户或虚假用户的信息,确定所述样本用户为真实用户或虚假用户;
针对每个应用程序,根据如下公式一获取真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率;根据真实用户使用所述应用程序的概率及虚假用户使用所述应用程序的概率,获取每天各应用程序的贡献度;
Figure FDA0002510886020000011
公式一中,Pik表示真实用户中使用第i个应用程序的概率;Ki表示一天内所述多个样本用户中使用第i个应用程序的真实用户的人数;K表示所述多个样本用户中真实用户的总人数;Piq表示所述虚假用户中使用第i个应用程序的概率;Qi表示一天内所述多个样本用户中使用第i个应用程序的虚假用户的人数;Q表示所述多个样本用户中虚假用户的总人数;
根据每天各应用程序的贡献度及如下公式二,获取每天各应用程序评分;
Figure FDA0002510886020000012
公式二中,APPi评分表示一天的第i个应用程序评分;min(APP贡献度)表示一天中各应用程序的贡献度的最小值;APPi贡献度表示一天所述第i个应用程序的贡献度;
根据多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位;
根据所述每天各应用程序评分以及所述开户N天内每天各应用程序的使用次数档位,获取开户N天内每天的应用程序使用总得分。
3.根据权利要求2所述的方法,其特征在于,所述根据多个样本用户开户N天内每天各应用程序的使用次数,获取开户N天内每天各应用程序的使用次数档位,包括:
根据所述样本用户开户N天内每天各应用程序的使用次数,获取所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数;
根据所述样本用户开户N天内每天各应用程序的使用次数的下四分位数、中位数、上四分位数,获取所述样本用户开户N天内每天各应用程序的使用次数档位。
4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:
根据所述多个样本用户中每个样本用户的所述通信行为信息,获得部分样本用户中每个样本用户的平均通话次数;
根据每个样本用户的平均通话次数以及所述每天的应用程序使用总得分,确定样本用户的用户类型,所述用户类型为应用程序与语音均不活跃用户,或者,应用程序活跃用户,或者,语音活跃用户,或者,应用程序与语音均活跃用户;
将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型;
所述针对M个用户中的每个用户,根据所述用户的所述通信行为信息、开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户,包括:
根据所述每个用户的所述通信行为信息,获得每个用户的平均通话次数;
根据每个用户的平均通话次数以及所述样本用户每天的应用程序使用总得分,确定所述用户的用户类型;
根据所述用户的用户类型,确定所述用户类型对应的真实用户预测模型;
根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及所述用户的用户类型对应的真实用户预测模型,预测所述用户是否为真实用户。
5.根据权利要求4所述的方法,其特征在于,将属于同一用户类型的样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的真实用户预测模型,包括:
根据属于同一用户类型的部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,训练获得所述用户类型对应的初始真实用户预测模型;
根据属于同一用户类型的另一部分样本用户中每个样本用户的所述通信行为信息、开户N天内每天的应用程序使用总得分、用于标识用户为真实用户或虚假用户的信息,校正所述用户类型对应的初始真实用户预测模型,获得所述用户类型的真实用户预测模型。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量,包括:
根据所述M个用户中真实用户的数量以及所述M,获取所述M个用户中真实用户的数量与所述M的比值;
根据所述M个用户中真实用户的数量与所述M的比值,评估所述渠道的质量。
7.根据权利要求1-3任一项所述的方法,其特征在于,每天的通信行为信息包括如下至少一项:
每天通话次数、每天流量、每天各应用程序的使用次数、充值金额以及用于标识用户为真实用户或虚假用户的信息。
8.一种渠道质量评估装置,其特征在于,包括:
获取模块,用于获取通过待评估渠道发展的M个用户开户N天内的通信行为信息,所述N、M为大于等于1;以及根据多个样本用户开户N天内的通信行为信息,获取开户N天内每天的应用程序使用总得分;
处理模块,用于针对M个用户中的每个用户,根据所述用户的所述通信行为信息、所述开户N天内每天的应用程序使用总得分,以及预先训练得到的真实用户预测模型,预测所述用户是否为真实用户;所述真实用户预测模型是根据所述多个样本用户开户N天内的通信行为信息、用于标识用户为真实用户或虚假用户的信息以及开户N天内每天的应用程序使用总得分,训练得到的;
评估模块,用于根据所述M个用户中真实用户的数量以及所述M,评估所述渠道的质量。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中的程序指令,执行如权利要求1-7任一项所述的渠道质量评估方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的渠道质量评估方法。
CN202010460787.5A 2020-05-27 2020-05-27 渠道质量评估方法、装置、电子设备及存储介质 Active CN111612366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010460787.5A CN111612366B (zh) 2020-05-27 2020-05-27 渠道质量评估方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010460787.5A CN111612366B (zh) 2020-05-27 2020-05-27 渠道质量评估方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111612366A true CN111612366A (zh) 2020-09-01
CN111612366B CN111612366B (zh) 2023-08-04

Family

ID=72204456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010460787.5A Active CN111612366B (zh) 2020-05-27 2020-05-27 渠道质量评估方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111612366B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112636980A (zh) * 2020-12-25 2021-04-09 平安科技(深圳)有限公司 资源数量确定方法、装置、电子设备及相关产品
CN112967139A (zh) * 2021-03-24 2021-06-15 北京人人云图信息技术有限公司 一种基于设备数据的证券用户质量评估方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1629870A (zh) * 2003-06-30 2005-06-22 微软公司 用于提供用户存在性和有效性的状态和预测的方法及结构
CN101089891A (zh) * 2007-07-13 2007-12-19 左立国 一种基于gis系统对电信运营商渠道分布进行分析和管理的技术方法
KR20130118597A (ko) * 2012-04-20 2013-10-30 (주)야긴스텍 아이템 추천 시스템 및 방법
CN104602182A (zh) * 2015-02-12 2015-05-06 中国联合网络通信集团有限公司 渠道价值获取方法和装置
KR20170087198A (ko) * 2016-01-20 2017-07-28 장중혁 푸시 메시지 수집 방법 및 그를 위한 푸시 메시지 수집 시스템
CN107343047A (zh) * 2017-07-06 2017-11-10 北京奇虎科技有限公司 应用推广系统及方法
CN107766580A (zh) * 2017-11-20 2018-03-06 北京奇虎科技有限公司 消息的推送方法及装置
CN108596616A (zh) * 2018-04-20 2018-09-28 平安科技(深圳)有限公司 用户数据真实性分析方法及装置、存储介质、电子设备
CN109978304A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 面向对象的评估方法和装置
CN110008390A (zh) * 2019-02-27 2019-07-12 深圳壹账通智能科技有限公司 应用程序的评估方法、装置、计算机设备及存储介质
CN110119415A (zh) * 2019-05-13 2019-08-13 重庆八戒传媒有限公司 基于渠道投放的数据分析方法、系统、介质和电子设备
CN110191460A (zh) * 2019-05-29 2019-08-30 中国联合网络通信集团有限公司 一种新入网用户监测方法及平台
CN110232597A (zh) * 2019-06-14 2019-09-13 苏州开心盒子软件有限公司 广告渠道的评估方法、装置、设备和存储介质
CN110537176A (zh) * 2017-02-21 2019-12-03 索尼互动娱乐有限责任公司 用于确定新闻真实性的方法
CN110674100A (zh) * 2019-09-28 2020-01-10 上海浦东发展银行股份有限公司信用卡中心 一种基于全渠道运营数据的用户需求预测方法及架构

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1629870A (zh) * 2003-06-30 2005-06-22 微软公司 用于提供用户存在性和有效性的状态和预测的方法及结构
CN101089891A (zh) * 2007-07-13 2007-12-19 左立国 一种基于gis系统对电信运营商渠道分布进行分析和管理的技术方法
KR20130118597A (ko) * 2012-04-20 2013-10-30 (주)야긴스텍 아이템 추천 시스템 및 방법
CN104602182A (zh) * 2015-02-12 2015-05-06 中国联合网络通信集团有限公司 渠道价值获取方法和装置
KR20170087198A (ko) * 2016-01-20 2017-07-28 장중혁 푸시 메시지 수집 방법 및 그를 위한 푸시 메시지 수집 시스템
CN110537176A (zh) * 2017-02-21 2019-12-03 索尼互动娱乐有限责任公司 用于确定新闻真实性的方法
CN107343047A (zh) * 2017-07-06 2017-11-10 北京奇虎科技有限公司 应用推广系统及方法
CN107766580A (zh) * 2017-11-20 2018-03-06 北京奇虎科技有限公司 消息的推送方法及装置
CN109978304A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 面向对象的评估方法和装置
CN108596616A (zh) * 2018-04-20 2018-09-28 平安科技(深圳)有限公司 用户数据真实性分析方法及装置、存储介质、电子设备
CN110008390A (zh) * 2019-02-27 2019-07-12 深圳壹账通智能科技有限公司 应用程序的评估方法、装置、计算机设备及存储介质
CN110119415A (zh) * 2019-05-13 2019-08-13 重庆八戒传媒有限公司 基于渠道投放的数据分析方法、系统、介质和电子设备
CN110191460A (zh) * 2019-05-29 2019-08-30 中国联合网络通信集团有限公司 一种新入网用户监测方法及平台
CN110232597A (zh) * 2019-06-14 2019-09-13 苏州开心盒子软件有限公司 广告渠道的评估方法、装置、设备和存储介质
CN110674100A (zh) * 2019-09-28 2020-01-10 上海浦东发展银行股份有限公司信用卡中心 一种基于全渠道运营数据的用户需求预测方法及架构

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘冬梅;: "精细化运营下APP推广渠道选择与效果监测分析", no. 03, pages 40 - 41 *
赵纯坚;魏莉;: "基于数据仓库技术的社会实体渠道虚假销售行为分析与研究", no. 11, pages 156 - 158 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112636980A (zh) * 2020-12-25 2021-04-09 平安科技(深圳)有限公司 资源数量确定方法、装置、电子设备及相关产品
CN112967139A (zh) * 2021-03-24 2021-06-15 北京人人云图信息技术有限公司 一种基于设备数据的证券用户质量评估方法

Also Published As

Publication number Publication date
CN111612366B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN110598016B (zh) 一种多媒体信息推荐的方法、装置、设备和介质
CN110399550B (zh) 一种信息推荐方法及装置
CN106095916B (zh) 信息推送方法和装置
CN110110093A (zh) 一种基于知识图谱的识别方法、装置、电子设备及存储介质
CN112818737B (zh) 视频识别方法、装置、存储介质及终端
CN111522724B (zh) 异常账号的确定方法、装置、服务器及存储介质
CN111612366B (zh) 渠道质量评估方法、装置、电子设备及存储介质
CN111815169A (zh) 业务审批参数配置方法及装置
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
CN111597343B (zh) 一种基于app的智能化用户职业判断方法、装置和电子设备
CN111061948B (zh) 一种用户标签推荐方法、装置、计算机设备及存储介质
CN113205403A (zh) 一种企业信用等级的计算方法、装置、存储介质及终端
CN111507513A (zh) 潜在投诉用户预测方法、装置、电子设备及存储介质
CN111159541A (zh) 一种帐号行为偏好的确定方法及装置
CN117333290B (zh) 一种一体化多尺度风控模型构建方法
CN107728772B (zh) 应用程序的处理方法、装置、存储介质及电子设备
CN111404835A (zh) 流量控制方法、装置、设备及存储介质
CN111813966A (zh) 数据审核方法及装置
CN116645134A (zh) 一种信用卡分期的推荐方法、装置、设备及介质
CN107871213B (zh) 一种交易行为评价方法、装置、服务器以及存储介质
CN114449106B (zh) 一种异常电话号码的识别方法、装置、设备和存储介质
CN115099934A (zh) 一种高潜客户识别方法、电子设备和存储介质
CN114298829A (zh) 用于授信评估的数据处理方法和装置
CN114298823A (zh) 用于模型构建的数据处理方法和装置
CN114399289A (zh) 一种工单督办时间设置方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant