CN111127050A - 内容渠道的评价方法、装置、电子设备和存储介质 - Google Patents
内容渠道的评价方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111127050A CN111127050A CN201811270889.XA CN201811270889A CN111127050A CN 111127050 A CN111127050 A CN 111127050A CN 201811270889 A CN201811270889 A CN 201811270889A CN 111127050 A CN111127050 A CN 111127050A
- Authority
- CN
- China
- Prior art keywords
- user
- user behavior
- content channel
- behavior
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 87
- 230000006399 behavior Effects 0.000 claims description 303
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 16
- 238000013507 mapping Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 12
- 238000012795 verification Methods 0.000 description 12
- 230000004913 activation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013441 quality evaluation Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 241000209202 Bromus secalinus Species 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了内容渠道的评价方法、装置、电子设备和存储介质。所述方法包括:对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;根据所述第一比例对各内容渠道的质量进行评价。该技术方案具有可解释性强,判定逻辑通俗易懂,易于接受的优点,能够为商务在结算谈判时争取主动权;无需额外使用第三方库,节省运营成本。
Description
技术领域
本发明涉及计算机技术领域,具体涉及内容渠道的评价方法、装置、电子设备和存储介质。
背景技术
在各行各业,产品都离不开用户的支撑。为了吸收更多用户(也称为“获客”),产品往往通过不同的渠道来推广内容,例如依赖于广告进行推广,在互联网时代,用户可以非常方便地通过点击广告跳转到产品的注册页面,注册成为产品的用户。
产品往往会选择多个内容渠道进行推广,通常会按照推广效果进行付费。例如,通过某广告渠道进行注册的用户数量就是一个考察的因素。部分广告渠道提供方为了牟利,进行了作弊,使得注册的用户中实际存在一部分作弊用户。因此需要一种基于识别出作弊等特定类型用户来对内容渠道进行评价的方式。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的内容渠道的评价方法、装置、电子设备和存储介质。
依据本发明的一个方面,提供了一种内容渠道的评价方法,包括:
对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;
从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;
根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;
统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;
根据所述第一比例对各内容渠道的质量进行评价。
可选地,所述对根据目标内容渠道进行注册的各用户,分别获取用户行为数据包括:
从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
可选地,该方法还包括:
提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;
所述前端页面包括:注册页面和/或产品页面。
可选地,所述用户行为数据为与用户注册相关的用户行为数据。
可选地,提取出的信息为与用户行为对应的IP地址,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
获取所述IP地址对应的地理位置;
判断所述地理位置与产品内容的投放区域是否匹配,否则将用户标记为指定类型的用户。
可选地,所述获取所述IP地址对应的地理位置包括:
根据预设的IP地址与地理位置的映射关系,获取所述IP地址对应的地理位置。
可选地,所述IP地址与地理位置的映射关系保存在预设的IP地址定位数据库中。
可选地,提取出的信息为与用户行为对应的网络环境信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若网络环境信息映射的指标值超过预设阈值,则将用户标记为指定类型的用户。
可选地,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
可选地,提取出的信息为与用户浏览行为对应的行为模式特征信息,所述用户浏览行为是在用户注册后的第一预设时间间隔内发生的;
所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若所述行为模式特征信息映射的指标值大于预设阈值,则将用户标记为指定类型的用户。
可选地,所述行为模式特征信息为用户行为的发生时间,所述行为模式特征信息映射的指标值为第二预设时间间隔内指定类型用户行为的发生次数。
可选地,提取出的信息为与用户注册行为对应的行为模式特征信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若所述行为模式特征信息映射的指标值小于预设阈值,则将用户标记为指定类型的用户。
可选地,所述行为模式特征信息为用户注册行为的发生时间,所述行为模式特征信息映射的指标值为各用户注册行为间的时间间隔和/或各用户注册行为持续的时间。
可选地,所述用户注册行为包括如下的一种或多种:
输入用户名,输入密码,密码确认,输入激活码,输入注册手机号,输入验证码,浏览用户协议,确认用户协议,点击注册控件。
可选地,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若所述操作系统信息与所述设备厂商信息不匹配,则将用户标记为指定类型的用户。
可选地,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
对操作系统信息进行去重,若去重后的操作系统信息数量大于1,则将用户标记为指定类型的用户。
可选地,所述指定类型的用户为虚假注册用户,该方法还包括:统计预设时间段内,根据各内容渠道进行注册的用户中,优质用户的比例作为第二比例;所述优质用户是为产品带来收益的用户;
所述根据所述第一比例对各内容渠道的质量进行评价包括:根据为所述第一比例和所述第二比例分别预设的权重计算各内容渠道的质量评价分数。
依据本发明的另一方面,提供了一种内容渠道的评价装置,包括:
获取单元,适于对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;
提取单元,适于从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;
识别单元,适于根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;
评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;根据所述第一比例对各内容渠道的质量进行评价。
可选地,所述获取单元,适于从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
可选地,所述获取单元,适于提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;所述前端页面包括:注册页面和/或产品页面。
可选地,所述用户行为数据为与用户注册相关的用户行为数据。
可选地,提取出的信息为与用户行为对应的IP地址;
所述识别单元,适于获取所述IP地址对应的地理位置;判断所述地理位置与产品内容的投放区域是否匹配,否则将用户标记为指定类型的用户。
可选地,所述识别单元,适于根据预设的IP地址与地理位置的映射关系,获取所述IP地址对应的地理位置。
可选地,所述IP地址与地理位置的映射关系保存在预设的IP地址定位数据库中。
可选地,提取出的信息为与用户行为对应的网络环境信息;
所述识别单元,适于若网络环境信息映射的指标值超过预设阈值,则将用户标记为指定类型的用户。
可选地,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
可选地,提取出的信息为与用户浏览行为对应的行为模式特征信息,所述用户浏览行为是在用户注册后的第一预设时间间隔内发生的;
所述识别单元,适于若所述行为模式特征信息映射的指标值大于预设阈值,则将用户标记为指定类型的用户。
可选地,所述行为模式特征信息为用户行为的发生时间,所述行为模式特征信息映射的指标值为第二预设时间间隔内指定类型用户行为的发生次数。
可选地,提取出的信息为与用户注册行为对应的行为模式特征信息;
所述识别单元,适于若所述行为模式特征信息映射的指标值小于预设阈值,则将用户标记为指定类型的用户。
可选地,所述行为模式特征信息为用户注册行为的发生时间,所述行为模式特征信息映射的指标值为各用户注册行为间的时间间隔和/或各用户注册行为持续的时间。
可选地,所述用户注册行为包括如下的一种或多种:
输入用户名,输入密码,密码确认,输入激活码,输入注册手机号,输入验证码,浏览用户协议,确认用户协议,点击注册控件。
可选地,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息;
所述识别单元,适于若所述操作系统信息与所述设备厂商信息不匹配,则将用户标记为指定类型的用户。
可选地,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息;
所述识别单元,适于对操作系统信息进行去重,若去重后的操作系统信息数量大于1,则将用户标记为指定类型的用户。
可选地,所述指定类型的用户为虚假注册用户;
所述评价单元,还适于统计预设时间段内,根据各内容渠道进行注册的用户中,优质用户的比例作为第二比例;所述优质用户是为产品带来收益的用户;根据为所述第一比例和所述第二比例分别预设的权重计算各内容渠道的质量评价分数。
依据本发明的又一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。
依据本发明的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。
由上述可知,本发明的技术方案,对根据目标内容渠道进行注册的各用户,分别获取用户行为数据,从用户行为数据中提取出与用户行为对应的一个或多个维度的信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户,统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例,根据第一比例对各内容渠道的质量进行评价。该技术方案通过基于原生的用户行为数据,从中选取若干个维度分别进行过滤,识别出指定类型的用户,并据此判断各内容渠道的质量,具有可解释性强,判定逻辑通俗易懂,易于接受的优点,能够为商务在结算谈判时争取主动权;无需额外使用第三方库,节省运营成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种内容渠道的评价方法的流程示意图;
图2示出了根据本发明一个实施例的一种内容渠道的评价装置的结构示意图;
图3示出了根据本发明一个实施例的电子设备的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种内容渠道的评价方法的流程示意图。如图1所示,该方法包括:
步骤S110,对根据目标内容渠道进行注册的各用户,分别获取用户行为数据。
在实际数据收集的过程中,用户行为数据可以包括用户行为的种类、发生用户行为的时间、发生用户行为的设备信息、用户行为对应的网络环境信息等等多个维度。在本发明的实施例中选取其中的若干个重点维度的数据作为基础进行用户识别。
步骤S120,从用户行为数据中提取出与用户行为对应的一个或多个维度的信息。
步骤S130,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户。
步骤S140,统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例。
步骤S150,根据第一比例对各内容渠道的质量进行评价。
可见,图1所示的方法,对根据目标内容渠道进行注册的各用户,分别获取用户行为数据,从用户行为数据中提取出与用户行为对应的一个或多个维度的信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户,统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例,根据第一比例对各内容渠道的质量进行评价。该技术方案通过基于原生的用户行为数据,从中选取若干个维度分别进行过滤,识别出指定类型的用户,并据此判断各内容渠道的质量,具有可解释性强,判定逻辑通俗易懂,易于接受的优点,能够为商务在结算谈判时争取主动权;无需额外使用第三方库,节省运营成本。
在本发明的一个实施例中,上述方法中,对根据目标内容渠道进行注册的各用户,分别获取用户行为数据包括:从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
通过预先埋点收集指定信息是互联网相关产品的一种较为方便的方法,在本实施例中,可以通过这种方式收集到用户行为打点日志,具体来说,在本发明的一个实施例中,上述方法还包括:提供包含若干个埋点的前端页面,根据埋点收集用户行为打点日志;前端页面包括:注册页面和/或产品页面。
例如,对注册页面的输入手机号、输入验证码进行埋点,则当用户输入手机号后,就会触发埋点,上报这一用户行为,在用户行为打点日志中进行记录。
可见,由于埋点较多,用户行为打点日志中收集有关于各个用户、各类用户行为的记录。在上述实施例中,可以根据设备信息等确定一个用户标识。这样在需要某一指定用户的用户行为数据时,可以根据用户标识,对用户行为打点日志进行处理、整合,得到同一个用户的用户行为数据。以注册场景为例,可以得到注册用户在注册前后完整的行为链条数据。
还需要说明的是,在本发明的实施例中可以不仅仅关注注册页面上发生的用户行为,还可以关注产品页面上发生的用户行为。因为许多内容渠道通过批量注册用户来进行作弊,这些用户在注册后也不登录产品,不能为产品创造收益,因此许多产品运营方选择根据注册后有行为的用户来为推广进行付费。因此,作弊不仅仅局限在注册时,也存在于注册后。所以,本发明的实施例还可以采集产品页面上的用户行为数据。正如背景技术中所述,内容的推广形式之一就是广告,本发明实施例中的内容可以是广告,相应的内容渠道即为广告渠道。
在本发明的一个实施例中,上述方法中,用户行为数据为与用户注册相关的用户行为数据。
结合前述说明可知,用户在产品的日常使用过程中也会在产品页面产生用户行为,因此,为了获取为与用户注册相关的用户行为数据,可以根据用户注册事件发生的时间点,来获取某一时间段内容的用户行为数据,将其作为与用户注册相关的用户行为数据,或者,获取输入验证码、输入手机号等指定类型的用户行为的用户行为数据。
在本发明的一个实施例中,上述方法中,提取出的信息为与用户行为对应的IP地址,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:获取IP地址对应的地理位置;判断地理位置与产品内容的投放区域是否匹配,否则将用户标记为指定类型的用户。
在本实施例中给出了一种利用IP地址判断规则和提取出的IP地址识别目标用户的具体示例。内容的投放往往是有区域限制的,例如仅在国内投放内容,那么通过国内投放的内容,产生了一个来自国外IP地址的用户注册,很可能就是内容渠道作弊产生的。这种用户可以标记为虚假用户或是作弊用户,相应的流量可以标记为虚假注册流量。内容投放区域可以是行政区域如国家、省、市等。
在本发明的一个实施例中,上述方法中,获取IP地址对应的地理位置包括:根据预设的IP地址与地理位置的映射关系,获取IP地址对应的地理位置。
在本实施例中通过预设IP地址与地理位置的映射关系,将IP地址转换为实际对应的地理位置,可以容易地判断出IP地址与产品内容的投放区域是否匹配。例如在中国境内投放内容,而IP地址定位在美国,则相应的流量可能为虚假注册流量。
在本发明的一个实施例中,上述方法中,IP地址与地理位置的映射关系保存在预设的IP地址定位数据库中。在本实施例中可以利用现有的高精度IP地址定位数据库来实现,数据更加准确,效果更好。在本发明的一个实施例中,上述方法中,判断地理位置与产品内容的投放区域是否匹配,是则将目标用户标记为指定类型的用户包括:当提取出的IP地址有多个时,若任一个IP地址对应的地理位置与产品内容的投放区域不匹配,则将目标用户标记为指定类型的用户。
在本发明的一个实施例中,上述方法中,提取出的信息为与用户行为对应的网络环境信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:若网络环境信息映射的指标值超过预设阈值,则将用户标记为指定类型的用户。
在本实施例中给出了一种利用网络环境判断规则和提取出的网络环境信息识别目标用户的具体示例。在本实施例中,网络环境信息可以是IP地址、网络类型等各类与用户行为息息相关的信息,并且各类网络环境信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述方法中,网络环境信息为IP地址,网络环境信息映射的指标值为IP地址的数量。
用户注册过程具有时间相对较短,场景相对单一的特点,在这个过程中,一般用户的IP地址不会发生多次切换,当然,如果将网络从4G切换到WIFI,则IP地址可能会切换。但是无论是何种正当途径下,IP地址的切换不会过于频繁,也就是在与注册事件相关的用户行为不应该对应于多个IP地址。如果对应于多个IP地址,则说明是不正常的,例如是使用脚本程序批量注册等等,这个过程有可能出现上述情况,而这种作弊行为则是产品运营方所不乐意见到的。具有这类用户行为相应的用户可以被识别为作弊用户或者是虚假用户。
在本发明的一个实施例中,上述方法中,提取出的信息为与用户浏览行为对应的行为模式特征信息,用户浏览行为是在用户注册后的第一预设时间间隔内发生的;根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:若行为模式特征信息映射的指标值大于预设阈值,则将用户标记为指定类型的用户。举例来说,收集用户注册后当天的用户浏览行为数据,对其进行分析。
选择这类数据进行分析的原因在于,部分采用脚本程序批量注册用户的内容渠道,为产品运营方提供的用户显然是较低质量的“僵尸用户”,这不是产品运营方乐于见到的,由于僵尸用户的特征为注册后不产生浏览行为,因此判断是否有浏览行为也是一个重要的参考因素。针对这一点,部分作弊的内容渠道采取脚本程序模拟用户操作,造成用户有浏览行为的表现,欺骗产品运营方,但是依然存在一定缺陷:即脚本程序往往在短时间内产生大量操作,例如上文举例的短时间内刷新大量网页,明显不是正常的浏览行为。
在本实施例中给出了一种利用预设的行为模式判断规则和提取出的行为模式特征信息识别目标用户的具体示例。在本实施例中,行为模式特征信息可以是用户行为的类型、发生的时间等,并且各类行为模式特征信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述方法中,行为模式特征信息为用户行为的发生时间,行为模式特征信息映射的指标值为第二预设时间间隔内指定类型用户行为的发生次数。
例如,一秒钟内刷新十个不同的产品详情页,显然不是正常用户的浏览行为。一方面,考虑到许多产品详情页采用HTML5技术实现,本身的加载需要一定时间,尤其是在网络环境不佳的情况下,短时间内可能根本加载不出产品详情页的内容;另一方面,用户即使对产品详情页不感兴趣,也需要一定的时间浏览内容,结合类似的因素可以得出与各类型用户行为相关的预设阈值。
在本发明的一个实施例中,上述方法中,提取出的信息为与用户注册行为对应的行为模式特征信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:若行为模式特征信息映射的指标值小于预设阈值,则将用户标记为指定类型的用户。具体地,在本发明的一个实施例中,上述方法中,用户注册行为包括如下的一种或多种:输入用户名,输入密码,密码确认,输入激活码,输入注册手机号,输入验证码,浏览用户协议,确认用户协议,点击注册控件。
在本实施例中给出了一种利用预设的行为模式判断规则和提取出的行为模式特征信息识别目标用户的具体示例。在本实施例中,行为模式特征信息可以是用户行为的类型、发生的时间等,并且各类行为模式特征信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述方法中,行为模式特征信息为用户注册行为的发生时间,行为模式特征信息映射的指标值为各用户注册行为间的时间间隔和/或各用户注册行为持续的时间。
以注册需要输入手机号为例,一般输入11位手机号至少也需要3秒,则如果输入过快,可能是利用脚本实现的,一般真实用户很少使用这种方式;另外,从输入手机号,到点击获取验证码,再到收到验证码后填入,整个过程也需要花费一定时间。然而目前存在一类被称为“接码平台”的服务商,能够为作弊内容渠道提供一批手机号所接收到的验证码,利用脚本程序可以快速将验证码输入,诸如此类。可见,用户注册行为间的间隔如果果断,或是用户注册行为持续的时间过短,相应的用户很可能不是真实用户,而是虚假用户或是作弊用户。
在本发明的一个实施例中,上述方法中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:若操作系统信息与设备厂商信息不匹配,则将用户标记为指定类型的用户。
举例来说,设备信息可以包括操作系统为iOS系统还是Android系统,设备厂商是华为、苹果、三星还是小米等等。例如,如果操作系统信息显示用户正在使用的是Android系统,但设备厂商信息显示是苹果手机,这几乎不会在正常用户的注册场景下发生。相反,这种情况在某些作弊场景下会出现,作弊的内容渠道通过批量操作,使用模拟器,有可能出现上述情形。
在本发明的一个实施例中,上述方法中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:对操作系统信息进行去重,若去重后的操作系统信息数量大于1,则将用户标记为指定类型的用户。
在一个注册过程中,正常用户使用的操作系统应当是单一的,因此,如果对操作系统信息去重后,数量大于1,也可能是因作弊方式产生,可以将相应的用户标记为指定类型的用户,例如虚假用户或是作弊用户。
在本发明的一个实施例中,上述方法中,指定类型的用户为虚假注册用户,该方法还包括:统计预设时间段内,根据各内容渠道进行注册的用户中,优质用户的比例作为第二比例;优质用户是为产品带来收益的用户;根据第一比例对各内容渠道的质量进行评价包括:根据为第一比例和第二比例分别预设的权重计算各内容渠道的质量评价分数。
现有技术中,对于虚假用户或是作弊用户的识别可以通过特征工程以及决策树分类模型来判定是否有作弊行为,等等诸多方式。这些方式的缺点通常在于:1)可解释性较差,且需要多维数据支撑,对数据质量有较高的要求,但实际业务场景中,可能不能保证数据高质量,进而影响模型识别质量;2)需要借助历史数据库进行查询,需要大量历史数据积累,或购买三方数据库,增加运营成本;3)需要观察相对长时间维度上的数据异常分布,没有基于用户粒度的识别,也无法进行短期或实时的识别,时效性较差。
而结合上述实施例可以看出,采用本发明的技术方案识别虚假用户或是作弊用户的优势在于:1)利用的是原生的用户行为数据,判定逻辑通俗易懂,可解释性强、易于接受,为商务在结算谈判时争取了主动权;2)在仅利用与用户注册事件时相关(例如当天)的用户行为数据进行判定,无需长期的数据积累,异常判定时效为T+1天,时效性大大提高,便于及时追回、减少产品运营方损失;3)无需额外使用第三方库,节省运营成本。
图2示出了根据本发明一个实施例的一种内容渠道的评价装置的结构示意图。如图2所示,内容渠道的评价装置200包括:
获取单元210,适于对根据目标内容渠道进行注册的各用户,分别获取用户行为数据。
在实际数据收集的过程中,用户行为数据可以包括用户行为的种类、发生用户行为的时间、发生用户行为的设备信息、用户行为对应的网络环境信息等等多个维度。在本发明的实施例中选取其中的若干个重点维度的数据作为基础进行用户识别。
提取单元220,适于从用户行为数据中提取出与用户行为对应的一个或多个维度的信息。
识别单元230,适于根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户。
评价单元240,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;根据第一比例对各内容渠道的质量进行评价。
可见,图2所示的装置,通过各单元的相互配合,对根据目标内容渠道进行注册的各用户,分别获取用户行为数据,从用户行为数据中提取出与用户行为对应的一个或多个维度的信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户,统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例,根据第一比例对各内容渠道的质量进行评价。该技术方案通过基于原生的用户行为数据,从中选取若干个维度分别进行过滤,识别出指定类型的用户,并据此判断各内容渠道的质量,具有可解释性强,判定逻辑通俗易懂,易于接受的优点,能够为商务在结算谈判时争取主动权;无需额外使用第三方库,节省运营成本。
在本发明的一个实施例中,上述装置中,获取单元210,适于从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
通过预先埋点收集指定信息是互联网相关产品的一种较为方便的方法,在本实施例中,可以通过这种方式收集到用户行为打点日志,具体来说,在本发明的一个实施例中,上述装置中,获取单元210,适于提供包含若干个埋点的前端页面,根据埋点收集用户行为打点日志;前端页面包括:注册页面和/或产品页面。
例如,对注册页面的输入手机号、输入验证码进行埋点,则当用户输入手机号后,就会触发埋点,上报这一用户行为,在用户行为打点日志中进行记录。
可见,由于埋点较多,用户行为打点日志中收集有关于各个用户、各类用户行为的记录。在上述实施例中,可以根据设备信息等确定一个用户标识。这样在需要某一指定用户的用户行为数据时,可以根据用户标识,对用户行为打点日志进行处理、整合,得到同一个用户的用户行为数据。以注册场景为例,可以得到注册用户在注册前后完整的行为链条数据。
还需要说明的是,在本发明的实施例中可以不仅仅关注注册页面上发生的用户行为,还可以关注产品页面上发生的用户行为。因为许多内容渠道通过批量注册用户来进行作弊,这些用户在注册后也不登录产品,不能为产品创造收益,因此许多产品运营方选择根据注册后有行为的用户来为推广进行付费。因此,作弊不仅仅局限在注册时,也存在于注册后。所以,本发明的实施例还可以采集产品页面上的用户行为数据。正如背景技术中所述,内容的推广形式之一就是广告,本发明实施例中的内容可以是广告,相应的内容渠道即为广告渠道。
在本发明的一个实施例中,上述装置中,用户行为数据为与用户注册相关的用户行为数据。
结合前述说明可知,用户在产品的日常使用过程中也会在产品页面产生用户行为,因此,为了获取为与用户注册相关的用户行为数据,可以根据用户注册事件发生的时间点,来获取某一时间段内容的用户行为数据,将其作为与用户注册相关的用户行为数据,或者,获取输入验证码、输入手机号等指定类型的用户行为的用户行为数据。
在本发明的一个实施例中,上述装置中,提取出的信息为与用户行为对应的IP地址;识别单元230,适于获取IP地址对应的地理位置;判断地理位置与产品内容的投放区域是否匹配,否则将用户标记为指定类型的用户。
在本实施例中给出了一种利用IP地址判断规则和提取出的IP地址识别目标用户的具体示例。内容的投放往往是有区域限制的,例如仅在国内投放内容,那么通过国内投放的内容,产生了一个来自国外IP地址的用户注册,很可能就是内容渠道作弊产生的。这种用户可以标记为虚假用户或是作弊用户,相应的流量可以标记为虚假注册流量。内容投放区域可以是行政区域如国家、省、市等。
在本发明的一个实施例中,上述装置中,识别单元230,适于根据预设的IP地址与地理位置的映射关系,获取IP地址对应的地理位置。
在本实施例中通过预设IP地址与地理位置的映射关系,将IP地址转换为实际对应的地理位置,可以容易地判断出IP地址与产品内容的投放区域是否匹配。例如在中国境内投放内容,而IP地址定位在美国,则相应的流量可能为虚假注册流量。
在本发明的一个实施例中,上述装置中,IP地址与地理位置的映射关系保存在预设的IP地址定位数据库中。在本实施例中可以利用现有的高精度IP地址定位数据库来实现,数据更加准确,效果更好。在本发明的一个实施例中,上述方法中,判断地理位置与产品内容的投放区域是否匹配,是则将目标用户标记为指定类型的用户包括:当提取出的IP地址有多个时,若任一个IP地址对应的地理位置与产品内容的投放区域不匹配,则将目标用户标记为指定类型的用户。
在本发明的一个实施例中,上述装置中,提取出的信息为与用户行为对应的网络环境信息;识别单元230,适于若网络环境信息映射的指标值超过预设阈值,则将用户标记为指定类型的用户。
在本实施例中给出了一种利用网络环境判断规则和提取出的网络环境信息识别目标用户的具体示例。在本实施例中,网络环境信息可以是IP地址、网络类型等各类与用户行为息息相关的信息,并且各类网络环境信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述装置中,网络环境信息为IP地址,网络环境信息映射的指标值为IP地址的数量。
用户注册过程具有时间相对较短,场景相对单一的特点,在这个过程中,一般用户的IP地址不会发生多次切换,当然,如果将网络从4G切换到WIFI,则IP地址可能会切换。但是无论是何种正当途径下,IP地址的切换不会过于频繁,也就是在与注册事件相关的用户行为不应该对应于多个IP地址。如果对应于多个IP地址,则说明是不正常的,例如是使用脚本程序批量注册等等,这个过程有可能出现上述情况,而这种作弊行为则是产品运营方所不乐意见到的。具有这类用户行为相应的用户可以被识别为作弊用户或者是虚假用户。
在本发明的一个实施例中,上述装置中,提取出的信息为与用户浏览行为对应的行为模式特征信息,用户浏览行为是在用户注册后的第一预设时间间隔内发生的;识别单元230,适于若行为模式特征信息映射的指标值大于预设阈值,则将用户标记为指定类型的用户。
举例来说,收集用户注册后当天的用户浏览行为数据,对其进行分析。
选择这类数据进行分析的原因在于,部分采用脚本程序批量注册用户的内容渠道,为产品运营方提供的用户显然是较低质量的“僵尸用户”,这不是产品运营方乐于见到的,由于僵尸用户的特征为注册后不产生浏览行为,因此判断是否有浏览行为也是一个重要的参考因素。针对这一点,部分作弊的内容渠道采取脚本程序模拟用户操作,造成用户有浏览行为的表现,欺骗产品运营方,但是依然存在一定缺陷:即脚本程序往往在短时间内产生大量操作,例如上文举例的短时间内刷新大量网页,明显不是正常的浏览行为。
在本实施例中给出了一种利用预设的行为模式判断规则和提取出的行为模式特征信息识别目标用户的具体示例。在本实施例中,行为模式特征信息可以是用户行为的类型、发生的时间等,并且各类行为模式特征信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述装置中,行为模式特征信息为用户行为的发生时间,行为模式特征信息映射的指标值为第二预设时间间隔内指定类型用户行为的发生次数。
例如,一秒钟内刷新十个不同的产品详情页,显然不是正常用户的浏览行为。一方面,考虑到许多产品详情页采用HTML5技术实现,本身的加载需要一定时间,尤其是在网络环境不佳的情况下,短时间内可能根本加载不出产品详情页的内容;另一方面,用户即使对产品详情页不感兴趣,也需要一定的时间浏览内容,结合类似的因素可以得出与各类型用户行为相关的预设阈值。
在本发明的一个实施例中,上述装置中,提取出的信息为与用户注册行为对应的行为模式特征信息;识别单元230,适于若行为模式特征信息映射的指标值小于预设阈值,则将用户标记为指定类型的用户。
具体地,在本发明的一个实施例中,上述方法中,用户注册行为包括如下的一种或多种:输入用户名,输入密码,密码确认,输入激活码,输入注册手机号,输入验证码,浏览用户协议,确认用户协议,点击注册控件。
在本实施例中给出了一种利用预设的行为模式判断规则和提取出的行为模式特征信息识别目标用户的具体示例。在本实施例中,行为模式特征信息可以是用户行为的类型、发生的时间等,并且各类行为模式特征信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述装置中,行为模式特征信息为用户注册行为的发生时间,行为模式特征信息映射的指标值为各用户注册行为间的时间间隔和/或各用户注册行为持续的时间。
以注册需要输入手机号为例,一般输入11位手机号至少也需要3秒,则如果输入过快,可能是利用脚本实现的,一般真实用户很少使用这种方式;另外,从输入手机号,到点击获取验证码,再到收到验证码后填入,整个过程也需要花费一定时间。然而目前存在一类被称为“接码平台”的服务商,能够为作弊内容渠道提供一批手机号所接收到的验证码,利用脚本程序可以快速将验证码输入,诸如此类。可见,用户注册行为间的间隔如果果断,或是用户注册行为持续的时间过短,相应的用户很可能不是真实用户,而是虚假用户或是作弊用户。
在本发明的一个实施例中,上述装置中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息;识别单元230,适于若操作系统信息与设备厂商信息不匹配,则将用户标记为指定类型的用户。
举例来说,设备信息可以包括操作系统为iOS系统还是Android系统,设备厂商是华为、苹果、三星还是小米等等。例如,如果操作系统信息显示用户正在使用的是Android系统,但设备厂商信息显示是苹果手机,这几乎不会在正常用户的注册场景下发生。相反,这种情况在某些作弊场景下会出现,作弊的内容渠道通过批量操作,使用模拟器,有可能出现上述情形。
在本发明的一个实施例中,上述装置中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息;识别单元230,适于对操作系统信息进行去重,若去重后的操作系统信息数量大于1,则将用户标记为指定类型的用户。
在一个注册过程中,正常用户使用的操作系统应当是单一的,因此,如果对操作系统信息去重后,数量大于1,也可能是因作弊方式产生,可以将相应的用户标记为指定类型的用户,例如虚假用户或是作弊用户。
在本发明的一个实施例中,上述装置中,指定类型的用户为虚假注册用户;评价单元240,还适于统计预设时间段内,根据各内容渠道进行注册的用户中,优质用户的比例作为第二比例;优质用户是为产品带来收益的用户;根据为第一比例和第二比例分别预设的权重计算各内容渠道的质量评价分数。
现有技术中,对于虚假用户或是作弊用户的识别可以通过特征工程以及决策树分类模型来判定是否有作弊行为,等等诸多方式。这些方式的缺点通常在于:1)可解释性较差,且需要多维数据支撑,对数据质量有较高的要求,但实际业务场景中,可能不能保证数据高质量,进而影响模型识别质量;2)需要借助历史数据库进行查询,需要大量历史数据积累,或购买三方数据库,增加运营成本;3)需要观察相对长时间维度上的数据异常分布,没有基于用户粒度的识别,也无法进行短期或实时的识别,时效性较差。
而结合上述实施例可以看出,采用本发明的技术方案识别虚假用户或是作弊用户的优势在于:1)利用的是原生的用户行为数据,判定逻辑通俗易懂,可解释性强、易于接受,为商务在结算谈判时争取了主动权;2)在仅利用与用户注册事件时相关(例如当天)的用户行为数据进行判定,无需长期的数据积累,异常判定时效为T+1天,时效性大大提高,便于及时追回、减少产品运营方损失;3)无需额外使用第三方库,节省运营成本。
综上所述,本发明的技术方案,对根据目标内容渠道进行注册的各用户,分别获取用户行为数据,从用户行为数据中提取出与用户行为对应的一个或多个维度的信息,根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户,统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例,根据第一比例对各内容渠道的质量进行评价。该技术方案通过基于原生的用户行为数据,从中选取若干个维度分别进行过滤,识别出指定类型的用户,并据此判断各内容渠道的质量,具有可解释性强,判定逻辑通俗易懂,易于接受的优点,能够为商务在结算谈判时争取主动权;无需额外使用第三方库,节省运营成本。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的内容渠道的评价装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备包括处理器310和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器320。存储器320可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器320具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码331的存储空间330。例如,用于存储计算机可读程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码331。计算机可读程序代码331可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质。图4示出了根据本发明一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质400存储有用于执行根据本发明的方法步骤的计算机可读程序代码331,可以被电子设备300的处理器310读取,当计算机可读程序代码331由电子设备300运行时,导致该电子设备300执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码331可以执行上述任一实施例中示出的方法。计算机可读程序代码331可以以适当形式进行压缩。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明的实施例公开了A1、一种内容渠道的评价方法,包括:
对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;
从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;
根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;
统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;
根据所述第一比例对各内容渠道的质量进行评价。
A2、如A1所述的方法,其中,所述对根据目标内容渠道进行注册的各用户,分别获取用户行为数据包括:
从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
A3、如A2所述的方法,其中,该方法还包括:
提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;
所述前端页面包括:注册页面和/或产品页面。
A4、如A1所述的方法,其中,所述用户行为数据为与用户注册相关的用户行为数据。
A5、如A1所述的方法,其中,提取出的信息为与用户行为对应的IP地址,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
获取所述IP地址对应的地理位置;
判断所述地理位置与产品内容的投放区域是否匹配,否则将用户标记为指定类型的用户。
A6、如A5所述的方法,其中,所述获取所述IP地址对应的地理位置包括:
根据预设的IP地址与地理位置的映射关系,获取所述IP地址对应的地理位置。
A7、如A6所述的方法,其中,所述IP地址与地理位置的映射关系保存在预设的IP地址定位数据库中。
A8、如A1所述的方法,其中,提取出的信息为与用户行为对应的网络环境信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若网络环境信息映射的指标值超过预设阈值,则将用户标记为指定类型的用户。
A9、如A8所述的方法,其中,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
A10、如A1所述的方法,其中,提取出的信息为与用户浏览行为对应的行为模式特征信息,所述用户浏览行为是在用户注册后的第一预设时间间隔内发生的;
所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若所述行为模式特征信息映射的指标值大于预设阈值,则将用户标记为指定类型的用户。
A11、如A10所述的方法,其中,所述行为模式特征信息为用户行为的发生时间,所述行为模式特征信息映射的指标值为第二预设时间间隔内指定类型用户行为的发生次数。
A12、如A1所述的方法,其中,提取出的信息为与用户注册行为对应的行为模式特征信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若所述行为模式特征信息映射的指标值小于预设阈值,则将用户标记为指定类型的用户。
A13、如A12所述的方法,其中,所述行为模式特征信息为用户注册行为的发生时间,所述行为模式特征信息映射的指标值为各用户注册行为间的时间间隔和/或各用户注册行为持续的时间。
A14、如A12所述的方法,其中,所述用户注册行为包括如下的一种或多种:
输入用户名,输入密码,密码确认,输入激活码,输入注册手机号,输入验证码,浏览用户协议,确认用户协议,点击注册控件。
A15、如A1所述的方法,其中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
若所述操作系统信息与所述设备厂商信息不匹配,则将用户标记为指定类型的用户。
A16、如A15所述的方法,其中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息,所述根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户包括:
对操作系统信息进行去重,若去重后的操作系统信息数量大于1,则将用户标记为指定类型的用户。
A17、如A1所述的方法,其中,所述指定类型的用户为虚假注册用户,该方法还包括:统计预设时间段内,根据各内容渠道进行注册的用户中,优质用户的比例作为第二比例;所述优质用户是为产品带来收益的用户;
所述根据所述第一比例对各内容渠道的质量进行评价包括:根据为所述第一比例和所述第二比例分别预设的权重计算各内容渠道的质量评价分数。
本发明的实施例还公开了B18、一种内容渠道的评价装置,包括:
获取单元,适于对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;
提取单元,适于从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;
识别单元,适于根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;
评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;根据所述第一比例对各内容渠道的质量进行评价。
B19、如B18所述的装置,其中,
所述获取单元,适于从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
B20、如B19所述的装置,其中,
所述获取单元,适于提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;所述前端页面包括:注册页面和/或产品页面。
B21、如B18所述的装置,其中,所述用户行为数据为与用户注册相关的用户行为数据。
B22、如B18所述的装置,其中,提取出的信息为与用户行为对应的IP地址;
所述识别单元,适于获取所述IP地址对应的地理位置;判断所述地理位置与产品内容的投放区域是否匹配,否则将用户标记为指定类型的用户。
B23、如B22所述的装置,其中,
所述识别单元,适于根据预设的IP地址与地理位置的映射关系,获取所述IP地址对应的地理位置。
B24、如B23所述的装置,其中,所述IP地址与地理位置的映射关系保存在预设的IP地址定位数据库中。
B25、如B18所述的装置,其中,提取出的信息为与用户行为对应的网络环境信息;
所述识别单元,适于若网络环境信息映射的指标值超过预设阈值,则将用户标记为指定类型的用户。
B26、如B25所述的装置,其中,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
B27、如B18所述的装置,其中,提取出的信息为与用户浏览行为对应的行为模式特征信息,所述用户浏览行为是在用户注册后的第一预设时间间隔内发生的;
所述识别单元,适于若所述行为模式特征信息映射的指标值大于预设阈值,则将用户标记为指定类型的用户。
B28、如B27所述的装置,其中,所述行为模式特征信息为用户行为的发生时间,所述行为模式特征信息映射的指标值为第二预设时间间隔内指定类型用户行为的发生次数。
B29、如B18所述的装置,其中,提取出的信息为与用户注册行为对应的行为模式特征信息;
所述识别单元,适于若所述行为模式特征信息映射的指标值小于预设阈值,则将用户标记为指定类型的用户。
B30、如B29所述的装置,其中,所述行为模式特征信息为用户注册行为的发生时间,所述行为模式特征信息映射的指标值为各用户注册行为间的时间间隔和/或各用户注册行为持续的时间。
B31、如B29所述的装置,其中,所述用户注册行为包括如下的一种或多种:
输入用户名,输入密码,密码确认,输入激活码,输入注册手机号,输入验证码,浏览用户协议,确认用户协议,点击注册控件。
B32、如B18所述的装置,其中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息;
所述识别单元,适于若所述操作系统信息与所述设备厂商信息不匹配,则将用户标记为指定类型的用户。
B33、如B32所述的装置,其中,提取出的信息为与用户行为对应的操作系统信息和设备厂商信息;
所述识别单元,适于对操作系统信息进行去重,若去重后的操作系统信息数量大于1,则将用户标记为指定类型的用户。
B34、如B18所述的装置,其中,所述指定类型的用户为虚假注册用户;
所述评价单元,还适于统计预设时间段内,根据各内容渠道进行注册的用户中,优质用户的比例作为第二比例;所述优质用户是为产品带来收益的用户;根据为所述第一比例和所述第二比例分别预设的权重计算各内容渠道的质量评价分数。
本发明的实施例还公开了C35、一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如A1-A17中任一项所述的方法。
本发明的实施例还公开了D36、一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如A1-A17中任一项所述的方法。
Claims (10)
1.一种内容渠道的评价方法,包括:
对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;
从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;
根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;
统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;
根据所述第一比例对各内容渠道的质量进行评价。
2.如权利要求1所述的方法,其中,所述对根据目标内容渠道进行注册的各用户,分别获取用户行为数据包括:
从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
3.如权利要求2所述的方法,其中,该方法还包括:
提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;
所述前端页面包括:注册页面和/或产品页面。
4.如权利要求1所述的方法,其中,所述用户行为数据为与用户注册相关的用户行为数据。
5.一种内容渠道的评价装置,包括:
获取单元,适于对根据目标内容渠道进行注册的各用户,分别获取用户行为数据;
提取单元,适于从所述用户行为数据中提取出与用户行为对应的一个或多个维度的信息;
识别单元,适于根据与各维度对应的判断规则和提取出的相应维度的信息识别出各用户是否为指定类型的用户;
评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例作为第一比例;根据所述第一比例对各内容渠道的质量进行评价。
6.如权利要求5所述的装置,其中,
所述获取单元,适于从用户行为打点日志中,根据用户标识提取并整理得到各用户的用户行为数据。
7.如权利要求6所述的装置,其中,
所述获取单元,适于提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;所述前端页面包括:注册页面和/或产品页面。
8.如权利要求5所述的装置,其中,所述用户行为数据为与用户注册相关的用户行为数据。
9.一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811270889.XA CN111127050A (zh) | 2018-10-29 | 2018-10-29 | 内容渠道的评价方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811270889.XA CN111127050A (zh) | 2018-10-29 | 2018-10-29 | 内容渠道的评价方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111127050A true CN111127050A (zh) | 2020-05-08 |
Family
ID=70484092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811270889.XA Pending CN111127050A (zh) | 2018-10-29 | 2018-10-29 | 内容渠道的评价方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111127050A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898887A (zh) * | 2020-07-16 | 2020-11-06 | 北京网聘咨询有限公司 | 流量质量评价方法 |
CN112308417A (zh) * | 2020-10-30 | 2021-02-02 | 领扣网络(上海)有限公司 | 在线测评的防作弊方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106161389A (zh) * | 2015-04-16 | 2016-11-23 | 北京金山安全软件有限公司 | 一种作弊识别方法、装置及终端 |
CN106301980A (zh) * | 2015-05-28 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种刷量工具检测方法和装置 |
CN106445796A (zh) * | 2015-08-04 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 作弊渠道的自动检测方法及装置 |
CN106874293A (zh) * | 2015-12-11 | 2017-06-20 | 北京国双科技有限公司 | 一种数据处理方法及装置 |
CN107153971A (zh) * | 2017-05-05 | 2017-09-12 | 北京京东尚科信息技术有限公司 | 用于识别app推广中设备作弊的方法及装置 |
CN107196889A (zh) * | 2016-03-14 | 2017-09-22 | 深圳市深信服电子科技有限公司 | 僵尸账号的检测方法和装置 |
CN107277025A (zh) * | 2017-06-28 | 2017-10-20 | 维沃移动通信有限公司 | 一种网络安全访问方法、移动终端及计算机可读存储介质 |
-
2018
- 2018-10-29 CN CN201811270889.XA patent/CN111127050A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106161389A (zh) * | 2015-04-16 | 2016-11-23 | 北京金山安全软件有限公司 | 一种作弊识别方法、装置及终端 |
CN106301980A (zh) * | 2015-05-28 | 2017-01-04 | 腾讯科技(深圳)有限公司 | 一种刷量工具检测方法和装置 |
CN106445796A (zh) * | 2015-08-04 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 作弊渠道的自动检测方法及装置 |
CN106874293A (zh) * | 2015-12-11 | 2017-06-20 | 北京国双科技有限公司 | 一种数据处理方法及装置 |
CN107196889A (zh) * | 2016-03-14 | 2017-09-22 | 深圳市深信服电子科技有限公司 | 僵尸账号的检测方法和装置 |
CN107153971A (zh) * | 2017-05-05 | 2017-09-12 | 北京京东尚科信息技术有限公司 | 用于识别app推广中设备作弊的方法及装置 |
CN107277025A (zh) * | 2017-06-28 | 2017-10-20 | 维沃移动通信有限公司 | 一种网络安全访问方法、移动终端及计算机可读存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898887A (zh) * | 2020-07-16 | 2020-11-06 | 北京网聘咨询有限公司 | 流量质量评价方法 |
CN112308417A (zh) * | 2020-10-30 | 2021-02-02 | 领扣网络(上海)有限公司 | 在线测评的防作弊方法及系统 |
CN112308417B (zh) * | 2020-10-30 | 2024-01-23 | 领扣网络(上海)有限公司 | 在线测评的防作弊方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107343047B (zh) | 应用推广系统及方法 | |
CN109859002B (zh) | 产品推送方法、装置、计算机设备及存储介质 | |
CN110335022B (zh) | 自动稽核方法、装置、设备及存储介质 | |
CN109034583A (zh) | 异常交易识别方法、装置及电子设备 | |
CN103236005A (zh) | 一种电子商务风险支付的检测评估阻止方法 | |
CN107633433B (zh) | 广告的审核方法及装置 | |
CN113516529B (zh) | 异常订单确定方法、装置、存储介质及电子设备 | |
CN111127050A (zh) | 内容渠道的评价方法、装置、电子设备和存储介质 | |
CN110851339A (zh) | 一种埋点数据的上报方法、装置、存储介质和终端设备 | |
CN111104628A (zh) | 一种用户识别方法、装置、电子设备和存储介质 | |
CN106301979B (zh) | 检测异常渠道的方法和系统 | |
CN110400193A (zh) | 菜品推荐方法及装置、电子设备及存储介质 | |
CN111784423B (zh) | 发票匹配方法、装置、电子设备和存储介质 | |
CN111105261B (zh) | 一种用户识别方法、装置、电子设备和存储介质 | |
CN111105259B (zh) | 一种用户识别方法、装置、电子设备和存储介质 | |
CN110796178B (zh) | 决策模型训练方法及样本特征选择方法、装置和电子设备 | |
CN112445787A (zh) | 一种基于实时业务的数据稽核方法和系统 | |
CN111105263A (zh) | 一种用户识别方法、装置、电子设备和存储介质 | |
CN109062945B (zh) | 一种社交网络的信息推荐方法、装置及系统 | |
CN111105262B (zh) | 一种用户识别方法、装置、电子设备和存储介质 | |
CN111105260B (zh) | 一种用户识别方法、装置、电子设备和存储介质 | |
CN110825609A (zh) | 服务的测试方法、装置和系统 | |
CN112269940A (zh) | 数据处理方法及装置 | |
CN108629610B (zh) | 推广信息曝光量的确定方法和装置 | |
CN108881591B (zh) | 一种多平台信息推荐方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |