CN111105259B - 一种用户识别方法、装置、电子设备和存储介质 - Google Patents

一种用户识别方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111105259B
CN111105259B CN201811270875.8A CN201811270875A CN111105259B CN 111105259 B CN111105259 B CN 111105259B CN 201811270875 A CN201811270875 A CN 201811270875A CN 111105259 B CN111105259 B CN 111105259B
Authority
CN
China
Prior art keywords
user
network environment
user behavior
environment information
behavior data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811270875.8A
Other languages
English (en)
Other versions
CN111105259A (zh
Inventor
贾伟
徐梦迪
李婧夕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201811270875.8A priority Critical patent/CN111105259B/zh
Publication of CN111105259A publication Critical patent/CN111105259A/zh
Application granted granted Critical
Publication of CN111105259B publication Critical patent/CN111105259B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户识别方法、装置、电子设备和存储介质。所述方法包括:获取目标用户的用户行为数据;从所述用户行为数据中提取出与用户行为对应的网络环境信息;根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。该技术方案从网络环境信息的维度进行用户识别,适用于用户注册等场景下识别出通过作弊等方式产生的用户,便于减少产品进行推广的损失。

Description

一种用户识别方法、装置、电子设备和存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种用户识别方法、装置、电子设备和存储介质。
背景技术
在各行各业,产品都离不开用户的支撑。为了吸收更多用户(也称为“获客”),产品往往通过不同的渠道来推广内容,例如依赖于广告进行推广,在互联网时代,用户可以非常方便地通过点击广告跳转到产品的注册页面,注册成为产品的用户。
产品往往会选择多个内容渠道进行推广,通常会按照推广效果进行付费。例如,通过某广告渠道进行注册的用户数量就是一个考察的因素。部分广告渠道提供方为了牟利,进行了作弊,使得注册的用户中实际存在一部分作弊用户。因此需要一种能够识别出作弊等特定类型用户的方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种用户识别方法、装置、电子设备和存储介质。
依据本发明的一个方面,提供了一种用户识别方法,包括:
获取目标用户的用户行为数据;
从所述用户行为数据中提取出与用户行为对应的网络环境信息;
根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。
可选地,所述获取目标用户的用户行为数据包括:
从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
可选地,该方法还包括:
提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;
所述前端页面包括:注册页面和/或产品页面。
可选地,所述目标用户的用户行为数据为与用户注册相关的用户行为数据。
可选地,所述根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户包括:
若所述网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
可选地,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
可选地,该方法还包括:
统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;
根据所述比例对各内容渠道的质量进行评价。
依据本发明的另一方面,提供了一种用户识别装置,包括:
获取单元,适于获取目标用户的用户行为数据;
提取单元,适于从所述用户行为数据中提取出与用户行为对应的网络环境信息;
识别单元,适于根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。
可选地,所述获取单元,适于从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
可选地,所述获取单元,适于提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;所述前端页面包括:注册页面和/或产品页面。
可选地,所述目标用户的用户行为数据为与用户注册相关的用户行为数据。
可选地,所述识别单元,适于若所述网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
可选地,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
可选地,该装置还包括:
内容渠道评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;根据所述比例对各内容渠道的质量进行评价。
依据本发明的又一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。
依据本发明的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。
由上述可知,本发明的技术方案,通过获取目标用户的用户行为数据,从用户行为数据中提取出与用户行为对应的网络环境信息,根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。该技术方案从网络环境信息的维度进行用户识别,适用于用户注册等场景下识别出通过作弊等方式产生的用户,便于减少产品进行推广的损失。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种用户识别方法的流程示意图;
图2示出了根据本发明一个实施例的一种用户识别装置的结构示意图;
图3示出了根据本发明一个实施例的电子设备的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种用户识别方法的流程示意图。如图1所示,该方法包括:
步骤S110,获取目标用户的用户行为数据。
在实际数据收集的过程中,用户行为数据可以包括用户行为的种类、发生用户行为的时间、发生用户行为的设备信息、用户行为对应的网络环境信息等等。在本发明的实施例中可以仅选取其中的网络环境信息进行利用。
步骤S120,从用户行为数据中提取出与用户行为对应的网络环境信息。
用户通过页面进行注册、浏览等行为时,如果与服务器产生交互,就可以收集到与用户行为对应的网络环境信息。
步骤S130,根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。
可见,图1所示的方法,通过获取目标用户的用户行为数据,从用户行为数据中提取出与用户行为对应的网络环境信息,根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。该技术方案从网络环境信息的维度进行用户识别,适用于用户注册等场景下识别出通过作弊等方式产生的用户,便于减少产品进行推广的损失。
在本发明的一个实施例中,上述方法中,获取目标用户的用户行为数据包括:从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
通过预先埋点收集指定信息是互联网相关产品的一种较为方便的方法,在本实施例中,可以通过这种方式收集到用户行为打点日志,具体来说,在本发明的一个实施例中,上述方法还包括:提供包含若干个埋点的前端页面,根据埋点收集用户行为打点日志;前端页面包括:注册页面和/或产品页面。
例如,对注册页面的输入手机号、输入验证码进行埋点,则当用户输入手机号后,就会触发埋点,上报这一用户行为,在用户行为打点日志中进行记录。
可见,由于埋点较多,用户行为打点日志中收集有关于各个用户、各类用户行为的记录。在上述实施例中,可以根据设备信息等确定一个用户标识。这样在需要某一指定用户的用户行为数据时,可以根据用户标识,对用户行为打点日志进行处理、整合,得到同一个用户的用户行为数据。以注册场景为例,可以得到注册用户在注册前后完整的行为链条数据。
还需要说明的是,在本发明的实施例中可以不仅仅关注注册页面上发生的用户行为,还可以关注产品页面上发生的用户行为。因为许多内容渠道通过批量注册用户来进行作弊,这些用户在注册后也不登录产品,不能为产品创造收益,因此许多产品运营方选择根据注册后有行为的用户来为推广进行付费。因此,作弊不仅仅局限在注册时,也存在于注册后。所以,本发明的实施例还可以采集产品页面上的用户行为数据。正如背景技术中所述,内容的推广形式之一就是广告,本发明实施例中的内容可以是广告,相应的内容渠道即为广告渠道。
在本发明的一个实施例中,上述方法中,目标用户的用户行为数据为与用户注册相关的用户行为数据。
结合前述说明可知,用户在产品的日常使用过程中也会在产品页面产生用户行为,因此,为了获取为与用户注册相关的用户行为数据,可以根据用户注册事件发生的时间点,来获取某一时间段内容的用户行为数据,将其作为与用户注册相关的用户行为数据,或者,获取输入验证码、输入手机号等指定类型的用户行为的用户行为数据。
在本发明的一个实施例中,上述方法中,根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户包括:若网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
在本实施例中给出了一种利用网络环境判断规则和提取出的网络环境信息识别目标用户的具体示例。在本实施例中,网络环境信息可以是IP地址、网络类型等各类与用户行为息息相关的信息,并且各类网络环境信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述方法中,网络环境信息为IP地址,网络环境信息映射的指标值为IP地址的数量。
用户注册过程具有时间相对较短,场景相对单一的特点,在这个过程中,一般用户的IP地址不会发生多次切换,当然,如果将网络从4G切换到WIFI,则IP地址可能会切换。但是无论是何种正当途径下,IP地址的切换不会过于频繁,也就是在与注册事件相关的用户行为不应该对应于多个IP地址。如果对应于多个IP地址,则说明是不正常的,例如是使用脚本程序批量注册等等,这个过程有可能出现上述情况,而这种作弊行为则是产品运营方所不乐意见到的。具有这类用户行为相应的用户可以被识别为作弊用户或者是虚假用户。
现有技术中,对于虚假用户或是作弊用户的识别可以通过特征工程以及决策树分类模型来判定是否有作弊行为,等等诸多方式。这些方式的缺点通常在于:1)可解释性较差,且需要多维数据支撑,对数据质量有较高的要求,但实际业务场景中,可能不能保证数据高质量,进而影响模型识别质量;2)需要借助历史数据库进行查询,需要大量历史数据积累,或购买三方数据库,增加运营成本;3)需要观察相对长时间维度上的数据异常分布,没有基于用户粒度的识别,也无法进行短期或实时的识别,时效性较差。
而结合上述实施例可以看出,采用本发明的技术方案识别虚假用户或是作弊用户的优势在于:1)利用的是原生的用户行为数据,判定逻辑通俗易懂,可解释性强、易于接受,为商务在结算谈判时争取了主动权;2)在仅利用与用户注册事件时相关(例如当天)的用户行为数据进行判定,无需长期的数据积累,异常判定时效为T+1天,时效性大大提高,便于及时追回、减少产品运营方损失;3)无需额外使用第三方库,节省运营成本。
在本发明的一个实施例中,上述方法还包括:统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;根据比例对各内容渠道的质量进行评价。
例如识别的用户为作弊用户或者是虚假用户,当这类用户占比较高时,显然该内容渠道的质量较差,反之则较高。
图2示出了根据本发明一个实施例的一种用户识别装置的结构示意图。如图用户识别装置,包括:
获取单元210,适于获取目标用户的用户行为数据;
在实际数据收集的过程中,用户行为数据可以包括用户行为的种类、发生用户行为的时间、发生用户行为的设备信息、用户行为对应的网络环境信息等等。在本发明的实施例中可以仅选取其中的网络环境信息进行利用。
提取单元220,适于从用户行为数据中提取出与用户行为对应的网络环境信息。
用户通过页面进行注册、浏览等行为时,如果与服务器产生交互,就可以收集到与用户行为对应的网络环境信息。
识别单元230,适于根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。
可见,图2所示的装置,通过各单元的相互配合,获取目标用户的用户行为数据,从用户行为数据中提取出与用户行为对应的网络环境信息,根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。该技术方案从网络环境信息的维度进行用户识别,适用于用户注册等场景下识别出通过作弊等方式产生的用户,便于减少产品进行推广的损失。
在本发明的一个实施例中,上述装置中,获取单元210,适于从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
通过预先埋点收集指定信息是互联网相关产品的一种较为方便的方法,在本实施例中,可以通过这种方式收集到用户行为打点日志,具体来说,在本发明的一个实施例中,上述装置中,获取单元210,适于提供包含若干个埋点的前端页面,根据埋点收集用户行为打点日志;前端页面包括:注册页面和/或产品页面。
例如,对注册页面的输入手机号、输入验证码进行埋点,则当用户输入手机号后,就会触发埋点,上报这一用户行为,在用户行为打点日志中进行记录。
可见,由于埋点较多,用户行为打点日志中收集有关于各个用户、各类用户行为的记录。在上述实施例中,可以根据设备信息等确定一个用户标识。这样在需要某一指定用户的用户行为数据时,可以根据用户标识,对用户行为打点日志进行处理、整合,得到同一个用户的用户行为数据。以注册场景为例,可以得到注册用户在注册前后完整的行为链条数据。
还需要说明的是,在本发明的实施例中可以不仅仅关注注册页面上发生的用户行为,还可以关注产品页面上发生的用户行为。因为许多内容渠道通过批量注册用户来进行作弊,这些用户在注册后也不登录产品,不能为产品创造收益,因此许多产品运营方选择根据注册后有行为的用户来为推广进行付费。因此,作弊不仅仅局限在注册时,也存在于注册后。所以,本发明的实施例还可以采集产品页面上的用户行为数据。正如背景技术中所述,内容的推广形式之一就是广告,本发明实施例中的内容可以是广告,相应的内容渠道即为广告渠道。
在本发明的一个实施例中,上述装置中,目标用户的用户行为数据为与用户注册相关的用户行为数据。
结合前述说明可知,用户在产品的日常使用过程中也会在产品页面产生用户行为,因此,为了获取为与用户注册相关的用户行为数据,可以根据用户注册事件发生的时间点,来获取某一时间段内容的用户行为数据,将其作为与用户注册相关的用户行为数据,或者,获取输入验证码、输入手机号等指定类型的用户行为的用户行为数据。
在本发明的一个实施例中,上述装置中,识别单元230,适于若网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
在本实施例中给出了一种利用网络环境判断规则和提取出的网络环境信息识别目标用户的具体示例。在本实施例中,网络环境信息可以是IP地址、网络类型等各类与用户行为息息相关的信息,并且各类网络环境信息可以对应一个指标,当指标值超过预设阈值,则将目标用户标记为指定类型的用户。一个具体的例子如下:在本发明的一个实施例中,上述装置中,网络环境信息为IP地址,网络环境信息映射的指标值为IP地址的数量。
用户注册过程具有时间相对较短,场景相对单一的特点,在这个过程中,一般用户的IP地址不会发生多次切换,当然,如果将网络从4G切换到WIFI,则IP地址可能会切换。但是无论是何种正当途径下,IP地址的切换不会过于频繁,也就是在与注册事件相关的用户行为不应该对应于多个IP地址。如果对应于多个IP地址,则说明是不正常的,例如是使用脚本程序批量注册等等,这个过程有可能出现上述情况,而这种作弊行为则是产品运营方所不乐意见到的。具有这类用户行为相应的用户可以被识别为作弊用户或者是虚假用户。
现有技术中,对于虚假用户或是作弊用户的识别可以通过特征工程以及决策树分类模型来判定是否有作弊行为,等等诸多方式。这些方式的缺点通常在于:1)可解释性较差,且需要多维数据支撑,对数据质量有较高的要求,但实际业务场景中,可能不能保证数据高质量,进而影响模型识别质量;2)需要借助历史数据库进行查询,需要大量历史数据积累,或购买三方数据库,增加运营成本;3)需要观察相对长时间维度上的数据异常分布,没有基于用户粒度的识别,也无法进行短期或实时的识别,时效性较差。
而结合上述实施例可以看出,采用本发明的技术方案识别虚假用户或是作弊用户的优势在于:1)利用的是原生的用户行为数据,判定逻辑通俗易懂,可解释性强、易于接受,为商务在结算谈判时争取了主动权;2)在仅利用与用户注册事件时相关(例如当天)的用户行为数据进行判定,无需长期的数据积累,异常判定时效为T+1天,时效性大大提高,便于及时追回、减少产品运营方损失;3)无需额外使用第三方库,节省运营成本。
在本发明的一个实施例中,上述装置还包括:内容渠道评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;根据比例对各内容渠道的质量进行评价。
例如识别的用户为作弊用户或者是虚假用户,当这类用户占比较高时,显然该内容渠道的质量较差,反之则较高。
综上所述,本发明的技术方案,通过获取目标用户的用户行为数据,从用户行为数据中提取出与用户行为对应的网络环境信息,根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。该技术方案从网络环境信息的维度进行用户识别,适用于用户注册等场景下识别出通过作弊等方式产生的用户,便于减少产品进行推广的损失。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的用户识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备包括处理器310和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器320。存储器320可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器320具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码331的存储空间330。例如,用于存储计算机可读程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码331。计算机可读程序代码331可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质。图4示出了根据本发明一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质400存储有用于执行根据本发明的方法步骤的计算机可读程序代码331,可以被电子设备300的处理器310读取,当计算机可读程序代码331由电子设备300运行时,导致该电子设备300执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码331可以执行上述任一实施例中示出的方法。计算机可读程序代码331可以以适当形式进行压缩。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明的实施例公开了A1、一种用户识别方法,包括:
获取目标用户的用户行为数据;
从所述用户行为数据中提取出与用户行为对应的网络环境信息;
根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。
A2、如A1所述的方法,其中,所述获取目标用户的用户行为数据包括:
从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
A3、如A2所述的方法,其中,该方法还包括:
提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;
所述前端页面包括:注册页面和/或产品页面。
A4、如A1所述的方法,其中,所述目标用户的用户行为数据为与用户注册相关的用户行为数据。
A5、如A1所述的方法,其中,所述根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户包括:
若所述网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
A6、如A5所述的方法,其中,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
A7、如A1所述的方法,其中,该方法还包括:
统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;
根据所述比例对各内容渠道的质量进行评价。
本发明的实施例还公开了B8、一种用户识别装置,包括:
获取单元,适于获取目标用户的用户行为数据;
提取单元,适于从所述用户行为数据中提取出与用户行为对应的网络环境信息;
识别单元,适于根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户。
B9、如B8所述的装置,其中,
所述获取单元,适于从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
B10、如B9所述的装置,其中,
所述获取单元,适于提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;所述前端页面包括:注册页面和/或产品页面。
B11、如B8所述的装置,其中,所述目标用户的用户行为数据为与用户注册相关的用户行为数据。
B12、如B8所述的装置,其中,
所述识别单元,适于若所述网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
B13、如B12所述的装置,其中,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
B14、如B8所述的装置,其中,该装置还包括:
内容渠道评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;根据所述比例对各内容渠道的质量进行评价。
本发明的实施例还公开了C15、一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如A1-A7中任一项所述的方法。
本发明的实施例还公开了D16、一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如A1-A7中任一项所述的方法。

Claims (12)

1.一种用户识别方法,包括:
获取目标用户的用户行为数据;其中,所述目标用户的用户行为数据为与用户注册相关的用户行为数据;
从所述用户行为数据中提取出与用户行为对应的网络环境信息;
根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户;
其中,该方法还包括:
统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;
根据所述比例对各内容渠道的质量进行评价。
2.如权利要求1所述的方法,其中,所述获取目标用户的用户行为数据包括:
从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
3.如权利要求2所述的方法,其中,该方法还包括:
提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;
所述前端页面包括:注册页面和/或产品页面。
4.如权利要求1所述的方法,其中,所述根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户包括:
若所述网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
5.如权利要求4所述的方法,其中,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
6.一种用户识别装置,包括:
获取单元,适于获取目标用户的用户行为数据;其中,所述目标用户的用户行为数据为与用户注册相关的用户行为数据;
提取单元,适于从所述用户行为数据中提取出与用户行为对应的网络环境信息;
识别单元,适于根据预设的网络环境判断规则和提取出的网络环境信息识别出目标用户是否为指定类型的用户;
其中,该装置还包括:
内容渠道评价单元,适于统计预设时间段内,根据各内容渠道进行注册的用户中,指定类型的用户的比例;根据所述比例对各内容渠道的质量进行评价。
7.如权利要求6所述的装置,其中,
所述获取单元,适于从用户行为打点日志中,根据用户标识提取并整理得到目标用户的用户行为数据。
8.如权利要求7所述的装置,其中,
所述获取单元,适于提供包含若干个埋点的前端页面,根据所述埋点收集所述用户行为打点日志;所述前端页面包括:注册页面和/或产品页面。
9.如权利要求6所述的装置,其中,
所述识别单元,适于若所述网络环境信息映射的指标值超过预设阈值,则将目标用户标记为指定类型的用户。
10.如权利要求9所述的装置,其中,所述网络环境信息为IP地址,所述网络环境信息映射的指标值为IP地址的数量。
11.一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如权利要求1-5中任一项所述的方法。
CN201811270875.8A 2018-10-29 2018-10-29 一种用户识别方法、装置、电子设备和存储介质 Active CN111105259B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811270875.8A CN111105259B (zh) 2018-10-29 2018-10-29 一种用户识别方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811270875.8A CN111105259B (zh) 2018-10-29 2018-10-29 一种用户识别方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN111105259A CN111105259A (zh) 2020-05-05
CN111105259B true CN111105259B (zh) 2024-04-02

Family

ID=70419294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811270875.8A Active CN111105259B (zh) 2018-10-29 2018-10-29 一种用户识别方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111105259B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579408A (zh) * 2020-10-29 2021-03-30 上海钱拓网络技术有限公司 一种埋点信息的分类方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001045355A2 (fr) * 1999-12-14 2001-06-21 Netvalue S.A. Procede de mesure et d'analyse d'audience sur reseaux de communication
CN102946319A (zh) * 2012-09-29 2013-02-27 焦点科技股份有限公司 网络用户行为信息分析系统及其分析方法
CN103136360A (zh) * 2013-03-07 2013-06-05 北京宽连十方数字技术有限公司 一种互联网行为标注引擎及对应该引擎的行为标注方法
CN105653605A (zh) * 2015-12-23 2016-06-08 北京搜狗科技发展有限公司 一种用于网络社区作弊用户挖掘的方法、系统及电子设备
CN106204108A (zh) * 2016-06-29 2016-12-07 腾讯科技(深圳)有限公司 广告反作弊方法及广告反作弊装置
CN106447383A (zh) * 2016-08-30 2017-02-22 杭州启冠网络技术有限公司 跨时间、多维度异常数据监测的方法和系统
CN106651475A (zh) * 2017-02-22 2017-05-10 广州万唯邑众信息科技有限公司 一种移动视频广告假量识别方法和系统
CN107153971A (zh) * 2017-05-05 2017-09-12 北京京东尚科信息技术有限公司 用于识别app推广中设备作弊的方法及装置
CN107274212A (zh) * 2017-05-26 2017-10-20 北京小度信息科技有限公司 作弊识别方法及装置
CN107295050A (zh) * 2016-04-01 2017-10-24 阿里巴巴集团控股有限公司 前端用户行为统计方法及装置
CN107592217A (zh) * 2017-09-01 2018-01-16 北京奇虎科技有限公司 一种用户识别方法和装置
US9965526B1 (en) * 2015-06-12 2018-05-08 Amazon Technologies, Inc. Data mining for multiple item comparisons
CN108109011A (zh) * 2017-12-28 2018-06-01 北京皮尔布莱尼软件有限公司 一种广告反作弊方法及计算设备
CN108470253A (zh) * 2018-04-02 2018-08-31 腾讯科技(深圳)有限公司 一种用户识别方法、装置及存储设备
CN108694616A (zh) * 2018-05-24 2018-10-23 百度在线网络技术(北京)有限公司 广告作弊的识别方法和装置
CN111105261A (zh) * 2018-10-29 2020-05-05 北京奇虎科技有限公司 一种用户识别方法、装置、电子设备和存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001045355A2 (fr) * 1999-12-14 2001-06-21 Netvalue S.A. Procede de mesure et d'analyse d'audience sur reseaux de communication
CN102946319A (zh) * 2012-09-29 2013-02-27 焦点科技股份有限公司 网络用户行为信息分析系统及其分析方法
CN103136360A (zh) * 2013-03-07 2013-06-05 北京宽连十方数字技术有限公司 一种互联网行为标注引擎及对应该引擎的行为标注方法
US9965526B1 (en) * 2015-06-12 2018-05-08 Amazon Technologies, Inc. Data mining for multiple item comparisons
CN105653605A (zh) * 2015-12-23 2016-06-08 北京搜狗科技发展有限公司 一种用于网络社区作弊用户挖掘的方法、系统及电子设备
CN107295050A (zh) * 2016-04-01 2017-10-24 阿里巴巴集团控股有限公司 前端用户行为统计方法及装置
CN106204108A (zh) * 2016-06-29 2016-12-07 腾讯科技(深圳)有限公司 广告反作弊方法及广告反作弊装置
CN106447383A (zh) * 2016-08-30 2017-02-22 杭州启冠网络技术有限公司 跨时间、多维度异常数据监测的方法和系统
CN106651475A (zh) * 2017-02-22 2017-05-10 广州万唯邑众信息科技有限公司 一种移动视频广告假量识别方法和系统
CN107153971A (zh) * 2017-05-05 2017-09-12 北京京东尚科信息技术有限公司 用于识别app推广中设备作弊的方法及装置
CN107274212A (zh) * 2017-05-26 2017-10-20 北京小度信息科技有限公司 作弊识别方法及装置
CN107592217A (zh) * 2017-09-01 2018-01-16 北京奇虎科技有限公司 一种用户识别方法和装置
CN108109011A (zh) * 2017-12-28 2018-06-01 北京皮尔布莱尼软件有限公司 一种广告反作弊方法及计算设备
CN108470253A (zh) * 2018-04-02 2018-08-31 腾讯科技(深圳)有限公司 一种用户识别方法、装置及存储设备
CN108694616A (zh) * 2018-05-24 2018-10-23 百度在线网络技术(北京)有限公司 广告作弊的识别方法和装置
CN111105261A (zh) * 2018-10-29 2020-05-05 北京奇虎科技有限公司 一种用户识别方法、装置、电子设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Profiling Victims of Investment Fraud: Mindsets and Risky Behaviors;Marguerite Deliema;Journal of Consumer Research;20201231;第46卷(第5期);904-914 *
基于目的分析的作弊页面分类;余慧佳;刘奕群;张敏;马少平;茹立云;;中文信息学报(第02期);338-389 *

Also Published As

Publication number Publication date
CN111105259A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN110198310B (zh) 一种网络行为反作弊方法、装置及存储介质
CN106022834B (zh) 广告反作弊方法及装置
CN108304410B (zh) 一种异常访问页面的检测方法、装置及数据分析方法
CN109034583A (zh) 异常交易识别方法、装置及电子设备
CN105426759A (zh) Url的合法性识别方法及装置
US20150341771A1 (en) Hotspot aggregation method and device
CN102819580B (zh) 互联网第三方媒体网站广告监控方法及系统
CN104731816A (zh) 一种处理异常业务数据的方法和装置
CN111198976B (zh) 云上资产关联分析系统、方法、电子设备及介质
CN108123972B (zh) 多媒体文件的分配方法及装置
CN110851339A (zh) 一种埋点数据的上报方法、装置、存储介质和终端设备
CN111104628A (zh) 一种用户识别方法、装置、电子设备和存储介质
CN111105259B (zh) 一种用户识别方法、装置、电子设备和存储介质
CN111126071A (zh) 提问文本数据的确定方法、装置和客服群的数据处理方法
CN111105263B (zh) 一种用户识别方法、装置、电子设备和存储介质
CN111105261B (zh) 一种用户识别方法、装置、电子设备和存储介质
CN111127050A (zh) 内容渠道的评价方法、装置、电子设备和存储介质
CN112085332A (zh) 数据处理方法、装置、计算机设备和存储介质
CN111105262B (zh) 一种用户识别方法、装置、电子设备和存储介质
CN111105260B (zh) 一种用户识别方法、装置、电子设备和存储介质
CN111160987A (zh) 一种信息展示方法、装置及系统
CN109598525B (zh) 数据处理方法和装置
CN108055661B (zh) 基于通信网络的电话号码黑名单建立方法及装置
CN108629610B (zh) 推广信息曝光量的确定方法和装置
CN112214506A (zh) 一种信息采集方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant