CN106453357A - 一种网络购票异常行为的识别方法、系统及设备 - Google Patents

一种网络购票异常行为的识别方法、系统及设备 Download PDF

Info

Publication number
CN106453357A
CN106453357A CN201610943260.1A CN201610943260A CN106453357A CN 106453357 A CN106453357 A CN 106453357A CN 201610943260 A CN201610943260 A CN 201610943260A CN 106453357 A CN106453357 A CN 106453357A
Authority
CN
China
Prior art keywords
behavior
frequency
threshold values
user
cookie
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610943260.1A
Other languages
English (en)
Inventor
曹杰
冯雨晖
宿晓坤
杨睿
周宇红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING HONGMA MEDIA CULTURE DEVELOPMENT CO LTD
Original Assignee
BEIJING HONGMA MEDIA CULTURE DEVELOPMENT CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING HONGMA MEDIA CULTURE DEVELOPMENT CO LTD filed Critical BEIJING HONGMA MEDIA CULTURE DEVELOPMENT CO LTD
Priority to CN201610943260.1A priority Critical patent/CN106453357A/zh
Publication of CN106453357A publication Critical patent/CN106453357A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网络购票异常行为的识别方法、系统及设备。该方法包括:将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;识别所述网络购票行为属性中的异常行为属性的用户IP,将异常行为属性的用户IP存入黑名单进行隔离。本发明提供的一种网络购票异常行为的识别方法、系统及设备,确定识别黄牛的各种阀值,为判别黄牛提供数据判断依据。实时记录用户的行为特征,能够为实时黄牛拦截提供实时依据;能够建立黑名单,能够基于黑名单,提前拦截黄牛,使资源的分配更具合理性和公平性。

Description

一种网络购票异常行为的识别方法、系统及设备
技术领域
本发明涉及异常行为识别技术领域,尤其涉及一种网络购票异常行为的识别方法、系统及设备。
背景技术
现场演出票由于价钱高资源少,会引来大量的黄牛前来刷票(网络购票异常行为),然后高价倒卖,黄牛的出现,损害用户的利益,极大的降低了网上购票的用户体验和平台的用户粘性。黄牛为了抢票,必须进行高频,大量的访问,以最快的速度下单占有资源。所以黄牛一般会通过程序进行刷票。目前识别黄牛大都是通过统计用户的访问来源,访问频次,访问周期,从中找出异于大多数用户的访问异常,从而判定为黄牛。建立黄牛黑名单。黄牛的定义并不一定是一个真正的用户,也可以是一个资源,黄牛使用该资源进行刷票,将此资源也纳入到黄牛黑名单中,因而,会有IP黑名单,Cookie黑名单,账号黑名单等。
当前的识别黄牛的方式主要通过监控访问日志,通过解析,计算日志中的IP,Cookie,设备,账号的访问频次,访问时间间隔,来识别异常访问,这在一定程度上能够防止黄牛。但是应用上述技术的时候,发明人发现,单一维度的识别,不能够唯一判别用户设备,容易误杀正常用户,比如IP,黄牛和正常用户在同一个楼或是小区,用同一个出口IP,如果使用IP识别,容易误杀正常用户。第二,频次识别只能是在一定程度上识别黄牛,当黄牛拉大访问间隔,降低访问频次,就不好判定。而且黄牛会模拟不同的客户端,多渠道的进行刷票。黄牛为了快速抢票,会走捷径,不会像正常用户操作,因而其行为轨迹也缺失关键步骤,所以当前基于流量访问异常的识别方法,已不满足识别黄牛的需要。
发明内容
为了解决上述技术问题,本发明提供了一种网络购票异常行为的识别方法、系统及设备,可以将网络购票异常行为特征从正常购票行为特征中识别出来,进行隔离,并降低误识别概率,使资源的分配更具合理性和公平性。
本发明一方面提供了一种网络购票异常行为的识别方法,包括:
将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;
提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;
识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
进一步的,所述将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识,包括:
通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
进一步的,所述识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离,包括:
识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
进一步的,所述提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性,包括:
提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单;
提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单;
实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
进一步的,所述提取所述用户标识中的历史行为记录中的历史频次阀值,包括以下步骤:
将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值。
进一步的,所述提取所述用户标识中的历史行为记录中的历史黑名单,包括以下步骤:
将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;
将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
进一步的,所述提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值,包括以下步骤:
导入历史交易行为记录到数据仓库中;
计算每个用户IP的单场次购票数,购买项目数,平均购票数;
使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
进一步的,所述提取所述用户标识中的历史交易行为记录中超出购买行为异常阀值的异常注册用户的黑名单,包括以下步骤:
导入前一天所有交易记录和至少一年的交易记录到数据仓库中;
计算每个用户IP一年之内的单场次购票数,购买项目数,平均购票数;使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值;
基于确定的潜在的购买行为异常阀值和频次计算结果,识别出超出购买行为异常阀值的异常注册用户,存入到黑名单表中。
进一步的,所述购买行为异常,包括:购买品类、地区和票价有较大的跨度的购买行为。
进一步的,所述实时采集用户标识的当前访问行为记录中的当前用户访问频次和异常访问路径,包括:
实时读取nginx的访问日志文件并发送到日志处理系统;
日志处理系统实时接收日志采集系统发送的日志,以一秒钟为一个计算窗口,计算IP访问频次,每个IP的访问url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问url的频次和异常访问路径,并将计算结果存储到缓存中。
进一步的,所述异常访问路径,包括:缺失至少一个主要访问路径的支付行为。
本发明还提供了一种网络购票异常行为的识别系统,包括:
标识模块,用于将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;
提取模块,用于提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;
识别模块,用于识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
进一步的,所述标识模块,包括:
标识单元,用于通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
进一步的,所述识别模块,包括:
识别单元,用于识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
第一黑名单单元,用于通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
进一步的,所述提取模块,包括:
第一提取单元,用于提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单;
第二提取单元,用于提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单;
采集单元,用于实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
进一步的,所述第一提取单元,包括:
第一收集单元,用于将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
第一计算单元,用于在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
第一存储单元,用于使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值;
第二收集单元,用于将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
第二计算单元,用于在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
第二存储单元,用于基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
进一步的,所述第二提取单元,包括:
第一导入单元,用于导入历史交易行为记录到数据仓库中;
第三计算单元,用于计算每个用户IP的单场次购票数,购买项目数,平均购票数;
第三存储单元,用于使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
第二导入单元,用于导入前一天所有交易记录和至少一年的交易记录到数据仓库中;
第四计算单元,用于计算每个用户IP一年之内的单场次购票数,购买项目数,平均购票数;使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值;
第四存储单元,用于基于确定的潜在的购买行为异常阀值和频次计算结果,识别出超出购买行为异常阀值的异常注册用户,存入到黑名单表中。
进一步的,所述购买行为异常,包括:购买品类、地区和票价有较大的跨度的购买行为。
进一步的,所述采集单元,包括:
读取单元,用于实时读取nginx的访问日志文件并发送到日志处理系统;
第五计算单元,用于在日志处理系统实时接收日志采集系统发送的日志,以一秒钟为一个计算窗口,计算IP访问频次,每个IP的访问url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问url的频次和异常访问路径,并将计算结果存储到缓存中。
进一步的,所述异常访问路径,包括:缺失至少一个主要访问路径的支付行为。
本发明提供了一种网络购票异常行为的识别设备,包括前述任一项所述的系统。
本发明通过将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。确定识别黄牛的各种阀值,为判别黄牛提供数据判断依据。实时记录用户的行为特征(频次和轨迹),能够为实时黄牛拦截提供实时依据;能够建立黑名单,能够基于黑名单,提前拦截黄牛,使资源的分配更具合理性和公平性。
附图说明
图1为本发明提供的一种网络购票异常行为的识别方法的实施例一的流程图;
图2为本发明提供的一种网络购票异常行为的识别系统的实施例二的结构框图。
图3为本发明提供的标识模块的结构框图;
图4为本发明提供的识别模块的结构框图;
图5为本发明提供的提取模块的结构框图;
图6为本发明提供的第一提取单元的结构框图;
图7为本发明提供的第二提取单元的结构框图;
图8为本发明提供的采集单元的结构框图;
图9为本发明提供的一种网络购票异常行为的识别设备的实施例三的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
本发明实施例一提供了一种网络购票异常行为的识别方法,如图1所示,包括:步骤S110、S120和S130。
步骤S110、将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
包括:通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
如,F(“192.168.2.12”,”283434223423”,”Mozilla/5.0(Windows NT 6.1;WOW64)AppleWebKit/537.36(KHTML,like Gecko)Chrome/37.0.2062.120Safari/537.36”)=0ca175b9c0f726a831d895e269332461。其中F(IP,cookie,Agent)标识一个Hash函数。
步骤S120、提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性。
步骤S130、识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
进一步的,所述识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离,包括:
识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
进一步的,所述提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性,包括:
提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单。
历史行为分析的目的在于找出诊断为黄牛的行为频次阀值和历史黑名单,包括IP阀值,下单URL访问频次阀值,唯一客户访问频次阀值。优选为,阀值分析的频率为每三个月一次,黑名单确定为每天自动化一次。
提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单。
历史交易分析目的在于找出潜在的购买行为异常的阀值和超出阀值的异常注册用户形成黑名单。优选为阀值分析频率每一年一次,黑名单确定频率为每天一次。
实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
进一步的,所述提取所述用户标识中的历史行为记录中的历史频次阀值,包括以下步骤:
历史行为记录收集。将ngnix代理服务器集群中不同的服务器上的近三个月用户访问日志文件集中到分布式存储系统HDFS上。
将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值。
进一步的,所述提取所述用户标识中的历史行为记录中的历史黑名单,包括以下步骤:
行为记录收集。将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;
将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
进一步的,所述提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值,包括以下步骤:
导入历史交易行为记录到数据仓库中;优选的,导入近一年的所有交易记录到数据仓库中。使用一年的交易记录是因为演出消费是一个低频消费,每个用户每年在演出的消费频次本身就不高,时间范围短看不出用户的消费规律。
计算每个用户IP的单场次购票数,购买项目数,平均购票数;
使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
进一步的,所述提取所述用户标识中的历史交易行为记录中超出购买行为异常阀值的异常注册用户的黑名单,包括以下步骤:
导入前一天所有交易记录和至少一年的交易记录到数据仓库中;
计算每个用户IP一年之内的单场次购票数,购买项目数,平均购票数;使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值;
基于确定的潜在的购买行为异常阀值和频次计算结果,识别出超出购买行为异常阀值的异常注册用户,存入到黑名单表中。
进一步的,所述购买行为异常,包括:购买品类、地区和票价有较大的跨度的购买行为。
黄牛现在通过真实的账号进行买票,买不同品类,不同城市,不同票价范围的多张票。需要通过订单来探索,识别出黄牛账号从下单的品类,城市,票价的范围和数量识别购买异常的账户。
进一步的,所述实时采集用户标识的当前访问行为记录中的当前用户访问频次和异常访问路径,包括:
实时读取nginx的访问日志文件并发送到日志处理系统。
访问日志实时采集。实时监控nginx的访问日志文件,一有日志写入,立即读取并发送到日志处理系统。
包括,实时监控访问日志文件,读取日志文件变化内容,发送变化内容到实时日志处理系统。
访问日志的解析。日志处理系统实时接收日志采集系统发送的日志,以一秒钟为一个计算窗口,计算IP访问频次,每个IP的访问url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问url的频次和异常访问路径,并将计算结果存储到缓存中。
包括,实时监听,接收日志消息,实时计算各种频次,并存入在线缓存。包括计算IP访问频次,计算IP+cookie+agent访问频次,计算IP+cookie+agent访问url的频次。实时记录访问url,存入在线缓存。计算IP+cookie+agent哈希化,客户的哈希值存入url列表。存储计算各种频次,存储记录的访问url。
进一步的,所述异常访问路径,包括:缺失至少一个主要访问路径的支付行为。
频次识别只能是在一定程度上识别黄牛,当黄牛拉大访问间隔,降低访问频次,就不好判定,这时候需要通过访问路径来判别,下单路径一定会通过登录,商品页的浏览,支付,如果没有这两个访问路径而只有支付路径,会判定为黄牛设备。而机器下单,为了快,绕过项目详情页,只会有下单url,且下单url频次会非常多。
本发明实施例一提供的技术方案,
通过访问频次阀值和消费购买行为阀值的确定,需要通过对历史数据的探索分析,通过统计学上的数据分布情况来确定。
访问设备的唯一性设定。通过一个哈希函数将IP+Agent+Cookie哈希化为一个全局唯一的编码作为客户设备唯一性判断。因而哈希函数是一个关键的选择。
具有实时性。使用目前最为先进的大数据实时计算技术,实时采集用户访问日志,实时计算用户访问频次,实时记录用户访问轨迹,实时诊断用户是否为黄牛。
正常用户的访问路径关键点的设定。黄牛用户抢票,一定走捷径,才能快于一般用户抢到票,所以会在访问路径上有所短缺。
购买行为异常规则设定。一般用户都会有自己的偏好,购买的范围是有一定规律和界限的,跨度不会很大。而黄牛不以盈利为目的,会对多个项目的进行刷票,表现购买品类,城市和票价都有较大的跨度。通过对数据进行探索,挖掘,找出这些规律,设定规则,从而识别出异常账号和手机号。
本发明实施例一通过将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。确定识别黄牛的各种阀值,为判别黄牛提供数据判断依据。实时记录用户的行为特征(频次和轨迹),能够为实时黄牛拦截提供实时依据;能够建立黑名单,能够基于黑名单,提前拦截黄牛,使资源的分配更具合理性和公平性。
实施例二
本发明实施例二提供了一种网络购票异常行为的识别系统200,如图2所示,包括:
标识模块21,用于将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
提取模块22,用于提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性。
识别模块23,用于识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
进一步的,如图3所示,所述标识模块21,包括:
标识单元211,用于通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
进一步的,如图4所示,所述识别模块23,包括:
识别单元231,用于识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
第一黑名单单元232,用于通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
进一步的,如图5所示,所述提取模块22,包括:
第一提取单元221,用于提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单;
第二提取单元222,用于提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单;
采集单元223,用于实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
进一步的,如图6所示,所述第一提取单元221,包括:
第一收集单元2211,用于将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
第一计算单元2212,用于在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
第一存储单元2213,用于使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值;
第二收集单元2214,用于将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
第二计算单元2215,用于在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
第二存储单元2216,用于基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
进一步的,如图7所示,所述第二提取单元222,包括:
第一导入单元2221,用于导入历史交易行为记录到数据仓库中;
第三计算单元2222,用于计算每个用户IP的单场次购票数,购买项目数,平均购票数;
第三存储单元2223,用于使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
第二导入单元2224,用于导入前一天所有交易记录和至少一年的交易记录到数据仓库中;
第四计算单元2225,用于计算每个用户IP一年之内的单场次购票数,购买项目数,平均购票数;使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值;
第四存储单元2226,用于基于确定的潜在的购买行为异常阀值和频次计算结果,识别出超出购买行为异常阀值的异常注册用户,存入到黑名单表中。
进一步的,所述购买行为异常,包括:购买品类、地区和票价有较大的跨度的购买行为。
进一步的,如图8所示,所述采集单元223,包括:
读取单元2231,用于实时读取nginx的访问日志文件并发送到日志处理系统;
第五计算单元2232,用于在日志处理系统实时接收日志采集系统发送的日志,以一秒钟为一个计算窗口,计算IP访问频次,每个IP的访问url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问url的频次和异常访问路径,并将计算结果存储到缓存中。
进一步的,所述异常访问路径,包括:缺失至少一个主要访问路径的支付行为。
具体实现的功能和处理方式参见方法实施例一描述的具体步骤。
由于本实施例二的系统所实现的处理及功能基本相应于前述图1所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
本发明实施例二通过标识模块用于将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;提取模块提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;识别模块识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。确定识别黄牛的各种阀值,为判别黄牛提供数据判断依据。实时记录用户的行为特征(频次和轨迹),能够为实时黄牛拦截提供实时依据;能够建立黑名单,能够基于黑名单,提前拦截黄牛,使资源的分配更具合理性和公平性。
实施例三
本发明实施例三提供了一种网络购票异常行为的识别设备300,如图9所示,包括:实施例二所述的任一项所述的系统200。
本发明实施例三通过将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。确定识别黄牛的各种阀值,为判别黄牛提供数据判断依据。实时记录用户的行为特征(频次和轨迹),能够为实时黄牛拦截提供实时依据;能够建立黑名单,能够基于黑名单,提前拦截黄牛,使资源的分配更具合理性和公平性。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
需要指出,根据实施的需要,可将本申请中描述的各个步骤/部件拆分为更多步骤/部件,也可将两个或多个步骤/部件或者步骤/部件的部分操作组合成新的步骤/部件,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (21)

1.一种网络购票异常行为的识别方法,其特征在于,包括:
将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;
提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;
识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
2.如权利要求1所述的方法,其特征在于,所述将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识,包括:
通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
3.如权利要求1或2所述的方法,其特征在于,所述识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离,包括:
识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
4.如权利要求1-3之一所述的方法,其特征在于,所述提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性,包括:
提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单;
提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单;
实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
5.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史行为记录中的历史频次阀值,包括以下步骤:
将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值。
6.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史行为记录中的历史黑名单,包括以下步骤:
将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;
将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
7.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值,包括以下步骤:
导入历史交易行为记录到数据仓库中;
计算每个用户IP的单场次购票数,购买项目数,平均购票数;
使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
8.如权利要求4所述的方法,其特征在于,所述提取所述用户标识中的历史交易行为记录中超出购买行为异常阀值的异常注册用户的黑名单,包括以下步骤:
导入前一天所有交易记录和至少一年的交易记录到数据仓库中;
计算每个用户IP一年之内的单场次购票数,购买项目数,平均购票数;使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值;
基于确定的潜在的购买行为异常阀值和频次计算结果,识别出超出购买行为异常阀值的异常注册用户,存入到黑名单表中。
9.如权利要求7或8所述的方法,其特征在于,所述购买行为异常,包括:购买品类、地区和票价有较大的跨度的购买行为。
10.如权利要求4所述的方法,其特征在于,所述实时采集用户标识的当前访问行为记录中的当前用户访问频次和异常访问路径,包括:
实时读取nginx的访问日志文件并发送到日志处理系统;
日志处理系统实时接收日志采集系统发送的日志,以一秒钟为一个计算窗口,计算IP访问频次,每个IP的访问url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问url的频次和异常访问路径,并将计算结果存储到缓存中。
11.如权利要求10所述的方法,其特征在于,所述异常访问路径,包括:缺失至少一个主要访问路径的支付行为。
12.一种网络购票异常行为的识别系统,其特征在于,包括:
标识模块,用于将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识;
提取模块,用于提取所述用户标识的历史网络购票行为记录和实时网络购票行为记录中的网络购票行为属性;
识别模块,用于识别所述网络购票行为属性中的异常行为属性的用户IP,将所述异常行为属性的用户IP存入黑名单进行隔离。
13.如权利要求12所述的系统,其特征在于,所述标识模块,包括:
标识单元,用于通过哈希函数将网络购票行为记录中的用户IP、Cookie和访问代理环境Agent哈希化为一个全局唯一的编码字符串IP+Cookie+Agent,形成唯一用户标识。
14.如权利要求12或13所述的系统,其特征在于,所述识别模块,包括:
识别单元,用于识别所述网络购票行为属性中的频次阀值和黑名单,所述频次阀值包括但不限于:不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
第一黑名单单元,用于通过所述频次阀值和黑名单识别出异常行为的用户IP,将所述识别出的用户IP存入黑名单进行隔离。
15.如权利要求12-14之一所述的系统,其特征在于,所述提取模块,包括:
第一提取单元,用于提取所述用户标识中的历史行为记录中的历史频次阀值和历史黑名单;
第二提取单元,用于提取所述用户标识中的历史交易行为记录中存在潜在的购买行为异常阀值和超出购买行为异常阀值的异常注册用户的黑名单;
采集单元,用于实时采集用户标识的当前访问行为记录中的当前用户访问频次和路径。
16.如权利要求15所述的系统,其特征在于,所述第一提取单元,包括:
第一收集单元,用于将历史行为记录中的日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
第一计算单元,用于在数据表中,计算访问频次,并将计算结果存入大数据数仓中;所述访问频次包括但不限于不同IP访问频次、每个IP的访问不同url的频次、IP+cookie+agent访问频次或IP+cookie+agent访问不同url的频次中的一种或多种;
第一存储单元,用于使用直方图,观察频次分布,自定义确定历史频次阀值并存储所述历史频次阀值;
第二收集单元,用于将ngnix代理服务器集群中不同的服务器上的前一天的用户访问日志文件集中到分布式存储系统HDFS上;将日志文件内容载入到大数据数仓Hive中,在Hive中建立日志文件格式化数据表,将日志文件内容格式化到数据表中;
第二计算单元,用于在Hive中,计算不同IP访问频次,每个IP的访问不同url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问不同url的频次;将计算结果存入大数据数仓中;使用直方图,观察频次分布,自定义确定历史频次阀值;
第二存储单元,用于基于确定的历史频次阀值和频次计算结果,识别出异常的客户,存入到黑名单表中。
17.如权利要求15所述的系统,其特征在于,所述第二提取单元,包括:
第一导入单元,用于导入历史交易行为记录到数据仓库中;
第三计算单元,用于计算每个用户IP的单场次购票数,购买项目数,平均购票数;
第三存储单元,用于使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值,并存储所述存在潜在的购买行为异常阀值。
第二导入单元,用于导入前一天所有交易记录和至少一年的交易记录到数据仓库中;
第四计算单元,用于计算每个用户IP一年之内的单场次购票数,购买项目数,平均购票数;使用直方图,观察单场次购票数,购买项目数,平均购票数分布,根据自定义规则分析确定存在潜在的购买行为异常阀值;
第四存储单元,用于基于确定的潜在的购买行为异常阀值和频次计算结果,识别出超出购买行为异常阀值的异常注册用户,存入到黑名单表中。
18.如权利要求17所述的系统,其特征在于,所述购买行为异常,包括:购买品类、地区和票价有较大的跨度的购买行为。
19.如权利要求15所述的系统,其特征在于,所述采集单元,包括:
读取单元,用于实时读取nginx的访问日志文件并发送到日志处理系统;
第五计算单元,用于在日志处理系统实时接收日志采集系统发送的日志,以一秒钟为一个计算窗口,计算IP访问频次,每个IP的访问url的频次,IP+cookie+agent访问频次,IP+cookie+agent访问url的频次和异常访问路径,并将计算结果存储到缓存中。
20.如权利要求19所述的系统,其特征在于,所述异常访问路径,包括:缺失至少一个主要访问路径的支付行为。
21.一种网络购票异常行为的识别设备,包括如权利要求12-19任一项所述的系统。
CN201610943260.1A 2016-11-01 2016-11-01 一种网络购票异常行为的识别方法、系统及设备 Pending CN106453357A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610943260.1A CN106453357A (zh) 2016-11-01 2016-11-01 一种网络购票异常行为的识别方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610943260.1A CN106453357A (zh) 2016-11-01 2016-11-01 一种网络购票异常行为的识别方法、系统及设备

Publications (1)

Publication Number Publication Date
CN106453357A true CN106453357A (zh) 2017-02-22

Family

ID=58177563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610943260.1A Pending CN106453357A (zh) 2016-11-01 2016-11-01 一种网络购票异常行为的识别方法、系统及设备

Country Status (1)

Country Link
CN (1) CN106453357A (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107046550A (zh) * 2017-06-14 2017-08-15 微梦创科网络科技(中国)有限公司 一种异常登录行为的检测方法及装置
CN107147621A (zh) * 2017-04-20 2017-09-08 微医集团(浙江)有限公司 互联网医疗黄牛风险控制的实现方法
CN107194486A (zh) * 2017-06-16 2017-09-22 北京微影时代科技有限公司 一种异常座位数据处理的方法及装置
CN107886007A (zh) * 2017-11-29 2018-04-06 深圳市茁壮网络股份有限公司 一种异常购票行为处理方法及装置
CN108052824A (zh) * 2017-12-25 2018-05-18 北京奇艺世纪科技有限公司 一种风险防控方法、装置及电子设备
CN108156166A (zh) * 2017-12-29 2018-06-12 百度在线网络技术(北京)有限公司 异常访问识别和接入控制方法及装置
CN108156141A (zh) * 2017-12-14 2018-06-12 北京奇艺世纪科技有限公司 一种实时数据识别方法、装置及电子设备
CN108346088A (zh) * 2018-02-09 2018-07-31 上海宝尊电子商务有限公司 品牌官方商城恶意抢购防控方法及系统
TWI638319B (zh) * 2017-08-25 2018-10-11 拓元股份有限公司 網路購票系統
CN109215794A (zh) * 2017-07-05 2019-01-15 东软集团股份有限公司 异常用户的识别方法及装置、存储介质、电子设备
CN109493111A (zh) * 2018-09-28 2019-03-19 中国平安人寿保险股份有限公司 抽奖数据处理方法、装置及存储介质、服务器
CN109657148A (zh) * 2018-12-24 2019-04-19 北京百度网讯科技有限公司 针对上报poi的异常操作识别方法、装置、服务器和介质
CN110213169A (zh) * 2018-02-28 2019-09-06 北京红马传媒文化发展有限公司 资源锁定方法、装置及电子设备
CN110322573A (zh) * 2018-03-30 2019-10-11 北京红马传媒文化发展有限公司 用户验证方法、用户验证装置和电子设备
CN110322028A (zh) * 2018-03-29 2019-10-11 北京红马传媒文化发展有限公司 资源管理方法、装置及电子设备
CN110427971A (zh) * 2019-07-05 2019-11-08 五八有限公司 用户及ip的识别方法、装置、服务器和存储介质
CN110675228A (zh) * 2019-09-27 2020-01-10 支付宝(杭州)信息技术有限公司 用户购票行为检测方法以及装置
CN110751536A (zh) * 2019-09-28 2020-02-04 同程网络科技股份有限公司 一种风险控制方法及系统
CN110795706A (zh) * 2019-10-22 2020-02-14 武汉极意网络科技有限公司 基于哈希的验证方法、设备、存储介质及装置
CN110889745A (zh) * 2019-11-22 2020-03-17 无线生活(北京)信息技术有限公司 一种智能识别抢购行为的方法及装置
CN111241541A (zh) * 2019-12-04 2020-06-05 珠海横琴电享科技有限公司 一种根据请求数据防爬虫系统和方法
CN111292099A (zh) * 2020-02-13 2020-06-16 广东工业大学 一种智能车站反刷票方法和反刷票系统
CN111598162A (zh) * 2020-05-14 2020-08-28 万达信息股份有限公司 一种黄牛风险监测方法、终端设备和存储介质
CN111723361A (zh) * 2019-03-21 2020-09-29 北京京东尚科信息技术有限公司 一种恶意用户拦截方法和系统
WO2020210976A1 (en) * 2019-04-16 2020-10-22 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for detecting anomaly
CN112184315A (zh) * 2020-09-29 2021-01-05 深圳市尊信网络科技有限公司 识别异常购彩行为的方法、装置、设备和存储介质
CN114885006A (zh) * 2022-05-10 2022-08-09 四川封面传媒科技有限责任公司 基于综合特征识别真实用户的方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6496824B1 (en) * 1999-02-19 2002-12-17 Saar Wilf Session management over a stateless protocol
US20040210485A1 (en) * 2003-04-18 2004-10-21 Luo Sheng Chi Quoting strategy analysis system and method
CN102413013A (zh) * 2011-11-21 2012-04-11 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置
CN102469117A (zh) * 2010-11-08 2012-05-23 中国移动通信集团广东有限公司 一种异常访问行为的识别方法及装置
CN103065089A (zh) * 2012-12-11 2013-04-24 深信服网络科技(深圳)有限公司 网页木马的检测方法和装置
CN103297435A (zh) * 2013-06-06 2013-09-11 中国科学院信息工程研究所 一种基于web日志的异常访问行为检测方法与系统
CN103354550A (zh) * 2013-07-03 2013-10-16 杭州华三通信技术有限公司 一种基于终端信息进行权限控制的方法及装置
CN103853948A (zh) * 2012-11-28 2014-06-11 阿里巴巴集团控股有限公司 用户身份的识别、信息的过滤及搜索方法和服务器
CN104052720A (zh) * 2013-03-14 2014-09-17 北京百度网讯科技有限公司 信息验证方法及系统
CN104268378A (zh) * 2014-09-12 2015-01-07 北京邮电大学 一种基于移动用户大数据的异常行为可视化监控方法
CN105072089A (zh) * 2015-07-10 2015-11-18 中国科学院信息工程研究所 一种web恶意扫描行为异常检测方法与系统
CN105468742A (zh) * 2015-11-25 2016-04-06 小米科技有限责任公司 恶意订单识别方法及装置
CN105654303A (zh) * 2015-12-31 2016-06-08 拉扎斯网络科技(上海)有限公司 一种高风险用户识别方法及装置
CN105956911A (zh) * 2016-05-23 2016-09-21 北京小米移动软件有限公司 购买请求处理方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6496824B1 (en) * 1999-02-19 2002-12-17 Saar Wilf Session management over a stateless protocol
US20040210485A1 (en) * 2003-04-18 2004-10-21 Luo Sheng Chi Quoting strategy analysis system and method
CN102469117A (zh) * 2010-11-08 2012-05-23 中国移动通信集团广东有限公司 一种异常访问行为的识别方法及装置
CN102413013A (zh) * 2011-11-21 2012-04-11 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置
CN103853948A (zh) * 2012-11-28 2014-06-11 阿里巴巴集团控股有限公司 用户身份的识别、信息的过滤及搜索方法和服务器
CN103065089A (zh) * 2012-12-11 2013-04-24 深信服网络科技(深圳)有限公司 网页木马的检测方法和装置
CN104052720A (zh) * 2013-03-14 2014-09-17 北京百度网讯科技有限公司 信息验证方法及系统
CN103297435A (zh) * 2013-06-06 2013-09-11 中国科学院信息工程研究所 一种基于web日志的异常访问行为检测方法与系统
CN103354550A (zh) * 2013-07-03 2013-10-16 杭州华三通信技术有限公司 一种基于终端信息进行权限控制的方法及装置
CN104268378A (zh) * 2014-09-12 2015-01-07 北京邮电大学 一种基于移动用户大数据的异常行为可视化监控方法
CN105072089A (zh) * 2015-07-10 2015-11-18 中国科学院信息工程研究所 一种web恶意扫描行为异常检测方法与系统
CN105468742A (zh) * 2015-11-25 2016-04-06 小米科技有限责任公司 恶意订单识别方法及装置
CN105654303A (zh) * 2015-12-31 2016-06-08 拉扎斯网络科技(上海)有限公司 一种高风险用户识别方法及装置
CN105956911A (zh) * 2016-05-23 2016-09-21 北京小米移动软件有限公司 购买请求处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
齐亚风: ""技术黄牛"秒杀12306防御?", 《北京科技报》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147621A (zh) * 2017-04-20 2017-09-08 微医集团(浙江)有限公司 互联网医疗黄牛风险控制的实现方法
CN107147621B (zh) * 2017-04-20 2020-04-07 微医集团(浙江)有限公司 互联网医疗黄牛风险控制的实现方法
CN107046550A (zh) * 2017-06-14 2017-08-15 微梦创科网络科技(中国)有限公司 一种异常登录行为的检测方法及装置
CN107046550B (zh) * 2017-06-14 2020-07-07 微梦创科网络科技(中国)有限公司 一种异常登录行为的检测方法及装置
CN107194486A (zh) * 2017-06-16 2017-09-22 北京微影时代科技有限公司 一种异常座位数据处理的方法及装置
CN109215794A (zh) * 2017-07-05 2019-01-15 东软集团股份有限公司 异常用户的识别方法及装置、存储介质、电子设备
TWI638319B (zh) * 2017-08-25 2018-10-11 拓元股份有限公司 網路購票系統
CN107886007A (zh) * 2017-11-29 2018-04-06 深圳市茁壮网络股份有限公司 一种异常购票行为处理方法及装置
CN107886007B (zh) * 2017-11-29 2021-06-11 深圳市茁壮网络股份有限公司 一种异常购票行为处理方法及装置
CN108156141A (zh) * 2017-12-14 2018-06-12 北京奇艺世纪科技有限公司 一种实时数据识别方法、装置及电子设备
CN108052824A (zh) * 2017-12-25 2018-05-18 北京奇艺世纪科技有限公司 一种风险防控方法、装置及电子设备
CN108052824B (zh) * 2017-12-25 2020-06-19 北京奇艺世纪科技有限公司 一种风险防控方法、装置及电子设备
CN108156166A (zh) * 2017-12-29 2018-06-12 百度在线网络技术(北京)有限公司 异常访问识别和接入控制方法及装置
CN108346088A (zh) * 2018-02-09 2018-07-31 上海宝尊电子商务有限公司 品牌官方商城恶意抢购防控方法及系统
CN110213169A (zh) * 2018-02-28 2019-09-06 北京红马传媒文化发展有限公司 资源锁定方法、装置及电子设备
CN110322028A (zh) * 2018-03-29 2019-10-11 北京红马传媒文化发展有限公司 资源管理方法、装置及电子设备
CN110322573A (zh) * 2018-03-30 2019-10-11 北京红马传媒文化发展有限公司 用户验证方法、用户验证装置和电子设备
CN109493111A (zh) * 2018-09-28 2019-03-19 中国平安人寿保险股份有限公司 抽奖数据处理方法、装置及存储介质、服务器
CN109657148B (zh) * 2018-12-24 2020-10-13 北京百度网讯科技有限公司 针对上报poi的异常操作识别方法、装置、服务器和介质
CN109657148A (zh) * 2018-12-24 2019-04-19 北京百度网讯科技有限公司 针对上报poi的异常操作识别方法、装置、服务器和介质
CN111723361A (zh) * 2019-03-21 2020-09-29 北京京东尚科信息技术有限公司 一种恶意用户拦截方法和系统
WO2020210976A1 (en) * 2019-04-16 2020-10-22 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for detecting anomaly
CN113711559B (zh) * 2019-04-16 2023-09-29 北京嘀嘀无限科技发展有限公司 检测异常的系统和方法
CN113711559A (zh) * 2019-04-16 2021-11-26 北京嘀嘀无限科技发展有限公司 检测异常的系统和方法
CN110427971A (zh) * 2019-07-05 2019-11-08 五八有限公司 用户及ip的识别方法、装置、服务器和存储介质
CN110675228A (zh) * 2019-09-27 2020-01-10 支付宝(杭州)信息技术有限公司 用户购票行为检测方法以及装置
CN110751536A (zh) * 2019-09-28 2020-02-04 同程网络科技股份有限公司 一种风险控制方法及系统
CN110795706A (zh) * 2019-10-22 2020-02-14 武汉极意网络科技有限公司 基于哈希的验证方法、设备、存储介质及装置
CN110889745A (zh) * 2019-11-22 2020-03-17 无线生活(北京)信息技术有限公司 一种智能识别抢购行为的方法及装置
CN111241541A (zh) * 2019-12-04 2020-06-05 珠海横琴电享科技有限公司 一种根据请求数据防爬虫系统和方法
CN111292099A (zh) * 2020-02-13 2020-06-16 广东工业大学 一种智能车站反刷票方法和反刷票系统
CN111292099B (zh) * 2020-02-13 2023-04-25 广东工业大学 一种智能车站反刷票方法和反刷票系统
CN111598162A (zh) * 2020-05-14 2020-08-28 万达信息股份有限公司 一种黄牛风险监测方法、终端设备和存储介质
CN112184315A (zh) * 2020-09-29 2021-01-05 深圳市尊信网络科技有限公司 识别异常购彩行为的方法、装置、设备和存储介质
CN114885006A (zh) * 2022-05-10 2022-08-09 四川封面传媒科技有限责任公司 基于综合特征识别真实用户的方法

Similar Documents

Publication Publication Date Title
CN106453357A (zh) 一种网络购票异常行为的识别方法、系统及设备
CN110223168B (zh) 一种基于企业关系图谱的标签传播反欺诈检测方法及系统
CN106022834B (zh) 广告反作弊方法及装置
CN106657007A (zh) 识别基于dbscan模型的非正常批量购票行为的方法
CN104915879B (zh) 基于金融数据的社会关系挖掘的方法及装置
CN106776781B (zh) 一种人群关系网络分析方法及装置
CN103678659A (zh) 一种基于随机森林算法的电子商务网站欺诈用户识别方法及系统
CN108780479A (zh) 用于对异常进行检测和评分的系统和方法
CN104834641B (zh) 网络媒介信息的处理方法和相关系统
CN106897930A (zh) 一种信用评估的方法及装置
CN105069654A (zh) 一种基于用户识别的网站实时/非实时营销投放方法及系统
CN103853948A (zh) 用户身份的识别、信息的过滤及搜索方法和服务器
CN107665444A (zh) 一种基于用户在线行为的网络广告即时效应评价方法及系统
CN109242553A (zh) 一种用户行为数据推荐方法、服务器及计算机可读介质
CN107818334A (zh) 一种移动互联网用户访问模式表征和聚类方法
CN110060087B (zh) 异常数据的检测方法、装置和服务器
CN108021651A (zh) 一种网络舆情风险评估方法及装置
CN103853839A (zh) 一种评测广告页面恶意点击疑似度的方法及装置
CN108416630A (zh) 一种目标受众的确定方法及装置
CN105787744A (zh) 一种基于购物需求的抗攻击信誉评价计算方法
CN108197795A (zh) 恶意团体账户识别方法、装置、终端及存储介质
CN114297448A (zh) 基于智慧防疫大数据识别的证照申办方法、系统及介质
CN109919667B (zh) 一种用于识别企业ip的方法和装置
CN114782051A (zh) 基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法
CN115456745A (zh) 小微企业画像构建方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222