CN107092660A - 一种网站服务器爬虫识别方法和装置 - Google Patents
一种网站服务器爬虫识别方法和装置 Download PDFInfo
- Publication number
- CN107092660A CN107092660A CN201710191636.2A CN201710191636A CN107092660A CN 107092660 A CN107092660 A CN 107092660A CN 201710191636 A CN201710191636 A CN 201710191636A CN 107092660 A CN107092660 A CN 107092660A
- Authority
- CN
- China
- Prior art keywords
- access
- reptile
- user
- request
- access request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明属于互联网领域,特别涉及网站服务器爬虫识别方法和装置,流程为:依据用户IP地址对访问用户进行标记;对用户访问请求进行划分,将用户访问请求中请求资源、请求域名、子域名、访问路径相同的用户访问请求归为相同类型的访问请求;依据每类访问请求的资源类型划分出核心资源访问请求;依据访问用户的核心资源访问请求的请求时间连续性、请求内容连续性、访问持续时间、访问频度进行爬虫访问判断;将判断为爬虫访问的用户进行处理。本发明通过多种手段有效识别用户的爬虫行为,实现成本低,与网站业务耦合度较低,可移植性性强;独立于网站业务服务器逻辑,易于升级更新,运维成本和技术风险较低。
Description
技术领域
本发明涉及互联网领域,具体涉及一种网站服务器爬虫识别方法和装置。
背景技术
目前互联网应用十分繁荣。网络爬虫程序会占用被爬网站服务器的宝贵带宽和计算资源,另外随着大数据技术兴起,网站数据和内容资源也日趋成为网站服务商的核心资产。如何从海量的普通用户访问请求中,有效识别爬虫机器人程序的数据爬取行为,已成为各大网站急需解决的主要技术问题之一。
目前已有反爬虫工作,往往是每个网站开发商各自为战,根据自己的业务特点,将反爬虫内置到业务服务器里。但是这一方面增加了各个网站的技术和业务成本,另一方面这样的技术方法往往跟网站具体业务耦合度太高,不具备可移植性。
另外,即便将反爬虫逻辑跟网站业务服务器逻辑耦合,还会导致反爬技术改进升级的麻烦,不能有效的应对新的爬虫技术和情况。如果因为反爬逻辑升级而重新部署服务器逻辑,又会提高网站运维成本和提高技术风险。
发明内容
本发明的目的在于:本发明的目的在于提供一种网站服务器爬虫识别方法和装置,来区分正常用户访问和爬虫程序访问,解决网络爬虫程序对一般网站服务器的数据采集和计算资源占用问题。
本发明采用的技术方案如下:
一种网站服务器爬虫识别方法,包括以下步骤:
S1:依据用户IP地址对访问用户进行标记;
S2:对用户访问请求进行划分,将用户访问请求中请求资源、请求域名、子域名、访问路径相同的用户访问请求归为相同类型的访问请求;
S3:依据每类访问请求的资源类型划分出核心资源访问请求;
S4:对访问用户的核心资源访问请求进行连续性判断,对非连续性访问判断为非爬虫访问,对连续性访问继续进行下一步;
S5:依据访问用户的核心资源访问请求的内容连续性、访问持续时间、访问频度进行爬虫访问判断;
S6:将判断为爬虫访问的用户进行处理。
进一步的,所述核心资源访问请求划分方法为:请求资源类型为展示数据内容的协议请求为核心资源访问请求。如请求资源类型为html,xml,json等涉及展示数据内容的协议请求为核心资源访问请求,相应的,请求资源类型为CSS,JS的访问请求,非核心资源访问请求。
进一步的,所述连续访问判断为:
设定连续访问阈值,当访问用户的相邻两次核心资源访问请求的时间小于连续访问阈值时判定用户为连续性访问。
进一步的,所述内容连续性的爬虫访问判断方法为:
对时间连续的访问,依据当前访问用户的核心资源访问请求协议标记的前次核心资源访问请求地址进行判断,如前次核心资源访问请求地址为非网站主地址URL和非历史访问地址URL,则判定访问用户的行为为爬虫访问。
进一步的,所述访问持续时间的爬虫访问判断方法为:
对时间连续的访问,依据访问用户的核心资源访问请求的访问持续时间,设定持续访问阈值,当访问持续时间超过持续访问阈值时判定访问用户的行为为爬虫访问。
进一步的,所述访问频度的爬虫访问判断步骤为:
S11:设定时间周期T1,统计每时间周期T1相同类型的核心资源访问请求频度为:
F=NCR/T1
其中,NCR指的是在时间周期T1内时间连续的同类型核心资源访问请求的访问次数;
S12:对用户每种同类型核心资源访问请求的连续请求,获取其最近N次的访问频度值组[F1,F2,F3,…FN],随机抽取访问频度值中任一值作为基准值Fy;
S13:依据Fy计算频度判定值Fs=Fy±σ(σ=φFy);其中φ为误差因子;
S14:判断访问频度值中除基准值Fy外的其它N-1个访问频度值是否满足范围[Fy-σ,Fy+σ],当N-1个访问频度值全部满足范围时,通过设定频度阈值Fz,当基准值Fy大于频度阈值Fz时判定用户访问为爬虫访问。
进一步的,对判定有爬虫访问的用户处理方法为:
依据网站预设策略,可以断开当前用户连接,并在设定的禁止访问时间段内禁止用户的IP对该网站的访问,也可以投递该访问给业务服务器,修改协议头增加爬虫标记字段,由业务服务器侧处理。
进一步的,所述爬虫访问判定的次序为:内容连续性判定、访问频度判定、访问持续时间判定。
一种网站服务器爬虫识别的装置,包括:
来访用户标记模块:对每个来访用户,根据其I P地址进行唯一的标记;
用户参数采集统计模块:对每个用户每个同类型访问标记其访问时间和记录访问请求头,进而标记核心访问内容、时间、频度;
爬虫用户识别模块:依据用户参数采集统计模块的数据对访问用户的核心资源访问请求的请求时间连续性、请求内容连续性、访问持续时间、访问频度进行爬虫访问判断;
爬虫用户处理模块:对认定为爬虫程序的访问按网站预设策略进行处理,包括:断开访问链接并禁止在设定时间内访问或传递给业务服务器,修改协议头增加爬虫标记字段,由网站服务器侧处理。
进一步的,所述装置前置于网站服务器端。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、能够有效识别网络爬虫访问行为,并根据用户设定策略处理,防止爬虫访问耗费网站资源,对网站系统接入能力造成影响。
2、通过多种手段有效识别用户的爬虫行为,实现成本低,与网站业务耦合度较低,可移植性性强。
3、独立于网站业务服务器逻辑,易于升级更新,运维成本和技术风险较低。
4、对判别为爬虫的请求处理灵活,可以根据根据业务服务器需求调整配置。
附图说明
图1为本发明提供的算法过程流程图。
图2为本发明提供的装置原理图。
图3为本发明提供的算法过程流程实施例图。
图4为本发明提供的装置安装原理图。
具体实施方式
本说明书中公开的所有特征,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面结合附图对本发明作详细说明。
如图3所示,本发明的一种实施流程为:
S10.用来访用户I P地址标记来访用户C1;
S11.根据用户请求完整路径、请求资源类型,区分同类型请求访问;
S12.根据访问类型是否页面或数据,分离出核心访问请求CR1,记录其来访时戳TR1;
S13.判断同类型核心访问连续性:计算两个连续访问时间间隔t=TR2-TR1,若t小于给定间隔ST2,认定为连续访问,继续下一步,否则直接判定为非爬虫访问,直接透传请求协议;
S14.对任意一种连续的核心访问,访问请求refer参数异常,则判断为爬虫访问;refer参数正常时继续下一步;
S15.计算每隔给定时间T1,任意一种相同类型的连续的核心访问CR1的访问频率F;其中,
F=NCR/T1;
S16.对任意一种相同类型的连续的核心访问,如果访问频率稳定,且大于给定值SF1,则判断为爬虫访问,否则直接下一步;其中访问频率稳定判定方法为:
对用户每种同类型核心资源访问请求的连续请求,获取其最近N次的访问频度值组[F1,F2,F3,…FN],随机抽取访问频度值中任一值作为基准值Fy;依据Fy计算频度判定值Fs=Fy±σ(σ=φFy);其中φ为误差因子;判断访问频度值中除基准值Fy外的其它N-1个访问频度值是否满足范围[Fy-σ,Fy+σ],当N-1个访问频度值全部满足范围时,访问频率稳定;
S17.对各种核心访问,如果其访问持续的时间超过指定值ST2,则判断为爬虫访问;判定为非爬虫访问直接透传请求协议。
对爬虫访问,按照设置规则进行处理,包括:依据断开当前用户连接,可以断开当前用户连接,并在设定的禁止访问时间段内禁止用户的IP对该网站的访问,也可以投递该访问给业务服务器,修改协议头增加爬虫标记字段,由业务服务器侧处理。
如图2所示,一种网站服务器爬虫识别的装置,其特征在于,包括:
来访用户标记模块:对每个来访用户,根据其IP地址进行唯一的标记;
用户参数采集统计模块:对每个用户每个同类型访问标记其访问时间和记录访问请求头,进而标记核心访问内容、时间、频度;
爬虫用户识别模块:依据用户参数采集统计模块的数据对访问用户的核心资源访问请求的请求时间连续性、请求内容连续性、访问持续时间、访问频度进行爬虫访问判断;
爬虫用户处理模块:对认定为爬虫程序的访问按网站预设策略进行处理,包括:断开访问链接并禁止在设定时间内访问或传递给业务服务器,修改协议头增加爬虫标记字段,由网站服务器侧处理。
如图4所示,所述装置前置于网站服务器端。
Claims (10)
1.一种网站服务器爬虫识别方法,其特征在于,包括以下步骤:
S1:依据用户IP地址对访问用户进行标记;
S2:对用户访问请求进行划分,将用户访问请求中请求资源、请求域名、子域名、访问路径相同的用户访问请求归为相同类型的访问请求;
S3:依据每类访问请求的资源类型划分出核心资源访问请求;
S4:对访问用户的核心资源访问请求进行连续性判断,对非连续性访问判断为非爬虫访问,对连续性访问继续进行下一步;
S5:依据访问用户的核心资源访问请求的内容连续性、访问持续时间、访问频度进行爬虫访问判断;
S6:将判断为爬虫访问的用户进行处理。
2.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,所述核心资源访问请求划分方法为:请求资源类型为展示数据内容的协议请求为核心资源访问请求。
3.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,所述连续访问判断为:
设定连续访问阈值,当访问用户的相邻两次核心资源访问请求的时间小于连续访问阈值时判定用户为连续性访问。
4.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,所述内容连续性的爬虫访问判断方法为:
对时间连续的访问,依据当前访问用户的核心资源访问请求协议标记的前次核心资源访问请求地址进行判断,如前次核心资源访问请求地址为非网站主地址URL和非历史访问地址URL,则判定访问用户的行为为爬虫访问。
5.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,所述访问持续时间的爬虫访问判断方法为:
对时间连续的访问,依据访问用户的核心资源访问请求的访问持续时间,设定持续访问阈值,当访问持续时间超过持续访问阈值时判定访问用户的行为为爬虫访问。
6.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,所述访问频度的爬虫访问判断步骤为:
S11:设定时间周期T1,统计每时间周期T1相同类型的核心资源访问请求频度为:
F=NCR/T1
其中,NCR指的是在时间周期T1内时间连续的同类型核心资源访问请求的访问次数;
S12:对用户每种同类型核心资源访问请求的连续请求,获取其最近N次的访问频度值组[F1,F2,F3,…FN],随机抽取访问频度值中任一值作为基准值Fy;
S13:依据Fy计算频度判定值Fs=Fy±σ(σ=φFy);其中φ为误差因子;
S14:判断访问频度值中除基准值Fy外的其它N-1个访问频度值是否满足范围[Fy-σ,Fy+σ],当N-1个访问频度值全部满足范围时,通过设定频度阈值Fz,当基准值Fy大于频度阈值Fz时判定用户访问为爬虫访问。
7.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,对判定有爬虫访问的用户处理方法为:
依据网站预设策略,可以断开当前用户连接,并在设定的禁止访问时间段内禁止用户的IP对该网站的访问,也可以投递该访问给业务服务器,修改协议头增加爬虫标记字段,由业务服务器侧处理。
8.根据权利要求1所述的一种网站服务器爬虫识别方法,其特征在于,所述爬虫访问判定的次序为:内容连续性判定、访问频度判定、访问持续时间判定。
9.一种网站服务器爬虫识别的装置,其特征在于,包括:
来访用户标记模块:对每个来访用户,根据其IP地址进行唯一的标记;
用户参数采集统计模块:对每个用户每个同类型访问标记其访问时间和记录访问请求头,进而标记核心访问内容、时间、频度;
爬虫用户识别模块:依据用户参数采集统计模块的数据对访问用户的核心资源访问请求的请求时间连续性、请求内容连续性、访问持续时间、访问频度进行爬虫访问判断;
爬虫用户处理模块:对认定为爬虫程序的访问按网站预设策略进行处理,包括:断开访问链接并禁止在设定时间内访问或传递给业务服务器,修改协议头增加爬虫标记字段,由网站服务器侧处理。
10.根据权利要求1所述的一种网站服务器爬虫识别的装置,其特征在于,所述装置前置于网站服务器端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710191636.2A CN107092660A (zh) | 2017-03-28 | 2017-03-28 | 一种网站服务器爬虫识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710191636.2A CN107092660A (zh) | 2017-03-28 | 2017-03-28 | 一种网站服务器爬虫识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107092660A true CN107092660A (zh) | 2017-08-25 |
Family
ID=59649009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710191636.2A Pending CN107092660A (zh) | 2017-03-28 | 2017-03-28 | 一种网站服务器爬虫识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107092660A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107818179A (zh) * | 2017-11-23 | 2018-03-20 | 成都知道创宇信息技术有限公司 | 一种基于信息量理论的爬虫识别方法 |
CN107943949A (zh) * | 2017-11-24 | 2018-04-20 | 厦门集微科技有限公司 | 一种确定网络爬虫的方法及服务器 |
CN108062256A (zh) * | 2017-11-10 | 2018-05-22 | 中国民生银行股份有限公司 | 一种应用程序的访问方法和装置 |
CN108228864A (zh) * | 2018-01-12 | 2018-06-29 | 深圳壹账通智能科技有限公司 | 网络爬虫识别方法、装置、计算机设备和存储介质 |
CN108429785A (zh) * | 2018-01-17 | 2018-08-21 | 广东智媒云图科技股份有限公司 | 一种爬虫识别加密串的生成方法、爬虫识别方法及装置 |
CN108763274A (zh) * | 2018-04-09 | 2018-11-06 | 北京三快在线科技有限公司 | 访问请求的识别方法、装置、电子设备及存储介质 |
CN108777687A (zh) * | 2018-06-05 | 2018-11-09 | 掌阅科技股份有限公司 | 基于用户行为画像的爬虫拦截方法、电子设备、存储介质 |
WO2019057048A1 (zh) * | 2017-09-20 | 2019-03-28 | 北京数安鑫云信息技术有限公司 | 一种低频爬虫识别方法、装置、可读存储介质及设备 |
CN109818949A (zh) * | 2019-01-17 | 2019-05-28 | 济南浪潮高新科技投资发展有限公司 | 一种基于神经网络的反爬虫方法 |
CN110609937A (zh) * | 2019-08-15 | 2019-12-24 | 平安科技(深圳)有限公司 | 一种爬虫识别方法及装置 |
CN110647672A (zh) * | 2019-08-29 | 2020-01-03 | 北京三快在线科技有限公司 | 异常用户检测方法、装置、电子设备及可读存储介质 |
CN111125692A (zh) * | 2019-12-05 | 2020-05-08 | 任子行网络技术股份有限公司 | 反爬虫方法及装置 |
CN112073412A (zh) * | 2020-09-08 | 2020-12-11 | 北京天融信网络安全技术有限公司 | 一种反爬虫方法、装置、处理器及计算机可读介质 |
CN114036364A (zh) * | 2021-11-08 | 2022-02-11 | 北京百度网讯科技有限公司 | 用于识别爬虫的方法、装置、设备、介质和产品 |
CN116150542A (zh) * | 2023-04-21 | 2023-05-23 | 河北网新数字技术股份有限公司 | 一种动态页面的生成方法和装置及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090287641A1 (en) * | 2008-05-13 | 2009-11-19 | Eric Rahm | Method and system for crawling the world wide web |
CN103678492A (zh) * | 2013-11-13 | 2014-03-26 | 复旦大学 | 基于网络爬虫行为识别与缓冲更新策略的Web点击计数方法 |
CN105260388A (zh) * | 2015-09-11 | 2016-01-20 | 广州极数宝数据服务有限公司 | 一种分布式垂直爬虫服务系统的优化方法 |
CN105930727A (zh) * | 2016-04-25 | 2016-09-07 | 无锡中科富农物联科技有限公司 | 基于Web的爬虫识别算法 |
CN106294368A (zh) * | 2015-05-15 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 网络爬虫识别方法和装置 |
-
2017
- 2017-03-28 CN CN201710191636.2A patent/CN107092660A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090287641A1 (en) * | 2008-05-13 | 2009-11-19 | Eric Rahm | Method and system for crawling the world wide web |
CN103678492A (zh) * | 2013-11-13 | 2014-03-26 | 复旦大学 | 基于网络爬虫行为识别与缓冲更新策略的Web点击计数方法 |
CN106294368A (zh) * | 2015-05-15 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 网络爬虫识别方法和装置 |
CN105260388A (zh) * | 2015-09-11 | 2016-01-20 | 广州极数宝数据服务有限公司 | 一种分布式垂直爬虫服务系统的优化方法 |
CN105930727A (zh) * | 2016-04-25 | 2016-09-07 | 无锡中科富农物联科技有限公司 | 基于Web的爬虫识别算法 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019057048A1 (zh) * | 2017-09-20 | 2019-03-28 | 北京数安鑫云信息技术有限公司 | 一种低频爬虫识别方法、装置、可读存储介质及设备 |
CN108062256A (zh) * | 2017-11-10 | 2018-05-22 | 中国民生银行股份有限公司 | 一种应用程序的访问方法和装置 |
CN107818179A (zh) * | 2017-11-23 | 2018-03-20 | 成都知道创宇信息技术有限公司 | 一种基于信息量理论的爬虫识别方法 |
CN107818179B (zh) * | 2017-11-23 | 2021-06-18 | 成都知道创宇信息技术有限公司 | 一种基于信息量理论的爬虫识别方法 |
CN107943949A (zh) * | 2017-11-24 | 2018-04-20 | 厦门集微科技有限公司 | 一种确定网络爬虫的方法及服务器 |
CN107943949B (zh) * | 2017-11-24 | 2020-06-26 | 厦门集微科技有限公司 | 一种确定网络爬虫的方法及服务器 |
CN108228864B (zh) * | 2018-01-12 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 网络爬虫识别方法、装置、计算机设备和存储介质 |
CN108228864A (zh) * | 2018-01-12 | 2018-06-29 | 深圳壹账通智能科技有限公司 | 网络爬虫识别方法、装置、计算机设备和存储介质 |
WO2019136987A1 (zh) * | 2018-01-12 | 2019-07-18 | 深圳壹账通智能科技有限公司 | 网络爬虫识别方法、装置、计算机设备和存储介质 |
CN108429785A (zh) * | 2018-01-17 | 2018-08-21 | 广东智媒云图科技股份有限公司 | 一种爬虫识别加密串的生成方法、爬虫识别方法及装置 |
CN108763274A (zh) * | 2018-04-09 | 2018-11-06 | 北京三快在线科技有限公司 | 访问请求的识别方法、装置、电子设备及存储介质 |
CN108763274B (zh) * | 2018-04-09 | 2021-06-11 | 北京三快在线科技有限公司 | 访问请求的识别方法、装置、电子设备及存储介质 |
CN108777687A (zh) * | 2018-06-05 | 2018-11-09 | 掌阅科技股份有限公司 | 基于用户行为画像的爬虫拦截方法、电子设备、存储介质 |
CN109818949A (zh) * | 2019-01-17 | 2019-05-28 | 济南浪潮高新科技投资发展有限公司 | 一种基于神经网络的反爬虫方法 |
CN110609937A (zh) * | 2019-08-15 | 2019-12-24 | 平安科技(深圳)有限公司 | 一种爬虫识别方法及装置 |
CN110647672A (zh) * | 2019-08-29 | 2020-01-03 | 北京三快在线科技有限公司 | 异常用户检测方法、装置、电子设备及可读存储介质 |
CN110647672B (zh) * | 2019-08-29 | 2020-12-11 | 北京三快在线科技有限公司 | 异常用户检测方法、装置、电子设备及可读存储介质 |
CN111125692A (zh) * | 2019-12-05 | 2020-05-08 | 任子行网络技术股份有限公司 | 反爬虫方法及装置 |
CN111125692B (zh) * | 2019-12-05 | 2022-07-12 | 任子行网络技术股份有限公司 | 反爬虫方法及装置 |
CN112073412A (zh) * | 2020-09-08 | 2020-12-11 | 北京天融信网络安全技术有限公司 | 一种反爬虫方法、装置、处理器及计算机可读介质 |
CN114036364A (zh) * | 2021-11-08 | 2022-02-11 | 北京百度网讯科技有限公司 | 用于识别爬虫的方法、装置、设备、介质和产品 |
CN116150542A (zh) * | 2023-04-21 | 2023-05-23 | 河北网新数字技术股份有限公司 | 一种动态页面的生成方法和装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107092660A (zh) | 一种网站服务器爬虫识别方法和装置 | |
US11373205B2 (en) | Identifying and punishing cheating terminals that generate inflated hit rates | |
CN103210382B (zh) | 基于总线装置健康信息和相关功率管理而仲裁通信总线上的总线事务 | |
US20080301811A1 (en) | System For Stabilizing of Web Service and Method Thereof | |
CN110858843B (zh) | 业务请求处理方法、装置及计算机可读存储介质 | |
US10282758B1 (en) | Pricing control in a real-time network-based bidding environment | |
US8595226B2 (en) | Method and system for providing content according to personal preference | |
CN110609937A (zh) | 一种爬虫识别方法及装置 | |
CN108282450A (zh) | 异常域名的检测方法及装置 | |
CN109462574B (zh) | 一种基于区块链的广告牌控制网关 | |
CN106713168A (zh) | 一种流量控制方法及系统 | |
CN109286957A (zh) | 一种回源链路的切换方法、装置、电子设备及存储介质 | |
CN107330718A (zh) | 一种媒体反作弊方法及装置、存储介质、终端 | |
CN105898727A (zh) | 一种终端联网状态控制方法及装置 | |
CN107402851A (zh) | 一种数据恢复控制方法及装置 | |
CN113452752A (zh) | 一种多域物联网场景下的信任管理、博弈方法、系统 | |
US10922624B2 (en) | Identifying users of shared devices based on user interactions and identity graph | |
CN108614843A (zh) | 网站内容的评估方法及装置 | |
CN109688106A (zh) | 一种数据协同采集方法及系统 | |
CN106874423B (zh) | 搜索控制方法和系统 | |
CN106357445B (zh) | 一种用户体验监控方法及监控服务器 | |
CN111443962A (zh) | 一种交易限制方法及装置 | |
CN103997416A (zh) | 移动终端上网的纠错方法及纠错装置 | |
CN107707597A (zh) | 一种突发热点访问均衡处理方法及装置 | |
CN108521435B (zh) | 一种用户网络行为画像的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170825 |
|
RJ01 | Rejection of invention patent application after publication |