CN103218431A - 一种能识别网页信息自动采集的系统与方法 - Google Patents
一种能识别网页信息自动采集的系统与方法 Download PDFInfo
- Publication number
- CN103218431A CN103218431A CN 201310128305 CN201310128305A CN103218431A CN 103218431 A CN103218431 A CN 103218431A CN 201310128305 CN201310128305 CN 201310128305 CN 201310128305 A CN201310128305 A CN 201310128305A CN 103218431 A CN103218431 A CN 103218431A
- Authority
- CN
- China
- Prior art keywords
- module
- automatic
- visit
- acquisition
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310128305.6A CN103218431B (zh) | 2013-04-10 | 2013-04-10 | 一种能识别网页信息自动采集的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310128305.6A CN103218431B (zh) | 2013-04-10 | 2013-04-10 | 一种能识别网页信息自动采集的系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103218431A true CN103218431A (zh) | 2013-07-24 |
CN103218431B CN103218431B (zh) | 2016-02-17 |
Family
ID=48816218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310128305.6A Active CN103218431B (zh) | 2013-04-10 | 2013-04-10 | 一种能识别网页信息自动采集的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103218431B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778216A (zh) * | 2014-01-20 | 2014-05-07 | 北京集奥聚合科技有限公司 | 自动化过滤用户点击行为的方法和系统 |
CN104090908A (zh) * | 2014-06-06 | 2014-10-08 | 微梦创科网络科技(中国)有限公司 | 统计页面组的平均停留时间、网站内容推广的方法和装置 |
CN104731937A (zh) * | 2015-03-30 | 2015-06-24 | 百度在线网络技术(北京)有限公司 | 用户行为数据的处理方法及装置 |
CN104935603A (zh) * | 2015-06-24 | 2015-09-23 | 郑州悉知信息技术有限公司 | 一种识别请求的方法及网站服务器 |
CN104994092A (zh) * | 2015-06-30 | 2015-10-21 | 百度在线网络技术(北京)有限公司 | 业务请求处理方法、终端浏览器及防攻击服务器 |
CN106487747A (zh) * | 2015-08-26 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 用户识别方法、系统、装置及处理方法、装置 |
CN106845092A (zh) * | 2017-01-03 | 2017-06-13 | 青岛海信医疗设备股份有限公司 | 一种系统对接方法及装置 |
CN107330090A (zh) * | 2017-07-04 | 2017-11-07 | 北京锐安科技有限公司 | 一种信息处理方法及装置 |
CN107508844A (zh) * | 2017-10-23 | 2017-12-22 | 山东浪潮云服务信息科技有限公司 | 一种访问请求验证方法、装置及系统 |
CN108270637A (zh) * | 2016-12-30 | 2018-07-10 | 中国移动通信集团浙江有限公司 | 一种网站质量多层钻取系统和方法 |
CN108495272A (zh) * | 2018-03-19 | 2018-09-04 | 上海哔哩哔哩科技有限公司 | 基于html5浏览器的机器人识别方法、系统及存储介质 |
CN108874810A (zh) * | 2017-05-10 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 信息采集的方法和装置 |
CN109756467A (zh) * | 2017-11-07 | 2019-05-14 | 中国移动通信集团广东有限公司 | 一种钓鱼网站的识别方法及装置 |
CN109766501A (zh) * | 2019-01-14 | 2019-05-17 | 北京搜狗科技发展有限公司 | 爬虫协议管理方法及装置、爬虫系统 |
CN109862018A (zh) * | 2019-02-21 | 2019-06-07 | 中国工商银行股份有限公司 | 基于用户访问行为的反爬虫方法及系统 |
CN110519228A (zh) * | 2019-07-22 | 2019-11-29 | 中国科学院信息工程研究所 | 一种黑产场景下恶意云机器人的识别方法及系统 |
CN116644218A (zh) * | 2023-07-26 | 2023-08-25 | 成都华栖云科技有限公司 | 一种线上线下融合的教学空间数据采集与存储方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101399672B (zh) * | 2008-10-17 | 2011-03-02 | 章毅 | 一种多神经网络融合的入侵检测方法 |
CN101582813B (zh) * | 2009-06-26 | 2011-07-20 | 西安电子科技大学 | 基于分布式迁移网络学习的入侵检测系统及其方法 |
CN102088477A (zh) * | 2010-11-25 | 2011-06-08 | 互动在线(北京)科技有限公司 | 网站内容防采集系统和方法 |
-
2013
- 2013-04-10 CN CN201310128305.6A patent/CN103218431B/zh active Active
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778216A (zh) * | 2014-01-20 | 2014-05-07 | 北京集奥聚合科技有限公司 | 自动化过滤用户点击行为的方法和系统 |
CN104090908A (zh) * | 2014-06-06 | 2014-10-08 | 微梦创科网络科技(中国)有限公司 | 统计页面组的平均停留时间、网站内容推广的方法和装置 |
CN104090908B (zh) * | 2014-06-06 | 2017-11-03 | 微梦创科网络科技(中国)有限公司 | 统计页面组的平均停留时间、网站内容推广的方法和装置 |
CN104731937A (zh) * | 2015-03-30 | 2015-06-24 | 百度在线网络技术(北京)有限公司 | 用户行为数据的处理方法及装置 |
CN104731937B (zh) * | 2015-03-30 | 2018-05-01 | 百度在线网络技术(北京)有限公司 | 用户行为数据的处理方法及装置 |
CN104935603A (zh) * | 2015-06-24 | 2015-09-23 | 郑州悉知信息技术有限公司 | 一种识别请求的方法及网站服务器 |
CN104994092B (zh) * | 2015-06-30 | 2018-11-06 | 百度在线网络技术(北京)有限公司 | 业务请求处理方法、终端浏览器及防攻击服务器 |
CN104994092A (zh) * | 2015-06-30 | 2015-10-21 | 百度在线网络技术(北京)有限公司 | 业务请求处理方法、终端浏览器及防攻击服务器 |
CN106487747A (zh) * | 2015-08-26 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 用户识别方法、系统、装置及处理方法、装置 |
CN106487747B (zh) * | 2015-08-26 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 用户识别方法、系统、装置及处理方法、装置 |
CN108270637B (zh) * | 2016-12-30 | 2020-12-22 | 中国移动通信集团浙江有限公司 | 一种网站质量多层钻取系统和方法 |
CN108270637A (zh) * | 2016-12-30 | 2018-07-10 | 中国移动通信集团浙江有限公司 | 一种网站质量多层钻取系统和方法 |
CN106845092A (zh) * | 2017-01-03 | 2017-06-13 | 青岛海信医疗设备股份有限公司 | 一种系统对接方法及装置 |
CN108874810A (zh) * | 2017-05-10 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 信息采集的方法和装置 |
CN107330090A (zh) * | 2017-07-04 | 2017-11-07 | 北京锐安科技有限公司 | 一种信息处理方法及装置 |
CN107508844A (zh) * | 2017-10-23 | 2017-12-22 | 山东浪潮云服务信息科技有限公司 | 一种访问请求验证方法、装置及系统 |
CN109756467A (zh) * | 2017-11-07 | 2019-05-14 | 中国移动通信集团广东有限公司 | 一种钓鱼网站的识别方法及装置 |
CN109756467B (zh) * | 2017-11-07 | 2021-04-27 | 中国移动通信集团广东有限公司 | 一种钓鱼网站的识别方法及装置 |
CN108495272A (zh) * | 2018-03-19 | 2018-09-04 | 上海哔哩哔哩科技有限公司 | 基于html5浏览器的机器人识别方法、系统及存储介质 |
CN109766501A (zh) * | 2019-01-14 | 2019-05-17 | 北京搜狗科技发展有限公司 | 爬虫协议管理方法及装置、爬虫系统 |
CN109862018A (zh) * | 2019-02-21 | 2019-06-07 | 中国工商银行股份有限公司 | 基于用户访问行为的反爬虫方法及系统 |
CN110519228A (zh) * | 2019-07-22 | 2019-11-29 | 中国科学院信息工程研究所 | 一种黑产场景下恶意云机器人的识别方法及系统 |
CN116644218A (zh) * | 2023-07-26 | 2023-08-25 | 成都华栖云科技有限公司 | 一种线上线下融合的教学空间数据采集与存储方法及装置 |
CN116644218B (zh) * | 2023-07-26 | 2023-11-21 | 成都华栖云科技有限公司 | 一种线上线下融合的教学空间数据采集与存储方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103218431B (zh) | 2016-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103218431B (zh) | 一种能识别网页信息自动采集的系统 | |
CN110462604B (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
CN107862022B (zh) | 文化资源推荐系统 | |
CN103136360B (zh) | 一种互联网行为标注引擎及对应该引擎的行为标注方法 | |
CN111191122A (zh) | 一种基于用户画像的学习资源推荐系统 | |
CN102289447B (zh) | 一种基于通讯网络报文的网站网页评价系统 | |
US20150121265A1 (en) | Systems and methods for facilitating open source intelligence gathering | |
CN110781308B (zh) | 一种基于大数据构建知识图谱的反欺诈系统 | |
CN105095187A (zh) | 一种搜索意图识别方法及装置 | |
Sisodia et al. | Web usage pattern analysis through web logs: A review | |
CN106383887A (zh) | 一种环保新闻数据采集和推荐展示的方法及系统 | |
CN102254265A (zh) | 一种富媒体互联网广告内容匹配、效果评估方法 | |
CN104899324B (zh) | 一种基于idc有害信息监测系统的样本训练系统 | |
CN101477554A (zh) | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 | |
CN103544188A (zh) | 移动互联网内容的用户偏好推送方法与装置 | |
CN103605738A (zh) | 网页访问数据统计方法及装置 | |
CN105718587A (zh) | 一种网络内容资源评估方法及评估系统 | |
CN106446115A (zh) | 移动上网用户分类方法及装置 | |
CN111767443A (zh) | 一种高效的网络爬虫分析平台 | |
CN106528777A (zh) | 跨屏用户标识归一的方法及其系统 | |
CN111447575A (zh) | 短信息推送方法、装置、设备及存储介质 | |
CN104298782A (zh) | 互联网用户主动访问行为轨迹的分析方法 | |
Gabryel | Data analysis algorithm for click fraud recognition | |
CN103745380A (zh) | 一种广告投放方法和装置 | |
CN111049818A (zh) | 一种基于网络流量大数据的异常信息发现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20161222 Address after: Wangjiang Hefei high tech Zone of Anhui province 230000 city Hefei Innovation Industrial Park 800 building A3 room 508 Patentee after: Hefei Zhiyuan wellSome service outsourcing Co.,Ltd. Address before: Jinzhai road in Baohe District of Hefei city in Anhui province 230000 96 08 Grade 1-9 Patentee before: Jin Jun Effective date of registration: 20161222 Address after: Jinzhai road in Baohe District of Hefei city in Anhui province 230000 96 08 Grade 1-9 Patentee after: Jin Jun Address before: Jinzhai road in Baohe District of Hefei city in Anhui province 230000 96 08 Grade 1-9 Patentee before: Jin Jun Patentee before: Jiang Yan |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200414 Address after: 200080 room 766d, block h, 7th floor, No.137 Haining Road, Hongkou District, Shanghai Patentee after: Guoke (Shanghai) Enterprise Development Co.,Ltd. Address before: 508, building 230000, building A3, Hefei Innovation Industrial Park, 800 Wangjiang West Road, Hefei hi tech Zone, Anhui, China Patentee before: Hefei Zhiyuan wellSome service outsourcing Co.,Ltd. |