CN102521232B - 一种互联网元数据的分布式采集处理系统及方法 - Google Patents
一种互联网元数据的分布式采集处理系统及方法 Download PDFInfo
- Publication number
- CN102521232B CN102521232B CN201110351493.XA CN201110351493A CN102521232B CN 102521232 B CN102521232 B CN 102521232B CN 201110351493 A CN201110351493 A CN 201110351493A CN 102521232 B CN102521232 B CN 102521232B
- Authority
- CN
- China
- Prior art keywords
- metadata
- url
- crawl
- distributed
- business application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110351493.XA CN102521232B (zh) | 2011-11-09 | 2011-11-09 | 一种互联网元数据的分布式采集处理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110351493.XA CN102521232B (zh) | 2011-11-09 | 2011-11-09 | 一种互联网元数据的分布式采集处理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102521232A CN102521232A (zh) | 2012-06-27 |
CN102521232B true CN102521232B (zh) | 2014-05-07 |
Family
ID=46292157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110351493.XA Active CN102521232B (zh) | 2011-11-09 | 2011-11-09 | 一种互联网元数据的分布式采集处理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521232B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102790914B (zh) * | 2012-07-04 | 2015-02-11 | 合一网络技术(北京)有限公司 | 一种获取生成用户关注度高的网络视频精华的系统及方法 |
CN106469087B (zh) * | 2015-08-19 | 2020-06-05 | 阿里巴巴集团控股有限公司 | 元数据输出方法、客户端和元数据服务器 |
CN106470118B (zh) * | 2015-08-21 | 2019-11-08 | 睿石网云(北京)科技有限公司 | 一种应用系统性能异常检测方法和系统 |
CN106815254B (zh) * | 2015-12-01 | 2020-08-14 | 阿里巴巴集团控股有限公司 | 一种数据处理方法和装置 |
CN110555020B (zh) * | 2018-03-26 | 2023-04-11 | 阿里巴巴集团控股有限公司 | 一种映射关系建立、数据查询方法、装置及设备 |
US10983889B2 (en) * | 2018-09-04 | 2021-04-20 | Aveva Software, Llc | Stream-based composition and monitoring server system and method |
CN109902434B (zh) * | 2019-03-18 | 2023-04-07 | 浙江工业大学 | 云计算环境下面向rest架构风格的服务数据可视化建模与匹配方法 |
CN111857789A (zh) * | 2019-04-29 | 2020-10-30 | 天津五八到家科技有限公司 | 数据处理系统 |
CN112783842B (zh) * | 2019-11-07 | 2024-03-01 | 北京沃东天骏信息技术有限公司 | 一种日志收集方法和装置 |
CN118012917B (zh) * | 2024-04-09 | 2024-06-11 | 无码科技(杭州)有限公司 | 数据流处理方法、调度控制器、分布式数据流处理系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2416238A (en) * | 2003-05-05 | 2006-01-18 | Arbortext Inc | System and method for defining specifications for outputting content in multiple formats |
CN101256650B (zh) * | 2008-03-21 | 2012-02-15 | 中国科学院软件研究所 | 一种基于业务实体的企业数据提取方法与系统 |
CN101799826B (zh) * | 2010-03-04 | 2011-09-14 | 中国电子科技集团公司第二十八研究所 | 一种基于虚拟视图的网络化数据共享系统及方法 |
-
2011
- 2011-11-09 CN CN201110351493.XA patent/CN102521232B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102521232A (zh) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102521232B (zh) | 一种互联网元数据的分布式采集处理系统及方法 | |
Sevilla Ruiz et al. | Inferring versioned schemas from NoSQL databases and its applications | |
CN102930059B (zh) | 一种聚焦爬虫的设计方法 | |
CN101488151B (zh) | 一种聚合Web站点内容的系统和方法 | |
CN105243159A (zh) | 一种基于可视化脚本编辑器的分布式网络爬虫系统 | |
CN102184184B (zh) | 一种网页动态信息获取方法 | |
CN102164186B (zh) | 一种实现云搜索服务的方法及系统 | |
CN104077402B (zh) | 数据处理方法和数据处理系统 | |
CN102760058B (zh) | 面向大规模协作开发的海量软件项目共享方法 | |
CN103927314B (zh) | 一种数据批量处理的方法和装置 | |
CN103428076A (zh) | 向多类型终端或应用发送信息的方法和装置 | |
CN101344881A (zh) | 海量文件型数据的索引生成方法及装置和搜索系统 | |
CN102193798B (zh) | 基于Internet的OpenAPI自动获取方法 | |
CN101441629A (zh) | 一种非结构化网页信息的自动采集方法 | |
CN106776693A (zh) | 一种网站数据采集方法及装置 | |
CN102117331B (zh) | 视频搜索方法及系统 | |
CN103810272A (zh) | 一种数据处理方法和系统 | |
CN103744987A (zh) | 基于dom树匹配的视频网站媒资聚合方法和系统 | |
CN101763432A (zh) | 一种轻量级网页动态视图快速构建方法 | |
US20190146954A1 (en) | Hierarchical seedlists for application data | |
CN105574037B (zh) | 一种信息处理方法及装置 | |
US20150178300A1 (en) | Methods for converting an xml artifact into a topic map instance and devices thereof | |
CN109614535B (zh) | 一种基于Scrapy框架的网络数据的采集方法及装置 | |
Ma et al. | A simple scheme for bibliography acquisition using DOI content negotiation proxy | |
CN102486731A (zh) | 增强软件的软件调用栈的可视化的方法、设备和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20151203 Address after: 100088, Beijing, Haidian District, Huayuan Road No. 4 Tong Heng building, room B07 Patentee after: UT Sidakang (China) Co., Ltd. Address before: 310053 six and 368 Road, hi tech Development Zone, Zhejiang, Binjiang, Hangzhou Patentee before: UT Starcom Communication Co., Ltd. |
|
TR01 | Transfer of patent right |
Effective date of registration: 20190107 Address after: 518000 Lenovo Building, No. 016, Gaoxin Nantong, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, on the east side of the third floor Patentee after: Excellent network Co., Ltd. Address before: Room B07, Tongheng Building, 4 Garden Road, Haidian District, Beijing 100088 Patentee before: UT Sidakang (China) Co., Ltd. |
|
TR01 | Transfer of patent right |