CN102254046A - 一种网页数据采集方法、系统 - Google Patents
一种网页数据采集方法、系统 Download PDFInfo
- Publication number
- CN102254046A CN102254046A CN2011102373915A CN201110237391A CN102254046A CN 102254046 A CN102254046 A CN 102254046A CN 2011102373915 A CN2011102373915 A CN 2011102373915A CN 201110237391 A CN201110237391 A CN 201110237391A CN 102254046 A CN102254046 A CN 102254046A
- Authority
- CN
- China
- Prior art keywords
- unit
- business model
- web data
- actuating logic
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102373915A CN102254046A (zh) | 2011-08-18 | 2011-08-18 | 一种网页数据采集方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102373915A CN102254046A (zh) | 2011-08-18 | 2011-08-18 | 一种网页数据采集方法、系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102254046A true CN102254046A (zh) | 2011-11-23 |
Family
ID=44981310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102373915A Pending CN102254046A (zh) | 2011-08-18 | 2011-08-18 | 一种网页数据采集方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102254046A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092817A (zh) * | 2013-01-18 | 2013-05-08 | 五八同城信息技术有限公司 | 一种基于脚本引擎的数据采集方法和装置 |
CN103218701A (zh) * | 2013-04-17 | 2013-07-24 | 佛山市真智客科技有限公司 | 物流配货信息交互方法 |
CN105335516A (zh) * | 2015-11-04 | 2016-02-17 | 浪潮软件集团有限公司 | 一种通用采集系统的构建方法 |
CN107784113A (zh) * | 2017-11-08 | 2018-03-09 | 深圳市科盾科技有限公司 | Html网页数据采集方法、装置和计算机可读存储介质 |
CN110020236A (zh) * | 2017-08-29 | 2019-07-16 | 北京国双科技有限公司 | 网页解析方法、装置、存储介质、处理器和设备 |
CN112256708A (zh) * | 2020-12-22 | 2021-01-22 | 远光软件股份有限公司 | 一种获取和存储文本内容的方法、装置、终端和存储介质 |
-
2011
- 2011-08-18 CN CN2011102373915A patent/CN102254046A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092817A (zh) * | 2013-01-18 | 2013-05-08 | 五八同城信息技术有限公司 | 一种基于脚本引擎的数据采集方法和装置 |
CN103218701A (zh) * | 2013-04-17 | 2013-07-24 | 佛山市真智客科技有限公司 | 物流配货信息交互方法 |
CN105335516A (zh) * | 2015-11-04 | 2016-02-17 | 浪潮软件集团有限公司 | 一种通用采集系统的构建方法 |
CN110020236A (zh) * | 2017-08-29 | 2019-07-16 | 北京国双科技有限公司 | 网页解析方法、装置、存储介质、处理器和设备 |
CN107784113A (zh) * | 2017-11-08 | 2018-03-09 | 深圳市科盾科技有限公司 | Html网页数据采集方法、装置和计算机可读存储介质 |
CN112256708A (zh) * | 2020-12-22 | 2021-01-22 | 远光软件股份有限公司 | 一种获取和存储文本内容的方法、装置、终端和存储介质 |
CN112256708B (zh) * | 2020-12-22 | 2021-04-30 | 远光软件股份有限公司 | 一种获取和存储文本内容的方法、装置、终端和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102254046A (zh) | 一种网页数据采集方法、系统 | |
CN102930059B (zh) | 一种聚焦爬虫的设计方法 | |
CN101271475B (zh) | 一种商业智能系统 | |
US9298680B2 (en) | Display of hypertext documents grouped according to their affinity | |
CN101840432B (zh) | 一种基于Deep Web深层动态数据的数据挖掘装置及方法 | |
CN103400579B (zh) | 一种语音识别系统和构建方法 | |
US20070198907A1 (en) | System and method for enabling persistent values when navigating in electronic documents | |
CN102880607A (zh) | 网络动态内容抓取方法及网络动态内容爬虫系统 | |
CN104778270A (zh) | 一种用于多文件的存储方法 | |
CN104679898A (zh) | 一种大数据访问方法 | |
CN101344881A (zh) | 海量文件型数据的索引生成方法及装置和搜索系统 | |
WO2004107112A2 (en) | Data federation methods and system | |
CN105512201A (zh) | 数据收集和加工方法及装置 | |
CN101997927A (zh) | 一种web平台数据缓存的方法和系统 | |
CN101291253B (zh) | 一种网管客户端基于图形界面的人机命令交互方法 | |
CN102521232B (zh) | 一种互联网元数据的分布式采集处理系统及方法 | |
CN104160397A (zh) | 位置独立文件 | |
CN102065114A (zh) | 一种移动终端访问网页的方法及装置 | |
CN101763423A (zh) | 实现万维网页面树形结构数据展示的方法、系统及装置 | |
CN104657189A (zh) | 混合式动态码编译装置、方法及其服务系统 | |
CN109298882A (zh) | 接口的管理方法、计算机可读存储介质和终端设备 | |
CN103744845A (zh) | 一种web平台数据缓存的方法和系统 | |
CN104268143A (zh) | Xml数据的处理方法和装置 | |
CN105426419A (zh) | 异构系统间数据升迁系统和方法 | |
CN100543741C (zh) | 自动下载和过滤网页的系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent for invention or patent application | ||
CB02 | Change of applicant information |
Address after: 19, building 18, Changhong technology building, 518057 South twelve Road, South tech Zone, Nanshan District hi tech Zone, Guangdong, Shenzhen Applicant after: SHENZHEN TEMOBI TECHNOLOGY CO., LTD. Address before: 19, building 18, Changhong technology building, 518057 South twelve Road, South tech Zone, Nanshan District hi tech Zone, Guangdong, Shenzhen Applicant before: Shenzhen Temobi Science & Tech Development Co.,Ltd. |
|
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: SHENZHEN TEMOBI SCIENCE + TECHNOLOGY CO., LTD. TO: SHENZHEN RONGCHANG TIANXIA TECHNOLOGY CO., LTD. |
|
ASS | Succession or assignment of patent right |
Owner name: RONGCHUANG TIANXIA (SHANGHAI) TECHNOLOGY DEVELOPME Free format text: FORMER OWNER: SHENZHEN RONGCHANG TIANXIA TECHNOLOGY CO., LTD. Effective date: 20150612 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20150612 Address after: 200433 Shanghai City, Yangpu District Wei Road No. 6 room 502-8 Applicant after: World (Shanghai) Technology Development Co., Ltd. Address before: 19, building 18, Changhong technology building, 518057 South twelve Road, South tech Zone, Nanshan District hi tech Zone, Guangdong, Shenzhen Applicant before: SHENZHEN TEMOBI TECHNOLOGY CO., LTD. |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20111123 |