CN101908071B - 一种提高搜索引擎搜索效率的方法及其系统 - Google Patents
一种提高搜索引擎搜索效率的方法及其系统 Download PDFInfo
- Publication number
- CN101908071B CN101908071B CN 201010250103 CN201010250103A CN101908071B CN 101908071 B CN101908071 B CN 101908071B CN 201010250103 CN201010250103 CN 201010250103 CN 201010250103 A CN201010250103 A CN 201010250103A CN 101908071 B CN101908071 B CN 101908071B
- Authority
- CN
- China
- Prior art keywords
- webpage
- search results
- url
- module
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010250103 CN101908071B (zh) | 2010-08-10 | 2010-08-10 | 一种提高搜索引擎搜索效率的方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010250103 CN101908071B (zh) | 2010-08-10 | 2010-08-10 | 一种提高搜索引擎搜索效率的方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101908071A CN101908071A (zh) | 2010-12-08 |
CN101908071B true CN101908071B (zh) | 2012-09-05 |
Family
ID=43263530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010250103 Active CN101908071B (zh) | 2010-08-10 | 2010-08-10 | 一种提高搜索引擎搜索效率的方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101908071B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855251B (zh) * | 2011-06-30 | 2015-07-01 | 北京百度网讯科技有限公司 | 一种需求识别的方法及装置 |
CN103886017B (zh) * | 2011-07-29 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 一种用于在搜索结果中提供相关子链接的方法和装置 |
CN103049454B (zh) * | 2011-10-16 | 2016-04-20 | 同济大学 | 一种基于多标签分类的中英文搜索结果可视化系统 |
CN103778164A (zh) * | 2012-10-26 | 2014-05-07 | 广州市邦富软件有限公司 | 一种网页链接特征模式识别算法 |
CN103838797A (zh) * | 2012-11-27 | 2014-06-04 | 大连灵动科技发展有限公司 | 一种移动搜索引擎优化方法 |
CN102968510B (zh) * | 2012-12-21 | 2016-05-11 | 厦门市美亚柏科信息股份有限公司 | 互联网人物信息的搜索方法及系统 |
CN103064827A (zh) * | 2013-01-16 | 2013-04-24 | 盘古文化传播有限公司 | 一种网页内容抽取的方法及装置 |
CN103942203A (zh) * | 2013-01-18 | 2014-07-23 | 北大方正集团有限公司 | 一种信息处理方法及主题信息库制作系统 |
CN103294815B (zh) * | 2013-06-08 | 2017-06-06 | 北京邮电大学 | 基于关键字分类并有多种呈现方式的搜索引擎装置与方法 |
CN103778238B (zh) * | 2014-01-27 | 2015-03-04 | 西安交通大学 | 一种从维基百科半结构化数据自动构建分类树的方法 |
CN103873597B (zh) * | 2014-04-15 | 2017-10-10 | 厦门市美亚柏科信息股份有限公司 | 分布式网页下载方法和系统 |
CN104102697B (zh) * | 2014-06-27 | 2018-07-31 | 深信服网络科技(深圳)有限公司 | 管理web应用中外链的方法及装置 |
CN104965934A (zh) * | 2015-08-04 | 2015-10-07 | 时代新媒体出版社有限责任公司 | 一种基于互联网内容挖掘的一搜成书方法 |
EP3384660B1 (en) * | 2015-12-04 | 2021-11-24 | ViaSat, Inc. | Accelerating connections to a host server |
CN105740389A (zh) * | 2016-01-27 | 2016-07-06 | 上海晶赞科技发展有限公司 | 一种分类方法及装置 |
CN105893581A (zh) * | 2016-04-03 | 2016-08-24 | 北京设集约科技有限公司 | 一种有效分享收藏的方法及系统 |
CN106168977B (zh) * | 2016-07-15 | 2019-07-02 | 山谷网安科技股份有限公司 | 一种用于网站安全监测的栏目识别方法 |
CN110472126A (zh) * | 2018-05-10 | 2019-11-19 | 中国移动通信集团浙江有限公司 | 一种页面数据的获取方法、装置和设备 |
CN111831948B (zh) * | 2019-04-18 | 2024-06-14 | 阿里巴巴集团控股有限公司 | 网页类型的检测方法、装置及计算机设备 |
CN110704761A (zh) * | 2019-09-25 | 2020-01-17 | 恩亿科(北京)数据科技有限公司 | 网页信息的获取方法和计算机存储介质 |
CN111796922B (zh) * | 2020-07-10 | 2022-02-01 | 四川长虹电器股份有限公司 | 一种基于编程语言分批调度任务的方法 |
CN113076164B (zh) * | 2021-04-16 | 2024-04-16 | 北京沃东天骏信息技术有限公司 | 一种网页语言管理方法和装置 |
CN114443928B (zh) * | 2022-01-25 | 2023-03-17 | 西藏民族大学 | 一种网络文本数据爬虫方法与系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251855A (zh) * | 2008-03-27 | 2008-08-27 | 腾讯科技(深圳)有限公司 | 一种互联网网页清洗方法、系统及设备 |
CN101520798A (zh) * | 2009-03-06 | 2009-09-02 | 苏州锐创通信有限责任公司 | 基于垂直搜索和聚焦爬虫的网页分类技术 |
CN101630330A (zh) * | 2009-08-14 | 2010-01-20 | 苏州锐创通信有限责任公司 | 一种网页分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003012576A2 (en) * | 2001-07-27 | 2003-02-13 | Quigo Technologies Inc. | System and method for automated tracking and analysis of document usage |
US20040215608A1 (en) * | 2003-04-25 | 2004-10-28 | Alastair Gourlay | Search engine supplemented with URL's that provide access to the search results from predefined search queries |
-
2010
- 2010-08-10 CN CN 201010250103 patent/CN101908071B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251855A (zh) * | 2008-03-27 | 2008-08-27 | 腾讯科技(深圳)有限公司 | 一种互联网网页清洗方法、系统及设备 |
CN101520798A (zh) * | 2009-03-06 | 2009-09-02 | 苏州锐创通信有限责任公司 | 基于垂直搜索和聚焦爬虫的网页分类技术 |
CN101630330A (zh) * | 2009-08-14 | 2010-01-20 | 苏州锐创通信有限责任公司 | 一种网页分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101908071A (zh) | 2010-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101908071B (zh) | 一种提高搜索引擎搜索效率的方法及其系统 | |
KR100505848B1 (ko) | 검색 시스템 | |
CN101246499B (zh) | 网络信息搜索方法及系统 | |
US6148289A (en) | System and method for geographically organizing and classifying businesses on the world-wide web | |
CN100394427C (zh) | 网络搜寻系统及方法 | |
US7664767B2 (en) | System and method for geographically organizing and classifying businesses on the world-wide web | |
CN101079064B (zh) | 一种网页排序方法及装置 | |
CN101329687B (zh) | 一种新闻网页定位方法 | |
CN111708740A (zh) | 基于云平台的海量搜索查询日志计算分析系统 | |
CN102760151B (zh) | 开源软件获取与搜索系统的实现方法 | |
CN102968465B (zh) | 网络信息服务平台及其基于该平台的搜索服务方法 | |
CN104391978B (zh) | 用于浏览器的网页收藏处理方法及装置 | |
CN101477554A (zh) | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 | |
CN102567494B (zh) | 网站分类方法及装置 | |
CN102270331A (zh) | 基于可视化搜索的网络购物导航方法 | |
CN103116635B (zh) | 面向领域的暗网资源采集方法和系统 | |
CN104268148A (zh) | 一种基于时间串的论坛页面信息自动抽取方法及系统 | |
KR100671077B1 (ko) | 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템 | |
CN104778232B (zh) | 一种基于长查询的搜索结果的优化方法和装置 | |
CN112597370A (zh) | 指定需求范围的网页信息自主搜集筛选系统 | |
CN100357942C (zh) | 一种移动互联网智能信息搜索引擎的搜索方法 | |
CN109948015B (zh) | 一种元搜索列表结果抽取方法及系统 | |
Ganguly et al. | Performance optimization of focused web crawling using content block segmentation | |
CN102890715A (zh) | 一种特定领域信息自动化组织的装置及其方法 | |
Shaker et al. | Information extraction from hypertext mark-up language web pages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20101208 Assignee: XIAMEN SECURITY INTELLIGENCE INFORMATION TECHNOLOGY CO.,LTD. Assignor: XIAMEN MEIYA PICO INFORMATION Co.,Ltd. Contract record no.: X2023350000020 Denomination of invention: A method and system for improving search efficiency of search engine Granted publication date: 20120905 License type: Common License Record date: 20230223 |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20101208 Assignee: Xiaoma Baoli (Xiamen) Network Technology Co.,Ltd. Assignor: XIAMEN MEIYA PICO INFORMATION Co.,Ltd. Contract record no.: X2023350000078 Denomination of invention: A Method and System for Improving Search Efficiency of Search Engines Granted publication date: 20120905 License type: Common License Record date: 20230313 |
|
EE01 | Entry into force of recordation of patent licensing contract |