CN102411617A - 一种对海量url进行存储和查询方法 - Google Patents
一种对海量url进行存储和查询方法 Download PDFInfo
- Publication number
- CN102411617A CN102411617A CN2011103382042A CN201110338204A CN102411617A CN 102411617 A CN102411617 A CN 102411617A CN 2011103382042 A CN2011103382042 A CN 2011103382042A CN 201110338204 A CN201110338204 A CN 201110338204A CN 102411617 A CN102411617 A CN 102411617A
- Authority
- CN
- China
- Prior art keywords
- url
- character string
- www
- field
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 101100328886 Caenorhabditis elegans col-2 gene Proteins 0.000 claims description 2
- 101100328884 Caenorhabditis elegans sqt-3 gene Proteins 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Computer And Data Communications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
URL | MD5 | Keywords | Col1 | Col2 | ... |
URL | MD5 | Keywords | Createtime | Author | Context |
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110338204 CN102411617B (zh) | 2011-10-31 | 2011-10-31 | 一种对海量url进行存储和查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110338204 CN102411617B (zh) | 2011-10-31 | 2011-10-31 | 一种对海量url进行存储和查询方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102411617A true CN102411617A (zh) | 2012-04-11 |
CN102411617B CN102411617B (zh) | 2013-09-18 |
Family
ID=45913688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110338204 Active CN102411617B (zh) | 2011-10-31 | 2011-10-31 | 一种对海量url进行存储和查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102411617B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103220274A (zh) * | 2013-03-25 | 2013-07-24 | 北京东方网信科技股份有限公司 | 一种用于运营商网络出口的网络报文模式匹配方法及系统 |
CN104750706A (zh) * | 2013-12-26 | 2015-07-01 | 贝壳网际(北京)安全技术有限公司 | 驱动程序信息的提供方法、装置和系统 |
CN105426364A (zh) * | 2014-06-04 | 2016-03-23 | 北大方正集团有限公司 | Url检索方法及服务器 |
CN106503227A (zh) * | 2016-10-28 | 2017-03-15 | 朱升 | 一种网络主页系统 |
CN108401180A (zh) * | 2017-02-08 | 2018-08-14 | 南宁富桂精密工业有限公司 | 视频缓冲规则的生成系统及方法 |
CN108595453A (zh) * | 2017-12-20 | 2018-09-28 | 中国联合网络通信集团有限公司 | Url标识映射获取方法及装置 |
CN111061972A (zh) * | 2019-12-25 | 2020-04-24 | 武汉绿色网络信息服务有限责任公司 | 一种用于url路径匹配的ac查找优化方法和装置 |
CN112052413A (zh) * | 2020-08-28 | 2020-12-08 | 上海谋乐网络科技有限公司 | Url模糊匹配方法、装置和系统 |
CN113821211A (zh) * | 2021-09-17 | 2021-12-21 | 杭州迪普科技股份有限公司 | 命令解析方法、装置、存储介质和计算机设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1573752A (zh) * | 2003-06-20 | 2005-02-02 | 日本电气株式会社 | Url检索系统、服务器及url检索方法 |
JP2006221294A (ja) * | 2005-02-09 | 2006-08-24 | Nec Engineering Ltd | Url検索方法及び検索装置 |
CN1963811A (zh) * | 2005-11-10 | 2007-05-16 | 国际商业机器公司 | 用于生成唯一的有效关键字的方法和系统 |
CN101196910A (zh) * | 2007-12-04 | 2008-06-11 | 深圳市迅雷网络技术有限公司 | 一种确定网络资源的方法和装置 |
CN101605129A (zh) * | 2009-06-23 | 2009-12-16 | 北京理工大学 | 一种用于url过滤系统的url查找方法 |
US20100154055A1 (en) * | 2008-12-12 | 2010-06-17 | At&T Intellectual Property I, L.P. | Prefix Domain Matching for Anti-Phishing Pattern Matching |
-
2011
- 2011-10-31 CN CN 201110338204 patent/CN102411617B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1573752A (zh) * | 2003-06-20 | 2005-02-02 | 日本电气株式会社 | Url检索系统、服务器及url检索方法 |
JP2006221294A (ja) * | 2005-02-09 | 2006-08-24 | Nec Engineering Ltd | Url検索方法及び検索装置 |
CN1963811A (zh) * | 2005-11-10 | 2007-05-16 | 国际商业机器公司 | 用于生成唯一的有效关键字的方法和系统 |
CN101196910A (zh) * | 2007-12-04 | 2008-06-11 | 深圳市迅雷网络技术有限公司 | 一种确定网络资源的方法和装置 |
US20100154055A1 (en) * | 2008-12-12 | 2010-06-17 | At&T Intellectual Property I, L.P. | Prefix Domain Matching for Anti-Phishing Pattern Matching |
CN101605129A (zh) * | 2009-06-23 | 2009-12-16 | 北京理工大学 | 一种用于url过滤系统的url查找方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103220274B (zh) * | 2013-03-25 | 2016-06-15 | 北京东方网信科技股份有限公司 | 一种用于运营商网络出口的网络报文模式匹配方法及系统 |
CN103220274A (zh) * | 2013-03-25 | 2013-07-24 | 北京东方网信科技股份有限公司 | 一种用于运营商网络出口的网络报文模式匹配方法及系统 |
CN104750706B (zh) * | 2013-12-26 | 2019-06-04 | 北京猎豹移动科技有限公司 | 驱动程序信息的提供方法、装置和系统 |
CN104750706A (zh) * | 2013-12-26 | 2015-07-01 | 贝壳网际(北京)安全技术有限公司 | 驱动程序信息的提供方法、装置和系统 |
CN105426364A (zh) * | 2014-06-04 | 2016-03-23 | 北大方正集团有限公司 | Url检索方法及服务器 |
CN106503227A (zh) * | 2016-10-28 | 2017-03-15 | 朱升 | 一种网络主页系统 |
CN108401180A (zh) * | 2017-02-08 | 2018-08-14 | 南宁富桂精密工业有限公司 | 视频缓冲规则的生成系统及方法 |
CN108595453A (zh) * | 2017-12-20 | 2018-09-28 | 中国联合网络通信集团有限公司 | Url标识映射获取方法及装置 |
CN108595453B (zh) * | 2017-12-20 | 2020-09-01 | 中国联合网络通信集团有限公司 | Url标识映射获取方法及装置 |
CN111061972A (zh) * | 2019-12-25 | 2020-04-24 | 武汉绿色网络信息服务有限责任公司 | 一种用于url路径匹配的ac查找优化方法和装置 |
CN111061972B (zh) * | 2019-12-25 | 2023-05-16 | 武汉绿色网络信息服务有限责任公司 | 一种用于url路径匹配的ac查找优化方法和装置 |
CN112052413A (zh) * | 2020-08-28 | 2020-12-08 | 上海谋乐网络科技有限公司 | Url模糊匹配方法、装置和系统 |
CN112052413B (zh) * | 2020-08-28 | 2024-02-13 | 上海谋乐网络科技有限公司 | Url模糊匹配方法、装置和系统 |
CN113821211A (zh) * | 2021-09-17 | 2021-12-21 | 杭州迪普科技股份有限公司 | 命令解析方法、装置、存储介质和计算机设备 |
CN113821211B (zh) * | 2021-09-17 | 2023-06-27 | 杭州迪普科技股份有限公司 | 命令解析方法、装置、存储介质和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102411617B (zh) | 2013-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102411617B (zh) | 一种对海量url进行存储和查询方法 | |
US8359318B2 (en) | System and method for distributed index searching of electronic content | |
US8352474B2 (en) | System and method for retrieving information using a query based index | |
US20110016128A1 (en) | Distributing content indices | |
CA2790421C (en) | Indexing and searching employing virtual documents | |
CN101950312B (zh) | 一种互联网网页内容解析方法 | |
WO2008043645B1 (en) | Establishing document relevance by semantic network density | |
JP5930496B2 (ja) | レイアウトファイルにおける構造化情報の取得方法及び装置 | |
CN105512143A (zh) | 一种网页分类方法及装置 | |
CN102761627A (zh) | 基于终端访问统计的云网址推荐方法及系统及相关设备 | |
WO2013119603A1 (en) | Web page retrieval method and device | |
EP3255564A1 (en) | Method and system for matching images with content using whitelists and blacklists in response to a search query | |
CN105550359A (zh) | 一种基于垂直搜索的网页排序方法、装置及服务器 | |
CN110889023A (zh) | 一种elasticsearch的分布式多功能搜索引擎 | |
CN103559258A (zh) | 基于云计算的网页排序方法 | |
CN101957860B (zh) | 一种发布、搜索信息的方法及装置 | |
CN102081649A (zh) | 一种搜索电脑文件的方法及其系统 | |
US20130086083A1 (en) | Transferring ranking signals from equivalent pages | |
CN103257981B (zh) | 基于查询接口属性特征的Deep Web数据表面化方法 | |
CN102129454A (zh) | 一种基于云存储的百科数据处理方法及系统 | |
CN104636384B (zh) | 一种处理文档的方法及装置 | |
CN102222067A (zh) | 一种根据关键字ip地址进行精确查询的搜索方法 | |
CN103324640B (zh) | 一种确定搜索结果文档的方法、装置和设备 | |
CN109086384A (zh) | 基于用户画像的水务管理方法及系统 | |
CN113032436A (zh) | 基于文章内容和标题的搜索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Method for storing and inquiring a large quantity of URLs Effective date of registration: 20180627 Granted publication date: 20130918 Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch Pledgor: RUN TECHNOLOGIES Co.,Ltd. BEIJING Registration number: 2018110000015 |
|
PC01 | Cancellation of the registration of the contract for pledge of patent right |
Date of cancellation: 20210128 Granted publication date: 20130918 Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch Pledgor: Run Technologies Co.,Ltd. Beijing Registration number: 2018110000015 |
|
PC01 | Cancellation of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A method of storing and querying massive URLs Effective date of registration: 20210705 Granted publication date: 20130918 Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch Pledgor: Run Technologies Co.,Ltd. Beijing Registration number: Y2021990000579 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PC01 | Cancellation of the registration of the contract for pledge of patent right |
Granted publication date: 20130918 Pledgee: China Co. truction Bank Corp Beijing Zhongguancun branch Pledgor: RUN TECHNOLOGIES Co.,Ltd. BEIJING Registration number: Y2021990000579 |
|
PC01 | Cancellation of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A method for storing and querying massive URLs Granted publication date: 20130918 Pledgee: Bank of Communications Co.,Ltd. Beijing Asian Games Village Branch Pledgor: RUN TECHNOLOGIES Co.,Ltd. BEIJING Registration number: Y2024110000165 |