CN103257975A - 一种搜索方法、装置及系统 - Google Patents
一种搜索方法、装置及系统 Download PDFInfo
- Publication number
- CN103257975A CN103257975A CN 201210039526 CN201210039526A CN103257975A CN 103257975 A CN103257975 A CN 103257975A CN 201210039526 CN201210039526 CN 201210039526 CN 201210039526 A CN201210039526 A CN 201210039526A CN 103257975 A CN103257975 A CN 103257975A
- Authority
- CN
- China
- Prior art keywords
- target pages
- web data
- tree
- search
- dom
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210039526 CN103257975A (zh) | 2012-02-21 | 2012-02-21 | 一种搜索方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210039526 CN103257975A (zh) | 2012-02-21 | 2012-02-21 | 一种搜索方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103257975A true CN103257975A (zh) | 2013-08-21 |
Family
ID=48961904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201210039526 Pending CN103257975A (zh) | 2012-02-21 | 2012-02-21 | 一种搜索方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103257975A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598536A (zh) * | 2014-12-29 | 2015-05-06 | 浙江大学 | 一种分布式网络信息结构化处理方法 |
CN104636411A (zh) * | 2013-11-11 | 2015-05-20 | 国际商业机器公司 | 用于正规化无组织的查询结果集的方法和系统 |
CN105183732A (zh) * | 2014-06-04 | 2015-12-23 | 广州市动景计算机科技有限公司 | 网页的处理方法及装置 |
CN105528357A (zh) * | 2014-09-30 | 2016-04-27 | 中国银联股份有限公司 | 一种基于url和网页文档结构的相似性的网页内容提取方法 |
CN106682150A (zh) * | 2016-12-22 | 2017-05-17 | 北京锐安科技有限公司 | 一种信息处理的方法及装置 |
CN108090054A (zh) * | 2016-11-21 | 2018-05-29 | 凌今 | 一种科研用商品智能搜索方法和系统 |
CN110458471A (zh) * | 2019-08-19 | 2019-11-15 | 绍兴数纺科技有限公司 | 标准化染料信息管理系统 |
-
2012
- 2012-02-21 CN CN 201210039526 patent/CN103257975A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636411A (zh) * | 2013-11-11 | 2015-05-20 | 国际商业机器公司 | 用于正规化无组织的查询结果集的方法和系统 |
CN105183732A (zh) * | 2014-06-04 | 2015-12-23 | 广州市动景计算机科技有限公司 | 网页的处理方法及装置 |
CN105528357A (zh) * | 2014-09-30 | 2016-04-27 | 中国银联股份有限公司 | 一种基于url和网页文档结构的相似性的网页内容提取方法 |
CN104598536A (zh) * | 2014-12-29 | 2015-05-06 | 浙江大学 | 一种分布式网络信息结构化处理方法 |
CN104598536B (zh) * | 2014-12-29 | 2017-10-20 | 浙江大学 | 一种分布式网络信息结构化处理方法 |
CN108090054A (zh) * | 2016-11-21 | 2018-05-29 | 凌今 | 一种科研用商品智能搜索方法和系统 |
CN106682150A (zh) * | 2016-12-22 | 2017-05-17 | 北京锐安科技有限公司 | 一种信息处理的方法及装置 |
CN110458471A (zh) * | 2019-08-19 | 2019-11-15 | 绍兴数纺科技有限公司 | 标准化染料信息管理系统 |
CN110458471B (zh) * | 2019-08-19 | 2022-05-20 | 绍兴数纺科技有限公司 | 标准化染料信息管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106776711B (zh) | 一种基于深度学习的中文医学知识图谱构建方法 | |
CN105468605B (zh) | 一种实体信息图谱生成方法及装置 | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
CN103257975A (zh) | 一种搜索方法、装置及系统 | |
CN110555153A (zh) | 一种基于领域知识图谱的问答系统及其构建方法 | |
US10521474B2 (en) | Apparatus and method for web page access | |
Bedi et al. | Focused crawling of tagged web resources using ontology | |
CN103455487B (zh) | 一种搜索词的提取方法及装置 | |
CN103838732A (zh) | 一种生活服务领域垂直搜索引擎 | |
CN105718585B (zh) | 文档与标签词语义关联方法及其装置 | |
CN105868177A (zh) | 一种通用公式搜索方法 | |
CN103399862B (zh) | 确定目标查询序列所对应的搜索引导信息的方法与设备 | |
JP2017157193A (ja) | 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法 | |
Chen et al. | Finding keywords in blogs: Efficient keyword extraction in blog mining via user behaviors | |
CN104317867A (zh) | 对搜索引擎返回的网页图片进行实体聚类的系统 | |
Spitz et al. | EVELIN: Exploration of event and entity links in implicit networks | |
CN105243120A (zh) | 一种检索方法及装置 | |
CN107908749B (zh) | 一种基于搜索引擎的人物检索系统及方法 | |
Hoque et al. | Combining conceptual query expansion and visual search results exploration for web image retrieval | |
CN112035723A (zh) | 资源库的确定方法和装置、存储介质及电子装置 | |
Varga et al. | Integrating dbpedia and sentiwordnet for a tourism recommender system | |
CN107451168A (zh) | 基于词汇统计的档案分类系统及方法 | |
US11507593B2 (en) | System and method for generating queryeable structured document from an unstructured document using machine learning | |
Manguinhas et al. | A geo-temporal web gazetteer integrating data from multiple sources | |
Fung et al. | Discover information and knowledge from websites using an integrated summarization and visualization framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
ASS | Succession or assignment of patent right |
Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD. Effective date: 20131017 |
|
C41 | Transfer of patent application or patent right or utility model | ||
COR | Change of bibliographic data |
Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE |
|
TA01 | Transfer of patent application right |
Effective date of registration: 20131017 Address after: A Tencent Building in Shenzhen Nanshan District City, Guangdong streets in Guangdong province science and technology 518057 16 Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd. Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403 Applicant before: Tencent Technology (Shenzhen) Co., Ltd. |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130821 |