WO2014000576A1 - 一种网络搜索方法及网络搜索系统 - Google Patents

一种网络搜索方法及网络搜索系统 Download PDF

Info

Publication number
WO2014000576A1
WO2014000576A1 PCT/CN2013/077153 CN2013077153W WO2014000576A1 WO 2014000576 A1 WO2014000576 A1 WO 2014000576A1 CN 2013077153 W CN2013077153 W CN 2013077153W WO 2014000576 A1 WO2014000576 A1 WO 2014000576A1
Authority
WO
WIPO (PCT)
Prior art keywords
web page
description information
module
page data
information
Prior art date
Application number
PCT/CN2013/077153
Other languages
English (en)
French (fr)
Inventor
刘付强
Original Assignee
北京奇虎科技有限公司
奇智软件(北京)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京奇虎科技有限公司, 奇智软件(北京)有限公司 filed Critical 北京奇虎科技有限公司
Priority to US14/411,206 priority Critical patent/US10380197B2/en
Publication of WO2014000576A1 publication Critical patent/WO2014000576A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Definitions

  • the present invention relates to the field of computer technologies, and in particular, to a network search method and a network search system. Background technique
  • a search engine is a system that collects information from the Internet using a specific computer program according to a certain strategy, organizes and processes the information, provides a search service for the user, and presents the user with relevant information to the user.
  • the user enters a keyword to search, and the search engine finds a webpage matching the keyword from the index database. For the convenience of the user, in addition to the web page title and URL, a summary and other information from the webpage are provided.
  • the traditional search engine usually displays the search results without detailed formatting of the professional dimension. It can only obtain general information such as title, abstract, link, and publication time, so all the results of the traditional search engine are generally only displayed. Web page title, abstract, web link, publication time.
  • the present invention has been made in order to provide a network search method and network search system that overcomes the above problems or at least partially solves or alleviates the above problems.
  • a network search system including: a database management module, a database, a search module, an analysis module, and a presentation module, wherein the database management module is adapted to extract and socialize Website related web page structure and information category composition data Library; the database, suitable for saving networks related to social networking sites! [Structure and information category; the search module is adapted to search for network data related to the keyword according to the submitted keyword; the analysis module is adapted to search for the searched keyword related words according to the database Determining, by the network data, the description information of the network data, where the description information is adapted to the information category of the social networking website; the presentation module is adapted to use the description information as a search with the corresponding network data The results are presented together.
  • the database management module is adapted to extract and socialize Website related web page structure and information category composition data Library
  • the database suitable for saving networks related to social networking sites! [Structure and information category
  • the search module is adapted to search for network data related to the keyword according to the submitted keyword
  • the analysis module
  • a network search method including: extracting a network structure of a social networking site and an information category composition database; and searching for webpage data related to the keyword according to the submitted keyword;
  • the database sorts the searched webpage data related to the keyword, and obtains the description information of the webpage data, and the description information is adapted to the information category of the social networking website;
  • the description information is presented together with the corresponding web page data as a search result.
  • a computer program comprising computer readable code causing the server to perform any of claims 9-16 when run on a server The network search method.
  • a computer readable medium storing the computer program according to claim 17 is provided.
  • the present invention performs format analysis on the website, and completes detailed information extraction of the professional dimension, and finally obtains description information of social networking websites such as forums and blogs, and has description information of forums and blog features as part of the search result. Highlighting allows users to quickly understand the basics of a web page, such as judging popularity by judging the number of clicks.
  • the source name of the webpage data in the description information, the author name of the webpage data, the number of times of browsing of the webpage data, and the number of times of replying the webpage data are likely to occur after the webpage data is completed. Changes, especially the number of views and the number of replies, are subject to change at any time.
  • the present invention continuously refreshes the page for updating when displaying search results such as description information.
  • FIG. 1 schematically shows a first method flow chart according to an embodiment of the present invention
  • FIG. 2 schematically shows a second method flow chart according to an embodiment of the present invention
  • FIG. 3 schematically shows according to the present invention.
  • FIG. 4 is a schematic diagram showing a fourth method flow diagram according to an embodiment of the present invention
  • FIG. 5 is a schematic diagram showing a first system architecture diagram according to an embodiment of the present invention
  • 6 is a schematic diagram showing a second system architecture diagram according to an embodiment of the present invention
  • FIG. 7 is a schematic diagram showing a third system architecture diagram according to an embodiment of the present invention
  • FIG. 8 is a schematic diagram showing the present invention.
  • a fourth system architecture diagram of an embodiment FIG.
  • FIG. 9 is a schematic diagram showing a fifth system architecture diagram according to an embodiment of the present invention.
  • FIG. 10 is a schematic diagram showing a sixth system architecture diagram according to an embodiment of the present invention.
  • Figure 11 is a schematic diagram showing a seventh system architecture diagram according to an embodiment of the present invention.
  • Figure 12 is a schematic diagram showing an eighth system architecture diagram according to an embodiment of the present invention;
  • Figure 14 schematically illustrates a memory unit for holding or carrying program code that implements the method in accordance with the present invention. Specific embodiment
  • the core idea of the present invention is: extracting a webpage structure and a category of information categories related to a social networking site; searching for a number of webpages related to the keyword according to the submitted keywords; searching for the searched and The webpage data related to the keyword is analyzed, and the web is obtained Descriptive information of the data
  • the description information is adapted to the information category of the social networking website; the description information is presented together with the corresponding webpage data as a search result.
  • FIG. 1 is a flowchart of a first method according to an embodiment of the present invention. the following operations are performed:
  • step S101 the webpage structure and the information category of the social wide station are extracted into data ⁇ .
  • the content, the color, and the feature-rich webpage are logically planned to abstract the webpage into a layout section or an attribute area, where the layout section or the attribute area is a network structure, and the webpage structure may be a personalized network structure of each social networking website. , or it can be a general web page structure obtained by statistical summarization of each Dudu website;
  • the attribute area can be roughly divided into a head area and a body area, or can be divided into a title area, an author area, a keyword area, a webpage information area, a background area, a music area, a font area, a text area, and a link area;
  • the layout of the image may be divided according to the content of the webpage, such as a content navigation area, a link information area, a text information area, an interaction operation area, and a site information area.
  • Information categories are categories of featured information that are important and valuable to social networking sites, such as number of replies, number of views, and so on.
  • the information category may be a personality information class of each social networking site or a general information category obtained by statistically summarizing the social networking sites.
  • the social networking site includes at least one or more of the following: a forum, a bar, a bulletin board, a group discussion website, an online chat website, a dating website, a personal space, a blog, a microblog, and other social networking websites.
  • Step S201 Search for webpage data related to the keyword according to the submitted keyword.
  • step S301 the webpage data related to the searched keyword is analyzed according to the database, and the description information of the webpage data is obtained, and the description information is adapted to the information category of the social networking website.
  • the webpage data is broken up into a plurality of areas, and the division of the area is divided according to the layout section or the attribute area as described in step S101; this method is beneficial to the detailed analysis of the professional dimension, and the corresponding description information is generally specific.
  • the layout section or attribute area, the description information has a corresponding relationship with the layout section or the attribute area, so that the location of the description information can be quickly located. For example: the author name of the webpage data is generally located in the author area;
  • description information is adapted to the information category of the social networking website, and the description information at least includes the following Combination of one or more kinds: a source name of the webpage data, an author name of the webpage data, a browsing number of the webpage data, and a reply number of the webpage data.
  • Step S401 The description information is displayed together with the corresponding webpage data as a search result.
  • the invention performs format analysis on the website, completes the detailed information extraction of the professional dimension, and finally obtains the description information of the type of the Duo website such as the forum and the blog, and highlights the description information with the characteristics of the forum and the blog, so that the user can Use these descriptions to quickly understand the basics of a web page, such as by knowing the popularity of a click.
  • step S401 is a flow chart of a second method of an embodiment of the present invention.
  • the source name of the webpage data in the description information, the author name of the webpage data, the number of times of browsing of the webpage data, and the number of times of replying the webpage data are likely to change after the webpage data is completed. In particular, the number of views and the number of replies will change at any time. For such sensitive information, after completing the presentation in step S401, the following operations should also be performed:
  • Step S501 Detecting and updating the displayed description information periodically or in real time
  • Step S502 the refreshing page displays the updated description information together with the corresponding webpage data.
  • FIG. 3 it is a flowchart of a third method of the embodiment of the present invention. If you can't open a search result or the opening speed is particularly slow, you can quickly browse the web page data in preview mode, and the preview page is called directly from the original web page. Therefore, after the presentation is completed in step S401, the following operations can also be performed:
  • Step S601 Display a trigger entry of the preview operation of the network data together with corresponding webpage data and description information;
  • Step S602 detecting that the cursor stays at the trigger entry for more than a preset duration.
  • FIG. 4 it is a flowchart of a fourth method of the embodiment of the present invention.
  • Step S701 Detect a trigger event of the description information that is displayed, where the description information includes at least: a source name of the webpage data and/or an author name of the webpage data;
  • the source name includes: forum name, blog name, section name, and so on.
  • Step S702 searching, according to the event, the description information as a keyword, and searching for webpage data related to the description information;
  • Step S703 analyzing the searched webpage data according to the database, and acquiring description information of the webpage data;
  • Step S704 the description information is jointly displayed along with the corresponding network data as a search result.
  • the system of the present invention will be described below in four embodiments, which system corresponds to the above-described method flow, and the deficiencies can be referred to the above method parts.
  • the network search system includes: a database management module 1, a database 2, a search module 3, an analysis module 4, and a presentation module 5, wherein
  • the database management module 1 is adapted to extract a webpage structure and an information category composition database 2 related to the social networking website;
  • the database 2 is adapted to save a webpage structure and a category of information related to the social networking website;
  • the searching module 3 is adapted to search webpage data related to the keyword according to the submitted keyword;
  • the analyzing module 4 is configured to analyze the webpage data related to the keyword searched by the search module 3 according to the database 2, and obtain description information of the webpage data, the description information and the description information.
  • the information category of the social networking site is adapted; specifically, it is further adapted to decompose the webpage data into a plurality of layout sections or attribute areas according to a webpage structure in the database; and according to each information category in the database, Descriptive information is obtained in the corresponding layout section or attribute area obtained after the webpage data is decomposed;
  • the presentation module 5 is adapted to associate the description information acquired by the analysis module 4 with a corresponding The webpage data searched by the search module 3 is displayed together as a search result.
  • the network search system includes: a database management module
  • Database Search module 3. Analysis module 4 and presentation module 5.
  • Database management module 1 database 2, search module 3, analysis module 4 and presentation module
  • the network search system further includes: a point selection detection module 6;
  • the selection detection module 6 is adapted to detect a trigger event of the description information displayed by the presentation module 5, where the description information includes at least: a source name of the webpage data and/or an author name of the webpage data;
  • the search module 3 is further adapted to trigger, by using the event detected by the click detection module 6, to search for the network data related to the description information by using the description information as a keyword;
  • the analyzing module 4 is configured to analyze the webpage data searched by the search module 3 according to the database 2, and obtain description information of the webpage data, where the description information is adapted to the information category of the social networking website. Specifically, it is further adapted to decompose the webpage data into a plurality of layout sections or attribute areas according to a webpage structure in the database; and correspondingly obtaining the webpage data according to each information category in the database. Get descriptive information in the layout section or attribute area;
  • the presentation module 5 is adapted to display the description information acquired by the analysis module 4 together with the webpage data searched by the corresponding search module 3 as a search result.
  • the network search system includes: a database management module 1, a database 2, a search module 3, an analysis module 4, and a presentation module 5.
  • Database management module 1 database 2, search module 3, analysis module 4 and presentation module
  • the network search system further includes: an update detection module 7;
  • the update detection module 7 is adapted to detect and update the change of the description information that is displayed by the presentation module 5 periodically or in real time;
  • the presentation module 5 is further adapted to receive the notification refresh page of the update detection module 7 to display the updated description information together with the corresponding webpage data.
  • the system of the present invention will be described below with reference to an embodiment. As shown in FIG. 8, it is a structural diagram of a fourth system according to an embodiment of the present invention.
  • the network search system includes: a database management module
  • Database Search module 3. Analysis module 4. Presentation module 5 and point selection detection module 6.
  • the functions of the database management module 1, the database 2, the search module 3, the analysis module 4, the presentation module 5, and the point selection detection module 6 are as described above, and will not be described again.
  • the network search system further includes: an update detection module 7;
  • the update detection module 7 is adapted to detect and update the description information of the presentation module 5 in a periodic or real-time manner
  • the presentation module 5 is further adapted to receive the notification refresh page of the update detection module 7 to display the updated description information together with the corresponding webpage data.
  • the network search system includes: a database management module 1, a database 2, a search module 3, an analysis module 4, and a presentation module 5.
  • the functions of the database management module 1, the database 2, the search module 3, the analysis module 4, and the presentation module 5 are as described above, and will not be described again.
  • the network search system further includes: a trigger entry generation module 8, a trigger detection module 9 and a preview module 10;
  • the trigger entry generation module 8 is adapted to generate a trigger entry of a preview operation of the webpage data
  • the presentation module 5 is further adapted to display the trigger entry generated by the trigger entry generation module 8 together with corresponding webpage data and description information;
  • the trigger detection module 9 is adapted to detect that the cursor is notified to the preview module 10 when the trigger entry displayed by the presentation module 5 stays longer than a preset duration;
  • the preview module 10 is adapted to: when receiving the notification of the trigger detection module, intercept the preset length of the webpage data for loading and displaying; the displaying comprises: displaying or removing all webpage rendering effects in a thumbnail form After the display.
  • the network search system includes: a database management module 1, a database 2, a search module 3, an analysis module 4, a presentation module 5, and a selection detection module 6.
  • the functions of the database management module 1, the database 2, the search module 3, the analysis module 4, the presentation module 5, and the click detection module 6 are as described above and will not be described again.
  • the network search system further includes: a trigger entry generation module 8, a trigger detection module 9 and a preview module 10;
  • the trigger entry generation module 8 is adapted to generate a trigger entry of a preview operation of the webpage data
  • the presentation module 5 is further adapted to display the trigger entry generated by the trigger entry generation module 8 together with corresponding webpage data and description information;
  • the trigger detection module 9 is adapted to detect that the cursor is notified to the preview module 10 when the trigger entry stays longer than a preset duration
  • the preview module 10 is adapted to: when receiving the notification of the trigger detection module, intercept the preset length of the webpage data for loading and displaying; the displaying comprises: displaying or removing all webpage rendering effects in a thumbnail form After the display.
  • the network search system includes: a database management module 1, a database 2, a search module 3, an analysis module 4, a presentation module 5, and an update detection module 7.
  • the functions of the database management module 1, the database 2, the search module 3, the analysis module 4, the presentation module 5, and the update detection module 7 are as described above, and will not be described again.
  • the network search system further includes: a trigger entry generation module 8, a trigger detection module 9 and a preview module 10;
  • the trigger entry generation module 8 is adapted to generate a trigger entry of a preview operation of the webpage data
  • the presentation module 5 is further adapted to display the trigger entry generated by the trigger entry generation module 8 together with corresponding webpage data and description information;
  • the trigger detection module 9 is adapted to detect that the cursor is notified to the preview module 10 when the trigger entry stays longer than a preset duration
  • the preview module 10 is adapted to: when receiving the notification of the trigger detection module, intercept the preset length of the webpage data for loading and displaying; the displaying comprises: displaying or removing all webpage rendering effects in a thumbnail form After the display.
  • the network search system includes: a database management module 1, a database 2, a search module 3, an analysis module 4, a presentation module 5, a point selection detection module 6, and an update detection module 7.
  • check detection module 6 and the update detection module 7 are as described above, and will not be described again.
  • the network search system further includes: a trigger entry generation module 8, a trigger detection module 9 and a preview module 10;
  • the trigger entry generation module 8 is adapted to generate a trigger entry of a preview operation of the webpage data
  • the presentation module 5 is further adapted to display the trigger entry generated by the trigger entry generation module 8 together with corresponding webpage data and description information;
  • the trigger detection module 9 is adapted to detect that the cursor is notified to the preview module 10 when the trigger entry stays longer than a preset duration
  • the preview module 10 is adapted to: when receiving the notification of the trigger detection module, intercept the preset length of the webpage data for loading and displaying; the displaying comprises: displaying or removing all webpage rendering effects in a thumbnail form After the display.
  • the various component embodiments of the present invention may be implemented in hardware, or in a software module running on one or more processors, or in a combination thereof.
  • a microprocessor or digital signal processor may be used in practice to implement some or all of the functionality of some or all of the components of the network search system in accordance with embodiments of the present invention.
  • the invention can also be implemented as a part or all of a device or device program (e.g., a computer program and a computer program product) for performing the methods described herein.
  • a program implementing the present invention may be stored on a computer readable medium or may be in the form of one or more signals. Such signals may be downloaded from an Internet website, provided on a carrier signal, or provided in any other form.
  • Figure 13 illustrates a server, such as an application server, that can implement the network search method in accordance with the present invention.
  • the server conventionally includes a processor 1310 and a computer program product or computer readable medium in the form of a memory 1320.
  • the memory 1320 may be an electronic memory such as a flash memory, an EEPROM (Electrically Erasable Programmable Read Only Memory), an EPROM, a hard disk, or a ROM.
  • Memory 1320 has a storage space 1330 for program code 1331 for performing any of the method steps described above.
  • the storage space 1330 for program code may include respective program codes 1331 for implementing various steps in the above methods, respectively.
  • These program codes can be read from or written to one or more computer program products.
  • One or more computer program products are examples of program products.
  • Such computer program products include program code carriers such as hard disks, compact disks (CDs), memory cards or floppy disks.
  • Such a computer program product is typically a portable or fixed storage unit as described with reference to FIG.
  • the storage unit may have a storage section, a storage space, and the like arranged similarly to the storage 1320 in the server of FIG.
  • the program code can be compressed, for example, in an appropriate form.
  • the storage unit includes computer readable code 133 ⁇ , i.e., code readable by a processor, such as 1310, that when executed by the server causes the server to perform various steps in the methods described above.
  • an embodiment or “one or more embodiments” as used herein means that the particular features, structures, or characteristics described in connection with the embodiments are included in at least one embodiment of the invention.
  • the phrase “in one embodiment” herein does not necessarily refer to the same embodiment.
  • any reference signs placed between parentheses shall not be construed as a limitation.
  • the word “comprising” does not exclude the presence of the elements or steps that are not in the claims.
  • the word “a” or “an” preceding a component does not exclude the presence of a plurality of such elements.
  • the invention can be implemented by means of hardware comprising several distinct elements and by means of a suitably programmed computer. In the unit claims enumerating several means, several of these means can be embodied by the same hardware item.
  • the use of the words first, second, and third does not indicate any order. These words can be interpreted as names.

Abstract

本发明公开了一种网络搜索方法及网络搜索系统,其中所述方法包括:提取社交网站的网页结构及信息类别构成数据库;根据提交的关键词搜索与所述关键词相关的网页数据;根据所述数据库对搜索到的与所述关键词相关的所述网页数据进行分析,获取所述网页数据的描述信息,所述描述信息与所述社交网站的信息类别相适应;将所述描述信息随相应的网页数据作为搜索结果共同展现。本发明对于网站进行格式化分析,并完成专业维度的细化信息抽取,最终获取论坛和博客等社交网站类型的描述信息,并将具有论坛、博客特色的描述信息作为检索结果显示。

Description

一种网络搜索方法及网络搜索系统 技术领域
本发明涉及计算机技术领域, 尤其涉及一种网络搜索方法及网络搜 索系统。 背景技术
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜 集信息, 在对信息进行组织和处理后, 为用户提供检索服务, 将用户检 索相关的信息展示给用户的系统。 用户输入关键词进行检索, 搜索引擎 从索引数据库中找到匹配该关键词的网页, 为了用户便于判断, 除了网 页标题和 URL外还会提供一段来自网页的摘要以及其他信息。
但是传统的搜索引擎对搜索结果的展示通常是不进行详细专业维度 的格式化分析的, 只能够获取如标题、 摘要、 链接、 发表时间等常规信 息, 因此传统的搜索引擎的所有结果一般只显示网页标题、 摘要、 网页 链接、 发表时间。
但是对于论坛和博客等社交网站类型的网页, 除了网页标题、 摘要、 网页链接、 发表时间等常规信息外, 还有如浏览数、 回复数等具有社交 网站特色的属性, 对于论坛和博客的用户对于这类属性往往更加感兴趣, 这类属性可以帮助用户判断网页的热度等等。
然而传统的搜索引擎因为不具备专业维度的格式化分析能力, 因此 并不能够向用户展示出这部分信息。 因此, 如果获得一种能够特别适于 论坛和博客等社交网站类型的网页的网络搜索和展示方式, 即成为亟待 解决的技术问题。 发明内容
鉴于上述问题, 提出了本发明以便提供一种克服上述问题或者至少 部分地解决或者减緩上述问题的网络搜索方法及网络搜索系统。
根据本发明的一个方面, 提供了一种网络搜索系统, 其包括: 数椐 库管理模块、 数据库、 搜索模块、 分析模块和展现模块, 其中, 所述数 椐库管理模块, 适于提取与社交网站相关的网页结构及信息类别构成数据 库; 所述数据库, 适于保存与社交网站相关的网! [结构及信息类别; 所述 搜索模块, 适于根据提交的关键词搜索与^述关键词相关的网百数据; 所 述分析模块, 适于根据 述数据库对搜索到的与 述关键词相关的 述网 数据进行分析 获取所述网 数据的描述信息, 所述描述信息与所述社交 网站的信息类別相适应; 所述展现模块, 适于将所述描述信息随相应的网 ^数据作为搜索结果共同展现。
根据本发明的另一个方面, 提供了一种网络搜索方法, 其包括: 提 取社交网站的网^结构及信息类别构成数据库;根据提交的关键词搜索与所 述关键词相关的网页数据; 根据所述.数据库对搜索到的与所述关键词相关的 所述.网页数据进行分柝, 获取所述.网页数据的描述信息、 所述描述信息与所 述.社交网站的信息类别相适应; 将所述描述信息随相应的网页数据作为搜索 结果共同展现。
根据本发明的又一个方面, 提供了一种计算机程序, 其包括计算机 可读代码, 当所述计算机可读代码在服务器上运行时, 导致所述服务器 执行根据权利要求 9-16中的任一个所述的网络搜索方法。
根据本发明的再一个方面, 提供了一种计算机可读介质, 其中存储 了如权利要求 17所述的计算机程序。
本发明的有益效果为:
1 )本发明对于网站进行 ·格式化分析, 并完成专业维度的细化信息抽取, 最终获取论坛和博客等社交网站类型的描述信息, 并将具有论坛, 博客特色 的描述信息作为检索结果的一部分进行突出显示, 让用户可以通过这些描述 快速了解网页的基本情况, 例如通过对点击回复次数的判断可以获知热门程 度等。
2 ) 在搜索结杲展示形式上增加了来源名称、 作者名称、 浏宽次数、 回 复次数的描述信息后, 特别对于来源名称、 作者名称, 还可以在点击来涯名 称、 作者名称后按照来源名称、 作者名称进行搜索, 极大地方便了用户的搜 索效率和搜索范围的精确制定。
3 )所述描述信息中的所述网页数据的来源名称、所述网页数据的作 者名称、 所述网页数据的浏览次数、 所述网页数据的回复次数在随网页 数据完成展现后很可能会发生变化, 尤其浏览次数和回复次数更是会随 时发生变化, 本发明在展现描述信息等搜索结果时还不断刷新页面进行 更新。 上述说明仅是本发明技术方案的概述, 为了能够更清楚了解本发明 的技术手段, 而可依照说明书的内容予以实施, 并且为了让本发明的上 述和其它目的、 特征和优点能够更明显易懂, 以下特举本发明的具体实 施方式。 附图说明
通过阅读下文优选实施方式的详细描述, 各种其他的优点和益处对 于本领域普通技术人员将变得清楚明了。 附图仅用于示出优选实施方式 的目的, 而并不认为是对本发明的限制。 而且在整个附图中, 用相同的 参考符号表示相同的部件。 在附图中:
图 1示意性示出了根据本发明一个实施例的第一方法流程图; 图 2示意性示出了根据本发明一个实施例的第二方法流程图; 图 3示意性示出了根据本发明一个实施例的第三方法流程图; 图 4示意性示出了根据本发明一个实施例的第四方法流程图; 图 5示意性示出了根据本发明一个实施例的第一系统架构图; 图 6示意性示出了根据本发明一个实施例的第二系统架构图; 图 7示意性示出了根据本发明一个实施例的第三系统架构图; 图 8示意性示出了根据本发明一个实施例的第四系统架构图; 图 9示意性示出了根据本发明一个实施例的第五系统架构图; 图 10示意性示出了根据本发明一个实施例的第六系统架构图; 图 11示意性示出了根据本发明一个实施例的第七系统架构图; 图 12示意性示出了根据本发明一个实施例的第八系统架构图; 图 13示意性地示出了用于执行根据本发明的方法的服务器的框图; 以及
图 14示意性地示出了用于保持或者携带实现根据本发明的方法的程 序代码的存储单元。 具体实施例
下面结合附图和具体的实施方式对本发明作进一步的描述。
本发明的核心构思在于: 提取与社交网站相关的网页结构及信息类别构 成数 庳; 根据提交的关键词搜索与所述关键词相关的网页数椐; 根椐所述 数据库对搜索到的与所述关键词相关的所述网页数据进行分析, 获取所述网 数据的描述信息 所述描述信息与所述社交网站的信息类别相适应; 将所 述描述信息随相应的网页数据作为搜索结果共同展现。
以下以一实施例对本发明的方法进行说明。 如图 1 所示, 为本发明 实施例的第一方法流程图, 执行如下操作:
步骤 S101 , 提取社交阔站的网页结构及信息类别抅成数据戽。
网页结构
对于内容、 色彩、 功能丰富的网页进行逻辑规划, 从而将网页抽象 成布局板块或属性区域, 所述布局板块或属性区域即为网^结构、 所述 网页结构可以是各社交网站的个性网 结构,也可以是通过统计汇总各杜交 网站得到的通用网页结构;
属性区域可以粗略的分为 head区域和 body区域, 也可以细致的分 为题目区域、 作者区域、 关键字区域、 网页信息区域、 背景区域、 音乐 区域、 字体区域、 文本区域、 链接区域;
当然, 除了上述抽象的属性区域的划分方法, 也可以依据网页内容 进行形象的布局板块划分, 例如内容导航区、 链接信息区、 正文信息区、 交互操作区、 站点信息区。
信息类別
信息类别是指对于社交网站来说较为重要、有价值的特色信息类别, 例如回复次数、 浏览次数等等。 信息类别可以是各社交网站的个性信息类 另 也可以是通过统计汇总各社交网站得到的通用信息类别。 所述社交网 站, 至少包括以下一种或多种的组合: 论坛、 贴吧、 公告栏、 群组讨论网 站、 在线聊天网站、 交友网站、 个人空间、 博客、 微博、 其它社交网站。
步骤 S201 , 根据提交的关键词搜索与所述关键词相关的网页数据。 步骤 S301 , 根据所述数据库对搜索到的与/ ^述关键词相关的所述网 页数据进行分析, 获取所述网页数据的描述信息, 所述描述信息与所述 社交网站的信息类别相适应。 网页数据打散为若干区域, 所述区域的划分如步骤 S101 中所述, 可以 按照布局板块或属性区域来划分;这种方式有利于专业维度的细化分析, 一般相应的描述信息会在特定的布局板块或属性区域, 描述信息与布局 板块或属性区域存在一种对应关系,这样便于快速定位描述信息的位置, 例如: 所述网页数据的作者名称一般位于作者区域;
根据所述数据库中的各个信息类别到所述网页数据格式化后得到的 相应区域中获取描述信息, 所述描述信息与所述社交网站的信息类别相 适应, 所述描述信息至少应该包括以下一种或多种的组合: 所述网页数 据的来源名称、 所述网页数据的作者名称、 所述网页数据的浏览次数、 所述网页数据的回复次数。
步骤 S401 , 将所述描述信息随相应的网页数据作为搜索结果共同展 现。
本发明对于网站进行格式化分析、 并完成专业维度的细化信息抽取, 最 终获取论坛和博客等杜交网站类型的描述信息, 并将具有论坛、 博客特色的 描述信息进行突出显示, 让用户可以通过这些描述快速了解网页的基本情 况 例如通过对点击回复次数的判断可以获知热门程度等。
以下再以一实施例对本发明的方法进行说明。 如图 2所示, 为本发 明实施例的第二方法流程图。 所述描述信息中的所述网页数据的来源名 称、 所述网页数据的作者名称、 所述网页数据的浏览次数、 所述网页数 据的回复次数在随网页数据完成展现后很可能会发生变化, 尤其浏览次 数和回复次数更是会随时发生变化, 对于这类敏感信息, 在步骤 S401 中完成展现后, 还应该进行如下操作:
步骤 S501 , 周期性或实时地检测展现的所述描述信息的变化并更 新;
步骤 S502 , 刷新页面将更新的描述信息随相应的网页数据共同展 现。
以下再以一实施例对本发明的方法进行说明。 如图 3所示, 为本发 明实施例的第三方法流程图。如果无法打开某个搜索结果或者打开速度特 别慢, 可以通过预览方式快速浏览网页数据, 预览页面还是直接从原网 页调用。 因此在步骤 S401中完成展现后, 还可以进行如下操作:
步骤 S601 , 将所述网百数据的预览操作的触发入口与相应的网页数据 及描述信息共同展现;
步骤 S602 , 检测到光标在所述触发入口停留超过一预设时长.; 步骤 S603 , 截取预设长度的所述网页数椐进行加载并进行显示; 所述显示包括: 缩略图形式显示或去除所有网页渲染效果后显示。 去除所有网^渲染效果是指只保留文本内容, 图片、 音乐等非文本信 息会被去除。
以下再以一实施例对本发明的方法进行说明。 如图 4所示, 为本发 明实施例的第四方法流程图。 在搜索结杲.展示形式上增加了来源名称、 作者 名称、 浏览次数、 回复次数的描述信息后, 特别对于来源名称 作者名称, 还可以在点击来源名称、 作者名称后按照来源名称、 作者名称进行搜索, 极 大地方便了用户的搜索效率和搜索范围的精确制定。在步骤 S401中完成展 现后, 还可以进行如下操作:
步骤 S701 , 检测对展现的所述描述信息的触发事件, 所述描述信息至 少包括: 所述网页数据的来源名称和 /或所迷网页数据的作者名称;
所述来源名称、 包括: 论坛名称、 博客名称、 板块名称等等。
步骤 S702 , 根据所述事件触发以所述描述信息作为关键词搜索, 其搜 索与所述描述信息相关的网页数据;
步骤 S703 , 根据所述数据库对搜索到的所述网页数据进行分析, 获取 所述网页数据的描述信息;
步骤 S704 ,将所述描述信息随.相应的网百数据作为搜索结果共同展现。 以下以四个实施例描述本发明的系统, 所述系统与上述方法流程对 应, 不足之处可参考上述方法部分。
以下以一实施例对本发明的系统进行说明, 如图 5所示, 为本发明 实施例的第一系统结构图。 所述网络搜索系统, 包括: 数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块 5 , 其中,
所述数据库管理模块 1 , 适于提取与社交网站相关的网页结构及信 息类别构成数据库 2 ;
所述数据库 2 , 适于保存与社交网站相关的网页结构及信息类别; 所述搜索模块 3 , 适于根据提交的关键词搜索与所述关键词相关的 网页数据;
所述分析模块 4 , 适于根据所述数据库 2对所述搜索模块 3搜索到 的与所述关键词相关的网页数据进行分析, 获取所述网页数据的描述信 息, 所述描述信息与所述社交网站的信息类别相适应; 具体来说, 进一 步适于根据所述数据库中的网页结构将所述网页数据分解为若干布局板 块或属性区域; 再根据所述数据库中的各个信息类别在所述网页数据分 解后得到的相应布局板块或属性区域中去获取描述信息;
所述展现模块 5 , 适于将所述分析模块 4获取的描述信息随相应的 所述搜索模块 3搜索到的网页数据作为搜索结果共同展现。
以下再以一实施例对本发明的系统进行说明, 如图 6所示, 为本发 明实施例的第二系统结构图。 所述网络搜索系统, 包括: 数据库管理模块
1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块 5。
数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块
5的功能如前所述, 不再赘述。
所述网络搜索系统, 还包括: 点选检测模块 6;
所述点选检测模块 6, 适于检测对展现模块 5展现的所述描述信息的 触发事件,所迷描述信息至少包括: 所述网页数据的来源名称和 /或所述网页 数据的作者名称;
所述搜索模块 3 , 还适于以所述点选检测模块 6检测到的事件触发 以所述描述信息作为关键词的搜索 其搜索与所述描述信息相关的网 数 据;
所述分析模块 4, 适于根据所述数据库 2对所述搜索模块 3搜索到 的网页数据进行分析, 获取所述网页数据的描述信息, 所述描述信息与 所述社交网站的信息类别相适应; 具体来说, 进一步适于根据所述数据 库中的网页结构将所述网页数据分解为若干布局板块或属性区域; 再根 据所述数据库中的各个信息类别在所述网页数据分解后得到的相应布局 板块或属性区域中获取描述信息;
所述展现模块 5 , 适于将所述分析模块 4获取的描述信息随相应的 所述搜索模块 3搜索到的网页数据作为搜索结果共同展现。
以下再以一实施例对本发明的系统进行说明, 如图 7所示, 为本发 明实施例的第三系统结构图。 所述网络搜索系统, 包括: 数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块 5。
数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块
5的功能如前所述, 不再赘述。
所述网络搜索系统, 还包括: 更新检测模块 7;
所述更新检测模块 7 , 适于周期性或实时地检测所述展现模块 5展 现的所述描述信息的变化并更新;
所述展现模块 5 ,还适于接收所述更新检测模块 7的通知刷新页面将 更新的描述信息随相应的网页数据共同展现。 以下再以一实施例对本发明的系统进行说明, 如图 8所示, 为本发 明实施例的第四系统结构图。 所述网络搜索系统, 包括: 数据库管理模块
1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5和点选检测模块 6。
数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5和点选检测模块 6的功能如前所述, 不再赘述。
所述网络搜索系统, 还包括: 更新检测模块 7 ;
所述更新检测模块 7 , 适于周期性或实时地检测所述展现模块 5展 现的所述描述信-息的变化并更新;
所述展现模块 5 ,还适于接收所述更新检测模块 7的通知刷新页面将 更新的描述信息随相应的网页数据共同展现。
以下再以一实施例对本发明的系统进行说明, 如图 9所示, 为本发 明实施例的第五系统结构图。 所述网络搜索系统, 包括: 数据库管理模 块 1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块 5。
数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4和展现模块 5的功能如前所述, 不再赘述。
所述网络搜索系统, 还包括: 触发入口生成模块 8、 触发检测模块 9 及预览模块 10;
所述触发入口生成模块 8 , 适于生成所述网页数据的预览操作的触 发入口;
所述展现模块 5 , 还适于将所述触发入口生成模块 8生成的触发入 口与相应的网页数据及描述信息共同展现;
所述触发检测模块 9 , 适于检测到光标在所述展现模块 5展现的触 发入口停留超过一预设时长时通知所述预览模块 10;
所述预览模块 10 , 适于当收到所述触发检测模块的通知时, 截取预设 长度的所述网页数据进行加载并进行显示; 所述显示包括: 缩略图形式 显示或去除所有网页渲染效果后显示。
以下再以一实施例对本发明的系统进行说明, 如图 10所示, 为本发 明实施例的第六系统结构图。 所述网络搜索系统, 包括: 数据库管理模 块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5和点选检测模块 6。
数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5和点选检测模块 6的功能如前所述, 不再赘述。 所述网络搜索系统, 还包括: 触发入口生成模块 8、 触发检测模块 9 及预览模块 10;
所述触发入口生成模块 8 , 适于生成所述网页数据的预览操作的触 发入口;
所述展现模块 5 , 还适于将所述触发入口生成模块 8生成的触发入 口与相应的网页数据及描述信息共同展现;
所述触发检测模块 9 , 适于检测到光标在所述触发入口停留超过一 预设时长时通知所述预览模块 10;
所述预览模块 10 , 适于当收到所述触发检测模块的通知时, 截取预设 长度的所述网页数据进行加载并进行显示; 所述显示包括: 缩略图形式 显示或去除所有网页渲染效果后显示。
以下再以一实施例对本发明的系统进行说明, 如图 11所示, 为本发 明实施例的第七系统结构图。 所述网络搜索系统, 包括: 数据库管理模 块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5和更新检测模块 7。
数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5和更新检测模块 7的功能如前所述, 不再赘述。
所述网络搜索系统, 还包括: 触发入口生成模块 8、 触发检测模块 9 及预览模块 10;
所述触发入口生成模块 8 , 适于生成所述网页数据的预览操作的触 发入口;
所述展现模块 5 , 还适于将所述触发入口生成模块 8生成的触发入 口与相应的网页数据及描述信息共同展现;
所述触发检测模块 9 , 适于检测到光标在所述触发入口停留超过一 预设时长时通知所述预览模块 10;
所述预览模块 10 , 适于当收到所述触发检测模块的通知时, 截取预设 长度的所述网页数据进行加载并进行显示; 所述显示包括: 缩略图形式 显示或去除所有网页渲染效果后显示。
以下再以一实施例对本发明的系统进行说明, 如图 12所示, 为本发 明实施例的第八系统结构图。 所述网络搜索系统, 包括: 数据库管理模 块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块 5、 点选检测模块 6 和更新检测模块 7。 数据库管理模块 1、 数据库 2、 搜索模块 3、 分析模块 4、 展现模块
5、 点选检测模块 6和更新检测模块 7的功能如前所述, 不再赘述。
所述网络搜索系统, 还包括: 触发入口生成模块 8、 触发检测模块 9 及预览模块 10;
所述触发入口生成模块 8 , 适于生成所述网页数据的预览操作的触 发入口;
所述展现模块 5 , 还适于将所述触发入口生成模块 8生成的触发入 口与相应的网页数据及描述信息共同展现;
所述触发检测模块 9 , 适于检测到光标在所述触发入口停留超过一 预设时长时通知所述预览模块 10;
所述预览模块 10 , 适于当收到所述触发检测模块的通知时, 截取预设 长度的所述网页数据进行加载并进行显示; 所述显示包括: 缩略图形式 显示或去除所有网页渲染效果后显示。
需要说明的是, 在不冲突的情况下, 本发明中的实施例及实施例中的特 征可以相互任意组合。
本发明的各个部件实施例可以以硬件实现, 或者以在一个或者多个 处理器上运行的软件模块实现, 或者以它们的组合实现。 本领域的技术 人员应当理解, 可以在实践中使用微处理器或者数字信号处理器 (DSP ) 来实现根据本发明实施例的网络搜索系统中的一些或者全部部件的一些 或者全部功能。 本发明还可以实现为用于执行这里所描述的方法的一部 分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。 这样的实现本发明的程序可以存储在计算机可读介质上, 或者可以具有 一个或者多个信号的形式。 这样的信号可以从因特网网站上下载得到, 或者在载体信号上提供, 或者以任何其他形式提供。
例如, 图 13示出了可以实现根据本发明的网络搜索方法的服务器, 例如应用服务器。 该服务器传统上包括处理器 1310和以存储器 1320形 式的计算机程序产品或者计算机可读介质。存储器 1320可以是诸如闪存、 EEPROM (电可擦除可编程只读存储器 ) 、 EPROM、 硬盘或者 ROM之 类的电子存储器。 存储器 1320具有用于执行上述方法中的任何方法步骤 的程序代码 1331的存储空间 1330。例如,用于程序代码的存储空间 1330 可以包括分别用于实现上面的方法中的各种步骤的各个程序代码 1331。 这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这 一个或者多个计算机程序产品中。 这些计算机程序产品包括诸如硬盘, 紧致盘 (CD ) 、 存储卡或者软盘之类的程序代码载体。 这样的计算机程 序产品通常为如参考图 14所述的便携式或者固定存储单元。 该存储单元 可以具有与图 13 的服务器中的存储器 1320类似布置的存储段、 存储空 间等。 程序代码可以例如以适当形式进行压缩。 通常, 存储单元包括计 算机可读代码 133 Γ , 即可以由例如诸如 1310之类的处理器读取的代码, 这些代码当由服务器运行时, 导致该服务器执行上面所描述的方法中的 各个步骤。
本文中所称的 "一个实施例"、 "实施例"或者"一个或者多个实施例 "意 味着, 结合实施例描述的特定特征、 结构或者特性包括在本发明的至少 一个实施例中。 此外, 请注意, 这里"在一个实施例中"的词语例子不一定 全指同一个实施例。
在此处所提供的说明书中, 说明了大量具体细节。 然而, 能够理解, 本发明的实施例可以在没有这些具体细节的情况下被实践。 在一些实例 中, 并未详细示出公知的方法、 结构和技术, 以便不模糊对本说明书的 理解。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限 制, 并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计 出替换实施例。 在权利要求中, 不应将位于括号之间的任何参考符号构 造成对权利要求的限制。单词"包含"不排除存在未列在权利要求中的元件 或步骤。 位于元件之前的单词 "一"或"一个"不排除存在多个这样的元件。 本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计 算机来实现。 在列举了若干装置的单元权利要求中, 这些装置中的若干 个可以是通过同一个硬件项来具体体现。 单词第一、 第二、 以及第三等 的使用不表示任何顺序。 可将这些单词解释为名称。
此外, 还应当注意, 本说明书中使用的语言主要是为了可读性和教 导的目的而选择的, 而不是为了解释或者限定本发明的主题而选择的。 因此, 在不偏离所附权利要求书的范围和精神的情况下, 对于本技术领 域的普通技术人员来说许多修改和变更都是显而易见的。 对于本发明的 范围, 对本发明所做的公开是说明性的, 而非限制性的, 本发明的范围 由所附权利要求书限定。

Claims

权 利 要 求
1、 一种网络搜索系统, 其包括: 数据库管理模块、 数据库、 搜索模 块、 分析模块和展现模块, 其中,
所述数据库管理模块, 适于提取与社交网站相关的网页结构及信息类 别构成数椐库;
所述数椐库, 适于保存与社交网站相关的网页结构及信息类别; 所述搜索模块, 适于根据提交的关键词搜索与所述关键:词相关的网页 数据;
所述分析模块, 适于根据所述数据库对搜索到的与所迷关健词相关的 所迷网页数据进行分析, 获取所迷网页数据的描述信息, 所述描述信息与所 述社交网站的信息类别相适应;
所述展现模块, 适于将所述描述信息随相应的网页数据作为搜索结果 共同展现。
2、 如权利要求 1所述的网络搜索系统, 其中, 还包括: 点逸检测模 块;
所述点选检测模块, 适于检测对展现的所述描述信息的触发事件, 所 述描述信息至少包括:所述网页数据的東源名称和 /或所述网页数椐的作者名 称;
所述搜索模块,还适于根据所述事件触发以所述描述信息作为关键:词 的搜索, 其搜索与所述描述信息相关的网页数据。
3、 如权利要求 1或 2所述的网络搜索系统, 其中,
所述分析模块, 进一步适于根据所述数据库中的网页结构将所述网 页数据分解为若干布局板块或属性区域; 再根据所述数据库中的各个信 息类别在所述网页数据分解后得到的相应布局板块或属性区域中获取描 述信息。
4、 如权利要求 1-3中任一项所述的网络搜索系统, 其中, 还包括: 更新检测模块;
所述更新检测模块,适于周期性或实时地检测展现的 述描述信息的 变化并更新;
所述展现模块, 还适于接收所述更新检测模块的通知剩新页面将更 新的描述信息随相应的网页数椐共同展现。
5、 如权利要求 1-4中任一项所述的网络搜索系统, 其中, 还包括: 触发入口生成模块、 触发检测模块及预览模块;
所述触发入口生成模块, 适于生成 述网! [数据的预览操作的触发入
P;
所述展现模块, 还适于将^迷触发入口与相应的网页数据及描迷信息 共同展现;
所述 发检测模块 ,适于检测到光标在所述触发入口停留超过一预设时 长时通知所述预览模块;
所述預览模块,适于当收到所述触发检测模块的通知时,截取 设长度 的所述.网页数据进行加载并进行显示 t.
6、 如权利要求 1-5中任一项所述的网络搜索系统, 其中,
所述显示, 包括: 缩略图形式显示或去除/ ^有网 渲染效杲后显示。
7、 如权利要求 1-6中任一项所述的网络搜索系统, 其中,
所述分析模块获取的所述描述信息 至少包括以下一种或多种的组合: 所述网页数据的来源名称、 述网百数据的作者名称、 所述网页数据的浏览 次数、 所述网页数据的回复次数。
8、 如权利要求 1-7中任一项所述的网络搜索系统, 其中, 交网站的个性网 ^结构及个性信息类别,和 /或各社交网站的通用网页结构及 通用信息类別。
9、 一种网络搜索方法, 其包括: 根据提交的关键词搜索与所述.关键词相关的网页数据;
根据^述数据庠对搜索到的与所述关键词相关的所述网 n数据进行分 析 获取所述网! [数据的描述信息, ^述描述信息与^述社交网站的信息类 别相 i 应;
将所述描述信息随.相应的网百数据作为搜索结果共同展现。
10、 如权利要求 9 所述的网络搜索方法, 其中, 将所述描述信息随 所述网页数据共同展现之后 还包括:
检测对展现的所述描述信息的 发事件, 所述描述信息至少包括: 所述 网页数据的東源名称和 /或所述网页数椐的作者名称;
根据所述事件触发以所述描述信息作为关键词的搜索, 其搜索与所述 描述信息相关的网! [数据;
根据所述数据库对搜索到的所述网页数椐进行分析, 获取所述网页数据 的描述信息;
将所述描述信息随相应的网 数据作为搜索结果共同展现。
11、 如权利要求 9或 10所述的网络搜索方法, 其中, 根据所述数据 库对所述网页数椐进行分析, 荻取所述网页数椐的描述信息, 进一步包括: 根据所述数据库中的网页结构将所述网页数据分解为若干布局板块 或属性区域, 再根据所述数据库中的各个信息类别在所述网页数据分解 后得到的相应布局板块或属性区域中获取描述信息。
12、 如权利要求 9-11中任一项所述的网络搜索方法, 其中, 将所述 描迷信息随所述网页数据共同展现之后, 还包括:
周期性或实时地检测展现的所述描述信息的变化并更新;
刷新页面将更新的描述信息随相应的网百数据共同展现。
13、 如权利要求 9-12中任一项所述的网络搜索方法, 其中, 将所述 描述信息随.相应的网百数据共同展现之后, 还包括:
将 述网页数据的预览操作的触发入口与相应的网! [数据及描述信息 共同展现;
检测到光标在所述触发入口停留超过一预设时长;
截取预设长度的所述网页数椐进行加载并进行显示„
14、 如权利要求 9-13中任一项所述的网络搜索方法, 其中, 所述显示, 包括: 缩略图形式显示或去除^有网页渲染效杲后显示。
15、 如权利要求 9-14中任一项所述的网络搜索方法, 其中, 所述描述信息, 至少包括以下一种或多种的组合: 所述网页数据的来源 名称、 所述网页数据的作者名称、 所述网页数据的浏宽次数、 所述网页数据- 的回复次数。
16、 如权利要求 9-15中任一项所述的网络搜索方法, 其中, 所述网页结构及信息类别, 包括: 各社交网站的个性网页结构及个性信 息类別, 和 /或各社交网站的通用网页结构及通用信息类别;
所述社交网站, 至少包括以下一种或多种的组合: 论坛、 贴吧、公告栏、 群组讨论网站、 在线聊天网站、 交友网站、 个人空间、 博客、 微博、 其它社 交网站。
17、 一种计算机程序, 包括计算机可读代码, 当所述计算机可读代 码在服务器上运行时, 导致所述服务器执行根据权利要求 9-16中的任一 个所述的网络搜索方法。
18、 一种计算机可读介质, 其中存储了如权利要求 17所述的计算机 程序。
PCT/CN2013/077153 2012-06-28 2013-06-13 一种网络搜索方法及网络搜索系统 WO2014000576A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/411,206 US10380197B2 (en) 2012-06-28 2013-06-13 Network searching method and network searching system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210222564.0A CN102760172B (zh) 2012-06-28 2012-06-28 一种网络搜索方法及网络搜索系统
CN201210222564.0 2012-06-28

Publications (1)

Publication Number Publication Date
WO2014000576A1 true WO2014000576A1 (zh) 2014-01-03

Family

ID=47054629

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/077153 WO2014000576A1 (zh) 2012-06-28 2013-06-13 一种网络搜索方法及网络搜索系统

Country Status (3)

Country Link
US (1) US10380197B2 (zh)
CN (3) CN104820685B (zh)
WO (1) WO2014000576A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978408A (zh) * 2015-08-05 2015-10-14 许昌学院 基于Berkeley DB数据库的主题爬虫系统

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820685B (zh) * 2012-06-28 2019-02-22 北京奇虎科技有限公司 一种社交类网络搜索方法及社交类网络搜索系统
CN103823808A (zh) * 2012-11-16 2014-05-28 云壤(北京)信息技术有限公司 利用微博短链的网页搜索系统及网页搜索方法
CN102982143A (zh) * 2012-11-22 2013-03-20 北京奇虎科技有限公司 一种网络小说的搜索方法和浏览装置
CN102999609A (zh) * 2012-11-22 2013-03-27 北京奇虎科技有限公司 网络小说搜索系统
US8788405B1 (en) 2013-03-15 2014-07-22 Palantir Technologies, Inc. Generating data clusters with customizable analysis strategies
US8937619B2 (en) 2013-03-15 2015-01-20 Palantir Technologies Inc. Generating an object time series from data objects
US9965937B2 (en) 2013-03-15 2018-05-08 Palantir Technologies Inc. External malware data item clustering and analysis
US8917274B2 (en) 2013-03-15 2014-12-23 Palantir Technologies Inc. Event matrix based on integrated data
US8924388B2 (en) 2013-03-15 2014-12-30 Palantir Technologies Inc. Computer-implemented systems and methods for comparing and associating objects
CN103744872B (zh) * 2013-12-18 2017-07-28 天脉聚源(北京)传媒科技有限公司 一种提供搜索结果的方法、装置及浏览器
US10356032B2 (en) 2013-12-26 2019-07-16 Palantir Technologies Inc. System and method for detecting confidential information emails
US9483162B2 (en) 2014-02-20 2016-11-01 Palantir Technologies Inc. Relationship visualizations
CN104035955B (zh) * 2014-03-18 2018-07-10 北京百度网讯科技有限公司 搜索方法和装置
US9857958B2 (en) 2014-04-28 2018-01-02 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive access of, investigation of, and analysis of data objects stored in one or more databases
CN104052654A (zh) * 2014-06-25 2014-09-17 金硕澳门离岸商业服务有限公司 实现网络聊天的方法及系统
US9619557B2 (en) 2014-06-30 2017-04-11 Palantir Technologies, Inc. Systems and methods for key phrase characterization of documents
US9535974B1 (en) 2014-06-30 2017-01-03 Palantir Technologies Inc. Systems and methods for identifying key phrase clusters within documents
US9202249B1 (en) 2014-07-03 2015-12-01 Palantir Technologies Inc. Data item clustering and analysis
US9256664B2 (en) 2014-07-03 2016-02-09 Palantir Technologies Inc. System and method for news events detection and visualization
US9390086B2 (en) 2014-09-11 2016-07-12 Palantir Technologies Inc. Classification system with methodology for efficient verification
US9767172B2 (en) 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9984133B2 (en) 2014-10-16 2018-05-29 Palantir Technologies Inc. Schematic and database linking system
US9483546B2 (en) 2014-12-15 2016-11-01 Palantir Technologies Inc. System and method for associating related records to common entities across multiple lists
US9367872B1 (en) 2014-12-22 2016-06-14 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
US9335911B1 (en) 2014-12-29 2016-05-10 Palantir Technologies Inc. Interactive user interface for dynamic data analysis exploration and query processing
US9727560B2 (en) 2015-02-25 2017-08-08 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10489391B1 (en) 2015-08-17 2019-11-26 Palantir Technologies Inc. Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
US9671776B1 (en) 2015-08-20 2017-06-06 Palantir Technologies Inc. Quantifying, tracking, and anticipating risk at a manufacturing facility, taking deviation type and staffing conditions into account
US9639580B1 (en) 2015-09-04 2017-05-02 Palantir Technologies, Inc. Computer-implemented systems and methods for data management and visualization
US9984428B2 (en) 2015-09-04 2018-05-29 Palantir Technologies Inc. Systems and methods for structuring data from unstructured electronic data files
US10706056B1 (en) 2015-12-02 2020-07-07 Palantir Technologies Inc. Audit log report generator
CN105512281A (zh) * 2015-12-07 2016-04-20 北京奇虎科技有限公司 官网类搜索结果页的展现方法及装置
CN105574097B (zh) * 2015-12-11 2019-05-28 北京奇虎科技有限公司 视频下载类搜索结果页的加载方法及装置
US9760556B1 (en) 2015-12-11 2017-09-12 Palantir Technologies Inc. Systems and methods for annotating and linking electronic documents
US9514414B1 (en) 2015-12-11 2016-12-06 Palantir Technologies Inc. Systems and methods for identifying and categorizing electronic documents through machine learning
US9823818B1 (en) 2015-12-29 2017-11-21 Palantir Technologies Inc. Systems and interactive user interfaces for automatic generation of temporal representation of data objects
US10871878B1 (en) 2015-12-29 2020-12-22 Palantir Technologies Inc. System log analysis and object user interaction correlation system
US9792020B1 (en) 2015-12-30 2017-10-17 Palantir Technologies Inc. Systems for collecting, aggregating, and storing data, generating interactive user interfaces for analyzing data, and generating alerts based upon collected data
US10698938B2 (en) 2016-03-18 2020-06-30 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10068199B1 (en) 2016-05-13 2018-09-04 Palantir Technologies Inc. System to catalogue tracking data
US10545975B1 (en) 2016-06-22 2020-01-28 Palantir Technologies Inc. Visual analysis of data using sequenced dataset reduction
CN106407262A (zh) * 2016-08-24 2017-02-15 百度在线网络技术(北京)有限公司 信息展现方法及装置
CN107798011A (zh) * 2016-08-31 2018-03-13 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
US10552002B1 (en) 2016-09-27 2020-02-04 Palantir Technologies Inc. User interface based variable machine modeling
US10726507B1 (en) 2016-11-11 2020-07-28 Palantir Technologies Inc. Graphical representation of a complex task
US10318630B1 (en) 2016-11-21 2019-06-11 Palantir Technologies Inc. Analysis of large bodies of textual data
GB201621434D0 (en) 2016-12-16 2017-02-01 Palantir Technologies Inc Processing sensor logs
US10249033B1 (en) 2016-12-20 2019-04-02 Palantir Technologies Inc. User interface for managing defects
US10360238B1 (en) 2016-12-22 2019-07-23 Palantir Technologies Inc. Database systems and user interfaces for interactive data association, analysis, and presentation
US11373752B2 (en) 2016-12-22 2022-06-28 Palantir Technologies Inc. Detection of misuse of a benefit system
US10762471B1 (en) 2017-01-09 2020-09-01 Palantir Technologies Inc. Automating management of integrated workflows based on disparate subsidiary data sources
US10133621B1 (en) 2017-01-18 2018-11-20 Palantir Technologies Inc. Data analysis system to facilitate investigative process
US10509844B1 (en) 2017-01-19 2019-12-17 Palantir Technologies Inc. Network graph parser
US10515109B2 (en) 2017-02-15 2019-12-24 Palantir Technologies Inc. Real-time auditing of industrial equipment condition
US10866936B1 (en) 2017-03-29 2020-12-15 Palantir Technologies Inc. Model object management and storage system
US10581954B2 (en) 2017-03-29 2020-03-03 Palantir Technologies Inc. Metric collection and aggregation for distributed software services
US10133783B2 (en) 2017-04-11 2018-11-20 Palantir Technologies Inc. Systems and methods for constraint driven database searching
US10563990B1 (en) 2017-05-09 2020-02-18 Palantir Technologies Inc. Event-based route planning
US10795749B1 (en) 2017-05-31 2020-10-06 Palantir Technologies Inc. Systems and methods for providing fault analysis user interface
US10430444B1 (en) 2017-07-24 2019-10-01 Palantir Technologies Inc. Interactive geospatial map and geospatial visualization systems
CN107562847B (zh) * 2017-08-25 2021-04-02 Oppo广东移动通信有限公司 信息处理方法及相关产品
US10877984B1 (en) 2017-12-07 2020-12-29 Palantir Technologies Inc. Systems and methods for filtering and visualizing large scale datasets
US11314721B1 (en) 2017-12-07 2022-04-26 Palantir Technologies Inc. User-interactive defect analysis for root cause
US10769171B1 (en) 2017-12-07 2020-09-08 Palantir Technologies Inc. Relationship analysis and mapping for interrelated multi-layered datasets
US11645277B2 (en) * 2017-12-11 2023-05-09 Google Llc Generating and/or utilizing a machine learning model in response to a search request
US11263382B1 (en) 2017-12-22 2022-03-01 Palantir Technologies Inc. Data normalization and irregularity detection system
US10885021B1 (en) 2018-05-02 2021-01-05 Palantir Technologies Inc. Interactive interpreter and graphical user interface
US11126638B1 (en) 2018-09-13 2021-09-21 Palantir Technologies Inc. Data visualization and parsing system
US11294928B1 (en) 2018-10-12 2022-04-05 Palantir Technologies Inc. System architecture for relating and linking data objects
CN113094382B (zh) * 2021-04-02 2022-12-06 南开大学 一种面向多来源数据管理的半自动化数据采集更新方法
CN113569170B (zh) * 2021-07-30 2024-02-20 企查查科技股份有限公司 网页表格数据提取方法、装置、计算机设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1518702A (zh) * 2001-05-04 2004-08-04 �Ҵ���˾ 网页注释系统
CN102169489A (zh) * 2010-02-26 2011-08-31 索尼公司 信息处理装置、关键字注册方法和程序
CN102760172A (zh) * 2012-06-28 2012-10-31 北京奇虎科技有限公司 一种网络搜索方法及网络搜索系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3919019B2 (ja) * 2005-10-14 2007-05-23 王子ネピア株式会社 使い捨ておむつ
CN101115024A (zh) * 2006-07-28 2008-01-30 阿里巴巴公司 一种显示网页内容相关信息的方法及系统
WO2008103682A1 (en) * 2007-02-19 2008-08-28 Viewzi Inc. Multi-view internet search mashup
CN100476830C (zh) * 2007-06-07 2009-04-08 北京金山软件有限公司 一种网络资源检索方法及系统
US9002869B2 (en) * 2007-06-22 2015-04-07 Google Inc. Machine translation for query expansion
US20090271283A1 (en) * 2008-02-13 2009-10-29 Catholic Content, Llc Network Media Distribution
CN102314435A (zh) * 2010-06-30 2012-01-11 腾讯科技(深圳)有限公司 搜索网页内容的方法及系统
CN102402519A (zh) * 2010-09-09 2012-04-04 腾讯科技(深圳)有限公司 搜索方法、搜索结果显示方法、搜索服务器及客户端
US8756121B2 (en) * 2011-01-21 2014-06-17 Target Brands, Inc. Retail website user interface
US9015141B2 (en) * 2011-02-08 2015-04-21 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to measure search results
CN102169501A (zh) * 2011-04-26 2011-08-31 北京百度网讯科技有限公司 基于搜索结果对应文档的类型信息生成摘要的方法与设备
US9026530B2 (en) * 2011-08-15 2015-05-05 Brightedge Technologies, Inc. Synthesizing search engine optimization data for directories, domains, and subdomains
US20130080900A1 (en) * 2011-09-28 2013-03-28 Microsoft Corporation Techniques for managing and viewing followed content
CN102508884A (zh) * 2011-10-18 2012-06-20 盘古文化传播有限公司 热点事件与实时评论的获取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1518702A (zh) * 2001-05-04 2004-08-04 �Ҵ���˾ 网页注释系统
CN102169489A (zh) * 2010-02-26 2011-08-31 索尼公司 信息处理装置、关键字注册方法和程序
CN102760172A (zh) * 2012-06-28 2012-10-31 北京奇虎科技有限公司 一种网络搜索方法及网络搜索系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978408A (zh) * 2015-08-05 2015-10-14 许昌学院 基于Berkeley DB数据库的主题爬虫系统

Also Published As

Publication number Publication date
US20150242401A1 (en) 2015-08-27
CN104820685B (zh) 2019-02-22
CN102760172A (zh) 2012-10-31
CN102760172B (zh) 2015-05-20
CN104820685A (zh) 2015-08-05
US10380197B2 (en) 2019-08-13
CN104820686B (zh) 2019-06-21
CN104820686A (zh) 2015-08-05

Similar Documents

Publication Publication Date Title
WO2014000576A1 (zh) 一种网络搜索方法及网络搜索系统
He et al. Crawling deep web entity pages
JP6461980B2 (ja) 検索結果におけるコヒーレントな質問回答
JP5721818B2 (ja) 検索におけるモデル情報群の使用
JP5956569B2 (ja) ブラウジング活動に基づく該当アプリケーションの識別
AU2014306879B2 (en) Browsing images via mined hyperlinked text snippets
WO2018149115A1 (zh) 用于提供搜索结果的方法和装置
US8874542B2 (en) Displaying browse sequence with search results
US9633018B2 (en) Generation of related content for social media posts
US20150278359A1 (en) Method and apparatus for generating a recommendation page
US10296644B2 (en) Salient terms and entities for caption generation and presentation
US8458584B1 (en) Extraction and analysis of user-generated content
US20160063061A1 (en) Ranking documents with topics within graph
US9658824B1 (en) Extracting topics from customer review search queries
US20160232236A1 (en) Presenting search results for an internet search request
US20170293683A1 (en) Method and system for providing contextual information
US20120284224A1 (en) Build of website knowledge tables
TWI547888B (zh) A method of recording user information and a search method and a server
CN111222918B (zh) 关键词挖掘方法、装置、电子设备及存储介质
RU2589856C2 (ru) Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты)
US20150095751A1 (en) Employing page links to merge pages of articles
TW201411379A (zh) 搜索系統及方法
Ansari et al. Query search on assortment websites by GMDH using neural network while not CRAWL to get rid of pretend rank websites
Makrydakis SEO mix 6 O’s model and categorization of search engine marketing factors for websites ranking on search engine result pages

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13809688

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14411206

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13809688

Country of ref document: EP

Kind code of ref document: A1