CN101097578A - 一种网络资源检索方法及系统 - Google Patents
一种网络资源检索方法及系统 Download PDFInfo
- Publication number
- CN101097578A CN101097578A CNA2007101003098A CN200710100309A CN101097578A CN 101097578 A CN101097578 A CN 101097578A CN A2007101003098 A CNA2007101003098 A CN A2007101003098A CN 200710100309 A CN200710100309 A CN 200710100309A CN 101097578 A CN101097578 A CN 101097578A
- Authority
- CN
- China
- Prior art keywords
- resource
- webpage
- index
- user
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种网络资源检索方法及系统,以解决现有的网页信息检索,耗费用户时间和精力而无法快速、准确地获取资源的问题。所述方法包括:创建网页索引,并对网页中包含的资源,创建对应每个网页的资源索引;接收用户输入的检索关键词,并在网页索引中查询符合所述关键词的网页;在资源索引中查询所述网页包含的资源;将包含所述网页信息和相应资源信息的检索结果显示。本发明在页面的一侧(例如左侧)显示网页正文摘要,另一侧(例如右侧)显示对应的资源信息(如资源名称,资源链接),用户可以直观地获知每个网页中都包含了哪些可下载的资源,通过直接下载可快速地获取自己想要的各种资源。
Description
技术领域
本发明涉及搜索引擎技术,特别是涉及一种网络资源检索方法及系统。
背景技术
随着网络技术的快速发展,网页所承载的信息内容越来越多,例如MP3、应用软件、学习课程等。因此在很多情况下,用户在进行Web信息检索时,不仅仅关心页面上的内容,同时也关心页面上所含有的各种资源链接,如音频文件、视频文件等。
现有的网页信息检索,例如百度、google等,假如用户输入关键词检索某个视频资源,在搜索结果页面中返回了包含该关键词的网页链接及页面内容的简要介绍;用户需要点击所选页面链接,通过浏览该页面,才能确定该页面中是否包含需要的资源或所关心的其他内容,进一步进行下载或获取。
按照上述方法,用户可以通过查找网页获取所关心的信息或者资源。但是,由于在检索结果的页面中,用户无法得知每个网页中都包含了哪些可下载的资源,因此需要用户耗费时间和精力进一步进行筛选,而无法快速地获取到自己想要的资源。而且,大部分网页中的资源名称都用了简单的标识,用户通过关键字检索网页时,经常无法获得准确的结果。
例如,一个网页内容中包含了“大学听力第一册”关键词,该网页中提供了“part1.mp3”,“part2.mp3”,“part3.mp3”等资源,用户需要检索到该页面并进行资源下载。用户在以“大学听力第一册”为关键词进行搜索网页时,可能会返回一系列与“大学听力第一册”相关的网页内容,但不一定每个网页中都包含以上资源的下载,用户需要进一步浏览网页进行筛选;若用户以“part1.mp3”为关键词进行搜索,经常搜索出的网页内容除包含大学听力第一册外,可能还包括其他不相关的资源,例如某个电影的下载片断也叫part1.mp3,用户同样需要进一步进行筛选。
总之,虽然现有的搜索网站提供了特定资源的直接下载,例如百度提供的mp3的检索,但是不能满足用户对各种资源下载的需求。
发明内容
本发明所要解决的技术问题是提供一种网络资源检索方法及系统,以解决现有的网页信息检索,需要用户耗费时间和精力进一步进行筛选,而无法快速、准确地获取资源的问题。
为解决上述技术问题,根据本发明提供的具体实施例,本发明公开了以下技术方案:
一种网络资源检索方法,包括:
创建网页索引,并对网页中包含的资源,创建对应每个网页的资源索引;
接收用户输入的检索关键词,并在网页索引中查询符合所述关键词的网页;
在资源索引中查询所述网页包含的资源;
将包含所述网页信息和相应资源信息的检索结果显示。
优选的,在页面的一侧显示网页信息,另一侧显示相应的资源信息。
优选的,按照资源与所述关键词的相关性高低,将网页包含的所有资源排序,并将排名靠前的部分资源信息显示。
其中,以资源所在网页的URL为索引建立资源索引。
所述方法还包括:根据用户的不同侧重点,按照侧重网页内容或者侧重资源内容,对检索到的网页信息进行排序。
一种网络资源检索系统,包括:
索引单元,用于创建网页索引,并对网页中包含的资源,创建对应每个网页的资源索引;
检索单元,用于在网页索引中查询符合检索关键词的网页,并在资源索引中查询所述网页包含的资源;
查询代理单元,用于接收用户输入的检索关键词,并通过所述检索单元的检索,将包含网页信息和相应资源信息的检索结果显示给用户。
优选的,所述查询代理单元在页面的一侧显示网页信息,另一侧显示相应的资源信息。
所述系统还包括:排序单元,用于根据用户的不同侧重点,按照侧重网页内容或者侧重资源内容,对检索到的网页信息进行排序。
其中,所述排序单元还按照资源与所述关键词的相关性高低,将网页包含的所有资源排序,并将排名靠前的部分资源信息通过所述查询代理单元显示。
其中,所述索引单元以资源所在网页的URL为索引建立资源索引。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
首先,通过建立网页索引和对应网页的资源索引,能够将符合用户检索关键词的网页信息和资源信息同时显示。所述将资源信息直接展示,用户可以直观地获知每个网页中都包含了哪些可下载的资源,而无需进入资源所在页面,用户通过在检索结果页面直接下载,即可快速地获取自己想要的各种资源。
而且,所述显示界面新颖,在页面的一侧(例如左侧)显示网页正文摘要,另一侧(例如右侧)显示对应的资源信息(如资源名称,资源链接),突破了传统搜索引擎的显示方式。
其次,结果页面中网页的摘要介绍,对相应网页中的资源提供了一个辅助性的说明,用户可以根据资源所在页面的摘要信息判断该资源是否为所需。因此,资源所在页面的摘要信息作为用户判断该资源的依据,增加了用户判断资源内容的准确性,从而提高了用户获取资源的准确性。
再次,在进行检索结果排序时,考虑用户的侧重方向(侧重网页内容或侧重资源内容),将网页中的资源的锚也作为指标进行权重的计算。根据用户的侧重点返回的检索结果顺序不同,可以更好地满足用户的需求。
附图说明
图1是本发明实施例所述快检索网页所含资源的步骤流程图;
图2是本发明实施例中网页正文索引与资源索引之间的关系示意图;
图3是本发明实施例中检索结果的页面显示效果图;
图4是本发明实施例所述快检索网页所含资源的系统结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
针对在检索结果的页面中,用户无法得知每个网页中都包含了哪些可下载的资源,以及由于资源名称简单,用户无法获得准确的检索结果的问题,本发明实施例提供了一种可快速检索网页中包含的资源的方法。通过创建网页索引,并创建以资源所在网页的URL为索引的资源索引,可以在检索网页时,将网页中的资源一同检索出来,并同时显示在检索结果页面中,便于用户直接下载,快速地获取自己想要的各种资源。
参照图1,是本发明实施例所述快速检索网页所含资源的步骤流程图。下面将以Web搜索中的资源获取为例进行说明。
步骤101,利用网页抓取工具,从互联网获取网页。
步骤102,对获取的网页建立索引。具体过程是:提取网页正文,并根据网页的编码对网页正文进行相应的编码转换;然后对正文进行分词处理,去掉“的、啊、哦”等等停用词;再对剩下的正文关键词,以所述正文关键词为索引,建立倒排索引。建立倒排索引的示例如下:
文本1的正文关键词是:aaa bbb ccc ddd;
文本2的正文关键词是:bbb ddd yyy;
以关键词建立倒排索引后:aaa 1
bbb 1,2
ccc 1
ddd 1,2
yyy 2
如果需要查找哪些文本中含有关键词bbb时,只需取出该关键词所对应的文本号1,2即可。
步骤103,分析网页中可能含有的资源链接,创建一个独立的资源索引。创建步骤如下:
首先,获取网页中以{<a href=“链接”>名称</a>}标签标识的链接以及锚文本。通常情况下,{<a href=“链接”>名称</a>}为HTML语言,用以定义一个链接,其中“名称”即为显示在网页中的文字,称为锚文本。例如,在个人网站上把中央电视台(www.cctv.com)作为新闻频道的链接,访问者通过点击网站上的“新闻频道”就能进入http://www.cctv.com网站,那么“新闻频道”就是中央电视台网站首页的锚文本。
其次,判断获取的链接是否为资源。如果链接以“.mp3”、“.exe”之类的字符串结尾,则显然是可以下载的资源;如果链接中含有“?”、“&”等信息,则该链接可能为重定向链接,需要进一步确认其是否对应一个资源。关于如何判断一个链接是否为资源链接,可采用本领域技术人员所熟知的各种方法实现,在此不作详细说明。
再次,经判断后,如果是资源链接,则对每个包含资源的网页,创建一个独立的资源索引。
本步骤中以资源所在网页的URL为索引,如图2所示,是所述实施例中网页正文索引与资源索引之间的关系示意图。图中,“特征项”即为建立网页正文索引的索引关键词,每个“特征项”都对应着一系列的网页URL,其中每个包含资源的网页URL又对应着一系列该网页所包含的所有资源。
当然,在建立资源索引时,也可以选取其他索引词,例如每个网页在网页索引中的位置编号等。
步骤104,用户在搜索框中输入查询关键词,并触发查询事件。
步骤105,服务器收到所述查询事件后,获取用户输入的查询关键词。
步骤106,对获得的查询关键词进行分词处理。所述分词处理是为了获取关键词中最常用的词根,例如关键词为“中国政府推出知识产权新举措”,分词结果可能为“中国”、“政府”、“知识产权”、“举措”,或者是“中国政府”、“知识产权举措”等等,能有效的排除不是常用组合的搭配,例如“国政”,这样可以减少搜索的词根。
步骤107,在网页索引中进行查询,获取符合所述关键词的网页。例如图2所示中,在以“特征项”为索引词的网页索引中,查找出“特征项”是所述关键词的索引,该“特征项”对应的所有网页即为符合所述关键词的网页。
步骤108,查找每个网页URL对应的资源索引,在对应的资源索引中找到该网页包含的所有资源。本发明与传统的信息检索不同,在检索与用户关键词符合的网页信息时,一同将网页中包含的资源信息也检索出来。
步骤109,对检索返回的结果进行显示,检索结果包括网页信息和网页中包含的资源信息。显示方式是在结果页面的一侧显示检索到的网页信息,另一侧显示对应的资源信息。
参照图3所示,是本发明实施例中检索结果的页面显示效果图。本例中,在页面的左侧显示检索到的网页的正文摘要及链接等信息,在页面的右侧显示对应该网页的资源名称及资源链接等信息。
本发明实施例优选的,在显示所述检索结果之前,先对检索结果进行排序处理,然后按照排序结果显示。其中对于网页信息的排序,排序规则分为侧重网页内容的排序和侧重资源内容的排序。
通常,服务器对检索出的相关网页,采用一定的策略进行排序,例如对网页进行打分,然后按照分数高低决定返回顺序;而打分的方法是参考几个指标,然后按照网页与所述指标的相关性进行打分,比如关键词出现的频率或区分度等,最后对所述指标进行加权做和得到网页的最后得分。本发明所述实施例中,由于引入了资源索引,所以在对网页打分时,将资源的锚的关键词出现的频率值也作为一个排序的指标,如果用户侧重资源,则调高这个指标所占的权重,而如果用户侧重网页,则调低这个指标的权重,然后提高其他指标的权重。
因此,根据不同侧重点,对网页的排序结果也不同。通过设置用户选项,如果用户在搜索时选择侧重网页内容,则在网页索引中检索出的网页内容所占的权值高;如果用户选择侧重资源内容,则在资源索引中检索出的资源的锚文本所占的权值高。
在显示网页所包含的资源信息时,由于显示空间所限,如果网页中的资源信息较多,通常选取部分显示。选取方法有多种,例如按照资源在网页中出现的先后顺序选取前几个,或者按照资源名称选取,等等。本发明所述实施例中,为给用户带来更好的使用体验,便于用户直观获取自己想要的资源,在选取要显示的资源时先对资源进行了排序。按照资源与检索关键词的相关性,将相关性高的资源显示在页面。
上述实施例提供了一种新颖的搜索结果展示界面,将网页包含的资源信息直接展示,用户可以直观地获知每个网页中都包含了哪些可下载的资源,无需进入资源所在页面即可直接下载;并且,用户可以根据资源所在页面的正文摘要信息,判断资源是否是自己需要的,进一步增加了资源获取的准确性。
而且,用户在搜索网页的时候,由于右侧显示出了对应的资源,用户可能会在无意中发现需要的资源,然后对资源进行下载,这样就激发了用户的潜在需求。如果用户觉得这个网站比较有新意、比较实用,然后会更多的访问,从而提高了网站的粘性。
本发明实施例还提供了一种资源获取系统,仍以Web搜索中的资源获取为例,参照图4,是本发明实施例所述快检索网页所含资源的系统结构图。所述系统主要包括索引单元401、检索单元402和查询代理单元403。
索引单元401用于建立网页索引和资源索引。建立网页索引时,索引单元401先提取网页正文,并根据网页的编码对网页正文进行相应的编码转换,然后对正文进行分词处理,以分词后的正文关键词为索引建立网页倒排索引。
对应每个包含资源链接的网页,索引单元401还建立了单独的资源索引,以资源所在网页的URL为索引词,可参见图2所示,通过查找网页的URL,即可找到网页包含的所有资源。索引单元401首先需要分析网页获取其中的链接及锚文本,然后判断所述链接是否为资源链接,如果是资源链接,则为该网页中存在的所有资源建立一个资源链接。
检索单元402用于根据索引单元401建立的网页索引和资源索引,查询与检索关键词符合的网页信息和资源信息。首先,检索单元402对检索关键词进行分词处理,排除不是常用组合的搭配;然后,根据检索关键词查询网页索引,获取符合所述关键词的网页;再根据网页URL查找到网页包含的所有资源。这样,检索单元402在检索网页信息时,一同将网页包含的资源信息也检索出来。
查询代理单元403用于接收用户输入的检索关键词,并传给检索单元402处理;当检索单元402返回检索结果时,将所述检索结果显示给用户。本发明提出了一种新颖的结果展示方式,在结果页面的一侧(例如左侧)显示检索到的网页信息,如网页的正文摘要及链接等信息,另一侧(例如右侧)显示对应的资源信息,如资源名称及资源链接等信息。
优选的,还提供了用户选项,根据用户选择侧重网页内容还是侧重资源内容,检索单元402先对检索到的网页信息和资源信息分别进行排序处理,再返回给查询代理单元403。在对网页进行排序时,将资源的锚的关键词出现的频率值也作为一个排序的指标,如果用户侧重资源,则调高这个指标所占的权重,而如果用户侧重网页,则调低这个指标的权重,然后提高其他指标的权重。在对资源进行排序时,按照资源与检索关键词的相关性,将相关性高的资源排在前面。如果网页中存在的资源较多,查询代理单元403显示部分资源信息。
所述系统的整体处理流程是:首先利用网页抓取工具404从互联网获取网页,并存入数据库405中;然后索引单元401从数据库405中提取网页正文,创建网页索引和资源索引;当查询代理单元403接收用户输入的检索关键词后,由检索单元402实现信息检索,检索单元402通过查询网页索引和资源索引,将与所述检索关键词符合的网页信息和对应的资源信息进行排序处理后,返回给查询代理单元403;查询代理单元403在页面的左侧显示网页的正文摘要及链接等信息,右侧显示对应的资源名称及资源链接等信息。因此,用户可以直接在搜索结果页面下载自己需要的资源,提高了资源获取的速度和准确性。
图4所示系统中未详述的部分可以参见图1所示方法的相关部分,为了篇幅考虑,在此不再详述。
以上对本发明所提供的一种网络资源检索方法及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1、一种网络资源检索方法,其特征在于,包括:
创建网页索引,并对网页中包含的资源,创建对应每个网页的资源索引;
接收用户输入的检索关键词,并在网页索引中查询符合所述关键词的网页;
在资源索引中查询所述网页包含的资源;
将包含所述网页信息和相应资源信息的检索结果显示。
2、根据权利要求1所述的方法,其特征在于:在页面的一侧显示网页信息,另一侧显示相应的资源信息。
3、根据权利要求1所述的方法,其特征在于:按照资源与所述关键词的相关性高低,将网页包含的所有资源排序,并将排名靠前的部分资源信息显示。
4、根据权利要求1所述的方法,其特征在于:以资源所在网页的URL为索引建立资源索引。
5、根据权利要求1所述的方法,其特征在于,还包括:根据用户的不同侧重点,按照侧重网页内容或者侧重资源内容,对检索到的网页信息进行排序。
6、一种网络资源检索系统,其特征在于,包括:
索引单元,用于创建网页索引,并对网页中包含的资源,创建对应每个网页的资源索引;
检索单元,用于在网页索引中查询符合检索关键词的网页,并在资源索引中查询所述网页包含的资源;
查询代理单元,用于接收用户输入的检索关键词,并通过所述检索单元的检索,将包含网页信息和相应资源信息的检索结果显示给用户。
7、根据权利要求6所述的系统,其特征在于:所述查询代理单元在页面的一侧显示网页信息,另一侧显示相应的资源信息。
8、根据权利要求6所述的系统,其特征在于,还包括:排序单元,用于根据用户的不同侧重点,按照侧重网页内容或者侧重资源内容,对检索到的网页信息进行排序。
9、根据权利要求8所述的系统,其特征在于:所述排序单元还按照资源与所述关键词的相关性高低,将网页包含的所有资源排序,并将排名靠前的部分资源信息通过所述查询代理单元显示。
10、根据权利要求6所述的系统,其特征在于:所述索引单元以资源所在网页的URL为索引建立资源索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101003098A CN100476830C (zh) | 2007-06-07 | 2007-06-07 | 一种网络资源检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101003098A CN100476830C (zh) | 2007-06-07 | 2007-06-07 | 一种网络资源检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101097578A true CN101097578A (zh) | 2008-01-02 |
CN100476830C CN100476830C (zh) | 2009-04-08 |
Family
ID=39011411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007101003098A Active CN100476830C (zh) | 2007-06-07 | 2007-06-07 | 一种网络资源检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100476830C (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101566984B (zh) * | 2008-07-11 | 2011-02-09 | 博采林电子科技(深圳)有限公司 | 一种应用在个人手持设备中的搜索引擎和资源搜索方法 |
CN102063454A (zh) * | 2010-05-31 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 一种搜索与应用相结合的方法和设备 |
CN102314456A (zh) * | 2010-06-30 | 2012-01-11 | 百度在线网络技术(北京)有限公司 | 网页划词搜索方法及系统 |
CN101398844B (zh) * | 2008-10-28 | 2012-01-25 | 华为终端有限公司 | 资源文件的搜索方法及移动终端 |
CN101546309B (zh) * | 2008-03-26 | 2012-07-04 | 国际商业机器公司 | 对计算机网络中的资源内容构建索引的方法和设备 |
CN102682003A (zh) * | 2011-03-10 | 2012-09-19 | 百度在线网络技术(北京)有限公司 | 用于确定特定资源链接的排序位置的方法、装置和设备 |
CN102760172A (zh) * | 2012-06-28 | 2012-10-31 | 北京奇虎科技有限公司 | 一种网络搜索方法及网络搜索系统 |
CN102799663A (zh) * | 2012-07-13 | 2012-11-28 | 深圳市同洲电子股份有限公司 | 一种输入法及输入法系统 |
CN101661490B (zh) * | 2008-08-28 | 2013-01-02 | 国际商业机器公司 | 搜索引擎、其客户端及搜索网页的方法 |
CN103180845A (zh) * | 2010-10-21 | 2013-06-26 | 雅虎公司 | 将用户生成内容的项目匹配到实体 |
CN103248641A (zh) * | 2012-02-07 | 2013-08-14 | 腾讯科技(深圳)有限公司 | 网络下载方法、装置及系统 |
CN103294507A (zh) * | 2013-05-09 | 2013-09-11 | 优视科技有限公司 | 一种提供下载资源信息的方法及装置 |
CN103455567A (zh) * | 2013-08-18 | 2013-12-18 | 苏州量跃信息科技有限公司 | 基于搜索索引项载入应用接口的方法及系统 |
CN103514221A (zh) * | 2012-06-28 | 2014-01-15 | 百度在线网络技术(北京)有限公司 | 一种web站点资源管理方法及装置 |
CN103605758A (zh) * | 2013-11-22 | 2014-02-26 | 中国科学院深圳先进技术研究院 | 一种移动终端文件查找的方法及装置 |
CN103942268A (zh) * | 2010-05-31 | 2014-07-23 | 百度在线网络技术(北京)有限公司 | 搜索与应用相结合的方法、设备以及应用接口 |
CN103955529A (zh) * | 2014-05-12 | 2014-07-30 | 中国科学院计算机网络信息中心 | 一种互联网信息搜索聚合呈现方法 |
CN104123297A (zh) * | 2013-04-26 | 2014-10-29 | 宏碁股份有限公司 | 远端文件的内容搜寻方法与电子装置 |
CN104199862A (zh) * | 2014-08-15 | 2014-12-10 | 北京奇虎科技有限公司 | 基于内容提供方定制的搜索方法、服务器和系统 |
CN104794165A (zh) * | 2015-03-26 | 2015-07-22 | 百度在线网络技术(北京)有限公司 | 一种页面展现方法、装置及系统 |
CN105431842A (zh) * | 2013-06-19 | 2016-03-23 | 微软技术许可有限责任公司 | 响应于查询标识相关app |
CN105550335A (zh) * | 2015-12-22 | 2016-05-04 | 北京奇虎科技有限公司 | 嵌入资源下载信息的搜索摘要提供方法及装置 |
CN105608071A (zh) * | 2015-12-21 | 2016-05-25 | 北京奇虎科技有限公司 | 用于确定中心词的机器学习算法的生成方法及装置 |
CN107943893A (zh) * | 2017-11-16 | 2018-04-20 | 北京奇安信科技有限公司 | 一种基于互联网的搜索处理方法及装置 |
CN109033385A (zh) * | 2018-07-27 | 2018-12-18 | 百度在线网络技术(北京)有限公司 | 图片检索方法、装置、服务器及存储介质 |
WO2019242328A1 (zh) * | 2018-06-20 | 2019-12-26 | 百度在线网络技术(北京)有限公司 | 信息检索方法、装置、设备及计算机可读介质 |
CN110955833A (zh) * | 2019-11-27 | 2020-04-03 | 百度在线网络技术(北京)有限公司 | 一种搜索方法、装置、服务器、终端设备和介质 |
CN114860865A (zh) * | 2022-05-05 | 2022-08-05 | 北京达佳互联信息技术有限公司 | 索引构建及资源召回方法、装置、电子设备和存储介质 |
-
2007
- 2007-06-07 CN CNB2007101003098A patent/CN100476830C/zh active Active
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101546309B (zh) * | 2008-03-26 | 2012-07-04 | 国际商业机器公司 | 对计算机网络中的资源内容构建索引的方法和设备 |
CN101566984B (zh) * | 2008-07-11 | 2011-02-09 | 博采林电子科技(深圳)有限公司 | 一种应用在个人手持设备中的搜索引擎和资源搜索方法 |
CN101661490B (zh) * | 2008-08-28 | 2013-01-02 | 国际商业机器公司 | 搜索引擎、其客户端及搜索网页的方法 |
CN101398844B (zh) * | 2008-10-28 | 2012-01-25 | 华为终端有限公司 | 资源文件的搜索方法及移动终端 |
CN103942268A (zh) * | 2010-05-31 | 2014-07-23 | 百度在线网络技术(北京)有限公司 | 搜索与应用相结合的方法、设备以及应用接口 |
CN102063454A (zh) * | 2010-05-31 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 一种搜索与应用相结合的方法和设备 |
CN103942268B (zh) * | 2010-05-31 | 2018-11-13 | 百度在线网络技术(北京)有限公司 | 搜索与应用相结合的方法、设备以及应用接口 |
CN102314456A (zh) * | 2010-06-30 | 2012-01-11 | 百度在线网络技术(北京)有限公司 | 网页划词搜索方法及系统 |
CN103180845A (zh) * | 2010-10-21 | 2013-06-26 | 雅虎公司 | 将用户生成内容的项目匹配到实体 |
CN102682003A (zh) * | 2011-03-10 | 2012-09-19 | 百度在线网络技术(北京)有限公司 | 用于确定特定资源链接的排序位置的方法、装置和设备 |
CN102682003B (zh) * | 2011-03-10 | 2017-02-08 | 北京音之邦文化科技有限公司 | 用于确定特定资源链接的排序位置的方法、装置和设备 |
CN103248641A (zh) * | 2012-02-07 | 2013-08-14 | 腾讯科技(深圳)有限公司 | 网络下载方法、装置及系统 |
CN104820685A (zh) * | 2012-06-28 | 2015-08-05 | 北京奇虎科技有限公司 | 一种社交类网络搜索方法及社交类网络搜索系统 |
CN104820686A (zh) * | 2012-06-28 | 2015-08-05 | 北京奇虎科技有限公司 | 一种网络搜索方法及网络搜索系统 |
CN103514221A (zh) * | 2012-06-28 | 2014-01-15 | 百度在线网络技术(北京)有限公司 | 一种web站点资源管理方法及装置 |
CN102760172A (zh) * | 2012-06-28 | 2012-10-31 | 北京奇虎科技有限公司 | 一种网络搜索方法及网络搜索系统 |
CN103514221B (zh) * | 2012-06-28 | 2016-12-28 | 百度在线网络技术(北京)有限公司 | 一种web站点资源管理方法及装置 |
CN102799663A (zh) * | 2012-07-13 | 2012-11-28 | 深圳市同洲电子股份有限公司 | 一种输入法及输入法系统 |
CN104123297B (zh) * | 2013-04-26 | 2018-04-06 | 宏碁股份有限公司 | 远端文件的内容搜寻方法与电子装置 |
CN104123297A (zh) * | 2013-04-26 | 2014-10-29 | 宏碁股份有限公司 | 远端文件的内容搜寻方法与电子装置 |
CN103294507A (zh) * | 2013-05-09 | 2013-09-11 | 优视科技有限公司 | 一种提供下载资源信息的方法及装置 |
CN105431842B (zh) * | 2013-06-19 | 2019-01-08 | 微软技术许可有限责任公司 | 响应于查询标识相关app |
CN105431842A (zh) * | 2013-06-19 | 2016-03-23 | 微软技术许可有限责任公司 | 响应于查询标识相关app |
CN103455567A (zh) * | 2013-08-18 | 2013-12-18 | 苏州量跃信息科技有限公司 | 基于搜索索引项载入应用接口的方法及系统 |
CN103605758B (zh) * | 2013-11-22 | 2017-09-08 | 中国科学院深圳先进技术研究院 | 一种移动终端文件查找的方法及装置 |
CN103605758A (zh) * | 2013-11-22 | 2014-02-26 | 中国科学院深圳先进技术研究院 | 一种移动终端文件查找的方法及装置 |
CN103955529A (zh) * | 2014-05-12 | 2014-07-30 | 中国科学院计算机网络信息中心 | 一种互联网信息搜索聚合呈现方法 |
CN104199862A (zh) * | 2014-08-15 | 2014-12-10 | 北京奇虎科技有限公司 | 基于内容提供方定制的搜索方法、服务器和系统 |
CN104199862B (zh) * | 2014-08-15 | 2017-10-20 | 北京奇虎科技有限公司 | 基于内容提供方定制的搜索方法、服务器和系统 |
CN104794165A (zh) * | 2015-03-26 | 2015-07-22 | 百度在线网络技术(北京)有限公司 | 一种页面展现方法、装置及系统 |
CN104794165B (zh) * | 2015-03-26 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 一种页面展现方法、装置及系统 |
CN105608071A (zh) * | 2015-12-21 | 2016-05-25 | 北京奇虎科技有限公司 | 用于确定中心词的机器学习算法的生成方法及装置 |
CN105550335A (zh) * | 2015-12-22 | 2016-05-04 | 北京奇虎科技有限公司 | 嵌入资源下载信息的搜索摘要提供方法及装置 |
CN107943893A (zh) * | 2017-11-16 | 2018-04-20 | 北京奇安信科技有限公司 | 一种基于互联网的搜索处理方法及装置 |
WO2019242328A1 (zh) * | 2018-06-20 | 2019-12-26 | 百度在线网络技术(北京)有限公司 | 信息检索方法、装置、设备及计算机可读介质 |
US11977589B2 (en) | 2018-06-20 | 2024-05-07 | Baidu Online Network Technology (Beijing) Co., Ltd. | Information search method, device, apparatus and computer-readable medium |
CN109033385A (zh) * | 2018-07-27 | 2018-12-18 | 百度在线网络技术(北京)有限公司 | 图片检索方法、装置、服务器及存储介质 |
CN109033385B (zh) * | 2018-07-27 | 2021-08-27 | 百度在线网络技术(北京)有限公司 | 图片检索方法、装置、服务器及存储介质 |
US11210334B2 (en) | 2018-07-27 | 2021-12-28 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, apparatus, server and storage medium for image retrieval |
CN110955833A (zh) * | 2019-11-27 | 2020-04-03 | 百度在线网络技术(北京)有限公司 | 一种搜索方法、装置、服务器、终端设备和介质 |
CN114860865A (zh) * | 2022-05-05 | 2022-08-05 | 北京达佳互联信息技术有限公司 | 索引构建及资源召回方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN100476830C (zh) | 2009-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100476830C (zh) | 一种网络资源检索方法及系统 | |
US8001135B2 (en) | Search support apparatus, computer program product, and search support system | |
CN1296853C (zh) | 网页的预测性浏览的方法和系统 | |
CN101452453B (zh) | 一种输入法网址导航的方法和一种输入法系统 | |
EP2321745B1 (en) | Providing posts to discussion threads in response to a search query | |
CN101256596B (zh) | 一种站内导航的方法及系统 | |
US20170228469A1 (en) | Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata | |
KR100815215B1 (ko) | 웹사이트 통합 검색 장치 및 방법 | |
EP3185149A1 (en) | System and method of inclusion of dynamic elements on a search results page | |
CN101542482B (zh) | 书签和排名 | |
KR20110085995A (ko) | 검색 결과들의 제공 | |
CN104679783B (zh) | 一种网络搜索方法和装置 | |
CN102054004A (zh) | 一种网页推荐方法和装置 | |
CN103221951A (zh) | 预测查询建议高速缓存 | |
KR20110114055A (ko) | 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법 | |
CN104715064A (zh) | 一种实现在网页上标注关键词的方法和服务器 | |
CN102708174A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN103631794A (zh) | 一种用于对搜索结果进行排序的方法、装置与设备 | |
CN103618774A (zh) | 一种基于网络行为的资源推荐方法及装置、系统 | |
CN104503988A (zh) | 搜索方法及装置 | |
CN104090923A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN103970800A (zh) | 网页相关关键词的抽取处理方法和系统 | |
KR101393839B1 (ko) | 링크된 용어들을 포함하는 활성 요약들을 제공하는 검색시스템 | |
CN104572719A (zh) | 信息收集方法及装置 | |
KR101122737B1 (ko) | 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |