CN1622086A - 在计算机网络中搜索 - Google Patents

在计算机网络中搜索 Download PDF

Info

Publication number
CN1622086A
CN1622086A CNA2004100350603A CN200410035060A CN1622086A CN 1622086 A CN1622086 A CN 1622086A CN A2004100350603 A CNA2004100350603 A CN A2004100350603A CN 200410035060 A CN200410035060 A CN 200410035060A CN 1622086 A CN1622086 A CN 1622086A
Authority
CN
China
Prior art keywords
search
inquiry
network
query argument
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100350603A
Other languages
English (en)
Inventor
尼古拉斯·J·米奇利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1622086A publication Critical patent/CN1622086A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明允许用户在搜索表单中输入搜索标准一次,并且搜索多个网络服务、搜索引擎和网页,而无需由于不同和可变支持格式而为每个网络服务或搜索引擎重复性地重新创建搜索标准。一旦用户定义了他们的搜索查询,就将搜索查询传给浏览器应用中的查询管理器,以将搜索标准格式化成通用查询格式。通用查询格式为不同网络服务、搜索引擎和网页所支持的所有其他查询机制提供统一且通用的接口。

Description

在计算机网络中搜索
技术领域
本发明涉及一种在计算机网络中搜索的方法、系统和计算机程序,特别涉及定义用于浏览器应用中的通用查询格式以允许单个搜索查询用于在通过因特网或内部网访问的一个或多个网站或者目录内重复搜索的方法、系统和计算机程序。
背景技术
因特网的出现将大量信息源带到了数百万人的“指尖”。过去,该大量信息源只能在公共和私人图书馆中获得。因此,借助于诸如搜索引擎的工具,因特网变成了用于进行研究的宝贵工具。
当在因特网或者任何其他类型的网络如公司内部网上执行搜索时,用户需要搜索多个数据仓库(repository)。用户通过访问他们首选的搜索引擎来执行搜索。搜索引擎需要用户填写带有搜索项和其他标准的表单,或者至少将搜索项键入搜索特定输入区域。发起轻量级目录访问协议(LDAP)目录搜索或通过搜索引擎如GoogleTM的搜索需要类似的用户交互序列-首先,载入网页,然后填写表单以生成LDAP目录搜索请求或者GoogleTM网站搜索请求。
搜索引擎获得搜索标准,并且形成(formulate)搜索串。搜索引擎将搜索串与搜索引擎的关键字索引数据库进行比较,并且在‘命中列表’中将任何匹配结果返回给用户。
为了创建关键字索引数据库,搜索引擎使用软件机器人或者软件蜘蛛(spider)来在因特网上爬行。每个软件机器人具有其自己的因特网爬行策略,但是通常每个软件机器人从预定的历史统一资源定位符(URL)列表开始,并且从该列表定位文档。软件机器人可以分析整个文档、文档总标题或者第一段落。为已分析信息建立索引,并且将其存储在关键字索引数据库中。
在一些情况下,由搜索引擎显示成功命中列表,来对搜索进行答复。在其他情况下,可能返回未成功命中,并且可能向用户提供选择链到另一个网站的另一个链接的选项,在该另一个网站中,用户可以进一步搜索,从而更深入地挖掘搜索引擎的文档仓库。该步骤需要用户重新输入他们的搜索查询,并且执行随后的搜索。
上面例子可以通过使用诸如GoogleTM的搜索引擎来找到。如果返回未成功(例如,HTTP 404错误)或者成功命中(例如,网页列表),则向用户提供‘在结果内搜索’的选项。单击该链接,将提供另一个搜索页,以允许用户重新输入他们的搜索查询,并且在所返回的网页内搜索。或者,用户可以访问另一个搜索引擎,并且将他们的搜索查询重新输入到搜索框中,以尝试和定位他们所需的结果。
当在多个搜索引擎上或者在同一搜索引擎内重复执行时,上述任务由于需要以多种不同格式重复输入搜索查询而可能变得重复且枯燥。经常地,当执行高级搜索时,需要输入可变数目的参数,例如、区分大小写字母、仅关键字、仅总标题、仅文档体、布尔操作,并且指定所要返回的最大文档数等。
目前网络(web)浏览器提供网络浏览器将‘记住’用户键入到搜索输入框中的最后的词的机制。当用户键入该词的头几个字母时,网络浏览器将开始匹配这些字母与先前输入到输入框中的词。例如,如果用户先前键入词‘toaster’,则当用户键入t,然后是o,然后是a时,网络浏览器将开始模式匹配(预填输入框),因而如果词“toaster”是用户希望键入的词时,则他能够选择该词。
上述方法的一个缺点是它不允许跨越多个网站或网络服务重复搜索。
WO 02/091241公开了一种用于网络中的分布式实时搜索机制的系统和方法。用作消费者(consumer)或请求节点的网络节点生成搜索请求。用作集线器(hub)的节点配置成在网络中路由传递(route)搜索请求。网络中节点之间的通信可以使用查询路由协议进行。公共查询协议作为服务器端协议来实现,并且用来允许企业对企业服务。
WO 02/091241的一个缺点是它不允许用户自由地创建和操纵他们自己的搜索和搜索机制,因为搜索的智能和控制完全在搜索引擎的控制之下。
WO 02/091241没有解决围绕用户必须跨越不同网站、搜索引擎和网络服务执行多次重复搜索的可用性问题。在这种情况下,用户不得不以适于每一个网站的格式表达搜索查询,包括选择各种选项例如执行搜索所用的语言。同时,一些系统将需要执行认证,例如,基于订购的数据仓库,而普通搜索服务不能对其进行访问,因此不能返回所请求的搜索结果。
因此,需要一种用于在计算机网络中搜索的方法、系统和计算机程序,并且特别是定义用于浏览器应用中的通用查询格式以允许搜索查询用于在通过因特网或内部网访问的一个或多个网站或者目录内重复搜索。
对于本文的其余部分,词汇网络服务将用来包括但不限于以下项:网页、网站、搜索引擎或网络服务,或者在计算机网络上获得搜索信息或服务的任何其他工具。
发明内容
本发明提供了一种用于在浏览器应用程序中定义搜索查询的方法,该搜索查询允许跨越计算机网络将单个搜索查询提交给服务器应用程序以搜索一个或多个网络服务,该方法包括以下步骤:将所接收的搜索查询格式化成通用查询格式;识别所要搜索的一个或多个网络服务的查询机制;将搜索查询映射到所识别的查询机制;以及将映射后的搜索查询提交给一个或多个网站,从而进行搜索并且聚合响应以在浏览器应用程序中显示。
本发明允许用户在搜索表单中输入搜索标准一次,并且搜索多个网络服务而无需由于不同和可变支持格式为每个网络服务或搜索引擎重复性地重新创建搜索标准。
一旦用户定义了他们的搜索查询,就将搜索查询传给浏览器中的查询管理器,以将搜索查询格式化成通用查询格式。通用查询格式用来为不同网络服务所支持的所有其他查询机制提供统一且通用的接口。
查询管理器起初将一个请求发送给用户想要搜索的网络服务或搜索引擎,以请求关于其搜索能力的信息。该请求是以超文本传输协议(HTTP)请求或用于跨越计算机网络传送请求的任何其他适当协议的形式发送的。目标网络服务以表示其搜索能力和该网络服务用来搜索其他网络服务的搜索参数的回复来响应。
查询管理器将以通用查询格式保存的用户搜索查询映射成目标网络服务的搜索能力和参数。查询管理器继续所要搜索的每个网络服务的映射过程。网络服务可以将格式化的搜索标准传递给其他兼容网络服务。在这种情形下,将表示搜索请求已发送到其他兼容网络服务上的回复消息回送给查询管理器。本发明允许在需要登记和认证服务的网络服务上执行搜索,而这一点对于普通搜索引擎是做不到的。这是因为认证详细信息必须由用户提交给查询界面管理器,从而当网络服务盘问查询管理器以进行认证时,查询管理器能够代表用户执行协商。
一旦查询管理器接收到所有回复,则聚合这些回复,并且将它们格式化成传递到浏览器中以在浏览器窗口中显示的响应。
查询管理器维护用户选择存储以供将来使用和参考的采用通用查询格式的搜索查询的数据存储库(data store)。所保存的搜索查询可以例如组织成相关类别,或者可以由查询管理器整理统计数据以采用十个最近查询或者搜索最多的域来组织所保存的查询。
浏览器工具栏上的按钮、浏览器显示窗口内的菜单选项或浮动按钮使得能够从数据存储库中检索所保存的搜索,并且将其提交给网络服务。将所保存的搜索查询与例如浮动按钮进行关联使得用户能够在子浏览器窗口内而不仅仅在父窗口内执行搜索,如果按钮或菜单选项在超文本标记语言(html)网页内编码,则将在父窗口内执行搜索。
从另一个方面来看,本发明提供了一种用于在浏览器应用程序中定义搜索查询的系统,搜索查询允许跨越计算机网络将单个搜索查询提交给服务器应用以搜索一个或多个网络服务,该系统包括用于查询管理器界面、查询管理器和数据存储库的装置;查询管理器界面包括:用于从一组用户输入的搜索标准构建搜索查询的装置;查询管理器包括:用于从查询管理器界面接收搜索查询的装置;用于将所接收的搜索查询格式化成通用查询格式的装置;用于请求并且识别网络服务的搜索能力的装置;用于将采用通用查询格式格式化的搜索查询映射成所识别的网络服务的搜索能力的装置;以及用于将映射后的搜索查询提交给网络服务以进行搜索并且为将响应发送给浏览器应用以进行显示的装置聚合响应。
从另一个方面来看,本发明提供了一种可以直接装载到数字计算机的内部存储器中的计算机程序产品,包括用于当所述产品在计算机上运行时执行以实施如上所述的本发明的软件代码部分。
附图说明
下面仅作为示例参照附图对本发明的实施例进行详细描述,其中:
图1是根据本发明实施例的计算机网络如因特网内的网络浏览器与多个服务器之间的交互的方框图;
图2是在其中用户可以构建搜索查询的界面的例子;
图3是根据本发明优选实施例的用于创建搜索的方法的步骤序列的流程图;以及
图4是根据本发明优选实施例的用于执行搜索过程的方法的步骤序列的流程图。
具体实施方式
对本描述来说,在附图的任一个或多个中引用具有相同标号的步骤或特性的情况下,这些步骤或特性具有基本上相同的功能或操作。
图1示出数据处理网络的多个组件,包括在与用户计算机70连接以进行通信的大型机服务器40、50、60上运行的多个网络服务器10、20、30。用户计算机70运行网络浏览器程序80和查询管理器90。在本技术领域内是公知的,网络浏览器是能够将超文本传输协议(HTTP)请求发送给网络服务器以访问万维网上的信息的应用程序。本发明的可选实施例包括支持文件传输协议(FTP)、轻量级目录访问协议(LDAP)或者其他请求发送协议的浏览器或者其他客户端请求器程序。
例如,如果本发明用于在因特网内连接并且可通过万维网访问的计算机上搜索所需网页,则用户计算机70和服务器40、50、60中的每一个在网络内相互可以是远程的。用户计算机70和服务器40、50、60同样也可以是局部网络或内部网的组件。
用户计算机70不限于特定类型的数据处理设备,并且可以是能够运行客户端请求器程序的传统桌面或膝盖型个人计算机、个人数字助理(PDA)或者其他专用数据处理设备。用户计算机可以通过无线或者硬连线连接来连接到数据处理系统的网络。类似地,服务器40、50、60可以是能够运行网络服务器、目录服务器或类似服务器程序的任何数据处理设备。下面详述的实施例的软件实现单元不限于任何特定操作系统或编程语言。
在第一实施例中,查询管理器90实现为扩展并修改标准网络浏览器80的功能的计算机程序模块。具体地说,本实施例提供用于连接到网景公司的Netscape Communicator网络浏览器程序的标准连接接口的“插件”程序模块。在本技术领域内是公知的,“插件”模块是可以容易地安装并作为网络浏览器的一部分使用的程序-一旦安装,“插件”模块由网络浏览器自动识别,并且网络浏览器和插件模块通过简单API相互调用的功能。
大量“插件”组件已经可以广泛地获得以与微软公司的Internet Explorer5或网景公司的Netscape Communicator网络浏览器一起使用。在撰写该专利说明书的时候,Netscape Communicator的插件说明及其使用和开发可从网景公司获得。由于将功能加到现有网络浏览器的“插件”组件的接口和开发为本领域的技术人员所理解,因此接口和开发步骤在此将不作详述。
数据存储库120与查询管理器90协作以存储搜索查询。数据存储库120可以包括任何类型的存储和检索机制,例如IBM的DB2数据库系统。
查询管理器90与网络浏览器80协作以处理搜索查询的输入。搜索查询通过调用查询管理器界面110并且输入搜索串和多个选项从而定义搜索查询来构建以检索准确搜索结果。
查询管理器界面110可以采用多种方式来调用,例如,通过从网络浏览器80的工具栏中选择一个按钮、从菜单功能中选择一个选项或者在网络浏览器窗口内选择用户可用的浮动按钮。对于本领域的技术人员而言,显而易见,用于调用查询管理器界面110的上述方法不限于上面列出的方法,而是可以包括本技术领域内公知的其他调用方法。
参照图2,示出查询管理器界面的例子。查询管理器界面110包括多个输入区域210、215、220、225和230。这些输入区域允许用户构建和定义搜索查询。查询管理器界面110还包括工具栏205,用于访问所保存的搜索查询、编辑所保存的搜索查询,并且将搜索查询提交给多个网络服务以进行搜索。
查询管理器界面110提供用于定义搜索查询并且搜索多个网络服务而无需为每个网站或网络服务重复创建搜索查询的单个搜索界面。
查询管理器界面110提供接受需要登记和认证的网络服务的用户名称和密码的附加输入区域,而这一点对于搜索引擎是做不到的。
查询管理器界面110可以实现为http输入表单,或者提供数据输入的其他机制例如Java程序或者用于在计算机网络上实现应用的任何其他适当编程语言(Java是美国和其他国家中太阳微系统公司(Sun Microsystems Inc.的商标)。
在一个实施例中,通过使用诸如超文本传输协议(HTTP)的请求/回复协议来执行计算机网络121、130上的通信。
在另一个实施例中,查询管理器90可以通过利用SOAP消息的网络服务调用来将请求/回复消息直接发布到多个目标网站。SOAP提供基于XML的信息的定义,它可以用于在分布式环境中交换结构化信息。
如图2所示的查询管理器界面110仅用于示例的目的,但是对于本领域的技术人员而言,显而易见,查询管理器界面可以包括响应于从包含关于从兼容网络服务发送的最新查询参数的信息的XML数据供给(data feeds)提供给通用查询格式的参数的多个不同区域。
用户以通过在如参照图2所述的一个或多个搜索输入区域100中定义搜索查询来构建他们的搜索查询开始。
查询管理器90从查询管理器界面110接收所输入的搜索查询。所输入的搜索查询采用通用查询格式存储在浏览器的数据存储库120中。通用查询格式可以作为XML大纲(schema)或者以关系式数据库所规定的文本格式保存在数据存储库120中。
通用查询格式维护用来定义搜索查询的参数列表。下面是这些参数的示例列表,但是不限于以下项:
搜索项
搜索项定义组成要用于搜索的搜索标准的一个词或多个词。
排除项
如果用户搜索如何制作美味土豆片的食谱,则被排除词的例子可以是‘烧焦’。
准确短语项(Exact phrase item)
如果用户搜索特定项,则可以使用准确短语,例如,“法国西北的卢瓦尔河地区的米德格雷城堡”。这允许搜索引擎仅返回满足上面搜索标准的搜索结果。
布尔项
布尔表达式允许使用诸如‘与’、‘或’和‘非’的表示法来表达。例如,搜索Babbage  ‘与’分析引擎两项允许搜索引擎返回在同一网页中包含‘Babbage’和‘分析引擎’两词的搜索结果。
搜索模式
搜索项是否为布尔搜索。
搜索范围
允许在特定域上执行搜索,例如,国家特定即英国或者域特定www.ibm.com。
语言
搜索可以限于特定语言,例如,仅搜索具有扩展(extension)的网站。
时间段(Time period)
如果搜索有关最近新闻事件的文章,则1个月以前的旧文章可能没有用处,因此有可能将搜索限定于1星期内的文章。或者,如果搜索试图定位有关一年前发生的主题的文章,则还有可能将搜索限定于具有12个月的日期的文章等。本领域的技术人员还应该理解,任何日期设置可以由用户进行配置以作使用。
时间范围(Timeframe)
可选地,有可能指定搜索文档的时间范围,例如,起始日期范围/结束日期范围。
文件类型
可以在搜索标准中定义不同的文件类型,例如,仅搜索.pdf文件。其他文件类型包括但不限于doc、html、exe、Zip、ppt、xls、lwp、123等。
出现处(Occurrences)
用户可能仅对出现在文档特定部分中的项感兴趣,例如,搜索被请求仅返回在总标题中含有“21世纪的激光技术”这些词的文档。另一个例子可以包括返回在文档的文档体中含有毕达哥拉斯定理的文档等。
位置
以允许在特定域如www.ibm.com内搜索。
每页的结果数
搜索引擎将返回指定数目的每页搜索结果数,例如,最接近命中的头10个。
指定链使得能将搜索查询传递给其他搜索提供商。
在一个优选实施例中,以用于网络服务环境中的作为XML大纲的通用查询格式定义上述参数,例如,参照例子1,可以看出日期、大小写、出现处和语言这些参数包含在XML格式的编码内。
例子1
<?-xml version=″1.0″encoding=″UTF-8″?>
<!--由用户输入的搜索定义包括搜索短语和相关搜索选项)>
<define search query>
<search term></search term>
<time period></time period>
<case(Y|N)></case>
</define search query>
参照图3,说明用户可以执行以输入、保存和提交搜索查询的步骤。
在步骤305,用户启动查询管理器界面110,并且在步骤310指定搜索标准。
在步骤315,以通用查询格式存储搜索查询,并且将其存储在网络浏览器80的数据存储库120中以由用户进行检索。
查询管理器90根据用户定义的标准维护所存储搜索查询的的数据存储库120,并且检索所存储的搜索查询。例如,用户可以定义‘执行最多的活动查询’或者‘搜索最多的域’,例如,域http://www.ibm.com是搜索最频繁的域。
为了允许重复使用搜索查询而无需人工地将搜索查询重新输入到查询管理器界面110中,将搜索查询与网络浏览器80的按钮、菜单功能或浮动按钮相关联。每次用户希望执行所保存的搜索查询时,用户从所保存搜索查询的列表中检索相关搜索查询。选择菜单功能或者浮动按钮来执行搜索。当创建网络浏览器80的新实例时,即当例如在Internet Explorer中通过调用文件/新建/窗口或者从连接到用户计算机的键盘调用Ctrl+N来创建子窗口时,可以获得活动搜索查询。
在步骤320,查询管理器90从查询管理器界面110接收搜索查询,并且开始处理搜索查询400。在任何时候,可以在步骤340根据用户的指令停止搜索查询的处理。
参照图4,以步骤401开始,进一步详细地说明查询管理器90执行从而处理搜索查询的步骤。
在步骤400,查询管理器90从查询管理器界面接收搜索查询,并且开始处理搜索请求。在步骤405,查询管理器90以识别所要搜索的网络服务的搜索能力开始。
用户希望搜索的每个目标网络服务可能具有受到设计网络服务的方式以及用来实现设计的编程语言或置标(markup)语言影响的不同搜索能力。
为了阐述多个网络服务之间可能出现的区别,例子2示出以HTML实现的网页。如例子2所示,该网页可以包括多个HTML标记。HTML定义信息应当如何在浏览器中查看。
例子2
<html>
<head>
<meta http-equiv=″content-type″content=″text/html;charset=iso-8859-1″>
<title>XML和搜索:搜索工具报告</title>
</head>
<body bgcolor=″white″>
<h1>这是一个标题</h1>
<P>这是一个段落</P>
</body>
</html>
每个HTML页面以<html>标记开头,这向浏览器通知所用的置标语言是HTML。紧随在HTML标记之后,使用文档头标记<head>来向浏览器指定关于网页的特定信息,例如,元信息如允许在浏览器和插件应用中采用十六进制值显示非标准字母和字符的HTML URL编码基准。
总标题(title)标记允许向网页提供显示在浏览器窗口的最上标题栏中的总标题。一旦定义了上述标记,就可以通过包括文档体标记、标题(heading)标记以及段落标记来形成HTML页面的文档体,其中,文档体标记可以定义HTML页面的颜色(<body bgcolor=″white″>),标题标记定义标题字体应当多大(<h1>这是一个标题</h1>),而段落标记用来输入HTML文本(<P>这是一个段落</P>),因此指定应当如何使用和显示网页的文本。
与使用HTML相关联的一个缺点是HTML不能描述文本的内容。例如,如果段落标记内的文本包括不同类型的门把手的目录,则HTML不能提供任何功能来让目录按例如大小和颜色来排序。
相反,XML向网络开发者提供前述功能,从而允许对数据进行更多的控制。为了具有对数据更多的控制,可以采用充分描述数据的XML格式定义另外的标记和区域。搜索引擎可以使用XML标记来指定搜索XML页面的哪些部分,而不是搜索XML页面的整个文本(搜索引擎在HTML页面中将不得不这样做)。因此,相对于XML页面,当对HTML页面执行搜索时,存在很多不同。
此外,由于网络浏览器80所访问的不同网络服务使用不同的标记来标识输入区域,即复选框和下拉菜单等,因此可能仅发生限定的预填(pre-filling)。
参照图4的步骤410,查询管理器90以将请求发布到网络服务开始,例如,该请求为HTTP请求或SOAP消息,请求网络服务搜索能力的详细信息。网络服务以回复消息响应,该回复消息包括关于网络服务当前所利用的查询机制的MIME内容类型详细信息。在另一个实施例中,网络服务可以使用诸如SOAP的网络服务协议来响应。
每个网络服务可以支持不同的参数,以便执行搜索。表1示出两个著名搜索引擎-Alta Vista和GoogleTM之间的这些区别。参数列定义由查询管理器90维护的参数。
表1
参数 Alta Vista映射 GoogleTM映射
搜索项 aqa=″text″ as_q=″text″
排除项 aqn=″text″ as_eq=″text″
准确短语项 aqp=″text″ as_epq=″text″
至少(Atleast) <无映射> as_oq=″text″
布尔项 aqb=″text″ as_q=″text″
搜索模式 aqmode=b|s <无映射>
搜索范围 kgs=0|1 <无映射>
语言 kl=<语言代码> lr=<语言代码>
时间段 dt=tmperiod|dtrange as_qdr=m3|m6|y|all
时间范围 d2=1|2|3|4|5 <无映射>
起始日期 d0=mm/dd/yy <无映射>
结束日期 d1=mm/dd/yy <无映射>
文件类型 filetype=pdf|html|<空白> as_filetype=pdf|ps|doc|xls|ppt|rtf|<空白>
出现处 <无映射> as_occt=title|body|url|link
位置 rc=url|dmn as_sitesearch=″text″
每页的结果数 nbq=<数字> num=<数字>
<无映射> <无映射>
列在表1的第一列中的参数提供通用查询格式的通用搜索参数。这些参数提供映射成兼容网络服务所指定的其他查询参数的通用基准。
第二和第三列详细描述搜索引擎Alta Vista和GoogleTM各自的参数。可以看出,在某些情况下,没有等价参数。例如,Alta Vista参数“搜索模式”在GoogleTM中没有等价参数。
本领域的技术人员公知,上述查询参数不是彻底无遗漏的列表,因为可以从搜索引擎和服务提供商获得其他查询参数。
为了允许动态更新通用查询格式所定义的参数,查询管理器90可以提供自动更新功能,该功能允许从兼容网络服务下载参数,从而允许通用查询格式按目标网站、网络服务或搜索引擎(表1的第二和第三列)不断更新。
可选地,查询管理器90可以访问特定网站以下载包含对流行引擎的最新映射的最新参数文件。提取包含在最新下载的参数文件中的数据,并且与其他查询参数一起采用适当格式将其存储在数据存储库120中。
通用查询格式提供来自不同网络服务的所有参数可以链接在一起以帮助跨越多个网站进行搜索的通用格式。如果不存在映射,即在查询管理器内没有识别出映射,则缺省立场是忽略缺少的参数。
查询参数可以采用众多方式发送给查询管理器。例如,在网络服务环境中,目标网络服务可以将符合XML文档类型定义的查询参数发送给查询管理器。
一旦查询管理器90接收到网络服务的搜索能力,查询管理器90就开始将采用通用查询格式存储的搜索查询映射成网络服务所要求的查询参数,以在步骤415构造有效载荷。查询管理器解析采用通用查询格式定义的每一个参数,定位通用查询格式的标记中定义的元数据(在XML实现中)。由查询管理器90执行查找(lookup),以确定所要搜索的网络服务、搜索引擎或网页的等价查询参数。
下面是由查询管理器90从查询管理器界面110接收且映射成目标网络服务所定义的搜索参数的搜索查询的例子。
搜索项:Charles Babbage
排除项:Ada Lovelace
时间段:12/12/2002到11/11/2003
界面管理器90从查询管理器界面110接收搜索查询。在本例中,按照XML大纲保存搜索查询。
查询管理器90根据所要搜索的网络服务的实现要求,发送http请求或SOAP请求,从而请求网络服务搜索能力的详细信息。
在本例中,回复消息定义所要搜索的一个网络服务要求DTD格式,而另一个网络服务是要求HTML格式的网页。回复消息还定义所要使用的查询参数的命名约定。
响应在回复消息中提供的数据,查询管理器90在数据存储库中执行查找,并且确定等价于通用查询参数的参数。将通用查询格式的参数映射成所要搜索的网络服务的查询参数。查询管理器90继续解析通用查询格式,直到按通用查询格式定义的每一个参数均映射成等价查询参数。在例子3中可以看到所得输出,该输出是所要搜索的网络服务所定义的XML搜索查询。
例子3
POST/search HTTP/1.1
Host:www.infobase.com
Content-Type:application/soap+xml;charset=utf-8
Content-Length:nnn
<?xml version=″1.0″?>
<soap:Envelope xmlns:soap=″http://www.w3.org/2001/12/soap-envelope″
  soap:encodingStyle=″http://www.w3.org/2001/12/soap-encoding″>
  <soap:Body xmlns:q=″http://www.infobase.com/search″>
    <q:query>
      <aqa:searchphrase>
        <aqa:searchitem>Babbage</q:searchitem>
      </aqa:searchphrase>
      <aqa:searchoptions author=″″
       case=″N″chain=″Y″time period=″12/12/2002 to 11/11/2003″
       domain=″″format=″ANY″Exclude term=″Ada Lovelace″
     geography=″″language=″″
     occurences=″ANYWHERE″type=″ALLWORDS″>searchoptions
   </aqa:searchoptions>
  </q:query>
 </soap:Body>
</soap:Envelope>
有效载荷将根据所要搜索的网络服务、搜索引擎或网页的要求来构造。在一个实施例中,搜索网站可以支持网络服务接口,并且如同例子3按照DTD提供有效载荷,或者有效载荷可以作为标准HTTP请求来构造。如何构造有效载荷依赖于所要搜索的网络服务的要求。
当在计算机网络上执行任何搜索时,经常出现将发生多次搜索的情况。在这种情况下,查询管理器90将需要把采用通用查询格式存储的搜索查询映射成很多不同类型的查询参数,以便执行多个同时搜索。
回到图4,一旦搜索查询采用网络服务所接受的格式,则在步骤430,查询管理器90将有效载荷提供给网络服务以进行搜索。
网络服务搜索网站的内容(根据所定义的搜索查询),并且在指定网络服务或网页内识别搜索项的出现处,从而作为网站内的被识别网页或其他内容的列表提供其输出。
查询管理器90截取所接收的搜索结果,并且聚合结果,从而生成合并结果,查询管理器90在步骤440将该结果转发给网络浏览器80以进行显示。该截取步骤435可以涉及在通过网络浏览器80将结果提供给用户之前整理(collate)所接收的来自不同网络服务的搜索响应。
在另一个实施例中,搜索查询可以通过定位、指定或者检索其他兼容搜索引擎的详细信息来重复多次,其中,其他兼容搜索引擎也可以包括使用诸如统一描述、发现和集成服务(UDDI)的目录,其定义一组用于访问网络服务数据库的标准接口。搜索引擎详细信息可以登记在UDDI目录中,并且可以通过特定数据类别例如网络服务、医疗或信息技术来分类。当网络浏览器80从搜索引擎接收到响应时,响应可以表示搜索查询已传递给搜索引擎所知道的另一个协作实体,与最初被发送查询的搜索引擎相比,该另一个协作实体可能能够对请求提供更准确的答案。

Claims (14)

1.一种用于在浏览器应用程序中定义搜索查询从而允许跨越计算机网络提交单个搜索查询来搜索一个或多个网络服务的方法,该方法包括以下步骤:
将所接收的搜索查询格式化成通用查询格式;
将所接收的通用查询格式映射到所要搜索的一个或多个网络服务的查询机制;以及
将映射后的搜索查询提交给一个或多个网络服务,以进行搜索并且聚合响应。
2.如权利要求1所述的方法,其中将请求查询机制标识的请求消息发送给一个或多个网络服务。
3.如权利要求2所述的方法,其中识别步骤包括将请求消息发送给一个或多个网络服务。
4.如权利要求1所述的方法,其中映射搜索查询包括将通用查询格式内的每个参数解析成采用查询机制标识的各查询参数。
5.如权利要求1所述的方法,其中聚合步骤包括聚合来自一个或多个网络服务的多个响应。
6.如权利要求1所述的方法,其中所标识的查询参数是网络服务所指定的任何查询参数。
7.如权利要求6所述的方法,其中当发生查询参数的增加或删除时,自动更新查询参数。
8.一种用于在浏览器应用程序中定义搜索查询从而允许提交单个搜索查询来搜索分布在计算机网络中的一个或多个网络服务的系统,该系统包括:
用于接收搜索查询的界面;
用于将所接收的搜索查询转换成通用查询格式的格式化装置;
用于将通用查询格式映射到所要搜索的一个或多个网络服务中的查询机制的映射装置;以及
用于将映射后的搜索查询提交给一个或多个网络服务以进行搜索的提交装置,和用于聚合响应的装置。
9.如权利要求8所述的系统,其中将请求查询机制标识装置的消息发送给所要搜索的一个或多个网络服务。
10.如权利要求8所述的系统,其中用于映射通用查询格式的装置包括用于解析通用查询格式内的每个参数并且映射成按查询机制标识的各查询参数的装置。
11.如权利要求8所述的系统,其中用于聚合的装置包括用于聚合来自一个或多个网络服务的多个响应的装置。
12.如权利要求8所述的系统,其中所标识的查询参数是网络服务所指定的任何查询参数。
13.如权利要求12所述的系统,其中当发生查询参数的增加或删除时,自动更新查询参数。
14.一种可以直接装载到数字计算机的内部存储器中的计算机程序产品,包括用于当所述产品在计算机上运行时执行以实施如权利要求1至7所述的本发明的软件代码部分。
CNA2004100350603A 2003-11-27 2004-04-20 在计算机网络中搜索 Pending CN1622086A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0327589.8A GB0327589D0 (en) 2003-11-27 2003-11-27 Searching in a computer network
GB0327589.8 2003-11-27

Publications (1)

Publication Number Publication Date
CN1622086A true CN1622086A (zh) 2005-06-01

Family

ID=29797924

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100350603A Pending CN1622086A (zh) 2003-11-27 2004-04-20 在计算机网络中搜索

Country Status (4)

Country Link
US (2) US8140563B2 (zh)
CN (1) CN1622086A (zh)
GB (1) GB0327589D0 (zh)
WO (1) WO2005052811A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136272A (zh) * 2011-12-02 2013-06-05 腾讯科技(深圳)有限公司 一种基于网络社区搜索的搜索方法和装置
CN110516157A (zh) * 2019-08-30 2019-11-29 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0327589D0 (en) 2003-11-27 2003-12-31 Ibm Searching in a computer network
FR2888069A1 (fr) * 2005-06-29 2007-01-05 France Telecom Procede d'echange de donnees entre un serveur et un client, serveur systeme comprenant ce serveur, client de ce systeme, programmes pour un ordinateur formant serveur et un ordinateur formant client
US10769215B2 (en) * 2005-07-14 2020-09-08 Conversant Wireless Licensing S.A R.L. Method, apparatus and computer program product providing an application integrated mobile device search solution using context information
US7752237B2 (en) * 2006-03-15 2010-07-06 Microsoft Corporation User interface having a search preview
US20070219954A1 (en) * 2006-03-15 2007-09-20 Microsoft Corporation Refined Search User Interface
US20080046407A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Application search interface
US20080104042A1 (en) * 2006-10-25 2008-05-01 Microsoft Corporation Personalized Search Using Macros
US8375362B1 (en) * 2006-11-28 2013-02-12 Emc Corporation Wizard for web service search adapter
US20080147710A1 (en) * 2006-12-19 2008-06-19 Microsoft Corporation Generating web pages utilizing user-defined search parameters
US20080319975A1 (en) * 2007-06-22 2008-12-25 Microsoft Corporation Exploratory Search Technique
US8745079B2 (en) * 2008-07-29 2014-06-03 Oracle International Corporation Reducing lag time when searching a repository using a keyword search
US8589436B2 (en) 2008-08-29 2013-11-19 Oracle International Corporation Techniques for performing regular expression-based pattern matching in data streams
US8156129B2 (en) 2009-01-15 2012-04-10 Microsoft Corporation Substantially similar queries
US9031216B1 (en) 2009-03-05 2015-05-12 Google Inc. In-conversation search
US9330139B2 (en) * 2009-11-18 2016-05-03 Blackberry Limited Automatic reuse of user-specified content in queries
US9305057B2 (en) 2009-12-28 2016-04-05 Oracle International Corporation Extensible indexing framework using data cartridges
US9430494B2 (en) 2009-12-28 2016-08-30 Oracle International Corporation Spatial data cartridge for event processing systems
US20120036188A1 (en) * 2010-08-06 2012-02-09 Nokia Corporation Method and Apparatus for Aggregating Document Information
US8713049B2 (en) 2010-09-17 2014-04-29 Oracle International Corporation Support for a parameterized query/view in complex event processing
US9189280B2 (en) 2010-11-18 2015-11-17 Oracle International Corporation Tracking large numbers of moving objects in an event processing system
US20120131645A1 (en) * 2010-11-18 2012-05-24 Harm Michael W User Scriptable Server Initiated User Interface Creation
US8990416B2 (en) 2011-05-06 2015-03-24 Oracle International Corporation Support for a new insert stream (ISTREAM) operation in complex event processing (CEP)
US9329975B2 (en) 2011-07-07 2016-05-03 Oracle International Corporation Continuous query language (CQL) debugger in complex event processing (CEP)
US8433719B1 (en) 2011-12-29 2013-04-30 Google Inc. Accelerating find in page queries within a web browser
CN103631807A (zh) * 2012-08-24 2014-03-12 腾讯科技(深圳)有限公司 引擎切换重搜的方法及装置
US9953059B2 (en) 2012-09-28 2018-04-24 Oracle International Corporation Generation of archiver queries for continuous queries over archived relations
US9563663B2 (en) 2012-09-28 2017-02-07 Oracle International Corporation Fast path evaluation of Boolean predicates
US8898143B2 (en) * 2012-09-28 2014-11-25 Sap Se Database comparison system and method
US10956422B2 (en) 2012-12-05 2021-03-23 Oracle International Corporation Integrating event processing with map-reduce
US10298444B2 (en) 2013-01-15 2019-05-21 Oracle International Corporation Variable duration windows on continuous data streams
US9098587B2 (en) 2013-01-15 2015-08-04 Oracle International Corporation Variable duration non-event pattern matching
US9390135B2 (en) 2013-02-19 2016-07-12 Oracle International Corporation Executing continuous event processing (CEP) queries in parallel
US9047249B2 (en) 2013-02-19 2015-06-02 Oracle International Corporation Handling faults in a continuous event processing (CEP) system
US9418113B2 (en) 2013-05-30 2016-08-16 Oracle International Corporation Value based windows on relations in continuous data streams
US9934279B2 (en) 2013-12-05 2018-04-03 Oracle International Corporation Pattern matching across multiple input data streams
US9244978B2 (en) 2014-06-11 2016-01-26 Oracle International Corporation Custom partitioning of a data stream
WO2015192213A1 (en) * 2014-06-17 2015-12-23 Maluuba Inc. System and method for retrieving data
US9712645B2 (en) 2014-06-26 2017-07-18 Oracle International Corporation Embedded event processing
US9886486B2 (en) 2014-09-24 2018-02-06 Oracle International Corporation Enriching events with dynamically typed big data for event processing
US10120907B2 (en) 2014-09-24 2018-11-06 Oracle International Corporation Scaling event processing using distributed flows and map-reduce operations
US9922099B2 (en) 2014-09-30 2018-03-20 Splunk Inc. Event limited field picker
US20160092045A1 (en) 2014-09-30 2016-03-31 Splunk, Inc. Event View Selector
US10261673B2 (en) * 2014-10-05 2019-04-16 Splunk Inc. Statistics value chart interface cell mode drill down
US11231840B1 (en) 2014-10-05 2022-01-25 Splunk Inc. Statistics chart row mode drill down
US10013454B2 (en) 2015-01-30 2018-07-03 Splunk Inc. Text-based table manipulation of event data
US11615073B2 (en) 2015-01-30 2023-03-28 Splunk Inc. Supplementing events displayed in a table format
US9922082B2 (en) 2015-01-30 2018-03-20 Splunk Inc. Enforcing dependency between pipelines
US9977803B2 (en) 2015-01-30 2018-05-22 Splunk Inc. Column-based table manipulation of event data
US9922084B2 (en) 2015-01-30 2018-03-20 Splunk Inc. Events sets in a visually distinct display format
US9842160B2 (en) 2015-01-30 2017-12-12 Splunk, Inc. Defining fields from particular occurences of field labels in events
US10726037B2 (en) 2015-01-30 2020-07-28 Splunk Inc. Automatic field extraction from filed values
US11442924B2 (en) 2015-01-30 2022-09-13 Splunk Inc. Selective filtered summary graph
US10061824B2 (en) 2015-01-30 2018-08-28 Splunk Inc. Cell-based table manipulation of event data
US11544248B2 (en) 2015-01-30 2023-01-03 Splunk Inc. Selective query loading across query interfaces
US9916346B2 (en) 2015-01-30 2018-03-13 Splunk Inc. Interactive command entry list
US10915583B2 (en) 2015-01-30 2021-02-09 Splunk Inc. Suggested field extraction
CN104991921B (zh) * 2015-06-26 2019-02-15 北京奇虎科技有限公司 一种数据查询方法、客户端和服务器
US10057659B2 (en) 2015-06-30 2018-08-21 Rovi Guides, Inc. Methods and system for presenting search results
WO2017018901A1 (en) 2015-07-24 2017-02-02 Oracle International Corporation Visually exploring and analyzing event streams
US11080291B2 (en) * 2017-08-02 2021-08-03 Sap Se Downloading visualization data between computer systems
US10977262B2 (en) * 2017-08-02 2021-04-13 Sap Se Data export job engine

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5905862A (en) * 1996-09-04 1999-05-18 Intel Corporation Automatic web site registration with multiple search engines
US6085186A (en) 1996-09-20 2000-07-04 Netbot, Inc. Method and system using information written in a wrapper description language to execute query on a network
US6263332B1 (en) * 1998-08-14 2001-07-17 Vignette Corporation System and method for query processing of structured documents
US6457009B1 (en) * 1998-11-09 2002-09-24 Denison W. Bollay Method of searching multiples internet resident databases using search fields in a generic form
US6430556B1 (en) * 1999-11-01 2002-08-06 Sun Microsystems, Inc. System and method for providing a query object development environment
US7451136B2 (en) 2000-10-11 2008-11-11 Microsoft Corporation System and method for searching multiple disparate search engines
CA2431762C (en) * 2000-12-18 2011-11-01 Kargo, Inc. A system and method for delivering content to mobile devices
US7203678B1 (en) * 2001-03-27 2007-04-10 Bea Systems, Inc. Reconfigurable query generation system for web browsers
US7099871B2 (en) 2001-05-04 2006-08-29 Sun Microsystems, Inc. System and method for distributed real-time search
US6934702B2 (en) 2001-05-04 2005-08-23 Sun Microsystems, Inc. Method and system of routing messages in a distributed search network
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US7243091B2 (en) 2002-04-29 2007-07-10 Hewlett-Packard Development Company, L.P. Search network for searching services on the internet
US7424510B2 (en) * 2002-09-03 2008-09-09 X1 Technologies, Inc. Methods and systems for Web-based incremental searches
GB0327589D0 (en) 2003-11-27 2003-12-31 Ibm Searching in a computer network

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136272A (zh) * 2011-12-02 2013-06-05 腾讯科技(深圳)有限公司 一种基于网络社区搜索的搜索方法和装置
CN110516157A (zh) * 2019-08-30 2019-11-29 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质

Also Published As

Publication number Publication date
US20120150902A1 (en) 2012-06-14
US20050120016A1 (en) 2005-06-02
GB0327589D0 (en) 2003-12-31
US8423530B2 (en) 2013-04-16
US8140563B2 (en) 2012-03-20
WO2005052811A1 (en) 2005-06-09

Similar Documents

Publication Publication Date Title
CN1622086A (zh) 在计算机网络中搜索
CN1120432C (zh) 产生显示控制信息的方法和计算机
US7266821B2 (en) Method and apparatus for processing jobs on an enterprise-wide computer system
CN101044478A (zh) 分析查询日志以用于管理类别特定的电子内容
CN1308876C (zh) 书签管理系统和书签管理方法
US8938436B2 (en) System for and method of providing reusable software service information based on natural language queries
CN1337026A (zh) 用于表达频道化数据的系统和方法
CN1282928A (zh) 提供本国语言查询服务的方法和系统
CN1784680A (zh) 搜索条件的逐渐放宽
CN1783124A (zh) 基于电子邮件的语义网协作和注释
US20080104042A1 (en) Personalized Search Using Macros
CN1493043A (zh) 翻译信息段
CN1609873A (zh) 用于管理电子邮件和报警消息的方法,装置,以及用户界面
CN1882943A (zh) 使用超单元的搜索处理的系统和方法
CN1781105A (zh) 在xml文档和关系数据之间的映射中保留层次信息
US20090177652A1 (en) Mobile search service
WO2006096939A1 (en) Remote access of heterogeneous data
CN1509442A (zh) 因特网和/或网站内容的自动管理
CN1704927A (zh) 信息处理系统、信息处理方法和信息处理程序
CN1818941A (zh) 信息处理系统、信息提供与处理设备及其方法、以及程序
CN1726512A (zh) 在多所有者内容管理系统中的内容反馈
CN1794230A (zh) 以透明方式公开计算机生成文档中嵌套数据的方法和系统
US7634458B2 (en) Protecting non-adult privacy in content page search
CN1688977A (zh) 智能使用用户数据以抢先阻止违反访问控制的查询的执行
CN1492367A (zh) 询问应答系统及询问应答方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication