CN1299224C - Url检索系统、服务器及url检索方法 - Google Patents

Url检索系统、服务器及url检索方法 Download PDF

Info

Publication number
CN1299224C
CN1299224C CNB2004100491353A CN200410049135A CN1299224C CN 1299224 C CN1299224 C CN 1299224C CN B2004100491353 A CNB2004100491353 A CN B2004100491353A CN 200410049135 A CN200410049135 A CN 200410049135A CN 1299224 C CN1299224 C CN 1299224C
Authority
CN
China
Prior art keywords
url
information
server
search
expression formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100491353A
Other languages
English (en)
Other versions
CN1573752A (zh
Inventor
岩间円
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Innovations Co ltd Hong Kong
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1573752A publication Critical patent/CN1573752A/zh
Application granted granted Critical
Publication of CN1299224C publication Critical patent/CN1299224C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种URL检索系统和URL检索方法,其中,不需要用户采用针对要访问的信息的关键字,并且即使当通过搜索获得了许多URL时,用户也不必从中选择所需的URL。代理搜索服务器利用来自用户终端的信息创建搜索表达式。搜索引擎服务器根据来自搜索服务器的搜索表达式提取URL。如果所提取出的URL的数量超过了预定的值,则搜索引擎服务器将表示针对每一个URL、所述URL所属的分级等级的信息通过代理引擎服务器发送到用于用户选择的终端。从所提取出的URL中,引擎服务器获取属于由用户所选择的分级等级的URL。如果URL的数量不超过预定值,则引擎服务器将作为检索结果的URL通过代理引擎服务器发送到用户终端,以便用户选择。

Description

URL检索系统、服务器及URL检索方法
技术领域
本发明涉及一种检索对因特网上的公众公开的信息的统一资源定位器(URL)的系统和方法,具体地,涉及一种URL检索系统和服务器、以及在系统中所使用的URL检索方法,其中,不需要用户使用关键字来检索URL。
背景技术
作为通信基础设施的最新发展的结果,因特网上的用户数据得到了增加。与此相关,各种信息已经对因特网上的公众公开。
在因特网上,由统一资源定位器(URL)来识别这样的信息的位置或地址。因此,为了访问对因特网上的公众公开的信息,需要用户从信息处理终端中输入信息的URL。即,当不适当地获知URL时,用户不能够访问信息。
作为获得所需信息的URL的方法,已经广泛地采用了关键字搜索或检索。该搜索采用了被称为“搜索引擎”的服务器,所述服务器包括已经存储了彼此间建立了对应关系的统一资源定位器(URL)和关键字。在操作中,将关键字从用户终端发送到搜索引擎。该引擎从数据库中提取与关键字相关的URL,并且将该URL通知给用户终端。结果,用户获得了与关键字相对应的URL。
为了进行关键字搜索,需要用户设置和输入与目标信息相关的关键字。这对于除了精通关键字搜索的有经验的用户之外的其他用户而言非常困难。然而,初学者或不熟悉关键字搜索的用户无法容易地针对在多种情况下的信息,设置和/或输入适当的关键字。
当在关键字搜索中使用不适合该信息的关键字时,不能够从搜索引擎的数据库中获得针对所需信息的URL。因此,作为搜索的结果而由用户所获得的URL不与所需信息关联。
在这种情况下,用户不能够访问该信息。在许多情况下,用户可能会得出错误的决定:该信息还未对网络上的公众开放。
在诸如标题为“Information Retrieval Apparatus,InformationRetrieval Program,and Recording Medium”的日本专利待审公开No.2002-297648和标题为“Information Retrieval Apparatus,Information Retrieval System,and Program Using E-Mail”的日本专利待审公开No.2003-76711中已经描述了用户检索URL而无需选择或采用关键字的传统技术。
根据日本专利待审公开No.2002-297648,在检索与图像相关的信息的URL的操作中,将图像数据从用户终端上载到图像搜索引擎。所述引擎提取诸如图像的轮廓的特征数据,以确定图像的特征,从而获得与图像相关的关键字。然后,图像引擎将这些关键字发送到关键字搜索引擎,以利用这些关键字来实现关键字搜索。
利用在日本专利待审公开No.2003-76711中所描述的技术,用户终端的用户按照所需的格式创建与要访问的信息相关的语句或文本,然后,通过电子邮件将所述文本发送到指定的邮件地址,以执行信息的检索。当接收到邮件时,检索引擎从该文本中提取出关键字,然后,执行针对该信息的关键字搜索。
根据上述的每一个技术,由于用户能够检索URL而无需设置和/或输入针对目标信息的关键字,不熟悉关键字搜索的任何用户可以容易地访问所需信息。
然而,由于非常大量的信息项对因特网上的公众开放,因此,可以由在一些情况下取决于搜索条件设置的搜索引擎来提取许多统一资源定位器。
在上述的文章中,未考虑到这样的情况。当用户检索到作为关键字搜索结果的大量统一资源定位器时,需要用户从中提取出针对要访问信息的一些定位器。
发明内容
由此,设计用于解决上述问题的本发明的目的是提供一种URL检索系统和URL检索方法,其中,不需要用户终端的用户采用与要访问的信息相关的关键字,并且即使当作为关键字搜索的结果获得了大量的统一资源定位器时,也不需要用户从中选择针对目标信息的一些定位器。
根据本发明,提出了一种统一资源定位器(URL)获取系统,包括:用户终端,能够通过因特网对信息进行通信;URL数据库,按照分级结构存储了表示对因特网上的公众开放的信息位置的URL和各个URL的关键字,在URL和关键字之间建立了对应关系;搜索单元,用于从在URL数据库中所存储的URL中提取与搜索表达式相匹配的URL;服务器,响应来自用户终端的请求,向搜索单元请求URL的检索,并且将检索的结果通知给用户终端;以及因特网,使用户终端、URL数据库、搜索单元和服务器彼此相连。所述用户终端包括:用于将针对搜索表达式的信息传送到服务器的传送单元;以及请求单元,用于请求服务器通知作为检索结果、与所述信息相关的URL,URL的数量等于或小于最大数量。所述服务器包括:提取单元,用于从用户终端接收到的信息中提取出关键字,并且利用所述关键字创建搜索表达式;用于请求搜索单元检索与搜索表达式相匹配的URL的请求单元;发送单元,用于将表示最大数量的信息发送到搜索单元;用于请求用户终端选择由从搜索单元中接收到的分级等级信息所指示的分级等级的项目中的至少一个的请求单元;用于向搜索单元传送表示由用户操作用户终端所选择的分级等级的分级等级选择信息的传送单元;以及通知单元,用于将来自搜索单元的检索通知给用户终端。所述搜索单元包括:创建单元,当根据从服务器接收到的搜索表达式所提取的URL数量超过了所述最大数量,创建由分级等级信息表示针对每一个URL所属的分级等级,并且将分级等级信息作为检索结果传送到服务器;以及选择单元,用于从根据从服务器接收到的搜索表达式提取出的URL中选择属于由分级等级选择信息所表示的分级等级的URL;其中通知装置,在由搜索装置根据搜索表达式所提取出的URL的数量等于或小于最大数量时,将由搜索装置所提取出的URL作为检索的结果通知给用户终端,并且当由搜索装置根据搜索表达式所提取出的URL的数量超过了最大数量时,将属由分级等级选择信息的分级等级的URL作为检索结果通知给用户终端。
根据本发明的一个方面,当属于由分级等级选择信息所表示的分级等级的URL的数量超过了最大数量时,搜索单元再次向服务器传送分级等级信息。此外,优选地,服务器将搜索表达式与检索结果一起通知给用户终端。另外,优选地,所述服务器还包括存储器,所述存储装置已经存储了表示URL数据库的分级结构的信息;并且当与URL数据库的最高分级等级名相匹配的关键字作为单一的或条件项包括在搜索表达式中时,服务器从搜索表达式中删除所述关键字。此外,优选地,所述服务器还包括音频识别单元,用于将音频数据转换为字符串数据;并且当从用户终端中作为语音数据接收到针对搜索表达式的信息时,所述音频识别单元将音频数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。此外,优选地,所述服务器还包括图像识别单元,用于将图像数据转换为字符串数据;并且当从用户终端作为图像数据接收到针对搜索表达式的信息时,图像识别单元将图像数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
为了实现上述目的,根据本发明的一个方面,提出了一种通过因特网与用户终端相连的用于URL检索的服务器,用于响应来自用户终端的请求,向搜索单元请求URL检索,并将检索结果通知给用户终端。所述服务器包括URL数据库,按照分级结构存储了表示对因特网上的公众开放的信息位置的URL和各个URL的关键字,在URL和关键字之间建立了对应关系;接收单元,用于从用户终端接收针对搜索表达式的信息、以及与所述信息相关的最大数量;提取单元,用于从用户终端所接收到的信息中提取关键字,并利用所述关键字创建搜索表达式;搜索单元,用于从在URL数据库中所存储的URL中提取与搜索表达式相匹配的搜索相匹配的URL;创建单元,当由搜索装置根据搜索表达式所提取的URL数量超过了所述最大数量,则分级等级信息表示针对每一个URL,所述URL所属的分级等级;请求单元,用于请求用户终端选择由分级等级信息所指示的分级等级的项目中的至少一个;获取单元,用于从用户终端中获取表示由用户操作用户终端所选择的分级等级的分级等级信息;选择单元,用于从根据从服务器接收到的搜索表达式所提取出的URL中选择属于由分级等级选择信息所表示的分级等级的URL;以及通知单元,当由搜索装置根据搜索表达式所提取出的URL的数量等于或小于最大数量时,将由搜索装置所提取出的URL作为检索的结果通知给用户终端,并且当由搜索装置根据搜索表达式所提取出的URL的数量超过了最大数量时,将属于由分级等级选择信息的分级等级的URL作为检索结果通知给用户终端。
优选地,当属于由分级等级选择信息所表示的分级等级的URL的数量超过了最大数量时,服务器请求用户选择再次由分级等级信息所表示的分级等级的项目的至少一个。此外,优选地,服务器将搜索表达式与检索结果一起通知给用户终端。优选地,所述服务器还包括存储单元,所述存储单元已经存储了表示URL数据库的分级结构的信息。当与URL数据库的最高分级等级名相匹配的关键字作为单一的或条件项包括在搜索表达式中时,服务器从搜索表达式中删除所述关键字。优选地,所述服务器还包括音频识别单元,用于将音频数据转换为字符串数据。当从用户终端中作为语音数据接收到针对搜索表达式的信息时,所述音频识别单元将音频数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。优选地,所述服务器还包括图像识别装置,用于将图像数据转换为字符串数据。当从用户终端作为图像数据接收到针对搜索表达式的信息时,图像识别单元将图像数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
为了实现根据本发明一个方面的目的,提出了一种在系统中使用的URL检索方法,所述系统包括:用户终端,能够通过因特网对信息进行通信;URL数据库,用于按照分级结构存储对因特网上的公众开放的信息位置的URL和各个URL的关键字,在URL和关键字之间建立了对应关系;搜索单元,用于从在URL数据库中所存储的URL中提取与搜索表达式相匹配的URL;服务器,用于响应来自用户终端的请求,向搜索单元请求URL检索,并将检索结果通知给用户终端;以及因特网,使用户终端、URL数据库、搜索单元和服务器彼此相连。所述方法包括以下步骤:将针对搜索表达式的信息从用户终端传送到服务器;由用户终端请求服务器通知作为检索结果、与所述信息相关的URL,URL的数量等于或小于最大数量,由服务器从用户终端接收到的信息中提取出关键字,并且利用所述关键字创建搜索表达式;由服务器请求搜索单元检索与搜索表达式相匹配的URL;由服务器将表示最大数量的信息发送到搜索单元;由搜索单元从URL数据库中所存储的URL中提取与从服务器接收到的搜索表达式相匹配的URL;由搜索单元进行检查以确定根据搜索表达式所提取出的URL的数量是否超过了最大数量;当根据从服务器接收到的搜索表达式所提取出的URL的数量超过了最大数量时,由搜索单元创建表示针对每一个URL的、所述URL所属的分级等级的分级等级信息,并且将分级等级信息作为检索结果传送到服务器;由服务器请求用户终端选择由从搜索单元中接收到的分级等级信息所表示的分级等级的项目中的至少一个;由服务器向搜索单元传送表示由用户终端所选择的分级等级的分级等级选择信息;由搜索单元从根据从服务器接收到的搜索表达式提取出的URL中,选择属于由分级等级选择信息所表示的分级等级的URL;由搜索单元将其数量等于或小于最大数量的URL作为检索结果发送到服务器;以及,由服务器将检索结果通知给用户终端。
优选地,所述URL检索方法还包括传送步骤,当属于由分级等级选择信息所表示的分级等级的URL的数量超过了最大数量时,由搜索单元再次向服务器传送分级等级信息。优选地,所述URL检索方法还包括通知步骤,由服务器将搜索表达式与检索结果一起通知给用户终端。优选地,所述服务器还包括存储器,所述存储器已经存储了表示URL数据库的分级结构的信息。所述方法还包括删除步骤,当与URL数据库的最高分级等级名相匹配的关键字作为单一的或条件项包括在搜索表达式中时,由服务器从搜索表达式中删除所述关键字。优选地,所述服务器还包括音频识别单元,用于将音频数据转换为字符串数据。所述方法还包括转换步骤,当从用户终端中作为语音数据接收到针对搜索表达式的信息时,由所述音频识别单元将音频数据转换为字符串数据,然后,从所述信息中提取出关键字。此外,优选地,所述服务器还包括图像识别单元,用于将图像数据转换为字符串数据所述方法还包括转换步骤,当从用户终端作为图像数据接收到针对搜索表达式的信息时,由图像识别单元将图像数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
附图说明
考虑结合附图所采用的以下详细描述,本发明的目的和特征将变得更加明显,其中,
图1是示出了根据本发明的URL检索系统的第一实例的示意方框图;
图2是在第一实施例中的用户终端的结构的方框图;
图3是示出了在第一实施例中的代理搜索服务器的结构的方框图;
图4是示出了在第一实施例中的搜索引擎服务器的结构的方框图;
图5是示出了在URL数据库中具有分级结构的类型和类别之间的关系的方框图;
图6是利用其间所建立的关系存储表示统一资源定位器和关键字的信息项的状态的方框图;
图7是示出了在第一实施例中,URL检索系统检索URL的操作的流程图;
图8是示出了在第一实施例中的URL检索系统的特定操作序列的序列图;
图9是示出了根据本发明的用户终端的第二实施例的结构的方框图;
图10是示出了在第二实施例中的代理搜索服务器的结构的方框图;
图11是示出了在第二实施例中,URL检索系统检索URL的操作的流程图;
图12是示出了在第二实施例中,URL检索系统检索URL的另一操作的流程图;
图13是示出了在第二实施例中,URL检索系统检索URL的另一操作的流程图;
图14是根据本发明的用户终端的第三实施例的结构的方框图;
图15是示出了在第三实施例中的代理搜索服务器的结构的方框图;
图16是在第三实施例中,URL检索系统检索URL的操作的流程图;
图17是根据本发明的用户终端的第四实施例的结构的方框图;
图18是示出了在第四实施例中的代理搜索服务器的结构的方框图;
图19是示出了在第四实施例中,URL检索系统检索URL的操作的流程图;
图20是示出了根据本发明的第五实施例中的代理搜索服务器的结构的方框图;
图21是示出了在第五实施例中,URL检索系统检索URL的操作的流程图;
图22是示出了在根据本发明的第六实施例中的代理搜索服务器的结构的方框图;
图23是示出了在第六实施例中,URL检索系统检索URL的操作的流程图。
具体实施方式
第一实施例
将描述根据本发明的URL检索系统的第一实施例。
图1示出了本实施例的URL检索系统。所述系统包括用户终端、代理搜索服务器、搜索引擎服务器300、以及用于使构成组件彼此相连的因特网500。
图2示出了用户终端100的典型结构。终端100是包括通过因特网500对信息进行通信的功能的信息处理器,并且包括控制部分101、操作部分102、收发器部分103和显示器104。
控制器101是控制用户终端100的每个构成组件的操作的功能部分。操作部分102是用户向终端100输入信息的接口,并包括键盘、定点设备和/或触摸板。收发器103具有通过网络500通信信息的功能,并且执行诸如对要发送到网络500的信号进行调制或编码、以及对从网络500接收到的信号进行解调或解码等处理。显示部分104是向用户显示消息的设备,并且包括诸如显示器和扬声器。
图3示出了代理搜索服务器的典型结构。服务器200分析从用户终端100接收到的信息,从中提取出关键字,并向搜索引擎服务器300发布针对使用关键字的URL搜索的请求。代理搜索服务器200包括控制器201、文本分析器202、收发器203、字典数据存储器204和用户信息存储器205。
控制单元201是控制代理搜索服务器200的构成部分的整体操作的功能部分。文本分析器202分析文本或字符串,以便从中提取出关键字,并利用这些关键字产生搜索表达式。收发器203是通过网络500通信信息的功能模块。字典数据存储器204存储数据,即针对文本分析器202的字典数据,以便分析文本。用户信息存储器205存储验证用户终端100的用户的信息。
图4示出了搜索引擎服务器300的典型结构。服务器300包括控制部分301、搜索处理部分302、收发器部分303和URL数据库304。
控制器301是控制搜索引擎服务器300的构成组件的整体操作的功能单元。搜索部分302执行从URL数据库304中提取出与从代理搜索服务器200所获得的关键字相关的统一资源定位器的处理。URL数据库304存储其间建立了关系的分级布置的定位器和关键字。
图5示出了在URL数据库304中所存储的按照分级等级分类的信息项的布置。在数据库304中,将该信息分类为诸如“音乐”和“汽车”之类的类型。将每个类型细分为包括“音乐标题”和“制作者”的类别。还进一步将一些类别分类为子类别。因此,按照分级树布置来配置每个类型的信息项。
在该实例中,将包括“音乐”和“汽车”的最大分级等级定义为“类型”,并且将类型中的分类定义为“类别”。当类别包括子类别时,该类别被称为“低层类别”,而子类别被称为“高层类别”。在图5所示的实例中,类别“音乐标题”包括类别“日本音乐”,因此“音乐标题”是高层类别而“日本音乐”是低层类别。
如从图6中可以看到,将每一个URL的信息分类为在信息的类型中不包括任何与URL相关的低层类别的类别。例如,在类型“音乐”的类别“音乐标题”中存储了不属于诸如“日本音乐”、“西方音乐”、“经典音乐”等的、针对关于音乐标题的信息的URLhttp://www.xxx.co.jp。
接下来,将描述URL检索系统的操作。
图7示出了其中用户终端100的用户利用代理搜索服务器200来实现URL检索的操作流程。
当用户终端100的用户进行来自操作员的单元103的操作时,控制器101创建连接请求,并且通过因特网500将来自收发器103的请求发送到代理搜索服务器200(步骤S101)。
已经接收到来自终端100的连接请求之后,服务器200请求终端100传送验证信息。该信息可以是用户标识符和口令的组合。此外,该信息可以是诸如从在生物统计或生物测量验证中使用的信息,例如指纹、声波纹和虹膜中所获得的信息。当从服务器200中请求验证信息时,终端100的控制器101在显示器104上显示请求用户输入验证信息的消息。
当用户操作终端100的操作部分103以输入验证信息时,控制器101通过因特网500向代理搜索服务器200传送该信息。
当服务器200从用户终端100中接收到该信息时,控制部分201进行检查以确认用户信息存储器205是否包含与验证信息相匹配的信息(步骤S102)。如果存储器205存储了该信息,控制器201允许终端100与服务器200相连。否则,控制器201通过拒绝与终端100相连的请求,终止该处理。在这种情况下,还可能的是,控制部分201向用户终端100发布请求以便再次向其发送验证信息。
当建立了与代理搜索服务器200的连接时,终端100的控制器101在显示器104上显示请求用户输入针对目标信息的文本(搜索文本)和要提取的最大项目数的消息。当用户从操作员的控制台102输入了该文本和最大项目数时,控制器101将这些项目传送到服务器200(步骤103)。
当服务器200从用户终端100中接收到这些信息项时,控制器201将文本传送到文本分析器部分202。文本分析器202通过参考字典数据存储器204中的字典数据,将文本分割为形态元素,以提取诸如名词、动词和形容词等项目作为关键字。当文本包括表示“或”或者“可选地”的单词或子句时,分析器202产生搜索表达式,其中,利用在该单词或子句之前和之后的部分文本来构造或条件。当文本包括表示“与”的单词或子句时,分析器202产生搜索表达式。该表达式包括利用在该单词或子句之前和之后的部分文本构造的与条件(步骤S104)。
当从用户终端100中接收到的搜索文本是诸如“good Japanesepancake restaurant in Tokyo or Yokohama”时,文本分析器202提取出“Tokyo”、“Yokohama”、“good”和“Japanese pancakerestaurant”,并产生包括利用“Tokyo”和“Yokohama”的或条件的搜索表达式。该表达式是((Tokyo+Yokohama)×good×JapanesePancake restaurant)。在该表达式中,“+”表示或条件,而“×”表示与条件。
当文本分析器202从搜索文本中提取出关键字并产生了搜索表达式时,控制器201通过因特网500向搜索引擎服务器300传送搜索文本和关于要提取的最大项目数的信息(步骤S105)。
当服务器300从代理搜索服务器200接收到搜索文本和关于最大数量的信息时,控制器301将搜索表达式传送到搜索处理器302。处理器302从在URL数据库304中所存储的统一资源定位器中选择适合于搜索表达式的项目(步骤S106)。
当在数据库304中不存在这样的适当URL时,控制单元301向通过因特网500与搜索引擎服务器300相连的另一信息处理器或因特网服务器400发送询问请求,以获得适合于搜索表达式的URL。
当由搜索处理器302所选择的统一资源定位器的数量等于或小于最大项目数时(步骤S107中的“是”),则控制器301通过因特网500向代理搜索服务器200发送这些定位器(步骤S108)。在已经从服务器300接收到这些定位器之后,服务器200通过因特网向用户终端100传送这些定位器。当终端接收到来自服务器200的定位器时,控制器101在显示器104上显示这些统一资源定位器(步骤S109)。
另一方面,当由搜索处理器302所选择的URL数量超过了最大项目数时(步骤S107中的“否”),控制器301获得每一个URL的高层类别或类型(步骤S110)。在图6的实例中,如果URL是http://www.yyy.co.jp,则控制器301获得表示与该URL相关的类别“音乐标题”的信息。如果URL是http://www.bbb.co.jp,则控制单元301获得表示该URL所属的类别“音乐”的信息。控制器301将该信息,即,表示与该URL相关的类型和类别的类型和类别信息,传送到代理搜索服务器200。
当服务器200从搜索服务器300中接收到该信息时,控制器201创建请求,即,类型和类别选择请求,以便从接收到的信息中选择所需数量的类型或类别项目。控制器201将该请求与类型和类别信息一起通过收发器203发送到用户终端100(步骤S111)。
当终端100从服务器200中接收到类型和类别信息和类型和类别选择请求时,控制器101在显示部分104上显示消息。该消息请求用户从由类型和类别信息所表示的类型和类别中选择所需数量的类型或类别。
当用户操作操作部分102以选择类型或类别(步骤S112)时,将表示所选择的类型或类别的信息,即,类型和类别选择信息发送到代理搜索服务器200(步骤S113)。当服务器200的收发器203从终端100接收到该信息时,控制器201向搜索引擎服务器300传送该信息。
当服务器300从代理搜索服务器200接收到该信息时,控制器301将该信息通知给搜索处理器30。该处理器30从通过关键字搜索所获得的统一资源定位器中提取属于由该信息所表示的类型或类别的URL(步骤S106)。如果作为结果所提取出的URL的数量等于或小于最大项目数时(步骤S107中的“是”),则控制器301向代理搜索服务器200发送由搜索处理器302根据类型和类别选择信息所提取出的URL(步骤S108)。
当服务器200从搜索引擎服务器300中接收到URL时,控制器201向用户终端100发送URL。当终端从服务器200中接收到该URL时,控制器在显示器104上显示该URL(步骤S109)。
如果由搜索处理部分302根据类型和类别选择信息所提取出的URL数量超过了最大项目数(在步骤S107中的“否”),则控制器301将类型和类别选择信息再次传送到代理搜索服务器200,以请求选择类型或类别(步骤S110和S111)。控制器301按照类似的方式重复执行步骤S106到S113的处理,直到由搜索处理器302所提取出的URL的数量变得小于或等于最大项目数为止。
图8示出了在本实施例中的URL检索系统的操作的特定序列。假定在该序列中,想要使用URL系统的人员或用户是具有使用系统的权利的合格人员。
根据由用户所进行的输入操作,终端100向代理搜索服务器200传送连接请求(A101)。当从终端100中接收到该请求时,服务器200请求终端100发送用于验证的信息。在该验证中,进行检查以确定用户是否具有使用该系统的资格(A102)。当用户从终端100中输入验证信息时(A103),终端100将该信息发送到服务器200(A104)。已经从终端100接收到该信息之后,服务器200根据在用户信息存储器205中所存储的用户信息,对用户进行验证,并建立与终端100的连接(A105)。
在建立与终端100的连接之后,服务器200请求终端100发送搜索信息,即,创建搜索表达式的搜索文本和表示针对搜索的最大项目数的信息(A106)。当用户从终端100中输入搜索文本和最大项目数时,终端100向代理搜索服务器200传送该信息(A108)。
当从终端100接收到表示搜索文本的信息和指定最大项目数的信息时,服务器200分析搜索文本以提取关键字并创建搜索表达式(A109)。服务器200将URL提取请求与搜索表达式和最大项目数的信息一起传送到搜索引擎服务器300(A110)。当接收到该请求时,服务器300根据搜索表达式对URL数据库304中的信息进行搜索,以提取与该表达式相匹配的URL(A111)。在这种情况下,假定所获得的URL的数量超过了最大项目数。
由于这样检测到的URL的数量超过了最大项目数,因此,服务器300产生统一资源定位器所属的类型和类别信息,并将请求选择类型和类别的信息传送到代理搜索服务器200(A112)。在接收到该信息时,服务器200将该信息传送到终端100(A113)。
当用户操作终端100来选择类型和类别时(A114),终端100向服务器200发送信息,即,表示由用户所选择的类型和类别的类型和类别选择信息(A115)。当接收到该信息时,服务器200将该信息传送到搜索引擎服务器300(A116)。
已经接收到该信息之后,服务器300从作为关键字搜索的结果所提取出的URL中选择属于由该信息所指定的类型和类别的统一资源定位器(A117)。在这种情况下,假定根据该信息所选择的URL的数量等于或小于用于选择的项目的最大数量。
在URL的数量降低到等于或小于最大数量之后,服务器300将如上所述选择的定位器传送到服务器200(A118)。当从服务器300中接收到定位器时,服务器200将这些定位器传送到终端100(A119)。
在满足利用从搜索文本中所选择的关键字创建的搜索表达式的统一资源定位器中,仅将属于由用户所选择的类型和类别的统一资源定位器作为搜索结果通知给终端100。
在根据本实施例的URL检索系统中,不需要用户采用与要访问的信息相关的关键字。此外,即时当通过搜索选择了许多URL时,也不需要用户从作为搜索的结果获得的URL中选择与该信息相关的统一资源定位器。结果,不精通搜索和检索操作的任何用户能够容易地获得与要范围的信息相关的URL。
第二实施例
现在将描述根据本发明的第二实施例。类似于第一实施例,URL检索系统的实施例包括用户终端100、代理搜索服务器200、搜索引擎服务器300和使构成组件彼此相连的因特网500。
图9示出了在第二实施例中设置的用户终端100的结构。除了第一实施例中的组件之外,该终端100还包括语音和音频输入部分105。所述部分105包括将来自用户的声音和语音转换为电信号,即音频信号的转换器元件。
图10示出了第二实施例的代理搜索服务器200的结构。除了另外设置了语音或音频识别部分206和语音或音频字典207之外,该实施例与第一实施例几乎相同。
字典207存储了形态元素的语音或音频信息。利用在字典207中的语音和声音信息,语音识别器206分析并将音频信号转换为包括字符串的数据。
第二实施例的搜索引擎服务器300与第一实施例中的搜索引擎服务器实质上相同。
接下来,将描述URL检索系统的操作。
图11示出了终端100的用户利用代理搜索服务器200来检索URL的操作流程。
在从服务器200对用户进行验证到服务器200建立与终端100的连接的范围内的操作流程上(步骤S201和S202),第二实施例与第一实施例几乎相同。
当建立了该连接时,终端100的控制器101在显示器104上显示消息,该消息请求用户输入针对要检索的信息和最大项目数的语音。作为响应,用户操作操作员的控制台103来输入最大数量,然后,从语音输入部分206中输入针对该信息的语音。控制器101将该语音和最大数量传送到代理搜索服务器200(步骤S203)。
当服务器200从终端100接收到语音和最大数量时,控制部分201将针对该信息的语音数据提供给语音识别部分206。所述部分206通过参考在语音字典207中所存储的语音数据,将该语音转换为字符串数据(步骤S204)。语音识别器206将该数据发送到文本分析部分202。所述部分202通过参考在存储器205中的字典数据,将该数据分割为形态元素,以从中提取出关键字,然后根据该关键字产生搜索表达式(步骤S205)。
在步骤S206处开始的后续操作与第一实施例的步骤S105到S113的操作类似。
接下来,将描述根据第二实施例的URL检索系统的操作的另一实例。图12示出了在该实施例中由URL检索系统检索URL所进行的操作流程的另一实例。
在从用户验证到在第一实施例的步骤S101和S102中由服务器200设置连接的范围内的操作上,该实例的流程(步骤S251和S252)与第一实施例的流程几乎相同。
终端100的用户操作操作部分102输入检测项目的最大数量、以及指示将针对搜索表达式的信息作为字符串还是语音或音频数据发送的指定项目。控制器101将该信息和最大数量传送到代理搜索服务器200(步骤S253)。当服务器200接收到这些项目时,控制器201请求用户终端100发送针对搜索表达式的信息(步骤S254)。当终端100接收到该请求时,控制器101在显示部分104上显示用于请求输入针对搜索表达式的信息的消息。具体地,该消息请求用户输入相关的信息。
如果指定该信息作为字符串来发送,则用户从操作员的控制台102输入信息。如果该指定指示将该信息作为语音数据传送,则用户从语音输入部分206中提供针对搜索表达式的信息。
在已经接收到该信息之后,控制器101通过因特网500向代理搜索服务器200提供该信息(步骤S255)。当服务器200接收到该信息时,如果该数据是语音数据(步骤S256中的“是”),控制器201针对该数据进行语音识别操作,以便将该数据转换为字符串(步骤S257)。控制器201向文本分析部分202传送来自用户终端100的字符串或由语音识别器206所获得的字符串,以从中提取关键字,从而利用该关键字来产生搜索表达式(步骤S258)。
当创建了搜索表达式时,控制器201向终端100发布关于针对该搜索表达式是否存在其他任何消息的询问。已经接收到该询问之后,控制器101在显示器104上显示该消息。
当用户利用操作部分102来选择项目以指示不存在针对该搜索表达式的信息时(步骤S259中的“否”),控制器101将服务器200发送用于通知该情况的信息。已经识别了从终端100通知的情况之后,控制器201将表示检测项目的最大数量和搜索表达式的信息传送到搜索引擎服务器300,如同第一实施例中的步骤S106。此后的操作与第一实施例中的操作类似。
当用户操作操作部分102来指示针对搜索表达式存在另一信息项时(步骤S259中的“是”),控制器101将表示该情况的信息提供给服务器200。当服务器200接收到该信息时,控制器201将该信息发送到终端100以指定针对搜索表达式的信息格式(步骤S26)。当终端接收到指定格式的信息时,控制器101在显示器102上显示消息,该消息请求用户指定其中将要传送针对搜索表达式的信息的格式。该消息还请求用户指示利用该信息所产生的搜索表达式是包括或条件还是包括与条件。响应该消息,当用户操作操作员的控制台102以指定针对搜索表达式的格式和条件时,控制器101向代理搜索服务器200传送表示该格式和条件的信息(步骤S261)。
重复执行上述过程(步骤S254到S261),直到完全将针对搜索表达式的信息传送到服务器200为止。
此刻之后的操作与第一实施例的操作类似。
如从图13中可以看到,还可能的是,在从针对搜索表达式的所有信息项中产生了搜索表达式之后,针对各个搜索表达式设置组合条件。接下来,将描述在这种情况下的操作。步骤S251’到S259’的处理与图12所示的步骤S251到S259的处理类似。
在已经利用针对搜索表达式的信息项创建了搜索表达式之后(步骤S259’中的“否”),控制器201请求用户终端100指定各个搜索表达式的组合。当终端100接收到该请求时,控制器101在显示器104上显示消息,该消息请求指定每一个搜索表达式的组合。当用户从操作部分102中指定了针对每一个搜索表达式的组合时,控制器101向代理搜索服务器200发送组合条件信息。已经接收到该信息之后,控制器201根据来自终端100的条件,对搜索表达式进行组合。控制器201向搜索引擎服务器300传送如由用户所指定的条件所指示的那样组合的搜索表达式,以请求URL检索。之后的处理与在步骤S106处开始的第一实施例的处理类似。
在本实施例中,可以将音频数据作为针对搜索表达式的信息来提供。因此,不需要用户从操作员的控制台102中输入搜索文本。结果,即时用户不熟悉控制台102的操作,或者即时操作部分102是诸如定点设备等不适合于输入语句或文本的设备,用户也可以容易地输入针对搜索表达式的信息。
即时当除了日语之外的其他语音的单词的正确拼写、或正确的中文字字符是未知的,只要其发音是已知的,就可以提取出关键字。
如上所述,在URL检索系统的实施例中,不需要用户采用针对要访问的信息的关键字。即时当作为搜索的结果,选择了许多统一资源定位器时,也不需要用户终端的用户从中选择与该信息相关的统一资源定位器。因此,即时用户不完全熟悉检索操作,用户也能够容易地获得与要访问的信息相关的URL。
第三实施例
现在将描述根据本发明的第三实施例。与第一实施例类似,URL检索系统的该实施例包括用户终端100、代理搜索服务器200和搜索引擎服务器300。本实施例还包括使构成组件彼此相连的因特网500。
图14示出了在URL检索系统的实施例中的用户终端100的结构。除了其中设置了图像输入部分106之外,终端100与第一实施例的终端类似。所述部分106包括用于产生图像数据的设备,例如扫描仪和/或数字摄像机。部分106还可以包括从在信息记录介质上记录的图像数据的信号中产生图像数据的设备。
图15示出了在URL检索系统的第三实施例的代理搜索服务器200的结构。除了其中设置了图像识别部分208和图像字典209之外,服务器200与第一实施例类似。
字典209存储了特征数据,例如,其间建立了关系的图像轮廓和色调与形态元素。例如,字典209存储了彼此之间具有对应关系的特征数据“汽车轮廓”和“汽车”。
图像识别部分208具有从图像数据中提取特征数据的功能,并在图像字典209中所存储的信息中选择与特征数据相匹配的信息项,结果,将该图像数据转换为字符串数据。
搜索引擎服务器300实质上与第一实施例相同。
将描述在本实施例中URL检索系统搜索URL的操作。
图16示出了当在本实施例中,URL检索系统进行URL检索时的操作流程。
从用户验证到由服务器200设置连接的操作流程(步骤S301和S302)与第一实施例的步骤S101和S102中的第一实施例的操作流程几乎相同。
当建立了与服务器200的连接时,用户终端100的控制器101在显示器104上显示消息,该消息请求用户输入针对要检索的信息的图像和提取项目的最大数量。当作为响应,用户从操作员的控制台(操作部分)102输入了最大数量,并从图像输入部分207中输入了与该信息相关的图像时,控制器101将图像和最大数量发送到服务器200(步骤S303)。
当服务器200从终端100中接收到该图像和最大数量时,控制部分201将针对该信息的图像数据提供给图像识别器部分208。该部分208通过参考在图像字典中作为图像存储的特征数据,将该图像数据转换为字符串数据(步骤S304)。然后,图像识别器208将字符串数据发送到文本分析部分202。在步骤S305处开始的后续操作与第二实施例的第一操作实例中在步骤S305处开始的操作类似。
URL检索系统的该实施例还可以执行与第二实施例的第二操作实例类似的处理。即,终端100的用户可以选择将针对搜索表达式的信息作为图像还是作为字符串发送到服务器200。
在本实施例中,由于将图像作为针对搜索表达式的信息来提供,因此,不需要用户从控制台部分102中输入搜索文本。因此,即时当用户不精通控制台102的操作时,或者当部分102是诸如定点设备等不适合于输入语句的设备时,用户也可以适当地高速输入针对搜索表达式的信息。
另外,即时当在其标题上以及如何书写其的方式方面,该信息是不清楚的,只要图像是可得到的,就能够利用该图像提取出关键字。
如上所述,在根据本实施例的URL检索系统中,不需要用户采用针对要访问的信息的关键字。此外,即时当通过搜索获得了许多URL时,也不需要用户从中选择与该信息相关的统一资源定位器。结果,即时用户不熟悉搜索操作,该用户也可以容易地获得与要访问的信息相关的URL。
第四实施例
接下来,将对根据本发明的第四实施例进行描述。与第一实施例类似,URL检索系统的第四实施例也包括用户终端100、代理搜索服务器200、搜索引擎服务器300、以及与使构成组件彼此相连的因特网500。
图17示出了第四实施例中的用户终端100的结构。除了第一实施例的用户终端100的构成组件之外,终端100还包括语音输入部分105和图像输入部分106。部分105与第二实施例类似,并且部分106也与第三实施例几乎相同。
图18上述了在第四实施例中的代理搜索服务器200的结构。当与第一实施例的结构进行比较时,服务器200另外包括语音识别部分206、语音字典207、图像识别部分208和图像字典209。语音识别部分206和语音字典207与第二实施例实质上相同。图像识别部分208和图像字典209与第三实施例几乎相同。
现在将描述本实施例的URL检索系统中的URL检索操作。
图19示出了在第四实施例中,URL检索系统检索URL的操作流程。
从服务器200验证用户到服务器200建立与终端100的连接的流程(步骤S401和S402)与第二实施例的第二操作实例的步骤S251和S253中的处理类似。
当用户操作操作部分102来输入最大数量和关于将针对搜索表达式的信息作为字符串、语音数据、还是作为图像数据发送的指示。控制部分201向代理搜索服务器200发送表示传输格式的信息和针对搜索表达式的信息(步骤S403)。当服务器200接收到这些信息项时,控制器201请求终端100传送针对搜索表达式的信息(步骤S404)。当终端100接收到该请求时,控制器101在显示器104上显示消息,该消息请求用户输入信息。
如果已经指定将信息作为字符串来发送,则用户从控制台102输入信息,以便将该信息发送到终端100。如果已经指定将信息作为语音数据来发送时,用户从语音输入部分105中输入信息。如果已经指定将信息作为图像来发送,则用户按照与如上所述相同的方式从图像输入部分106中输入信息。
已经获得了该信息之后,控制器101通过因特网500将该信息传送到服务器200(步骤S405)。当服务器200接收到针对搜索表达式的信息时,如果数据是语音数据(步骤S406中的“语音”),则控制器201将语音数据转换为字符串(步骤S407)。如果该信息是图像数据(步骤S406中的“图像”),则控制器201进行图像识别,以便将该数据转换为字符串(步骤S408)。控制器将由语音识别器206或图像识别器208转换后的字符串传送到文本分析器202以提取关键字,结果,创建了搜索表达式(步骤S409)。
步骤S410到S412的操作与第二实施例的步骤S259到S261的操作几乎相同。
控制器201重复执行过程(步骤S404到S412),直到将针对搜索表达式的所有信息项传送到代理搜索服务器200为止。在将所有信息项传送到服务器200之后,操作与第一实施例的操作实质上相同。
在该实施例中,由于可以将语音数据或图像数据作为针对搜索表达式的信息来输入,用户不需要从操作部分102中输入搜索文本。结果,即时当用户不熟悉用户控制台102的操作时,或者即时当控制台102是诸如定点设备之类的不适合输入文本的设备时,用户可以在较短的时间段内容易地输入针对搜索表达式的信息。
此外,针对搜索表达式的信息可以是字符串、语音数据和图像中的任意一个,并且还能够对这些项目进行组合。因此,不精通检索操作的任何用户都可以正确地检测到所需的URL。
如上所述,在根据本实施例的URL检索系统中,不需要用户采用与要访问的信息相关的关键字。此外,即使当通过搜索获得了大量URL,也不需要用户选择与从根据搜索得到的URL结果中的信息相关统一资源定位器。结果,即时用户不熟悉搜索操作,用户也可以容易地获得与要访问的信息相关的URL。
第五实施例
现在将描述根据本发明的第五实施例。URL检索系统的第五实施例与第一实施例类似,并且包括用户终端100、代理搜索服务器200和搜索引擎服务器300。该实施例还包括使构成组件彼此相连的因特网500。
图20示出了在第五实施例中的代理搜索服务器200的结构。除了第一实施例的代理搜索服务器200的构成组件之外,具有与第一实施例类似的结构的服务器200还包括类型和类别信息存储器210。
存储器210存储表示在搜索引擎服务器300的URL数据库304中的数据的分级结构的信息。
现在将对在本实施例中,URL检索系统进行URL检索的操作进行描述。
图21示出了URL检索系统在URL检索中的操作流程。从步骤S501到步骤S504的处理流程与第一实施例中从步骤S101到S104的处理类似。
当文本分析器202产生了搜索表达式时,控制器201通过参考在理行和类别信息存储器210中所存储的信息进行检查,以确定该搜索表达式是否包括关键字匹配“类型”(步骤S505)。
如果该表达式包括这样的关键字(步骤S505中的“是”),则控制器进行检查以确定该关键字是否单独成为了“或搜索”的参数(步骤S506)。如果该关键字是“或搜索”的参数(步骤S506中的“是”),则控制器201从搜索表达式中删除该关键字(步骤S507)。如果每一个关键字与类型名相匹配,并且自身成为或搜索条件,则控制器21请求用户终端100传送另一搜索文本。
在由文本分析器202所获得的任何关键字都不与类型名相匹配(步骤S505中的“否”),或者搜索表达式包括与类型名相匹配的关键字,并且该关键字自身未成为或搜索的参数(步骤S506中的“否”)的情况下,在搜索表达式中使用所有关键字。
然后,控制器201将搜索表达式传送到搜索引擎服务器300(S508)。后续的操作与第一实施例中在步骤S106处开始的操作几乎相同。
当使用与类型名匹配的关键字作为或搜索的单个参数来进行URL检索时,极有可能获得大量的URL。然而,在本实施例的URL检索系统中,当作为文本分析的结果,检测到与类型名相匹配的关键字时,不将该关键字用作或搜索的单一参数。这防止了利用其中需要搜索范围在稍后变得较窄的搜索表达式的URL检索的问题。
在本实施例的描述中,当作为搜索表达式中的或搜索的单个参数,包括与类型名相匹配的关键字时,从表达式中删除该关键字。然而,当与类型名相匹配的关键字自身变为了或条件时,也能够获得大量的URL。因此,此外,当检测到这样的关键字时,可以根据情况来执行上述的处理。
按照这种方式,在根据本实施例的URL检索系统中,不需要用户采用与要访问的信息相对应的关键字。另外,能够避免在检测到大量URL的条件下执行URL检索。此外,即时当通过搜索获得了大量的URL,也不需要用户从通过搜索获得的URL中选择与该信息相关的统一资源定位器。结果,不熟悉搜索操作的任何用户可以容易地获得与要访问的信息相关的URL。
第六实施例
现在将描述根据本发明的第六实施例。与第一实施例类似,URL检索系统的第六实施例包括用户终端100、代理搜索服务器200、搜索引擎服务器300、以及使构成组件彼此相连的因特网500。
图22示出了在第六实施例中的代理搜索服务器200的结构。除了第四实施例中的代理搜索服务器200的构成组件之外,该服务器200还包括搜索表达式存储器211。
存储器211存储要发送到搜索引擎服务器300的搜索表达式。
图23示出了在第六实施例中,URL检索系统检索URL的操作流程。
从步骤S601到步骤S609的在服务器200中提取关键字的处理与第四实施例的步骤S401到S409类似。当文本分析器202从用户终端100中接收到的搜索数据中提取出关键字时,控制器201利用该关键字产生搜索表达式,并将该表达式存储在搜索表达式存储器211中(步骤S605)。控制器201还将表示检测项目的最大数量和搜索表达式发送到服务器300(步骤S606)。
根据最大项目数从URL数据库304的信息中提取URL的后续处理(步骤S607和S608及步骤S613到S616)与第一实施例的步骤S106和S107及步骤S111到S115的处理实质上相同。
在已经从如上所述的数据库304的信息中获得了URL之后,控制器301将该URL传送到服务器200(步骤S609)。
当服务器200从服务器300中接收到该URL时,控制器201从存储器211中读取搜索表达式(步骤S610)。控制器201向用户终端100发送来自服务器300的URL、以及从存储器211中获得的表达式(步骤S611)。当终端100从服务器200中接收到URL和表达式时,控制器101在显示器104上显示和搜索表达式,作为检索结果(步骤S612)。
当针对搜索表达式的信息是语音数据或图像,则可能发生不能够从语音数据或图像中提取出与用户所需的信息相关的关键字的情况。当信息是诸如语音数据时,可能由发音彼此相等而字符彼此不同的错误短语来识别。当信息是诸如图像时,则可能存在将具有与相关图像类似的外观的另一图像错误识别为相关图像的情况。如果从语音数据或图像中选择了用户所不期望的关键字,则不能够通过关键字搜索来获得与要由用户访问的信息相关的URL。在这种情况下,如果仅将这样提取出的URL作为检索结果显示给用户,用户可能会识别错误结果:即使当这样的URL存在时,与所需信息相关的URL也不存在。
在本实施例中,由于将搜索表达式和通过检索检测到的URL通知给用户终端100,用户可以识别用于提取URL的搜索表达式。因此,当使用用户所不期望的关键字来提取结果URL时,用户可以通过改变针对搜索表达式的信息来检索与所需信息相对应的适当URL。结果,不精通检索操作的任何用户可以容易地获得与要访问的信息相关的URL。
已经描述了仅作为根据本发明的实例的实施例。本发明并不局限于这些实施例。
例如,在实例的描述中,代理搜索服务器200和搜索引擎服务器300是相互独立的单元,并且可以通过因特网彼此相连。然而,也能够采用通过诸如局域网(LAN)的服务器内网络将服务器200与服务器300相连的结构。在这种情况下,除了与因特网相连的收发器部分之外,还可以分立地设置针对LAN的接口模块。根据本发明,代理搜索服务器200和搜索引擎服务器300可以构造为一个单元,也用作如上所述的功能。
可以如同上述实施例将URL数据库400集成地设置在搜索引擎服务器300中,也可以将该URL数据库400与服务器300分离。
用户终端100可以通过有线或无线通信与因特网500相连。用户终端100可以是与移动通信网络相连的移动终端、与无线LAN或因特网相连的计算机终端或其他任何终端。即,终端100可以是任何类型的终端。
根据本发明,可以进行各种修改。
如从描述中可以看到的,根据本发明,提出了一种URL检索系统和URL检索方法,其中,不需要用户采用与要访问的信息相对应的关键字。此外,即时通过搜索获得了大量的URL,也不需要用户从通过搜索获得的URL中选择与该信息相关的统一资源定位器。
虽然已经参考特定的说明性实施例描述了本发明,但是本发明并不局限于这些实施例,而仅有所附权利要求来限定本发明。应该意识到,在不脱离本发明的精神和范围的情况下,本领域的技术人员能够改变或修改这些实施例。

Claims (18)

1.一种统一资源定位器(URL)获取系统,包括:
用户终端,能够通过因特网对信息进行通信;
URL数据库,按照分级结构存储了表示对因特网上的公众开放的信息位置的URL和各个URL的关键字,在URL和关键字之间建立了对应关系;
搜索单元,用于从在URL数据库中所存储的URL中提取与搜索表达式相匹配的URL;
服务器,响应来自用户终端的请求,向搜索单元请求URL的检索,并且将检索的结果通知给用户终端;以及
因特网,使用户终端、URL数据库、搜索单元和服务器彼此相连,其中,
用户终端包括:
用于将针对搜索表达式的信息传送到服务器的传送装置;以及
请求装置,用于请求服务器通知作为检索结果、与所述信息相关的URL,URL的数量等于或小于最大数量,
服务器包括:
提取装置,用于从用户终端接收到的信息中提取出关键字,并且利用所述关键字创建搜索表达式;
用于请求搜索单元检索与搜索表达式相匹配的URL的请求装置;
用于将表示最大数量的信息发送到搜索单元的发送装置;
用于请求用户终端选择由从搜索单元中接收到的分级等级信息所指示的分级等级的项目中的至少一个的请求装置;
用于向搜索单元传送表示由用户操作用户终端所选择的分级等级的分级等级选择信息的传送装置;以及
用于将来自搜索单元的检索通知给用户终端的通知装置;以及
所述搜索单元包括:
创建装置,当根据从服务器接收到的搜索表达式所提取的URL数量超过了所述最大数量,创建由分级等级信息表示的针对每一个URL所属的分级等级,并且将分级等级信息作为检索结果传送到服务器;以及
选择装置,用于从根据从服务器接收到的搜索表达式提取出的URL中选择属于由分级等级选择信息所表示的分级等级的URL;
其中通知装置,在当由搜索装置根据搜索表达式所提取出的URL的数量等于或小于最大数量时,将由搜索装置所提取出的URL作为检索的结果通知给用户终端,并且当由搜索装置根据搜索表达式所提取出的URL的数量超过了最大数量时,将属于由分级等级选择信息的分级等级的URL作为检索结果通知给用户终端。
2.根据权利要求1所述的URL检索系统,其特征在于:当属于由分级等级选择信息所表示的分级等级的URL的数量超过了最大数量时,搜索单元再次向服务器传送分级等级信息。
3.根据权利要求1或2所述的URL检索系统,其特征在于:服务器将搜索表达式与检索结果一起通知给用户终端。
4.根据权利要求1到3之一所述的URL检索系统,其特征在于:
所述服务器还包括存储装置,所述存储装置已经存储了表示URL数据库的分级结构的信息;以及
当与URL数据库的最高分级等级名相匹配的关键字作为单一的或条件项包括在搜索表达式中时,服务器从搜索表达式中删除所述关键字。
5.根据权利要求1到4之一所述的URL检索系统,其特征在于:
所述服务器还包括音频识别装置,用于将音频数据转换为字符串数据;以及
当从用户终端中作为语音数据接收到针对搜索表达式的信息时,所述音频识别装置将音频数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
6.根据权利要求1到5之一所述的URL检索系统,其特征在于:
所述服务器还包括图像识别装置,用于将图像数据转换为字符串数据;以及
当从用户终端作为图像数据接收到针对搜索表达式的信息时,图像识别装置将图像数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
7.一种通过因特网与用户终端相连的用于URL检索的服务器,用于响应来自用户终端的请求,向搜索单元请求URL检索,并将检索结果通知给用户终端,包括:
URL数据库,按照分级结构存储了表示对因特网上的公众开放的信息位置的URL和各个URL的关键字,在URL和关键字之间建立了对应关系;
接收装置,用于从用户终端接收针对搜索表达式的信息、以及与所述信息相关的最大数量;
提取装置,用于从用户终端所接收到的信息中提取关键字,并利用所述关键字创建搜索表达式;
搜索装置,用于从在URL数据库中所存储的URL中提取与搜索表达式相匹配的搜索相匹配的URL;
创建装置,当由搜索装置根据搜索表达式所提取的URL数量超过了所述最大数量,则创建分级等级信息表示针对每一个URL的所述URL所属的分级等级;
请求装置,用于请求用户终端选择由分级等级信息所指示的分级等级的项目中的至少一个;
获取装置,用于从用户终端中获取表示由用户操作用户终端所选择的分级等级的分级等级信息;
选择装置,用于从根据从服务器接收到的搜索表达式所提取出的URL中选择属于由分级等级选择信息所表示的分级等级的URL;以及
通知装置,当由搜索装置根据搜索表达式所提取出的URL的数量等于或小于最大数量时,将由搜索装置所提取出的URL作为检索的结果通知给用户终端,并且当由搜索装置根据搜索表达式所提取出的URL的数量超过了最大数量时,将属于由分级等级选择信息的分级等级的URL作为检索结果通知给用户终端。
8.根据权利要求7所述的服务器,其特征在于:当属于由分级等级选择信息所表示的分级等级的URL的数量超过了最大数量时,服务器请求用户选择再次由分级等级信息所表示的分级等级的项目的至少一个。
9.根据权利要求7或8所述的服务器,其特征在于:服务器将搜索表达式与检索结果一起通知给用户终端。
10.根据权利要求7到9之一所述的服务器,其特征在于还包括存储装置,所述存储装置已经存储了表示URL数据库的分级结构的信息;以及
当与URL数据库的最高分级等级名相匹配的关键字作为单一的或条件项包括在搜索表达式中时,服务器从搜索表达式中删除所述关键字。
11.根据权利要求7到10之一所述的服务器,其特征在于还包括音频识别装置,用于将音频数据转换为字符串数据;以及
当从用户终端中作为语音数据接收到针对搜索表达式的信息时,所述音频识别装置将音频数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
12.根据权利要求7到11之一所述的服务器,其特征在于还包括图像识别装置,用于将图像数据转换为字符串数据;以及
当从用户终端作为图像数据接收到针对搜索表达式的信息时,图像识别装置将图像数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
13.一种在系统中使用的URL检索方法,所述系统包括:用户终端,能够通过因特网对信息进行通信;URL数据库,用于按照分级结构存储对因特网上的公众开放的信息位置的URL和各个URL的关键字,在URL和关键字之间建立了对应关系;搜索单元,用于从在URL数据库中所存储的URL中提取与搜索表达式相匹配的URL;服务器,用于响应来自用户终端的请求,向搜索单元请求URL检索,并将检索结果通知给用户终端;以及因特网,使用户终端、URL数据库、搜索单元和服务器彼此相连,所述方法包括以下步骤:
将针对搜索表达式的信息从用户终端传送到服务器;
由用户终端请求服务器通知作为检索结果、与所述信息相关的URL,URL的数量等于或小于最大数量,
由服务器从用户终端接收到的信息中提取出关键字,并且利用所述关键字创建搜索表达式;
由服务器请求搜索单元检索与搜索表达式相匹配的URL;
由服务器将表示最大数量的信息发送到搜索单元;
由搜索单元从URL数据库中所存储的URL中提取与从服务器接收到的搜索表达式相匹配的URL;
由搜索单元进行检查以确定根据搜索表达式所提取出的URL的数量是否超过了最大数量;
当根据从服务器接收到的搜索表达式所提取出的URL的数量超过了最大数量时,由搜索单元创建表示针对每一个URL的、所述URL所属的分级等级的分级等级信息,并且将分级等级信息作为检索结果传送到服务器;
由服务器请求用户终端选择由从搜索单元中接收到的分级等级信息所表示的分级等级的项目中的至少一个;
由服务器向搜索单元传送表示由用户终端所选择的分级等级的分级等级选择信息;
由搜索单元从根据从服务器接收到的搜索表达式提取出的URL中,选择属于由分级等级选择信息所表示的分级等级的URL;
由搜索单元将其数量等于或小于最大数量的URL作为检索结果发送到服务器;以及
由服务器将检索结果通知给用户终端。
14.根据权利要求13所述的URL检索方法,其特征在于还包括传送步骤,当属于由分级等级选择信息所表示的分级等级的URL的数量超过了最大数量时,由搜索单元再次向服务器传送分级等级信息。
15.根据权利要求13或14所述的URL检索方法,其特征在于还包括通知步骤,由服务器将搜索表达式与检索结果一起通知给用户终端。
16.根据权利要求13到15之一所述的URL检索方法,其特征在于:所述服务器还包括存储装置,所述存储装置已经存储了表示URL数据库的分级结构的信息,所述方法还包括删除步骤,当与URL数据库的最高分级等级名相匹配的关键字作为单一的或条件项包括在搜索表达式中时,由服务器从搜索表达式中删除所述关键字。
17.根据权利要求13到16之一所述的URL检索方法,其特征在于:所述服务器还包括音频识别装置,用于将音频数据转换为字符串数据,所述方法还包括转换步骤,当从用户终端中作为语音数据接收到针对搜索表达式的信息时,由所述音频识别装置将音频数据转换为字符串数据,然后,从所述信息中提取出关键字。
18.根据权利要求13到17之一所述的URL检索方法,其特征在于:所述服务器还包括图像识别装置,用于将图像数据转换为字符串数据所述方法还包括转换步骤,当从用户终端作为图像数据接收到针对搜索表达式的信息时,由图像识别装置将图像数据转换为字符串数据,然后,服务器从所述信息中提取出关键字。
CNB2004100491353A 2003-06-20 2004-06-17 Url检索系统、服务器及url检索方法 Expired - Fee Related CN1299224C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003176364A JP2005011180A (ja) 2003-06-20 2003-06-20 Url検索システム及びそれに使用するサーバ並びにurl検索方法
JP2003176364 2003-06-20

Publications (2)

Publication Number Publication Date
CN1573752A CN1573752A (zh) 2005-02-02
CN1299224C true CN1299224C (zh) 2007-02-07

Family

ID=33411008

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100491353A Expired - Fee Related CN1299224C (zh) 2003-06-20 2004-06-17 Url检索系统、服务器及url检索方法

Country Status (4)

Country Link
US (1) US20040260730A1 (zh)
EP (1) EP1489528A3 (zh)
JP (1) JP2005011180A (zh)
CN (1) CN1299224C (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
JP2005275692A (ja) * 2004-03-24 2005-10-06 Sony Corp コンテンツ提供装置、コンテンツ提供システム、Webサイト変更装置、Webサイト変更システム、コンテンツ提供方法およびWebサイト変更方法
JP4516815B2 (ja) * 2004-09-28 2010-08-04 株式会社ニューズウォッチ 検索装置
CA2633959C (en) * 2005-12-12 2015-04-28 Mark Samuelson Mobile device retrieval and navigation
CN100505704C (zh) * 2005-12-17 2009-06-24 华为技术有限公司 查询用户信息的方法
KR100772392B1 (ko) 2006-02-07 2007-11-01 삼성전자주식회사 홈 네트워크에서 tv 채널을 이용한 콘텐트 처리 방법 및그 장치
US20080010387A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method for defining a Wiki page layout using a Wiki page
US20080010386A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for client wiring model
US8196039B2 (en) * 2006-07-07 2012-06-05 International Business Machines Corporation Relevant term extraction and classification for Wiki content
US20080010345A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for data hub objects
US8775930B2 (en) * 2006-07-07 2014-07-08 International Business Machines Corporation Generic frequency weighted visualization component
US7954052B2 (en) * 2006-07-07 2011-05-31 International Business Machines Corporation Method for processing a web page for display in a wiki environment
US20080010388A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for server wiring model
US20080065769A1 (en) * 2006-07-07 2008-03-13 Bryce Allen Curtis Method and apparatus for argument detection for event firing
US8219900B2 (en) * 2006-07-07 2012-07-10 International Business Machines Corporation Programmatically hiding and displaying Wiki page layout sections
US20080010338A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for client and server interaction
US8560956B2 (en) 2006-07-07 2013-10-15 International Business Machines Corporation Processing model of an application wiki
US7979458B2 (en) * 2007-01-16 2011-07-12 Microsoft Corporation Associating security trimmers with documents in an enterprise search system
KR101385492B1 (ko) * 2007-01-23 2014-04-16 삼성전자주식회사 데이터 전송 장치와 화상형성장치 및 그 방법
KR100821519B1 (ko) * 2007-04-20 2008-04-14 유니챌(주) 단어정보 제공 시스템
US20080319972A1 (en) * 2007-06-19 2008-12-25 Childress Rhonda L Short period search keyword
US8285700B2 (en) * 2007-09-07 2012-10-09 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
CN101136025A (zh) * 2007-09-24 2008-03-05 腾讯科技(深圳)有限公司 一种下载网络资源的方法、系统及设备
CN101437039B (zh) * 2007-11-15 2012-11-07 华为技术有限公司 一种移动搜索的方法、系统和设备
CN101854335A (zh) * 2009-03-30 2010-10-06 华为技术有限公司 一种过滤的方法、系统及网络设备
WO2011080867A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 機器間の距離に応じてセキュリティレベルを設定するサーバ装置、クライアント装置、通信システム、サーバ制御用集積回路、クライアント制御用集積回路、サーバプログラム、クライアントプログラム、クライアント装置への接続方法、サーバ装置への接続方法、及び通信システム接続方法
CN102844758B (zh) * 2010-03-26 2016-04-06 乐天株式会社 检索系统、检索方法、检索程序以及记录介质
JP5044707B1 (ja) * 2011-03-31 2012-10-10 株式会社東芝 情報処理システム、情報処理装置およびプログラム
CN102207960B (zh) * 2011-05-25 2013-10-23 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
US20130066633A1 (en) * 2011-09-09 2013-03-14 Verisign, Inc. Providing Audio-Activated Resource Access for User Devices
CN102411617B (zh) * 2011-10-31 2013-09-18 北京锐安科技有限公司 一种对海量url进行存储和查询方法
CN102831181B (zh) * 2012-07-31 2014-10-01 北京光泽时代通信技术有限公司 缓存文件的目录刷新方法
DE102016208118A1 (de) * 2016-05-11 2017-11-16 Lenze Automation Gmbh Verfahren zum Konfigurieren eines elektrischen Antriebssystems und Maschine
JP2019102060A (ja) * 2017-12-04 2019-06-24 株式会社リコー 情報提示システム、情報提示方法、プログラム、及び記録媒体
CN108900574A (zh) * 2018-06-04 2018-11-27 上海市疾病预防控制中心 基于用户个性化需求的一站式搜索推送方法
CN113114709B (zh) * 2021-06-16 2021-09-17 紫光恒越技术有限公司 自定义url过滤分类的应用方法、装置、服务器及存储设备
CN113852682B (zh) * 2021-09-23 2024-06-14 中国农业银行股份有限公司 一种数据传输方法及中间传输层服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
JP2000035174A (ja) * 1998-07-17 2000-02-02 Nippon Seiko Kk 多重管継手

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330336A (ja) * 1996-06-11 1997-12-22 Sony Corp 情報処理装置
JP3499105B2 (ja) * 1997-03-03 2004-02-23 株式会社東芝 情報検索方法および情報検索装置
US5970489A (en) * 1997-05-20 1999-10-19 At&T Corp Method for using region-sets to focus searches in hierarchical structures
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US6178461B1 (en) * 1998-12-08 2001-01-23 Lucent Technologies Inc. Cache-based compaction technique for internet browsing using similar objects in client cache as reference objects
US6970894B2 (en) * 1998-12-30 2005-11-29 Intel Corporation Method for extracting information from a file using a printer driver
JP2001052024A (ja) * 1999-08-13 2001-02-23 Nippon Telegr & Teleph Corp <Ntt> 類似特徴量の検索方法及び装置及び類似特徴量の検索プログラムを格納した記憶媒体
US6493744B1 (en) * 1999-08-16 2002-12-10 International Business Machines Corporation Automatic rating and filtering of data files for objectionable content
US6389467B1 (en) * 2000-01-24 2002-05-14 Friskit, Inc. Streaming media search and continuous playback system of media resources located by multiple network addresses
US20020055870A1 (en) * 2000-06-08 2002-05-09 Thomas Roland R. System for human capital management
JP4014390B2 (ja) * 2001-10-29 2007-11-28 オリンパス株式会社 マルチメディアオブジェクト検索システム
US7072883B2 (en) * 2001-12-21 2006-07-04 Ut-Battelle Llc System for gathering and summarizing internet information
US20050091232A1 (en) * 2003-10-23 2005-04-28 Xerox Corporation Methods and systems for attaching keywords to images based on database statistics

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
JP2000035174A (ja) * 1998-07-17 2000-02-02 Nippon Seiko Kk 多重管継手

Also Published As

Publication number Publication date
JP2005011180A (ja) 2005-01-13
EP1489528A3 (en) 2005-02-23
US20040260730A1 (en) 2004-12-23
EP1489528A2 (en) 2004-12-22
CN1573752A (zh) 2005-02-02

Similar Documents

Publication Publication Date Title
CN1299224C (zh) Url检索系统、服务器及url检索方法
CN1156773C (zh) 字典管理方法以及装置
CN1242337C (zh) 用于访问在一个网络上的信息的方法和系统
CN1158645C (zh) 到服务应用程序上的用户接口的声音控制
CN1716922A (zh) 移动装置消息传送的方法和系统
CN1195856A (zh) 提供建议信息的信息处理器和记录媒体
CN1742480A (zh) 信息处理装置、信息处理方法和计算机程序
CN1761959A (zh) 在移动电话系统中存储和检索多媒体数据和相关注释数据
CN1908965A (zh) 信息处理装置及其方法和程序
CN1573928A (zh) 用语音应用语言标记执行的语义对象同步理解
CN1308438A (zh) 在多个关系搜索主机中进行注册和搜索的系统和方法
CN1757020A (zh) 信息处理装置、信息处理方法以及计算机程序
CN1745370A (zh) 信息处理装置、内容管理方法、内容信息管理方法和计算机程序
CN101030204A (zh) 在用户终端设备上生成用户界面的入口服务器和方法
CN1924858A (zh) 一种获取新词的方法、装置以及一种输入法系统
CN1209895C (zh) 信息处理装置和信息处理方法
CN1901547A (zh) 生成web服务策略协议的方法和设备
CN1862698A (zh) 信息处理系统、信息生成装置及方法、信息处理装置及方法、程序
CN101080927A (zh) 内容推荐装置
CN1742279A (zh) 条形码识别装置
CN1519753A (zh) 程序、字符输入编辑方法、装置及记录媒体
CN101065967A (zh) 元数据管理装置以及元数据利用装置
CN1925438A (zh) 信息处理设备和网络设备以及它们的控制方法
CN1282151C (zh) 语音识别设备和语音识别方法
CN1163836C (zh) 图象信息检索系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LENOVO INNOVATION CO., LTD. (HONGKONG)

Free format text: FORMER OWNER: NEC CORP.

Effective date: 20141126

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: HONG KONG, CHINA

TR01 Transfer of patent right

Effective date of registration: 20141126

Address after: Hongkong, China

Patentee after: LENOVO INNOVATIONS Co.,Ltd.(HONG KONG)

Address before: Tokyo, Japan

Patentee before: NEC Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070207

Termination date: 20150617

EXPY Termination of patent right or utility model