CN1849604A - 通过在网上搜索列举来创建数据库 - Google Patents

通过在网上搜索列举来创建数据库 Download PDF

Info

Publication number
CN1849604A
CN1849604A CNA2004800260075A CN200480026007A CN1849604A CN 1849604 A CN1849604 A CN 1849604A CN A2004800260075 A CNA2004800260075 A CN A2004800260075A CN 200480026007 A CN200480026007 A CN 200480026007A CN 1849604 A CN1849604 A CN 1849604A
Authority
CN
China
Prior art keywords
item
collection
enumerating
separately
enumerates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800260075A
Other languages
English (en)
Inventor
J·H·M·科斯特
N·德琼格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1849604A publication Critical patent/CN1849604A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明利用存在于巨大集合的电子文档中的列举或列表之间的重叠来创建或扩展数据库。

Description

通过在网上搜索列举来创建数据库
技术领域
本发明涉及能够扩展信息项集的方法,还涉及用于扩展信息项集的方法以及用于执行所述方法的软件。
背景技术
如在计算环境中所使用的术语“本体(ontology)”典型情况下指的是术语名称、术语含义和术语相互关系的规范。也被称为“域概念化”的本体类似于分类学,但是在术语之间可以使用更丰富的语义关系,以及关于怎样指定术语和关系的严格规则。例如参见Deborah L.McGuinness的“Ontologies Come of Age”。在DieterFensel、Jim Hendler、Henry Lieberman和Wolfgang Wahlster编辑的自旋语义网:Bringing the World Wide Web to Its Full Potential中,MIT出版,2002年。
典型情况下创建本体是费时的任务。例如在Yahoo,一小组专家手动地分类网页。DMOZ的开放目录工程(Open Directory ProjectODP)平衡35,000名志愿者编辑的合作成果以便利用分类学中超过360,000个分类来产生巨大、简单的本体。
发明内容
发明人考虑这样一个例子,伴随电子内容信息的元数据在因特网上以及诸如光盘、存储卡等之类的载体上可用。元数据是可以用来搜索或浏览音频/视频内容的附加信息。例如,与歌曲有关的元数据可以包括歌曲的标题、艺术家的名字、流派的指示等。给定确定域(流行音乐、电影等)的本体,常常难于用相关数据来填充元数据数据库。为了填充数据库,通过手动添加数据是昂贵的且费时的。因此发明人建议通过使用在环球网的网页上可用的信息来自动地填充数据库。其思想在于通过在网页上搜索列举来自动地扩展给定类型的小项集,在所述列举中列出了给定集的多个项。在这种列举中的其它词(或词组)也将以较高的概率涉及相同类型的项。因而本发明利用存在于巨大集合的电子文档中的列举或列表之间的重叠来创建或扩展数据库。
更具体地说,本发明的示例涉及能够扩展具有共同的本体属性的信息项集的方法。所述方法包括能够向电子文档集合查询所述集的多个项的第一列举。所述查询例如用任何方便的搜索引擎(诸如Google)对环球网运行,或对例如可以进行全文搜索的任何其它的电子文档集合运行。在查询的查询结果中所表示的各自文档中,在包括第一列举的各自第二列举中识别各自的候选项。然后确定在各自的候选项之间是否存在具有与上述集的项共同的属性的特定项。如果所述特定项被确定为具有共同的属性,并且尚未包括在所述集内,那么提供所述特定项以便添加到所述集。确定是否存在此通用性例如包括确定候选项与第一列举的项和/或与该集的不同项的另一列举共同出现的次数。例如,所述确定包括对在查询结果中包含相同的各自候选项的文档数目进行估算。本发明的方法可以经历两个或更多进一步的迭代。然后进一步向所述集合查询所述集的多个项的第三列举,其中所述第三列举不同于第一列举。例如,第三列举包括第一列举的排列,或第三和第一列举彼此至少一个项不同,例如,第三列举包括在先前列举中所找到的特定项等。
例如由因特网上信息服务供应商的服务器作为对现有搜索引擎的扩展来执行上面定义的方法。
本发明的另一示例涉及扩展具有共同本体属性的信息项集的方法。所述方法包括:向电子文档集合查询集的多个项的第一列举;在查询结果所表示的各自文档中识别在包括所述第一列举的各自第二列举中的各自候选项;确定在各自的候选项之间是否存在具有与所述集的项共同的属性的特定项;并且如果所述特定项被确定为具有共同的属性并且尚未包括在所述集中,那么把所述特定项添加到所述集。本发明的此示例由数据库供应商或数据库创建者通过利用用于自动创建数据库或本体的软件来执行。
因而本发明利用存在于巨大文档集合的电子文档中的列举或列表之间的重叠来创建或扩展数据库。
附图说明
以举例形式并且参考附图进一步详细地解释本发明,其中:
图1是依照本发明的方法的流程图;
图2是依照本发明系统的框图;和
图3是依照图1方法的某些过程步骤的例图。
遍及附图,相同的附图标记表示相似的或相应的部件。
具体实施方式
本发明涉及借助于在网上搜索其中有多个给定项共同出现的列举,来利用相同类型的附加项扩展给定类型的项的集合。本发明基于这样的假设,在网页上所找到的特定项的列举或列表中,存在更多相同类型的项。通过计数连同具有给定多个项的列举一起存在的共同出现项的次数,可以过滤不太可能属于适当类型的项。另外,通过计数具有给定项的不同列举的命中的相对频率,滤出新近找到的更多不太可能的项。然后下一迭代可以使用下一列举来利用在先前迭代中所找到的一个或多个新的项来开始查询。借助于仅仅向搜索程序给出几个项来作为开始,可以用在多次迭代中所找到的更多项来构建数据库。
项例如由单个词或名称组成,或是依照特定次序由多个词组成的合成体。由于所使用的拼写,搜索程序可以只搜索特定语言的文档。把初始项转换为另一种语言可能发现使用初始语言所未找到或最初不接受的附加项。搜索的另一微调涉及使用初始项的次序或布置来运行查询,其中所述初始项是依照特定序列输入的。例如,在要扩展的集之前已知的信息项按字母顺序来布置,或按其概念所覆盖的幅度或大小的增加或减小的次序来布置,等等。
图1是依照本发明的方法的流程图。步骤102以集的一个或多个已知的信息项来开始该过程,其中用户设法通过添加新的类似信息项来扩展所述集。例如,假定用户想要创建关于作曲者及其音乐的数据库。那么相关信息项是作曲者的名字和他们创作的名称或其它标识符。假定用户选择三个作曲者的姓作为初始项:Beethoven(贝多芬)、Bach(巴赫)和Mozart(莫扎特)。在步骤104,用户把此第一列举准备为文本串“Bach、Mozart、Beethoven”。在步骤106,把此第一列举输入到对电子文档集合(例如环球网)运行查询的搜索引擎中。在步骤108,例如作为选择,使用第一列举的不同排列来运行附加查询。不同的排列产生不同的查询结果。在步骤110,分析所述查询结果。例如,人们记录电子文档数目的分数,所述分数包含在包含第一列举或其任何排列的第二列举中共同出现的特定新的候选项。然后第二列举在两个新的候选项之间或在单个候选项在右手边或左手边的侧面包括第一列举(或其排列)。很可能的是,第二列举包含例如“序曲”或“优选”而找到的文档数目比所述第二列举包含例如“Chopin(肖邦)”或“Haydn(海顿)”的所找到的文档数目要低。附加滤出不太可能的候选项可以利用为包含所找到的两个或更多新的候选项的不同子集(进一步的列举)而对查询结果中的文档之间命中的相对频率进行确定。作为选择或另外,附加过滤结合所搜索的本体类型的分类符来对每个候选项运行附加查询。在上述例子中,人们可以对“作曲者Haydn”和/或“Haydn,作曲者”和/或“Haydn的音乐”等运行查询。在步骤112,清除不太可能的候选项,并且在步骤114,如果其余的新的候选项还不是集的元素,那么把所述新的候选项添加到所述集。在步骤116,判定过程是继续至步骤118以便结束还是所述过程继续。如果所述过程继续,那么返回到步骤104来进行下一迭代,其中从当前集中选择新的多个项。
在不是第一次的迭代中,在步骤110的分析还可以包括使当前结果与先前迭代的结果相关,例如通过分析经过至此所执行的迭代而累积的分数。另外,人们还可以跟踪在两次或更多迭代中特定的电子文档所发现的那些项。于是这些特定的文档可以包含所寻求项的更大的列表。例如,如果在至此所进行的大部分迭代的查询结果之间出现了相同的文档,那么人们可以考虑在更宽的范围内扫描此文档,例如通过反复地测试在此特定文档所包含的第二列举中所接受的候选项的邻近项是否还具有在至此所获取的其它文档中出现的极度(high degree),在第一列举中并不存在所述邻近项。如果是的话,那么此邻近项可能也是可接受的候选项。于是所述过程可以通过估算邻近项的邻近项等来继续进行。
此外,在步骤118终止过程之前,可以执行可选择的步骤(未示出)来进一步提炼如此扩展的集。例如,如果在包括确定项的文档数目和包括任何其它项的文档数目之间存在巨大差异,那么人们可以认为所述确定的项是异常的并把它从集中删除。为此步骤可以需要统计分析、用户干预或编辑介入。
图2参考具有客户端202的客户-服务器系统200图示了本发明的进一步方面,所述客户端202经由数据网络206连接到服务器204。服务器204拥有用于实现参考图1的流程图所图示的方法的应用软件208。客户端202的用户想要具有确定项的列表并且联系服务器204。用户向服务器204提供具有附图标记210的初始列举“Ford(福特)、Lincoln(林肯)、Pierce(皮尔斯)”。按照在流程图100中所概述的方法,服务器可以发现自动搜索结果似乎集中在两个实际上不相关的专题文档集。进一步检查揭示出一个文档集涉及“美国总统”。完整的美国总统列表包括Gerald Ford(杰拉尔德福特)、AbrahamLincoln(亚伯拉罕林肯)以及Franklin Pierce(富兰克林皮尔斯)(以及John Adams(约翰亚当斯)和John Quincy Adams(约翰昆西亚当斯),前一个亚当斯的儿子)的姓氏。另一个集涉及“美国经典或古典汽车”,其完整列表包括“Ford”、“Lincoln”、“PierceArrow”(也有“Fr anklin”和“Adams”)。作为一个细节:品牌“Lincoln”为Ford所拥有,因此从纯化论的角度严格地说:“Lincoln”应当是“Ford”的附属集或子集。可以依照各种方式来解析分支(“总统”和“汽车”)。例如,服务器204可以从用户请求附加信息输入,诸如附加项(“吉普车”)或查询的专题方面(“汽车”)。作为选择,服务器204可以考虑语境、用户简档或交互作用历史记录。例如参见美国专利6,256,633(代理人案号PHA23,422),在此将其内容引用以供参考并且下面简要地进行论述。作为另一解决方案,服务器204为依照主题而组织文档目录的另外服务器的(真实或虚拟)网络形成网关。要求用户在开始查询之前进行类别选择。在此上下文内例如参见美国专利6,349,307(代理人案号PHA23,606),在此将其内容引用以供参考并且下面简要地进行论述。假定已经解决了歧义而且用户感兴趣的是美国经典汽车列表。服务器204使用一个或多个迭代来运行软件应用208并且返回汽车制造商的列表212。列表212作为选择可以包括指向在所述列表212中的每个各自项的各自的进一步文档的各自指针。例如,与条目“渔帆船”相关联的指针引用常规搜索引擎对输入“渔帆船AND(汽车OR车辆)”(大写字母的术语表明相关的布尔操作符)的查询结果。
一旦列表被作为完整的列表而被接受并且过程100结束,那么得到具有一维信息项阵列的数据库,可能附有使用如上所述的指针的元信息。可以扩展所述数据库以便由二维或更多维阵列来表示。例如,在下面图2的例子中的用户可能想要找到所列出的每个制造商的不同型号。例如,用户输入串“型号A、型号T、Thunderbird(雷鸟)”,并且优选地是“AND Ford”。过程100最后返回Ford商标的型号列表,包括三个一开头加上型号K,Fordor和Tudor、F1轻型卡车、Mustang(野马)等。对于在原始列表中的每个项(商标),用户将通过输入预先已知的某些项作为属于进一步的维数(这里是:由Ford制造的型号),来初始化目录的进一步维数的扩展。
图3图示了在图1和2的情况下所触及的某些方面。如所提及,用户提供列举210“Lincoln、Ford、Pierce”作为条目并且想要创建关于美国经典汽车的数据库。系统200接收条目210并且获取包括列举“Studebaker(斯多德巴克尔)、Lincoln、Ford、Pierce Arrow、Duesenberg”的文档作为查询结果。因此术语“Studebaker”是要添加到集的候选302。由于在所找到的列表中术语“Duesenberg”并不是紧跟在“Pierce”后面,所以“Duesenberg”没有被确定为候选。然后系统200运行关于列举210的各个排列的查询。排列304“Ford、Lincoln、Pierce”产生具有列表“Packard、Lincoln、Ford、Pierce、Chrysler(克莱斯勒)”的文档并因此产生附加候选306“Packard”和“Chrysler”。排列308“Pierce、Lincoln、Ford”返回文档,据此作为“Plymouth(普利茅斯)”、“Studebaker”、“Washington(华盛顿)”和“Roosevelt(罗斯福)”来获取附加的候选项310。术语“Studebaker”已经被识别为候选项。在此术语“Roosevelt”和“Washington”是合理的候选项并且在进一步的迭代中将连同“Lincoln”、“Ford”和“Pierce”一起导出用于表示美国总统名字的进一步合理的候选项。据此,在累积的搜索结果中的文档最后看起来会形成与汽车有关的群集以及与美国总统有关的另一群集,所述群集具有可忽略的重叠,如果存在重叠的话。因此,从总统文档群集而来的术语必须与来自汽车文档群集的术语相关。然后把在两个群集中都没有出现的术语从要添加到数据库的新的项的列表上删除。作为选择,扫描群集的文档以查找串“汽车”,并且连同基于不存在“汽车”的这些文档的候选术语一起来丢弃那些不包含此串的文档。在进一步的迭代中,当返回到步骤104时,系统200可以选择条目312作为“Packard、Pierce、Plymouth”。注意,术语都以相同的字母开始并且按字母顺序存在,而不是依照随机次序。这增加了找到具有近乎完整的更多汽车制造商列表的文档的机会,因而可能按字母顺序来布置列表。条目312产生候选项314“Pontiac”和“Oldsmobile”,其可能是由列举“Oldsmobile、Packard、Pierce、Plymouth、Pontiac”而产生的。对于输入到查询的按字母顺序排序的项,优选地是,系统200向所述文档查询进一步的列举316和318,所述列举316和318由所截取的先前列举312以及添加到各自按字母顺序正确的位置中的各自新的候选项(“Oldsmobile”和“Pontiac”)组成。如果产生结果314的相同文档还生成合理的新的候选物320和322,这里为“Nash”和“Reo”,那么系统200可以重复地使用截取和添加步骤来把相同的文档用于进一步的迭代。
依照本发明方法的感兴趣用途涉及找到依照另一种语言转换的特定词。例如考虑在不同语言中的城市名称,例如词“Milano(米兰)”、“Milan”、“Mailand”、“Milaan”都指的是分别在意大利语、法语/英语、德语和荷兰语中的北意大利的相同城市。荷兰首都的名称的拼写“Amsterdam(阿姆斯特丹)”当被译为其它语言时保留下来。这意味着在依照本发明方法所获得的城市名称的列举中的项取决于其中已经表达所分析文档的语言。据此,人们可以以独立语言的名称的第一列举来开始查询,所述查询被限制为特定语言的文档。例如,应用于列举“Amsterdam、Rotterdam(鹿特丹)、Utrecht(乌得勒支)”并且被限制为英语文档的本发明方法可能会产生诸如“Eindhoven(艾恩德霍芬)”和“Hague(海牙)”之类的候选项。限制为法语文档的类似查询可能在结果“Eindhoyen”和“LaHaye”之间,而限于荷兰文档的查询将产生“Eindhoven”和“′sGravenhage”和“DenHaag”。分析不同语言的查询的最终结果将理解术语“The Hague”、“La Haye”、“Den Haag”和“'s Gravenhage”都指的是荷兰西部的同一荷兰城市,而且“Den Bosch”、“'sHertogenbosch”和“Bois-le-Duc”是相同南方荷兰城市的不同名称,前两个是荷兰语并且最后一个是法语。注意,因此分析最终列举还可能产生相同语言的相同体的候选指示,例如“Holland”、“TheNether lands”和“The Low Countries”。
在此将下列内容引用以供参考:
-Doreen Cheng公布的美国专利6,349,307(代理人案号PHA23,606)“COOPERATIVE TOPICAL SERVERS WITH AUTOMATICPREFILTERING AND ROUTING”。本专利涉及信息组织和检索系统,其根据专题内容有效地组织文档以便迅速且高效地搜索并检索。优化信息组织和检索系统以便只组织并获取与预定义主题的给定集有关的那些文档。如果文档不具有包括在主题的给定集中的主题,那么把所述文档排除在所提供的服务之外。同理,如果文档包括为所提供的服务特别禁止的主题,那么将其排除在外。在此范例中,供应商故意地限制所提供的搜索和检索服务的范围,但是这样一来提供了更高效且有效服务,其目标针对所期望的用户需求。信息组织和检索系统还支持上下文相关的搜索和检索技术,包括使用重定义或用户定义的视图以便扩展搜索条件,以及使用用户特定的词汇。在优选实施例中,在多个重叠层次中组织所选择的主题集,并且使用分布式软件体系结构来支持基于主题的信息机构、路由选择和检索服务。文档可以与一个或多个主题有关,并且经由信息服务器所维持的专题层次来与每个主题相关联。
-Chanda Dharap发布的美国专利6,256,633(代理人案号PHA23,422)“CONTEXT-BASED AND USER-PROFILE DRIVEN INFORMATIONRETRIEVAL”。本专利涉及使用户能够依照个性化方式在电子数据库中导航。根据用户简档来创建上下文,预先至少部分地形成所述简档。在上下文的控制之下从数据库中选择候选数据,并且用户能够与所述候选数据相交互。所述简档是基于由用户预先提供的专题信息以及从所述用户到数据库的先前访问的历史记录的。这个授予专利的发明增加了借助于主要集中于根据先前查询的结果而由用户的访问历史记录所给出的用户兴趣,来浏览广域信息的有效性。对于下一查询考虑这些结果创建了能够解释当前查询对象的上下文,鉴于此当前查询对象可能对特定用户来说是感兴趣的。当前查询的上下文用来更新用户简档。简档本身被用作推荐,用于把形成信息供应商的主题空间的相关信息(也被称为文档库)映射到用户搜索空间上。所述简档响应于用户与文档库的相交互来获得动态更新。据此,动态部分反映在用户搜索期间在供应商信息空间内所采取的路径。优选地是,所述简档还具有静态部分,用于反映用户的长期兴趣。术语“静态”用来表明基本上慢于动态部分的时间标度。例如通过让用户首次提供关于他/她的注意领域的专题信息来确定的静态部分,所述用户与文档库相交互。可以及时地手动改变这种条目。作为选择或另外,随时间推移统计相关的结果数目的统计分析能够找到基本上恒定的主题。

Claims (14)

1.一种能够扩展具有共同本体属性的信息项集的方法,所述方法包括:
-能够向电子文档集合查询具有集的多个项的第一列举;
-在查询结果所表示的各自文档中识别在包括所述第一列举的各自第二列举中的各自候选项;
-确定在各自的候选项之间是否存在具有与所述集的项共同的属性的特定项;并且
-如果所述特定项被确定为具有共同的属性并且尚未包括在所述集中,那么提供所述特定项以便将其添加到所述集。
2.如权利要求1所述的方法,其中所述确定包括对在询问结果中包含各自候选项的文档数目进行估算。
3.如权利要求1所述的方法,还包括向所述集合查询所述集的多个项的第三列举,所述第三列举不同于所述第一列举。
4.如权利要求3所述的方法,其中所述第三列举包括所述第一列举的排列。
5.如权利要求3所述的方法,其中所述第三列举在至少一个项上不同于所述第一列举。
6.如权利要求3所述的方法,其中所述第三列举包括所述特定项。
7.如权利要求1所述的方法,其中所述能够进行查询包括把所述集合限制为特定语言的文档。
8.一种扩展具有共同本体属性的信息项集的方法,所述方法包括:
-能够向电子文档集合查询集的多个项的第一列举;
-在查询结果所表示的各自文档中识别在包括所述第一列举的各自第二列举中的各自候选项;
-确定在各自的候选项之间是否存在具有与所述集的项共同的属性的特定项;并且
-如果所述特定项被确定为具有共同的属性并且尚未包括在所述集中,那么把所述特定项添加到所述集。
9.如权利要求8所述的方法,其中所述确定包括对在询问结果中包含各自候选项的文档数目进行估算。
10.如权利要求8所述的方法,还包括向所述集合查询所述集的多个项的第三列举,所述第三列举不同于所述第一列举。
11.如权利要求10所述的方法,其中所述第三列举包括所述第一列举的排列。
12.如权利要求10所述的方法,其中所述第三列举在至少一个项上不同于所述第一列举。
13.如权利要求10所述的方法,其中所述第三列举包括所述特定项。
14.如权利要求8所述的方法,其中所述集合被限制为特定语言的文档。
CNA2004800260075A 2003-09-12 2004-08-26 通过在网上搜索列举来创建数据库 Pending CN1849604A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03103363 2003-09-12
EP03103363.2 2003-09-12

Publications (1)

Publication Number Publication Date
CN1849604A true CN1849604A (zh) 2006-10-18

Family

ID=34306925

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800260075A Pending CN1849604A (zh) 2003-09-12 2004-08-26 通过在网上搜索列举来创建数据库

Country Status (5)

Country Link
US (1) US20070094249A1 (zh)
EP (1) EP1665098A1 (zh)
JP (1) JP2007505386A (zh)
CN (1) CN1849604A (zh)
WO (1) WO2005026987A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US7747637B2 (en) 2006-03-08 2010-06-29 Microsoft Corporation For each item enumerator for custom collections of items
US8037086B1 (en) 2007-07-10 2011-10-11 Google Inc. Identifying common co-occurring elements in lists
US9146980B1 (en) * 2013-06-24 2015-09-29 Google Inc. Temporal content selection

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953718A (en) * 1997-11-12 1999-09-14 Oracle Corporation Research mode for a knowledge base search and retrieval system
US6256633B1 (en) * 1998-06-25 2001-07-03 U.S. Philips Corporation Context-based and user-profile driven information retrieval
US6349307B1 (en) * 1998-12-28 2002-02-19 U.S. Philips Corporation Cooperative topical servers with automatic prefiltering and routing
US20020103809A1 (en) * 2000-02-02 2002-08-01 Searchlogic.Com Corporation Combinatorial query generating system and method
US6640231B1 (en) * 2000-10-06 2003-10-28 Ontology Works, Inc. Ontology for database design and application development

Also Published As

Publication number Publication date
US20070094249A1 (en) 2007-04-26
WO2005026987A1 (en) 2005-03-24
EP1665098A1 (en) 2006-06-07
JP2007505386A (ja) 2007-03-08

Similar Documents

Publication Publication Date Title
US10275419B2 (en) Personalized search
CN100507915C (zh) 网络搜索方法、网络搜索设备和用户终端
US8200649B2 (en) Image search engine using context screening parameters
US6336112B2 (en) Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages
US6523021B1 (en) Business directory search engine
JP3673487B2 (ja) 階層的統計分析のシステム及び方法
US6236987B1 (en) Dynamic content organization in information retrieval systems
US7949648B2 (en) Compiling and accessing subject-specific information from a computer network
US7133867B2 (en) Text and attribute searches of data stores that include business objects
US7769752B1 (en) Method and system for updating display of a hierarchy of categories for a document repository
US20020069190A1 (en) Method and system of weighted context feedback for result improvement in information retrieval
US7698294B2 (en) Content object indexing using domain knowledge
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US20110016134A1 (en) Using link structure for suggesting related queries
US20050065773A1 (en) Method of search content enhancement
US7024405B2 (en) Method and apparatus for improved internet searching
JP2008537810A (ja) 検索方法及び検索システム
WO2009064316A1 (en) Ranking of objects using semantic and nonsemantic features in a system and method for conducting a search
CN101393565A (zh) 基于本体的面向虚拟博物馆的搜索方法
CN110442584B (zh) 一种基于异步加载的树形结构资源检索的方法
US20080059432A1 (en) System and method for database indexing, searching and data retrieval
WO2007132342A1 (en) Documentary search procedure in a distributed information system
US20040162815A1 (en) Adapting business objects for searches and searching adapted business objects
KR101120040B1 (ko) 연관 질의어 추천 장치 및 방법
CN1849604A (zh) 通过在网上搜索列举来创建数据库

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication