CN100481077C - 用于增强搜索结果导航的可视化方法及装置 - Google Patents

用于增强搜索结果导航的可视化方法及装置 Download PDF

Info

Publication number
CN100481077C
CN100481077C CNB2006100012678A CN200610001267A CN100481077C CN 100481077 C CN100481077 C CN 100481077C CN B2006100012678 A CNB2006100012678 A CN B2006100012678A CN 200610001267 A CN200610001267 A CN 200610001267A CN 100481077 C CN100481077 C CN 100481077C
Authority
CN
China
Prior art keywords
mentioned
search results
clustering information
visual
subclauses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006100012678A
Other languages
English (en)
Other versions
CN101000607A (zh
Inventor
刘世霞
苏中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CNB2006100012678A priority Critical patent/CN100481077C/zh
Priority to US11/619,665 priority patent/US7502786B2/en
Publication of CN101000607A publication Critical patent/CN101000607A/zh
Priority to US12/061,720 priority patent/US20080222145A1/en
Application granted granted Critical
Publication of CN100481077C publication Critical patent/CN100481077C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种增强搜索结果导航的可视化方法,包括:从搜索引擎获取第一搜索结果;对第一搜索结果聚类,以获得聚类信息;计算聚类信息与第一搜索结果的排序列表之间的关联性,并对聚类信息进行可视化处理;根据关联性,将可视聚类信息与第一搜索结果的排序列表联动地显示。当选择某个可视聚类信息项时,还对该可视聚类信息项进一步搜索相关的搜索结果,并对搜索结果进行再次聚类。采用本发明,通过将传统的搜索结果的排序列表与搜索结果的可视化聚类信息相结合以联动地显示,可以方便网络用户发现该可视化聚类信息与搜索结果的排序列表之间潜在的关联,此外,通过动态地搜索更多的搜索结果并再聚类,使网络用户可以容易地获取更详细、准确的搜索结果。

Description

用于增强搜索结果导航的可视化方法及装置
技术领域
本发明涉及计算机信息处理技术,具体地说,涉及增强由搜索引擎返回的搜索结果的导航的可视化方法及装置。
背景技术
因特网的广泛应用使人们可以从网络上获取大量的信息,但由于网络信息的增长速度很快,网络用户如何快速准确地找到所需要的信息变得越来越难。目前,网络用户主要依赖搜索引擎以查找所需要的信息。通常,网络用户使用搜索引擎以查找所需要的信息的过程如下所述:网络用户向搜索引擎提交查询请求,查询可以例如是单个关键词或关键词的组合。然后,搜索引擎基于所提交的查询请求生成搜索结果排序列表,返回该排序列表,并显示在网络用户所使用的浏览器上。网络用户通过观看返回的搜索结果的排序列表中的片段,获取自己感兴趣的搜索结果。
但是这种使用搜索引擎查找信息的方法普遍存在搜索引擎总是返回很多搜索结果的情况。在这种情况下,由于计算机显示器屏幕大小有限,不可能同时向网络用户显示全部的搜索结果,因此,网络用户一般需要浏览多个网页才能找到所需要的信息,这样,造成网络用户获取信息的效率很低。在另一个方面,根据对网络用户的调查,在大多数情况下,网络用户只观看前几个网页上的搜索结果排序列表。因此,实际上,网络用户搜索信息的搜索质量也很低。
为了提高搜索质量,近几年出现了一些改善搜索结果的可浏览性的方法.Vivisimo公司提出了一种解决方案,该解决方案对搜索引擎返回的搜索结果进行聚类,并将聚类结果可视地与搜索结果排序列表一起显示。虽然该解决方案可以方便网络用户了解搜索结果的聚类情况,但是该解决方案仅仅是同时但孤立地显示了聚类结果和搜索结果排序列表,并没有向网络用户明显、直观地显示出两者之间的关联性。另外,该解决方案只对搜索结果的一部分(例如前210个搜索结果)进行聚类和显示,如果网络用户选择聚类结果中的某个聚类项,则显示该聚类项包含的搜索结果,但是不能进一步生成更多的相关的搜索结果,使网络用户不能获得更多感兴趣的信息。
发明内容
本发明正是基于上述现有技术中存在的技术问题而提出的,其目的在于提供一种增强搜索结果导航的可视化方法及装置,可以将传统的搜索结果排序列表与搜索结果的可视聚类信息联动地显示,并进一步动态地搜索更多地搜索结果,以帮助网络用户迅速准确地找到所需要的信息。
根据本发明的一个方面,提供一种增强搜索结果导航的可视化方法,包括以下步骤:
从搜索引擎获取第一搜索结果;
对上述第一搜索结果聚类,以获得聚类信息;
计算上述聚类信息与上述第一搜索结果的排序列表之间的关联性,并对上述聚类信息进行可视化处理;
根据上述关联性,将可视聚类信息与上述第一搜索结果的排序列表联动地显示;
选择上述可视聚类信息中的某个可视聚类信息项;
生成新的查询关键词,并提交到搜索引擎;
上述搜索引擎根据上述新的查询关键词,生成新的搜索结果;
选择新的搜索结果中预定数量的搜索结果条目生成第二搜索结果;
对上述第二搜索结果聚类,以获得子聚类信息;
计算上述子聚类信息与上述第二搜索结果的排序列表之间的关联性,并对上述子聚类信息进行可视化处理;以及
根据上述关联性,将上述可视子聚类信息和上述第二搜索结果的排序列表联动地显示。
优选地,上述第一搜索结果包含由上述搜索引擎基于查询请求而生成的搜索结果中的预定数量的搜索结果条目。
优选地,将可视聚类信息与上述第一搜索结果的排序列表联动地显示包括下述情形的任意一种:
a.当显示上述第一搜索结果的排序列表的页面时,在上述可视聚类信息中突出显示包含上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
b.当显示上述第一搜索结果的排序列表的页面时,在上述可视聚类信息中突出显示包含第一个页面的上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
c.当选择上述第一搜索结果的排序列表中的某个搜索结果条目时,在上述可视聚类信息中突出显示包含上述搜索结果条目和上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
d.当选择上述第一搜索结果的排序列表中的某个搜索结果条目时,在上述可视聚类信息中突出显示包含上述搜索结果条目和第一个页面的上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;以及
e.当选择上述可视聚类信息中的某个可视聚类信息项时,显示上述第一搜索结果中包含在上述可视聚类信息项中的搜索结果条目的排序列表。
优选地,生成新的查询关键词的步骤包括:将当前的查询关键词与所选择的可视聚类信息项的名称进行组合以生成新的查询关键词。
优选地,生成新的查询关键词的步骤包括:
收集相关文档;
在上述相关文档中确定关键词;以及
将上述关键词与当前的查询关键词进行组合以生成新的查询关键词。
根据本发明的另一个方面,提供一种增强搜索结果导航的可视化装置,包括:
动态聚类构造器,用于对来自搜索引擎的搜索结果进行选取,获得第一搜索结果并对第一搜索结果进行动态聚类,以生成聚类信息;
关联处理器,用于计算上述聚类信息与上述第一搜索结果的排序列表之间的关联性;
可视化引擎,用于对上述聚类信息进行可视化处理,生成可视聚类信息,以及用于根据上述关联性将上述可视聚类信息和上述第一搜索结果的排序列表联动地显示在浏览器上;以及
关键词生成器,用于在选择上述可视聚类信息中的某个可视聚类信息项时,生成新的查询关键词,并经上述动态聚类构造器发送到搜索引擎;
其中,上述搜索引擎根据上述关键词生成器生成的新的查询关键词进行搜索,返回的新的搜索结果的排序列表;
上述动态聚类构造器的搜索结果选取单元对接收的新的搜索结果的排序列表,选择预定数量的搜索结果条目,形成第二搜索结果并存储;
上述动态聚类构造器的聚类器对上述第二搜索结果聚类,以生成子聚类信息;
上述可视化引擎还将上述可视聚类信息和上述第二搜索结果的排序列表联动地显示在浏览器上。
优选地,上述动态聚类构造器包括:
搜索结果选取单元,用于对接收的搜索结果选择预定数量的搜索结果条目以形成第一搜索结果,并存储上述第一搜索结果;以及
聚类器,用于对上述第一搜索结果聚类,以生成聚类信息。
优选地,上述关键词生成器包括:
文档收集器,用于收集相关文档;
权值计算器,用于计算上述相关文档的每一个文档中除了停止词以外的所有词的权值;以及
组合器,用于选择具有高权值的词并将其与当前的查询关键词相组合,生成新的查询关键词。
根据本发明的再一个方面,提供一种浏览器,包括上述的增强搜索结果导航的可视化装置。
根据本发明的再一个方面,提供一种搜索引擎,包括上述的增强搜索结果导航的可视化装置。
根据本发明的再一个方面,提供一种程序产品,包含:程序代码,用于实现上述方法;以及承载该程序代码的承载介质。
附图说明
图1是根据本发明的一个实施例的增强搜索结果导航的可视化方法的流程图;
图2是采用图1所示的实施例的增强搜索结果导航的可视化方法后浏览器的显示的示意图;
图3是根据本发明的另一个实施例的增强搜索结果导航的可视化方法的流程图;
图4是图3所示实施例中的生成新的查询关键词的示例流程图;
图5是根据本发明的优选实施例的增强搜索结果导航的可视化装置的示意性框图;
图6是图5所示实施例的关键词生成器的示意性框图。
具体实施方式
相信通过以下结合附图对本发明的具体实施例的详细描述,本发明的上述和其它目的、特征和优点会变得更明显。
图1是根据本发明的一个实施例的增强搜索结果导航的可视化方法的流程图。
如图1所示,首先在步骤101,从搜索引擎获取第一搜索结果。当搜索引擎接收到网络用户提交的查询请求时,基于该查询可以生成搜索结果。搜索结果包含多个文档,每个文档构成一个搜索结果条目。通常,网络用户通过浏览器提交查询请求,浏览器可以是例如Microsoft公司的IE浏览器、Netscape公司的Netscape浏览器等,搜索引擎可以采用已知的如Google、Yahoo等的搜索引擎。如本领域普通技术人员所已知的,查询通常采用单个关键词或关键词的组合的形式,并符合所采用的搜索引擎规定的格式。
在获得了第一搜索结果后,在步骤105,对第一搜索结果进行聚类,从而获得搜索结果的聚类信息。聚类操作基于搜索结果中的文档的片段的相似性,采用某个聚类算法对第一搜索结果进行,这样,与某一个主题相关的文档可以被收集在一个聚类中。为了保证搜索引擎仍然实时地工作,所采用的聚类算法不应产生实质上的延迟。聚类算法选取文档的片段作为输入,生成的聚类信息具有方便网络用户快速浏览的可读性描述内容。
下面对采用聚类算法对第一搜索结果进行聚类的过程进行详细地说明。在本实施例中,优选地,采用后缀树聚类(STC)算法作为聚类算法。STC算法是一种用于网络搜索结果聚类的快速、增量、线性时间聚类算法,其基本思想是识别对于作为搜索结果的文档集合来说是公共的短语。首先,定义基本聚类为共享的公共短语的文档集合。然后,对搜索结果中的每个文档进行预处理操作,即,使用词干提取算法转换代表每个文档的文本串,标记句子的边界,并除去非词标记,诸如数字、HTML标签和大多数标点符号等。然后,使用后缀树识别基本聚类,其可以被看作是对文档集合生成短语的倒排索引。最后,将这些被识别出的基本聚类合并到聚类中,公共短语可作为聚类的名称。
在此,STC算法仅仅是作为聚类算法的一个例子,本领域的普通技术人员可以采用其它任何合适的聚类算法对搜索结果进行聚类。
为了加快聚类操作过程,优选地,第一搜索结果只包含由搜索引擎生成的搜索结果中的预定数量的搜索结果条目,例如,在图2所示的例子中,第一搜索结果包含搜索结果排序列表中的前206个文档。第一搜索结果的数量可以由网络用户通过浏览器的用户接口进行设置,该第一搜索结果的数量会影响执行聚类操作的时间。
在获得了第一搜索结果的聚类信息后,在步骤110,计算该聚类信息与第一搜索结果的排序列表之间的关联性,关联性例如包括下述信息中的至少一个:聚类信息中的每个聚类信息项包含第一搜索结果的哪些搜索结果条目、每个聚类信息项所包含的搜索结果条目的数量、每个搜索结果条目包含在哪些聚类信息项中、哪个聚类信息项包含的搜索结果条目最多以及哪个聚类信息项包含的第一个页面的搜索结果条目最多等。
当然,上面所列举的关联性的例子仅仅是示意性的,本实施例并不局限于此,本领域的普通技术人员还可以采用其它合适的代表关联性的信息。
在步骤115,对得到的聚类信息进行可视化处理,包括采用网络用户可视的形式表现聚类信息,优选地,可以采用树形可视化技术来展现聚类树结构;并且描述聚类信息中的各个聚类信息项的属性,例如各个聚类信息项的名称、所包含的搜索结果条目的个数等。聚类信息经过可视化处理后,变为可视聚类信息以在浏览器上向网络用户显示。
虽然在本实施例中,计算聚类信息与第一搜索结果的排序列表之间的关联性的步骤110在对聚类信息进行可视化处理的步骤115之前进行,但是实质上,这两个步骤可以并行执行,并没有严格的先后顺序。可选地,也可以先执行对聚类信息进行可视化处理的步骤115,再执行计算聚类信息与第一搜索结果的排序列表之间的关联性的步骤110。
然后在步骤120,根据在步骤110计算出的关联性,将在步骤115生成的可视聚类信息与第一搜索结果的排序列表联动地显示,从而帮助网络用户更容易定位自己感兴趣的搜索结果条目,并从整体上了解第一搜索结果中的搜索结果条目的聚类情况。
在步骤120中,将可视聚类信息与第一搜索结果的排序列表联动地显示包括以下几种情形:
1)当在浏览器上显示第一搜索结果的排序列表的页面时,在可视聚类信息中突出显示包含第一搜索结果中最多的搜索结果条目的可视聚类信息项。也就是说,包含搜索结果条目最多的可视聚类信息项被突出显示。这样,网络用户可以很容易地了解哪个可视聚类信息项包含最多的搜索结果条目。
优选地,在这种情形下,也可以在可视聚类信息中突出显示包含第一个页面的第一搜索结果中最多的搜索结果条目的可视聚类信息项。因为通常在第一个页面显示的各个搜索结果条目与网络用户所提交的查询的相关度很高,网络用户更关心在该页面上的搜索结果的聚类情况,所以突出显示这样的可视聚类信息项更方便网络用户定位自己感兴趣的内容。
2)当选择第一搜索结果的排序列表中的某个搜索结果条目时,在可视聚类信息中突出显示包含该搜索结果条目的、且包含最多的搜索结果条目的可视聚类信息项。也就是说,被选择的搜索结果条目所归属的、并且包含搜索结果条目最多的可视聚类信息项被突出显示。这样,可以帮助网络用户迅速了解被选择的搜索结果条目所归属的并具有最多搜索结果条目的可视聚类信息项。
优选地,在这种情况下,也可以在可视聚类信息中突出显示包含被选择的搜索结果条目的、且包含第一个页面的第一搜索结果中最多的搜索结果的可视聚类信息项。这样,可以方便网络用户了解被选择的搜索结果条目所归属的在第一个页面上具有最多搜索结果条目的可视聚类信息项。
3)当选择可视聚类信息中的某个可视聚类信息项时,显示第一搜索结果中包含在该可视聚类信息项中的搜索结果条目的排序列表。也就是说,显示被选择的可视聚类信息项所包含的具体的搜索结果条目,使网络用户可以了解被选择的可视聚类信息项的具体内容。
通过以上描述可以看出,采用本实施例的增强搜索结果导航的可视化方法,通过将传统的搜索结果的排序列表与这些搜索结果的可视化聚类信息相结合以联动地显示,可以方便网络用户发现该可视化聚类信息与搜索结果的排序列表之间潜在的关联,使网络用户更容易定位自己所需要的内容。
参照图2所示的采用图1所示实施例的增强搜索结果导航的可视化方法后浏览器的显示的示意图,详细说明实际应用本实施例的增强搜索结果导航的可视化方法的示例。
如图2所示,该例子使用本领域普通技术人员熟知的IE浏览器,网络用户提交的查询关键词是“information visualization”,根据该查询关键词,搜索引擎Google生成的搜索结果包括至少2,355,000个搜索结果条目,其中选择前206个搜索结果条目作为第一搜索结果进行聚类并显示。图2的左侧显示可视聚类信息,采用节点的形式表示可视聚类信息项,并显示了各个可视聚类信息项的名称及包含的搜索结果条目的个数;图2的右侧显示前206个搜索结果条目在第一个页面的排序列表。根据上述的说明,在这种情形下,需突出显示包含最多的搜索结果条目的可视聚类信息项或者包含第一个页面中最多的搜索结果条目的可视聚类信息项。在图2中,可视聚类信息项InfoVis采用深色节点的方式被突出显示,其包含18个搜索结果条目。突出显示的方式可以是高亮显示、放大显示、或者采用不同于其他可视聚类信息项的颜色等。由此可知,在第一个页面所显示的搜索结果中,可视聚类信息项InfoVis包含的搜索结果条目最多。通过这样的显示,网络用户可以清楚地知道搜索结果的聚类情况以及聚类信息中最重要的聚类信息项。
图3是根据本发明的另一个实施例的增强搜索结果导航的可视化方法的流程图。下面结合该附图对本实施例进行详细描述,其中与图1所示实施例相同的部分采用相同的标记,并适当省略其说明。
本实施例的特点在于:在图1所示实施例的基础上,进一步搜索与被网络用户选择的可视聚类信息项有关的搜索结果以加入该可视聚类信息项,然后再次进行聚类。
如图3所示,在步骤300,如果用户选择可视聚类信息中的某个可视聚类信息项,在选择步骤300后,除了显示第一搜索结果中包含在该可视聚类信息项中的搜索结果条目的排序列表之外,还可以执行以下操作:在步骤301,生成新的查询关键词,并提交到搜索引擎。为了搜索与该可视聚类信息项有关的更多的搜索结果,需要对当前的查询关键词进行进一步限定,生成新的查询关键词提交给搜索引擎。新的查询关键词可以通过将当前的查询关键词与所选择的可视聚类信息项的名称进行组合而生成,如在图2所示的例子中,如果网络用户选择可视聚类信息项Software,则新的查询关键词为“information visualization+software”。
在步骤305,搜索引擎基于新的查询关键词,生成新的搜索结果。然后,在步骤310,从新生成的搜索结果中选择预定数量的搜索结果条目,例如前300个搜索结果条目,从而生成第二搜索结果。优选地,还可以将搜索结果条目与该可视聚类信息项当前包含的搜索结果条目合并后生成第二搜索结果,这样更有利于用户迅速找到需要的信息。
然后,在步骤315,对第二搜索结果聚类,以获得子聚类信息。该步骤所采用的聚类方法与图1所示实施例所采用的聚类方法类似,此处省略其说明。
在获得子聚类信息之后,在步骤320,计算该子聚类信息与第二搜索结果的排序列表之间的关联性,关联性信息包含的内容在前面的实施例中已经描述,此处省略其说明。
然后,在步骤325,对子聚类信息进行可视化处理。在本实施例中,子聚类信息的可视化处理也采用节点的方式表现子聚类信息,并描述子聚类信息的名称和包含的搜索结果条目的个数。经过可视化处理的子聚类信息变为可视子聚类信息。
虽然在本实施例中,计算关联性的步骤320在可视化处理的步骤325之前执行,但是实质上,这两个步骤可以并行执行,并无严格的先后顺序。可选地,可以先执行可视化处理的步骤,再执行计算关联性的步骤。
在步骤330,将可视子聚类信息和第二搜索结果的排序列表联动地显示在浏览器上。联动地显示可视子聚类信息和第二搜索结果的排序列表与图1所示实施例的联动显示相类似,此处省略说明。
在本实施例中,可视子聚类信息与可视聚类信息采用树状结构显示,其中可视聚类信息包含的可视聚类信息项是根节点,可视子聚类信息包含的可视子聚类项是可视聚类信息项的分枝节点。采用树状结构显示可视聚类信息和可视子聚类信息,可以使网络用户清楚地了解它们相互之间的关系,并允许网络用户在不同级别的可视聚类信息中向上或向下挖掘。
此外,如果网络用户进一步选择可视子聚类信息中的某个可视子聚类信息项(步骤335),则重复执行步骤301至330。如果网络用户继续选择可视子聚类信息的下一级聚类信息中的某个聚类信息项,则继续重复步骤301至330。通过这样重复地执行“生成新的查询关键词—搜索新的搜索结果—聚类”操作,可以向网络用户提供更准确地搜索结果。
通过以上描述可以看出,采用本实施例的增强搜索结果导航的可视化方法,可以在原先有限的搜索结果的基础上动态地搜索更多的搜索结果,并对新的搜索结果与原有的搜索结果的组合进行聚类,从而与之前的聚类信息一起构成各个级别的聚类信息,使网络用户可以容易地获取更详细、准确的搜索结果。
关于如何生成新的查询关键词,除了上面提到的将之前的查询与所选择的可视聚类信息项的名称进行组合生成新的查询关键词外,还可以采用如图4所示的生成新的查询关键词的方法。下面结合图4,对图3所示实施例中生成新的查询关键词进行详细说明。
如图4所示,在步骤401,收集相关文档。相关文档可以是两种类型的文档,即网络用户已经阅读过的文档或者属于被选择的可视聚类信息项的文档。
然后在收集的相关文档中确定关键词。在本实施例中,采用tf-idf方法确定关键词。首先在步骤405,计算所收集的相关文档的每一个文档中除了停止词(stopword)以外的所有词的权值,这里所说的“停止词”是指诸如“的”、“地”、“得”等的零语义词。由于这一类词在各个文档中出现的频率较高但无实际语义,因此不计算这类词的权值。计算具有实际语义的词的权值公式如下:
valuei=tf·idf,
其中,value表示词的权值;tf表示被计算权值的词在相关文档的所有文档中出现的频率;idf=all_documents/keyword_documents,其中all_documents表示相关文档中所有文档的数量,keyword_documents表示在相关文档中包含该词的文档的数量。这样,在文档中出现频率越高的词,其权值就越大。然后在步骤407,将具有高权值的词确定为关键词。
确定了关键词后,在步骤410,将这些关键词与当前的查询关键词进行组合,从而生成新的查询关键词。
通过以上描述可以看出,采用本例的生成新的查询关键词的方法,可以根据网络用户的选择以及阅读的文档,更准确地确定关键词,用于搜索网络用户感兴趣的内容。
在这里,如图4所示的生成新的查询关键词的方法仅仅是示例性的,而并非限制性的,本领域的普通技术人员可以采用其它任何合适的关键词生成方法。
在同一个发明构思下,图5是根据本发明的一个实施例的增强搜索结果导航的可视化装置500的示意性框图。下面结合附图,对本实施例进行详细描述,在本实施例中,增强搜索结果导航的可视化装置500作为单个装置,安装在搜索引擎506和浏览器505之间。
如图5所示,增强搜索结果导航的可视化装置500包括:动态聚类构造器501,其与搜索引擎506连接,对来自搜索引擎506的搜索结果进行动态聚类,以生成聚类信息;关联处理器502,用于计算聚类信息与搜索结果的排序列表之间的关联性;可视化引擎503,其与浏览器505连接,用于对聚类信息进行可视化处理,生成可视聚类信息,以及根据关联性将可视聚类信息和搜索结果的排序列表联动地显示在浏览器505上。
在本实施例中,搜索引擎506可以采用已知的如Google、Yahoo等的搜索引擎,浏览器505可以是例如Microsoft公司的IE浏览器、Netscape公司的Netscape浏览器等。
下面详细说明增强搜索结果导航的可视化装置500的具体操作过程。
当网络用户使用浏览器505提交查询请求时,该查询请求经由可视化装置500的可视化引擎503传送到搜索引擎506。查询通常采用单个关键词或关键词的组合的形式,并符合所采用的搜索引擎506规定的格式。搜索引擎506根据该查询请求生成搜索结果,搜索结果包含多个文档,每个文档构成一个搜索结果条目。然后搜索引擎506将搜索结果的排序列表返回给可视化装置500的动态聚类构造器501。
优选地,动态聚类构造器501可进一步包括:搜索结果选取单元5011,用于接收由搜索引擎506返回的搜索结果的排序列表以及在接收的搜索结果的排序列表中选择预定数量的搜索结果条目以形成第一搜索结果,并存储第一搜索结果;聚类器5012,用于对第一搜索结果聚类,以生成聚类信息,还将聚类信息和第一搜索结果的排序列表发送到关联处理器502。在本实施例中,聚类器5012采用后缀树聚类(STC)算法进行聚类,关于STC算法已经在前面详细描述过,此处省略其说明。在此,STC算法仅仅是作为聚类算法的一个例子,本领域的普通技术人员可以采用其它任何合适的聚类算法对搜索结果进行聚类。
关联处理器502从动态聚类构造器501收到生成的聚类信息和第一搜索结果的排序列表后,对它们之间的关联性进行计算,关联性信息包含的内容在前面的实施例中已经描述,此处省略其说明。
关联处理器502计算了关联性之后,将聚类信息、第一搜索结果的排序列表以及它们的关联性发送到可视化引擎503中,由可视化引擎503进行可视化处理,包括采用网络用户可读的形式表现聚类信息、描述聚类信息的属性等。
然后,可视化引擎503根据由关联处理器502计算的关联性将可视聚类信息和搜索结果的排序列表联动地显示在浏览器505上。联动显示包含的情形在前面的实施例中已经描述,此处省略其说明。
本实施例的增强搜索结果导航的可视化装置500及其构成部件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合实现。
通过以上描述可以看出,采用本实施例的增强搜索结果导航的可视化装置500,通过将传统的搜索结果的排序列表与这些搜索结果的可视化聚类信息相结合以联动地显示,可以方便网络用户发现该可视化聚类信息与搜索结果的排序列表之间潜在的关联,使网络用户更容易定位自己所需要的内容。
优选地,图5所示的增强搜索结果导航的可视化装置500还包括关键词生成器504,其用于在选择可视聚类信息中的某个可视聚类信息项时,生成新的查询关键词,并将生成的新的查询关键词发送到搜索引擎506。为了进一步的帮助网络用户搜索更多、更相关的搜索结果,当网络用户使用浏览器505选择可视聚类信息中的某个可视聚类信息项时,除了显示该可视聚类信息项所包含的搜索结果条目的排序列表之外,网络用户的选择请求还通过可视化引擎503发送到关键词生成器504中。关键词生成器504根据该选择请求生成新的查询关键词,如何生成新的关键词在前面的实施例中已经描述,此处省略其说明。优选地,可以通过关键词生成器504接收通过可视化引擎503传送来的用户在浏览器中选择的可视聚类信息项,生成新的关键词,然后将生成的新的关键词发送到搜索引擎506,以进行进一步的搜索。搜索引擎506根据新的查询关键词生成新的搜索结果的排序列表,并返回给动态聚类构造器501。
动态聚类构造器501的搜索结果选取单元5011接收到返回的新的搜索结果的排序列表后,在该新的搜索结果的排序列表中,选择预定数量的搜索结果条目,诸如前200个搜索结果条目,形成第二搜索结果,并进行存储。优选地,也可以将选择的搜索结果条目与当前存储的第一搜索结果中包含在被选择的可视聚类信息项中的搜索结果条目合并,再形成第二搜索结果,并进行存储。然后,聚类器5012对第二搜索结果进行聚类,生成被选择的可视聚类信息项的子聚类信息。这些子聚类信息和第二搜索结果的排序列表送到关联处理器502中。
同样地,关联处理器502计算子聚类信息和第二搜索结果的排序列表之间的关联性,关联性信息包含的内容在前面的实施例中已经描述,此处省略其说明。然后关联处理器502将子聚类信息、第二搜索结果的排序列表以及它们之间的关联性发送到可视化引擎503。
可视化引擎503除了对子聚类信息进行可视化处理之外,还将聚类信息与子聚类信息可视化为树状结构,其中聚类信息包含的聚类信息项作为根节点,子聚类信息包含的子聚类信息项作为分枝节点。
然后,可视化引擎503根据子聚类信息和第二搜索结果的排序列表之间的关联性,控制子聚类信息和第二搜索结果的排序列表联动地显示在浏览器505上。
如果网络用户继续选择某个子聚类信息项,那么增强搜索结果导航的可视化装置500可继续通过关键词生成器504对被选择的子聚类信息项生成新的查询关键词,再由动态聚类构造器501搜索新的搜索结果并进行聚类,从而生成不同级别的可视聚类信息,以方便网络用户查找自己感兴趣的内容。
可选择地,关键词生成器504也可以被集成在可视化引擎503中,通过可视化引擎503接收来自网络用户的选择请求,根据该选择请求生成新的查询关键词,并通过可视化引擎503发送到搜索引擎506。
通过以上描述可以看出,加入关键词生成器504的增强搜索结果导航的可视化装置500,可以在原先有限的搜索结果的基础上动态地搜索更多的搜索结果,并对新的搜索结果与原有的搜索结果的组合进行聚类,从而与之前的聚类信息一起构成各个级别的聚类信息,使网络用户可以容易地获取更详细、准确的搜索结果。
图6是关键词生成器504的一个例子的示意性框图。下面结合该附图进行详细说明。
如图6所示,关键词生成器504包括:文档收集器601,用于收集生成查询关键词所需的相关文档;权值计算器602,用于计算相关文档的每一个文档中除了停止词以外的所有词的权值;以及组合器603,用于选择具有高权值的词并将其与当前的查询关键词相组合,生成新的查询关键词。
当关键词生成器504收到来自网络用户的选择请求时,文档收集器601根据该选择请求,收集生成新的查询关键词所需的相关文档,以在这些相关文档中确定新的关键词。文档收集器601收集的相关文档被送到权值计算器602中,由权值计算器602计算每一个文档中除了停止词以外的所有词的权值,组合器603根据权值计算器602的计算结果,选择具有高权值的词作为新的关键词,并将其与当前的查询关键词相结合,从而生成新的查询关键词。如何搜集相关文档和如何计算权值在前面的实施例中已经描述,此处省略其说明。
本实施例的关键词生成器504及其构成部件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合实现。
通过以上描述可以看出,采用本实施例的关键词生成器504可以根据网络用户的选择以及阅读的文档,更准确地确定关键词,用于搜索网络用户感兴趣的内容。
此外,上述的增强搜索结果导航的可视化装置可以与现有的浏览器相结合,构成一种新的浏览器,现有的浏览器可以是例如Microsoft公司的IE浏览器、Netscape公司的Netscape浏览器等。
另一方面,上述的增强搜索结果导航的可视化装置还可以与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以采用已知的如Google、Yahoo等的搜索引擎。
本发明还提供一种程序产品,包含实现以上所有方法的程序代码以及承载该程序代码的承载介质。
以上虽然结合实施例对本发明的增强搜索结果导航的可视化方法及相应的装置进行了详细地描述,但应当理解,在不脱离本发明的精神和范围的情况下,本发明的普通技术人员可以对上述实施例进行各种修改。

Claims (20)

1.一种增强搜索结果导航的可视化方法,包括:
从搜索引擎获取第一搜索结果;
对上述第一搜索结果聚类,以获得聚类信息;
计算上述聚类信息与上述第一搜索结果的排序列表之间的关联性,并对上述聚类信息进行可视化处理;
根据上述关联性,将可视聚类信息与上述第一搜索结果的排序列表联动地显示;
选择上述可视聚类信息中的某个可视聚类信息项;
生成新的查询关键词,并提交到搜索引擎;
上述搜索引擎根据上述新的查询关键词,生成新的搜索结果;
选择新的搜索结果中预定数量的搜索结果条目生成第二搜索结果;
对上述第二搜索结果聚类,以获得子聚类信息;
计算上述子聚类信息与上述第二搜索结果的排序列表之间的关联性,并对上述子聚类信息进行可视化处理;以及
根据上述子聚类信息与第二搜索结果的排序列表之间的关联性,将上述可视子聚类信息和上述第二搜索结果的排序列表联动地显示。
2.根据权利要求1所述的增强搜索结果导航的可视化方法,其中,上述第一搜索结果包含由上述搜索引擎基于查询请求而生成的搜索结果中的预定数量的搜索结果条目。
3.根据权利要求1所述的增强搜索结果导航的可视化方法,其中,将可视聚类信息与上述第一搜索结果的排序列表联动地显示包括下述情形的任意一种:
a.当显示上述第一搜索结果的排序列表的页面时,在上述可视聚类信息中突出显示包含上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
b.当显示上述第一搜索结果的排序列表的页面时,在上述可视聚类信息中突出显示包含第一个页面的上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
c.当选择上述第一搜索结果的排序列表中的某个搜索结果条目时,在上述可视聚类信息中突出显示包含上述搜索结果条目和上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
d.当选择上述第一搜索结果的排序列表中的某个搜索结果条目时,在上述可视聚类信息中突出显示包含上述搜索结果条目和第一个页面的上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;以及
e.当选择上述可视聚类信息中的某个可视聚类信息项时,显示上述第一搜索结果中包含在上述可视聚类信息项中的搜索结果条目的排序列表。
4.根据权利要求1所述的增强搜索结果导航的可视化方法,其中,对上述第一搜索结果聚类的步骤采用后缀树聚类算法。
5.根据权利要求1至4任意一项所述的增强搜索结果导航的可视化方法,还包括步骤:
当选择上述可视子聚类信息中的某个可视子聚类信息项时,重复执行从选择上述可视聚类信息中的某个可视聚类信息项的步骤开始的步骤。
6.根据权利要求5所述的增强搜索结果导航的可视化方法,其中,上述可视聚类信息与上述可视子聚类信息构成树状结构,其中上述可视聚类信息包含的可视聚类信息项是根节点,上述可视子聚类信息包含的可视子聚类项是上述可视聚类信息项的分枝节点。
7.根据权利要求5所述的增强搜索结果导航的可视化方法,其中,生成新的查询关键词的步骤包括:将当前的查询关键词与所选择的可视聚类信息项的名称进行组合以生成新的查询关键词。
8.根据权利要求5所述的增强搜索结果导航的可视化方法,其中,生成新的查询关键词的步骤包括:
收集相关文档;
在上述相关文档中确定关键词;以及
将上述关键词与当前的查询进行组合以生成新的查询。
9.根据权利要求8所述的增强搜索结果导航的可视化方法,其中,上述相关文档是网络用户已经阅读的文档或者属于所选择的可视聚类信息项的文档。
10.根据权利要求8所述的增强搜索结果导航的可视化方法,其中,在上述相关文档中确定关键词的步骤包括:
计算上述相关文档的每一个文档中除了停止词以外的所有词的权值,公式如下:
valuei=tf·idf,
其中,value表示词的权值;tf表示某个词在上述相关文档中出现的频率;idf=all_documents/keyword_documents,其中all_documents表示上述相关文档中所有文档的数量,keyword_documents表示在上述相关文档中包含该词的文档的数量;以及
确定具有高权值的词为关键词。
11.一种增强搜索结果导航的可视化装置,包括:
动态聚类构造器,用于对来自搜索引擎的搜索结果进行选取,获得第一搜索结果并对第一搜索结果进行动态聚类,以生成聚类信息;
关联处理器,用于计算上述聚类信息与上述第一搜索结果的排序列表之间的关联性;
可视化引擎,用于对上述聚类信息进行可视化处理,生成可视聚类信息,以及用于根据上述关联性将上述可视聚类信息和上述第一搜索结果的排序列表联动地显示在浏览器上;以及
关键词生成器,用于在选择上述可视聚类信息中的某个可视聚类信息项时,生成新的查询关键词,并经上述动态聚类构造器发送到搜索引擎;
其中,上述搜索引擎根据上述关键词生成器生成的新的查询关键词进行搜索,返回新的搜索结果的排序列表;
上述动态聚类构造器的搜索结果选取单元对接收的新的搜索结果的排序列表,选择预定数量的搜索结果条目,形成第二搜索结果并存储;
上述动态聚类构造器的聚类器对上述第二搜索结果聚类,以生成子聚类信息;
上述关联处理器计算上述子聚类信息与上述第二搜索结果的排序列表之间的关联性,并对上述子聚类信息进行可视化处理;
上述可视化引擎还将上述子聚类信息和上述第二搜索结果的排序列表联动地显示在浏览器上。
12.根据权利要求11所述的增强搜索结果导航的可视化装置,其中,
上述动态聚类构造器的搜索结果选取单元还用于对接收的搜索结果选择预定数量的搜索结果条目以形成第一搜索结果,并存储上述第一搜索结果;
并且,上述聚类器还用于对上述第一搜索结果聚类,以生成聚类信息。
13.根据权利要求12所述的增强搜索结果导航的可视化装置,其中,上述可视化引擎根据上述关联性将上述可视聚类信息和上述第一搜索结果的排序列表联动地显示在浏览器上包括下述情形的任意一种:
a.当显示上述第一搜索结果的排序列表的页面时,在上述可视聚类信息中突出显示包含上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
b.当显示上述第一搜索结果的排序列表的页面时,在上述可视聚类信息中突出显示包含第一个页面的上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
c.当选择上述第一搜索结果的排序列表中的某个搜索结果条目时,在上述可视聚类信息中突出显示包含上述搜索结果条目和上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;
d.当选择上述第一搜索结果的排序列表中的某个搜索结果条目时,在上述可视聚类信息中突出显示包含上述搜索结果条目和第一个页面的上述第一搜索结果中最多的搜索结果条目的可视聚类信息项;以及
e.当选择上述可视聚类信息中的某个可视聚类信息项时,显示上述第一搜索结果中包含在上述可视聚类信息项中的搜索结果条目的排序列表。
14.根据权利要求12所述的增强搜索结果导航的可视化装置,其中,上述聚类器采用后缀树聚类算法。
15.根据权利要求11所述的增强搜索结果导航的可视化装置,其中,上述关键词生成器通过将当前的查询关键词与所选择的可视聚类信息项的名称进行组合而生成新的查询关键词。
16.根据权利要求11所述的增强搜索结果导航的可视化装置,其中,上述关键词生成器包括:
文档收集器,用于收集相关文档;
权值计算器,用于计算上述相关文档的每一个文档中除了停止词以外的所有词的权值;以及
组合器,用于选择具有高权值的词并将其与当前的查询关键词相组合,生成新的查询关键词。
17.根据权利要求16所述的增强搜索结果导航的可视化装置,其中,上述相关文档是网络用户已经阅读的文档或者是属于所选择的可视聚类信息的文档。
18.根据权利要求16所述的增强搜索结果导航的可视化装置,其中,上述权值计算器采用的公式如下:
valuei=tf·idf;
其中,value表示词的权值;tf表示某个词在上述相关文档中出现的频率;idf=all_documents/keyword_documents,其中all_documents表示上述相关文档中所有文档的数量,keyword_documents表示在上述相关文档中包含该词的文档的数量。
19.一种浏览器,包括:如权利要求11至18的任意一项所述的增强搜索结果导航的可视化装置。
20.一种搜索引擎,包括:如权利要求11至18的任意一项所述的增强搜索结果导航的可视化装置。
CNB2006100012678A 2006-01-12 2006-01-12 用于增强搜索结果导航的可视化方法及装置 Active CN100481077C (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CNB2006100012678A CN100481077C (zh) 2006-01-12 2006-01-12 用于增强搜索结果导航的可视化方法及装置
US11/619,665 US7502786B2 (en) 2006-01-12 2007-01-04 Visual method and apparatus for enhancing search result navigation
US12/061,720 US20080222145A1 (en) 2006-01-12 2008-04-03 Visual method and apparatus for enhancing search result navigation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100012678A CN100481077C (zh) 2006-01-12 2006-01-12 用于增强搜索结果导航的可视化方法及装置

Publications (2)

Publication Number Publication Date
CN101000607A CN101000607A (zh) 2007-07-18
CN100481077C true CN100481077C (zh) 2009-04-22

Family

ID=38692584

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100012678A Active CN100481077C (zh) 2006-01-12 2006-01-12 用于增强搜索结果导航的可视化方法及装置

Country Status (2)

Country Link
US (2) US7502786B2 (zh)
CN (1) CN100481077C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915342A (zh) * 2011-09-22 2013-02-06 微软公司 提供基于话题的搜索引导
CN102934109A (zh) * 2010-05-20 2013-02-13 萨基姆通讯宽带公司 用于在通过搜索引擎获得的搜索结果内进行导航的方法
CN104428768A (zh) * 2012-05-16 2015-03-18 谷歌公司 知识面板

Families Citing this family (177)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131736B1 (en) 2005-03-01 2012-03-06 Google Inc. System and method for navigating documents
US20070233678A1 (en) * 2006-04-04 2007-10-04 Bigelow David H System and method for a visual catalog
US8131722B2 (en) * 2006-11-20 2012-03-06 Ebay Inc. Search clustering
US8930331B2 (en) 2007-02-21 2015-01-06 Palantir Technologies Providing unique views of data based on changes or rules
US8073803B2 (en) * 2007-07-16 2011-12-06 Yahoo! Inc. Method for matching electronic advertisements to surrounding context based on their advertisement content
US20090157610A1 (en) * 2007-12-13 2009-06-18 Allen Jr Lloyd W Method, system, and computer program product for applying a graphical hierarchical context in a search query
CN101925896B (zh) 2008-01-23 2016-05-11 初世先 信息的可视化表达方法和装置、及其可视人机交互表达界面
US8027999B2 (en) * 2008-02-25 2011-09-27 International Business Machines Corporation Systems, methods and computer program products for indexing, searching and visualizing media content
US7996431B2 (en) * 2008-02-25 2011-08-09 International Business Machines Corporation Systems, methods and computer program products for generating metadata and visualizing media content
US20090216563A1 (en) * 2008-02-25 2009-08-27 Michael Sandoval Electronic profile development, storage, use and systems for taking action based thereon
US7996432B2 (en) * 2008-02-25 2011-08-09 International Business Machines Corporation Systems, methods and computer program products for the creation of annotations for media content to enable the selective management and playback of media content
US20090216639A1 (en) 2008-02-25 2009-08-27 Mark Joseph Kapczynski Advertising selection and display based on electronic profile information
US20090216743A1 (en) * 2008-02-25 2009-08-27 International Business Machines Corporation Systems, Methods and Computer Program Products for the Use of Annotations for Media Content to Enable the Selective Management and Playback of Media Content
CN104834684A (zh) * 2008-06-13 2015-08-12 电子湾有限公司 用于集群化的方法和系统
US8358308B2 (en) * 2008-06-27 2013-01-22 Microsoft Corporation Using visual techniques to manipulate data
US8090715B2 (en) * 2008-07-14 2012-01-03 Disney Enterprises, Inc. Method and system for dynamically generating a search result
US9449092B2 (en) * 2008-07-24 2016-09-20 Adobe Systems Incorporated Method and apparatus requesting information upon returning to a search results list
US10747952B2 (en) 2008-09-15 2020-08-18 Palantir Technologies, Inc. Automatic creation and server push of multiple distinct drafts
US20100125569A1 (en) * 2008-11-18 2010-05-20 Yahoo! Inc. System and method for autohyperlinking and navigation in url based context queries
US8122820B2 (en) * 2008-12-19 2012-02-28 Whirlpool Corporation Food processor with dicing tool
US9330165B2 (en) * 2009-02-13 2016-05-03 Microsoft Technology Licensing, Llc Context-aware query suggestion by mining log data
CN101876982B (zh) * 2009-04-30 2012-08-15 国际商业机器公司 动态非连通网络在显示区域内的布局方法和系统
US9104695B1 (en) 2009-07-27 2015-08-11 Palantir Technologies, Inc. Geotagging structured data
US20110093478A1 (en) * 2009-10-19 2011-04-21 Business Objects Software Ltd. Filter hints for result sets
US20110113357A1 (en) * 2009-11-12 2011-05-12 International Business Machines Corporation Manipulating results of a media archive search
US8756231B2 (en) 2010-01-28 2014-06-17 International Business Machines Corporation Search using proximity for clustering information
US8984647B2 (en) 2010-05-06 2015-03-17 Atigeo Llc Systems, methods, and computer readable media for security in profile utilizing systems
US9443008B2 (en) * 2010-07-14 2016-09-13 Yahoo! Inc. Clustering of search results
US9355179B2 (en) 2010-09-24 2016-05-31 Microsoft Technology Licensing, Llc Visual-cue refinement of user query results
US8799240B2 (en) 2011-06-23 2014-08-05 Palantir Technologies, Inc. System and method for investigating large amounts of data
US9092482B2 (en) 2013-03-14 2015-07-28 Palantir Technologies, Inc. Fair scheduling for mixed-query loads
US9547693B1 (en) 2011-06-23 2017-01-17 Palantir Technologies Inc. Periodic database search manager for multiple data sources
US8732574B2 (en) 2011-08-25 2014-05-20 Palantir Technologies, Inc. System and method for parameterizing documents for automatic workflow generation
US9459767B2 (en) * 2011-08-29 2016-10-04 Ebay Inc. Tablet web visual browsing
US8504542B2 (en) 2011-09-02 2013-08-06 Palantir Technologies, Inc. Multi-row transactions
US9009144B1 (en) * 2012-02-23 2015-04-14 Google Inc. Dynamically identifying and removing potential stopwords from a local search query
US9176948B2 (en) 2012-03-27 2015-11-03 Google Inc. Client/server-based statistical phrase distribution display and associated text entry technique
CN102937983A (zh) * 2012-10-19 2013-02-20 北京奇虎科技有限公司 个性化网址导航系统
US9348677B2 (en) 2012-10-22 2016-05-24 Palantir Technologies Inc. System and method for batch evaluation programs
CN103020206A (zh) * 2012-12-05 2013-04-03 北京海量融通软件技术有限公司 基于知识网络的搜索结果聚焦系统及聚焦方法
US9501507B1 (en) 2012-12-27 2016-11-22 Palantir Technologies Inc. Geo-temporal indexing and searching
US9069882B2 (en) * 2013-01-22 2015-06-30 International Business Machines Corporation Mapping and boosting of terms in a format independent data retrieval query
US9380431B1 (en) 2013-01-31 2016-06-28 Palantir Technologies, Inc. Use of teams in a mobile application
US9514191B2 (en) * 2013-03-14 2016-12-06 Microsoft Technology Licensing, Llc Visualizing ranking factors for items in a search result list
US10037314B2 (en) 2013-03-14 2018-07-31 Palantir Technologies, Inc. Mobile reports
US8917274B2 (en) 2013-03-15 2014-12-23 Palantir Technologies Inc. Event matrix based on integrated data
US10275778B1 (en) 2013-03-15 2019-04-30 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation based on automatic malfeasance clustering of related data in various data structures
US8937619B2 (en) 2013-03-15 2015-01-20 Palantir Technologies Inc. Generating an object time series from data objects
US9965937B2 (en) 2013-03-15 2018-05-08 Palantir Technologies Inc. External malware data item clustering and analysis
US8818892B1 (en) 2013-03-15 2014-08-26 Palantir Technologies, Inc. Prioritizing data clusters with customizable scoring strategies
US8909656B2 (en) 2013-03-15 2014-12-09 Palantir Technologies Inc. Filter chains with associated multipath views for exploring large data sets
US8868486B2 (en) 2013-03-15 2014-10-21 Palantir Technologies Inc. Time-sensitive cube
US8799799B1 (en) * 2013-05-07 2014-08-05 Palantir Technologies Inc. Interactive geospatial map
US9922139B2 (en) 2013-06-05 2018-03-20 Tencent Technology (Shenzhen) Company Limited Method and device for data screening
CN104216922B (zh) * 2013-06-05 2018-11-06 腾讯科技(深圳)有限公司 数据筛选的方法及装置
US9720972B2 (en) * 2013-06-17 2017-08-01 Microsoft Technology Licensing, Llc Cross-model filtering
US9223773B2 (en) 2013-08-08 2015-12-29 Palatir Technologies Inc. Template system for custom document generation
US9335897B2 (en) 2013-08-08 2016-05-10 Palantir Technologies Inc. Long click display of a context menu
US8713467B1 (en) 2013-08-09 2014-04-29 Palantir Technologies, Inc. Context-sensitive views
CN104346413A (zh) * 2013-08-09 2015-02-11 聚游互动(北京)科技发展有限公司 在移动终端上呈现可视化检索结果的方法及系统
EP2840512B1 (en) * 2013-08-21 2015-10-21 Ontoforce NV A data processing system for adaptive visualisation of faceted search results
US9785317B2 (en) 2013-09-24 2017-10-10 Palantir Technologies Inc. Presentation and analysis of user interaction data
US8938686B1 (en) 2013-10-03 2015-01-20 Palantir Technologies Inc. Systems and methods for analyzing performance of an entity
US8812960B1 (en) 2013-10-07 2014-08-19 Palantir Technologies Inc. Cohort-based presentation of user interaction data
US8924872B1 (en) 2013-10-18 2014-12-30 Palantir Technologies Inc. Overview user interface of emergency call data of a law enforcement agency
US9116975B2 (en) 2013-10-18 2015-08-25 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive simultaneous querying of multiple data stores
US11238056B2 (en) 2013-10-28 2022-02-01 Microsoft Technology Licensing, Llc Enhancing search results with social labels
US9542440B2 (en) 2013-11-04 2017-01-10 Microsoft Technology Licensing, Llc Enterprise graph search based on object and actor relationships
US9021384B1 (en) 2013-11-04 2015-04-28 Palantir Technologies Inc. Interactive vehicle information map
US8868537B1 (en) 2013-11-11 2014-10-21 Palantir Technologies, Inc. Simple web search
US9105000B1 (en) 2013-12-10 2015-08-11 Palantir Technologies Inc. Aggregating data from a plurality of data sources
US10019520B1 (en) * 2013-12-13 2018-07-10 Joy Sargis Muske System and process for using artificial intelligence to provide context-relevant search engine results
US9734217B2 (en) 2013-12-16 2017-08-15 Palantir Technologies Inc. Methods and systems for analyzing entity performance
US9552615B2 (en) 2013-12-20 2017-01-24 Palantir Technologies Inc. Automated database analysis to detect malfeasance
US10356032B2 (en) 2013-12-26 2019-07-16 Palantir Technologies Inc. System and method for detecting confidential information emails
US9043696B1 (en) 2014-01-03 2015-05-26 Palantir Technologies Inc. Systems and methods for visual definition of data associations
US8832832B1 (en) 2014-01-03 2014-09-09 Palantir Technologies Inc. IP reputation
US11645289B2 (en) 2014-02-04 2023-05-09 Microsoft Technology Licensing, Llc Ranking enterprise graph queries
US9483162B2 (en) 2014-02-20 2016-11-01 Palantir Technologies Inc. Relationship visualizations
US9009827B1 (en) 2014-02-20 2015-04-14 Palantir Technologies Inc. Security sharing system
US9870432B2 (en) 2014-02-24 2018-01-16 Microsoft Technology Licensing, Llc Persisted enterprise graph queries
US11657060B2 (en) 2014-02-27 2023-05-23 Microsoft Technology Licensing, Llc Utilizing interactivity signals to generate relationships and promote content
US10757201B2 (en) 2014-03-01 2020-08-25 Microsoft Technology Licensing, Llc Document and content feed
US10169457B2 (en) 2014-03-03 2019-01-01 Microsoft Technology Licensing, Llc Displaying and posting aggregated social activity on a piece of enterprise content
US10394827B2 (en) 2014-03-03 2019-08-27 Microsoft Technology Licensing, Llc Discovering enterprise content based on implicit and explicit signals
US10255563B2 (en) 2014-03-03 2019-04-09 Microsoft Technology Licensing, Llc Aggregating enterprise graph content around user-generated topics
US9727376B1 (en) 2014-03-04 2017-08-08 Palantir Technologies, Inc. Mobile tasks
US8935201B1 (en) 2014-03-18 2015-01-13 Palantir Technologies Inc. Determining and extracting changed data from a data source
US9857958B2 (en) 2014-04-28 2018-01-02 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive access of, investigation of, and analysis of data objects stored in one or more databases
US9009171B1 (en) 2014-05-02 2015-04-14 Palantir Technologies Inc. Systems and methods for active column filtering
CN104063430A (zh) * 2014-06-10 2014-09-24 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
US9129219B1 (en) 2014-06-30 2015-09-08 Palantir Technologies, Inc. Crime risk forecasting
US9535974B1 (en) 2014-06-30 2017-01-03 Palantir Technologies Inc. Systems and methods for identifying key phrase clusters within documents
US9619557B2 (en) 2014-06-30 2017-04-11 Palantir Technologies, Inc. Systems and methods for key phrase characterization of documents
US9021260B1 (en) 2014-07-03 2015-04-28 Palantir Technologies Inc. Malware data item analysis
US9256664B2 (en) 2014-07-03 2016-02-09 Palantir Technologies Inc. System and method for news events detection and visualization
US9785773B2 (en) 2014-07-03 2017-10-10 Palantir Technologies Inc. Malware data item analysis
US9202249B1 (en) 2014-07-03 2015-12-01 Palantir Technologies Inc. Data item clustering and analysis
US10572496B1 (en) 2014-07-03 2020-02-25 Palantir Technologies Inc. Distributed workflow system and database with access controls for city resiliency
US9454281B2 (en) 2014-09-03 2016-09-27 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US10061826B2 (en) 2014-09-05 2018-08-28 Microsoft Technology Licensing, Llc. Distant content discovery
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9767172B2 (en) 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
US9785328B2 (en) 2014-10-06 2017-10-10 Palantir Technologies Inc. Presentation of multivariate data on a graphical user interface of a computing system
US9984133B2 (en) 2014-10-16 2018-05-29 Palantir Technologies Inc. Schematic and database linking system
US9229952B1 (en) 2014-11-05 2016-01-05 Palantir Technologies, Inc. History preserving data pipeline system and method
US9043894B1 (en) 2014-11-06 2015-05-26 Palantir Technologies Inc. Malicious software detection in a computing system
US10552994B2 (en) 2014-12-22 2020-02-04 Palantir Technologies Inc. Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items
US10362133B1 (en) 2014-12-22 2019-07-23 Palantir Technologies Inc. Communication data processing architecture
US9348920B1 (en) 2014-12-22 2016-05-24 Palantir Technologies Inc. Concept indexing among database of documents using machine learning techniques
US9367872B1 (en) 2014-12-22 2016-06-14 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
US9817563B1 (en) 2014-12-29 2017-11-14 Palantir Technologies Inc. System and method of generating data points from one or more data stores of data items for chart creation and manipulation
US9870205B1 (en) 2014-12-29 2018-01-16 Palantir Technologies Inc. Storing logical units of program code generated using a dynamic programming notebook user interface
US9335911B1 (en) 2014-12-29 2016-05-10 Palantir Technologies Inc. Interactive user interface for dynamic data analysis exploration and query processing
CN104598549B (zh) * 2014-12-31 2019-03-05 北京畅游天下网络技术有限公司 数据分析方法和系统
US10372879B2 (en) 2014-12-31 2019-08-06 Palantir Technologies Inc. Medical claims lead summary report generation
US10387834B2 (en) 2015-01-21 2019-08-20 Palantir Technologies Inc. Systems and methods for accessing and storing snapshots of a remote application in a document
US9727560B2 (en) 2015-02-25 2017-08-08 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
EP3070622A1 (en) 2015-03-16 2016-09-21 Palantir Technologies, Inc. Interactive user interfaces for location-based data analysis
US9886467B2 (en) 2015-03-19 2018-02-06 Plantir Technologies Inc. System and method for comparing and visualizing data entities and data entity series
CN108647276B (zh) * 2015-05-11 2022-04-05 何杨洲 一种搜索方法
CN104881447A (zh) * 2015-05-14 2015-09-02 百度在线网络技术(北京)有限公司 搜索方法及装置
EP3298516A4 (en) * 2015-05-20 2018-10-24 eBay Inc. Multi-faceted entity identification in search
US9460175B1 (en) 2015-06-03 2016-10-04 Palantir Technologies Inc. Server implemented geographic information system with graphical interface
US10671677B2 (en) * 2015-06-12 2020-06-02 Smugmug, Inc. Advanced keyword search application
US9454785B1 (en) 2015-07-30 2016-09-27 Palantir Technologies Inc. Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data
US10963476B2 (en) 2015-08-03 2021-03-30 International Business Machines Corporation Searching and visualizing data for a network search based on relationships within the data
US9996595B2 (en) 2015-08-03 2018-06-12 Palantir Technologies, Inc. Providing full data provenance visualization for versioned datasets
US9456000B1 (en) 2015-08-06 2016-09-27 Palantir Technologies Inc. Systems, methods, user interfaces, and computer-readable media for investigating potential malicious communications
US10489391B1 (en) 2015-08-17 2019-11-26 Palantir Technologies Inc. Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
US9600146B2 (en) 2015-08-17 2017-03-21 Palantir Technologies Inc. Interactive geospatial map
US10102369B2 (en) 2015-08-19 2018-10-16 Palantir Technologies Inc. Checkout system executable code monitoring, and user account compromise determination system
US10853378B1 (en) 2015-08-25 2020-12-01 Palantir Technologies Inc. Electronic note management via a connected entity graph
US11150917B2 (en) 2015-08-26 2021-10-19 Palantir Technologies Inc. System for data aggregation and analysis of data from a plurality of data sources
US9485265B1 (en) 2015-08-28 2016-11-01 Palantir Technologies Inc. Malicious activity detection system capable of efficiently processing data accessed from databases and generating alerts for display in interactive user interfaces
US10706434B1 (en) 2015-09-01 2020-07-07 Palantir Technologies Inc. Methods and systems for determining location information
US9639580B1 (en) 2015-09-04 2017-05-02 Palantir Technologies, Inc. Computer-implemented systems and methods for data management and visualization
US9576015B1 (en) 2015-09-09 2017-02-21 Palantir Technologies, Inc. Domain-specific language for dataset transformations
US10296617B1 (en) 2015-10-05 2019-05-21 Palantir Technologies Inc. Searches of highly structured data
CN106815274B (zh) * 2015-12-02 2022-02-18 中兴通讯股份有限公司 基于Hadoop的日志数据挖掘方法及系统
US9542446B1 (en) 2015-12-17 2017-01-10 Palantir Technologies, Inc. Automatic generation of composite datasets based on hierarchical fields
US10109094B2 (en) 2015-12-21 2018-10-23 Palantir Technologies Inc. Interface to index and display geospatial data
US10089289B2 (en) 2015-12-29 2018-10-02 Palantir Technologies Inc. Real-time document annotation
US9823818B1 (en) 2015-12-29 2017-11-21 Palantir Technologies Inc. Systems and interactive user interfaces for automatic generation of temporal representation of data objects
US9612723B1 (en) 2015-12-30 2017-04-04 Palantir Technologies Inc. Composite graphical interface with shareable data-objects
CN105786969B (zh) * 2016-02-01 2020-07-03 百度在线网络技术(北京)有限公司 信息展示方法和装置
US10698938B2 (en) 2016-03-18 2020-06-30 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10068199B1 (en) 2016-05-13 2018-09-04 Palantir Technologies Inc. System to catalogue tracking data
US10719188B2 (en) 2016-07-21 2020-07-21 Palantir Technologies Inc. Cached database and synchronization system for providing dynamic linked panels in user interface
US10324609B2 (en) 2016-07-21 2019-06-18 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US9686357B1 (en) 2016-08-02 2017-06-20 Palantir Technologies Inc. Mapping content delivery
US10437840B1 (en) 2016-08-19 2019-10-08 Palantir Technologies Inc. Focused probabilistic entity resolution from multiple data sources
US10318630B1 (en) 2016-11-21 2019-06-11 Palantir Technologies Inc. Analysis of large bodies of textual data
US10515433B1 (en) 2016-12-13 2019-12-24 Palantir Technologies Inc. Zoom-adaptive data granularity to achieve a flexible high-performance interface for a geospatial mapping system
US10270727B2 (en) 2016-12-20 2019-04-23 Palantir Technologies, Inc. Short message communication within a mobile graphical map
US10460602B1 (en) 2016-12-28 2019-10-29 Palantir Technologies Inc. Interactive vehicle information mapping system
US10579239B1 (en) 2017-03-23 2020-03-03 Palantir Technologies Inc. Systems and methods for production and display of dynamically linked slide presentations
US10895946B2 (en) 2017-05-30 2021-01-19 Palantir Technologies Inc. Systems and methods for using tiled data
US11334216B2 (en) 2017-05-30 2022-05-17 Palantir Technologies Inc. Systems and methods for visually presenting geospatial information
US10956406B2 (en) 2017-06-12 2021-03-23 Palantir Technologies Inc. Propagated deletion of database records and derived data
US10403011B1 (en) 2017-07-18 2019-09-03 Palantir Technologies Inc. Passing system with an interactive user interface
US10371537B1 (en) 2017-11-29 2019-08-06 Palantir Technologies Inc. Systems and methods for flexible route planning
US11599706B1 (en) 2017-12-06 2023-03-07 Palantir Technologies Inc. Systems and methods for providing a view of geospatial information
US10698756B1 (en) 2017-12-15 2020-06-30 Palantir Technologies Inc. Linking related events for various devices and services in computer log files on a centralized server
US11599369B1 (en) 2018-03-08 2023-03-07 Palantir Technologies Inc. Graphical user interface configuration system
US10896234B2 (en) 2018-03-29 2021-01-19 Palantir Technologies Inc. Interactive geographical map
US10830599B2 (en) 2018-04-03 2020-11-10 Palantir Technologies Inc. Systems and methods for alternative projections of geographical information
US11585672B1 (en) 2018-04-11 2023-02-21 Palantir Technologies Inc. Three-dimensional representations of routes
US10754822B1 (en) 2018-04-18 2020-08-25 Palantir Technologies Inc. Systems and methods for ontology migration
US10885021B1 (en) 2018-05-02 2021-01-05 Palantir Technologies Inc. Interactive interpreter and graphical user interface
US10429197B1 (en) 2018-05-29 2019-10-01 Palantir Technologies Inc. Terrain analysis for automatic route determination
US11119630B1 (en) 2018-06-19 2021-09-14 Palantir Technologies Inc. Artificial intelligence assisted evaluations and user interface for same
US10467435B1 (en) 2018-10-24 2019-11-05 Palantir Technologies Inc. Approaches for managing restrictions for middleware applications
US11025672B2 (en) 2018-10-25 2021-06-01 Palantir Technologies Inc. Approaches for securing middleware data access
CN109816127B (zh) * 2019-01-11 2022-12-30 广州市骑鹅游信息技术咨询服务有限公司 一种智能票务推荐方法及系统
CN111444405A (zh) * 2020-03-20 2020-07-24 北京三快在线科技有限公司 用于搜索中的用户交互方法、装置、移动终端和存储介质
CN116502241B (zh) * 2023-06-29 2023-10-10 中汽智联技术有限公司 一种基于PoC载荷库的漏洞扫描工具增强方法和系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415282B1 (en) * 1998-04-22 2002-07-02 Nec Usa, Inc. Method and apparatus for query refinement
US7340464B2 (en) * 2000-03-10 2008-03-04 General Electric Company Method for automated web site maintenance via searching
WO2002041190A2 (en) * 2000-11-15 2002-05-23 Holbrook David M Apparatus and method for organizing and/or presenting data
US7085753B2 (en) * 2001-03-22 2006-08-01 E-Nvent Usa Inc. Method and system for mapping and searching the Internet and displaying the results in a visual form
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US7293014B2 (en) * 2001-06-18 2007-11-06 Siebel Systems, Inc. System and method to enable searching across multiple databases and files using a single search
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
US7334195B2 (en) * 2003-10-14 2008-02-19 Microsoft Corporation System and process for presenting search results in a histogram/cluster format
US20050144158A1 (en) * 2003-11-18 2005-06-30 Capper Liesl J. Computer network search engine
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Web Document Clustering: A Feasibility Demonstration. O. Zamir, O. Etzioni.Proceedings of ACM SIGIR'98. 1998
Web Document Clustering: A Feasibility Demonstration. O. Zamir,O. Etzioni.Proceedings of ACM SIGIR'98. 1998 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102934109A (zh) * 2010-05-20 2013-02-13 萨基姆通讯宽带公司 用于在通过搜索引擎获得的搜索结果内进行导航的方法
CN102915342A (zh) * 2011-09-22 2013-02-06 微软公司 提供基于话题的搜索引导
US9043350B2 (en) 2011-09-22 2015-05-26 Microsoft Technology Licensing, Llc Providing topic based search guidance
CN104428768A (zh) * 2012-05-16 2015-03-18 谷歌公司 知识面板
US10019495B2 (en) 2012-05-16 2018-07-10 Google Llc Knowledge panel
CN104428768B (zh) * 2012-05-16 2018-07-24 谷歌有限责任公司 知识面板

Also Published As

Publication number Publication date
US7502786B2 (en) 2009-03-10
CN101000607A (zh) 2007-07-18
US20070162443A1 (en) 2007-07-12
US20080222145A1 (en) 2008-09-11

Similar Documents

Publication Publication Date Title
CN100481077C (zh) 用于增强搜索结果导航的可视化方法及装置
US9697249B1 (en) Estimating confidence for query revision models
US7565345B2 (en) Integration of multiple query revision models
US9940398B1 (en) Customization of search results for search queries received from third party sites
US8346754B2 (en) Generating succinct titles for web URLs
TWI471737B (zh) 具搜尋結果之蹤跡識別系統與方法
US7899818B2 (en) Method and system for providing focused search results by excluding categories
US9262532B2 (en) Ranking entity facets using user-click feedback
US20090287676A1 (en) Search results with word or phrase index
US20090259646A1 (en) Method for Calculating Score for Search Query
US9411886B2 (en) Ranking advertisements with pseudo-relevance feedback and translation models
US20060230005A1 (en) Empirical validation of suggested alternative queries
US8676798B1 (en) Query generation for searchable content
KR20070039072A (ko) 검색 엔진에서의 결과물 기반의 광고 개인화
JP5427694B2 (ja) 関連コンテンツ提示装置及びプログラム
KR20100132376A (ko) 스니펫 제공 장치 및 방법
Li et al. A path-based approach for web page retrieval
JP2008112310A (ja) 検索装置、情報検索システム、検索方法、検索プログラム、及び記録媒体
CN106708808B (zh) 一种信息挖掘方法及装置
AU2011247862B2 (en) Integration of multiple query revision models
Meng et al. Web Search Technologies for Text Documents
Parrell Increasing trustworthiness in web-page searches by using an alternative approach for web-page ranking
Sanduja et al. Framework for Domain Oriented Search Result Generation.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant