CN101395605B - 比较性web搜索 - Google Patents

比较性web搜索 Download PDF

Info

Publication number
CN101395605B
CN101395605B CN2007800073320A CN200780007332A CN101395605B CN 101395605 B CN101395605 B CN 101395605B CN 2007800073320 A CN2007800073320 A CN 2007800073320A CN 200780007332 A CN200780007332 A CN 200780007332A CN 101395605 B CN101395605 B CN 101395605B
Authority
CN
China
Prior art keywords
search
inquiry
comparative
search results
implemented method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800073320A
Other languages
English (en)
Other versions
CN101395605A (zh
Inventor
J-T·孙
X·王
D·沈
H-J·曾
J·王
Z·陈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101395605A publication Critical patent/CN101395605A/zh
Application granted granted Critical
Publication of CN101395605B publication Critical patent/CN101395605B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

提供了执行比较性搜索的方法和系统。在一示例中,该比较性搜索通过诸如web或数据库等网络执行。在一示例性实现中,用户发送表示用户想要比较的主题的多个查询,且计算系统可以基于其与查询的相关性和其包含的比较性内容自动检索并排列网页或文档。在这样一个示例中,比较性页面被成对地或以其它分组形式显示。在另一示例中,具有类似内容的比较性结果可以被群集成有意义的主题。

Description

比较性web搜索
背景技术
计算机用户通常利用连接到因特网或一信息数据库的计算设备来比较类似的项目。确实,用户通过因特网比较产品或服务的商店是相当普遍的。例如,用户可能希望在他/她做出购买决定之前比较两个候选产品。传统的搜索引擎返回根据其与输入查询的相关性排序的一组网页或文档。虽然这可能有助于搜索与该搜索查询相关的页面和/或文档,但这些结果即使不是根本不提供,也通常不以高效的方式提供用户需要的比较信息。
一般地,向用户呈现包含搜索查询中所提供的(诸)单词的任何页面或文档,而不管这些页面或文档在将所搜索的产品或服务与另一类似产品或服务进行比较时是否提供有用的信息。这迫使用户审阅基本没有价值的众多页面。事实上,即使所搜索的页面包括有用的比较性信息,用户也必须进行若干查询并独立地确定在不同的查询中哪一些包括类似的信息。因此,所需要的是用于执行对诸如产品或服务等两个或更多相关项目的比较性搜索的高效的方法和系统。
发明内容
提供了从诸如因特网或Web等网络或数据库中搜索相关的和比较性信息的方法和系统。在一示例中,在接收到表示用户想要比较的主题的多个查询时,一系统可以基于其与查询的相关性和其包含的比较性内容自动检索并排列网页。在一示例中,比较性页面被成对地或以其它分组形式显示。
在另一示例中,具有类似内容的比较性结果可以被群集成语义上有意义的主题。为帮助用户容易地捕捉每一主题的比较性内容,可以提取显著短语来概括每一主题中的比较性内容。在一个这样的示例中,一图形用户界面可以允许用户查看比较性页面和比较性集群。
结合附图阅读下面的详细描述,则本发明的这些和其它优点会变得显而易见。可通过结合附图参考以下描述来获得对本发明及其优点的更完整的理解,附图中相同的参考标号指示相同的特征。本发明按照其示例性实施例来描述。通过细读以上公开内容,本领域的技术人员可以清楚所附权利要求书的范围和精神内的多种其它实施例、修改和变化。
附图说明
图1示出了在其中可以实现本发明各实施例的示例性计算机系统。
图2是排列比较性搜索结果的示例性方法的流程图。
具体实施方式
示例性操作环境
图1是可结合各种输入设备使用的常规通用数字计算环境的一个示例的功能框图。在图1中,计算机100包括处理单元110、系统存储器120和将包括系统存储器的各种系统组件耦合到处理单元110的系统总线130。系统总线130可以是若干类型总线结构中的任一种,包括存储器总线或存储器控制器、外围总线以及使用各类总线体系结构中的任一种的局部总线。系统存储器120包括只读存储器(ROM)140和随机存取存储器(RAM)150。
包含如在启动时帮助在计算机100中的元件之间传输信息的基本例程的基本输入/输出系统160(BIOS)被存储在ROM 140中。计算机100也包括用于对硬盘(未示出)进行读写的硬盘驱动器170、用于对可移动磁盘190进行读写的磁盘驱动器180、以及用于对诸如CD ROM或其它光学介质等可移动光盘192进行读写的光盘驱动器191。硬盘驱动器170、磁盘驱动器180和光盘驱动器191分别由硬盘驱动器接口192、磁盘驱动器接口193和光盘驱动器接口194连接到系统总线130。驱动器及其关联的计算机可读介质为个人计算机100提供了计算机可读指令、数据结构、程序模块和其它数据的非易失存储。本领域的技术人员可以理解,在示例操作环境中也可以使用可储存可由计算机访问的数据的其它类型的计算机可读介质,如磁带盒、闪存卡、数字视频盘、贝努利盒式磁带、随机存取存储器(RAM)、只读存储器(ROM)等等。
众多程序模块可储存在硬盘驱动器170、磁盘190、光盘192、ROM 140或RAM 150中,包括操作系统195、一个或多个应用程序196、其它程序模块197和程序数据198。用户可通过诸如键盘101和定位设备102等输入设备向计算机100输入命令和信息。其它输入设备(未示出)可包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常通过耦合到系统总线的串行端口接口106连接到处理单元110,但也可通过其它接口进行连接,如并行端口、游戏端口和通用串行总线(USB)。所示的计算机100包括可任选的PCMCIA接口103,其可以将根据本发明的输入设备的至少一个实施例连接到计算机100。此外,这些设备可通过适当的接口(未示出)直接耦合至系统总线130。监视器107或其它类型的显示设备也经由诸如视频适配器108等接口连接至系统总线130。除监视器之外,个人计算机通常包括其它外围输出设备(未示出),如扬声器或打印机。
计算机100可使用到一个或多个诸如远程计算机109这样的远程计算机的逻辑连接在网络化环境中操作。远程计算机109可以是服务器、路由器、网络PC、对等设备或其它常见的网络节点,并通常包括以上相对于计算机100所描述的许多或所有元件,尽管图1中仅示出了存储器存储设备111。图1所描述的逻辑连接包括局域网(LAN)112和广域网(WAN)113。这样的联网环境在办公室、企业范围计算机网络、内联网和因特网中是常见的。
当在LAN联网环境中使用时,计算机100通过网络接口或适配器114连接到局域网112。当在WAN联网环境中使用时,个人计算机100通常包括调制解调器115或用于通过广域网113,如因特网建立通信的其它装置。或为内置或为外置的调制解调器115经由串行端口接口106连接到系统总线130。在网络化环境中,相对于个人计算机100所描述的程序模块或其部分可以存储在远程存储器存储设备中。
可以理解,所示的网络连接是说明性的,可以使用在计算机之间建立通信链路的其它技术。假定存在各种公知协议的任一种,如TCP/IP、以太网、FTP、HTTP、蓝牙、IEEE 802.11x等等,且系统可在客户机-服务器配置中操作,以准许用户从基于web的服务器检索网页。可以使用各种常规web浏览器中的任一种来显示并操控网页上的数据。
说明性实施例的描述
图2是根据本发明的一个实施例的排列比较性搜索结果的示例性方法的流程图。可以理解,参考该方法描述的这些步骤可以在任何计算设备中实现。在示例性步骤205,接收第一搜索查询。该搜索查询可以由具有诸如微软的Internet
Figure GSB00000155220000041
web浏览器等通过如广域网113操作上连接到因特网的web浏览器的计算设备发送。虽然步骤205中所示的搜索和贯穿本说明书的其它搜索可以用参考因特网或web的方式示出,但本领域的技术人员将容易理解,这些方法可以在包括内联网的任何网络中进行。
在步骤210,接收与第一查询相关的至少一个第二搜索查询。通过相关,这些搜索共享一共同主题。例如,第一搜索查询可能涉及
Figure GSB00000155220000042
Figure GSB00000155220000043
游戏控制台而第二搜索查询可以涉及
Figure GSB00000155220000044
在这样一个示例中,这两个搜索都涉及个人游戏设备。当然,其它搜索查询可以涉及其它个人游戏设备。就此而言,搜索查询允许用户输入用户正考虑购买的两个竞争产品或服务。
第二搜索查询还可以从本领域公知的浏览器中发送。另选地,可以利用向用户呈现允许输入两个或更多查询的图形用户界面的经修改的浏览器。用户可以在单个页面上或在该过程的不同阶段提供搜索查询。搜索查询可以采用,例如布尔项或自然语言的形式。本领域技术人员理解,查询可以用多种形式呈现,每一形式都可以结合本发明的教导来使用。
在示例性步骤215,处理第一搜索查询以产生第一搜索结果,并处理第二搜索查询以产生第二搜索结果。在一实施例中,利用了布尔和/或关键字搜索引擎。在搜索查询基于相关性而与对应的网页匹配的实施例中,在向搜索引擎提交搜索查询时,一进程从该搜索查询中提取文字权标。在一实施例中,随后进行搜索以寻找在文字权标级最优匹配该查询的文档。匹配的紧密度最通常基于文档是否满足由这些查询项所构成的布尔表达式,或基于查询和文档中的项的加权集,如公知的“矢量空间模型”(参见,例如“Automatic Text Processing(自动文本处理)”,G.Salton[Addison-Wesley,1989],第10.1.1节)本领域技术人员将认识到,还有处理搜索查询的其它更多特定方法。
虽然该示例性步骤在同一步骤中处理第一和第二搜索查询,但是本领域技术人员将容易理解,可以由不同的进程在不同的时间处理搜索查询。例如,用户可以选择将先前关于第一产品执行的搜索查询与稍后或当前正在执行的搜索查询进行比较。
在步骤220,生成多个比较性搜索结果组,其中每一结果组都包括一来自于第一搜索结果的元素和一来自于第二搜索结果的元素。在一实施例中,表达为方程(1)的函数可以被用来估计两个页面形成与两个输入查询相对应的比较性对的可能性。
fq1,q2(p1,p2)=α·R(p1,q1)+β·R(p2,q2)+γ·S(p1\q1,p2\q2)p1∈SR1,p2∈SR2(方程1)其中,该函数被用来为输入查询q1和q2生成比较性信息。第一种方法是自动重排在步骤205和210所利用的搜索引擎(“SE”)所返回的搜索结果。假定函数中的“SR1”和“SR2”表示与分别在步骤205和210执行的查询q1和q2相对应的结果页面。与通常按照其与查询的相关性进行排名的传统搜索函数不同,该函数重排SR1和SR2以显示比较性页面组,如以下更详细地解释的对。假定“p1”和“p2”分别是来自于SR1和SR2的两个页面。通过使用“R”表示查询对于页面的相关性而使用“S”表示两个文本片段之间的相似性,示为方程1的函数可被用来估计两个页面形成与两个输入查询相对应的比较性对可能性。
在方程1中,p1\q1和p2\q2分别表示在删除包含于q1和q2中的项之后页面p1和p2的剩余文本内容。因此,S(p1\q1,p2\q2)测量p1和p2中与q1和q2相关联的较性信息的数量。函数f考虑页面和其对应的查询之间的相关性,以及包含于该两个页面中的比较性信息。在一实施例中,参数α和β被设为相等,以便同等地对待与两个查询相对应的相关性测量。γ是折衷参数,用于平衡相关性测量和比较性测量。
f的计算基于摘录文本。所有可能的页面对E={p1,p2|p1∈SR1,p2∈SR2}都根据fq1,q2(p1,p2)以降序排列。具有最高排名的对将被选为比较性对且该对的两个页面被插入到集合P中。所有剩余页面对将被过滤且包含P中的页面的那些被从E中删除。随后从更新过的集合E中选择第二比较性对。采用这一策略,可以删除那些包含重复页面的对并根据fp1,q2排列所有的比较性页面对。
在完成步骤220时,可以启动步骤225和/或230。在步骤230,确定是否显示在步骤220中所生成的将以成对的方式显示的组的至少一个。在一个这样的实施例中,用户可以被准许选择一选项以激活或停用以成对的方式的一个或多个组的显示。“成对”所指的是,为在显示设备上容易查看,关联了至少一个比较性结果组。如果是,则可以实现步骤245。每一对都包含与两个输入查询都相关的比较性内容。例如,第一对可以是
Figure GSB00000155220000061
游戏控制台站点和Global站点的主页。第二对可以包含IGN评论的页面。
在一实施例中,可以调整网页的尺寸以使该组中的两个结果同时适合在单一显示器上。例如,关于上述搜索的一个比较性结果组可以产生由
Figure GSB00000155220000063
的MSN.com评论和
Figure GSB00000155220000064
的MSN.com评论所组成的比较性结果组。可以调整两个网页来适合于单一显示区域中。然而,在具有多个显示器的计算环境中,可以将网页显示在不同的监视器或显示设备上。在又一实施例中,包括该对的网页以选项卡显示在单一应用程序中,以使用户可以通过在各选项卡之前切换来容易地以成对的方式比较网页。事实上,使网页一起成对的任何分组都落入本发明的范围之内。此外,本领域技术人员容易理解,出于帮助读者理解本发明的范围的简单理由,选择了两个网页来描述本发明的各方面,并且在不止两个网页形成比较性结果组时,可以用对应于网页的数目的方式来显示结果(即,在三个网页形成一组时以三个一组显示)。
在再一实施例中,可以向用户只提取和显示相关网页的一部分(即,步骤240)。该实施例可以被实现而不管结果是否以成对的方式显示。例如,该提取内容可由出现在步骤205和/或210所搜索的单词的预定邻近度之内的文本(和/或图)所组成。在其它实施例中,该提取内容可以包括出现在将一个组同另一个组分开的单词的预定邻近度之内的文本和/或图。例如,使用上述关于游戏设备的搜索查询,比较性结果组可以包括价格、消费者满意度、可用游戏等。在一个这样的实施例中,可以准许用户选择预定邻近度。
或结合或独立于步骤230,也可以实现和步骤225。在步骤225,确定在步骤220的结果中是否存在类似的比较性结果组。例如,在一实施例中,如果步骤220的比较性结果组包括各自都包括关于所搜索的游戏设备的价格的信息的若干对(或三个一组等),则可以实现步骤235。在步骤235,群集包括类似信息的比较性搜索结果组的子集。
在一个这样的实施例中,还实现步骤240,其中可以向用户提取并显示网页的一部分。在一实施例中,其中网页的子集都考虑定价,则可使用提取技术来向用户显示结果中的文本以传达该成本是该子集中共同的主题。在一实现中,可以为描述该共同主题的每一子集生成一超链接或其它选择机制并允许用户选择该超链接以进一步调查该子集中的网页。在一示例中,在选择某一子集时,用户可以确定是否以如参考步骤230所讨论的成对的方式选择那些对中的网页。
本发明是按照其示例性实施例来描述的。通过细读以上公开内容,本领域的技术人员可以清楚所附权利要求书的范围和精神内的多种其它实施例、修改和变化。例如,本领域技术人员将认识到,可使用不同方法来进行比较性搜索查询而不背离本发明的范围。此外,所描述的方法的一个或多个步骤可被省略或重复,且在一些实例中以与上述不同的次序来执行。

Claims (17)

1.一种用于排列比较性web结果的计算机实现的方法,包括如下步骤:
(a)接收第一搜索查询;
(b)接收与所述第一搜索查询相关的第二搜索查询;
(c)处理所述第一搜索查询以产生第一搜索结果,并处理所述第二搜索查询以产生第二搜索结果;以及
(d)生成多个比较性搜索结果组,其中每一组都包括一来自于所述第一搜索结果的元素和一来自于所述第二搜索结果的元素;
其中使用方程(1)生成所述多个比较性搜索结果组;
其中所述方程(1)为:
fq1,q2(p1,p2)=α·R(p1,q1)+β·R(p2,q2)+γ·S(p1\q1,p2\q2),p1∈SR1,p2∈SR2;
其中SR1表示对于第一搜索查询q1的第一搜索结果,SR2表示对于第二搜索查询q2的第二搜索结果,p1表示来自SR1的元素,p2表示来自SR2的元素,R表示一元素相对于查询的相关性,S表示两个元素之间的相似性,p1\q1表示在移除q1的项之后p1的文本内容,p2\q2表示在移除q2的项之后p2的文本内容,以及α,β和γ为参数,其中如果参数α和β被设为相等,则同等地对待与两个查询相对应的相关性测量,其中γ是折衷参数,用于平衡相关性测量和比较性测量。
2.如权利要求1所述的计算机实现的方法,其特征在于,(d)的至少一个搜索结果组是一对网页。
3.如权利要求2所述的计算机实现的方法,其特征在于,还包括以下步骤:
(e)以成对的方式显示所述网页对。
4.如权利要求2所述的计算机实现的方法,其特征在于,还包括以下步骤:
(e)提取所述对中每一网页的至少一部分,所述部分包括来自于所述第一或第二搜索结果中的任一个的至少一个元素。
5.如权利要求1所述的计算机实现的方法,其特征在于,所述第一搜索查询涉及消费产品,且所述第二搜索查询涉及类似消费产品。
6.如权利要求1所述的计算机实现的方法,其特征在于,还包括以下步骤:
(e)确定在(d)中生成的所述多个比较性搜索结果组的一子集包括类似信息;以及
(f)将所述子集群集成一个集群。
7.如权利要求6所述的计算机实现的方法,其特征在于,还包括以下步骤:
(g)提取所述集群中的至少一个网页的至少一部分,所述部分包括包括来自于所述第一或第二搜索结果中的任一个的至少一个元素。
8.一种用于通过浏览器从操作上连接到网络(113)的计算设备(100)获取比较性web结果的计算机实现的方法,包括如下步骤:
(a)发送第一搜索请求以获取第一搜索结果;
(b)发送与所述第一搜索请求相关的第二搜索请求以获取第二搜索结果;
(c)接收多个比较性搜索结果组,其中每一组都包括一来自于所述第一搜索结果的元素和一来自于所述第二搜索结果的元素;
其中,在步骤(c)接收到的所述多个比较性搜索结果组是根据合并了方程(1)的方法生成的;
其中所述方程(1)为:
fq1,q2(p1,p2)=α·R(p1,q1)+β·R(p2,q2)+γ·S(p1\q1,p2\q2),p1∈SR1,p2∈SR2;
其中SR1表示对于第一搜索查询q1的第一搜索结果,SR2表示对于第二搜索查询q2的第二搜索结果,p1表示来自SR1的元素,p2表示来自SR2的元素,R表示一元素相对于查询的相关性,S表示两个元素之间的相似性,p1\q1表示在移除q1的项之后p1的文本内容,p2\q2表示在移除q2的项之后p2的文本内容,以及α,β和γ为参数,其中如果参数α和β被设为相等,则同等地对待与两个查询相对应的相关性测量,其中γ是折衷参数,用于平衡相关性测量和比较性测量。
9.如权利要求8所述的计算机实现的方法,其特征在于,(c)的至少一个比较性搜索结果组是一对网页。
10.如权利要求9所述的计算机实现的方法,其特征在于,还包括
以下步骤:
(d)在显示设备(107)上以成对的方式向用户显示所述网页对。
11.如权利要求8所述的计算机实现的方法,其特征在于,还包括以下步骤:
(d)提取所述对中的每一网页的至少一部分,所述部分包括包括来自于所述第一或第二搜索结果中的任一个的至少一个元素;以及
(e)向用户显示所述对中的所述网页的所述部分。
12.如权利要求8所述的计算机实现的方法,其特征在于,还包括以下步骤:
(d)显示包括在(c)中生成的所述多个比较性搜索结果组的、包括类似信息的子集的集群。
13.如权利要求12所述的计算机实现的方法,其特征在于,还包括
以下步骤:
(e)显示所述多个比较性搜索结果组的所述子集中的信息的概要,所述概要包括来自于所述第一或第二搜索结果中的任一个的至少一个元素。
14.一种用于排列比较性web结果的计算设备(100),包括:
用于接收第一搜索查询的装置;
用于接收与所述第一搜索查询相关的第二搜索查询的装置;
用于处理所述第一搜索查询以产生第一搜索结果,并处理所述第二搜索查询以产生第二搜索结果的装置;以及
用于生成多个比较性搜索结果组的装置,其中每一组都包括一来自于所述第一搜索结果的元素和一来自于所述第二搜索结果的元素;
其中用于生成多个比较性搜索结果组的装置包括用于使用方程(1)的装置;
其中所述方程(1)为:
fq1,q2(p1,p2)=α·R(p1,q1)+β·R(p2,q2)+γ·S(p1\q1,p2\q2),p1∈SR1,p2∈SR2;
其中SR1表示对于第一搜索查询q1的第一搜索结果,SR2表示对于第二搜索查询q2的第二搜索结果,p1表示来自SR1的元素,p2表示来自SR2的元素,R表示一元素相对于查询的相关性,S表示两个元素之间的相似性,p1\q1表示在移除q1的项之后p1的文本内容,p2\q2表示在移除q2的项之后p2的文本内容,以及α,β和γ为参数,其中如果参数α和β被设为相等,则同等地对待与两个查询相对应的相关性测量,其中γ是折衷参数,用于平衡相关性测量和比较性测量。
15.如权利要求14所述的计算设备,其特征在于,至少一个搜索组是一对网页。
16.如权利要求15所述的计算设备,其特征在于,所述计算设备进一步包括:
用于提取所述对中的每一网页的至少一部分的装置,所述部分包括包括来自于所述第一或第二搜索结果中的任一个的至少一个元素。
17.如权利要求14所述的计算设备,其特征在于,所述计算设备进一步包括:
用于确定在生成的所述多个比较性搜索结果组的一子集包括类似信息的装置;以及
用于将所述子集群集成一个集群的装置。
CN2007800073320A 2006-03-01 2007-02-28 比较性web搜索 Expired - Fee Related CN101395605B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/365,961 2006-03-01
US11/365,961 US7571162B2 (en) 2006-03-01 2006-03-01 Comparative web search
PCT/US2007/005397 WO2007103191A2 (en) 2006-03-01 2007-02-28 Comparative web search

Publications (2)

Publication Number Publication Date
CN101395605A CN101395605A (zh) 2009-03-25
CN101395605B true CN101395605B (zh) 2011-08-03

Family

ID=38472563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800073320A Expired - Fee Related CN101395605B (zh) 2006-03-01 2007-02-28 比较性web搜索

Country Status (4)

Country Link
US (1) US7571162B2 (zh)
KR (1) KR20080106202A (zh)
CN (1) CN101395605B (zh)
WO (1) WO2007103191A2 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US8019742B1 (en) 2007-05-31 2011-09-13 Google Inc. Identifying related queries
KR100930455B1 (ko) * 2007-09-06 2009-12-08 엔에이치엔(주) 쿼리별 검색 컬렉션 생성 방법 및 시스템
US7974974B2 (en) 2008-03-20 2011-07-05 Microsoft Corporation Techniques to perform relative ranking for search results
US8051083B2 (en) * 2008-04-16 2011-11-01 Microsoft Corporation Forum web page clustering based on repetitive regions
US8731995B2 (en) * 2008-05-12 2014-05-20 Microsoft Corporation Ranking products by mining comparison sentiment
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
US8639682B2 (en) 2008-12-29 2014-01-28 Accenture Global Services Limited Entity assessment and ranking
US7831609B1 (en) 2009-08-25 2010-11-09 Vizibility Inc. System and method for searching, formulating, distributing and monitoring usage of predefined internet search queries
US8849785B1 (en) 2010-01-15 2014-09-30 Google Inc. Search query reformulation using result term occurrence count
CN102222076A (zh) * 2010-04-16 2011-10-19 无锡比比网信息有限公司 一种信息比较方法和装置
US9703895B2 (en) 2010-06-11 2017-07-11 Microsoft Technology Licensing, Llc Organizing search results based upon clustered content
CN101930459A (zh) * 2010-08-19 2010-12-29 百度在线网络技术(北京)有限公司 一种辅助用户设备实现网页的块状浏览的方法和网络设备
US20120203751A1 (en) * 2011-02-07 2012-08-09 International Business Machines Corporation Capture, Aggregate, and Use Search Activities as a Source of Social Data Within an Enterprise
US9015143B1 (en) 2011-08-10 2015-04-21 Google Inc. Refining search results
US20130167059A1 (en) * 2011-12-21 2013-06-27 New Commerce Solutions Inc. User interface for displaying and refining search results
US10896186B2 (en) * 2014-06-30 2021-01-19 Microsoft Technology Licensing, Llc Identifying preferable results pages from numerous results pages
KR101618965B1 (ko) 2014-07-15 2016-05-09 네이버 주식회사 검색 결과를 제공하기 위한 방법과 시스템, 기록 매체, 그리고 파일 배포 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6584204B1 (en) * 1997-12-11 2003-06-24 The Regents Of The University Of California Loudspeaker system with feedback control for improved bandwidth and distortion reduction
US6701309B1 (en) * 2000-04-21 2004-03-02 Lycos, Inc. Method and system for collecting related queries
US6832355B1 (en) * 1998-07-28 2004-12-14 Microsoft Corporation Web page display system

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220625A (en) * 1989-06-14 1993-06-15 Hitachi, Ltd. Information search terminal and system
US6119101A (en) * 1996-01-17 2000-09-12 Personal Agents, Inc. Intelligent agents for electronic commerce
US6999959B1 (en) * 1997-10-10 2006-02-14 Nec Laboratories America, Inc. Meta search engine
US6363373B1 (en) * 1998-10-01 2002-03-26 Microsoft Corporation Method and apparatus for concept searching using a Boolean or keyword search engine
US6381597B1 (en) * 1999-10-07 2002-04-30 U-Know Software Corporation Electronic shopping agent which is capable of operating with vendor sites which have disparate formats
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
US6684204B1 (en) 2000-06-19 2004-01-27 International Business Machines Corporation Method for conducting a search on a network which includes documents having a plurality of tags
US6738759B1 (en) * 2000-07-07 2004-05-18 Infoglide Corporation, Inc. System and method for performing similarity searching using pointer optimization
US6721736B1 (en) * 2000-11-15 2004-04-13 Hewlett-Packard Development Company, L.P. Methods, computer system, and computer program product for configuring a meta search engine
US7051014B2 (en) * 2003-06-18 2006-05-23 Microsoft Corporation Utilizing information redundancy to improve text searches
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
WO2006011819A1 (en) * 2004-07-30 2006-02-02 Eurekster, Inc. Adaptive search engine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6584204B1 (en) * 1997-12-11 2003-06-24 The Regents Of The University Of California Loudspeaker system with feedback control for improved bandwidth and distortion reduction
US6832355B1 (en) * 1998-07-28 2004-12-14 Microsoft Corporation Web page display system
US6701309B1 (en) * 2000-04-21 2004-03-02 Lycos, Inc. Method and system for collecting related queries

Also Published As

Publication number Publication date
US7571162B2 (en) 2009-08-04
WO2007103191A3 (en) 2007-11-01
WO2007103191A2 (en) 2007-09-13
CN101395605A (zh) 2009-03-25
KR20080106202A (ko) 2008-12-04
US20070208701A1 (en) 2007-09-06

Similar Documents

Publication Publication Date Title
CN101395605B (zh) 比较性web搜索
US10339184B2 (en) System and method for topic extraction and opinion mining
JP5550765B2 (ja) 関連タグの作成および利用
JP6027618B2 (ja) トピック・ベースのサーチ・ガイダンスの提供
US7392238B1 (en) Method and apparatus for concept-based searching across a network
US7680778B2 (en) Support for reverse and stemmed hit-highlighting
US20050065774A1 (en) Method of self enhancement of search results through analysis of system logs
US20060248458A1 (en) Method and apparatus for storing and retrieving data using ontologies
WO2008106667A1 (en) Searching heterogeneous interrelated entities
CA2727537A1 (en) System and method for compending blogs
CA2613048C (en) System and method for facilitating use of a selection guide
CN100511228C (zh) 依照自然语言查询进行文献检索的系统和方法
EP2192503A1 (en) Optimised tag based searching
CN110795627A (zh) 信息推荐方法及装置、电子设备
US20210342919A1 (en) System and method for cross catalog search
JP4819628B2 (ja) ドキュメントデータを検索する方法、サーバ、およびプログラム
US7730062B2 (en) Cap-sensitive text search for documents
Zhang et al. Informing the curious negotiator: Automatic news extraction from the internet
WO2001027712A2 (en) A method and system for automatically structuring content from universal marked-up documents
US20140222592A1 (en) Method and system of internet connected computers for organizing globally presented original data in the world wide web locally
JP2008065417A (ja) 連想語群検索装置、システム及びコンテンツマッチ型広告システム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム
KR101137056B1 (ko) 자동 상품모델 추천 로직을 이용한 상품 정보 등록 방법 및시스템
JP2010015203A (ja) Web検索支援方法、装置及びプログラム
EP1775662A1 (en) Method and computer system for allowing a user to access information content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150508

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150508

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110803

Termination date: 20210228