CN1811763A - 用于查询细化的系统和方法 - Google Patents

用于查询细化的系统和方法 Download PDF

Info

Publication number
CN1811763A
CN1811763A CNA2005101073833A CN200510107383A CN1811763A CN 1811763 A CN1811763 A CN 1811763A CN A2005101073833 A CNA2005101073833 A CN A2005101073833A CN 200510107383 A CN200510107383 A CN 200510107383A CN 1811763 A CN1811763 A CN 1811763A
Authority
CN
China
Prior art keywords
result
subquery
correlation
degree
initial search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005101073833A
Other languages
English (en)
Inventor
E·B·沃森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1811763A publication Critical patent/CN1811763A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的方法和系统。该方法可包括在搜索引擎内实现用于评估初始搜索结果的适当性的结果评估机制。该方法还可包括如果初始搜索结果被结果评估机制认为是不适当的,则制定至少一个替换查询,如子查询。该方法还可包括显示包括初始搜索结果和任何制定的替换查询的清单的结果信息。

Description

用于查询细化的系统和方法
技术领域
本发明的实施例涉及用于细化用户查询的技术,尤其涉及用于向用户提供适当的搜索结果的技术。
背景技术
通过因特网的其它网络,用户获取对分布在大量计算机上的大量信息的访问。为访问该巨大数量的信息,用户通常实现用户浏览器来访问搜索引擎。搜索引擎通过返回可通过因特网或其它网络获得的一个或多个信息源来响应输入的用户查询。
当前,当实现搜索引擎时,用户输入一个或多个关键词,并接收一组结果。取决于由用户输入的特定项,搜索引擎产生多个结果。在某些情况下,用户选择的项可能不导致搜索引擎定位期望的信息。具体地,当用户输入通常包含了太多信息的多词查询时,用户常常对由搜索引擎产生的不令人满意的或最小限度的结果感到失望。
在操作中,搜索引擎通常实现爬寻器(crawler)来访问多个网站,并在索引中储存对那些网站的引用。索引中的引用可基于一个或多个关键词来分类。搜索引擎也可将某些结果储存在高速缓存中。
当响应于用户查询时,搜索引擎可首先遍历该索引,以定位输入的查询项。然而,在许多情况下,索引中的项可能不对应于输入的查询项。期望信息可以基于同义项或关键词的替换组合来索引。由此,为接收期望的搜索结果,用户可在接收可接受的结果或任何结果之前实现反复试验技术并多次输入查询项。
当现有搜索引擎接收无法在索引中找到的用户输入查询项时,这些现有搜索引擎通常无法提供任何结果。某些搜索引擎将试图进行拼写纠正并重新发出搜索。然而,如果用户希望搜索输入项的变体,则通常要求用户用不同的输入项来重复搜索。
因此,需要一种用于处理多词搜索查询的解决方案,该解决方案通过基于所返回的搜索结果的数量或质量自发地拓宽输入查询来确保适当结果的供应。较佳地,这一解决方案将确保获得最大数量的相关结果。
发明内容
本发明的实施例针对一种用于响应于多词用户输入自动增强由搜索引擎产生的初始搜索结果的方法。该方法包括在搜索引擎内实现用于评估初始搜索结果的适当性的结果评估机制。该方法还包括如果初始搜索结果被该结果评估机制认为是不适当的,则制定至少一个替换查询,以及显示包括初始搜索结果以及任何制定的替换查询的清单的结果信息。
其它实施例针对一种用于响应于多词用户输入自动增强由搜索引擎产生的初始搜索结果的方法。该实施例包括将多词用户查询剖析成多个子查询,并通过确定子查询结果的数量或子查询结果的相关度或数量和相关度的组合来确定多个子查询的有效性。该方法还可包括显示初始搜索结果、子查询以及确定的子查询有效性。
在其它实施例中,可提供一种用于响应于多词用户输入自动增强由搜索引擎产生的初始搜索结果的系统。该系统可包括搜索引擎内用于评估初始结果的适当性的结果评估机制。该系统还可包括用于如果初始搜索结果由结果评估机制评估为不适当,则制定替换查询的替换查询确定机制。该系统还包括用于输出替换查询以及初始搜索结果以供显示的结果输出组件。
附图说明
本发明在下文中参考附图来详细描述,附图中:
图1是示出依照本发明的一个实施例的系统的综述的框图;
图2是示出其中可实现本发明的计算机化的环境的框图;
图3是示出依照本发明的一个实施例的查询细化组件的框图;
图4是示出依照本发明的一个实施例的结果评估机制的框图;以及
图5是示出依照本发明的一个实施例用于细化用户查询的方法的流程图。
具体实施方式
I.系统综述
图1是示出依照本发明的实施例的系统综述的框图。包括用户浏览器12的用户计算机10可通过网络20与搜索引擎200连接。搜索引擎200可包括,例如web爬寻器210、索引220、高速缓存230。搜索引擎200可包括其它标准组件,这些组件为简明起见被省略不作描述。搜索引擎200也可包括查询细化组件300。查询细化组件230可在搜索引擎200无法产生适当的结果时细化来自用户计算机10和用户浏览器12的用户查询。通常,搜索引擎200基于由web爬寻器210遍历的网站,如网站30来维护索引220。
本发明的实施例包括用于当搜索引擎无法产生适当的结果时细化用户查询以避免遇到僵局的方法和系统。结果可能由于在数量上太少或在相关度上太低而不适当。在操作中,系统和方法的实施例可确定结果是不适当的,并给予用户拓宽输入查询的建议。不适当的结果可以通过诸如对点击通过率的评估等已知技术来确定,或者可以基于阈值数来确定。
当结果被认为不合适时,查询细化组件300可将多词查询分解成子查询。在对每一子查询返回结果之后,查询细化组件300可捕捉前面的结果的相关度以及子查询的结果数量。最后,搜索引擎200可输出具有需要数量的结果或具有需要阈值相关度的所有结果集。
II.示例性操作环境
图2示出了适合在其中实现本系统和方法的查询细化的计算系统环境100的一个示例。计算系统环境100仅为合适的计算环境的一个示例,并非对本发明的使用范围或功能提出任何局限。也不应将计算环境100解释为对示例性操作环境100中示出的任一组件或其组合具有任何依赖或需求。
本发明在诸如由计算机执行的程序模块等计算机可执行指令的一般上下文环境中描述。一般而言,程序模块包括例程、程序、对象、组件、数据结构等等,它们执行特定的任务或实现特定的抽象数据类型。此外,本领域的技术人员可以理解,本发明可以用于其它计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器或可编程消费者电子设备、小型机、大型机等等。本发明也可以在分布式计算环境中实践,其中,任务由通过通信网络连接的远程处理设备来执行。在分布式计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质中。
参考图2,用于实现本发明的示例性系统包括计算机110形式的通用计算设备,包括处理单元120、系统存储器130以及将包括系统存储器的各类系统组件耦合至处理单元120的系统总线121。
计算机110通常包括各种计算机可读介质。作为示例而非局限,计算机可读介质包括计算机存储介质和通信介质。系统存储器130包括以易失性和/或非易失性存储器形式的计算机存储介质,如只读存储器(ROM)131和随机存取存储器(RAM)132。基本输入/输出系统133(BIOS)包括如在启动时帮助在计算机110内的元件之间传输信息的基本例程,通常储存在ROM 131中。RAM 132通常包含处理单元120立即可访问或者当前正在操作的数据和/或程序模块。作为示例而非局限,图2示出了操作系统134、应用程序135、其它程序模块136和程序数据137。
计算机110也可包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作示例,图2示出了对不可移动、非易失性磁介质进行读写的硬盘驱动器141、对可移动、非易失性磁盘152进行读写的磁盘驱动器151以及对可移动、非易失性光盘156,如CD ROM或其它光介质进行读写的光盘驱动器155。可以在示例性操作环境中使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括但不限于,磁带盒、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等等。硬盘驱动器141通常通过不可移动存储器接口,如接口140连接到系统总线121,磁盘驱动器151和光盘驱动器155通常通过可移动存储器接口,如接口150连接到系统总线121。
上文讨论并在图2出的驱动器及其相关联的计算机存储介质为计算机110提供了计算机可读指令、数据结构、程序模块和其它数据的存储。例如,在图2中,示出硬盘驱动器141储存操作系统144、应用程序145、其它程序模块146和程序数据147。注意,这些组件可以与操作系统134、应用程序135、其它程序模块136和程序数据137相同,也可以与它们不同。这里对操作系统144、应用程序145、其它程序模块146和程序数据147给予不同的标号来说明至少它们是不同的副本。用户可以通过输入设备,如键盘162和定位设备161(通常指鼠标、跟踪球或触摸板)向计算机110输入命令和信息。其它输入设备(未示出)可包括麦克风、操纵杆、游戏垫、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常通过耦合至系统总线的用户输入接口160连接至处理单元120,但是也可以通过其它接口和总线结构连接,如并行端口、游戏端口或通用串行总线(USB)。监视器191或其它类型的显示设备也通过接口,如视频接口190连接至系统总线121。除监视器之外,计算机也可包括其它外围输出设备,如扬声器197和打印机196,它们通过输出外围接口195连接。
本发明中的计算机110可以使用到一个或多个远程计算机,如远程计算机180的逻辑连接在网络化环境中操作。远程计算机180可以是个人计算机,并通常包括许多或所有相对于计算机110所描述的元件,尽管在图2中仅示出了存储器存储设备181。图2描述的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也可包括其它网络。
当在LAN网络环境中使用时,计算机110通过网络接口或适配器170连接至LAN 171。当在WAN网络环境中使用时,计算机110通常包括调制解调器172或用于通过WAN 173,如因特网建立通信的其它装置。调制解调器172可以是内置或外置的,通过用户输入接口160或其它适当的机制连接至系统总线121。在网络化环境中,相对于计算机110所描述的程序模块或其部分可储存在远程存储器存储设备中。作为示例,而非局限,图2示出远程应用程序185驻留在存储器设备181中。可以理解,示出的网络连接是示例性的,也可以使用在计算机之间建立通信链路的其它手段。
尽管未示出计算机110的许多其它内部组件,然而本领域的普通技术人员可以理解,这些组件和互连是公知的。因此,关于计算机110的内部构造的其它细节无需结合本发明来揭示。
III.本发明的系统和方法
如上所述,图1是示出依照本发明的实施例的系统综述的框图。诸如用户计算机10等包括用户浏览器12的用户计算机可通过网络20与搜索引擎200连接。网络20可以是因特网,或者可以是上文参考图2所描述的网络类型中的任一种。
搜索引擎200可包括web爬寻器210、web索引220和高速缓存230。web爬寻器通常在常规的基础上遍历网站30,并在索引220中索引网站30,以响应于用户输入查询而容易地访问结果。查询细化组件300可在搜索引擎200无法响应于用户查询产生适当的结果时评估和细化来自用户计算机10和用户浏览器12的用户查询。通常,当生成结果时,搜索引擎200维护所遍历的网站,诸如网站30的索引。所创建的索引220可以基于出现在所遍历的网站30中的关键词。
图3示出了依照本发明的一个实施例的查询细化组件300的进一步细节。查询细化组件300可包括结果评估机制310、子查询确定机制320、子查询搜索机制330以及结果输出组件340。结果评估机制310的一个实施例在图4中进一步示出。结果评估机制310可包括相关度确定组件312以及可调整阈值指示器314。相关度确定组件312可确定为用户输入查询所检索的结果是否相关,和/或产生的结果数量是否足够。相关度确定组件312可访问可调整阈值指示器314以作出这一确定。例如,可调整阈值指示器314可储存预设的阈值结果数,诸如10个结果,和/或预设的相关度指示器或得分阈值。相关度确定组件312可基于诸如点击通过率等可跟踪相关度因素来评估相关度。存在用于基于用户行为模式来确定相关度的有关技术。相关度确定组件312可实现用于确定相关度的任何已知技术。
如果用户输入查询不产生满足预定阈值的结果,则结果评估机制310可通知子查询确定机制从输入查询创建子查询。子查询确定机制320将用户输入查询剖析成单独的子查询。子查询搜索机制然后可搜索索引220,或提示搜索引擎200在索引220中搜索匹配的结果。产生的结果可再一次由结果评估机制310在转发到结果输出组件340以供输出到用户计算机10之前评估。
子查询确定机制320可通过实现同义词典以提供同义词来另外补充其替换子查询。通常,由用户输入的相可以用替换同义词来索引。因此,在子查询确定机制320内提供同义词典可增强结果的相关度。
结果评估机制310可在接收到为每一子查询返回的结果之后捕捉前面的结果的相关度,例如前三个结果的相关度,并可另外对查询的结果数量进行计数。结果输出组件340随后可显示搜索的所有子查询以及所示的结果数量,或者可替换地显示具有高于预设阈值的相关度索引的查询。
作为一个示例,如果输入查询是“mini blue ipod”(迷你型蓝色的ipod),且结果评估机制310确定从该多词查询产生的结果不是适当的,则查询细化组件300可通过使用子查询确定机制320、子查询搜索介质330和结果输出组件340将具有所接收结果数量的替换查询输出到UI。例如,响应于对于“blue mini ipod”(蓝色的迷你型ipod)的用户查询,除对输入查询“blue mini ipod”的结果之外,结果输出组件340可输出以下:
“You can try″blue ipod″~50k results or″Mini Ipod″~15k results”
(你可以尝试“blue ipod”,大约有50000个结果,或者“Mini Ipod”,大约有15000个结果)
这一示例示出替换子查询以及由每一替换子查询产生的结果数量。子查询确定机制320将用户输入查询“blue mini ipod”剖析成“blue ipod”和“mini ipod”。子查询确定机制320不选择短语“blue mini”,因为由两个形容词组成的短语的结果的相关度可能比上述两个短语的相关度要低得多,在上述两个短语中,其每一个都包括一个名词和一个形容词。
或者,结果输出组件340可产生附加的相关度得分而非结果数量或者同时附加了相关度得分和结果数量的替换子查询。如上所述,触发子查询搜索和建议的值可以是可配置或可调整的。这些值可以由搜索引擎选择,并可在可调整阈值指示器314中设置。在替换实施例中,搜索引擎200可允许用户主动调整阈值。在高系统负载的情况下,查询细化组件300可被手动或自动停用。停用选项防止对查询细化组件300的使用导致对搜索引擎用户不可接受的等待时间。
搜索引擎200可确定多少人点击各种提供的选择,并基于点击数和相关度级别来调整阈值。如果用户仅点击具有较高得分的项目或结果,则系统可基于点击重设该阈值。由此,由所选择的技术确定的相关度触发对选项的显示。
上述组件可以在许多环境中使用。在一个示例性环境中,查询细化组件300可在在线购物环境中使用。例如,用户可输入诸如“Digital Camera,Price<$200,manufacturer=cannon”(数码相机,价格<$200,制造商=佳能)的查询。如果该查询返回不适当的结果集,则可实现查询细化组件300以拓宽查询,来包括例如200和250美元之间的佳能相机或由其它公司制造的200美元以下的相机。子查询确定机制320可实现系统来确定放松哪一准则。在某些情况下,放松价格可产生更多结果,且结果具有较高的相关度得分。在其它情况下,品牌或其它准则可以是要放松的适当准则。
图5是示出依照本发明的一个实施例用于查询细化的方法的流程图。该方法在步骤500开始,搜索引擎200在步骤502接收并处理输入的用户多词查询。在步骤504,查询细化组件300评估处理步骤的结果。如果结果在步骤506被认为是适当的,则搜索引擎200在步骤508显示结果。如上所述,适当性可基于所产生的结果的数量、质量或数量和质量的组合来确定。
如果结果在步骤506不被认为是适当的,则查询细化组件300在步骤510将查询划分成子查询。在步骤512,查询细化组件300处理子查询。在步骤514,查询细化组件300评估子查询处理的结果,并选择合适的结果。在步骤516,搜索引擎200显示所有选中的结果,并且该过程在步骤518结束。
尽管此处示出并详细描述了本发明的特定实施例,然而应当理解,可以对本发明作出各种改变和修改而不脱离本发明的精神和范围。此处所描述的实施例在所有方面都旨在说明性而非限制性的。本发明所属领域的技术人员可以明白替换实施例而不脱离其范围。
从以上内容可以看到,本发明较好地适用于达到上述的所有目的和目标,以及本系统和方法中明显且固有的其它优点。可以理解,某些特征和子组合是实用的,并可在不引用其它特征和子组合的情况下使用。这是所构想的,且落入所附权利要求书的范围之内。

Claims (20)

1.一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的方法,所述方法包括:
在所述搜索引擎内实现用于评估所述初始搜索结果的适当性的结果评估机制;
如果所述初始搜索结果被所述结果评估机制认为是不适当的,则制定至少一个替换查询;以及
显示包括所述初始搜索结果以及任何制定的替换查询的清单的结果信息。
2.如权利要求1所述的方法,其特征在于,实现所述结果评估机制包括评估所述初始结果的数量和相关度中的至少一个。
3.如权利要求1所述的方法,其特征在于,制定至少一个替换查询包括从所述多词用户查询中制定至少一个子查询。
4.如权利要求3所述的方法,其特征在于,还包括制定多个子查询。
5.如权利要求4所述的方法,其特征在于,还包括确定子查询结果的数量和相关度中的至少一个。
6.如权利要求5所述的方法,其特征在于,还包括显示所述子查询结果的数量和相关度中的至少一个。
7.如权利要求1所述的方法,其特征在于,还包括如果所述初始搜索结果落在相关度和数量阈值之一以下,则制定所述至少一个查询。
8.如权利要求7所述的方法,其特征在于,还包括提供用于触发所述至少一个替换查询的制定的可调整阈值。
9.如权利要求1所述的方法,其特征在于,还包括在高使用率周期期间消除所述替换查询的制定。
10.一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的方法,所述方法包括:
将所述多词用户查询剖析成多个子查询;
通过确定子查询结果的数量和子查询结果的相关度中的一个来确定所述多个子查询的有效性;以及
显示所述初始搜索结果。
11.如权利要求10所述的方法,其特征在于,还包括显示所述子查询和所确定的子查询的有效性。
12.如权利要求10所述的方法,其特征在于,还包括仅显示具有超过预先选择的阈值的确定的有效性值的子查询。
13.如权利要求10所述的方法,其特征在于,还包括通过评估所述初始搜索结果的数量和相关度中的一个来评估所述初始搜索结果的有效性。
14.如权利要求13所述的方法,其特征在于,还包括如果所述初始搜索结果落在相关度和数量阈值中的一个以下,则剖析所述多词查询。
15.如权利要求14所述的方法,其特征在于,还包括显示所述子查询结果的数量和相关度中的至少一个。
16.如权利要求14所述的方法,其特征在于,还包括提供用于触发所述多词查询的剖析的可调整阈值。
17.一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的系统,所述系统包括:
所述搜索引擎内用于评估所述初始搜索结果的适当性的结果评估机制;
用于在所述初始搜索结果被所述结果评估机制评估为不适当时制定替换查询的替换查询确定机制;以及
用于输出所述替换查询以及所述初始搜索结果以供显示的结果输出组件。
18.如权利要求17所述的系统,其特征在于,所述结果评估机制包括用于评估所述初始结果的数量和相关度的至少一个的机制。
19.如权利要求17所述的系统,其特征在于,所述替换查询制定机制从所述多词用户查询制定至少一个子查询。
20.如权利要求19所述的系统,其特征在于,所述子查询评估机制包括用于确定子查询结果的数量和相关度中的至少一个的组件。
CNA2005101073833A 2005-01-25 2005-12-26 用于查询细化的系统和方法 Pending CN1811763A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/041,418 US20060167842A1 (en) 2005-01-25 2005-01-25 System and method for query refinement
US11/041,418 2005-01-25

Publications (1)

Publication Number Publication Date
CN1811763A true CN1811763A (zh) 2006-08-02

Family

ID=36262881

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005101073833A Pending CN1811763A (zh) 2005-01-25 2005-12-26 用于查询细化的系统和方法

Country Status (7)

Country Link
US (1) US20060167842A1 (zh)
EP (1) EP1684196A1 (zh)
JP (1) JP2006209757A (zh)
KR (1) KR20060085908A (zh)
CN (1) CN1811763A (zh)
BR (1) BRPI0505638A (zh)
MX (1) MXPA06000330A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104011713A (zh) * 2011-12-28 2014-08-27 乐天株式会社 检索装置、检索方法、检索程序以及记录介质
CN106959992A (zh) * 2006-08-31 2017-07-18 高通股份有限公司 使用基于用户的偏向获得或提供搜索结果的方法及设备

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
US8630984B1 (en) 2003-01-17 2014-01-14 Renew Data Corp. System and method for data extraction from email files
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8065277B1 (en) 2003-01-17 2011-11-22 Daniel John Gardner System and method for a data extraction and backup database
US7401072B2 (en) * 2003-06-10 2008-07-15 Google Inc. Named URL entry
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results
US8069151B1 (en) 2004-12-08 2011-11-29 Chris Crafford System and method for detecting incongruous or incorrect media in a data recovery process
US8527468B1 (en) 2005-02-08 2013-09-03 Renew Data Corp. System and method for management of retention periods for content in a computing system
US20060242130A1 (en) * 2005-04-23 2006-10-26 Clenova, Llc Information retrieval using conjunctive search and link discovery
US7962462B1 (en) 2005-05-31 2011-06-14 Google Inc. Deriving and using document and site quality signals from search query streams
US7984039B2 (en) * 2005-07-14 2011-07-19 International Business Machines Corporation Merging of results in distributed information retrieval
US7321892B2 (en) * 2005-08-11 2008-01-22 Amazon Technologies, Inc. Identifying alternative spellings of search strings by analyzing self-corrective searching behaviors of users
US8903810B2 (en) 2005-12-05 2014-12-02 Collarity, Inc. Techniques for ranking search results
US8429184B2 (en) 2005-12-05 2013-04-23 Collarity Inc. Generation of refinement terms for search queries
US7483894B2 (en) * 2006-06-07 2009-01-27 Platformation Technologies, Inc Methods and apparatus for entity search
US8150827B2 (en) * 2006-06-07 2012-04-03 Renew Data Corp. Methods for enhancing efficiency and cost effectiveness of first pass review of documents
US20100198802A1 (en) * 2006-06-07 2010-08-05 Renew Data Corp. System and method for optimizing search objects submitted to a data resource
US20080189273A1 (en) * 2006-06-07 2008-08-07 Digital Mandate, Llc System and method for utilizing advanced search and highlighting techniques for isolating subsets of relevant content data
US7849077B2 (en) * 2006-07-06 2010-12-07 Oracle International Corp. Document ranking with sub-query series
US8442972B2 (en) 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
US20080091675A1 (en) * 2006-10-13 2008-04-17 Wilson Chu Methods and apparatuses for modifying a search term utilized to identify an electronic mail message
US8768961B2 (en) 2007-03-09 2014-07-01 At&T Labs, Inc. System and method of processing database queries
US7809714B1 (en) 2007-04-30 2010-10-05 Lawrence Richard Smith Process for enhancing queries for information retrieval
US20090055242A1 (en) * 2007-08-24 2009-02-26 Gaurav Rewari Content identification and classification apparatus, systems, and methods
US20090055368A1 (en) * 2007-08-24 2009-02-26 Gaurav Rewari Content classification and extraction apparatus, systems, and methods
US8655862B1 (en) * 2007-10-17 2014-02-18 Google Inc. System and method for query re-issue in search engines
CN101159967B (zh) * 2007-10-29 2011-08-31 中国移动通信集团设计院有限公司 一种将路测数据用于传播模型校正的方法及装置
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
US7991780B1 (en) 2008-05-07 2011-08-02 Google Inc. Performing multiple related searches
US8438178B2 (en) * 2008-06-26 2013-05-07 Collarity Inc. Interactions among online digital identities
US8214350B1 (en) * 2009-01-02 2012-07-03 Google Inc. Pre-computed impression lists
US8316037B1 (en) * 2009-01-30 2012-11-20 Google Inc. Providing remedial search operation based on analysis of user interaction with search results
US8321447B2 (en) * 2009-03-02 2012-11-27 Winshuttle, Llc Adaptive query throttling system and method
US8412699B1 (en) * 2009-06-12 2013-04-02 Google Inc. Fresh related search suggestions
US8180768B2 (en) * 2009-08-13 2012-05-15 Politecnico Di Milano Method for extracting, merging and ranking search engine results
WO2011075610A1 (en) 2009-12-16 2011-06-23 Renew Data Corp. System and method for creating a de-duplicated data set
US8875038B2 (en) 2010-01-19 2014-10-28 Collarity, Inc. Anchoring for content synchronization
US10546311B1 (en) 2010-03-23 2020-01-28 Aurea Software, Inc. Identifying competitors of companies
US9760634B1 (en) 2010-03-23 2017-09-12 Firstrain, Inc. Models for classifying documents
US10643227B1 (en) 2010-03-23 2020-05-05 Aurea Software, Inc. Business lines
US8463790B1 (en) 2010-03-23 2013-06-11 Firstrain, Inc. Event naming
US8370345B2 (en) 2010-04-09 2013-02-05 International Business Machines Corporation Snippet based proximal search
US20120158765A1 (en) * 2010-12-15 2012-06-21 Microsoft Corporation User Interface for Interactive Query Reformulation
US9251185B2 (en) 2010-12-15 2016-02-02 Girish Kumar Classifying results of search queries
US8983995B2 (en) 2011-04-15 2015-03-17 Microsoft Corporation Interactive semantic query suggestion for content search
DE102011101146A1 (de) * 2011-05-11 2012-11-15 Abb Technology Ag Mehrstufiges Verfahren und Einrichtung zum interaktiven Auffinden von Gerätedaten eines Automatisierungssystem
US8965882B1 (en) 2011-07-13 2015-02-24 Google Inc. Click or skip evaluation of synonym rules
US8782042B1 (en) 2011-10-14 2014-07-15 Firstrain, Inc. Method and system for identifying entities
US8862605B2 (en) * 2011-11-18 2014-10-14 International Business Machines Corporation Systems, methods and computer program products for discovering a text query from example documents
US8909627B1 (en) 2011-11-30 2014-12-09 Google Inc. Fake skip evaluation of synonym rules
US20130173662A1 (en) * 2012-01-03 2013-07-04 International Business Machines Corporation Dependency based prioritization of sub-queries and placeholder resolution
US8965875B1 (en) 2012-01-03 2015-02-24 Google Inc. Removing substitution rules based on user interactions
US9152698B1 (en) 2012-01-03 2015-10-06 Google Inc. Substitute term identification based on over-represented terms identification
US9141672B1 (en) 2012-01-25 2015-09-22 Google Inc. Click or skip evaluation of query term optionalization rule
US8959103B1 (en) * 2012-05-25 2015-02-17 Google Inc. Click or skip evaluation of reordering rules
US8977613B1 (en) 2012-06-12 2015-03-10 Firstrain, Inc. Generation of recurring searches
US9146966B1 (en) 2012-10-04 2015-09-29 Google Inc. Click or skip evaluation of proximity rules
US10592480B1 (en) 2012-12-30 2020-03-17 Aurea Software, Inc. Affinity scoring
US9519703B2 (en) * 2013-03-20 2016-12-13 International Business Machines Corporation Refining search results for a compound search query
US20150066594A1 (en) * 2013-08-27 2015-03-05 New York University System, method and computer accessible medium for determining one or more effects of rankings on consumer behavior
JP6380601B2 (ja) * 2017-04-17 2018-08-29 株式会社Jvcケンウッド 情報選択装置、情報選択方法、端末装置およびコンピュータプログラム
US10387515B2 (en) * 2017-06-08 2019-08-20 International Business Machines Corporation Network search query
US10380211B2 (en) 2017-06-16 2019-08-13 International Business Machines Corporation Network search mapping and execution
US11055355B1 (en) * 2018-06-25 2021-07-06 Amazon Technologies, Inc. Query paraphrasing
WO2023106608A1 (ko) * 2021-12-06 2023-06-15 삼성전자 주식회사 개인정보 침해를 방지하기 위한 빅데이터 분석 장치, 동작 방법 및 비-일시적 컴퓨터 판독가능 저장 매체

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3007375B2 (ja) * 1990-04-02 2000-02-07 株式会社リコー 文書情報検索装置
JP2792287B2 (ja) * 1991-10-31 1998-09-03 日本電気株式会社 情報検索装置
DE69423838T2 (de) * 1993-09-23 2000-08-03 Xerox Corp., Rochester Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen
JP3521176B2 (ja) * 1997-09-26 2004-04-19 株式会社東芝 検索方法および検索装置
US7124129B2 (en) * 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6363377B1 (en) * 1998-07-30 2002-03-26 Sarnoff Corporation Search data processor
JP2002024261A (ja) * 2000-07-07 2002-01-25 Denso Corp 情報検索システム
US6647383B1 (en) * 2000-09-01 2003-11-11 Lucent Technologies Inc. System and method for providing interactive dialogue and iterative search functions to find information
US7206778B2 (en) * 2001-12-17 2007-04-17 Knova Software Inc. Text search ordered along one or more dimensions
EP1353279A1 (en) * 2002-04-12 2003-10-15 Bouygues S.A. Method and system for computer-aided data-driven adaptation of database queries
US20040078251A1 (en) * 2002-10-16 2004-04-22 Demarcken Carl G. Dividing a travel query into sub-queries
US7836391B2 (en) * 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959992A (zh) * 2006-08-31 2017-07-18 高通股份有限公司 使用基于用户的偏向获得或提供搜索结果的方法及设备
CN104011713A (zh) * 2011-12-28 2014-08-27 乐天株式会社 检索装置、检索方法、检索程序以及记录介质

Also Published As

Publication number Publication date
US20060167842A1 (en) 2006-07-27
MXPA06000330A (es) 2006-07-24
EP1684196A1 (en) 2006-07-26
KR20060085908A (ko) 2006-07-28
JP2006209757A (ja) 2006-08-10
BRPI0505638A (pt) 2006-09-19

Similar Documents

Publication Publication Date Title
CN1811763A (zh) 用于查询细化的系统和方法
US7966337B2 (en) System and method for prioritizing websites during a webcrawling process
TWI486800B (zh) 用於使用編輯距離以及文件資訊的搜尋結果排序之系統與方法
US7953740B1 (en) Detection of behavior-based associations between search strings and items
US7962463B2 (en) Automated generation, performance monitoring, and evolution of keywords in a paid listing campaign
US10354308B2 (en) Distinguishing accessories from products for ranking search results
US8090621B1 (en) Method and system for associating feedback with recommendation rules
US7574426B1 (en) Efficiently identifying the items most relevant to a current query based on items selected in connection with similar queries
US8290932B2 (en) Information repository search system
US20050210042A1 (en) Methods and apparatus to search and analyze prior art
US10606556B2 (en) Rule-based system and method to associate attributes to text strings
US20080306819A1 (en) System and method for shaping relevance scores for position auctions
US8126877B2 (en) Arranging search engine results
US20130110830A1 (en) Ranking of entity properties and relationships
US20070226202A1 (en) Generating keywords
JP2008511057A (ja) エンドユーザの情報要求に応答するための方法及び装置
CN104142999A (zh) 搜索结果展示方法及装置
JP2009521750A (ja) コンテキストを決定するためのコンテンツの分析およびコンテキストに基づく関係のあるコンテンツの供給
WO2012051470A1 (en) Systems and methods for using a behavior history of a user to augment content of a webpage
US20100082628A1 (en) Classifying A Data Item With Respect To A Hierarchy Of Categories
US9251262B1 (en) Identifying media queries
US8224693B2 (en) Advertisement selection based on key words
Sayed et al. Jointly modeling relevance and sensitivity for search among sensitive content
US20090187503A1 (en) Generating content to satisfy underserved search queries
US7788284B2 (en) System and method for knowledge based search system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20060802