CN1930566A - 用于使用倾向分析进行搜索查询处理的系统和方法 - Google Patents

用于使用倾向分析进行搜索查询处理的系统和方法 Download PDF

Info

Publication number
CN1930566A
CN1930566A CNA2004800367547A CN200480036754A CN1930566A CN 1930566 A CN1930566 A CN 1930566A CN A2004800367547 A CNA2004800367547 A CN A2004800367547A CN 200480036754 A CN200480036754 A CN 200480036754A CN 1930566 A CN1930566 A CN 1930566A
Authority
CN
China
Prior art keywords
inquiry
user
dimension
search
trend information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800367547A
Other languages
English (en)
Other versions
CN100401292C (zh
Inventor
希亚姆·卡普尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fly upward Management Co., Ltd
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN1930566A publication Critical patent/CN1930566A/zh
Application granted granted Critical
Publication of CN100401292C publication Critical patent/CN100401292C/zh
Anticipated expiration legal-status Critical
Active legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于处理搜索请求的系统和方法,包括分析所接收到的查询以提供被搜索信息的更完善理解。在一个实施例中,查询被解析为单元,其中可能包括查询的一个或多个单词或标记,并且单元在概念网络中相关。通过沿着感兴趣的维度将查询分类成子集和比较用于不同子集的概念网络来执行倾向分析。倾向信息可用于增强自动搜索工具对后续接收到的查询的响应。

Description

用于使用倾向分析进行搜索 查询处理的系统和方法
本发明涉及以下共同转让的待审美国专利申请:于2003年4月4日提交的题为“Universal Interface System and Methods”的临时申请第60/460,222号;以及于2003年10月9日提交的题为“Systemand Methods for Search Processing Using Clustering of Units”的临时申请第60/510,220号。所有这些申请的披露均结合于此作为参考。
背景技术
随着互联网和用户通过万维网(网络)可用的大量网页及媒体内容的出现,需要向用户提供用于从网络过滤和获取期望信息的改进的方法。已开发了搜索系统和程序以满足用户对获取期望信息的需要。这些技术,例如,可以通过Yahoo!、Google和其它站点来访问。典型地,用户输入查询并且搜索程序返回一个或多个关于查询的链接(在搜索网络的情况下)、文件和/或参考资料(在不同搜索资料库的情况下)。返回的链接可能与用户实际上寻找的内容紧密相关,或者它们可能与其完全不相关。查询结果的“相关度(relatedness)”可能部分地为所输入的实际查询和所使用的搜索系统(下层收集系统)的鲁棒性(robustness)的函数。相关度可以由用户主观地确定或者由用户可能一直寻找的内容客观地确定。
用户输入的查询典型地由一个或多个单词(word)构成。例如,“hawaii”是一个查询,“new york city”也是如此,并且“new yorkcity law enforcement”也是如此。同样地,查询作为整体对于人的大脑不是完整的。换句话说,人们不按照查询自然地进行思考。它们是通过搜索引擎或查寻库目录的需要部分强加的人工构造。人们也不根据单个单词自然地进行思考。人们根据自然概念进行思考。例如,就由单词数目衡量的长度而言,“hawaii”和“new york city”是很不同的查询,但是它们共享一个重要的特征:它们各由一个概念构成。然而,查询“new york city law enforcement”是不同的,因为它由两个截然不同的概念“new york city”和“law enforcement”构成。
人们还按照概念之间的逻辑关系进行思考。例如,“lawenforcement”和“police”是相关概念,因为警察局是法律实施的重要机构;键入这些概念之一的用户可能对与其它概念相关的站点感兴趣,即使那些站点不包括用户正巧键入的特定单词或者短语。作为这种思考模式的结果,人们生来通过输入一个或多个自然概念建立查询,不单单是单个单词的可变长度序列,并且通常查询不包括用户可能知道的全部相关概念。同样,用户意图未必反映在查询的单个单词中。例如,“law enforcement”是一个概念,而分开的单词“law”和“enforcement”不单独地传达与单词组合时相同的用户意图。
任何主要搜索提供方的当前技术,例如,MSN、Google或任何其它主要搜索引擎站点,均不以创建它们的人们的相同方式理解查询。例如,通常现存的搜索引擎搜索用户所输入的确切单词或短语,不是搜索潜在的自然概念或实际上在用户头脑中的相关概念。这可能是阻止搜索提供方识别用户的意图并且提供最佳的搜索结果和内容的最重要的原因。
正如所看到的,需要改进搜索和接口技术来帮助提供更符合用户可能感兴趣的实际概念的结果并且增强用户的体验。
发明内容
本发明的实施例提供了一种用于处理搜索请求的系统和方法,包括分析所接收到的查询以提供所搜索的信息的更完善的理解。查询被解析成单元,其可能包括例如,查询的一个或多个单词或标记(token)。对查询的单元表示执行进一步分析以检测模式,例如在不同查询中使用的单元的类似组合。在查询中出现的单元连同第二(secondary)单元的类似组被分组成群集(cluster),并且可以根据与每个单元有关的第二单元的相似程度来对两个群集成员之间的关系分配权重。
根据本发明的一个方面,对于查询的不同子集进行重复群集,其中,查询按照一个或多个维度被分类为子集。在一个实施例中,维度包括时间、个人特征或者用户的人口统计状况(demographics)(例如,年龄、性别、已知的兴趣、或用户简介)、地理维度(例如,物理位置或IP地址)、或表示查询之前的用户活动或内容的垂直维度(例如,当输入查询时用户在网站的何处)。这为查询的每个子集生成子集专用群集(或概念网络)。通过将相应子集专用概念网络与至少两个子集进行比较,生成关于单元或群集的倾向信息。
下面的详细描述与附图一起,将为本发明的性质和优点提供更好的理解。
附图说明
图1是根据本发明的实施例的信息检索和通信系统的简化高层框图。
图2是根据本发明的实施例的用于传输媒体内容的信息检索和通信网络的简化框图。
图3是根据本发明的实施例的查询处理引擎的简化框图。
图4是根据本发明的实施例的用于执行倾向分析的过程的流程图。
图5是根据本发明的实施例的包括单元词典和相关处理信息的系统(包括某些方面的查询处理引擎)的简化框图。
图6是示出作为一天中时间的函数的查询频率的倾向数据的图表。
具体实施方式
图1示出了根据本发明的实施例的包括客户机系统20的信息检索和通信网络10的总体图。在计算机网络10中,客户机系统20通过互联网40或其它通信网络(例如,通过任何LAN或WAN连接)连接到任意数目的服务器系统501至50N。将在此描述,根据本发明,将客户机系统20配置成与任意的服务器系统501至50N进行通信,例如,访问、接收、检索和显示媒体内容和其它信息(例如网页)。
在图1所示的系统中的若干组件包括在此不必详细解释的常规的、众所周知的组件。例如,客户机系统20可以包括桌面个人计算机、工作站、便携式计算机、个人数字助理(PDA)、移动电话、或任何无线应用协议(WAP)装置或任何能够直接或间接连接到互联网的其他计算装置。客户机系统20典型地运行浏览程序,例如微软的Internet ExplorerTM浏览器、Netscape NavigatorTM浏览器、MozillaTM浏览器、OperaTM浏览器、或在移动电话、PDA或其它无线装置的情况下的WAP浏览器等,允许客户机系统20的用户通过互联网40从服务器系统501至50N访问、处理和观看浏览器可用的信息和网页。客户机系统20典型地还包括一个或多个用户接口装置22,例如键盘、鼠标、触摸屏、笔等,用来与图形用户界面(GUI)进行互动,GUI以及由服务器系统501至50N或其它服务器提供的页面、表格和其它信息,由浏览器提供在显示器(例如,监控器屏幕、LCD显示器,等)上。本发明适于用在互联网上,互联网指网络的特定全球互联网络。然而,应当理解,可以使用其它网络或互联网(例如内联网、外联网、虚拟个人网络(VPN)、基于非TCP/IP的网络、任何LAN或WAN等)代替。
根据一个实施例,客户机系统20和其所有的组件是能够使用中央处理器单元(例如Intel PentiumTM处理器、AMD AthlonTM处理器等)或多个处理器进行运行以及使包括计算机代码的应用程序运行的操作器。在此描述的用于操作和配置客户机系统20以进行通信、处理和显示数据和媒体内容的计算机代码被优选地下载并存储到硬盘上,但是整个程序代码,或其多个部分也可以被存储在众所周知的任何其它易失性或非易失性存储介质或装置中(例如ROM或RAM),或提供在可以存储程序代码的任何媒体上,例如光盘(CD)介质、数字通用盘(DVD)介质、软盘等。另外,整个程序代码或其一部分可以从软件源传输和下载,例如,通过互联网从服务器系统501至50N之一至客户机系统20,或通过任何其它网络连接(例如,外联网、VPN、LAN、或其它常规的网络)使用任何通信媒介和协议(例如,TCP/IP、HTTP、HTTPS、以太网、或其它传统媒体和协议)来传输。
应当意识到用于本发明的实现方面的计算机代码可以是C、C++、HTML、XML、Java、JavaScript等代码,或任何其它适合的脚本语言(例如,VBScript),或任何其它适合的编程语言,其可以在客户机系统20上执行或被编译,以在客户机系统20上执行。在某些实施例中,没有代码被下载到客户机系统20,并且所需的代码由服务器执行,或执行已经存在于客户机系统20的代码。
图2示出了根据本发明的实施例的用于传输媒体内容的另一个信息检索和通信网络110。如所示,网络110包括客户机系统120、一个或多个内容服务器系统150、和搜索服务器系统160。在网络110中,客户机系统120通过互联网140或其它通信网络可通信地连接到服务器系统150和160。如上所述,客户机系统120和其组件被配置成通过互联网140或其它通信网络与服务器系统150和160以及其它服务器系统进行通信。
根据一个实施例,在客户机系统120上执行的客户机应用程序(以模块125表示)包括用于控制客户机系统120和其组件以与服务器系统150和160进行通信和处理及显示从那里接收的数据内容的指令。客户机应用程序125优选地从软件源传输和下载到客户机系统120,例如远程服务器系统(例如,服务器系统150、服务器系统160或其它远程服务器系统),虽然客户机应用程序模块125可以被提供在如上所述的任何软件存储介质(例如软盘、CD、DVD、等)上。例如,在一方面,客户机应用程序模块125在HTML封装器(wrapper)中可以通过互联网140提供给客户机系统120,其中,HTML封装器包括用于在各种对象、框和窗口中操作数据和提供数据的各种控件,例如,诸如嵌入式JavaScript或Active X控件。
另外,客户机应用程序模块125包括用于处理数据和媒体内容的各种软件模块,例如用于处理搜索请求和搜索结果数据的特定搜索模块126,用于在文本和数据框和活动窗口(例如,浏览器窗口和对话框)中提供数据和媒体内容的用户界面(interface)模块127,用于与在客户机120上执行的各种应用程序进行连接和通信的应用程序界面模块128。根据本发明的多个方面,应用程序界面模块128被优选地配置成与客户机系统120相连接,在客户机系统120上执行的各种应用程序的实例包括各种电子邮件应用程序、即时通信(IM)应用程序、浏览器应用程序、文档管理应用程序和其它应用程序。另外,界面模块127可能包括浏览器,例如在客户机系统120上配置的缺省浏览器或不同的浏览器。在某些实施例中,客户机应用程序模块125提供第60/460,222号临时申请所描述的通用搜索界面的特征。
根据一个实施例,搜索服务器系统160用于向客户机系统120提供搜索结果数据和媒体内容,并且例如,响应于在搜索服务器系统160提供的搜索结果页面中所选择的链接,内容服务器系统150用于向客户机系统120提供数据和媒体内容(例如网页)。在某些改变中,搜索服务器系统160也返回内容,或者替代地,链接和/或内容的其它引用。
在一个实施例中,搜索服务器系统160引用各种收集技术,用于使用例如页、到页面的链接、表示所索引页面的内容的数据等来填充一个或多个页面索引。这些收集技术包括自动网络爬行者(crawlers)、蜘蛛等,以及用于在分层结构中分类和排列网页的手动或半自动分类算法和界面。在某些方面,搜索服务器系统16也配置有用于处理和排列网页的与搜索相关的算法。搜索服务器系统160也优选地被用于以查询日志文件的形式记录用户查询活动。
搜索服务器系统160用于响应于从客户机系统(特别是搜索模块126)接收到的各种搜索请求来提供数据。服务器系统150和160可能是单个组织的部分,例如,诸如由Yahoo!公司提供给用户的分布式服务器系统,或者它们可能是不同组织的部分。内容服务器系统150和搜索服务器系统160均包括至少一个服务器和一个相关的数据库系统,并且可能包括多个服务器和相关数据库系统,并且虽然以单个框示出,但可以在地理上分散。例如,搜索服务器系统160的所有服务器可能是彼此靠近放置(例如,位于单个建筑物或校园中的服务器中心),或者它们可能分散在彼此远离的位置(例如,位于城市A中的一个或多个服务器和位于城市B中的一个或多个服务器)。
如在此所用的,“服务器系统”典型地包括一个或多个逻辑上和/或物理上连接的本地或跨越一个或多个地理位置分布的服务器。如在本领域中所熟知的,“服务器”通常包括计算机系统和相关的存储系统和数据库应用程序。
根据一个实施例,搜索服务器系统160配置有一个或多个页面索引和用于响应于从客户机系统120接收的搜索查询来访问页面索引和提供搜索结果给用户的算法。在某些方面,搜索服务器系统160另外用于响应于来自客户机系统120的搜索结果,来提供增强的搜索查询分析和群集功能。在其它改变中,搜索服务器系统160包括内容服务器系统150的全部内容和功能。
在一个实施例中,在搜索服务器系统160上执行的过程执行搜索查询和/或搜索结果的上下文分析并且用分组的搜索结果进行响应,以反映不同上下文。根据预期的上下文,许多搜索术语可能具有不同的含义。例如,如果用户使用术语“Java”执行搜索,预期的上下文不清楚。用户可能对Java计算机语言感兴趣,可能对印度尼西亚的Java岛感兴趣,或对咖啡感兴趣(其经常被通俗地称为java)。本发明有利地分析搜索查询和/或结果,并且为了显示在用户计算机120上,在上下文中将结果分组。例如,响应于搜索术语“Java”,某些搜索服务器系统160的实施例返回被分组成三个(如果识别其它上下文,可能更多)上下文或单词意义的搜索结果:Java计算机语言、Java岛、和咖啡java。该系统可以用于显示具有与每个上下文相关的链接的组中的结果,或者系统可以仅显示没有任何链接的上下文(具有为用户区分上下文的足够信息)并且允许用户选择期望的上下文来显示相关链接。在Yahoo!网络系统中,例如,可能显示一组上下文,其中,每个上下文具有从搜索索引到页面的一组链接、与赞助商匹配相关的链接、与目录匹配相关的链接和与Inside Yahoo!(IY)匹配相关的链接。
除了具有模糊含义的单词或短语外,例如“Java”,本发明的系统在一个实施例中被用于将不是很模糊的搜索术语的结果分组进上下文。一个实例是为搜索术语“Hawaii”返回的结果。术语“Hawaii”在本质上可能不是模糊的;然而,对于这样的术语返回的结果的特性可能非常广泛,涉及每个讨论或仅提到Hawaii的站点。为了给用户提供更有用的结果,通过支持(leveraging)对结果实际涉及内容的认识,本发明的系统优选地将搜索结果组织进上下文。例如,对于Hawaii,系统可能在不同上下文分组中返回结果,例如“Hawaii:travel”、“Hawaii:climate”、“Hawaii:geography”、“Hawaii:culture”,等。
在某些实施例中,上下文标识符与页面链接相关联地存储在在索引中,因此当执行搜索时,可以根据标识符对链接进行分组。页面链接可以与多个上下文标识符相关联。在用户执行相关搜索时,通过系统优选地将这种标识符自动地与链接进行关联;然而,也可以由一个或多个索引编辑者的团队手动地修改和使标识符与链接相关。以此方式中,由众多搜索收集的知识被反馈进系统,来限定或重限定上下文,以使显示的搜索结果对请求用户更有价值和更有用。
在一个实施例中,在搜索服务器系统160上的算法执行搜索术语的概念发现或概念分析,以向用户提供更有意义的结果。例如,对于搜索短语“New York City”,相当清楚的是,相对于(as supposedto)纽约州的其它城市,用户对涉及纽约市(市或区)的站点感兴趣。类似地,对于“New York City law enforcement”,很清楚,用户对涉及纽约市的法律实施(例如,工作部分)的站点感兴趣。然而,大多数搜索引擎可能仅使用单独的术语“New”、“York”、“City”、“law”和“enforcement”进行搜索,而不管在搜索短语中术语出现的顺序。其它搜索引擎可能试图找到在索引中出现的搜索短语中的最长子字符串。例如,如果索引包含“New York”、“NewYork City”和“New York City law”但不包含“New York City lawenforcement”,搜索引擎将使用“New York City law”和“enforcement”搜索,这不一定是用户所预期的。
本发明的实施例有利地分析在搜索短语中的术语,以识别构成搜索查询的一个或多个概念(单元)。
图3是根据本发明的一个实施例的用于执行概念发现或包括倾向分析的概念分析的系统300的框图。由查询处理引擎(同时称为查询引擎)304接收一个或多个查询日志文件302(或实际查询),该引擎产生如下所述的单元词典306。查询日志文件(或实际查询)可以通过互联网或通过多种网络连接(例如,LAN、WAN、直接链接、分布介质(例如,CD、DVD、软盘)等)从不同的来源接收。来源的实例包括搜索服务器系统160(图1)、或在搜索服务器的分布式网络中的多个搜索服务器160、和一个或多个内容服务器150。通常查询日志文件来源与同一组织或实体有关,例如,Yahoo!服务器,但不是必须的。由查询引擎304使用统计学方法(例如在信息理论中所使用的)或概念(例如交互信息)来处理查询日志文件(也称为查询日志)。在优选方面,使用日常查询日志,根据需要可能使用不同时期的日志,例如,小时、星期、等。查询日志通常包括由用户提交的实际查询,并且也可能包括用于某些或全部查询的额外信息,例如查询用户的地理位置、时间信息、客户机系统的IP地址、cookies、客户机类型(例如,浏览器类型)等。查询处理引擎304处理各种的查询日志并且从其产生单元(unit)。单元和相关统计(例如出现的频率)被存储在存储器中或在此称为单元词典306的数据库文件中。可以通过搜索引擎响应于后续查询来使用单元词典306,如下所述。
在一个实施例中,查询处理器304包括单元分析模块310和群集模块312。单元分析模块310处理查询日志302来产生单元。在优选的实施例中,系统使用搜索术语出现的顺序来识别构成查询的单元。单元可以是单词(例如,“java”)或经常彼此相邻出现的单词组(例如,“new york city”)。在上面引用的第60/460,222号临时申请中对单元的确定进行了详细描述。由单元分析模块310产生的单元存储在单元词典306中;在一些实施例中,也可以包括统计信息(例如,出现的频率或连同一个或多个其他单元一起出现的频率)。可以通过搜索引擎响应于后续查询使用存储在单元词典306中的信息。
群集模块312使用由单元分析模块310识别出的单元来执行对查询的进一步分析,以创建群集,或概念网络,其指示不同单元间的相似性。如在本领域通常所知的,概念网络是用于表示关系的结构,其中每个概念对应于一个节点,并且概念之间的关系由连接节点的线(或边)表示。可以为边分配不同的权重,因此每个边的权重反映了概念(节点)之间相似性的强度或接近程度。根据本发明的一个实施例,通过识别倾向于与一个或多个相同组“签名”单元一起出现在查询中的不同单元(群集的“成员”),从单元产生群集。成员单元可以用作概念网络中的节点。可以理解,也可以使用不同单元或概念之间的联系或关系的其它表示,并且在此使用的“概念网络”包括可选表示。
例如,假设许多用户搜索关于它们喜爱的流行音乐节目的信息。通常,这些用户将构建包括节目名称(例如,“Avril Lavigne”或“Celine Dion”)以及一些其它反映搜索信息类型的词语(例如,“lyrics(歌词)”、“mp3”、“guitar tabs”、“discography(音乐唱片分类目录)”等)的查询。群集模块312分析这些查询并确定“lyrics”、“mp3”、“guitar tabs”、“discography”等是用于群集的“签名”单元,群集的成员包括不同流行音乐节目的名称。用于创建群集的特定技术的实例可以在群集模块312中实施,这些实例如第60/510,220号临时申请中所述。群集模块312有利地将包括涉及成员单元的数据和签名的群集信息存储在单元词典306中。因此,在单元词典306中的可用信息包括有关单元和它们的“近邻”(也就是说,与给定单元一起出现在查询中的其它单元)以及与具有相似近邻的单元的关系的信息。
在优选实施例中,由群集模块312创建的群集倾向于反映概念的真实世界的关系(例如,属于共同分类的分组单元),即使不需要向查询处理引擎304提供真实世界的知识或有关特定单元或查询的语义信息。例如,一个群集可能包括“New York City(纽约市)”、“San Francisco”、和“Chicago”、并且群集的签名可能包括“hotel”、“restaurant”、和“night club”。这样的群集将会反映纽约市、旧金山、和芝加哥全部是旅游目的地(或城市),但查询引擎304(图3)不要求具有任何概念“目的地”(或“城市”)的现有知识。该概念性知识可以从分析查询的模式自动增长。应该理解,本说明书使用对人们带有语义含义的术语来标注群集,这便于促进本公开的理解。实际上,由查询引擎304或单元词典306使用的任何群集标注方案均不需要具有该属性;例如,群集标签可以仅是一个数字、一个群集签名的指示器等。
单元可能属于多个群集;例如,模糊单元(例如“java”)可以终止于“computer programming”群集中、“food and drink”群集中、和“travel”或“place”群集中。在一些实施例中,单元可以不属于任何群集。
根据本发明的一个实施例,查询处理引擎304也包括沿着多个维度寻找查询中的倾向的倾向分析模块320,例如时间、地理、用户人口统计状况、用户历史或上下文(在此称为“垂直”维度)等。倾向分析模块320有利地支持单元分析模块310和群集模块312的功能,以在查询的不同子集上进行概念分析和/或概念发现,然后汇编结果。得到的倾向信息被方便地加入单元词典306。
单元词典306可以以任何格式实施,并且存储在任何合适的存储介质上,包括磁盘或磁带、诸如光盘(CD)的光学存储介质等。单元词典306的内容有利地包括单元,以及有关每个单元的附加信息,例如由单元分析模块310生成的统计数据、由群集模块312确定的群集信息、和由倾向分析模块320产生的倾向信息。涉及单元、群集、和/或倾向的信息可以由搜索引擎使用以响应后续查询。
图4是可以由倾向分析模块320的实施例执行的过程400的流程图。在步骤402,包含在查询日志中的查询沿着所选择的维度分类成子集。可以根据关于日志文件提供的查询的任何信息限定维度,并且可以沿给定维度将查询分为任何数目的子集。
作为一个实例,如果查询日志提供涉及多种已知查询的提交时间的信息,可以使用“时间”维度。沿着时间维度,例如,可以按星期或月份来划分查询,以分析用户兴趣随着时间的倾向。也可以根据一天中的时间(例如,早上、下午、傍晚、深夜)、工作日对周末或假日、季节等划分查询。许多变更是可能的;仅作为一个实例,可以在一周、一个月、或另一个所需时期的时间集合在上午8时和上午10时之间收到的查询。在一些实施例中,根据搜索服务器的本地时间来确定一天的时间。在搜索服务提供多个服务器以服务不同地理区域的情况下,服务器的本地时间大体上表示用户的本地时间。在其它实施例中,可以使用用户的本地时间。
作为另一个实例,如果查询日志提供关于查询的地理起源的信息,可以使用“地理”维度。地理可以涉及物理地理。例如,一些IP地址可以用来识别查询起源的可能国家;用于提交查询的用户的用户简介(profile)可以用来确认用户居住在何处;或者可以根据它们是否在位于不同位置的镜像站点或与不同位置有关的地区/国家站点被接收到,来分类查询。可选地,地理维度可以表示“计算机地理”,其中,用户的IP地址(或由IP地址确定的域)被视为地理起源。可以结合物理的和计算机的地理维度。
作为第三实例,如果查询日志提供关于例如年龄、性别、等用户的人口统计学特征的信息,可以使用“人口统计学”维度。人口统计学数据的任何数字和结合均可以被用来限定用于倾向分析的人口统计学维度。例如,人口统计学维度可以包括一组“年龄大于25和拥有住房的女性用户”、另一组“年龄大于35和租房的男性用户”、一组“年龄小于25拥有汽车的用户”等。
作为第四实例,如果查询日志提供关于在查询输入之前的用户活动的信息(在此称为“用户历史”或“用户上下文”),可以使用“垂直的”或“用户历史”维度。例如,假设门户站点(例如,在www.yahoo.com的Yahoo!站点)包括不同区域或“属性”,例如购物属性、通用网络目录、音乐属性等,每个属性包括了使用户输入查询的搜索接口的属性。关于当输入查询时用户正在访问这些属性的哪一个的信息可能被存储并且作为“垂直”维度被使用。因此,在一个实施例中,垂直维度可能包括来自在“购物”属性的用户的一个查询子集和来自在“通用目录”属性的用户的另一个查询子集等。在其它实施例中,例如在任意时间用户已经为了输入搜索查询连续访问对话框的情况下(这样的对话框的一个实例如第60/460,222号临时申请所述),用户历史信息可能也包括当用户输入查询时显示的网页的URL或其它标识符。垂直维度可能根据URL、其一部分(例如,域名)、或关于页面内容的信息(例如,可能保持在页面索引中的信息)来分开查询。
本领域的技术人员将认识到前述维度和子集的实例是说明性的,并不是限制性的;可以使用沿给定维度的查询的任何数目的维度和子集。查询沿着维度的分类可以包括相关维度的“未知”和/或“其它”值的子集,并且可以根据系统设置来分析或不分析该子集。
在步骤404,查询的每个子集被提供给群集模块312以产生一个或多个子集专用概念网络。在某些实施例中,使用现存单元词典306;在其它实施例中,也可以将子集提供给单元分析模块310来产生子集专用单元组。单元分析和群集分析如第60/510,220号临时申请所述。有利地为每个查询子集独立执行群集分析,因此为每个子集产生概念网络组。得到的子集专用概念网络返回到倾向分析模块320。
在步骤408,倾向分析模块320使用子集专用概念网络沿着维度执行倾向分析,以检测反映用户行为的不同模式的相似性和差异。这些不同模式在此称为“倾向”,并且倾向分析通常涉及比较由不同子集产生的群集(例如,概念网络)和/或签名以发现这些差异。倾向和倾向分析可以采取广泛多样的形式。
作为一个实例,一个倾向分析可能比较在不同时期或对于不同用户人口统计的特定搜索术语或单元的相对频率。比较的单元可能是,例如群集的不同成员单元或对于群集的不同签名单元。假设,例如,有一个“歌唱家”的群集;对于该群集的一个倾向分析可能显示:对于小于21岁的用户,“Avril Lavigne”是比“Celine Dion”更流行的查询术语,而对于大于35岁的用户结果是相反的。或者假设有一个“cities(城市)”的群集并且该群集的签名包括单元“employment”和“hotel”;对该签名的倾向分析可能显示:在工作日期间更经常搜索“employment”,而在周末更经常搜索“hotel”。(这可能反映,例如,用户倾向于在工作日期间进行工作搜索并且在周末期间进行度假计划)。
在某些实施例中,倾向分析也可能被用来检测用户兴趣和行为中更微妙的倾向。例如,假设在一个领域中(例如,音乐),众所周知的名人决定进入另一个领域(例如,政治)。对该名人的兴趣的总体水平可能没有改变很多,但是所搜索的关于该名人的信息的种类可能变动。例如,对于名人的姓名加上“song”或“album(曲集)”的搜索的频率可能减少而对于名人的姓名加上“politics”或“taxes”的术语的搜索的频率增加。对在不同时期的名人姓名的近邻比较将显示这样的倾向。
在步骤410,为了用于响应后续查询,倾向信息被存储在例如单元词典306中。信息可能与信息所属的特定单元和/或群集、与关于单元或群集的签名或建议等一起存储。
将意识到,在此描述的系统和过程是说明性的并且可以变更和修改。可以平行执行按顺序描述的过程步骤,可以改变步骤的次序,并且可以修改或合并步骤。可以在任何数目的维度上同时进行倾向分析(例如,来自“购物”区域的年龄小于21的用户),并且沿着维度的分类根据所需可以为近似的或精细的。一个子集专用概念网络可以与另一个子集专用概念网络进行比较,或者不同子集专用概念网络可以与由没有分类的查询所产生的“全局”概念网络进行比较。倾向分析可以限于特定概念网络,例如,那些涉及用在足够大数目的查询中以产生有意义数据的单元的,或者作为用于建议相关搜索的基础的单元的。可以在单元、群集、签名、或它们的任意组合上执行倾向分析。
像单元和群集数据一样,经常有利地随时间更新或重新产生倾向信息,以捕获可以反映用户兴趣的改变的用户行为的变化(例如,特定流行音乐表演者的流行增加或减少,找工作相对旅行的兴趣增加或减少等)。
在本发明的另一个实施例中,通过考虑相关倾向,倾向信息被用于帮助响应于特定用户的兴趣修整搜索。图5示出了可以由图2的系统110使用的方法以响应查询。客户机120发送查询到搜索服务器系统160。搜索服务器系统160向概念服务器180发送查询和/或其组成单元,其访问单元词典306。概念服务器180返回涉及查询的概念数据,例如从查询识别的一个或多个单元以及用于多个单元的统计和群集信息,以及涉及单元的倾向信息。例如,可以通过混编(hashing)查询来识别在此包含的单元,并访问单元词典306以检索用于每个识别出的单元的条目(entries),来推断该信息。在一个实施例中,返回的信息包括单元、统计、群集、和关于与查询相关的倾向的信息、一个或多个其组成单元,或者一个或多个与任何组成单元相关的群集。
搜索服务器系统160有利地使用从响应于查询的概念服务器180接收到的概念数据。由搜索服务器系统160返回的结果有利地包括响应于用户查询而给用户的结果,以及其它相关信息,例如关于用户下一步可能要寻找的内容的提示和指点,其基于在单元和它们的扩充和结合物中所捕获的对用户需要的理解,其扩充和结合物包括关于单元和/或群集的群集和倾向。
例如,假设查询包括模糊术语,例如可能在多于一个上下文中使用的“Java,”。这样的术语可能属于多个群集,例如,“food anddrink”群集,“computer”群集、和“location”群集。在某些实施例中,搜索服务器系统160可以使用倾向数据来形成响应,例如,通过选择哪个群集将被给予最显著的位置。例如,如果在工作日搜索“Java”的用户很可能对计算机语言感兴趣,而在周末搜索“Java”的用户很可能对咖啡感兴趣,显示哪个搜索结果的次序可能取决于星期几;例如,如果是工作日,涉及计算机语言的结果可能被最显著地显示,而如果是周末,涉及咖啡的结果可能被最显著地显示。(第60/510,220号参考临时申请描述了用于根据不同群集的相关性分组搜索结果的一些技术。)
作为第二实例,假设有其为打击乐团体名称同时也是用于某个公司的证券报价机(stock-ticker)符号的四字母序列(“WXYZ”)。根据当股票市场营业时所收到的查询相对于当市场关闭时所收到的查询,比较概念网络或群集可能显示在前一种情况中公司WXYZ更经常地被搜索,而在后一种情况中打击乐团体WXYZ更经常地被搜索。因此,涉及公司的搜索结果可能被置于涉及打击乐团体的结果之前或之后,取决于当接收到查询时市场是否营业。
作为第三实例,考虑术语“party”,取决于上下文,其可以涉及社会活动或涉及政治。包括术语“party”的某些查询也可以包括解析(resolve)模糊的另一个术语(例如,“Republican party”或“partygames”),但其它查询可能不包括这些术语。倾向分析可以被用于形成对模糊查询的响应。例如,图6是示出了沿着一天中的时间维(每4小时增量)、包含术语“party”的查询的频率(以任意单位)的倾向数据的图表。这种倾向数据可能通过分析根据上述过程400的某些组查询来获得。倾向数据组602(符号“×”)对应于其中“party”与另一个清楚地涉及社会活动(例如,“game)”、“favors”、“supplies”)的术语共同出现的查询。倾向数据组604(符号“○”)对应于其中“party”与另一个清楚地涉及政治(例如,“Republican”、“Democrat”、“candidate”)的术语共同出现的查询。倾向数据组606(三角)对应于包括“party”的查询,其中不能通过参考查询中的其它术语来解析模糊。
根据本发明,解析模糊的一个方法是通过比较不同倾向的形状(例如,在图6所示的数据组的第一和/或第二导数),并且确定该模糊组查询是否比其它组与一个明确组查询更接近地匹配。在图6中所示的实例中,模糊倾向数据606明显地比“political”倾向数据604更类似于“social event”倾向数据602。由此,可以推断输入包括“party”的模糊查询的用户可能对社会活动比对政治更感兴趣,并且可以相应地显示搜索结果,例如,通过在涉及政治的结果之前显示涉及社会活动的结果。
应当注意到两组倾向数据之间的相似性程度也可以被考虑,并且用于建立用于所推断意图的置信度。在图6中所示的实例中,模糊倾向数据606相当接近地与“social event”倾向数据602匹配,因此,推断的置信度水平将会很高。在其它实例中,取决于用户行为,置信度水平可能较低或较高。这样的置信度水平可能是形成查询响应的另一个因素。例如,给出足够高置信度水平,最初可能只显示涉及社会活动的结果;在这种情况中,可以为用户提供检索涉及政治的结果的选择。
该实例是说明性的,并且可以变更和修改。例如,沿着多个维度(例如,一天中的时间和用户年龄)的倾向可能在确定相似性中一起考虑。倾向比较可能基于两条曲线的相似性的任何适当的测量,例如实际频率值、导数(变化率)、更高阶导数、或它们的任何组合。
作为第四实例,考虑术语“poison”,其可能涉及有毒物质或涉及重金属乐队。再次,某些查询将包括解析模糊的其它术语;例如,查询例如“rat poison”或“poison control”将涉及有毒物质,而“poisonlyrics”或“poison mp3”将涉及乐队。然而,其它查询将完全是不确定的。
例如在上面“party”的实例中描述的分析可以被用来解析模糊。另一个方法涉及确认乐队“poison”属于音乐表演者的群集,并且该群集包括其名称相对明确的其它表演者。(例如,实际上,每个输入“Britney Spears”作为查询的用户对该著名的歌手均感兴趣。)包括音乐表演者明确名称的查询可以被用作“控制”组,可以从中得出关于正在寻找关于音乐表演者信息的用户的行为的推断。为了估计模糊术语涉及表演者的可能性,可以将该行为与键入模糊术语(例如,“poison”)的用户的行为进行比较,该模糊术语可能涉及表演者或可能不涉及。
控制组和包括模糊术语的查询之间的大量比较是可能的。例如,可以计算包括模糊术语“poison”同时包含确定地与音乐相关的术语(例如,“lyrics”)的查询的分数,包含明确名称(例如,“Britney Spears”)的查询的相应“控制”分数也是如此。控制分数可以视为接近于对音乐感兴趣的用户将输入可能模糊查询的可能性。通过将此与包含“poison”的明确音乐有关的查询的频率进行比较,推断出输入查询“poison”的用户对乐队感兴趣的可能性是可能的。
为了使该实例更具体,假设包括术语“poison”同时包括术语“lyrics”的查询的分数为0.1,并且包括术语“Britney Spears”同时包括术语“lyrics”的查询的分数为0.2。由此,可以推断出输入术语“poison”的一半用户可能不想涉及乐队。在这种情况中,涉及乐队和涉及毒物的结果都将被显著地显示。为了估计搜索有毒物质的用户不能包括模糊解析术语的可能性,也可以根据包括有毒“poison”(例如,涉及药品的群集)的群集使用控制分数做出类似的分析。如果在涉及药品的群集中的术语的模糊查询的可能性很小,将暗示模糊查询“poison”更有可能涉及乐队。
另外,通过将接收来自对药品感兴趣的用户相对于对音乐感兴趣的用户的可能模糊查询的可能性进行比较,可以推断用户意图。例如,假设来自对音乐感兴趣的用户的查询的29%为仅包括表演者姓名的单个单元查询,而来自对药品感兴趣的用户的查询只有2%包括单个单元。这可以推断出输入单个单元查询“poison”的用户更可能对乐队感兴趣。
将意识到,也可以使用该分析的更复杂改变。例如,不是仅使用一个表演者来计算控制分数,可以使用更多表演者(例如,不仅是“Britney Spears”而且包括“matchbox twenty”、“Johnny Cash”等)。类似地,不是只考虑一个模糊解析术语,可以使用多个术语(例如,不仅是“lyrics”而且包括“mp3”、“tour”、“album”等)。也可以将类似的分析用于其它模糊术语和其它群集。
作为第五实例,假设用户输入查询“digital cameras”。用户可能在寻找出售数字相机的站点或寻找关于数字相机的信息(例如产品评论)。可以使用沿着多个维度的先前查询的倾向分析(包括,例如,用户简介和/或垂直维度)来确定哪一个更可能,因此可以相应地修整结果。
作为第六实例,在某些实施例中,搜索服务器系统160可能根据倾向信息提出相关搜索。例如,如果已知小于21的用户输入包括歌手姓名的查询,除了显示与该歌手相关的站点的列表,搜索服务器系统160可能建议涉及通过倾向分析确认为在小于21的用户中流行(例如,“Avril Lavigne”)的一个或多个其它歌手的搜索。对于35岁的用户,可能建议不同的歌手(例如,“Celine Dion”)。在另一个实例中,如果“new york city”的查询在周日被输入,可能使建议“employment”比建议“hotel”更显著(如果这与倾向数据一致),而如果在周末输入相同的查询,可能使用相反的顺序。
在一些实施例中,也可以由搜索服务器系统160使用倾向数据,来推断关于特定用户的信息,例如,用户的可能性别、年龄或地理位置。这种推断可能涉及将倾向数据与由相同用户输入的许多查询进行比较,以使用户行为与不同维度匹配。应当理解,这些推断不能保证是精确的;它们反映了用户如何行动,而不必反映用户是谁。可以使用对特定用户做出的任何推断,来调整对由该用户输入的另外查询的响应,再使用倾向数据作为类似用户意图的一个指示。因此,可以使用倾向数据定制搜索服务器对输入查询的特定用户的响应。
倾向数据也可以连同广告决策(例如在特定场合显示哪一个广告和/或为特定广告放置所收取的价格)一起由搜索服务器系统160的提供方使用。
虽然参考特定实施例描述了本发明,本领域的技术人员将认识到可能有许多修改。例如,用于倾向分析的维度的数目和特征以及查询子集可以改变,并且不是所有收到的查询需要用于倾向分析。可以动态地限定群集、签名和倾向信息,并且可以时常执行倾向分析(例如,每天或每周),以响应于变化的用户行为来更新倾向信息。在其它实施例中,可以在查询被收到时处理它们,因此实际上实时更新群集、签名和倾向数据。在此所描述的自动化的系统和方法可以通过对所得到的单元词典(包括群集、签名、涉及单元、群集、和签名的任何或全部的倾向信息等等)的全部或部分的人工检查(human review)扩充或补充。
在此描述的实施例可以涉及网站、链接、和用于其中由万维网(或其子集)充当搜索主体的实例的其它术语。应当理解,在此描述的系统和过程可以被修改用于不同的搜索主体(例如电子数据库或文档储存库),并且结果可能包括内容和可以找到内容的位置的链接或引用。
因此,虽然已经参考特定实施例描述了本发明,将意识到本发明包括权利要求书所限定的范围内的所有修改及其等价物。

Claims (20)

1.一种用于处理查询的方法,所述方法包括:
接收一组先前查询,其中,每个所述先前查询均包括一个或多个单元;
沿着维度将所述查询分类成子集;
为所述查询的每个子集产生一个或多个子集专用概念网络;以及
比较来自至少两个所述子集的相应子集专用概念网络,
从而产生用于单元的倾向信息。
2.根据权利要求1所述的方法,其中,所述维度是时间维度。
3.根据权利要求1所述的方法,其中,通过对用户的一个或多个人口统计学特征的引用来限定所述维度。
4.根据权利要求1所述的方法,其中,所述维度是地理维度。
5.根据权利要求1所述的方法,其中,所述维度是表示所述查询的用户上下文的垂直维度。
6.根据权利要求1所述的方法,进一步包括:
接收后续查询;
将所述后续查询解析成一个或多个组成单元;以及
在形成对所述后续查询的响应时使用所述倾向信息。
7.根据权利要求6所述的方法,其中,所述倾向信息用于解析所述查询的模糊术语。
8.根据权利要求6所述的方法,其中,所述倾向信息用于建议相关搜索。
9.根据权利要求6所述的方法,其中,所述倾向信息用于将响应数据分组。
10.根据权利要求6所述的方法,其中,所述倾向信息用于选择用于显示的广告。
11.一种用于处理查询的系统,包括:
倾向分析模块,用于沿着维度将一组查询分类成多个子集;以及
群集模块,用于为所述多个子集中的每一个产生相应概念网络,
其中,所述倾向分析模块还用于比较用于至少两个所述子集的相应概念网络,从而产生倾向信息。
12.根据权利要求11所述的系统,其中,所述维度是时间维度。
13.根据权利要求11所述的系统,其中,所述维度通过对用户的一个或多个人口统计学特征的引用来限定。
14.根据权利要求11所述的系统,其中,所述维度是地理维度。
15.根据权利要求11所述的系统,其中,所述维度是表示所述查询的用户上下文的垂直维度。
16.根据权利要求11所述的系统,还包括响应模块,用于接收后续查询,以将所述后续查询解析成一个或多个组成单元,并且用于至少部分基于所述倾向信息来形成对所述查询的响应。
17.根据权利要求16所述的系统,其中,所述响应模块还用于使用所述倾向信息来分析所述查询的模糊术语。
18.根据权利要求16所述的系统,其中,所述响应模块还用于使用所述倾向信息来建议相关搜索。
19.根据权利要求16所述的系统,其中,所述响应模块还用于使用所述倾向信息对响应数据进行分组。
20.根据权利要求16所述的系统,其中,所述响应模块还用于使用所述倾向信息来选择用于显示的广告。
CNB2004800367547A 2003-11-12 2004-11-12 用于使用倾向分析进行搜索查询处理的系统和方法 Active CN100401292C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/712,307 2003-11-12
US10/712,307 US7240049B2 (en) 2003-11-12 2003-11-12 Systems and methods for search query processing using trend analysis

Publications (2)

Publication Number Publication Date
CN1930566A true CN1930566A (zh) 2007-03-14
CN100401292C CN100401292C (zh) 2008-07-09

Family

ID=34552670

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800367547A Active CN100401292C (zh) 2003-11-12 2004-11-12 用于使用倾向分析进行搜索查询处理的系统和方法

Country Status (6)

Country Link
US (2) US7240049B2 (zh)
EP (1) EP1690169A4 (zh)
JP (1) JP4722051B2 (zh)
KR (1) KR101031449B1 (zh)
CN (1) CN100401292C (zh)
WO (1) WO2005050367A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179472B (zh) * 2007-05-31 2011-05-11 腾讯科技(深圳)有限公司 一种网络资源搜索方法及搜索系统
CN102124439A (zh) * 2008-06-13 2011-07-13 电子湾有限公司 用于集群化的方法和系统
CN103221951A (zh) * 2010-07-22 2013-07-24 谷歌公司 预测查询建议高速缓存
CN105917330A (zh) * 2014-01-17 2016-08-31 脸谱公司 用于在线社交网络的客户端搜索模板
CN106257942A (zh) * 2015-06-16 2016-12-28 思科技术公司 在网络环境中使用用户设备组协助服务移出的系统和方法
CN110033156A (zh) * 2018-12-14 2019-07-19 阿里巴巴集团控股有限公司 一种业务活动效果的确定方法及装置
CN111159248A (zh) * 2019-12-12 2020-05-15 北京字节跳动网络技术有限公司 信息检索方法、装置和电子设备
CN112446493A (zh) * 2019-08-28 2021-03-05 国际商业机器公司 使用对话系统来学习和推断判断推理知识

Families Citing this family (291)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US6832220B1 (en) * 2000-08-03 2004-12-14 Microsoft Corporation Method and apparatus for file searching, accessing file identifiers from reference page
US7743045B2 (en) 2005-08-10 2010-06-22 Google Inc. Detecting spam related and biased contexts for programmable search engines
US7693830B2 (en) 2005-08-10 2010-04-06 Google Inc. Programmable search engine
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
AU2003279992A1 (en) * 2002-10-21 2004-05-13 Ebay Inc. Listing recommendation in a network-based commerce system
US8255417B2 (en) * 2003-05-20 2012-08-28 Google Inc. System and method for providing definitions
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US7660400B2 (en) 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
US8954420B1 (en) 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US7158966B2 (en) * 2004-03-09 2007-01-02 Microsoft Corporation User intent discovery
US7941439B1 (en) 2004-03-31 2011-05-10 Google Inc. Methods and systems for information capture
US7409383B1 (en) 2004-03-31 2008-08-05 Google Inc. Locating meaningful stopwords or stop-phrases in keyword-based retrieval systems
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US8275839B2 (en) 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US7333976B1 (en) 2004-03-31 2008-02-19 Google Inc. Methods and systems for processing contact information
US8099407B2 (en) 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
US8631076B1 (en) 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
US20060010029A1 (en) * 2004-04-29 2006-01-12 Gross John N System & method for online advertising
US20050246358A1 (en) * 2004-04-29 2005-11-03 Gross John N System & method of identifying and predicting innovation dissemination
US20050246391A1 (en) * 2004-04-29 2005-11-03 Gross John N System & method for monitoring web pages
US8250065B1 (en) * 2004-05-28 2012-08-21 Adobe Systems Incorporated System and method for ranking information based on clickthroughs
US9626437B2 (en) * 2004-06-10 2017-04-18 International Business Machines Corporation Search scheduling and delivery tool for scheduling a search using a search framework profile
US7565630B1 (en) 2004-06-15 2009-07-21 Google Inc. Customization of search results for search queries received from third party sites
US8392453B2 (en) * 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US8972444B2 (en) * 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US9223868B2 (en) * 2004-06-28 2015-12-29 Google Inc. Deriving and using interaction profiles
US7562069B1 (en) 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US8078607B2 (en) * 2006-03-30 2011-12-13 Google Inc. Generating website profiles based on queries from webistes and user activities on the search results
US7555524B1 (en) * 2004-09-16 2009-06-30 Symantec Corporation Bulk electronic message detection by header similarity analysis
US8874570B1 (en) 2004-11-30 2014-10-28 Google Inc. Search boost vector based on co-visitation information
US7962461B2 (en) * 2004-12-14 2011-06-14 Google Inc. Method and system for finding and aggregating reviews for a product
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9256685B2 (en) 2005-03-31 2016-02-09 Google Inc. Systems and methods for modifying search results based on a user's history
US20060224583A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for analyzing a user's web history
US20060224608A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for combining sets of favorites
US20060224579A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation Data mining techniques for improving search engine relevance
US7403767B2 (en) * 2005-04-29 2008-07-22 Siemens Aktiengesellschaft Cellular telephone network with record keeping for missed calls
US20060253423A1 (en) * 2005-05-07 2006-11-09 Mclane Mark Information retrieval system and method
US7647312B2 (en) * 2005-05-12 2010-01-12 Microsoft Corporation System and method for automatic generation of suggested inline search terms
US8103659B1 (en) * 2005-06-06 2012-01-24 A9.Com, Inc. Perspective-based item navigation
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US10769215B2 (en) * 2005-07-14 2020-09-08 Conversant Wireless Licensing S.A R.L. Method, apparatus and computer program product providing an application integrated mobile device search solution using context information
US7844599B2 (en) * 2005-08-24 2010-11-30 Yahoo! Inc. Biasing queries to determine suggested queries
US7747639B2 (en) * 2005-08-24 2010-06-29 Yahoo! Inc. Alternative search query prediction
US7672932B2 (en) * 2005-08-24 2010-03-02 Yahoo! Inc. Speculative search result based on a not-yet-submitted search query
US10911894B2 (en) 2005-09-14 2021-02-02 Verizon Media Inc. Use of dynamic content generation parameters based on previous performance of those parameters
US8290810B2 (en) 2005-09-14 2012-10-16 Jumptap, Inc. Realtime surveying within mobile sponsored content
US8989718B2 (en) 2005-09-14 2015-03-24 Millennial Media, Inc. Idle screen advertising
US8364540B2 (en) 2005-09-14 2013-01-29 Jumptap, Inc. Contextual targeting of content using a monetization platform
US8027879B2 (en) 2005-11-05 2011-09-27 Jumptap, Inc. Exclusivity bidding for mobile sponsored content
US9076175B2 (en) 2005-09-14 2015-07-07 Millennial Media, Inc. Mobile comparison shopping
US8364521B2 (en) 2005-09-14 2013-01-29 Jumptap, Inc. Rendering targeted advertisement on mobile communication facilities
US8666376B2 (en) 2005-09-14 2014-03-04 Millennial Media Location based mobile shopping affinity program
US8311888B2 (en) 2005-09-14 2012-11-13 Jumptap, Inc. Revenue models associated with syndication of a behavioral profile using a monetization platform
US8195133B2 (en) 2005-09-14 2012-06-05 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US9471925B2 (en) 2005-09-14 2016-10-18 Millennial Media Llc Increasing mobile interactivity
US8103545B2 (en) 2005-09-14 2012-01-24 Jumptap, Inc. Managing payment for sponsored content presented to mobile communication facilities
US7702318B2 (en) 2005-09-14 2010-04-20 Jumptap, Inc. Presentation of sponsored content based on mobile transaction event
US7660581B2 (en) 2005-09-14 2010-02-09 Jumptap, Inc. Managing sponsored content based on usage history
US9201979B2 (en) 2005-09-14 2015-12-01 Millennial Media, Inc. Syndication of a behavioral profile associated with an availability condition using a monetization platform
US8503995B2 (en) 2005-09-14 2013-08-06 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US7577665B2 (en) 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US10038756B2 (en) 2005-09-14 2018-07-31 Millenial Media LLC Managing sponsored content based on device characteristics
US7676394B2 (en) 2005-09-14 2010-03-09 Jumptap, Inc. Dynamic bidding and expected value
US8832100B2 (en) 2005-09-14 2014-09-09 Millennial Media, Inc. User transaction history influenced search results
US8302030B2 (en) 2005-09-14 2012-10-30 Jumptap, Inc. Management of multiple advertising inventories using a monetization platform
US20110313853A1 (en) 2005-09-14 2011-12-22 Jorey Ramer System for targeting advertising content to a plurality of mobile communication facilities
US8131271B2 (en) 2005-11-05 2012-03-06 Jumptap, Inc. Categorization of a mobile user profile based on browse behavior
US10592930B2 (en) 2005-09-14 2020-03-17 Millenial Media, LLC Syndication of a behavioral profile using a monetization platform
US7912458B2 (en) 2005-09-14 2011-03-22 Jumptap, Inc. Interaction analysis and prioritization of mobile content
US7860871B2 (en) 2005-09-14 2010-12-28 Jumptap, Inc. User history influenced search results
US8688671B2 (en) 2005-09-14 2014-04-01 Millennial Media Managing sponsored content based on geographic region
US7752209B2 (en) 2005-09-14 2010-07-06 Jumptap, Inc. Presenting sponsored content on a mobile communication facility
US8156128B2 (en) 2005-09-14 2012-04-10 Jumptap, Inc. Contextual mobile content placement on a mobile communication facility
US8615719B2 (en) 2005-09-14 2013-12-24 Jumptap, Inc. Managing sponsored content for delivery to mobile communication facilities
US8238888B2 (en) 2006-09-13 2012-08-07 Jumptap, Inc. Methods and systems for mobile coupon placement
US9703892B2 (en) 2005-09-14 2017-07-11 Millennial Media Llc Predictive text completion for a mobile communication facility
US8805339B2 (en) 2005-09-14 2014-08-12 Millennial Media, Inc. Categorization of a mobile user profile based on browse and viewing behavior
US7769764B2 (en) 2005-09-14 2010-08-03 Jumptap, Inc. Mobile advertisement syndication
US8812526B2 (en) 2005-09-14 2014-08-19 Millennial Media, Inc. Mobile content cross-inventory yield optimization
US9058406B2 (en) 2005-09-14 2015-06-16 Millennial Media, Inc. Management of multiple advertising inventories using a monetization platform
US8209344B2 (en) 2005-09-14 2012-06-26 Jumptap, Inc. Embedding sponsored content in mobile applications
US8229914B2 (en) 2005-09-14 2012-07-24 Jumptap, Inc. Mobile content spidering and compatibility determination
US8532633B2 (en) 2005-09-14 2013-09-10 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
US8819659B2 (en) 2005-09-14 2014-08-26 Millennial Media, Inc. Mobile search service instant activation
US8660891B2 (en) 2005-11-01 2014-02-25 Millennial Media Interactive mobile advertisement banners
US9317601B2 (en) * 2005-10-04 2016-04-19 Thomson Reuters Global Resources Systems, methods, and software for assessing ambiguity of medical terms
US9767143B2 (en) 2005-10-26 2017-09-19 Cortica, Ltd. System and method for caching of concept structures
US10621988B2 (en) 2005-10-26 2020-04-14 Cortica Ltd System and method for speech to text translation using cores of a natural liquid architecture system
US11620327B2 (en) 2005-10-26 2023-04-04 Cortica Ltd System and method for determining a contextual insight and generating an interface with recommendations based thereon
US9256668B2 (en) 2005-10-26 2016-02-09 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US9396435B2 (en) 2005-10-26 2016-07-19 Cortica, Ltd. System and method for identification of deviations from periodic behavior patterns in multimedia content
US8266185B2 (en) 2005-10-26 2012-09-11 Cortica Ltd. System and methods thereof for generation of searchable structures respective of multimedia data content
US8312031B2 (en) 2005-10-26 2012-11-13 Cortica Ltd. System and method for generation of complex signatures for multimedia data content
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US10380267B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for tagging multimedia content elements
US10191976B2 (en) 2005-10-26 2019-01-29 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US10180942B2 (en) 2005-10-26 2019-01-15 Cortica Ltd. System and method for generation of concept structures based on sub-concepts
US10360253B2 (en) 2005-10-26 2019-07-23 Cortica, Ltd. Systems and methods for generation of searchable structures respective of multimedia data content
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US9031999B2 (en) 2005-10-26 2015-05-12 Cortica, Ltd. System and methods for generation of a concept based database
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US10698939B2 (en) 2005-10-26 2020-06-30 Cortica Ltd System and method for customizing images
US9953032B2 (en) 2005-10-26 2018-04-24 Cortica, Ltd. System and method for characterization of multimedia content signals using cores of a natural liquid architecture system
US8818916B2 (en) 2005-10-26 2014-08-26 Cortica, Ltd. System and method for linking multimedia data elements to web pages
US9372940B2 (en) 2005-10-26 2016-06-21 Cortica, Ltd. Apparatus and method for determining user attention using a deep-content-classification (DCC) system
US10193990B2 (en) 2005-10-26 2019-01-29 Cortica Ltd. System and method for creating user profiles based on multimedia content
US9558449B2 (en) 2005-10-26 2017-01-31 Cortica, Ltd. System and method for identifying a target area in a multimedia content element
US9747420B2 (en) 2005-10-26 2017-08-29 Cortica, Ltd. System and method for diagnosing a patient based on an analysis of multimedia content
US10635640B2 (en) 2005-10-26 2020-04-28 Cortica, Ltd. System and method for enriching a concept database
US10614626B2 (en) 2005-10-26 2020-04-07 Cortica Ltd. System and method for providing augmented reality challenges
US9477658B2 (en) 2005-10-26 2016-10-25 Cortica, Ltd. Systems and method for speech to speech translation using cores of a natural liquid architecture system
US10380623B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for generating an advertisement effectiveness performance score
US11003706B2 (en) 2005-10-26 2021-05-11 Cortica Ltd System and methods for determining access permissions on personalized clusters of multimedia content elements
US9466068B2 (en) 2005-10-26 2016-10-11 Cortica, Ltd. System and method for determining a pupillary response to a multimedia data element
US9529984B2 (en) 2005-10-26 2016-12-27 Cortica, Ltd. System and method for verification of user identification based on multimedia content elements
US11361014B2 (en) 2005-10-26 2022-06-14 Cortica Ltd. System and method for completing a user profile
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US10535192B2 (en) 2005-10-26 2020-01-14 Cortica Ltd. System and method for generating a customized augmented reality environment to a user
US10691642B2 (en) 2005-10-26 2020-06-23 Cortica Ltd System and method for enriching a concept database with homogenous concepts
US10585934B2 (en) 2005-10-26 2020-03-10 Cortica Ltd. Method and system for populating a concept database with respect to user identifiers
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US8175585B2 (en) 2005-11-05 2012-05-08 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
KR100809415B1 (ko) * 2005-12-08 2008-03-05 한국전자통신연구원 온톨로지를 활용한 정보질의 확장 시스템 및 그 방법
US7680775B2 (en) * 2005-12-13 2010-03-16 Iac Search & Media, Inc. Methods and systems for generating query and result-based relevance indexes
US7627559B2 (en) * 2005-12-15 2009-12-01 Microsoft Corporation Context-based key phrase discovery and similarity measurement utilizing search engine query logs
US9262446B1 (en) 2005-12-29 2016-02-16 Google Inc. Dynamically ranking entries in a personal data book
US7685144B1 (en) 2005-12-29 2010-03-23 Google Inc. Dynamically autocompleting a data entry
US7634463B1 (en) 2005-12-29 2009-12-15 Google Inc. Automatically generating and maintaining an address book
US7739225B2 (en) 2006-02-09 2010-06-15 Ebay Inc. Method and system to analyze aspect rules based on domain coverage of an aspect-value pair
US7640234B2 (en) * 2006-02-09 2009-12-29 Ebay Inc. Methods and systems to communicate information
US8380698B2 (en) * 2006-02-09 2013-02-19 Ebay Inc. Methods and systems to generate rules to identify data items
US7739226B2 (en) * 2006-02-09 2010-06-15 Ebay Inc. Method and system to analyze aspect rules based on domain coverage of the aspect rules
US7725417B2 (en) * 2006-02-09 2010-05-25 Ebay Inc. Method and system to analyze rules based on popular query coverage
US7849047B2 (en) * 2006-02-09 2010-12-07 Ebay Inc. Method and system to analyze domain rules based on domain coverage of the domain rules
US9443333B2 (en) * 2006-02-09 2016-09-13 Ebay Inc. Methods and systems to communicate information
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7571162B2 (en) * 2006-03-01 2009-08-04 Microsoft Corporation Comparative web search
US9953097B2 (en) 2006-03-16 2018-04-24 Ebay Inc. System and method for managing network traffic routing
US7716229B1 (en) * 2006-03-31 2010-05-11 Microsoft Corporation Generating misspells from query log context usage
KR100754768B1 (ko) * 2006-04-06 2007-09-03 엔에이치엔(주) 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체
US8126874B2 (en) * 2006-05-09 2012-02-28 Google Inc. Systems and methods for generating statistics from search engine query logs
US7523108B2 (en) * 2006-06-07 2009-04-21 Platformation, Inc. Methods and apparatus for searching with awareness of geography and languages
US7814112B2 (en) * 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
US20080016157A1 (en) * 2006-06-29 2008-01-17 Centraltouch Technology Inc. Method and system for controlling and monitoring an apparatus from a remote computer using session initiation protocol (sip)
US20080010101A1 (en) * 2006-07-06 2008-01-10 Todd Williamson Determining reissue methods for ticket changes
US20080041945A1 (en) * 2006-07-06 2008-02-21 Todd Williamson Ticket reconstruction
US8731980B2 (en) * 2006-07-06 2014-05-20 Google Inc. Low fare search for ticket changes
US20080010102A1 (en) * 2006-07-06 2008-01-10 Todd Williamson Database for storing historical travel information
US8688485B2 (en) * 2006-07-06 2014-04-01 Google Inc. Low fare search for ticket changes using married segment indicators
US7664744B2 (en) * 2006-07-14 2010-02-16 Yahoo! Inc. Query categorizer
WO2008030568A2 (en) * 2006-09-07 2008-03-13 Feedster, Inc. Feed crawling system and method and spam feed filter
US7979425B2 (en) * 2006-10-25 2011-07-12 Google Inc. Server-side match
US10733326B2 (en) 2006-10-26 2020-08-04 Cortica Ltd. System and method for identification of inappropriate multimedia content
US7937403B2 (en) * 2006-10-30 2011-05-03 Yahoo! Inc. Time-based analysis of related keyword searching
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US20080109752A1 (en) * 2006-11-07 2008-05-08 Yahoo! Inc. Expanding search query input box to support livesearch interaction
US8635203B2 (en) * 2006-11-16 2014-01-21 Yahoo! Inc. Systems and methods using query patterns to disambiguate query intent
US7630970B2 (en) * 2006-11-28 2009-12-08 Yahoo! Inc. Wait timer for partially formed query
US7941436B2 (en) * 2006-11-30 2011-05-10 Yahoo, Inc. Keyword bidding strategy for novel concepts
US7630972B2 (en) * 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing
US7822734B2 (en) * 2006-12-12 2010-10-26 Yahoo! Inc. Selecting and presenting user search results based on an environment taxonomy
US20090012841A1 (en) * 2007-01-05 2009-01-08 Yahoo! Inc. Event communication platform for mobile device users
US7912847B2 (en) * 2007-02-20 2011-03-22 Wright State University Comparative web search system and method
US7827170B1 (en) 2007-03-13 2010-11-02 Google Inc. Systems and methods for demoting personalized search results based on personal information
US8738606B2 (en) * 2007-03-30 2014-05-27 Microsoft Corporation Query generation using environment configuration
CN101286150B (zh) * 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 生成更新参数的方法和装置、展示相关关键词的方法和装置
US7672937B2 (en) * 2007-04-11 2010-03-02 Yahoo, Inc. Temporal targeting of advertisements
KR20080096005A (ko) * 2007-04-26 2008-10-30 엔에이치엔(주) 키워드 제공 범위에 따라 키워드 제공 방법 및 그 시스템
US7895227B1 (en) * 2007-04-27 2011-02-22 Intuit Inc. System and method for detecting trends in network-based content
US8019742B1 (en) 2007-05-31 2011-09-13 Google Inc. Identifying related queries
US7644075B2 (en) * 2007-06-01 2010-01-05 Microsoft Corporation Keyword usage score based on frequency impulse and frequency weight
US8051040B2 (en) 2007-06-08 2011-11-01 Ebay Inc. Electronic publication system
US20090006311A1 (en) * 2007-06-28 2009-01-01 Yahoo! Inc. Automated system to improve search engine optimization on web pages
US8090709B2 (en) 2007-06-28 2012-01-03 Microsoft Corporation Representing queries and determining similarity based on an ARIMA model
US8290921B2 (en) * 2007-06-28 2012-10-16 Microsoft Corporation Identification of similar queries based on overall and partial similarity of time series
US7693823B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Forecasting time-dependent search queries
US7693908B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Determination of time dependency of search queries
US7685100B2 (en) 2007-06-28 2010-03-23 Microsoft Corporation Forecasting search queries based on time dependencies
US7689622B2 (en) * 2007-06-28 2010-03-30 Microsoft Corporation Identification of events of search queries
US7685099B2 (en) * 2007-06-28 2010-03-23 Microsoft Corporation Forecasting time-independent search queries
US20090043749A1 (en) * 2007-08-06 2009-02-12 Garg Priyank S Extracting query intent from query logs
US7966341B2 (en) * 2007-08-06 2011-06-21 Yahoo! Inc. Estimating the date relevance of a query from query logs
US7428522B1 (en) * 2007-09-27 2008-09-23 Yahoo! Inc. Real-time search term popularity determination, by search origin geographic location
US20090089169A1 (en) * 2007-09-28 2009-04-02 Google Inc. Event Based Serving
US8903756B2 (en) * 2007-10-19 2014-12-02 Ying Zhao System and method for knowledge pattern search from networked agents
KR100893129B1 (ko) * 2007-10-24 2009-04-15 엔에이치엔(주) 멀티 미디어 컨텐츠의 추천 키워드 추출 시스템 및 그 방법
US7853475B2 (en) * 2007-11-09 2010-12-14 Motorola Mobility, Inc. Intelligent advertising based on mobile content
US7415460B1 (en) * 2007-12-10 2008-08-19 International Business Machines Corporation System and method to customize search engine results by picking documents
US8612409B2 (en) * 2007-12-18 2013-12-17 Yahoo! Inc. Method and apparatus for detecting and explaining bursty stream events in targeted groups
US9501467B2 (en) 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
US20090222395A1 (en) * 2007-12-21 2009-09-03 Marc Light Systems, methods, and software for entity extraction and resolution coupled with event and relationship extraction
US20090164266A1 (en) * 2007-12-21 2009-06-25 Microsoft Corporation Category aggregated opinion data
EP2240873A1 (en) * 2007-12-31 2010-10-20 Thomson Reuters Global Resources Systems, methods and sofstware for evaluating user queries
US8402031B2 (en) * 2008-01-11 2013-03-19 Microsoft Corporation Determining entity popularity using search queries
WO2009097558A2 (en) * 2008-01-30 2009-08-06 Thomson Reuters Global Resources Financial event and relationship extraction
US9746985B1 (en) 2008-02-25 2017-08-29 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9489495B2 (en) 2008-02-25 2016-11-08 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9529974B2 (en) 2008-02-25 2016-12-27 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US8881040B2 (en) 2008-08-28 2014-11-04 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US20090222321A1 (en) * 2008-02-28 2009-09-03 Microsoft Corporation Prediction of future popularity of query terms
US20090276414A1 (en) * 2008-04-30 2009-11-05 Microsoft Corporation Ranking model adaptation for searching
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US10198503B2 (en) 2008-05-01 2019-02-05 Primal Fusion Inc. System and method for performing a semantic operation on a digital social network
US8126930B2 (en) * 2008-05-06 2012-02-28 Yahoo! Inc. Micro-bucket testing for page optimization
US9798807B2 (en) * 2008-05-06 2017-10-24 Excalibur Ip, Llc Algorithmically generated topic pages
US11048765B1 (en) 2008-06-25 2021-06-29 Richard Paiz Search engine optimizer
US10922363B1 (en) * 2010-04-21 2021-02-16 Richard Paiz Codex search patterns
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
US9740986B2 (en) * 2008-09-30 2017-08-22 Excalibur Ip, Llc System and method for deducing user interaction patterns based on limited activities
US20100114887A1 (en) * 2008-10-17 2010-05-06 Google Inc. Textual Disambiguation Using Social Connections
US7949647B2 (en) * 2008-11-26 2011-05-24 Yahoo! Inc. Navigation assistance for search engines
US8631007B1 (en) * 2008-12-09 2014-01-14 Google Inc. Disambiguating keywords and other query terms used to select sponsored content
US8412749B2 (en) 2009-01-16 2013-04-02 Google Inc. Populating a structured presentation with new values
US8615707B2 (en) * 2009-01-16 2013-12-24 Google Inc. Adding new attributes to a structured presentation
US20100185651A1 (en) * 2009-01-16 2010-07-22 Google Inc. Retrieving and displaying information from an unstructured electronic document collection
US8452791B2 (en) 2009-01-16 2013-05-28 Google Inc. Adding new instances to a structured presentation
US8977645B2 (en) * 2009-01-16 2015-03-10 Google Inc. Accessing a search interface in a structured presentation
US20100191758A1 (en) * 2009-01-26 2010-07-29 Yahoo! Inc. System and method for improved search relevance using proximity boosting
US8700630B2 (en) * 2009-02-24 2014-04-15 Yahoo! Inc. Algorithmically generated topic pages with interactive advertisements
US8190601B2 (en) * 2009-05-22 2012-05-29 Microsoft Corporation Identifying task groups for organizing search results
US20100306235A1 (en) * 2009-05-28 2010-12-02 Yahoo! Inc. Real-Time Detection of Emerging Web Search Queries
US20110106819A1 (en) * 2009-10-29 2011-05-05 Google Inc. Identifying a group of related instances
US8768938B2 (en) * 2009-06-25 2014-07-01 Hewlett-Packard Development Company, L.P. Histogram processing by trend and pattern removal
US20110010378A1 (en) * 2009-07-07 2011-01-13 John Dukes Trend charting system and method
US20130304818A1 (en) * 2009-12-01 2013-11-14 Topsy Labs, Inc. Systems and methods for discovery of related terms for social media content collection over social networks
US11113299B2 (en) 2009-12-01 2021-09-07 Apple Inc. System and method for metadata transfer among search entities
US8515975B1 (en) 2009-12-07 2013-08-20 Google Inc. Search entity transition matrix and applications of the transition matrix
US8849785B1 (en) 2010-01-15 2014-09-30 Google Inc. Search query reformulation using result term occurrence count
WO2011090036A1 (ja) * 2010-01-19 2011-07-28 日本電気株式会社 動向情報検索装置、動向情報検索方法および記録媒体
US8903794B2 (en) * 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8150859B2 (en) * 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8260664B2 (en) * 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US20110231395A1 (en) * 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
US20110258017A1 (en) * 2010-04-15 2011-10-20 Ffwd Corporation Interpretation of a trending term to develop a media content channel
US8380723B2 (en) * 2010-05-21 2013-02-19 Microsoft Corporation Query intent in information retrieval
US11386510B2 (en) 2010-08-05 2022-07-12 Thomson Reuters Enterprise Centre Gmbh Method and system for integrating web-based systems with local document processing applications
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
JP5542017B2 (ja) * 2010-09-15 2014-07-09 アルパイン株式会社 名称検索装置
US20120095997A1 (en) * 2010-10-18 2012-04-19 Microsoft Corporation Providing contextual hints associated with a user session
US8983995B2 (en) 2011-04-15 2015-03-17 Microsoft Corporation Interactive semantic query suggestion for content search
US20120271844A1 (en) * 2011-04-20 2012-10-25 Microsoft Corporation Providng relevant information for a term in a user message
US20120290612A1 (en) * 2011-05-10 2012-11-15 Ritoe Rajan V N-dimensional data searching and display
US10776431B2 (en) * 2011-10-26 2020-09-15 Oath Inc. System and method for recommending content based on search history and trending topics
US9069880B2 (en) * 2012-03-16 2015-06-30 Microsoft Technology Licensing, Llc Prediction and isolation of patterns across datasets
US9916396B2 (en) 2012-05-11 2018-03-13 Google Llc Methods and systems for content-based search
US8620925B1 (en) 2012-05-17 2013-12-31 Google Inc. System and method for identifying advertising opportunities
US8954438B1 (en) 2012-05-31 2015-02-10 Google Inc. Structured metadata extraction
US10275525B2 (en) * 2012-06-14 2019-04-30 Excalibur Ip, Llc Method and system for mining trends around trending terms
US20130339136A1 (en) * 2012-06-18 2013-12-19 Ebay Inc. Detection of events from bursts of activity indicators
US9471606B1 (en) 2012-06-25 2016-10-18 Google Inc. Obtaining information to provide to users
CN103516583B (zh) * 2012-06-28 2017-09-29 北京奇虎科技有限公司 一种用于即时通讯中进行消息交互的方法及装置
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US8577671B1 (en) 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
US9110852B1 (en) 2012-07-20 2015-08-18 Google Inc. Methods and systems for extracting information from text
US9465833B2 (en) * 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US9390174B2 (en) 2012-08-08 2016-07-12 Google Inc. Search result ranking and presentation
US9529867B1 (en) * 2012-10-11 2016-12-27 Google Inc. System and method for providing a dynamic dashboard
US9256682B1 (en) 2012-12-05 2016-02-09 Google Inc. Providing search results based on sorted properties
US11809506B1 (en) 2013-02-26 2023-11-07 Richard Paiz Multivariant analyzing replicating intelligent ambience evolving system
US11741090B1 (en) 2013-02-26 2023-08-29 Richard Paiz Site rank codex search patterns
US20140250116A1 (en) * 2013-03-01 2014-09-04 Yahoo! Inc. Identifying time sensitive ambiguous queries
US9218819B1 (en) 2013-03-01 2015-12-22 Google Inc. Customizing actions based on contextual data and voice-based inputs
US9342503B1 (en) * 2013-03-12 2016-05-17 Amazon Technologies, Inc. Correlation across languages
US10055462B2 (en) 2013-03-15 2018-08-21 Google Llc Providing search results using augmented search queries
US10108700B2 (en) 2013-03-15 2018-10-23 Google Llc Question answering to populate knowledge base
US9477759B2 (en) 2013-03-15 2016-10-25 Google Inc. Question answering using entity references in unstructured data
US8996559B2 (en) 2013-03-17 2015-03-31 Alation, Inc. Assisted query formation, validation, and result previewing in a database having a complex schema
DK2994908T3 (da) 2013-05-07 2019-09-23 Veveo Inc Grænseflade til inkrementel taleinput med realtidsfeedback
WO2014183035A1 (en) 2013-05-10 2014-11-13 Veveo, Inc. Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
US9311406B2 (en) 2013-06-05 2016-04-12 Microsoft Technology Licensing, Llc Discovering trending content of a domain
KR102016545B1 (ko) 2013-10-25 2019-10-21 한화테크윈 주식회사 검색 시스템 및 그의 동작 방법
US9785661B2 (en) 2014-02-07 2017-10-10 Microsoft Technology Licensing, Llc Trend response management
MY184201A (en) 2014-05-19 2021-03-25 Mimos Berhad A system and method for analyzing concept evolution using network analysis
US9465831B2 (en) * 2014-07-18 2016-10-11 Wipro Limited System and method for optimizing storage of multi-dimensional data in data storage
JP6162664B2 (ja) * 2014-08-13 2017-07-12 ヤフー株式会社 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
US10210214B2 (en) 2014-08-27 2019-02-19 International Business Machines Corporation Scalable trend detection in a personalized search context
US20160103861A1 (en) * 2014-10-10 2016-04-14 OnPage.org GmbH Method and system for establishing a performance index of websites
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
US10528632B2 (en) 2016-07-19 2020-01-07 Microsoft Technology Licensing, Llc Systems and methods for responding to an online user query
US11416535B2 (en) 2018-04-20 2022-08-16 Microsoft Technology Licensing, Llc User interface for visualizing search data
US11366812B2 (en) 2019-06-25 2022-06-21 Google Llc Using live data streams and/or search queries to determine information about developing events
US11256992B2 (en) 2019-06-25 2022-02-22 Google Llc Developing event-specific provisional knowledge graphs
US20230230109A1 (en) * 2022-01-19 2023-07-20 Martin A. Alpert Trend prediction

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
WO1997008604A2 (en) * 1995-08-16 1997-03-06 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6076088A (en) 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
US6460034B1 (en) 1997-05-21 2002-10-01 Oracle Corporation Document knowledge base research and retrieval system
US6006321A (en) 1997-06-13 1999-12-21 Malleable Technologies, Inc. Programmable logic datapath that may be used in a field programmable device
AU3292699A (en) * 1998-02-13 1999-08-30 Yahoo! Inc. Search engine using sales and revenue to weight search results
JP2002521753A (ja) * 1998-07-24 2002-07-16 ジャーグ コーポレーション 複数のオントロジーに基づく検索システム及び検索方法
AU5581599A (en) 1998-08-24 2000-03-14 Virtual Research Associates, Inc. Natural language sentence parser
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6363373B1 (en) 1998-10-01 2002-03-26 Microsoft Corporation Method and apparatus for concept searching using a Boolean or keyword search engine
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6772150B1 (en) 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
US6675159B1 (en) 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
WO2002019147A1 (en) * 2000-08-28 2002-03-07 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US20020087346A1 (en) * 2000-11-28 2002-07-04 Harkey Scott T. Utilization of competencies as drivers in a learning network
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US6584470B2 (en) * 2001-03-01 2003-06-24 Intelliseek, Inc. Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction
US7194454B2 (en) * 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US20040260677A1 (en) 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179472B (zh) * 2007-05-31 2011-05-11 腾讯科技(深圳)有限公司 一种网络资源搜索方法及搜索系统
CN102124439A (zh) * 2008-06-13 2011-07-13 电子湾有限公司 用于集群化的方法和系统
CN103221951A (zh) * 2010-07-22 2013-07-24 谷歌公司 预测查询建议高速缓存
US9323808B1 (en) 2010-07-22 2016-04-26 Google Inc. Predictive query suggestion caching
US9720956B2 (en) 2014-01-17 2017-08-01 Facebook, Inc. Client-side search templates for online social networks
CN105917330A (zh) * 2014-01-17 2016-08-31 脸谱公司 用于在线社交网络的客户端搜索模板
CN105917330B (zh) * 2014-01-17 2017-10-17 脸谱公司 用于在线社交网络的客户端搜索模板
CN106257942A (zh) * 2015-06-16 2016-12-28 思科技术公司 在网络环境中使用用户设备组协助服务移出的系统和方法
CN106257942B (zh) * 2015-06-16 2019-09-13 思科技术公司 在网络环境中使用用户设备组协助服务移出的系统和方法
CN110033156A (zh) * 2018-12-14 2019-07-19 阿里巴巴集团控股有限公司 一种业务活动效果的确定方法及装置
CN110033156B (zh) * 2018-12-14 2023-05-09 创新先进技术有限公司 一种业务活动效果的确定方法及装置
CN112446493A (zh) * 2019-08-28 2021-03-05 国际商业机器公司 使用对话系统来学习和推断判断推理知识
CN112446493B (zh) * 2019-08-28 2024-08-16 国际商业机器公司 使用对话系统来学习和推断判断推理知识
CN111159248A (zh) * 2019-12-12 2020-05-15 北京字节跳动网络技术有限公司 信息检索方法、装置和电子设备
CN111159248B (zh) * 2019-12-12 2023-04-28 北京字节跳动网络技术有限公司 信息检索方法、装置和电子设备

Also Published As

Publication number Publication date
WO2005050367A3 (en) 2006-08-24
EP1690169A4 (en) 2008-12-17
JP4722051B2 (ja) 2011-07-13
KR20070007031A (ko) 2007-01-12
CN100401292C (zh) 2008-07-09
KR101031449B1 (ko) 2011-04-26
US7240049B2 (en) 2007-07-03
US20070226198A1 (en) 2007-09-27
JP2007511016A (ja) 2007-04-26
US20050102259A1 (en) 2005-05-12
WO2005050367A2 (en) 2005-06-02
US7562076B2 (en) 2009-07-14
EP1690169A2 (en) 2006-08-16

Similar Documents

Publication Publication Date Title
CN100401292C (zh) 用于使用倾向分析进行搜索查询处理的系统和方法
US9971842B2 (en) Computerized systems and methods for generating a dynamic web page based on retrieved content
US10423880B2 (en) Systems and methods for providing recommendations based on collaborative and/or content-based nodal interrelationships
CN101111837B (zh) 查询自动分类的搜索处理
US8032508B2 (en) System and method for URL based query for retrieving data related to a context
US8060492B2 (en) System and method for generation of URL based context queries
CA2573672C (en) Personalization of placed content ordering in search results
CN102859516B (zh) 使用历史搜索结果生成改进的文档分类数据
US20090327913A1 (en) Using web revisitation patterns to support web interaction
US20100125569A1 (en) System and method for autohyperlinking and navigation in url based context queries
US20100125605A1 (en) System and method for data privacy in url based context queries
JP2012113744A (ja) エンタープライズウェブマイニングシステム及び方法
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
CN112868003A (zh) 使用用户互动度的基于实体的搜索系统
JP2002539559A (ja) インターネット検索とホットリンクを結びつける、相乗作用を生むインターネットブックマーク
KR20240015280A (ko) 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법
Das et al. Suitability of Web Usage Mining for Web Content Syndication

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: FEIYANG MANAGEMENT CO., LTD.

Free format text: FORMER OWNER: YAHOO CORP.

Effective date: 20150331

TR01 Transfer of patent right

Effective date of registration: 20150331

Address after: The British Virgin Islands of Tortola

Patentee after: Fly upward Management Co., Ltd

Address before: American California

Patentee before: Yahoo Corp.