CN102138140A - 利用综合语义语境的信息处理 - Google Patents
利用综合语义语境的信息处理 Download PDFInfo
- Publication number
- CN102138140A CN102138140A CN2009801337221A CN200980133722A CN102138140A CN 102138140 A CN102138140 A CN 102138140A CN 2009801337221 A CN2009801337221 A CN 2009801337221A CN 200980133722 A CN200980133722 A CN 200980133722A CN 102138140 A CN102138140 A CN 102138140A
- Authority
- CN
- China
- Prior art keywords
- information
- linguistic context
- context
- user
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
Abstract
用于生成用于多个信息的参照系的系统和方法,多个信息含有由用户通过与一个或者多个信息源交互所获得的文本数据,包括接收所选择的用于分析的信息,该信息包括文本数据并且识别文本数据的多个逻辑单元。识别在逻辑单元的每个中的多个独立正文部,并且计算与每个独立正文部关联的逻辑单元的数量以便在识别模式中使用。基于模式,计算重要性测度并且基于满足预先定义的重要性阈值的重要性测度选择模式。基于选择的模式生成多个信息语境定义并且分配所生成的信息语境定义作为与参照系关联的语义语境的语境界定。多个信息彼此相关并且通过语义语境的生成的语境定义来表示这种关系。
Description
技术领域
本发明涉及通过通信网络来有效访问信息。
背景技术
由于通过诸如搜索引擎的各种搜索工具而可以在线获取的可用信息不断扩大的可利用性,互联网的使用日益流行。遍及本地企业和远程互联网,计算机用户面临不得不把巨大数量的信息分类。互联网快速成为了用于获取有关产品、地点、人物等信息的主要信息搜索工具。遗憾地,由于可用数据难于管理的数量以及用户不能接收对于用户高效使用所期望的搜索结果,互联网也迅速变成其自身成功的受害者。
与互联网搜索方法学有关的一个问题是通过表面上直接搜索所获得的不期望数量的搜索结果。即使对于最有经验的互联网搜索者,关于任何特定论题的可用信息的数量也可能是巨大的。通常,搜索结果充满了可能不适用于搜索者所希望的搜索语境的大量信息。此外,搜索者可能希望多于其他类型的某种信息类型。当然,缺点是搜索者不得不筛选表面上不属于搜索者兴趣/希望的搜索结果容量。因此,诸如搜索引擎的工具和文档管理系统可能通过将越来越多数量的信息推向用户桌面,产生被数据淹没的感觉而加重了该问题。此外,认识到当前搜索技术是反应性的并且同样地,需要用户停止他们当前任务并且查询访问信息的数据源。
此外,增加“信息混乱”是当今许多计算机用户从事多重、通常不同的项目的事实,并且用户对于存储在其计算机中的相关信息(与他们当前项目有关)的有序且优化访问可能是难以解决的。这种组织能力的缺乏可能显著降低用户(例如,律师、会计、顾问、教育者、医生…)利用与其当前项目相关的信息经由计算机来高效工作的的能力。在用户计算机上与信息杂乱无章有关的普遍问题是“哪个相关文档在桌面上?”;“哪个电子邮件线索是项目的一部分”;“什么网络搜索和结果在该项目内?”;“什么文档、报告、数据、电子邮件、图片、视频为该项目的一部分”;以及“哪个文件在桌面系统、服务器上、或者在文档管理系统中?”。这些组织问题的一种解决方案是用户手动创建并且管理用于相关信息的大量目录和文件夹。然而,这种组织类型的本质是:任何希望的改变需要用户方的大量人力。
当前搜索技术的另一缺点在于即使存在多个搜索者当前在线搜索类似的主题(例如,佛罗里达的低价旅行),但是多个搜索者孤立地进行搜索。因此,多个搜索者不能平衡彼此花费在找到类似主题的任务上的时间。
发明内容
本发明的目的是提供信息处理环境以消除或者缓解至少一些以上所提出的缺点。
诸如搜索引擎的工具和文档管理系统可能通过将越来越多数量的信息推向用户桌面,产生被数据淹没的感觉从而加重信息过载问题。此外,认识到,当前搜索技术是反应性的并且同样地,需要用户停止其当前任务并且查询访问信息的数据源。与当前系统和方法相反地,提供了用于生成用于多个信息的参照系的系统和方法,多个信息含有文本数据并且由用户通过与一个或者多个信息源交互所获得。该方法和系统包括接收用于分析的经选择信息,该信息包括多种文本数据并且识别文本数据的多个逻辑单元。还包括识别每个逻辑单元中多个独立正文部并且计算与多个正文部的每个独立正文部的相关的逻辑单元的数量以便在识别包括用于每个独立正文部的各个模式的多个模式中使用。基于所识别的模式,计算用于多个模式中每一个的重要性测度并且基于其对应的、满足用于在多种模式中的保持相应模式的预先定义的模式重要性阈值的重要性测度来从多个模式选择相应模式。此外,基于选择的各个模式生成多个信息语境定义并且将生成的信息语境定义指定为与参照系相关的语义语境的语境定义。多个信息彼此相关并且通过所生成的语义语境的语境定义来表示这种关系。
所提供的第一方面是用于生成用于多个信息的参照系的方法,多个信息含有文本数据并且由用户通过与一个或者多个信息源交互所获得,该方法包括:接收经选择的用于分析的信息,该信息包括多个文本数据;识别文本数据的多个逻辑单元;识别在每个逻辑单元中的多个单独语境部;计算与多个正文部的每个独立正文部相关的逻辑单元的数量以便在识别包括用于每个独立正文部的相应模式的多个模式中使用;计算用于多个模式中每一个的重要性测度;基于满足用于在多个模式中保持各个模式的预先定义模式重要性阈值的模式的相应重要性测度,来从多个模式中选择各个模式;基于选择的各个模式生成多个信息语境定义;以及将从选择信息中所获得的生成的信息语境定义指定为与参照系相关的语义语境的语境定义,多个信息彼此相关并且通过语义语境的语境定义来表示这种关系。
提供的另一方面是从多个经选择的信息中选择语境定义作为独立正文部;识别包括语境定义的文本数据的多个逻辑单元;计算与每个语境定义相关的逻辑单元的数量以便在识别包括用于每个单独语境定义的相应语境定义模式的多个语境定义模式中使用;计算用于多个语境定义模式中每一个的重要性测度;基于语境定义模式满足用于在多个语境定义模式中保持各个语境模式的预先定义的语境定义模式重要性阈值的相应重要性测度,来从多个语境定义模式中选择各个语境定义模式;基于所选择的各个语境定义模式生成多个二次信息语境定义;以及将从选择的多个信息中所获得的生成的信息二次语境定义指定为与参照系相关联的语义语境的二次语境定义。
所提供的另一方面是接收用于分析的另外信息,该另外信息包括多个其他文本数据;识别其他文本数据的多个其他逻辑单元;识别在每个逻辑单元中的多个其他单独正文部;计算与多个其他正文部的每个独立其他正文部相关的逻辑单元的数量以便在识别包括用于每个独立其他正文部的相应其他模式的多个其他模式中使用;计算用于多个其他模式中每一个的重要性的其他测度;基于满足用于在多个其他模式中保持各个其他模式的预先定义的其他模式重要性阈值的其他模式的相应其他重要性测度,来从多个模式中选择各个模式基于满足用于保持在多个其他模式中的各个其他模式的其他预先定义的模式重要性阈值的重要性其对应其他测度来从多个其他模式中选择各个其他模式;基于选择的各个其他模式生成多个其他信息语境定义;以及将生成的其他信息语境定义与语义语境的语境定义相比较以确定通过接收的另外信息与语义语境相关的多个信息的关联性程度。
所提供的另一方面是接收的其他信息是根据信息查询所获得的信息并且接收到的其他信息是基于用户请求或者基于独立于用户互动的用户的语境引擎的请求。从以下各项选择信息查询:数据库查询;文档的结构化查询;以及网页查询。语境引擎的请求是基于用户的活动由语境引擎所发起的预测性查询,其中,用户的活动选自以下各项:除了在提交用户请求以前,当用户在参照系的语义语境中时;除了在提交用户请求期间,当用户在参照系的语义语境中时;以及除了在提交用户请求以后,用户在参照系的语义语境中时。将来自语义语境的语境定义提供给用户作为用于通过用户选择的查询建议。
附图说明
现在仅以示例方式,结合附图描述本发明的典型实施方式,其中:
图1是信息处理系统的部件的框图;
图2示出了图1的系统的语境引擎的示例性配置;
图3示出了图2的语境引擎的示例性工作流程;
图4是用于实现图1和图10的系统部件的示例性计算装置的框图;
图5是图3的语境引擎的操作流程图;
图6示出了通过图3的语境引擎的信息14的示例性划分;
图7是图1的系统的语境引擎的示例性操作的流程图;
图8是图1的系统的信息集合和语义语境15的组织的示例性实施方式;
图9是图1的系统的语境引擎的示例性操作的流程图;
图10是可以耦合至图1的系统的协作环境的部件的框图;
图11示出了图10的环境的示例性搜寻信息集;
图12是图10的环境的选择性实施方式;
图13示出了图12环境的对应搜索语境和示例性搜索信息集;
图14是图10的环境的协作引擎的部件的框图;
图15示出了图10的环境的协作服务器的比较处理的示例性结果;
图16示出了图10的环境的语境引擎的示例性配置;
图17是图10的环境的协作服务器的部件的框图;
图18是图10的环境的操作流程图;以及
图19是经由图10的协作服务器所提供的示例性用户界面内容。
具体实施方式
信息处理系统10
参照图1和图2,示出了用于创建和保持用于用户工作活动的定义的参照系(FoR)12的信息处理系统10,该信息处理系统包括通过通信网络11经由信息请求18和信息响应20从各种信息源16检索的信息14。信息源16可以被配置为直接与用户通信(例如,在用户与Web服务之间)和/或被配置为间接与用户通信(例如,通过信息源16的组17在用户与第三方搜寻引擎24之间)。信息14可以是诸如(但不限于)如下信息对象类型:电子文档(例如,含有正文和/或图像信息);网络消息(例如,诸如Web服务消息的其他网络11通信或者电子邮件);数据库内容(从远程17和/或本地210存储器(参见图4)获得的内容);和/或(例如)基于搜寻查询的搜索结果。如下文中进一步描述的,认识到信息14可能包括应用程序(例如,Microsoft Word、PowerPoint、Excel、Outlook、Internet Explorer)的状态和/或应用程序的特定生成结果(例如,Word文档、报告、电子数据表、电子邮件、浏览器搜索结果)。
应当认识到,信息请求18和信息响应20可能涉及诸如(但不限于)以下28信息查询:数据库查询;文档(或者其他信息14)的结构化查询;以及Web(例如,网络11)查询。认识到,当以结构化定义语言(例如,XML)存储越来越多的信息,以结构化定义语言交换越来越多的信息,或者通过各种界面以结构化定义语言提交越来越多的信息时,期望智能查询结构化定义语言数据源的能力。例如,可以将以结构化定义语言定义的信息14(例如,文档)称作结构化信息(例如,文档)并且因此,可以把信息14看作数据源并且可以把传统数据源(例如,数据库)看作信息14(例如,文档)。
如下文中进一步描述的,FoR 12可以包括具有与FoR 12相关的一个或者多个语义语境15和与其相关的信息14的可视外壳(例如,参见图4,在计算装置101的用户界面202上的显示203)。当用户继续以FoR 12工作时,可以维持/开发其工作环境的可视方面以有助于表示与FoR 12相关的语义语境15。同时,如下文中进一步描述的,基于用户正在创建或参考的信息14内容(例如,文档),通过语境引擎100(参见图2)来建立语义语境15,或者相反地进行修改,以考虑从信息14所确定的信息语境19(包括所确定的语境定义105)。
认识到,基于通过语境引擎100与信息14相关的信息语境19,当用户操作/访问本地创建/存储的(例如,用户创建的文档、信息请求18等)和/或从远程信息源16所获得的信息14的时候,语境引擎100可以动态地开发与FoR 12相关的语义语境15。在任何情况下,为了断定所选择的信息14涉及哪种(如果有)语义语境15,将系统10用于定义FoR 12的语义语境15并且用于将从选择的信息14所确定的信息语境19(例如,在创建语义语境15以后,由用户访问的文档)与FoR 12的语义语境15进行比较。认识到,语境引擎100可能确定信息语境19不与任何一种语义语境15匹配,并且因此,可以将信息语境19作为基础来创建FoR 12的新语义语境15。
例如,语境定义104集合表示或者另外定义用于信息14集合的语义语境15的语义论题内容。例如,结合自一个或者多个文档的语境定义104表示指定给文档组/与文档组相关的总语义内容15。同样地,对于单独信息14部(例如,文档、Web页等),所确定的语境定义105集合表示信息14的语义论题内容,然后,将该信息接着用于与现有语义语境15的比较目的,以确定单独信息14部是否涉及该语义语境15。换句话说,将独立信息14部的语境定义105与语义语境15的语境定义104进行比较。例如,从文档所获得的语境定义105表示该文档的信息内容19。
经由一个或者多个通信网络11(诸如,内部网和/或外延网-例如,互联网)便于在用户装置101、信息源16、以及搜索引擎24之间的通信,并且由用户通过用户界面202(参见图4)实现。如所期望的,系统10可以包括多个用户装置101、多个语境引擎100、多个信息源16、多个搜索引擎24、以及一个或者多个耦合的通信网络11。认识到,语境引擎100可以存在于用户装置101上(如通过实施例所示的)或者可以被配置为通过网络11由用户装置101容易访问的网络服务。
信息请求18
作为通过用户搜索和检索的信息14的实施例,以下论述使用通过通信网络11的信息请求18和信息响应20,从而通过语境引擎100来处理信息14(可能包括相关的信息请求18)以使用所确定的信息语境19动态建立/修改与FoR 12相关的语义语境15。认识到,更普遍地,信息请求18和信息响应20还可能包括用于在用户计算装置101上本地创建/修改/获得/存储文档和/或消息(和其他信息14)的用户活动。
用户的请求18包括搜索参数22(例如,关键词术语、词组等),以便在有助于从一个或者多个信息源16中识别适当地涉及已经存在于(例如,与其相关的)所定义的FoR 12中的信息14的所期望的信息14。认识到,FoR 12的定义的初始/预备版本可能包括初始/预备信息14,诸如但不限于:用户定义的标题和/或内容定义/描述;用户选择的文档(例如,来自本地存储器17);和/或用户从搜索响应20中选择的信息对象(例如,关于含有对于另一文档、网页或其他网络资源的索引或者导航元素、以及对于网页位置的索引和导航元素的搜索结果页的选择链接)。认识到,选择的信息14对象对于用户而言可能位于本地(例如,诸如数据库的文件系统)或者位于远程(例如,经由互联网的访问的Web服务)。如下文中进一步描述的,语境引擎100可以使用初始/预备信息14,以构造FoR 12的语义语境15以便随后在分析由用户通过与其计算装置101交互所获得的后续信息14中使用。
搜索请求18含有搜索参数22以有助于从信息源16中识别所期望的信息14,信息源诸如但不限于是以下各项:图像文件、视频文件、音频文件、文本或者文学文件;文章/书籍评论;网页/网站;电子文档;网络广告;RSS种子;博客;和/或播客。用户通过网络11提交搜索请求18,以定位潜在地涉及FoR 12的语义语境15的期望信息14。随后,可以通过语境引擎100来过滤通过搜索请求18(例如,通过与至少某些搜索参数22匹配)返回的该信息14,以获得认为与用户兴趣最相关的信息14子集,即,与在语义语境15中所含有的语境定义104(参见图2)相关的信息14。还认识到,可以通过内容搜索模块106可选地增加搜索请求18的搜索参数22(例如,补充搜索请求18),以在向信息源16提交搜索请求18之前包括至少一些语境定义104(以幻图示出)。可替换地,或者作为补充,在报告给用户以前,可以通过内容搜索模块106进一步分析基于用户提供的搜索参数22的、接收到的搜索结果20(例如,来自基于Web的搜索引擎)。例如,内容搜索模块106可能使用至少一些语境定义104修改或者以其他方式对于在搜索结果20中所含有的信息14链接的排列进行重新排序。
在一个实施方式中,接收到的其他信息(例如,来自经由网络11连接至用户的其他用户)可能是从以下的信息查询18所获得的信息14,信息查询诸如(但不限于):数据库查询;文档的结构化查询;和/或Web查询。接收到的其他信息可能基于用户请求18或者基于与用户交互无关地用户的语境引擎100的请求18。例如,引擎100的请求18可能是基于用户活动由引擎100发起的预测性查询,用户活动诸如但不限于:当用户在参照系(例如,FoR 12)的语境15中时,但是在提交用户请求18以前;当用户在参照系(例如,FoR 12)的语境15中时,但是在提交用户请求18期间;以及当用户在参照系(例如,FoR 12)的语境15中时,但是在提交用户请求18以后。
此外,例如,当在已经进行任何搜索之前、期间、或之后用户处于语境15中时,可能发生直接通过引擎100的预测性搜索(例如,提交请求18)和相关的预测性检索(例如,接收响应20)。引擎100可以根据在语境15中最确定的语境定义104的确定重要模式来构造查询字符串(预测性请求18的查询字符串)。搜索字符串可能为结合(例如,或的)在一起的非重叠模式的集合。通过与信息源16(或者耦合至信息源16的诸如搜索引擎24的第三方服务器)的通信由引擎100发起搜索。注意,搜索字符串可能不用于与其他语境15匹配,而是用于在语境15内的选择的语境定义104。然后,当用户打开FoR 12的相应的应用程序(例如,MicrosoftWord、Web Browser等)时,用户可被呈现搜索结果20。还认识到,语境引擎100可以使用搜索字符串。当不存在可用的语境定义104时,语境引擎100可以使用搜索字符串作为退化情况(例如,选择作为单个语境定义104),从而可以在可由语境引擎100使用的唯一信息(例如,用于语义语境15)的情况下把搜索字符串看作语境定义104。
此外,例如,当用户在其计算机上打开FoR 12的应用程序(诸如,网页浏览器或者文件资源管理器)或者其他应用程序时,在搜索文本框中的自动完成能力可以在下拉组合框中向用户提供搜索建议。例如,这通过使用从选自语境15的语境定义104的关键模式经由引擎100来实现,以为用户提供在用户可以从下拉列表中选择的基于语境类型的前面搜索/查询建议。
请求18实施例
系统10的用户可能使用语义语境15的语境定义104来使搜索请求18的搜索参数22具有倾向性,以提炼请求18和/或结果20的评价。搜索模块106可以将请求18的初始参数22与语境定义104进行比较,以确定在语境定义104中含有的词Wn是否包括至少一些搜索参数22。例如,当提交搜索请求18时,如果在用户的FoR 12的语义语境15中不存在相关的语境定义104,则搜索模块106(语境引擎106-参见图2)没有修改用于查询搜索引擎(例如,信息源16)的搜索字符串(例如,搜索参数22)。
然而,如果在参数22和语境定义104之间存在确定的匹配,则通过搜索模块106从语境定义104(例如,论题)中选择信息(例如,词、短语等)然后用于增加搜索请求18(例如,查询)的参数22,然后将其发送至安排相应搜索的搜索引擎。换句话说,搜索模块106可以利用从语境定义104中选择的内容(例如,确定的最重要的模式)附加参数22(例如,倾向的单词)的基本术语,以增加查询字符串。例如,这可能通过语境定义104(例如论题)执行语境定义104。在包括选择模式的单词最小化重叠的情况下,从最重要的语境定义104(或者满足定义重要性阈值的另外的语境定义104)中选择最重要的模式(或者满足模式重要性阈值的另外的模式)。
例如,通过搜索模块106接收对于Research In Motion(RIM),电信公司工作的用户搜索请求。在这种情况下,用户寻找RIM的工程师职位。然而,如果用户搜索“RIM工作”(例如,作为向搜索引擎所提交的搜索参数22),则至少对于在搜索结果列表中的较高排序结果的搜索结果20可能全部/大部分涉及性别材料。例如,在Microsoft Live Search和Google上测试搜索请求“RIM工作”。Live搜索返回的搜索结果20在结果(每页约10条)的前5页中没有包含就业机会的索引而Google搜索返回的搜索结果20在前5页中含有在第二页上的第一条、在第三页中的第二条的两条索引。
通过将“RIM”和“job”的搜索参数22与用户寻找职业处所定义的语义语境15的语境定义104进行比较来重复搜索请求18。语境定义104含有单词“工作”、“职业”、“工程师”、“职位”及其组合,和“性别”、“口才”等的排除/否定/限制语境定义104。搜索模块106确定在搜索参数22和语境定义104之间存在匹配,即,这两者都含有单词“工作”。因此,搜索模块106利用来自语境定义104的匹配模式来增加基础查询18,从而搜索请求18的查询字符串变为:查询=(RIM+工作|RIM+职业|工作+工程师+职位非(性别|口才|等…)…)。基于选自语境定义104的内容而增加/修改的查询18使得搜索引擎106从所提供的所有搜索字符串中返回结果20。可选地,还对比语境定义104模式给结果20评分,使得没有结果涉及性别内容并且返回涉及就业机会的所有结果用于用户在用户界面202上审阅。认识到,可能基于选自语境定义104的内容(例如,单词Wn)修改基础搜索参数22和/或可能基于选自语境定义104(例如,通过评分技术过滤性别索引,从而没有经由搜索结果20向用户显示的性别索引)的内容(例如,单词Wn)修改结果20。
认识到,可能将系统10配置为使得在用户没有主动地做任何事情的情况下来开始搜索信息。由搜索模块106从语义语境15的语境定义104选择的匹配模式结合在查询字符串(例如,参数22)中,以催化该搜寻(例如,搜索请求18)。搜索模块106可能还给结果20评分并且用户以前摄方式得到结果(即,在用户方面不需要请求或者行动),从而向用户示出结果20的最相关信息,例如,将语境定义104用于排序搜索结果20。
另外,如果用户访问选择信息14(例如,打开Microsoft word),则协作引擎150可以在与选择信息14的信息语境19相关的信息源16中搜索,然后提出显示了所认为的相关信息源16的任务窗格(例如,在用户界面202上)。下文中,对于协作环境140进一步描述的,认识到,所认为的相关信息源16可能包括被认为正从事相关材料(即,信息14的信息语境19与相关信息源16的信息语境19相匹配)的一些其他用户分组(例如,远离用户但经由互联网11可访问的)或者在用户企业中的同事。
在另一实施例中,用户可能将语境定义104与其语义语境15(该用户FoR 12的语义语境)相关联,表明用户从在线视频商店获得/审查一些记录片并且该用户是某一在线历史兴趣组的会员。因此,语境搜索模块106可以修改用户搜索请求18,以在搜索参数22中包括来自定义表的语境定义104,其声明用户对纪录片感兴趣并且参加历史兴趣群(例如,使用指定的与用户的语义语境15相关的“记录片”和“历史兴趣”语境定义104)。包含这些语境定义104可以优选地对搜索结果20进行加权(例如,在更新搜索请求18以后所生成的的搜索结果,以包括“纪录片”和“历史兴趣”)以包括属于记录片和/或历史兴趣的信息14,或者按照其他方式,在随后搜索结果20中所包括的信息14的列表中使这些信息14排序更高。通常,语境搜索模块106可能利用所选择的一些语境定义104(或者至少从语境定义104中选取的单词/短语)修改搜索请求18,从而使搜索结果20更适用于用户。另一种选择是内容搜索模块106将搜索结果20与语义语境15的语境定义104进行比较,从而为来自搜索结果20、(例如)与语义语境15的语境定义104的阈值评分测量相匹配(经由其确定的信息语境19)的这些信息14提供较高排序。
FoR 12
系统10的一个特性在于其能够如用户所希望的而有助于建立、使用以及从FoR 12中删除语义语境15。例如,在动态FoR 12的情况下,当用户搜索涉及多个不同语义语境15的信息14时,语境引擎100可以确定正在查找的信息14的信息语境19是否与动态FoR 12的现有语义语境15(或者,多个现有语义语境15)相匹配。如果匹配,则语境引擎100使用所确定的信息语境19的内容定义105作为附加信息,以建立/提炼语境定义104。可以将修订/修正/修改的语义语境15用于将当前搜索结果20的剩余信息14结果进行分类或者以其他方式对剩余信息结果进行过滤(例如,这使得基于改变的语义语境15来相应地改变当前检索结果的排序/内容),和/或可以将其用于过滤随后搜索结果20(和/或修改随后搜索请求18的搜索参数22)。
此外,基于在各个信息语境19的内容定义105和语义语境15的语境定义104之间的比较,如果正在查找的新信息14不符合现有语义语境15,则语境引擎100可能使用不匹配的内容定义105来自动创建新语义语境15。因此,当用户在数个语义语境15间切换(例如,混合格斗、去牙买加旅行、专利保护等)同时与FoR 12互动时,可以将语境引擎100配置为基于确定的语境定义105与现有语义语境15的内容定义104的比较结果来动态创建新语义语境15或者不断磨练现有语义语境15。此外,认识到,可以由系统10无限期地或者在所选择的时间段内(例如,直到在由多个家庭成员共享的计算机上关闭使用的所有浏览器窗口)使动态FoR 12中创建的语义语境15持续存在。
此外,参照图1,FoR 12可能包括在装置101(参见图4)与定义的语义语境15相关的用户的工作会话。例如,工作会话可能包括如通过内容引擎100所维持的语义语境15,以及内容引擎100与表示另一程序、或者程序集的图形用户界面(GUI)的互动,其中这些程序通过图标、窗口、工具栏、文件夹、壁纸/背景、和/或专用界面工具集向用户呈现。该程序或者程序集的一个实施例是被认为窗口管理程序或者包括窗口管理程序的一系列程序的桌面环境(例如,Microsoft Windows XP或者MicrosoftVista)。总体上,GUI有助于用户使用与实体世界(诸如按钮和窗口)互动时所使用的类似概念来与计算机程序互动。仅为了证明的目的,以下使用表示为桌面的FoR 12。认识到,语境引擎100与由桌面所提供的一个或者多个程序合作,以经由语义语境15来优化基于用户正在进行的工作会话内的语境定义104(例如,论题)的用户信息14访问。认识到,当用户完成涉及定义的语义语境15(其还可以与其他用户共享)的工作活动时,用户可以保存包括桌面程序状态的用户工作会话状态。可替换地,一旦完成用户的工作会话,可以删除语义语境15(以及对桌面程序的任何修改)。
因此,FoR 12GUI的用户交互特性可以包括应用程序状态项,诸如但不限于:桌面图标;最近使用的用于窗口和应用程序的菜单项;网页浏览器爱好;以及维持状态的窗口桌面的其他通用特性。下文中进一步描述的程序修改器模块108可以经由语义语境15增加这些交互FoR 12用户特性的状态。例如,程序修改器模块108可以使用语义语境15的内容定义104以重新排序最近使用的菜单项、网页浏览器爱好、以及维持状态的窗口桌面的其他通用特性,从而动态更新窗口特性以解释定义的语义语境15。例如,程序修改器模块108将基于与一个或者多个语境定义104(或者其他预先定义的定义匹配阈值)最匹配的这些爱好来修改列出的网页浏览器爱好的顺序,例如,在爱好列表中将与大部分语境定义14匹配的爱好(例如,在定义104的指定阈值数量之上匹配的爱好)放置高于与语境定义104较差匹配的爱好。以这种方式,将语境引擎100用于阻止经由FoR 12向用户呈现的混乱和/或不相关信息14,这些混乱和/或不相关信息与涉及与当前定义的语义语境15无关的先前的方案/工作的信息14相关。
在一实施方式中,在语义语境15创建中的第一步是用户识别语义语境15并且将信息14提供给语境引擎100以便在创建初始语境定义104中使用,认识到,用户可能实际上除了识别语义语境15以外不必做任何事然后可以没有从用户识别的任何初始定义/信息14的擦除而通过语境引擎100来建立语义语境15。还可以明确定义、命名语境15并将语境与桌面(例如,FoR 12)关联。
例如,用户可以运行或者另外启动与语境引擎100(或者本地或者远程)的通信,其为用户提供输入语义语境15的名称和/或描述。一旦开始,定义的语义语境15表示用于用户的特定方案的工作环境。可能通过语境引擎100使用语义语境15以包括用户工作环境(例如,桌面GUI)的可视和环境方面,以及例如用户正在工作的论题的方案的语义方面。虽然用户在FoR 12中工作,但是语境引擎100可能在后台运行并且基于对于用户看不见的和/或需要用于修改/更新语义语境15的用户输入的用户活动来生成语义语境15。如上所述的,当用户在诸如对于商业用户通用的文字处理器、电子数据表、网页浏览器以及其他应用程序的应用程序中工作时,语境引擎100还可以保持应用程序状态信息。可以将该应用程序(包括诸如文档、搜索结果等的应用程序的生成结果)定义为包括所有类型的文档和其相关程序。例如,文档类型可能包括诸如但不限于:Microsoft Office文档-Word、PowerPoint、Excel、Visio、Access、Publisher、Frontpage、OneNote等;在诸如Microsoft Outlook的电子邮件/管理器程序中的电子邮件、日历事件、记录(在写字板上打字或者手写的)以及任务;网页和基于SGML的文档(例如,XML)的其他形式;数据库、数据库报告、以及数据的其他示图;Adobe Acrobat PDF;照片、扫描图像以及视频。应该注意,用户没有必要明确命名或者识别语境15。语境引擎100可以通过测量看起来用户感兴趣的材料的关联性(即,下文中进一步描述的语境定义104、105的计算)基于用户与系统10互动来暗示和创建语境15。
此外,认识到,可以由语境引擎100保持的信息14的类型可能包括诸如但不限于:包括桌面(图标、背景、主题以及其他配置)的Windows、最近的程序(和诸如表示历史监控用户与应用程序互动的临时非独立状态信息的程序内部的状态信息)、最近的文档、我的文档、以及文件夹查看;包括我的爱好、书签、最近搜索、历史搜索、最近网页等的网络浏览器;以及包括在文件菜单中的最近文档的Office Applications、电子邮件、记事本、任务、日历、联系人和电话(例如,在MS Outlook、MS OneNoteNotebooks内)、以及文档管理系统索引和查询。
语义语境15和信息语境19
再次参照图2,与For 12关联的语义语境15包含用来存储用于定义语义语境15的语境定义104的表(或者其他结构化存储结构)。认识到,语境定义104可能提供关于语义语境15的标识、分类、描述、和/或标签信息。例如,用户可能经由用户界面202(参见图4)向语境引擎100提供初始定义104(作为代表期望的语义语境15而被处理的材料)以便在创建初始语义语境15中使用。认识到,用户还可能使语境引擎100从用户访问的信息14中选择语境定义104,以便在创建初始语义语境15中使用。将语义语境15用于定义还称作搜索信息集154(参见图10)的多个信息14(例如,一系列搜索结果20以及由用户收集的其他文档)彼此相关的方式并且通过语境定义104来定义这种关系的方式。此外,用户访问的、对于选择的信息14所确定的信息语境19具有用于定义信息14的语境的相关语境定义105。
参照图8,示出了在系统10内的信息14的组织的示例性实施方式。由用户所收集的信息14的集合具有包括多个语境定义104的指定语义语境15。信息的集合还具有单独信息14(例如,一个或者多个文档集、网页、网页链接-例如,浏览器书签等),每个单独信息均具有其自身指定的信息语境19。下文中进一步论述的语境引擎100还将语境定义104、105彼此进行比较324(参见图7)以确定是否通过信息的集合包括新信息14(通过在图8中的重影项14、19来表示判定)。
例如,包括用于佛罗里达的旅游、酒店、以及娱乐活动的网页的多个单独信息14(例如,信息集合)将分配到具有“佛罗里达”、“低价旅行”、“推荐旅游胜地”、“帆伞活动”、“佛罗里达冒险行程”、“迈阿密夜总会”、以及“佛罗里达旅游和娱乐活动”(作为结合所有其他语境定义104的超级论题的实施例)等语境定义104的语义语境15。单独信息14还通过指定的语境定义105具有独立的信息语境19,例如,旅游网页将具有表示其信息语境19的信息语境105“低价旅游”和“佛罗里达”,酒店网页具有表示其信息语境19的信息语境105“推荐旅游胜地”和“佛罗里达”,并且娱乐信息(例如,旅游手册文档)具有表示其信息语境19的信息语境105“帆伞活动”、“佛罗里达冒险行程”、“迈阿密夜总会”。参见图10,认识到,从用于还称作搜索信息集154的单独信息14的集合的语义语境15的语境定义104动态收集单独信息语境19的语境定义105,并且语义语境还称作搜索语境156。如下文中进一步描述的,当用户获得新信息14(例如,推荐的佛罗里达所有旅游胜地的列表)时,语境引擎100确定用于新信息14的信息语境19的语境定义105(例如,“旅游胜地”、“最佳推荐”、“佛罗里达”、“包括一切的”),然后进行比较以确定是否通过信息集合和语义语境15添加/收集新信息14和/或其信息语境19。
认识到,语境定义104、105可能提供关于信息14的标识、分类、描述、和/或标签信息。认识到,用户可以使语境引擎100确定用于由用户访问的信息14的语境定义104、105以便在创建信息语境15、19中使用,和/或用户可以指定在生成语境15、19期间由语境引擎100使用的语境定义104、105。例如,用户可以在信息14中选择一些单词或者单词组合,在确定语义语境104、105中使用。
例如,语境15、19可以包括超级论题、论题及模式(例如,语境定义104、105),其中,每一个均根据另一个来建立(即,由论题来建立超级论题,由模式来建立论题,从而超级论题可以被认为是论题的进一步概况)。每个模式均包括在模式中的单词和在分析文档(例如,信息14)中的单词相对频率。通过参照发现该结构的文档(例如,信息14),将这些结构(例如,超级论题、论题、以及模式)添加在存储器210中。此外,通过在存储器210中指向全局词典109(参见图2)的关键字来表示该结构的所有单词,全局词典包括:识别每个单词Wn的语言全局统计、其唯一指示符In(例如,唯一整数或者其他值)以及在包括每个单词Wn的全局单词集(例如,语言)中的其全局自信息(例如,相对频率)。认识到,全局统计可能来自该语言的单词Wn使用和/或来自通过文档主体的训练。你还可以在给定了单词Wn使用的任何差别的词典109中具有医学、法律、以及(专门(例如,技术))倾向。
随后,可能允许用户104明确(例如,提供实际单词/短语)或者隐含地经由信息14的关联来监控(例如,添加、修改、或者删除)语境定义104,其中,信息14的关联包括在确定语境定义104期间通过语境引擎100使用的潜在单词/短语。例如,用户可以命令语境引擎100包括一个或者多个文档内容以便在创建或者另外修正FoR 12的语义语境15期间使用。还认识到,语境引擎100可以自动(例如,没有接收来自用户的指示)包括由用户访问的信息14,以便在确定语义语境15的语境定义104期间使用。除非另有建议(例如,通过语境引擎100),否则用户可以希望在搜索请求18和/或结果20的随后处理中主动关联/使用语境定义104。
再次参照图2,基于内容分析器模块102的模式识别算法(例如,模式集群和规则集103的数据分组)通过信息14来确定语境定义104。模式识别从对于与语义语境15关联(或者潜在关联的确定)选择(或者另外为了比较目的选择)的信息14提取包括确定的语境定义105的信息语境19,然后模块102使用确定的语境定义105动态更新语境定义104。
语境定义104、105可以是用于使信息14的内容分类或者另外标注信息14的内容的单个/多个字母和/或数字描述符(例如,单词),从而内容引擎100可以将信息14与用户手头项目的语义语境15进行最佳匹配。语境定义105是与信息14(例如,文档、图片、文章、视频剪辑、博客等)相关的或者另外指定给信息14的(相关)单词或者术语或者短语(和其模式),因此描述信息14并且能够使信息14的基于描述/单词分类作为信息语境19。
例如,可以将语境定义104、105定义为包括n阶模式,其中,一个单词为第一阶模式,两个关联单词被认为是第二阶模式,三个关联单词被认为是第三阶模式,四个单词被认为是第四阶模式,以及五个关联单词被认为是第五阶模式等。如下文中进一步描述的,语境定义104、105由在单词模式/分组中包括的单词组成。语境定义104、105由选择的(例如,基于模式重要性阈值)单词模式形成,该单词模式已经由选择的(例如,基于单词重要性阈值)单词形成。例如,模式映射至将何称作一个关键词的情况是存在第一阶模式的情况。
此外,虽然信息14的相关性测量可以表示其与语义语境15的相关性(即,比较语境104、105以判定在选择的单独信息14和语义语境15的信息14之间是否存在匹配),还可以创建否定/过滤语境定义104,以从与语义语境15相关的信息14集合中过滤不期望的信息14内容。例如,否定语境定义104、105可以包括对于广告材料、色情材料或者由用户识别为不期望的简单材料的定义。为了有助于识别不期望的材料,用户可以创建否定语境定义104、105并且指示语境引擎100将他们分配至单独信息14的各个信息语境19和/或表示信息14集合的语义语境15。
此外,语境引擎100可以基于通过语境引擎100使用的否定/过滤材料(例如,单词、短语、指定文档等)建议(例如,通过用户)来自动识别和分配否定/过滤语境定义104、105。例如,用户可以指定含有令人反感的/不期望的材料的信息14(例如,大量网站/网页、文档等)。然后,语境引擎100将使用分析器模块102确定对于经识别的不期望材料的信息语境19的语境定义105。用户可能允许语境引擎100自动将这些确定的语境定义105(表示不期望信息14)分配给语义语境15的语境定义104和/或可以主动地选择应当分配哪些确定的语境定义105。用户还可以建议由语境引擎100使用的一些单词和/或短语,以协助可疑信息14的语境定义105的生成。例如,用户可以强制语境引擎100使用指定单词(例如,“性别”、“广告”等),否则该指定单词由于缺少对于与指定单词/短语关联的指定单词/短语和/或模式所确定的重要性可能从语境定义105生成处理(下文中所述的)被剔除。
认识到,在表示不期望信息14的确定的语境定义105的情况下,将确定的语境定义105添加至语义语境15,但是可能没有将相关的不期望信息14添加至与语义语境15相关的信息14集合。否则,可以将不期望/过滤信息14添加至过滤信息文件夹,用于用户预览以有助于估计语境引擎100在识别不期望材料中的性能。因此,可以在否定语境中包括否定/过滤语境定义104、105并且与为代表用户所希望的材料(例如,信息14集合)的当前语义语境15相关联。每个语义语境15均可以既为与语义语境15相关联的肯定语境定义104又为与语义语境15相关联的否定语境定义104。同样地,全局信息集109(参见图2)还可以具有用于自动/手动选择语义语境15的任何数量的全局否定过滤器(例如,语境定义104)。全局否定过滤器的实施例可能涉及广告术语和材料或者涉及色情材料。
例如,每种语境15可以具有与其相关联的否定语境。除了用户已经识别不期望材料(例如,用于识别否定语境定义104的信息14)以外,可以按照与肯定语境相同的方式将材料添加至否定语境。在比方说色情的其他过滤器的情况下,否定语境定义104可以为全局的(例如,在词典109中列出)并且用户可能不需要采取任何行动来创建由系统10(例如,将具有不期望模式的语义语境15载入词典109)访问的预先定义的全局过滤器(包含在词典109中可用的全部或者选择部分的否定语境定义104)。最终,信息14的评分可能为少于否定语境评分(即,从信息14所获得的语境定义105与语义语境15的否定语境定义104匹配)的肯定语境评分(即,从信息14所获得的语境定义105与语义语境15的肯定语境定义104匹配)。如果模式在肯定语境定义和否定语境定义104、105下重叠,则对于在肯定方的模式(但没有排除)可以减小信息14的评分。因此,认识到语境15可以具有与其相关联的肯定和否定语境定义104这两者。
可以按照SQL数据库格式(例如,Microsoft SQL 2005)存储语境定义104、105,以存储所有的语境信息104、105。SQL数据库格式是用于在相关数据库管理系统(RDBMS)中检索和管理语境定义104、105的一个实施例。SQL数据库格式通过检索、插入、更新、以及删除在存储器210中的语境定义104、105数据来提供查询和修改语境定义104、105数据并且管理数据库(例如,存储器210-参见图4)。用于访问在存储器210中的语境定义104、105的SQL语言可能包括以下示例性语言要素,例如但不限于:Statements(语句),其对于存储器210的图式和数据可以具有持久影响,或者其可以控制事物处理、程序流程、连接、会话、或者诊断;Queries(查询),其基于特有标准检索语境定义104、105;Expressions(表达式),其可以产生由用于语境定义104、105的数据行和列组成的表格或者标量值;Predicates(判定),其能够指定可以被评估为SQL三值逻辑(3VL)布尔真值的条件并且该条件用于限制语句和查询的效果,或者用于改变程序流程;Clauses(条款),其为语句和查询的组成成分(在任选的某些情况下);Whitespace(空白符),其可以在SQL语句和查询中忽略。
在另一实施方式中,语境定义104、105可以为涉及描述符与对象关联的元数据并且可以体现为用于定界元素的开始和结尾、元素的内容、或其组合的句法(例如,诸如编码语句的HTML标志/定界符)。可以使用诸如但不限于定义可以根据其逻辑结构(标题、段落、或者思想单元等)如何描述文档的标准通用标记语言(SGML)的结构化定义语言来定义语境定义104、105。因为SGML提供了“如何描述语言的语言”,因此SGML通常还称作元语言。SGML的特定用法被称为文档类型定义(DTD),其精确定义了所容许的语言。例如,超文本标记语言(HTML)是用于定义语境定义104、105的结构化定义语言的实施例。结构化定义语言的另一实施例为可扩展标记语言(XML),其定义如何描述数据集合。因此,可以将语境定义104、105用于提供语境15、19的底层定义/描述,还有助于定义用于生成或者另外操作(例如,修正、查看等)信息的14的FoR 12应用的状态。例如,可以将HTML定界符用于围绕关于HTML页的描述语言(例如,语境定义104),其作为标题部分位于Web页中HTML的顶部附近。
认识到,由语境引擎100使用语境定义104、105这两者,以识别适用于搜索请求18语境的相关信息14,以及组织与信息14关联的FoR 12应用的状态(例如,组织Outlook中最贴切的电子邮件、组织Word中最相关的文档、组织最相关的浏览器链接等)。还认识到,如下文中参照处理300(参见图5)进一步描述的,可以使用根据信息14所确定的语境定义105以有助于相对于语义语境15的语境定义104对信息14排序,即,在根据信息14所确定的语境定义105与语义语境15的语境定义104之间的类似度。认识到,如果在信息14的语境定义105与语义语境15的语境定义104之间发现合适的类似度,则可以将信息14的语境定义105添加至语境15的语境定义104,以更新语义语境15从而表示信息14是通过语义语境15所表示的用户的信息14集的一部分。
还认识到,用户可能已经将任何不相关的信息14(例如,文档)添加至与语义语境15关联的信息14主体。可能存在以下情况,其中,系统10对在与语义语境15关联的信息14的主体中的从属关系来预先测试(例如,识别语境定义105然后将其与语义语境15的语境定义104相匹配)信息14,或者仅将信息14添加至与语义语境15关联的信息14主体,而不考虑信息14是否含有匹配语境定义105。例如,用户可以对于系统10简单指定应添加信息14。认识到,在其他情况下,当已经处理信息14的内容并且具有已经视为拥有了标识其作为相关材料的评分时,系统10将仅添加信息14。
语境引擎100
参照图2,当用户工作以在FoR 12内创建或者编译文档和其他数据时,语境引擎100管理并使用语义语境15的语境信息。分析与语义语境15关联(手动、自动、半自动)的每个用户操作信息14(例如,文档)。由语境引擎100使用FoR 12语境定义104、105,以引导并且添加网络搜索18和/或然后区分搜索结果20的先后顺序,是否该结果在整个互联网11上、或者位于本地企业(例如,计算机本地网络)或在用户自己的计算机101上。为了协作目的,经由协作引擎150,可以将语义语境15和/或信息语境19的该论题信息用于找到在企业中正在从事相同主题的同事而同时例如遵守隐私和安全策略。如所期望的,参见下文中描述的协作环境140,还认识到可能便于在互联网11上的系统10的用户和其他用户之间的协作。另外,在所希望的情况下,语境引擎100使用这些确定的论题(例如,语境15、19)以对信息14和其关联的FoR 12程序分类并且对其进行注释。在向企业搜索引擎24和/或文档管理系统提交信息14(例如,文档)之前,可以在企业中完成信息14的注释。例如,可以将系统10配置为存储或者另外将确定的信息语境19与存储在存储器210(例如,通过数据库表示的)中各自信息14关联。
为了动态修改FoR 12的语义语境15,可以积极或被动引导语境引擎100以包括用于通过内容分析器102(参见图2)分析的用户操作信息14。积极引导的实施例是用户选择要分配给语义语境15(例如,用于有助于通过语境引擎100进一步定义/生成FoR 12的语义语境15)的一个或者多个信息14。被动引导的实施例是将语境引擎100配置为自动选择(例如,没有用户手动互交互)通过在与信息源16和/或本地存储17交互中用户所操作的(例如,创建、修正、存取、或者另外获得等)任何信息14。例如,语境引擎100可以确定根据用户从搜寻结果20列表中选择(例如,通过从列表中点击链接)的这些搜索结果20所确定的适当的语境定义105,并且将这些适当的语境定义105添加至语义语境15,同时进行选择以忽略用户没有从搜索结果20列表中选择(例如,没有从列表中点击链接)的那些搜索结果。
还认识到,例如可以使用向用户提供接受或者拒绝所选择的信息14与语义语境15的关联的能力的显示提示,通过语境引擎100向用户自动建议在语义语境15生成中使用的信息14选择。认识到,当选择要与语义语境15关联的选择信息14时,语境引擎100确定常驻在选择信息14中的任何语境定义105(经由内容分析器102),以这些新确定的语境定义105更新语义语境15的语境定义104,从而提供语义语境15的动态更新能力。
认识到,选择信息14与FoR 12的语义语境15关联的另一实施方式可以是使用基于时间的被动引导。例如,如果用户继续停留(即,与其交互)在目的源上长达大于预定时段(例如,45秒),则可以将搜索结果20用于积极地精炼语义语境15的语境定义104,如果用户在预定时段内(例如,5秒)关闭目的源,则可以将搜索结果20用于消极地精炼语义语境15的语境定义104。此外,例如,当用户将信息14(例如,实际文件或对于信息14的链接)移动至诸如“我的文档(My Document)”或者用户桌面的FoR 12的监控区域时,信息14(例如,文件或者网络内容)的信息语境19可以自动添加至语义语境15。在网页作为信息14的情况下,将信息添加至浏览器应用程序的“我的爱好(My Favourites)”将自动将关联信息语境19添加至语义语境15。认识到,还可能存在与FoR 12的其他应用程序关联的其他众所周知的位置(例如,监控区域)。
参照图2,示出了语境引擎100的一个实施例,其用于处理搜索请求18、向用户100提供搜索结果20、以及基于常驻在用于认为的这些新获取的信息14(通过语境引擎100和/或通过用户手动)的搜索结果20的新获取的信息14中的确定语境定义105更新语义语境15。
语境引擎100包括:内容搜索模块106,用于接收搜索请求18和/或用于处理(例如,通过根据语义语境15的内容添加额外参数22来修正搜索请求18的参照22(参见图1))的搜索结果20;内容分析器模块102,用于为了确定常驻其中的适当的语境定义105(根据语境确定规则的集合103)来分析搜索请求18、搜索结果20以及与用户交互的任何其他信息14的内容。如果确定了根据信息14所确定的新语境定义105不与语义语境15的任何一个语境定义104匹配,则将内容分析器模块102配置为用于使用非匹配语境定义105来创建新的语义语境15。此外,还包括程序更新模块108,其用于更新与FoR 102关联的任何应用程序的状态。
内容分析器模块102
内容分析器模块102可以被指令为经由通过用户界面202(参见图4)所提供的菜单分析用于任何常驻语境定义105的特定信息14。优选实施方式使用托盘图标来允许用户访问语境菜单,其便于选择与语义语境15关联的信息14。
作为实施例,可以暗示和/或明确进行要包括在语义语境15中的信息14内容的识别。明确包括的内容是由用户所识别的信息14(例如,文档)。例如,通过用户在文件或者文件夹上“点击右键”然后选择添加至语义语境15的菜单选项将导致选择的信息14对于用于语境定义105分析的内容分析器模块102可用。
此外,可以通过在FoR 12内监控通过用户创建或者访问信息14(例如,文档或者其他数据源),利用语义语境15暗示地包括信息14内容。否则,可以通过检查信息14位于本地存储器210何处(和/或信息来源于何源16),利用语义语境15暗示地包括信息14文档。例如,可能经由内容分析器模块102暗示地在语义语境15中包括位于用于FoR 12的我的文档文件夹中的信息14。另一选项是对于网页,可以通过用户简单查看网页(例如,长达预定时段)或者通过用户由在语义语境15中应该包括页(URL)的基于工具栏的控制识别来暗示在语义语境15中包括这些网页。
此外,内容分析器模块102使用模式群集和数据分组算法(例如,规则集103)以从要作为在修正语义语境15的语境定义104中使用的新语境定义的选择信息14中选取关键论题(例如,语境定义105)。
在协作(例如,匿名)的情况下,参见图10,实施例可以是用户Un共享搜索结果20和/或搜索信息集154。当用户Un搜索互联网和/或文件系统(例如,数据库)时,模块102基于用户Un的活动建立语境定义104、105数据,用户Un的活动触发正添加至语义语境15的材料。这些触发可能包括:在浏览器中读取结果、将结果20(例如,文档)识别为相关或者非相关(例如,结果20存储在预先定义的文件夹或者应用文件中)、书签结果20或者将链接添加至用户文件系统。认识到,例如,模块102可以通过监控文件系统和浏览器行为来跟踪用户的活动。
内容规则集103
参照图2和图5,示出了由内容分析器模块102所使用的示例性内容规则集103,内容分析器模块用于从要用作在修正或者另外创建语义语境15中使用的语境定义105的选择信息14中提取论题(例如,诸如但不限于单词和单词分组的正文部17)。认识到,在正文部17中包括两个以上单词的情况下,这些单词可以在信息14的文本中彼此邻近(例如,认作多词短语),可以通过在信息14的文本中位于中间的一个或多个单词彼此分离,或者其结合。还可以将语境定义105称作分析信息14的自信息。可以根据取决于在确定自信息中所使用的表达式中使用的对数的基数,将自信息称作与以例如位的信息单位所表达的随机变量结果关联的信息内容的测量。例如,在概率事件中所含有的自信息数量可能取决于该事件的相对概率/频率,即,相对概率/频率越小,与事件真正出现的接收信息关联的自信息越大。此外,自信息的测量可能具有以下性质:如果事件C由两个相互独立事件A和B组成,则表明C已经发生的信息量等于分别表明事件A和事件B的信息量的和。考虑到该性质,可以将与结果ωn关联的自信息I(ωn)(以位测量)确定为:
在信息14处理的语境下,例如,IL(Wn)=-log2(Pr(Wn)),其中,Pr是在信息14中(例如,在文档中或者在诸如部分、段落、页等的文档子集中)找到单词Wn(或者其他正文部)的概率(例如,相对频率)。此外,对于在信息14(例如,文档)中的每个单词/正文部Wn,可以将用于单词/正文部Wn的重要性IMP(Wn)测度确定为:
IMP(Wn)=IG(Wn)-IL(Wn),
其中,IL(Wn)为单词/正文部Wn的局部自信息(LSI),IG(Wn)为单词/正文部Wn的全局自信息(GSI)。
换句话说,局部自信息(LSI)可以描述为在考虑中的局部信息14(例如,文档)中单词/正文部Wn发生的相对概率/频率描述,并且全局自信息(GSI)可以描述为在全局信息109集(例如,定义为诸如词典的单词和/或短语的词汇表的语言,文档和/或者其他信息源的分组等)中单词/正文部17发生的预先定义的(例如,已经已知的)相对概率/频率。可能基于在选择文档中发生的其相对概率/频率以及其在可以包括来自除了选择文档(或者除了选择文档以外)的文档的(例如文档的分组、词典等)的单词/短语的全局信息109集中发生的相对概率/频率这两者来确定选择的正文部17的重要性测量。
鉴于以上所述,将在选择信息14中的单词的相对局部频率与在选择的信息14中其他单词相比较(用于计算I局部中使用的)并且将全局单词集(例如,词典109)中的单词的相对频率与在全局单词集中的其他单词(在计算I全局中使用的)相比较。将全局单词集表示为如下语言,其可以符号化为可以根据其来计算全局相对频率值的文档集合。将这些全局值存储在用于在词典109中含有的每个单词的词典109中。重要性计算考虑在信息14中的单词的相对频率与其在标准语言使用或者文档训练集中的相对频率相对。在优选实施方式中,局部自信息与全局自信息之间的偏差提供这种测度。
认识到,在词典109中含有的单词Wn可以包括在信息14(例如,通过用户)内识别(例如,通过用户)的行话或者用户定义术语。可以为这些用户识别的单词Wn给定或者另外分配(例如,通过语境引擎100)非常高(例如,与在语言中很少出现的单词Wn相对应)的默认全局自信息,因此,这些识别的单词Wn可以作为任何其他单词处理。此外,词典109可能体现为含有多种语言和/或特定词典。
此外,例如,将GSI描述为在普遍语言中使用的单词(例如,英语)。用于词典109中的GSI来源于处理在大量跨该语言的书籍和文档中所含有的单词的相对频率。对于每种语言,可能存在含有对于用在该语言中的单词已经计算的GSI测度的词典109。当可能出现在与工程、法律、或者医学材料相关的文档中的时候,对于语言的非标准应用可以计算不同GSI。在这种情况下,可以将用于单词的GSI分配给从例如具有医学偏爱的材料训练的单词。
认识到,在任何情况下,鉴于在全局信息集中的内容定义105的相对频率(例如,全局相对频率),通过考虑在信息14中的内容定义105的相对频率(例如,局部相对信息)进行正考虑/分析的信息14的内容定义105的确定。
再次参照图5,在作为用户与FoR 12互动/工作活动的结果,向语境引擎100提交信息14(例如,一个或者多个文档、诸如来自搜索引擎或者文档管理系统的搜索结果列表、诸如来自文档的段落的文本部、诸如我的文档的兴趣位置或者在用户文件系统中的兴趣其他位置的存在等),或者另外通过语境引擎100接收信息14的情况下,规则集103可以包括步骤300。在步骤301处,在每个事件21均可以是公认的(例如,或者静态地或者动态地预先定义)文本的逻辑单位的情况下,处理信息14的内容以创建一系列事件。例如,在良好形成的信息14集中,这种公认的/识别的逻辑单元可以为句子、段落、或者连续段落、页或者多页、PowerPoint中的文本行(点)、单元、在用于HTML(或者其他网页/内容)的MS Excel(Excel的用户对其熟悉)的其他逻辑描绘或者行、在网页/内容主体内句子组合、和/或在信息14中(例如,在页中)逻辑分组的文本块。因此,在信息14中事件21的识别/认识可能基于用于事件21的定义机制,该定义机制诸如但不限于:标点符号(例如,句号或者逗号);空格(例如,制表位或者空格);元数据(例如,标志和/或用于定义事件21文本内容的开始和/或结束的定界符);文档中断(例如,分页符、分行符等);以及本领域中众所周知的其他定义机制。
认识到,信息14可能为一种或者多种格式(例如,PDF、MicrosoftOffice格式、HTML、XML、以及其他类型SGML及格式)。此外,认识到,事件21结构可以使用在文档内的诸如段落的其他结构或者在诸如<DIV>、<P>等的网页(例如,HTML)内的逻辑分类,这表示在信息14内的逻辑分组文本或者信息14的定义部。信息14可以包括多种语言或者单种语言。因此,认识到,可以作为独立语言实现规则集103。另外,当每个单词添加至事件21列表时,可以阻止每个单词。例如,将stop、stops、stopped、stopping全部添加至事件21列表作为stop;但是可以将stopper保持为stopper。认识到,每个正文部17可能属于一个或者多个事件21(例如,单词为句子的一部分,句子为定位在一页或者多页上的段落的一部分,页为章或者其他定义信息14部的一部分)。
在每个事件21均包括作为文本串形成每个事件21的单词(例如,被阻止的)和术语/短语的列表的情况下,步骤301的结果为形成信息14的事件21的列表。因此,步骤301用于将信息14分成一系列文本串,即,表示识别事件21的内容,以使文本串的每个集合均表示认为信息14的文本的逻辑分组块的各个事件21。因此,认为信息14的每个公认/识别事件21含有一个或者多个正文部17。
在步骤302处,对于在信息14(现在表示为事件21的列表)中的每个正文部17(例如,单词或者短语),例如,计算局部自信息:IL(Wn)=-log2(Pr(Wn))其中,Pr为在信息14中局部找到的正文部17Wn的概率(例如,发生的相对概率)。接下来,对于在信息14中的每个正文部17,例如,计算用于正文部17的重要性测度:
IMP(Wn)=IG(Wn)-IL(Wn)
其中,IL(Wn)为正文部17的局部自信息(LSI),IG(Wn)为正文部17的全局自信息(GSI)。认识到,可以在保持用于语言正文部17的预先定义的GSI值的全局信息109(例如,可以存储在数据库表中的词典、或者在存储器210中的任何其他数据结构-参见图4)中保持用于正文部17的GSI的预先定义值111。
例如,认识到,可以通过处理大量文档(或者其他信息源14)来训练用于全局信息110中的文本部17的GSI的预先定义值111,以获得代表在语言中使用的文本部17(例如,单词/短语)的统计表(例如,该统计表可以源于正文部17相对于该语言中其他正文部17的发生频率的频率数)。此外,作为从全局信息109中所获得的唯一整数或者其他代表值(例如,混列码、GUID、…)“In”与信息14中的每个正文部17(例如,单词Wn)关联。该整数/值对于存储在全局信息109(例如,词典)中的每个正文部17是唯一的。
因此,正文部107的每个单词映射至全局信息109中的代码In。如果对于遇到的正文部17不存在代码In,则在全局信息109中附加代码In输入项。这可能发生在信息14中出现的俚语、绰号、缩写词等。此外,认识到,如果所识别的正文部17的使用被认为是重要的,则仅实现这些新添加的代码In,并且因此,在将要使其通过语境定义104、105生成的模式中涉及该代码In。为了清晰,可以将代码In分配给信息14中的每个单词Wn(以及定义的词组-例如,共同考虑组成短语的单词的情况下的医学短语或者其他技术短语)。一个这种实施例为术语“副神经”,从而将单词副和神经的组合一起用于定义神经类型。在这种情况下,全局信息109可能具有用于“副神经”的输入项,其具有用于将该输入项处理为单词组合(例如,短语)的指定代码In。通过从全局信息109中所获得的其对应代码In来表示在事件21(例如,句子)中的每个单词(或者预定义词组)。同样地,应该理解,还将用于单词和词组的GSI存储在全局信息109中并且由模块102通过查找来取出。
认识到,鉴于在事件21中的单词或者预先定义的词组的上述实施例,如所希望的,可能或者不可能将合成术语配置为通过系统10使用。例如,如果认为识别的合成词重要(例如,满足重要性阈值),则用户可能使用用于在处理信息14的识别模式下自动识别合成词(例如,词组)的语境引擎100。
步骤302的结果为将唯一值In(例如,整数)分配给在信息14中所识别的每个正文部17并且对于在信息14中所识别的每个正文部17已经计算了GSI、LSI、以及IMP。因此,除了表示为文本串的事件21的原始列表以外,现在可以呈现所有值(例如,整数)事件21列表。如所描述的,每个事件21(文本的句子或者其他块,例如,段落、节、章)由在信息的事件21中呈现的单词Wn的列表组成。然后,信息14成为事件21的列表,其中,每个事件21都为表示在事件21中的每个单词Wn(或者预先定义的词组)的代码In(例如,整数)的列表。如下文中所述的,在信息14内的事件21之间找到模式。此外,已经把像“I(我)”和“am(是)”的单词视为完全没有具有实质信息内容,因此在关联挖掘以前,类似这些单词可能决不将其制作为模式并且结束从单词列表中剔除。还认识到,可以将与局部计算相对的全局用于剔除一些单词Wn。剔除这些典型单词,但是可能存在(或可能不存在)要剔除的预先定义的单词Wn的专用表。
规则集103的下一步骤304是鉴于在信息14中存在的一些正文部17相对缺少关于在信息14中存在的其他识别正文部17的重要性,而将其剔除/删除。换句话说,正文部17的IMP(IMP=GSI-LSI)提供在正在考虑中的当前信息14内的正文部17的重要性测度。通常,IMP越高(在正文部17之间的相对重要性的实施例),则正文部17对于正在考虑中的信息14的信息内容越重要。该技术的一个优势在于,可以从基于信息内容的进一步处理中剔除正文部17。这可能还自动包括可能被认为含有相对可以忽略的信息(即,与认为在全局信息109中相对很少常见/共用的其他正文部17相比较,通过具有在全局信息110中所分配的较低值所表示的)的例如冠词和连词的单词(例如,the(这个)、and(和)、but(但)、or(或)…)。认识到,例如相反地,认为在全局信息109中相对很少常见/共用的正文部17更重要,因此具有比认为含有/表示相对可以忽略的信息的正文部17的值的较高分配值111。还认识到,如所希望的,与用于更不重要的正文部17的更高值相比较,可能向更重要的正文部17分配更低值111。
因此,使用分配值In(和其计算的LSI)可以进行从信息14的内容中滤除或者另外的去除考虑的一些正文部17,而没有通过使用专用词典(或者其他单词列表)来识别要过滤的特定正文部17。因此,在信息14(例如,文档)中的正文部17(例如,单词)每一个均从全局信息集109接收通过其分配值111的类似处理。因此,可以通过正文部17确定的IMP值相对于包含阈值的IMP的比较来进行从信息14的内容中滤除一些正文部17(例如,小于包括阈值的IMP的用于正文部17的任何IMP值为通过进一步考虑去除的正文部17的候选者)。此外,还实现了可以通过考虑其GSI值并且使用重要性阈值和要剔除的GSI阈值进行该过滤。
因此,可以将重要性阈值用于确定将从信息14中剔除以下哪些单词。可以调整该阈值以增大或者减小剔除的正文部17的百分比。例如,为了减小对于稍后步骤中所执行的模式集群和数据分组(PCDG)的计算要求,可能期望基于正文部17的总事件21计数(含有正文部17的事件21数)或者在信息14内的唯一正文部17的总数来增加从信息14中所剔除的正文部17的百分比,例如,正文部17仅在信息14中出现有限次数(例如,一次)。大信息14集通常含有比更小信息14集更多的句子(例如,事件21)和唯一单词(例如,正文部17)。
步骤304的结果是用于信息14的事件21列现在含有具有最高IMP的正文部17的子集(即,通过下文所述的模式发现步骤306中进一步考虑重要性而没有剔除/去除的正文部17)。
接下来的步骤306是用于在信息14中发现/识别正文部17的模式并且去除认为不如其他更显著模式那样重要的那些模式。在步骤306中,计算在信息14中所含有的所有模式(例如,定义为在一个或者多个正文部17之间的确定关联性)。可以将模式描述为在多个事件21中出现的一个或者多个正文部17中发生。例如,可以在模式收集/识别中设置多个模式阈值。
可以将模式的频率设置为阈值。例如,如果模式没有出现多于某次数,则将从模式列表中把该模式排除在外。同样地,可以将模式阈值设置为相对频率模式阈值,其中,仅选择相对最高频率数(例如,通常最高出现5次)进行进一步处理。认识到,模式的一个实施例为在两个以上不同事件21中重复两个以上正文部17(例如,在多个不同句子中共同找到两个单词,因此指示它们彼此具有某种关系)。还认识到,在事件21中的正文部17的相对定位/位置可能便于模式识别,例如,主要(例如,总是)找到彼此相邻的两个单词,主要(例如,总是)在每段的第一句中或者在每页的第一段中或者在每节的标题中找到一个单词等。例如,可以将用于小文档的值2和用于更大文档的3用作频率阈值。此外,可以将第1阶模式(例如,可以将模式的阶定义为在模式中的单词(正文部)数量以使第1阶模式具有一个单词,第2阶具有两个,第3阶具有三个等…)用在较小文档中以有助于取在计算论题中可用的模式数量最大值。在较大文档中,可以使用第2阶和更大模式。例如,语境引擎100可以配置模式挖掘以在第5阶模式处停止。认识到,如果降低模式阶,则空间相关的模式仍可以聚集在一起。
认识到,用于在事件21中的正文部17的GSI和LSI值的整数表示可能有助于提高计算模式的计算性能。还认识到,作为在步骤304中进行计算和剔除的结果,在步骤306中所计算的模式可以由可能与信息14最相关(例如,具有最大IMP)的正文部17组成。因此,在步骤306中发生模式挖掘以前,从事件列表中去除具有低IMP的正文部17(即,那些被认为不满足重要性阈值的正文部)。这可以减少包括无意义单词Wn(例如,the(这)、this(这)、were(是)等…)的模式数量并且可以减少用于随后找到模式的计算然后加权、计算重要性,然后挑选这些模式。还认识到,步骤304可以为在确定语境定义104、105中进行的可选步骤。
此外,对于每个模式,引擎100可以计算识别模式的重要性(P-IMP)。该计算的第一步是要计算用于每个识别模式的模式权数(PW(Pi)),例如像:PW(Pi)=包括模式的正文部17的IMP的和(或者其他数学组合),同样地,P-IMP(Pi)=P-GSI-P-LSI和P-LSI=-log2(Pr(Pn))*PW(Pi)。
同样地,在用于正文部17的GSI的情况下,可以通过利用大量文档训练来计算P-GSI。例如,Pr(Pn)为在信息14内找到模式的概率(例如相对频率f发生)。就像单词可以建立模式的全局信息109一样,可以根据文档来训练模式。例如,可以基于文档训练结果向用于每个正文部17的GSI值分配独立GSI值或者分配用于所有模式的常量。在任何情况下,认识到,如在全局信息109中指定的,GSI值对于每个正文部17可以相同或者不同。在当前实施方式中,语境引擎100使用24.0作为用于模式的全球自信息GSI的示例性占位符。例如,选择24的原因其是表示在16000000中找到低于1的模式的概率的数字。该数字意味着任何P-GSI-P-LSI大于0。步骤306的合成计算为语境引擎100具有模式的有序列表,以使模式的P-IMP越高,则其在表示信息14中越重要。
至于用于挑选正文部17的步骤304,可以执行模式挑选以包括在信息14中所含有的最重要的模式。至于正文部17,可以在与信息大小和发现的模式的总数的关系中改变该模式阈值。通常,利用更小的文档来降低信息阈值,以增加对于找到论题可用的数据。认识到,可以动态地设置模式阈值以留下充分数量的正文部17来找到模式,并且因此,确定语境定义104、105。如果模式已经通过重要性处理但是与任何其他模式不相关,则退化情况是使模式为语境定义104、105。
接下来的步骤308是用于计算另外称为论题的语境定义104,可以将语境定义定义为置于信息14的模式上的一个示例性语义拓扑,其中,可以将多个信息14(例如,多个文档)用于形成语义语境15、19。
幸存步骤306的重要模式集合转到模式集群算法(在这种情况下为PCDG)。输出为模式集群集。模式集群为通过其含有的正文部17并且可能通过其在信息14内的位置而在信息14中相关的模式。认识到,模式集群的一个实施例为在两个以上不同事件21中重复两个以上正文部17(例如,在多个不同句子中共同找到两个单词,因此,指出它们彼此具有某种关系)。还认识到,事件21中正文部17的相对定位/位置可以便于模式集群的识别,例如,主要(例如,总是)找到彼此相邻的两个单词,主要(例如,总是)在每段的第一句中或者在每页的第一段中或者在每节的标题中找到一个单词等。PCDG中原型模式为覆盖集群中所有模式的正文部17的集合。此外,在步骤308中将所有正文部17表示为整数的事实可能促进计算的计算性能。
例如,步骤308可以使用模式中的元素(单词)连同其在事件21结构内的位置使模式群集(即,形成语境定义104、105)。这意味着共享单词/短语的模式可以在相同集群中结束。此外,一直出现在相同事件21中的低阶模式可以在相同集群中结束。例如,模式原型为在包括语境定义104、105的模式中的单词/短语集合。在一些情况下,其为在包括/形成语境定义104、105的模式中的单词Wn的适当子集。
因此,语境引擎100将确定的论题(例如,语境定义104)表示为模式集合(集群)。引擎100保持用于与集群的原型模式一致的论题(集群)的单词/短语列表。至于模式和正文部17,可以基于在语境定义104单词(模式原型)内含有的正文部17的重要性和/或模式重要性来排列语境定义104、105的先后顺序。语境定义104、105的集合表示语义语境15/信息14的语义论题内容。例如,与一个或者多个文档结合的语境定义104表示文档组的语义语境15。
在接下来的步骤310中,由于将信息14连同统计计算的结果一起存储在存储器210中(例如,相关数据库-MS SQL Server 2005),引擎100存储语境定义104(和单词、通过语境定义104所表示的模式)。保持语境定义104的存储紧凑的一个特性为将用于正文部17的整数表示用在存储器210中,连同全局正文部统计表一起,还保存并且把保持正文部17与整数(或者其他值In)之间的映射的词典(例如,全局信息109)除外。
因此,鉴于以上情况,使用分析规则103对于模式关系分析在语境内所包括的内容。在文本的情况下,在优选实施方式中,关联性(模式)使用句子作为事件21。在电子表格(或者数据型数据格式)的情况下,在记录或者单元为事件21的情况下,使用模式分析技术。将在信息14内所找到的模式用于使用模式集群和数据分组规则形成论题(即,语境定义104)。此外,可以将论题群集为超级论题以进一步总结在语义语境15内的数据。语义语境15可以包括:文档参考、单词、模式、论题、超级论题,当通过内容分析器模块102分析新信息14的时候,保持/更新文档参考、单词、模式、论题、超级论题。例如,可以将标准SQL数据库用于更新/维持语义语境15的语境定义104。对于语义语境15的所有语境定义104,SQL数据库可以为全局的;然而,可以分等级地组织所有信息以识别信息14与其相关的语义语境15(注解:可以将相同的语境定义104用于定义多个信息14)。
此外,内容分析器模块102模块经由分析器规则103创建在信息14中所识别的单词、模式、语义结构以及数据之间的知识网(即,独立语境定义104之间的互连)。可以按照任何数量的方法分等级访问该网并且在任何时候通过新关系覆盖该网。这意味着可以按照任何水平来组织和访问语义语境15内的信息。这包括论题(主题)、模式、关键词、段落、句子、以及其他语言结构。实际上,这意味着可以基于其主题(论题)或根据信息14中的实际文本通过用户组织和/或访问主题。例如,用户可以点击提及特定论题(即,语境定义104)的段落并且语境引擎100可以识别与该论题相关的其他信息14(例如,文档)的所有部分。例如,可以将任何材料、文档、或者部分文档用于创建语境15。在段落(其被看作小文档)的情况下,语境引擎100使用信息测度和模式以找到最重要的正文部17。可以将该信息用于构成新搜索以找到相关信息或者可以将该信息用于对照用户的现有语境15进行测试。
认识到,可以将上述规则集103用于确定用于选择独立信息14(用于可能添加至用户信息14集合)的语境定义105和/或用于确定组合语境定义104(例如,来自语义语境15的语境定义104的现有集合的超级论题)。
鉴于以上情况,可以作为还称作超级论题的概括语境定义104、105计算语境定义104的概括版本,可以不考虑文档源(例如,用于多个文档的语境定义104、105的概要)将超级论题称作语境定义104、105的概括。在概括语境定义104、105的计算中,首先,获得用于语境定义104、105的“模式原型”的集群,然后基于重要性和相互信息(参见下文中的相互信息定义)混合对用于每个概括语境定义104、105的模式原型中的单词Wn排序。概括语境定义104、105为与包括概括语境定义104、105的所形成语境定义104、105的所有模式关联的新原型(例如,为了数据库的压缩性以16个单词入选)。
以下为概括语境定义104、105的计算的实施方式。
1)搜集语境定义104
a.载入用于语境15的所有语境定义104
b.建立用于在所有语境定义104中所指定的所有单词Wn的WordStats对象,包括:
i.全局自信息(来自单词表-例如,词典109)
ii.局部自信息=-log2(局部单词计数/总语境单词计数)
iii.重要性=全局自信息-局部自信息
c.建立论题词典(语境定义104列表的列表)
2)集群语境定义104
a.创建用于每个语境定义104的语境定义104集群
b.语境定义104集群的目标#=(语境定义104#)/(log2(语境定义104#))+概括语境定义104的最小数(例如,1)
c.通过对在每个语境定义104对之间类似单词的#计数来建立用于语境定义104(集群)的相似矩阵
d.当语境定义104集群#>目标(并且存在不同但类似的对)
i.找到最靠近/类似对并且将语境定义104结合至较大集群,然后从常规可用语境定义104的集合中去除添加的语境定义104
ii.相似性测度当前使用“平均相似性”,例如,(在两种集群中的所有相似性的和)/((在集群0中的论题#)*(在集群1中的语境定义104#))
e.把语境定义104集群提交给数据库
3)生成概括语境定义104
a.使用以下公式对在每个语境定义104集群中的多个(例如,16)最重要单词Wn排序:
i.单词重要性=(全局自信息-局部自信息)*相互信息
ii.单词频率=每个语境来自每个文档的一单个语境定义104(模式)的所有单词频率的总和
iii.全局自信息=来自单词表的全局自信息
iv.局部自信息=-1*log(单词频率/单词的#)/log(2)
v.相互信息=log((a*t)/(c*b))/log(2);其中
1.a=在含有单词的语境定义104集群中的语境定义104#
2.b=在含有单词的语境15中的语境定义104#
3.c=在语境定义104集群中的语境定义104#
4.t=在语境15中的语境定义104#
b.把所有的当前模式迁移到用于语境15的概括的语境定义104关联性
c.去除用于语境15的所有当前概括的语境定义104
d.对于每个语境定义104集群:
i.将概括的语境定义104提交给数据库
ii.找到与关键词关联的所有模式(最多16个)
iii.根据模式的语境权重对找到的所有模式排序:
1.语境权重=(log(语境中模式频率)/log(2))*(模式权重);其中,模式权重=在语境定义104集群的排序中所计算的所有单词的重要性的总和(参见a)
e.剔除至每个概括语境定义104的模式的最大值#(例如,语境定义104集群)=(关键词#*1.5)+1
f.将模式提交给概括语境定义104关联性
g.从数据库中移除语境定义104集群
鉴于以上情况,按照概率论和信息论,两个随机变量的相互信息、或者传送信息可以为测量两个变量的相互依赖性的量。当使用基数为2的对数时,相互信息的测度的最普通单位为位。形式上,可以将两个离散随机变量X和Y的相互信息定义为:
其中,p(x,y)为X和Y的联合概率分布函数,且p1(x)和p2(y)分别为X和Y的边缘概率分布函数。假设log的基数为2。
此外,直观地,相互信息可以测量X和Y共享的信息:其测量已知这些变量之一减小多少人们对于另一个的不确定性。例如,如果X和Y独立,则知晓X没有给出关于Y的任何信息,反之亦然,因此其相互信息为0。在另一极端,如果X和Y相同,则Y共享由X所传达的所有信息:知晓X确定Y值并且反之亦然。结果,相互信息与单独在Y(或者X)中含有的不确定性相同,即,Y的平均信息量(或者X:显然,如果X和Y相同,则它们具有相等的平均信息量)。相互信息量化在联合分布X和Y的联合分布之间距离,并且如果X和Y独立,则量化联合分布将是什么。相互信息为在以下检测中的依赖性测量:如果并且只要X和Y为独立随机变量,则I(X;Y)=0。这易于在一个方向上了解:如果X和Y独立,则p(x,y)=p(x)×p(y),并且因此:
内容搜索模块106
通过语境引擎100使用内容搜索模块106以为用户提供考虑到语义语境15相关的增强的信息14检索。例如,可以从桌面(例如,FoR 12)、企业以及互联网搜索结果20获得信息14,可以通过用户和/或用于通过内容分析器模块102分析的语境引擎100选择适当信息14。例如,可以使用精确论题信息(即,从语义语境15所获得的语境定义)通过内容搜索模块106增加出站搜索请求18。此外,筛选来自搜索结果20的入站数据(即,信息14)并且经由内容分析器模块102排列该入站数据的先后顺序。
参考图3,示出了语境引擎100操作的实施例,该语境引擎有助于通过使他们立即重回其FoR 12工作环境来提高用户效率,该工作环境具有所有的语境提示和他们在工作于由语义语境15所表示的其项目时已经建立的其信息14源的组织。内容引擎100象智能隔膜一样运转,其中,运输代理(例如,模块102、106)通过信息通道便于数据输入和输出(例如,至信息源16和来自信息源16)。可以利用其知晓正在FoR 12内继续工作的当前论题(例如,语义语境15)通过语境引擎100增加出站数据访问请求。可以基于当前FoR 12的语义语境15(主题和论题)通过语境引擎100组织并且排列来自搜索、文件访问、RSS种子以及其他形式的数据种子(网页机器人等…)的入站数据(还被称作搜索结果20)的先后顺序。将模式集群和数据分组(PCDG)算法和规则102-103用于分析用户操作的信息14。
内容搜索模块106的示例性操作为:当用户进入查询18(搜索偏爱)(通常通过使用关键词)时,内容搜索模块106检查其语义语境15并且提供可以用于增加用户提供的搜索参数22(例如,当“记录片”的定义绑定至语义语境15中的“历史兴趣”的语境定义104时,将通过“历史兴趣”的语境定义104增加纪录片的用户参数22)的最匹配语境定义104的列表。因此,经修改的搜索请求18发送至搜索引擎24以获得使“记录片”和“历史兴趣”最匹配的搜索结果20(例如,作为根据搜索引擎24的标准的一系列网页,通常具有含有文档标题和有时包含部分文本的摘要)。认识到,例如,内容搜索模块106可以支持布尔操作符AND、OR、以及NOT的使用,以进一步经由语义语境15指定搜索查询18。此外,内容搜索模块106还可以通过考虑到语义语境15定义近似搜索来增加搜索请求18,该近似搜索定义在搜索结果20中关键词之间的可接受距离。
内容搜索模块106的另一实施方式是使用在搜索结果20的信息中确定的语境定义104与语义语境15的语境定义104匹配,以对结果20排序以首先提供“最好”结果(例如,对于具有语境定义104的更大数量的结果或者评分测度与相关性程度匹配)。此外,内容搜索模块106还可以包括蕴含阈值。例如,在匹配小于语义语境15的定义104的最小数量或者评分测度的特定信息14之间的任何匹配将排除在搜索结果20中的特定信息的显示(或者另外,与通过搜索引擎24提供的信息相比将该信息置于排序中的较低的位置处)。
信息14和语境15评分
作为信息搜索和/或社会性网络活动(参见在协作环境140中描述的协作搜索)的结果,用户活动可以促使向语境引擎100提交信息14(例如,文档)和/或语义语境15(例如,搜索语境156-参见图10)。
参见图2、6以及7,论述了在将通过用户所获得的新信息14与语义语境15的语境定义104进行比较中使用的比较处理320。可以将新信息14的内容和与语义语境15关联的所有语境定义104相比较,或者将其与语义语境15的语境定义104的选择子集进行比较。此外,认识到,语境定义104可以包括包含/肯定语境定义104和/或否定/滤除语境定义104。
语境引擎100用于将选择信息14(例如,来自搜索结果或者另外通过系统10的用户从本地存储器210获得的-或者经由网络11远程获得)与FoR 12的语义语境15的语境定义104相比较。认识到,在期望对照语义语境15或者语义语境15的集合给未知文档或者文档集(例如,新信息14)评分的情况下,有时用户或者语境引擎100可以启动活动。最终结果是提供新信息14的内容对于现有语义语境15的相关性的评分。可以将这种评分用于多种目的。一些目的包括诸如但不限于:使用评分基于与语义语境15的相关性(例如,互联网搜索结果、文档管理搜索结果、文档集合等)对内容排序向用户显示新信息14的内容;确定文档(例如,信息14)与来自语境集15的哪个语境15相关;诸如在将对照另一用户语境15测量一用户语境15用于确定相关性然后提供网络化机会的社会网络环境140中,将一语义语境15与另一语义语境15(例如,通过协作服务器152使用的)进行比较;和/或使用用于人们共同参加协作活动(例如,协作搜索)的认为相关的语境15匿名或者非匿名协作搜索的目的。
从以下说明中,显而易见,将关联性与来自语义语境15的语境定义104或者与来自选择信息14(例如,文档)的语境定义105相比较可以为类似处理。当处理信息14时,结果为最代表信息14内容的语境定义105的集合。聚集来自一个或者多个信息14的语境定义105以形成信息语境19,并且聚集来自一个或者多个信息14的语境定义105以形成分配给所有一个或者多个信息14的对应搜索语境15的语境定义104。因此,对于从信息14或者从语义语境15所获得的语境定义105集合的评分可以是对称处理。对于来自语境15或者信息14的语境定义104、105的评分给出了语境数据的相关性测度(例如,在信息14和语境15之间、信息14对信息14,或者语境15对语境15,这种情况可以为任何一个)。
参考图7的处理320,在步骤322处,处理语境数据。例如,用户或者语境引擎100促使对照语境15或者语境15集合给信息14(例如,一个或者多个文档网页等)的集合或者语境15评分。如所提及的,可以将信息14的集合处理为临时语境或者永久语境。也就是说,可以对照信息14的集合测试信息14的集合,以使动态创建信息集合14中每一个的信息语境19。
在最简单的情况下,对照语境15处理信息14。通过示例,将信息14处理为以上所述的语境定义105。该处理的结果为来自信息14的最有代表性的语境定义105的集合。
在步骤324处,确定评分(例如,在两组语境数据集合之间的相关度)。在步骤324中,测量在目标语境定义(例如,文档的)和其他语境定义(例如,语境15定义104)之间的重叠测度。可以将召回该语境定义105定义为来自信息14的单词模式的集群(例如,连同其原型模式一起,通过上述模式辨别相关)。计算一系列测度以识别目标信息14和语境15之间有多少相关语境定义。在两组语境定义集合之间,模式匹配计数为通过在两个语境定义集合之间的语境定义计算的语境定义。此外,计算在语境定义的这两个集合之间的每个语境定义的模式中的单词之间的匹配计数。实际上,这是用于语境定义104、105的模式原型。这里,系统10可以设置用于评分的双阈值,其中,对模式命中/匹配的评分高于单词命中/与模式原型匹配但是这两者均可以用在总匹配评分中。
例如,单独使用或者结合这两种测度以通过语境定义匹配评分或者在目标信息14与语境15之间的相关性来提供总语境定义。可以集合所有语境定义的评分以表示信息14对于语境15的关联性的总评分。或者,其可能为用户的活动仅正设法识别来自语境15和信息14的语境定义的子集是否相关的情况。在这种情况下,可以测试来自语境15和/或信息14的语境定义的一个或者多个子集以确定相关性。
一旦已经对照语境15给信息14(或者来自另一目标的语境定义,例如,另一语境15)评分,还可以在类似处理中对照信息14(或者另一语境15)给任何否定语境评分。对照语境15的语境定义集合的总评分为肯定语境定义匹配的语境评分较少或者另外,通过否定语境定义匹配的评分减少。否定/过滤语境定义104可以与语境15直接关联和/或主动为如从全局信息集109所获得的全局否定语境的每个全局分配该否定/过滤语境定义104(例如,可以通过客户端用户任选地激活色情和广告过滤,在这种情况下,这些全局否定语境定义的情况将为计算的一部分)。因此,认识到,可以使信息14和/或语义语境15的语境定义与其他信息14、其他语境15的语境定义、和/或从全局信息集合109所获得的全局语境定义(例如,否定语境定义)匹配。
在步骤326处,可以将评分有利的信息14(例如,满足语境定义匹配阈值)添加至与语义语境15关联的信息14集合。此外,还可以通过语义语境15的语境定义104集合信息14(例如,信息语境19)的确定的语境定义105。在一些情况下,用于信息14(例如,文档或者文档集)的评分结果可以具有在文档级别与其关联的匹配阈值或者通过语境定义级别与语境定义关联的匹配阈值。如果满足这种匹配阈值,则可以通过语境引擎100来使用这些匹配阈值以将信息14添加至语境15。例如,如果通过来自语境15的一个或者多个语境定义104来覆盖在构成用于语境定义105的原型模式的单词集合中的所有单词,则可以在与语境15关联的信息14的集合中包括信息14。
在步骤328处,可以在用户界面202(参见图4)上向用户显示信息14的评分结果。还认识到,可以不显示评分结果并且可以通过由用户访问限制信息14与语义语境15的关联性,和语境定义104、105的集合体。
认识到,在确定的语境定义105表示不期望信息14的情况下,将确定的语境定义105添加至语义语境15,但是可以不将关联的不期望信息14添加至与语义语境15关联的信息14集合。否则,可以将不期望/过滤的信息14添加至过滤的信息文件夹,用于用户预览,以有助于估计语境引擎100在不期望材料的识别中的性能。因此,可以在否定语境内包括否定/过滤语境定义104、105,并且否定/过滤语境定义104、105与代表用户的期望材料(例如,信息14的集合)的当前语义语境15关联。每个语义语境15可以为与语义语境15关联的肯定和否定语境定义104这两者。同样地,全局信息集109(参见图2)还可以具有用于自动/手动选择语义语境15的任何数量的全局否定过滤器(例如,语境定义104)。全局否定过滤器的实施例可以涉及广告措辞和材料或者涉及色情材料。
语境15评分(例如,逐个论题)的一个实施例如下。评分技术查看在语境定义104、105的原型模式(包括在语境定义104、105中的模式的单词集合)和具有来自另一信息14源(例如,另一文档或者语境、文档集合等)的语境定义104、105或者语境定义104、105的列表的模式之间的匹配。例如,假设来自考虑中的文档的语境定义105的集合Td和来自语境Tc的集合,语境引擎100可以执行如下:语境引擎100查看在Td(包括在语境定义105中的模式的单词集合)中的每个T(例如,语境定义105)的模式原型并且确定由在Tc(总体上,语境定义104的所有关键词)中模式原型覆盖多少。这为我们提供了用于Td的原型模式对Tc的原型模式的覆盖百分比。然后,语境引擎100查看在Td的每个T中的模式并且查明在Tc的模式(同时,语境的所有模式)中覆盖多少。这为我们提供用于在Td中的每个T的模式的覆盖百分比。
在这两种计算中,语境引擎100可以使用重要性数来计算覆盖百分比。所以其不仅简单,为含有或者没有的单词。因此,对于在Td中的T,可以计算覆盖百分比作为:
和(覆盖单词的重要性)/和(在模式原型中的所有单词的重要性)*100
和(覆盖模式的重要性)/和(在论题中的所有模式的重要性)*100
仅将它们保留为分数。*100是为了人们查看百分比结果。现在,语境引擎100具有多个选项。如果可以通过最好的语境定义104、105匹配的评分、非零语境定义的平均语境定义评分、所有语境定义的平均评分、或者语境定义(例如)的最坏评分来确定会员。语境引擎100还可以使用覆盖的语境定义100的百分比。
在一实施例中,当测试来自文档14的语境定义105的集合以参加语境15时,语境引擎100可以使用用于一个或者多个度量(例如,三个度量)的最小阈值以确定在语境中的文档会员。
1.非零论题关键词(原型模式)对语境论题的平均评分;
2.所有模式对所有语境模式的评分(实际上,其对在目标文档和语境中的所有共同论题求和并且对它们评分);和/或
3.在目标文档中所覆盖的论题的百分比。
因此,如果满足一个或者多个(例如,所有3个)阈值,则将文档14识别为属于语境15。
语境引擎100的操作的数字实施例
参照附录A,示出了关于产品市场,具体地,目标市场营销的论题的正文内容的12页文档14。电子表格示出了模式集群(即,ns1:CID为识别的集群ID,ns1:PID为识别的模式ID,ns1:Freq为计算的模式频率,ns1:W为模式权重,ns1:I为计算的模式重要性,ns1:为识别的一个单词,ns1:wf1为用于一个单词的单词频率,并且类似地,ns1:w2/ns1:wf2ns1:w3/ns1:wf3ns1:w4/ns1:wf4ns1:w5/ns1:wf5为用于两个单词、三个单词、四个单词以及五个单词)。还包括单词计算结果的列表(即,ns1:Word为单词,ns1:Count为在文档中的单词频率,ns1:LocalSurprisal为单词的局部重要性,ns1:GlobalSurprisal为单词的全局重要性,并且ns1:Importance为单词的总重要性)。
如在模式集群表的左列中的集群ID(ns1:CID)中所示的,集群(论题)41和39抽出文档14的主要语境内容。文档14是关于产品定位和独特竞争优势的全部。其他识别集群ID 34、33、32也说明文档14。
语境引擎100的示例性操作360
步骤362
参照图9,语境引擎100具有分成一系列事件(例如,句子)的文档的三个公认事件En,每个事件均含有多个单词Wn。
E1-W1,W2,W3
E2-W2,W3,W4
E3-W1,W2,W3,W5
注意,在该实施例中,文档由总共10个单词Wn组成,具有三个句子作为分离事件En。
步骤364
语境引擎100计算在文档中找到的每个单词Wn的概率Pr(Wn)(例如,发生的相对频率)及其局部自信息。
Pr(w1)=0.2和Ilocal(w1)=-log(0.2)
Pr(w2)=0.3和Ilocal(w2)=-log(0.3)
Pr(w3)=0.3和Ilocal(w3)=-log(0.3)
Pr(w4)=0.1和Ilocal(w4)=-log(0.1)
Pr(w5)=0.1和Ilocal(w5)=-log(0.1)
顺便提及,例如,作为在通过文档中的单词总数所划分的文档中的单词的出现数(即,频率)计算Pr(Wn)。
语境引擎100从词典中选择用于每个单词Wn的全局自信息109值GSI作为lg(w1)、lg(w2)、lg(w3)、lg(w4)、lg(w5),然后,计算用于每个单词重要性测度IMPn为:
IMP1=lg(w1)-Ilocal(w1)
IMP2=lg(w2)-Ilocal(w2)
IMP3=lg(w3)-Ilocal(w3)
IMP4=lg(w4)-Ilocal(w4)
IMP5=lg(w5)-Ilocal(w5)
顺便提及,lg(Wn)可以基于大量文档的处理以得到代表在语言中单词使用的统计表(还称作源于频率数量的数)。
此外,语境引擎100从词典中选择用于每个单词Wn的唯一整数。
i1用于w1,i2用于w2,i3用于w3,i4用于w4,i5用于w5,给出
E1-i1,i2,i3
E2-i2,i3,i4
E3-i1,i2,i3,i5
步骤366
语境引擎100可以任选地剔除具有低于指定重要性阈值以下的较低IMPn的单词Wn。
例如,让我们假定IMP1、IMP2以及IMP5都高于阈值,因此,导致从事件En的列表中剔除单词W3和W4,给出:
E1-W1,W2
E2-W2
E3-W1,W2,W5以及
E1-i1,i2
E2-i2
E3-i1,i2,i5
认识到,如果剔除在事件中的所有单词,则从事件列表中去除该事件。
步骤368
现在,语境引擎100使用剩余单词Wn计算在文档内所含有的所有模式/关联性,从而将模式定义为在多个事件中一个或者多个单词的发生。通过允许的第一阶至第五阶(即,W1为第1阶模式并且W1、W2为第2阶模式)将模式频率设置为在如大于1的该实施例中的模式阈值。因此,语境引擎100具有
P1=i1(在事件E1、E3中)
P2=i1,i2(在事件E1、E3中)
P3=i2(在事件E1、E2、E3中)
其中,当i5没有在大于一个事件中发生的时候,没有把E3中的i5视为模式。
注意,可以将单词Wn表示为整数In以提高模式检测的计算性能。
接下来,计算模式权重,包括包含模式Pn的单词的所有IMP的组合PW(Pn)(例如,和)。认识到,可以通过使用大量文档训练来计算P-GSI并且或是保持为用于所有模式的常数和/或唯一值可以与在全局信息集合109(例如,预先定义的Pr(Pn)全局值)中的独立单词关联。
(a)因此,语境引擎100计算PW(P1)=IMP1,PW(P2)=IMP1+IMP2,PW(P3)=IMP2,(b)然后,语境引擎100确定P-GSI(P1)、P-GSI(P1)、P-GSI(P1)(例如,全部等于24),(c)然后,语境引擎100确定局部Pr(Pn)为Pr(P1)=2/3,Pr(P2)=2/3,Pr(P3)=3/3(作为在事件中的模式发生的相对频率),然后,语境引擎100使用来自步骤(a)、(b)、(c)的确定值来确定模式P-IMP的重要性为P-IMP(P1)、P-IMP(P2)、P-IMP(P3)。
可替换地,系统10可以计算模式的重要性为:
m重要性=(24.0+Math.Log((两倍)mFreq/(两倍)文档描述符.句子计数,2.0d))*m权重
其中,作为在用于该信息14(例如,文档)的模式中的每个单词的重要性的和来计算权重。注意,可以将值24视为用于模式的全局自信息的占位符,然而,如果系统10访问在该语言中模式发生的词典109,则替代地,系统10可以使用该值。log术语表示在信息14中的模式的自信息(例如,在信息14中找到该模式的概率的log)。该log值乘以模式权重。所以,可以将模式重要性定义为(全局-局部自信息)*模式权重。因此,可以通过来自含有用于训练集(或者全体语言)的全局自信息的语言的模式词典来代替值24。
和步骤366一样,接下来,执行模式剔除以包括最重要的模式。例如,让我们假定P-IMP(P2)、P-IMP(P3)全部高于模式阈值,因此,导致从模式Pn的列表中剔除P1。
步骤370
接下来的步骤是通过模式含有的单词Wn并且可能通过其在文档中的位置来确定模式(在这种情况下,P2和P3)的关联性(相关程度)。对于该步骤,可以将每个模式表示为整数。
让我们假定,对于该实施例,由于在每个模式中的其类似“单词”i2和其在文档内的相对定位,将模式P2和P3确定为模式集群。因此,把模式P2-P3视为“论题”-T1,该论题具有i1、i2作为在论题Tn(一般地,称作语境定义104)中的单词列表。还认识到,在该文档中确定多个论题Tn的情况下,可以重复仅用于在论题Tn中所含有的这些单词Wn的以上处理来确定超级论题STn。这些论题Tn和超级论题STn与FoR 12的语义语境15关联。
顺便提及,在随后的文档评分中,可以将论题Tn(例如,W1、W2)的单词分组用于与在对于文档(即,目标文档)评分的事件中所找到的类似单词分组匹配。此外,可以结合或者单独使用在模式集群P2-P3中所表示的单词的相对定位。换句话说,认为语义语境15的论题T1具有单词w1和w2、模式P2和P3、以及模式集群P2-P3。可以将论题T1的所有这些属性独自或者结合地用于与对于目标文档所确定的论题的单词内容Wn进行比较。实质上,计算测度作为代表在目标文档的论题和语义语境15的论题之间的重叠程度。
步骤372
相对于它们来自的文档,将所有的单词Wn、模式Pn、以及论题Tn/STn连同统计计算的结果一起存储在数据库(例如,存储器210)中。将单词表示为整数In并且将词典109用于表示整数In与单词之间的映射,和用于每个单词的全局统计。以这种方式,例如,现在通过包括论题T1的属性的论题T1来定义语义语境15。
可替换地,除原始文档(例如,信息14)的参考以外,语境引擎100还可以将模式、论题以及超级论题连同用于每个的相关统计一起存储在数据库210中。因此,可以将语境引擎100配置为加载信息14并且访问对应的单词Wn统计。同样地,认识到,可以通过在词典109中的其值(例如,整数值)表示在模式或者语境定义104中的每个单词Wn。
协作环境140
参照图10,示出了用于基于对于搜索信息集154的不同对之间共享搜索语境156的确定,促进在多个用户Un之间共享/访问各个搜索信息集154的协作环境140。共享语境156可以为具有某些重叠级别的任何语境定义160集合。这可以基于逐个定义或者在聚合体中的语境156进行评分。如上文中通过示例所述的,可以基于利用包括搜索请求18和搜索结果20的多个信息源16(例如,经由第三方搜索引擎24)用户Un搜索活动生成搜索信息集合154的内容。搜索信息集合154还可以含有所希望的对于用户Un生成信息14(例如,文档等)的参考。用户Un的工作活动可以包括在通信网络11上经由信息请求18(含有搜索参数22)和信息响应20(含有产生的信息14和/或其参考)从多个信息源16的信息14检索。上文中关于信息处理系统10(参见图1)给出了在环境140中访问的信息14的实施例。
此外,当已经建立搜索语境156时,协作环境140暗含地可以搜索协作者的信息集合154。当用户提出语境156内的FoR12的应用程序(例如,Microsoft Word)时,在用户进行相同的搜索请求18以前,协作引擎150可以通过协作者的列表和/或搜索结果20增减应用情况。可以将协作服务器152配置为向协作引擎150广播(或者多播)并且询问他们是否具有可以通过网络11在用户之间共享的相关语境156和/或信息集合154。一个实施例为搜索结果20。其还可能为以下情况,在一台机器上的协作客户端150发起关于用于新和/或现有语境156的给定语境定义160(和/或语境156)的对于协作者的请求18。除了通过打开由用户的协作引擎150所监控的FoR 12中的语境156,用户甚至不能发起该请求18。
为了确定哪个搜索信息集154具有共同的搜索语境156,环境140具有配置为将每个搜索信息集154的搜索语境156彼此进行比较的协作服务器152。用户Un均具有为了通过网络11与协作服务器152通信而耦合的协作引擎150。协作引擎150将与每个用户Un的每个搜索信息集154关联的各自搜索语境156通信至协作服务器152,以便随后在确定共享搜索语义156中使用。协作服务器152还可以存储如相对于用户Un所获得的搜索信息集154的副本,和/或如对于搜索信息集154与其他用户Un通信的需要,协作服务器可以请求来自用户Un的搜索信息集合154的副本作为确定对应搜索语境156之间匹配的结果。协作引擎150还与协作服务器152通信,以请求并且获得与用户Un的指定搜索语境156匹配的搜索结果集合154。用户Un还可以具有在确定属于用户Un的搜索信息集合154的搜索语境156中使用的语境引擎151。认识到,语境引擎151的一个实施方式为上文关于信息处理系统10(参见图1)所述的语境引擎100。
网络11
经由一个或者多个通信网络(诸如内网和/或外网-例如,互联网)便于在用户Un(例如,经由网络通信装置101-参见图4)、协作服务器152、信息源16、以及搜索引擎24之间的通信,并且通过用户装置101(参见图4)的用户界面202由用户进行访问。如所希望的,环境140可以包括多个用户装置101、多个协作服务器152、多个信息源16、多个搜索引擎24、以及一个或者多个耦合的通信网络11。
认识到,协作引擎150的一个实施方式是作为协作服务器152的客户端。协作引擎150可以驻留在用户装置101(如通过示例所示的)上,或者可以将其配置为驻留在远程装置101(例如,作为在用户Un和协作服务器150之间的代理服务器-未示出,或者驻留在与协作服务器152相同的服务器装置101上)上并且通过网络11由用户装置101可访问的网络协作服务(例如,协作网络服务)。认识到,如所希望的,关于用户Un的搜索请求18和搜索结果20的网络通信可以是在用户Un和搜索引擎24之间、在用户Un和直接与信息源16之间(例如,绕过搜索引擎24)、和/或在用户Un和协作服务器150(其作为在用户Un和搜索引擎24和/或信息源16之间的代理装置运转)之间。作为仅用于论述目的的典型实施例,以下论述使用驻留在用户装置上101并在与协作服务器152网络通信中的协作引擎150的实施方式。
搜索信息集154
参照图11,搜索信息154的实施方式包括诸如但不限于:包括多个搜索参数22的搜索请求18的内容;包括对于与所请求的搜索参数22匹配(例如,某种程度上)的多个信息14(例如,文档,网页等)的参考链接158的列表的搜索结果20的内容;包括信息14的搜索结果20;或者其组合。可以将参考链接158引导160至搜索信息154文件内所含有的信息14和/或引导162至位于搜索信息154文件外部的信息14。这还可以包括来自语境156(从其发起搜索18)的语境定义160的选择子集或者语境定义160。
认识到,搜索信息154的参考链接158的配置可以包括诸如但不限于:超链接,其被称为信息14中对于相同信息14或者可以在不同域上或者可以为不同域的一部分的另一信息14的另一部分的参考或者导航元素(例如,可以将URI的参考或者导航元素用于保持文件或者URL索引,以使参考可以为URL、文件名等…)。参考链接158可以包括嵌入链接和/或内联链接。例如,将嵌入链接158称作嵌入在诸如超文本或者热区域(例如,覆盖文本标签或者图形图像的用户界面202屏幕的区域)的信息14的对象中的链接。可以将内联链接158用于显示(在用户界面202上)远程信息内容而没有将内容嵌入在信息14中。诸如内联链接158显示远程信息内容的特定部分的情况下(例如,索引图像、低分辨率预览、裁剪部、放大部、描述文本等),远程信息内容可以通过用户Un选择链接158或者在没有用户Un选择链接的情况下被访问,并且当激活时访问其他部分或者全部信息内容。此外,如下所述,搜索信息154具有与例如文档、网页、文档和/或网页的参考链接158等中的每个信息14内容关联的搜索语境156。
搜索语境156
搜索信息154的搜索语境156包括:提供关于搜索信息154的识别、种类、描述、和/或标注信息的语境定义160。例如,语境定义160可以为用于分类或者另外标注搜索信息154的内容(例如,信息14本身、搜索参数22、和/或参考链接158)的单个/多个字母和/或数字描述符(例如,一个或者多个单词),以使下文中进一步描述的、协作服务器152可以将与搜索信息154关联的搜索语境156与其他搜索信息集154的搜索语境156最佳匹配。因此,语境定义160可以为与搜索信息154(例如,网页、文档、图片、文章、视频剪辑、博客等)关联或者另外分配给搜索信息154的(相关)单词或者术语或者短语(或者其模式),因此描述信息154并且便于搜索信息154的基于描述/单词的分类作为搜索语境156。认识到,参照信息处理系统10(参见图1),语境定义160的一示例性实施方式为上文所述的语境定义105,并且搜索语境156的一实施方式为上述语义语境19。
例如,语境定义160可以由作为单词模式/分组/短语包括的单词组成。可以选择语境定义160作为代表搜索信息154的正文和/或图形内容。可以使用在搜索信息154的任何正文主题中不存在(例如,基于用于从信息源16获得图形图像的搜索参数22和/或图像识别分析,将描述标签附至图形图像的内容)的术语学通过语境引擎151来分配语境定义160和/或可以分析用于从其选择有代表性的单词模式/分子/短语的搜索信息154的正文内容。还认识到,无论关联搜索信息集154的实际图形和/或正文内容怎样,用户Un可以将语境定义160分配给搜索语境156。上文中,参照语境引擎100(参见图2)的内容分析器模块102描述了从搜索信息14中选择有代表性的单词模式/分组/短语的一示例性实施方式。还认识到,如上文中参照图1的系统的语义语境15、19所述的,搜索语境160还可以含有应用状态信息(例如,浏览器书签)。
可以按照SQL数据库格式(例如,SQL 2005)将语境定义160存储在存储器210中。SQL数据库格式为用于检索和管理相关数据库管理系统(RDBMS)中的语境定义160的一个实施例。SQL数据库格式通过检索、插入、更新、以及删除存储器210中的语境定义160数据提供查询和修改语境定义160数据并且管理数据库(例如,存储器210-参见图4)。用于访问存储器210中的语境定义160的SQL语言可以包括以下示例性语言元素,诸如但不限于:Statement(语句),其可以对存储器210的图解和数据具有永久影响,或者其可以控制事物处理、程序流程、连接、会话、或者诊断;Query(查询),其基于特有标准检索语境定义160;Experssion(表达式),其可以产生由用于语境定义160的数据行和列组成的标量值或者表;Predicate(判定),其可以将可以估计的条件指定给SQL三值逻辑(3VL)布尔真值并且用于限制语句和查询的效果,或者用于改变程序流程;Clause(条款),其(在任选的某些情况下)为语句和查询的组成成分;以及Whitespace(空白符),其可以在SQL语句和查询中省略。
在另一实施方式中,语境定义160可以为涉及描述符与搜索信息154的对象关联的元数据并且可以体现为用于分割元素的开始和结尾、元素的内容、或者其组合的句法(例如,诸如编码语句的HTML标记/定界符)。可以使用诸如但不限于定义可以根据其逻辑结构(标题、段落、或者思想单元等)如何描述搜索信息154的标准通用标记语言(SGML)的结构化定义语言来定义语境定义160。SGML通常还称作元语言。SGML的特定用法被称为文档类型定义(DTD),其精确定义了所容许的语言。例如,超文本标记语言(HTML)为用于定义语境定义160的结构化定义语言的实施例。结构化定义语言的另一实施例为可扩展标记语言(XML),其定义如何描述搜索信息154数据的集合。因此,可以将语境定义160用于提供语境156的底层定义/描述。例如,可以将HTML定界符用于围绕关于HTML页的描述语言(例如,语境定义160),其作为标题部分位于Web页中HTML的顶部附近。
认识到,通过语境引擎151来确定与各自搜索信息154相关的搜索语境156的语境定义160,然后通过协作引擎150使用其以响应于协作引擎150已知的用户的语境156,通过用户对于协作引擎150的明确请求和/或通过协作引擎150暗示做出从协作服务器152请求其他用户Un的相关搜索信息154。还认识到,如下文中参照处理400(参见图4)进一步描述的,可以将语境定义160(与其他搜索语境156的语境定义160相比较)用于有助于对其他搜索信息集154相对于用户Un的搜索信息154的相对相关性(即,用户Un的搜索语境156与其他用户Un的搜索语境156之间的相似性程度)的排序。如果在用户的搜索信息154的搜索语境156和其他用户的搜索信息154的搜索语境156之间找到(如通过协作服务器152所确定的)适当的相似性程度(例如,满足语境匹配阈值),则如下文中进一步描述的,对于用户来说对于相应搜索信息154的访问(与匹配的搜索语境156关联)是可用的。
示例性搜索语境156比较
参照图12和13,例如,用户U1具有有关联搜索语境156a的搜索信息集154a,用户U2具有有关联搜索语境156b的搜索信息集154b,并且用户U3具有有关联搜索语境156c的搜索信息集154c。此外,协作服务器152至少还具有存储在存储器210中的搜索语境156b、156c,并且搜索语境156b、156c与用户U2、U3(例如,经由诸如用户Un的网络11地址的用户ID)关联。
通过实例,搜索信息集154b包括关于佛罗里达豪华旅行、旅游公司、以及重点推荐旅游胜地公司和游轮公司的列表的信息。搜索语境156b的关联语境定义160b包括术语“佛罗里达”、“豪华旅行”、以及几个旅游胜地公司名称。通过实例,搜索信息集154c包括关于佛罗里达低价旅行、佛罗里达旅游公司、以及重点推荐旅游胜地的列表的信息。搜索语境156c的关联语境定义160c包括术语“佛罗里达”、“低价旅行”、以及几个旅游胜地公司名称。
用户U1经由搜索请求18和对应搜索结果20与搜索引擎24交互。用户U1的语境引擎151(参见图10)分析与搜索请求18(含有多个搜索参数22)和结果20(例如,含有一系列网页链接158的大量结果列表)关联的搜索信息154a,并且生成代表搜索信息集154a的内容的搜索语境156a。
例如,搜索请求18含有“便宜”、“旅行”、“佛罗里达”、以及“包括一切旅游胜地”的参数22。搜索结果20含有用于用户选择旅游公司的网页链接158的列表、关于佛罗里达的网站、机票价格、以及具有旅游者评论的用户选择旅游胜地(包括和不包括这两者)的列表。认识到,如下所述,为了有助于精炼或者另外过滤未经分析的(例如,从搜索引擎24所获得的)搜索信息154a,用户U1与语境引擎151交互以有助于从搜索信息集154a中去除不期望的(对于用户U1)信息内容。因此,认识到,搜索信息集154a代表对于佛罗里达旅行的用户U1特有的分析。还认识到,搜索信息集154a可以包括通过用户U1保存的与某些链接158相关的或者另外通过在收集搜索信息集154a中通过用户U1所使用的各个应用程序自动跟踪的应用状态信息(例如,浏览器书签和浏览器搜索历史)。
因此,通过实例,分配给搜索信息集154a的搜索语境156a包括:“佛罗里达旅行”的语境定义160a(例如,通过返回网页的内容分析指定的语境引擎151)、选择旅游胜地和/或旅游胜地名称的URL(例如,由于用户U1在从搜索结果20中所获得的选择网页URL进行书签的行为,通过用户U1和/或语境引擎151指定的)、搜索参数“包括一切的”(例如,通过分析大部分与在搜索请求18中所重复的搜索参数22之一匹配的返回网页的内容指定的语境引擎51)、以及“便宜”和“最后一刻交易”的关键词/短语(例如,当通过监控用户U1与搜索结果20作用由用户U1认为更相关的,通过分析返回网页的内容指定的搜索引擎151)。因此,认识到,作为搜索信息集154a的内容的最好代表,可以通过用户U1和/或语境引擎151将语境定义160a指定给搜索语境156a。例如,用户U1和/或语境引擎151已经加权或者另外对“便宜”、和“佛罗里达旅行”的语境定义160a的排序高于搜索语境156a的其他语境定义160a。
再次参照图12和图13,用户U1提交其搜索语境156a(例如,经由其协作引擎150-参见图10)并且协作服务器152将语境定义160a与搜索语境156b、156c的语境定义160b、160c进行比较。即使搜索语境156a、156b这两者都与佛罗里达旅行相关,但是基于“所有一切的”语境定义160a与语境定义160b“豪华”不匹配,协作服务器152确定搜索语境156b与搜索语境156a不相关(或者另外,与搜索语境156c很少相关)。此外,在搜索语境156a和156c的比较中,协作服务器152尤其基于“便宜”与“低价旅行”以及“佛罗里达旅行”与“佛罗里达”语义匹配确定在语境定义160a、160c之间存在充分匹配。
然后,协作服务器152联系(例如,服务器152联系用户U1的协作引擎150然后,协作引擎150为用户U1提供匿名或者非匿名的潜在协作搜索者的列表)用户U1,表明其搜索语境156a与一个其他搜索语境156c匹配。还联系用户U3,并且提供使搜索信息集154c与用户U1通信的选项(例如,经由协作服务器152)。同样地,如所希望的,还可以为用户U3提供访问搜索信息集154a的选项。认识到,在各个搜索信息集154a、154c与用户U3、U1通信以前,可以匿名进行搜索信息集154a、154c的交换,即,可以从搜索信息集154a、154c中除去用户U1、U3的身份。因此,给出以上实例,用户U1经由搜索信息集154c获得访问用于佛罗里达旅游公司的用户U3的搜索经验/工作并且在其搜索工作期间通过用户U1没有覆盖的任何旅游胜地的推荐的权益。
协作引擎150
可以在用户装置101(参见图4)上驻留协作引擎150(或者经由在另一计算机装置上驻留的协作引擎150的代理服务器运行-例如,服务器)并且可以在通信网络11上与协作服务器152通信。基于接收到的用户Un的搜索语境156与其他用户的搜索语境156的匹配结果,通过用户Un使用协作引擎150以有助于从其自身和其他用户Un收集或者另外集合搜索信息集154。如下文中进一步描述的,协作引擎150使用协作服务器152获取对其他用户Un的搜索信息集154的访问。为了关于识别的搜索项目的协作,协作引擎150还可以有助于各种用户Un之间的网络11通信。一旦将用户Un对识别为具有类似的搜索语境156和关联的搜索信息集154,用户Un就可以合作进一步搜索/定义搜索项目的不同方面。例如,用户U1(参见图12)可以调查并且共享(与用户U3)关于通过其搜索工作所确定的最好排序的佛罗里达旅游胜地的信息,并且另一用户U3可以调查并且共享(与用户U1)关于通过其搜索工作所确定的航空旅行的最低价钱和佛罗里达旅行的信息。因此,协作引擎150可以便于关于访问彼此的搜索信息集154和/或搜索语境156的用户Un的社会性网络活动。
参照图14,示出了协作引擎150的典型配置。协作引擎150具有通信模块160,其有助于在不同用户Un之间通信(直接在网络11上或者经由如所配置的协作服务器152),具体地,其有助于搜索信息集154和任何其他消息(例如,聊天)的交换。协作引擎150还可以作为例如动态构建社会性网络(或者其他结构)或者协作活动的一部分的对等网络11的一部分通信。
协作引擎150还具有信息模块162,其用于例如经由搜索引擎24访问来自存储器210以及来自信息源16(参见图10)的用户Un的搜索信息集154。认识到,存储器210可以含有均具有其指定的搜索语境156的不同搜索信息集154。协作引擎150还具有被配置为与从语境引擎151和/或存储器210所获得的用户Un的搜索语境156通信的语境模块164,和从协作服务器152接收任何与其他用户Un的搜索语境156匹配的结果。如下文中进一步描述的,语境模块164向用户显示(例如,经由用户界面202)用于通过用户Un随后选择并且与用户交互的识别的其他用户Un和其关联搜索语境156。
信息模块162
引擎150具有信息模块162,其用于例如经由搜索引擎24访问来自存储器210以及来自信息源16(参见图10)的用户Un的搜索信息集154。认识到,存储器210可以含有均具有其指定搜索语境156的不同搜索信息集154。否则,可以通过用户Un来使用信息模块162以从信息源16(经由网络11)获得搜索信息集154然后与语境引擎151交互以确定新获得的搜索信息集154的各个搜索语境156。例如,在对于佛罗里达旅行通过互联网上的搜索中间,在用户Un找到可接受的推荐旅游胜地有困难的情况下,用户Un可以提交(经由语境模块164)搜索信息集154的搜索语境156以查明任何其他用户Un当前是否具有关于可接受旅游胜地的信息。
在通过用户Un请求并且获得来自其他用户Un的期望的搜索信息集154的情况下,可以将信息模块162用于集合或者另外结合用户Un的搜索信息集154的选择内容以导致改善的/修改的搜索信息集154。为了生成相应的改善/修改的搜索语境156,可以基于改善/修改的搜索信息集154的改善/搜索的信息14内容将改善/修改的搜索信息集154发送至用于随后分析的语境引擎151。在这点上,认识到,为了识别可以与改善的/修改的搜索语境156更紧密匹配的其他用户Un的搜索语境156,然后用户Un可以提交改善的/修改的搜索语境156(例如,经由语境模块164)。在这点上,认识到,用户Un可以通过与其他用户(其具有与用户Un的修正搜索信息集154反复匹配的搜索语境156)的协作反复改善/修正选择搜索信息集154的信息14内容。
还可以将信息模块162配置为便于用户使安全属性与搜索信息集154的多部分关联。这些安全属性为选择信息14提供完全私有的(例如,指定为限于所有其他用户Un)、指定为在用户Un识别组和/或者单独用户Un内共享的(例如,指定为与某些识别的用户Un共享/限制)、或者以公共方式共享的(例如,指定为与所有用户Un共享的)搜索信息集154。此外,可以将部分搜索信息集154指定为匿名共享或者明确识别用户Un。例如,在他们与其他用户Un通信以前,可以从搜索信息集154去除或者通过搜索信息集154(和/或关联搜索语境156)保持诸如但不限于用户名、用户网络地址、诸如电话号码的电子邮件地址和/或用户地点的用户联系信息等的用户Un的识别信息。同样地,如果用户Un满足与其他用户Un的搜索语境156和/或对应搜索信息集154相关的安全性要求,则将仅返回(或者匿名返回)通过用户Un所要求的任何搜索语境156评分结果。
此外,取决于指定给其他用户Un的搜索语境156的每部分和/或搜索信息集154的安全性级别(例如,标记私有、标记公共、或者标记请求用户Un为其他用户Un的可靠会员),可以仅将其他用户Un的部分搜索语境156和/或搜索信息集154返回至请求用户Un。例如,如果请求用户Un满足内容部分的对应安全属性,则仅发送内容部分(搜索语境156和/搜索信息集154的内容部分)。认识到,可以将部分用于描述所有(例如,全部)搜索语境156和/或搜索信息集154,或者所有搜索语境156和/或搜索信息集154的子集。
语境模块164
引擎150具有被配置为使从语境引擎151和/或存储器210所获得的用户Un的搜索语境156与协作服务器152通信的语境模块164。如果可用,则语境模块164还从协作服务器152接收任何与其他用户Un的搜索语境156匹配的结果。还认识到,语境模块164可以接收空集(例如,没有可用的匹配搜索语境156)。如下文中进一步描述的,语境模块164向用户显示(例如,经由用户界面202)用于通过用户Un随后选择和与用户交互的识别的其他用户Un和其关联搜索语境156。
还可以将语境模块162配置为便于用户使安全属性(例如,标记私有、标记公共、或者标记请求用户Un为其他用户Un的可靠会员)与所有(或者其选择部分)搜索语境156关联/将安全属性指定给所有(或者其选择部分)搜索语境。这些安全属性为选择信息语境定义160提供完全私有的(例如,指定为限于所有其他用户Un)、指定为在用户Un识别组和/或者单独用户Un内共享的(例如,指定为仅与某些识别的用户Un共享/限制)、或者以公共方式共享的(例如,指定为与所有用户Un共享的)搜索语境156。此外,可以将选择的语境定义160(例如,其全部或者部分)指定为匿名共享或者明确识别用户Un。例如,在他们与其他用户Un通信以前,可以从语境定义160去除或者通过语境定义保持诸如但不限于用户名、用户网络地址、和/或用户地点等的用户Un的识别信息。同样地,如果用户Un满足与其他用户Un的搜索语境156和/或对应语境定义160关联的安全性要求,则将仅返回(或者匿名返回)通过用户Un所请求的任何搜索语境156评分结果。
通信模块160
如所希望的,协作引擎150还具有通信模块160,该模块用于便于在用户Un和协作服务器152之间和直接在用户Un和其他用户Un之间的消息155和搜索信息集154的通信。通信模块160可以经由显示在用户界面202中的聊天窗口便于用户Un的协作。用户可能希望不向其他用户Un暴露自身(例如,保持匿名),在这种情况下,通过模块160格式化聊天消息155为匿名。否则,基于共同决定,用户Un可以同意继续关于论题匿名或者通过用户识别绰号共享所有的将来搜索(例如,搜索信息集154)。可以通过搜索语境156偏爱关于搜索语境156做出对于这种类型的同意。
参照图15,如通过用于与用户Un交互的通信模块160所生成和提交的,在用户界面202上示出典型显示窗格170(例如,显示框)。在互联网搜索的情况下,窗型窗格170可以为示出(例如,匿名地)其他用户Un搜索(通过协作服务器152)视为含有通过用户Un向协作服务器152所提交的与搜索语境156(例如,指示作为实施可以用于随后用户Un搜索协作的类似搜索的用户Un)相关的信息14的内容的浏览器。例如,窗格170可以含有均具有确定为与用户Un提交的搜索语境156匹配的各自搜索语境156(例如,156a、156b、156c)的链接174(例如,对于用户U1、U2、U3)的列表。还认识到,窗格170还可以含有(未示出)均具有与用户Un(例如,用户Un具有与如显示在窗格170中的其他用户Un的搜索语境156匹配的一个以上的搜索语境156)的不同特定搜索语境156相关的搜索语境156的用户的单独列表170。例如,每个显示用户列表172(其他用户Un的用户列表)可以与向协作服务器152提交搜索语境156的用户Un的不同搜索语境关联。
基于列表172的预览,为了直接请求或者经由协作服务器152请求来自其他用户(例如,用户U1、U2、和/或U3)的对应搜索信息集154,用户Un可以在一个或者多个链接174上选择(例如,点击)。例如,可以将聊天机会显示为在网页上的可点击链接。在企业的情况下,可以在用户的用户界面202上呈现同事的图片和名字。
还认识到,为了有助于用户Un决定选择哪个链接174,可以将链接174配置为显示与搜索语境156关联的一些或者全部语境定义160。如上文中所述的,一旦选择,就经由通信模块160访问对应搜索信息集154然后将其转到用于信息14内容(例如,通过语境引擎151自动选择和/或通过用户Un手动选择信息14)的潜在集合体的信息模块162。例如,语境引擎151可以基于通过内容分析器模块102(参见图2)所执行的信息评分从由其他用户Un所接收到的搜索信息集154中选择信息14,以使类似配置语境引擎151的内容分析器模块182。
还可以将通信模块160配置为便于用户Un匿名传达消息155或者具体地识别用户Un。例如,在他们与其他用户Un通信以前,可以从消息155去除或者通过消息155保持诸如但不限于用户名、用户网络地址、和/或用户地点等的用户Un的识别信息。还可以将通信消息155用于便于关于访问彼此的搜索信息集154和/搜索语境156的用户Un的社会性网络活动。
语境引擎151
参照图16,当用户工作以创建或者编译关于搜索信息集154文档和其他数据的时候,语境引擎151管理并使用搜索语境156的正文信息。为了确定有代表性的语境定义160,可以分析与搜索语境156关联(手动、自动、半自动)的每个用户操作信息14(例如,文档)。为了经由协作引擎150的协作目的,可以将搜索语境156的这些语境定义160用于找到在企业中正在从事相同主题工作的同事同时例如遵守隐私和安全策略。如所希望的,还认识到,可能便于在互联网11上环境140(参见图10)的用户其他用户Un和Un之间的协作。另外,在所希望的情况下,语境引擎151使用这些确定的语境定义160以给信息14和任选的其关联应用程序分类并且对其注释。在向企业搜索引擎24和/或文档管理系统提交信息14(例如,文档)以前,可以在企业中完成信息14的这种注释。
为了确定搜寻信息集154的搜索语境156,可以积极或者被动引导语境引擎151以包括用于通过内容分析器182(参见图16)分析的用户操作信息14。积极引导的实例为用户选择要分配给搜索语境156的一个或者多个信息14。被动引导的实例为将语境引擎151配置为自动选择通过与信息源16和/或本地存储器210交互的用户所操作的(例如,创建、修正、存取、或者另外获得等)任何信息14。例如,语境引擎151可以确定通过用户从搜寻结果20列表中选择(例如,通过从列表的链接上点击)的这些搜索结果20所确定的适当的语境定义160并且将这些适当的语境定义160添加至信息集154的搜索语境156,同时选择省略用户没有从搜索结果20列表中选择(例如,通过没有在从列表的链接上点击)的那些搜索结果。
还认识到,例如使用显示提示,通过语境引擎151向用户自动建议在搜索语境156生成中使用的信息14选择,这可以向用户提供接受或者拒绝选择信息14与语搜索语境156确定的关联性的能力。认识到,当选择与搜索语境156关联的选择信息14时,语境引擎151确定常驻在选择信息14中的任何语境定义160(经由内容分析器182),然后通过这些新确定的语境定义160更新搜索语境156的语境定义160,从而提供搜索语境156的动态更新能力。
认识到,选择信息14与搜索信息集154的搜索语境156的关联性的另一实施例可以使用基于时间的被动引导。例如,如果用户继续停留(即,与其交互)在目的地资源16上长达大于预定时段(例如,45秒),则可以将搜索结果20用于积极地精炼搜索语境156的语境定义160,如果用户在预定时段内(例如,5秒)关闭目的地资源16,则可以将搜索结果20用于消极地精炼搜索语境156的语境定义160。此外,例如,当用户将信息14(例如,实际文件或者对于信息14的链接)移动至诸如“我的文档”或者其桌面的用户桌面的监控区域中时,可以将信息14(例如,文件或者网络内容)的搜索语境156自动添加至搜索信息集154的搜索语境15。在网页作为信息14的情况下,将信息添加至浏览器应用程序的“我的爱好”将自动将关联语境定义160添加至对应的搜索语境156。
参照图10和图16,示出了语境引擎151的一个实施例,其用于处理搜索请求18(如果通过协作引擎150引导)、向用户100提供搜索结果20(如果通过协作引擎150引导)、以及基于常驻在用于认为的这些新获取的信息14(通过语境引擎151和/或通过用户手动)的搜索结果20的新获取的信息14中的确定语境定义160更新搜索语境156(如果通过协作引擎150引导)。
内容分析器模块182
内容分析器模块182可以使用规则集183以指令或者另外指示模块182经由通过用户界面202(参见图4)所提供的菜单分析用于任何常驻语境定义160的特定信息14(例如,搜索信息集154)。优选实施方式可以使用托盘图标来允许用户访问便于要选择用于与搜索语境156关联的信息14的语境菜单。认识到,特定信息14可以为:来自新获取的用户Un搜索结果20并且因此用于生成用于用户Un的新搜索语境156;和/或要集合或者另外与用户的现有搜索信息集154结合的附加信息14(或者来自用户Un或者来自其他用户Un)。
例如,规则集183可以为用于识别频繁发生和另外在信息14中的不常用单词和/或分组的搜索方法。此外,认识到,可以将规则集183配置为使用用户Un协作以选择使用的识别单词/单词分组作为语境定义160。例如,可以将规则集183配置为省略某些单词或者单词分组(例如,and(和)、or(或)、but(但)等)还识别在含有预先定义单词的信息14中的选择段落(例如,句子、页、段落、标题等)。例如,可以将规则集183配置为指令模块182突出(向用户Un)含有术语“佛罗里达”、“旅行”、“旅游胜地”、以及“交易”的所有信息14段落。认识到,可以通过用户修改规则集183以含有来自选择的搜索语境156的语境定义160作为这些预先定义单词和/或单词模式。一旦在信息中识别段落,可以通过模块182为用户Un提供机会(例如,经由在用户界面202上的段落的显示)以从如用户Un视为代表信息14的识别段落选择某些单词和/或单词分组。然后,模块182将关联用户选择单词和/或单词分子以成为用于含有信息14的搜索信息集154的搜索语境156(作为语境定义160)的一部分。
作为实例,可以暗示和/或明确进行要包括在搜索语境156中的信息14内容的识别和分析。明确包括内容为通过用户所识别的信息14(例如,文档)。例如,通过用户在文件或者文件夹上“右键单击”然后选择添加至搜索语境156的菜单选择将导致选择信息14对于用于内容定义160分析的内容分析器模块182可用。同样地,还可以将在识别段落中的单词上右键单击用于指令模块182以将选择单词分配给关联的搜索语境156。还可以向用户Un提供选项(例如,经由显示器)以从将选择单词分配给那个搜索语境156的列表中识别。例如,在更接近信息14和识别段落的审查的时候,用户Un可以判定信息14不是代表当前搜索语境156而是代替地可归于不同搜索语境156(新的或者现有的)。
此外,可以通过由用户监控关于搜索信息集154(用户Un的和/或如从其他用户Un所获得的)信息14的创建或者访问(例如,文档或者其他数据源)通过搜索语境156暗示地包括信息14内容。否则,可以通过检查信息14位于本地存储器210(和/或信息来源于哪个源16,包括其他用户Un)何处通过搜索语境156暗示地包括信息14文档。例如,可以经由内容分析器模块182在搜索语境156中暗示地包括位于我的文档文件夹中的信息14。另一选项是用于网页,可以通过用户简单查看网页(例如,在预先确定的时段内)或者通过用户由在搜索语境156中包括页(URL)的基于工具栏的控制识别来在搜索语境156中暗示地包括该网页。例如,响应于通过协作服务器152所执行的确定匹配,可以通过用户经由与从其他用户Un所获得的搜索信息集合154的信息14内容交互来访问这些网页。还认识到,可以通过用户由将在语义语境15中包括页(URL)的基于工具栏的控制、菜单选择、或者其他用户输入反馈机制识别在语义语境15中暗示地包括网页。
将内容分析器模块182配置为从要用作语境定义160的选择信息14中选取单词/多个单词/短语/单词分组(例如,正文部17)以便在修正或者另外创建搜索语境15中使用。认识到,在正文部17中包括两个以上单词的情况下,这些单词可以在信息14的文本中彼此邻近(例如,视为多单词短语),可以通过在信息14文本中位于中间的一个或者多个单词或者其组合将其彼此分离。
语境定义160可以包括检测的单词模式,因此指示在信息14中所含有的单词彼此具有某种关系。此外,在信息14中的正文部17的相对定位/位置可能便于单词模式/关联性的识别,例如,主要(例如,总是)找到彼此相邻的两个单词,主要(例如,总是)在每段的第一句中或者在每页的第一段中或者在每节的标题中等找到一个单词。
此外,鉴于以上情况,认识到,语境引擎151的一典型实施例为关于图1的系统10所述的语境引擎100,其中,将内容分析器模块182配置为与内容分析器模块102(参见图2)类似。
此外,内容分析器模块182可以创建在信息14中所识别的单词、模式、语义结构、和数据的知识网(即,在单独语境定义160之间的互联)。可以按照任何多种方法分等级地访问该网并且在任何时候通过新关系覆盖该网。这意味着能够以任何级别组织和访问搜索语境156内的信息。该主题、模式、关键词、段落、句子、以及其他语言结构。实际上,这意味着可以通过用户基于其主题或者来自在信息14中的正文的其主题组织和/或访问主题。例如,用户可以在引用特定语境定义160的段落上单击并且语境引擎151可以识别与语境定义160相关的其他信息14(例如,文档)的所有部分。例如,可以将任何材料、文档、或者部分文档用于创建搜索语境156。可以将该信息用于构建找到相关信息的新搜索或者可以将其用于对照用户的现有搜索语境156进行测试。
在协作(例如,匿名)的情况下,实施例可以是用户Un共享搜索结果20和/或搜索信息集154。当用户Un搜索互联网和/或文件系统(例如,数据库)的时候,模块182基于用户Un的活动(其触发正添加至搜索语境156的材料)建立语境定义160数据。这些触发可能包括:在浏览器中读取结果、将结果20(例如,文档)识别为相关或者非相关(例如,将结果20存储在预先定义的文件夹或者应用文件中)、书签结果20或者将链接添加至用户文件系统。例如,认识到,模块182可以通过监控文件系统和浏览器行为来跟踪用户的活动。
如通过用户和/或协作引擎150所指定的,还认识到,可以根据选择时间周期过滤与其他用户关联的任何匹配语境定义160(和/或搜索信息集154)。例如,用户可能希望识别具有与选择时间周期(例如,在最近一月内、在最近一周内、在当天内、在最近一年内等)关联的内容的那些其他用户。因此,例如,如与用户不相关的,可以通过协作引擎150滤除不满足选择时间周期的任何内容定义160和/或搜索信息集154。
信息搜索模块186
通过语境引擎151使用内容搜索模块186以为用户Un提供可能鉴于搜索语境156关联的检索的信息14。例如,可以从桌面、企业、以及互联网搜索结果20中获得信息14并且可以通过用户和/或用于通过内容分析器模块182分析的语境引擎151来选择适当信息14。例如,可以使用精确论题信息(即,从搜索语境156所获得的语境定义160)通过内容搜索模块186增加出站搜索请求18。此外,可以经由内容分析器模块182筛选来自搜索结果20的入站数据(即,信息14)并且排列入站数据先后顺序/对入站数据排序。
搜索模块186的一个典型操作为当用户进入查询18(搜索偏爱)(通常通过使用用于参数22的关键词和任何逻辑操作符-括号、AND、NOT、OR等-用于限制参数22),语境搜索模块186检查其搜索语境15并且提供可以用于增加用户提供的搜索参数22的最匹配语境定义160的列表(例如,当“纪录片”的定义绑定至搜索语境156中的“历史兴趣”的语境定义160时,将通过“历史兴趣”的语境定义160增加记录片的用户参数22)。因此,将修改的搜索请求18发送至搜索引擎24以获得与“记录片”AND(及)“历史兴趣”最匹配的搜索结果20(例如,作为根据搜索引擎24的标准的一系列网页,通常具有含有文档的标题的简短总结和有时具有部分文本)。认识到,例如,内容搜索模块186可以支持布尔操作符AND、OR、以及NOT的使用,以进一步经由搜索语境156指定搜索查询18。此外,搜索模块186还通过鉴于搜索语境156定义近似搜索来增加搜索请求18,该近似搜索定义了搜索结果20中的关键词之间的可接受距离。
搜索模块186的另一实施方式是使用与搜索语境156的语境定义160匹配的搜索结果20的信息14中的单词、词组,以对结果20排序以首先提供“最好”结果(例如,对于具有更大相对数量或者语境定义160的评分测度的这些结果与搜索语境156匹配作为信息14的关联性程度)。此外,搜索模块186还可以包括蕴含阈值。例如,在匹配小于语义语境15的定义160的最小数量或者评分测度的特定信息14之间的任何匹配将排除在搜索结果20中的特定信息的显示(或者另外,与通过搜索引擎24提供的信息相比将该信息置于排序中的较低的位置处)。
认识到,在任何情况下,通过协作引擎150使用语境引擎151以检查用于与搜索语境156的相关性的确定程度接收到的信息14,并且通过任何新的识别的语境定义160更新搜索语境156。此外,语境引擎151可以辅助协作引擎150在网络11上提交搜索结果18以获得用于修改搜索信息集154的内容,包括使用选自搜索语境156的语境定义160修改搜索参数22的能力的信息14。还认识到,如上文中参照图1所述的,语境引擎151的一个实施例为语境引擎100。
协作服务器152
参照图17,示出了协作服务器152的示例性实施方式。例如,在协作环境140(参见图10)的某些协作和/或社会性网络活动中,在其他用户Un可能潜在从事与用户Un相同的主题(例如,搜索项目)的工作或者对与用户Un相同的主题感兴趣的情况下,用户Un期望在社会性网络环境内协作搜索或者识别同事/朋友(例如,其他用户Un)。协作服务器152包括可以由用户Un的客户端机器101上的协作引擎150访问的比较模块192。在这种情况下,通信模块190从协作引擎150接收或者另外请求可以与从其获得搜索语境156的各个Un相关的一个或者多个搜索语境156。将获得的搜索语境156存储在存储器194中并将其与用户Un和/或对应搜索信息集154关联。认识到,提交搜索语境156的用户Un可能希望还与搜索语境156一起发送搜索信息集154,还可以将该搜索信息集存储在与对应搜索语境156关联的存储器194中。
然后,为了例如根据诸如但不限于:搜索语境156对搜索语境156;语境定义160对搜索语境156;语境定义160对语境定义160;和/或搜索语境156对语境定义160的匹配粒度的不同级别确定在搜索语境156之间的匹配,服务器152使用比较模块192将搜索语境156彼此进行比较。将语境匹配的评分结果用于识别具有共享兴趣的用户Un(例如,在其搜索信息集154中的信息14的一个或者多个部分潜在可用于每个匹配用户Un)。通过经由其各自搜索语境156满足与每个用户Un关联的语境定义160之间的匹配阈值的评分来识别共享兴趣。
然后,通信模块190可以为协作引擎150提供用户Un身份(例如,实际或者匿名使用例如通过协作服务器152所存储的别名/绰号NN),和其他用户的对应搜索语境156。例如,参照图12,在确定所提交的搜索语境156a与搜索语境156c匹配的情况下,将通过协作服务器152利用其他用户的身份联系用户U1、U3的这两个或者至少一个(例如,通知用户U1搜索语境156a与用户U3的搜索语境156c匹配和/或通知用户U3搜索语境156c与用户U1的搜索语境156a匹配)。然后,联系的用户Un可以审查其他用户Un的搜索语境156然后决定是否联系其他用户Un以获得与审查的搜索语境156相对应的搜索信息集154(或者至少其部分)。
认识到,可以用于在用户Un之间共享身份或者信息14的信息可能基于与搜索语境156(或者单独语境定义160等)关联的安全属性。此外,该信息共享可能不包括协助服务器152并且可能改为在提供广播或者对等能力的网络11上实现该信息共享。认识到,在任何情况下,将协作服务器152配置为确定不同搜索语境156之间的匹配然后使匹配处理的结果和与搜索语境156关联的用户Un通信。
通信模块190
如所希望的,通信模块190可以便于在用户Un和协作服务器152之间以及在用户Un和其他用户Un之间的搜索语境156和搜索信息集154的通信。用户Un可能不希望向其他用户Un标识自身(例如,保持匿名),在这种情况下,通过模块190将用于用户Un的消息格式化为匿名的(例如,使用用户Un的别名NN)。否则,基于共同决定,用户Un可以同意继续匿名或者通过用户识别绰号共享所有的将来搜索(例如,搜索信息集154)。可以通过搜索语境156偏爱关于搜索语境156进行这种类型的同意。还认识到,可以经由模块190便于用户Un之间的通信(例如,用户Un经由模块190发送并且接收与其他用户Un关联的消息)或者用户Un可以直接经由网络11彼此进行通信。
可以将通信模块190配置为便于用户Un与其他用户Un匿名通信或者具体地识别用户Un。例如,在用户内容(例如,搜索语境156、搜索信息集154等)传达至其他用户Un以前,可以通过模块190去除或者保持诸如但不限于用户名、用户网络地址、和/或用户地点等的用户Un的识别信息。可以将模块190用于便于关于访问彼此的搜索信息集154和/或搜索语境156的用户Un的社会性网络活动。
比较模块192
比较模块192可以使用规则集193以指令或者另外引导模块192分析与用于在存储器194中的其他可用搜索语境156的其他语境定义160匹配的任何常驻语境定义160的搜索语境156。认识到,搜索语境156可以是从用户Un新获得的和/或作为先前从用户Un或者从其他用户Un所获得的驻存在存储器194中。
例如,规则集193可以为用于识别在不同搜索语境156中的类似语境定义160,和语境定义160的不同改变(例如,单词分组)的搜索方法。例如,将在一搜索语境156中的“佛罗里达”的语境定义视为另一搜索语境156的“低价旅行”和“佛罗里达”的语境定义对的匹配。认识到,可以将匹配阈值用于确定匹配的语境定义160的数量是否表示该搜索语境156匹配对。然后,模块192将匹配搜索语境156与对应用户Un(例如,来自存储器194的可用的)关联,然后模块192将产生对于通信模块190可用的匹配处理的结果。
为了对于来自不同搜索语境156的彼此进行比较的目的,将模块192配置为从搜索语境156选取语境定义160(例如,单词/多个单词/短语/单词分组)。认识到,语境定义160还可以含有关于在信息14中的单词的定位的信息(例如,单词“佛罗里达”在链接标题中并且在与链接关联的内容的第一段中)。同样地,语境定义160还可以通过彼此含有关于单词的相对分组的信息(例如,“佛罗里达”或者“佛罗里达州的”和“旅行”和“豪华”)。此外,可以在语境定义160中指定单词可以在信息14的文本中彼此邻近(例如,视为多字词组),可以通过在信息14的文本中位于中间的的一个或者多个单词或者其结合彼此分离。
语境定义160可以包括检测到的单词模式,因此,指出在信息14中所含有的单词彼此具有某种关系。此外,在信息14中的单词的相对定位/位置(在语境定义160中)可能便于单词模式/关联性的识别,例如,主要(例如,总是)找到彼此相邻的两个单词,主要(例如,总是)在每段的第一句中或者在每页的第一段中或者在每节的标题等中找到一个单词。
此外,鉴于以上情况,认识到,比较模块192的一个典型实施方式为关于图1的系统10的语境引擎100所描述的语境分析器模块102。
还可以将比较模块192用于集合来自多个用户Un的匹配搜索语境156,然后向通信模块190提供可以向用户Un显示的匹配数据(例如,匹配搜索语境156和/或对应搜索信息集154的链接)以便于与正在从事用户Un的搜索项目的语义语境类似的搜索项目的其他用户Un交互。
还认识到,正如通过用户和/或协作引擎150(或者服务器152)所指定的,可以根据选择的时间周期过滤与其他用户关联的任何匹配语境定义160(和/或搜索信息集154)。例如,用于可能希望识别具有与选择的时间周期(例如,在最近一月内、在最近一周内、在当天内、在最近一年内等)关联的内容的那些其他用户。因此,作为与用户不相关的,例如,可以通过协作引擎150(或者服务器152)滤除不满足选择时间周期的任何内容定义160和/或搜索信息集154。
存储器194
存储器194将获得的搜索语境156存储在表格195中或者其他结构化存储器结构中并且搜索语境156与用户Un和/或对应搜索信息集154关联。认识到,提交搜索语境156的用户Un可能希望还与搜索语境156一起发送搜索信息集合154,还可以将如与对应搜索语境156关联的搜索信息集合154存储在存储器194中。还可以将存储器194用于存储用户Un的别名NN。
搜索模块196
可以通过协作服务器152使用搜索模块196以与搜索引擎24通信(例如,互联网搜索引擎,数据库管理器等)。例如,如所希望的,可以通过搜索引擎152驻留协作服务器152并因此,可以将协作服务器用作用于搜索请求18和搜索结果20(参见图10)的通信的客户端界面(用于用户Un)以及用于接收和处理用于指定的搜索语境156的匹配请求。
认识到,环境140的通信网络11可以包括多个协作服务器152。还认识到,鉴于系统10和环境140的上述部件,可以与术语系统互换地使用术语引擎并且可以与术语系统互换地使用术语服务器。
因此,鉴于以上情况,认识到,在没有任何用户交互的情况下(除了通过使能或者另外地,选择用于FoR 12的语境156),可以通过引擎150启动搜索18。此外,不可能经由信息源16或者协作服务器152通过匹配用户搜索仅找到语境/协作匹配。在协作服务器152的情况下,即使当用户没有明确启动搜索18时,服务器152也可以链接协作引擎150。例如,用户的协作引擎150可以向协作服务器152发送语境定义160和/或语境156并且服务器152可以连接至具有关于该语境定义160和/或语境156的信息的其他协作引擎150(例如,其他用户的)并且设立用于请求协作引擎150合作者(例如,用户)的识别或者聊天的适当链接。不是作为搜索而是作为协作请求18通过协作服务器152发送语境定义160和/或语境156。
在一实施方式中,接收到的其他信息(例如,经由网络11来自连接至用户的其他用户)可以为从诸如但不限于数据库查询;文档的结构化查询;和/或Web查询的信息查询18所获得的信息14。接收到的其他信息可能基于用户请求18或者与用户交互无关地、基于用户的协作引擎150的请求18。例如,基于诸如但不限于:除了在用户请求18提交以前,当用户在参照系(例如,FoR 12)的语境156中时;除了在用户请求18提交期间,当用户在参照系(例如,FoR 12)的语境156中时;以及除了在用户请求18提交以后,当用户在参照系(例如,FoR 12)的语境156中时的用户的活动,引擎150的请求18可以为通过引擎150所启动的预测性查询。
此外,例如,在已经进行任何搜索以前、在已经进行任何搜索期间、或者在已经进行任何搜索以后,当用户在语境156中时,可能出现直接通过引擎150的预测性搜索(例如,提交请求18)和关联的预测性检索(例如,接收响应20)。引擎150可以根据语境156中最确定的语境定义160的确定重要模式构建查询串(预测性请求18的)。搜索串可以为结合在一起的非重叠模式(例如,OR的)的集合。通过与服务器152和/或信息源16通信由引擎150启动搜索。注意,在协作服务器152的情况下,不但没有将搜索串用于其他语境156的匹配,反而在语境156内选择语境定义160。然后,当用户打开(或者另外,与其交互)FoR 12的对应应用程序(例如,Microsoft Word、Web Browser等)时,用户可以获得搜寻和协作结果20。还认识到,引擎150可以使用搜索串。当不存在可用的语境定义160时,引擎150和/或服务器152可以使用例如作为单个语境定义160所选择的搜索串作为退化情况,以使在其为通过引擎150和/或服务器152仅有的可用信息(例如,用于搜索语境156的)的情况下,将搜索串视为语境定义160。
此外,例如,当用户在其计算机上打开诸如网页浏览器或者文件管理器的FoR 12的应用程序或者其他应用程序时,在搜索文本框中的自动完成能力可以在下拉组合框中向用户提供搜索建议。例如,这通过使用来自选自语境156的语境定义160的关键模式经由引擎150进行,以为用户提供用户可以从(例如)下拉列表中选择的正文地基于前面语境类型的搜索/查询建议。
环境140的操作
参照图10、图14、以及图18,示出了用于便于在通信网络11上属于共享主题的多个用户Un的社会性网络的协作环境140的典型操作400。在步骤401处,语境模块164向协作服务器152发送搜索语境156以便在确定与类似主题关联的协作服务器152的另一用户中使用。认识到,搜索语境156包括第一多个语境定义160以使第一多个语境定义160的每个均具有从属于用户的第一搜索信息集合154的第一多个信息14选择的一个或者多个单词。第一多个信息14彼此相关,以使通过搜索语境156的第一多个语境定义160来表示关系。
在步骤402处,协作服务器确定在第一搜索语境156的第一语境定义160与任何第二搜索语境156的第二语境定义160之间的任何适当匹配。
在步骤404处,语境模块164接收至少一个与另一用户关联的匹配的第二搜索156语境,以使匹配的第二搜索语境156含有视为至少与第一多个语境定义160的一些匹配的第二多个语境定义160,该匹配的搜索语境定义160包括从属于与另一用户关联的第二搜索信息集154的第二多个信息14选择的一个或者多个单词Wn。
在步骤406处,用户Un(例如)经由用户界面202调查或者另外评审接收到的第二搜索语境156。在步骤408处,用户使用通信模块106以请求访问与其他用户关联的第二搜索信息集合154。可以经由协作服务器152发送该请求或者直接经由网络11向另一用户发送该请求。认识到,可以从与多个各自其他用户关联的多个接收到的匹配的搜索语境156的列表172(参见图15)选择匹配的搜索语境,以使多个接收到的匹配的搜索语境156的每个均与对应搜索信息集154关联。
在步骤408处,将信息模块162用于集合具有第一搜索信息集合154的信息内容14的第二搜索信息集合154的选择的信息14内容,还集合具有指定给第一搜索信息集合154的搜索语境156的语境定义160的与选择的信息内容14相对应的选择语境定义160。
在步骤410处,语境模块164可以向协作服务器152发送集合的搜索语境156,以便在确定与通过集合的搜索语境156所代表的类似主题关联的协作服务器152的另一用户中使用。
还认识到,在步骤412处,用户可以任选地将一个或者多个安全属性分配给第一搜索信息集合154的部分,并分配给第一搜索语境156,该安全属性定义与协作服务器152的多个用户相关的部分的访问级别。在步骤414处,在发送搜索语境156以前,用户可以过滤第一搜索语境156的内容,该过滤基于指定的安全属性。在步骤416处,用户可以任选地从另一用户接收用于第一搜索信息集合154的请求然后,作为响应发送第一搜索信息集合154。任选地,在步骤418处,在向其他用户发送以前,用户可以过滤第一搜索信息集合154的内容,该过滤基于指定的安全属性。
参照图19,示出了通过协作服务器152所提供的并因此通过用户的协作引擎150所操作的典型用户界面202显示。例如,点击一个按钮170可以指示协作引擎150将选择的信息14添加至语境156的肯定语境定义160而点击另一按钮170可以指示协作引擎152将选择的信息14添加至语境156的否定语境定义160。此外,例如,在信息14参考上点击并且将其加入书签将/可能还便于将信息14参考添加至语境156。此外,还可以将按钮172用于访问识别的协作者174(例如,在网络11上经由协作服务器152)。
计算装置101
参照图1和图4,可以在一台或者多台各自计算装置101上实现例如用户、语境引擎100、151、协作服务器152、协作引擎150、信息源16、以及搜索引擎24的系统10和/或协作环境140的上述部件中的每一个。装置101通常可以包括诸如经由连接218耦合至装置基础设施204的网络接口卡或者调制解调器的网络连接接口200。在装置101操作期间可将连接接口200连接至网络11(例如,诸如互联网的内联和/外联,包括无线网络),该网络使装置101能够彼此适当通信。网络11可以支持系统10和/或协作环境140的部件之间的搜索请求18和对应搜索结果20的通信。认识到,可以在用户装置101上驻留、经由网络11在远离用户的装置101上驻留、或者其结合上驻留任何部件的功能性。
再次参照图4,装置101还可以具有通过连接222耦合至装置基础设施204的用户接口202以与用户交互。通过装置101的用户使用用户接口202以查看FoR 12并且与FoR 12交互。用户接口202可以包括诸如但不限于:标准键盘、键区、走行轮、输入笔、鼠标、麦克风的一个或者多个用户输入装置以及诸如LCD屏幕显示器和/或扬声器的用户输出装置。如果屏幕为触敏的,则还可以将显示器用作根据通过装置基础设施204所控制的用户输入装置。例如,可以将通过用户使用的用于装置101的用户接口202配置为与网页浏览器(例如,FoR 12的一部分)互动以用公式表示搜索请求18,还处理接收到的搜索结果20。
再次参照图4,通过装置基础设施204来便于装置101的操作。装置基础设施204包括一个或者多个计算机处理器208并且可以包括关联的存储器210(例如,随机存取存储器)。计算机处理器208通过执行任务相关指令通过装置101的网络接口200、用户接口202、以及其他应用程序/软件207促进配置为计划任务的装置101的性能。可以通过操作系统、和/或位于存储器210中的软件应用程序207、和/或通过配置成被设计为执行特定任务的处理器208的电子/数字电路的可操作性提供这些任务相关指令。此外,认识到,装置基础设施204可能包括耦合至处理器208的计算机可读存储介质212,用于为处理器208提供指令和/或如果本地访问,则载入/更新客户端应用程序207和语境引擎100。计算机可读介质212可以包括诸如,仅作为实例的磁盘、磁带、诸如CD/DVD ROMS的光学可读介质、以及存储卡的硬件和/或软件。在每种情况下,计算机可读介质212可以采用小磁碟、软盘、盒式磁带、硬盘驱动器、固态存储卡、或者设置在存储模块210中的RAM的形式。应该注意,可以单独或者结合使用以上列出的典型计算机可读介质212。可以将装置存储器210和/或计算机可读介质212用于存储装置101的用户的语境15信息,以使在从装置101向网络11所提交的搜索请求18的处理中使用语境15信息。此外,还可以通过语境引擎100、151、协作引擎150、以及协作服务器152将装置存储器210用作用于存储和访问语境15信息的装置,以便在例如与搜索请求18关联的来自信息14的确定的语境定义105(和/或来自其他语境15的语境定义104)匹配中使用。
此外,认识到,计算装置101可以包括可执行应用程序100、207,该可执行应用程序包括用于执行(例如)包括了操作系统、网页浏览器、语境引擎100的那些预定功能/操作的代码或者机器可读指令。如用于本文的处理器208,其为用于执行如通过以上实例所述的操作的配置装置和/或机器可读指令的集合。如在本文中所使用的,处理器208可以包括硬件、固件、和/或软件的任何一个或者组合。处理器208通过操作、分析、修改、转换、或者传输通过可执行程序或者信息装置使用的信息,和/或通过关于输出装置路由信息来作用于信息。例如,处理器208可以使用或者包括控制器或者微处理器的能力。因此,可以在硬件、软件、或者这两者的结合中实现语境引擎100、151、协作引擎150、和/或协助服务器152的任何模块(和其子集)的任何功能性。因此,为了简单起见,下文中,通常将作为装置和/或机器可读指令的集合的处理器208的使用称作处理器/模块。
应该理解,用户的计算装置101可以为(例如)个人计算机、个人数字助理、以及移动电话。如所希望的,可以为信息源16和搜索引擎24配置服务器计算装置101。此外,认识到,如所希望的,尽管描述为单个计算机系统,但是可以作为计算机处理器的网络实现每个计算装置101。
附录A-系统10的操作的数字实例
提高价值主张的市场定位
“我将向谁销售什么,并且他们为什么购买?”确定对于这种表面上简单问题的回答将比任何其他事情对于您企业的成功具有更大影响。这个回答将对于你的消费者推动你的独特的价值主张的本质。
什么是独特的价值主张,并且为什么重要?
首先,价值主张为你的产品、服务、或者出售物可以向消费者提供的内在价值的承诺。当消费者从你那购买时,可以期待消费者受益的声明。简单地声明,他们用他们的钱得到了什么。独特的价值主张为与通过竞争对手所提供的价值主张区别开的一种价值主张。
通常沿着三个尺度创造价值:
·性能价值(出众的功能)
·价格价值(低成本)
·相关价值(诸如个性化处理)
价值还被相对感知。例如,一个公司将更多的重要性放在低成本上,然而另一公司将重要性放在可靠性上。例如,Cisco索价超过作为以前的竞争对手10倍价格并且现在附属机构Linksys,供应关于具有相同操作特征,但是具有更高感知(和实际)可靠性的无线路由器。对于IT购买者,可靠性和系统正常运行时间对于他们至关重要,Cisco价值在这点上。家用无线网络者更加关注支付价格并且将为了显著价格降低牺牲一些极高可靠性。因此,为了定位你的企业以提供独特价值主张,了解你正向谁销售至关重要。
市场细分和市场定位反应企业的基础。在这种基础上建立独特的价值主张并且客户为导向的市场营销计划基于该基础。所有企业的重要决策和策略关键取决于这些基本要素。然而,确定市场细分和市场定位不容易。如果在确定市场细分和市场定位以前,进行其他市场营销决策,则存在资源(诸如资金和时间)被不良使用并且不能实现预期结果的风险。客户为导向的市场营销计划必须基于目标市场、企业市场定位、以及所提供的独特的价值主张。
市场细分回答问题的第一半:“我正在向谁销售什么…?”。通过市场细分将市场划分为志趣相投的购买者的类别。一旦确定类别,就可以确定目标市场。
市场定位回答问题的第二半:“…并且他们为什么会购买?”与竞争相比较,市场定位确定通过目标市场如何感知产品和服务。管理战略的这两个相关概念被认为最有成效地回答市场定位问题。存在企业特长和其持续竞争优势。
特长和持续竞争优势
持续竞争优势是大多数企业不断寻求的圣杯。如果可以找到一种方法持续在竞争前列,则企业将可能将高于正常的利益回报给其拥有者。在竞争前列意味着企业可以更容易销售更多,和/或索要更高价格,和/或比“标准”公司具有更低成本。让我们从企业营销人员的观点来看竞争优势。如你将看到的,企业营销人员的观点是消费者的观点。你的竞争优势是与你的竞争者相比为什么消费者或者潜在消费者更可能从你那里购买。如果你在开发持续来自竞争性侵犯的竞争优势方面已经成功,则你已经创造了持续价值。
特长是某些人如何参考为持续竞争优势的来源的优势。如果优势为持续的,则你的企业具有对于你的竞争者难以仿效的某些东西并且对于你的企业必须是有些与众不同的。什么是可能为持续竞争优势的来源的企业的特长来源?创造企业家好像找到新的与众不同的方法来说服消费者更喜欢他们而不是喜欢竞争者。某些方法:
·许多公司使用技术获得竞争优势。专利和商业机密是防止竞争者仿制的武器。对于软件公司,用于他们产品的源代码是关键竞争优势。Priceline.com具有关于用于让消费者设法确定商品和服务的其自己的价格的方法的专利。这是持续竞争优势的最大来源。
·其他公司可能依靠优秀设计、感知高质量、或者持续创新作为特长。例如,戴尔计算机能够提供其客户定制计算机的独特价值主张,严格按照消费者订购计算机并且当用户订购计算机时,并且以具有竞争力的价格投递该计算机。戴尔能够实施这种价值主张的原因在于其供应链投资和订单管理系统建立了“准时生产”系统,消除开销、存货、以及计算要求错误的成本。然而,作为其他竞争对手,诸如联想和惠普已经找到可选择的低成本制造和分销系统,戴尔的竞争优势被侵蚀。
·其他商业通过已经接受公司服务价值的忠诚员工使用良好的客户服务。西南航空公司是企业的优秀实例,该企业通过优秀的客户服务和用于调度和调转航班的技术来区分自己和竞争对手。许多消费者乘坐西南航空公司的航班,不仅因为其经济,而且因为其乐趣。其他航空公司不得不仿效西南航空公司并且已经失败。
·消费者感知产品、服务、以及公司的名誉和其他差别可以为持续优势的非常有价值的来源。如果消费者把你视为优选资源,则他们更可能选择你的产品或者服务。行业领先的服务质量一直是雷克萨斯特点。思考雷克萨斯怎样致力于提供伟大的客户体验。他们从每个消费者收集大量信息并且下次使用该信息,相同的消费者与公司互动以使他或者她的体验甚至更好,从服务调度、至债权人汽车、至说明在车辆上进行的工作干的更好、至完成整车质量检查过程。这是雷克萨斯为什么在1991年成为顶级豪华进口车的主要原因并且在2000年成为整个汽车市场的第一豪华汽车,该头衔其已经保持7年。
所有这些是企业家搜寻持续竞争优势的方法。他们涉及消费者如何相对于另一个来选择一种产品或者服务。关键市场定位和市场细分决策与消费者为什么相对于你的竞争者而选择你的纠缠。提供你的独特价值主张的这些决策最好与企业的特长平衡。
开始:市场细分和目标市场
实际上,通常一起开发市场定位和市场细分决策。然而,为了便于沟通,我们一次采取一个,但是考虑我们要达到的相互关系。概念地,市场细分为通过对于公司营销活动具有响应的目标将公司市场分割为子市场并且产品/服务提供跨细分市场大量改变的过程,但是在每个细分市场内几乎没有可变性。对于企业,在多种情况下,细分市场可以仅等于两个:通过我们的出售物和市场营销活动我们作为目标的团体和“其他每个人”。目标细分市场明显与提供的产品/服务和企业的竞争战略有关。
具有某些非常重要的问题,作为目标市场的细分市场的选择的一部分需要回答这些问题。如下:
1.最重要的问题是:目标细分市场希望设法提供多于其他细分市场的我们市场定位的感知价值吗?有时,目标市场可能包括对于营销组合的其他要素的响应不同的细分市场。然而,许多成功企业根据它们着眼于它们感知公司提供的差别利益的价值区分目标细分市场。如果公司可以把与竞争者相比较其对他们的出售物评价最高的这些人们作为目标,则公司具有多种利益,包括更好定价和更高利润、更满意的消费者、以及通常对于潜在和实际竞争者更好的壁垒。
2.几乎与有利的市场细分一样重要的是:怎样可以达到细分市场?以及怎样快速达到?存在可用的分销或者媒体选择权吗或者可以使用自选战略吗?选择权是为了达到有效的细分市场成本吗?在竞争对手(尤其,在互联网上)可能把相同的细分市场作为目标以前,可以足以快速地达到足够的细分市场以使你可以成为领导者吗?
3.细分市场多大?如果细分市场不够大,则根据潜在收入和总利润调整制定计划的成本以满足细分市场,细分市场将无利可图。
4.还记住的其他问题包括:在相关环境条件下(例如,经济条件、生活方式、法律条例等)的改变对目标细分市场的潜在响应的可能影响是什么?引导目标细分市场的当前和可能的竞争活动是什么?[1]
虚拟社区:是最终细分市场吗?
互联网已经培养了成千上万个虚拟社区。这些虚拟社区由通过共同兴趣联机集中在一起的人们的团体组成。正像对于诸如业余爱好、体育、娱乐等的某些活动的爱好者多年以来已经在主要城市区域组成起来,互联网让来自世界各地的爱好者虚拟地“组织起来”。相同的现象对于某种软件或者专用设备的商业用户适用。用户或者潜在用户喜欢组织起来以通过可能帮助社区会员的对于共同问题的共有解决方法、有用提示、新想法、或者新产品的评价互相帮助。与亲身参加爱好者的聚会相比更容易将通知粘贴在博客或者在线虚拟布告栏上。虚拟社区会员可以在白天或者晚上的任何时间与对方互动并且通过非常相似的需要和体验来联络人们。
这些虚拟社区可以是企业的倒数第二的细分市场。根据前述市场细分选择问题,前两个问题的回答几乎为在线虚拟社区的定义的一部分。如果根据虚拟社区的会员调整你提供的产品或者服务(或者作为重大的,感知调整),则与任何其他团体相比较将虚拟社区定位为非常有价值的细分市场。将细分市场的大小容易地确定为虚拟社区的大小。
卷入虚拟社区的企业公司的动机大,但是这不是单行线。市场营销程序的所有要素需要机敏地适应新的市场细分环境。McKinsey公司的顾问John Hagel III和Arthur G.Armstrong恰好概括了在虚拟社区中的市场营销的挑战。
虚拟社区可能看起来真正威胁到你的普通公司。多少公司希望他们的消费者更容易彼此交谈关于他们的产品和服务?但是经销商立刻除了参与几乎没有选择。当越来越多的消费者参加虚拟社区的时候,消费者发现自己在“反向市场”中-消费者搜寻出经销商并且这些经销商相互竞争的市场,而不是相反。目光远大的公司将认识到虚拟社区实际上代表以最小成本扩张其地理区域的巨大机会。
企业市场细分实例-Tandem′s East
聪明的企业家可以使用目标市场细分作为创办企业的主要原因。实例是Mel Kornbluh,80年代末期他在其车库里创办了叫做Tandem′s East的公司。Mel是出售和维修双人自行车的专家-为2人(或者3人或者4人)制造的自行车。Mel认识到存在赏识双人自行车的独特优越性的自行车夫妇的细分市场。两个人在一起的最好锻炼,在他们一起锻炼、欣赏自然的同时进行交流,即使他们可能具有完全不同的体力,也可以一起做所有的这些事。
当他创办他的企业时,直觉地,Mel具有对于以前问题的非常好的答案。实际上,存在Mel可能作为目标的两个目标细分市场。第一个是现有双人自行车爱好者夫妇-他们已经拥有双人自行车并且需要升级或者更新。另一个目标细分市场是因为体力的差别他们一起骑自行车存在问题的相对富裕的自行车夫妇。因为当与两辆常规自行车相比较时,双人自行车相对昂贵,所以需要夫妇是富裕的。他们没有大量生产并且没有利用大规模经济。
在Mel创办时,在东海岸没有人设立作为双人自行车专家的职位。因为双人自行车库存昂贵并且挑选对于潜在购买者非常重要,所以他通过首先堆积充实库存来建立对于潜在竞争对手的壁垒。他还能够通过首先在区域并且为它们提供新专营店利用某些供应商建立某些排外布置。
Mel相对容易地达到他的这两个细分市场。现有双人自行车爱好者是拥有他们双月出版的实事通信的美国双人自行车俱乐部的会员。在实事通信上相对便宜的广告正好达到他的第一细分市场。不仅达到该细分市场,而且因为读者已经是爱好者,所以他们将注意力集中在实事通信的每一页上。随着时间的过去,还形成了专注于双人自行车的互联网用户团体。他们还是用于有效达到细分市场的自然媒介物。
他的第二细分市场也相对容易地达到有效成本。富裕的自行车夫妇阅读自行车杂志-大多数为自行车杂志。此外,因为他们是爱好者,所以目标细分市场将许多注意力集中在甚至小广告上。这些细分市场还留意自行车集会和组织的骑自行车。
这两个细分市场比Mel需要进行的切实可行的商业大得多。通过在任何一个细分市场中的非常小的反应速率,他可以有条件支付开销并且开始积累适当库存。实际上,他的广告成本明显在收入的10%以下,指出达到细分市场为非常有效的成本。
因此,创办Tandem’s East并且Tandem’s East通过有创造性地看待重视Mel正在出售什么的目标细分市场繁荣。细分市场充实并且非常容易达到有效成本,并且可以树立竞争壁垒。
企业市场细分审计
图1-1示出了企业营销人员可以用作清单以确信她或者他没有忘记考虑的市场细分要素的市场细分审计。对于企业家,可能有效成本仅在质量上回答在审计中的许多难题。然而,没有考虑这些难题可能导致大问题。
实际上,这本书的其他目的是为了逐出第七组难题。市场细分怎样与用于企业风险的市场营销组合的所有其他要素相关?然而,正像作为目标市场决策的基本原则是接下来我们将注意力转向的错综复杂的市场定位决策。
市场定位
市场定位回答这个问题:“目标细分市场的成员为什么会购买我们的产品或服务而不是购买我们的竞争对手的产品或服务?”相关市场定位问题是:“如通过目标细分市场的成员所感知的,我们的产品或者服务的独特区分特征是什么?”在这些市场定位问题中的具有下划线的单词对于有效实现至关重要。首先,必须分析单词“感知”。显然,人们仅基于他们所感知的进行决策。当许多企业公司已经开发了关于他们知道对于在他们的目标市场中的人们重要的特征实际上好于竞争者的产品或者服务时,其非常高兴。他们所忘记的是直到目标市场的人们实际上感知在他们的产品和竞争者的之间的差别才做这件工作。实际上,在互联网空间中,在他们可以实际提供很早以前,许多公司设法获得他们非常好的感知。
有效市场定位的障碍之一是大多数人不可能同时感知两个或者三个区分属性。重要的是目标市场定位容易记住。如果存在太多区分属性,则潜在消费者可能感到困惑。营销人员的工作是为了隔离她的出售物的最重要的区分属性并且在市场营销组合的所有要素中使用这些属性。在多种情况下,真正有效成本是通过潜在消费者进行概念测试或者其他研究以隔离最佳属性组合(参见第二章“概念测试”节,“生成、筛选、以及发展思路”)。在其他情况下,企业家可以本能隔离优良的属性组合。
已经成功的企业家可能夸大怎样容易获得用于他们的市场定位的优良属性组合。至少部分地由于非常有效的市场定位,诸如星巴克(仅口味好、品质优良的咖啡)或者苹果计算机(娱乐和易于使用)的公司是成功的。因为他们的市场定位和相关目标细分市场不是真正有效的,所以已经具有没有记载什么的多少企业冒险失败(或者不像他们可能的那样成功)。风险资本评估(在绪论中所引用的)-可以通过更好的投放市场以前的市场营销分析来防止多达60%的失败-强调获得你的正确的市场定位和通过真实消费者测试以确认其正确的重要性。
许多企业犯得大错误是基于与他们的竞争对手相比较的他们供应品的特征进行定位。令人惊奇的是我们已经遇到具有好主意的多少企业家是基于以某种方式比他们竞争对手更好的技术特征。许多企业家已经吃亏的“消费者不购买特征,他们购买优越性”的基本范例。甚至更精确地,消费者基于感知优越性购买。不仅企业家需要开发最好的一系列优越性对抗竞争者;而且他或者她必须以某种方式使消费者感知这些优越性。
在他的书中,他们正在想什么?我已经从超过80000个新产品创新和白痴行为中吸取教训,Robert McMath还说沟通特征代替感知优越性是“营销人员最常犯的错误之一”[2]。他描述了英国喜剧演员约翰克里斯举例说明外科大夫怎样向躺在病床上的病人解释新外科手术程序的培训电影。
“我要给你做手术。只有三个切口和安德森斜线、山脊茬端弹指和标准天窗滑!仅使用手术刀5分钟;只有30针!我们可以从你的身体内部拿出多达5磅的东西,你回到病床上平躺75分钟,并且我们可以在一天作十多台这样的手术。[3]”
外科大夫从头至尾仅关心他作为生产者(企业家)兴奋的技术特征。消费者具有完全不同的关注。消费者可能想知道的所有事情是,他是否好转,可能存在什么并发症的危险,以及他是否疼痛。
联系在一起的价值主张:特长、持续竞争优势、以及市场定位
现在,我们研究了市场细分和市场定位,并且建立了特长和持续竞争优势的战略概念的关系,我们可以返回独特价值主张。独特价值主张是放在基于企业的特长和持续竞争优势的目标市场和市场定位决策上的公众面孔。现在,我们可以基于以前所论述的决策确定“我正在向谁销售什么并且他们为什么购买?”的答案。当心,然而-这些决策不容易改变。通常改变价值主张比尝试在真空中建立新价值主张要花费更大的精力。改变价值主张大于改变口号。意味着取消已经基于企业怎样执行建立的市场感知并且通过另一个代替该市场感知。
对于企业公司,在创办新商业并且复兴老商业以前,决定价值主张-错综复杂的市场定位、特长、以及持续竞争优势的决策-是所作出的最重要的战略决策。花时间证明这件事正确。如果市场没有评价“我们感知的是你们公司对抗竞争者的特长”(定义“市场定位”的另一种方法),则市场定位不会成功。如果市场定位不成功,则价值主张将不能吸引消费者。此外,因为难以改变感知,所以随着时间的过去,感知特长应该持续。因为,在第一次挂牌以前,获得适当接近正确的市场定位至关重要。在第2章和第3章中,在挂牌以前,你将研究获得市场定位选择权的市场反应的有效成本方法。
奥维斯公司-优秀企业市场定位
奥维斯公司多年利用在完全竞争行业中的独特市场定位做的很出色。他们出售“国家”衣服、女装、以及运动装备与像L.L.Bean和Eddie Bauer的更大品牌竞争。与他们的竞争对手一样,奥维斯零售和邮购。怎样区分奥维斯?他们希望被视为适用于飞钓专长的所有领域的身份。他们的特殊专长是进行“非常易受新一代钓鱼者的影响的”非常难的运动[4]。自从1968年,当他们的销售额小于一百万美元时,奥维斯已经营位于他们零售店附近的飞钓学校。现在,他们的年销售额超过了3.5亿美元。飞钓产品仅贡献出一小部分公司的销售额,但是飞钓传统为所有奥维斯产品增加了威望。据Tom Rosenbauer所说,参加他们学校的初学飞钓者成为非常忠实的消费者并且对于更有利的服装和礼物生产线的持续扩张至关重要。他说:“没有我们的飞钓传统,我们仅是服装供应商[5]”。
奥维斯市场定位遍及他们的总体业务。他们的产品目录和他们的零售店都加强了他们的飞钓传统。他们还可以使用完全的目标细分市场以找到他们飞钓课程的新会员。具有到达对钓鱼感兴趣的消费者的多个目标媒体和公共关系传达手段。因为他们独特市场定位,他们的利润高于典型的“服装供应商”。因为自从1968年以来他们的所有业务已经加强的一致感知,所以市场定位还是可防御性的。竞争对手将具有复制奥维斯学校和零售店的非常艰难的时期和巨大开支。竞争对手也难以在传统如此重要的行业中成为“我也一样”。奥维斯在1968年所做的市场定位和市场细分决策可能自那时为他们的企业增加接近1百万美元的递增价值。与他们仅为“另一个服装的供应商”的企业的收益率相比较,这个价值是自从1968年以来我们估计奥维斯的实际利润的差额。如接下来所论述的,维多利亚的秘密(Victoria′s Secret)是真正平衡优秀市场定位的的另一公司。
维多利亚的秘密及有限公司-市场定位、市场细分、以及特长的良好结合[6]
最初的维多利亚的秘密商店和产品目录在加利福尼亚州的帕罗奥多。在1982年,当有限品牌创始人,Les Wexner,第一次看到这个商店时,它是非常廉价纺织品店。然而,在负责这个商店以后,Les想到重新包装内衣作为女性内衣并且制作情感内衣-具有内衣令你感觉良好。通过他判断欧洲女性对内衣的看法与美国女性看内衣怎样不同来影响Les。早期的绝妙主意是使用超级名模作为PR的一部分并且为维多利亚的秘密(VS)做广告。
有限公司在1982年以1百万购买第一个VS商店。在1995年的时候,其具有产品目录,300个零售商店,以及8亿美元资产的企业。产品目录为最大的收入贡献者。在1995年,女人和男人们感知VS产品作为主要适用于星期六晚上和特别场合。在1995年,VS营销人员发现用于VS的更大扩展市场定位(满足“日常”需要)的机会同时保持“特制产品”形象。他们通过利用使用场合市场细分开始VS的转换。他们在重新定位生产线的第一件产品是日常棉织物,但是定位并且设计为“性感”。存在关于是否可能使女人们将棉织物视为内衣的有限公司管理的许多不确定性。风险是,可能将棉织物内衣视为正如可与Haines相比较的与性感相反的内衣。这是更大的沟通挑战。
需要将市场营销组合的所有要素改变为支持新市场定位。VS以前从未做过广告并且仅使用其产品目录作为广告媒介物。产品目录到达范围非常低,并且频率非常高(不适用于使大量新人对该品牌发生兴趣或者改变产品的感知)。因此,使用其成功超级名模偶像作为重新定位的一部分,大规模TV广告和PR是适当的。超级名模是新VS市场定位的情感体现。在网络上VS超级名模时尚秀非常有效地加强了其市场定位。如此多的人们访问他们的网站以使他们对互联网服务中应接不暇。
在1995年,在市场定位以前,VS乳罩定价为两个15美元,并且VS为商家驱动企业。需要转换为时尚企业。在2006年的时候,由于重新定位,通过超过4个因素,VS商品的平均价格翻了一倍多,并且其收入上升。重新定位成功的一个关键是VS乳罩不仅性感,而且非常舒服。消费者不必在感觉性感和感觉舒适之间妥协。对VS的忠诚度通过新乳罩加倍。日益增加的忠诚度使消费者的长期价值更大,因此,对于VS证明为了获得新消费者的更大花费是正确的-美好的良性循环。
VS商店是重新定位的整体要素。将在大商店内的体验设计为与其他商店截然不同-将其设计为使消费者感觉专用、亲密、私人。存在更多的纵容。
随时时间的推移,VS逐步形成子品牌-通过生活方式细分:
·诱惑的-“绝对性感”
·浪漫的-“天使”
·富有魅力的
·少女系列-“调情的(Such a Flirt)”
·清新和简单的-“维多利亚修身”
·年轻的-轻浮的-现代的-“粉红佳人”
在星巴克所作出的方面VS获得了成功-改变人们怎样看日用品-通过将VS改变为相对便宜的方式使女人自我感觉良好。在随后在章节中,我们将更深入调查VS及其公司能够怎样使用企业市场营销人员的战略和策略以实现使VS为有限品牌公司的皇冠明珠。
市场定位、名称、以及口号
当许多企业家命名他们的产品、服务、以及公司时,他们错过了市场定位的机会。如我们稍后深入论述的,企业家具有非常有限的市场营销资金以培养关于其产品和服务的市场定位的目标市场。如果选择的名称本身没有暗示适当的市场定位,则代替一种方式,企业家不得不花费更多的资金以两种方式培养市场。他们不仅必须使潜在消费者认识并且记住其产品名称,而且他们还必须围绕伴随该名称的属性和利益培养消费者。请触摸费城博物馆是完美实例。其名称确切地告诉父母和他们的孩子他们可以期待什么。多种新技术和基于互联网的企业也是非常有才智和有创意的,其名称暗示适当的市场定位。诸如CDNow(互联网上CD)、ONSale(在线网上拍卖)、Netscape Communication(互联网浏览器)、以及NetFlix(互联网上影片租赁)的公司使潜在消费者容易记住他们是做什么的和至少一部分其的市场定位。然而,即使当其名称优秀,CDNow的有缺陷市场定位和商业模式也导致公司的倒闭。另一方面,你仅从Amazon.com的名字全部知道的是它是互联网公司。它销售图书的事实从其名字来看不明显,并且需要通过其他市场营销活动来培养。
即使某些幸运的公司进一步通过使其名字不仅支撑其市场定位,而且同时让他们的潜在消费者知道怎样与他们联系,但这些公司已经消失。实例为1-800-FLOWERS、1-800-DIAPERS、以及1-800-MATTRESS或者Reel.com。
其他公司通过使其产品名称和公司名称相同来获得平衡。你知道哪个财富1000强公司命名为Relational Software?Relational Software的产品命名为Oracle。为了改善市场认知,公司将其名称改为Oracle,其流行产品的名字。Oracle已经成为世界上的顶级数据库软件公司之一。然而,认知获得是多样化的障碍。Oracle因数据库而著名,但是无论大投资和市场营销活动怎样,Oracle在销售他们自己的应用软件方面相当失败。没有将Oracle视为强大的应用软件公司。Oracle=数据库。
如果公司或者产品的名称不足以确定其在消费者心中的位置,则接下来需要简洁地(并且希望难忘的)深入锤击市场定位的口号或者署名。如果市场定位非常好,则在许多情况下,口号或者署名可以相当完整地传达适当属性。一个好实例为FedEx:“当你完全确定要在那里过夜的时候”。在该署名中的内在市场定位是为了对该公司进行市场定位仅集中在要强调的少数、最重要的属性的好实例。Visa多年来使用“它无处不在,你想要的”以作为全世界接受的无处不在的信用卡区分自己。另一方面,Michelin使用“因为你的轮胎负重如此多。(Because so much is riding onyour tires)”以设法作为对于轮胎购买者更好地在安全属性上区分自己。
正像简短和简单在市场定位中颇有价值,他们还在口号和署名中颇有价值。只要市场定位有效,伴随公司或者产品名称的口号将是可以在相当长时间段内保持的一个口号。Robert Keidel提出了用于有效口号的其他基本规则[7]:避免陈词滥调,例如“真正的”Chevrolet,Miller等;一致的;使用数字,但是支持这些数字;简短;表明立场;以及使你自己与众不同。所有这些规则与我们的有效市场定位范例一致并且合情合理。
印度利华公司代表举例说明在本章中所论述的多点的令人感兴趣的实例。
印度利华公司:对于金字塔底部的市场定位和目标市场
像任何有效的管理决策一样进行市场定位和目标市场的决策。发展标准,生成多种决策选择权(包括创造性、“独特性”选择权),然后估计这些标准的选择权。用于估计市场定位和目标市场决策的暗示标准通常涉及对实体的股东价值的长期影响和短期影响。然而,还存在可以限制选择权的制约,诸如道德问题、环境问题、法律问题、企业价值和文化等。印度利华公司的实例还举例说明了市场定位和目标定位决策怎样与怎样提升、分销、以及销售产品的决策深入交融。C.K.Prahalad在他非常有价值的书中《在金字塔底部的财富》证明了对于新市场定位的需要和印度利华公司怎样响应于具有完全创新产品的市场定位、目标市场、以及市场营销组合战略的需要。
印度利华有限公司,HLL,是印度最大的清洁剂制造商,在2001年具有24亿美元的销售额,40%来自肥皂和清洁剂[8]。在其市场定位选择权上存在的一个限制条件是其公司使命:
我们印度利华公司的目的是为了满足无论什么地方的人们的日常需要-预测我们的消费者和消费者的渴望并且报之以提高生活质量的创造性和竞争性的品牌产品。
我们深深扎根于本土文化和全世界的市场是我们的空前遗产和我们未来成长的基础。我们将把我们的知识财富和国际专业技术带给本地消费者的服务。
在其从1990年至2000的历史上,HLL已经把印度的大众化市场作为目标市场。他们已经逐渐展现提供持续竞争优势对抗其竞争者的独特能力。在印度周围的约100个场所制作产品并且经由仓库分销给近7500个供货中心。HLL达到至少2000人的所有村庄。具有使农村妇女忙于销售和维护其产品的大量创新性计划[9]。因为适用于农村市场的建立基础设施和开发产品的成本,所以他们的竞争者很难达到农村人群。
他们继续使用杠杆作用的能力之一是引入并且有益地销售社会贫困地区人们愿意支付的产品。代替首先考虑成本,他们着眼于人们愿意支付。通过由潜在消费者感知的产品价值来决定这种支付意愿。据HLL主席曼维恩德-辛格-邦加(Manvinder Singh Banga)所说:
力宝(Lifebuoy)定价为群众负担的起的…。在商店中非常容易发现人们算出成本加成定价。他们计算出其成本是多少然后他们加上利润并且计算他们的销售价格。我们已经学会的是当你处理大众化市场时,你不能像这样工作。你必须通过说我将提供利益开始,比如说杀死细菌。只需说力宝。你必须计算出人们将支付多少。这是我们的价格。现在,我们的目标利润是多少?并且为你提供你的目标成本-或者挑战成本。然后,你必须告知提供这种挑战成本[10]的商业模式。
为什么HLL决定使用“杀死细菌”的市场定位?他们看到实现许多消费者重要的未得到满足的需要的方法。然而,为了进行市场定位和关联的目标市场工作,你有许多相关关联问题和利益相关者应付。
未满足的需要
在全世界上,关于传染病,仅急性呼吸道传染病和AIDS杀死了比痢疾更多的人,痢疾每年杀死220万人。在印度,19.2%的孩子们遭受痢疾的痛苦,并且印度占全世界所有痢疾死亡率的30%[11]。这种问题的解决方法非常简单和众所周知。在许多证据充分的调查研究报告中,利用肥皂洗手减小痢疾发生率42%至48%[12]。在2000年,印度群众没有使用这种解决方法。在便后并且在每餐前和餐后,仅全部农村人口的14%使用肥皂和水。62%使用水加灰或者泥浆,并且14%仅使用水[13]。
全世界,已经尝试解决这种问题,但是没有多大成功。在印度和其他发展中国家,对于重要的公共卫生主动性,认为这个问题太大并且成本太高。另外,解决方案需要在三个不同的政府部门之间协调-公共卫生、水利、以及环境-艰巨的任务。因为诸如AIDS的其他疾病引起最多的公众注意,所以痢疾不是冠军。最终,在痢疾地区的行为变化难以设计和实现。在2000年,HLL是鼓励洗手的公私合作的参与者。这是社会、政府、学术界、以及私营企业的联盟,并且把喀拉拉邦的印度州作为试点目标。然而,在2002年,围绕来自各种社团的联盟任务的辩论妨碍了其实现。
HLL具有经营107年悠久历史的力宝,具有鲜红色和清新的碳气味,作为“健康清洁用品”。自从20世纪60年代以来,他们使用运动方言经营该产品以举例说明健康清洁。他们的目标市场是具有约47美元月薪的中层收入的18~45岁之间的印度男性,居住在小于等于100,000[14]城镇的的半文盲农场主或者建筑工人。然而,到20世纪80年代,竞争者也模仿该市场定位以使健康被视为清洁的基本标准,并且力宝没有区分服务。到2000年,在印度发达的、高收入地区(和世界,就此而言),肥皂市场饱和并且是完全竞争的。保洁和高露洁是对于全世界相对富裕消费者的世界级的竞争对手。
因为这种现象,联合利华公司总体上预期在未来10年里开发市场以占领其销售额的50%[15]。
如果HLL没有以市场规定的价格有利地提供新定位的力宝的可用销售和分销渠道,则其不是优秀的或者甚至可行的战略。销售和分销渠道是小额贷款出借的独特公/私混合和在1999年创立的农村企业家身份。印度利华注意到几十个代理向全印度的贫穷妇女出借小额贷款资金。印度利华在2000年与Andra Pradesh州政府交涉并且请求国营小额贷款计划的顾客。政府同意了迅速扩大的小试点计划。现在称作Project Shakti(实力)的自发性已经扩大至12个州,并且监督次大陆最大的小额贷款计划之一的CARE India已经和HLL合作[16]。
华尔街日报通过描述与HLL相关的一个独立小额贷款企业的活动和属性举例说明了这种渠道的力量-Nandyala女士:
当Nandyala女士的一位邻居使用以作为联合利华的力宝品牌的相同的红色包装提供的称作力宝的仿制肥皂而犹豫支付用于真正力宝的额外卢比(约2美分)的时候,Nandyala女士给了她一块免费试用。几天以后,通过仿造肥皂清洗导致皮疹,并且这个邻居转换至力宝。
当另一邻居问为什么她为联合利华的Wheel清洁剂比当地制作的一块洗衣皂付更多钱时,Nandyala女士让他拿来桶和水以及一些脏衣服。她说“我直接在她面前洗衣服以向她展示这种清洁剂怎样有效”。
Project Shakti妇女不是印度利华的职工。但是公司帮助培训她们并且提供当地市场营销支持。在Chervaunnaram(一名每几个月访问的印度利华员工)在聚集的100个人面前证明了用肥皂洗手比单独用水洗手怎样好。她身着医用工作服,利用白色粉末涂两个志愿者的手,然后,让一个人单独利用水洗去粉末而让另一个人使用肥皂。她将紫外线光照射在他们的手上,突出没有用肥皂的妇女手上所残留的白色斑点。当人群喋喋不休的时候,印度利华工人们将Nandyala女士拉到礼堂的前面,并且告诉群众她有大量的肥皂要卖。
Nandyala女士对她的新公众角色不一定感到舒服。四年前她第一次向国营代理处申请小额贷款来为她家的小扁豆农场购买肥料和新工具。在2003年,代理处将她介绍给来自邻近城镇的印度利华销售主管。她另外拿出200美元贷款购买多袋肥皂、牙膏、以及洗发精-但是她太害羞以致于不能上门兜售产品。所以地区印度利华销售主管陪伴Nandyala女士并且演示怎样推销产品。
Nandyala女士偿还了她开办阶段的小额贷款并且不需要另一笔贷款。今天,她定期向约50个家庭销售,并且甚至作为小批发商,在搭乘她自己的短途巴士的偏远村庄中的小长袜商店。她每月销售约230美元的货物,赚取约15美元的利润。其他的用于再存储产品[17]。
在2005年,像Nandyala女士这样的13000个企业家在印度的12个州的50000个村庄销售联合利华产品。到2006年,HLL把将这种工程扩大至40000个农村妇女作为目标。HLL预期在2008年至2010年,ProjectShakti可以占据多达25%的HLL农村销售额[18]。
对于印度农村的这种非常完整的市场营销战略的成功的重要原因是在私有实体(HLL)、政府实体、以及NGO(例如,CARE)之间的目标一致性。由于力宝产品市场定位并且目标为社会期望改善的健康目标,其他实体很高兴与HLL合作。这种目标市场和市场定位对于HLL具有战略价值。如C.K.Prahalad所声明的:
在健康平台上区分肥皂产品利用肥皂竞争状况的开放。为穷人提供支付得起的健康肥皂达到用于大众化市场肥皂的产品差别化并且通过增加的使用从而接近了成长的机会。在印度,将肥皂视为美容产品,而不是预防性的健康措施。此外,许多消费者相信看到的干净是安全清洁的,并且也不使用肥皂洗手,很少见到使用肥皂,或者使用他们相信提供相同的益处的更便宜替代品。HLL通过其创新性的沟通活动,已经将使用肥皂与许诺健康联系起来作为建立行为改变的方式,并且因此增加了其低成本、大众化市场肥皂的销售额。健康对于穷人和HLL是有价值的日用品。通过将力宝增加的使用与健康联系起来,HLL可以建立包括其品牌的新习惯并且建立来自对于产品目录来说新的消费者群体的忠诚。健康益处还引起对钱的更高的感知价值,增加了消费者的支付意愿。通过提高消费者理解疾病预防的水平,HLL参与了对于印度群众健康具有意味深长的影响的计划并且实现了“提高生活质量”的合作目标[19]。
显然,这种完整的市场定位、目标市场、和市场销售和分销战略为HLL提供了持续竞争优势。然而,存在我们感觉到HLL可以改善整个过程的生产力的一个区域-通过其新开发的沟通渠道。
HLL和奥美(Ogilvy and Mather)一起工作以发展访问村庄的团队-以在9个州的10000个村庄为目标,其中,HLL坚持获得最大的市场份额,和培养最贫困社区。他们花费很多精力设计与这些农村目标人群沟道的低成本方法。HLL在2003年发展到127个两人团队并且估计这种计划到达目标州的30%~40%的农村人群[20]。每个团队完成四个阶段的沟通计划。第1阶段是使用互动配套挂图的学校和村庄情况介绍。在这天结束时,他们指派学校老师和学生一起工作以展开滑稽短剧和两至三个月内的再次访问的情况介绍。第2阶段是力宝村庄健康日,其包括滑稽短剧和健康营地,在健康营地乡村医生测量身高和体重以为属于健康标准的孩子颁发“健康儿童奖”。第3阶段是适合可能通过最早的两个阶段没有到达的孕妇和年轻母亲的痢疾管理部门讲习班。第4阶段是包括卫生和保持村庄干净的活动的力宝健康俱乐部的形成。这两人团队将返回4至6次以管理健康俱乐部的活动。
如我们将在第6章中更详细地论述的,“这产生企业广告的效果”,具有改善广告生成率的巨大机会,并且在这种情况下,通过应用适当实验,具有其他沟通方法。在HLL的案例中,他们假设奥美生成的沟通计划是可以生成的最好的,并且他们将这种计划铺开。然而,如果每个村庄或者州可以为实验单位,并且如果与目标乡村村民有效地沟通的某些其他方法可能更有效,当他们铺开计划的时候,村庄不展开和尝试以及测量在不同村庄其他沟通方法的影响的机会成本。我们将在第6章中更详细地研究可以怎样开展这项工作。
创造特别收入的营销驱动战略>摘要
摘要
在企业可以制定成功的市场营销战略和计划以前,每个企业必须回答“我正在向谁销售什么,并且他们将为什么购买?”的问题。市场细分选择我们认为可以向他们销售我们的产品的所有消费者的小组。和竞争对手相比,市场定位设法通知细分市场的会员使用我们的产品或者服务的利益。独特的价值主张是消费者将从你的产品和服务购买到不能从其他竞争者购买到的许诺内在价值的公共通信。所有这些都基于企业特长和持续竞争能力。通过这种基础,可以制定有效的市场营销计划。
到目前为止,我们集中在对于以消费者为导向的市场营销计划的基础,这是首先优先考虑的要素。然而,今天,市场营销挑战扩张超出消费者的范围。所有的企业的其他利益相关者-诸如用户、投资者、供应链/渠道合作伙伴、以及员工-关心消费者,但是他们还关心企业的资产净值和形象。每位利益相关者需要保持与公司接洽的相关价值主张。所以向他们施加相同概念的市场细分和市场定位。
Claims (33)
1.一种用于生成用于多个信息的参照系的方法,所述多个信息含有文本数据并且由用户通过与一个或者多个信息源交互所获得,所述方法包括:
接收经选择的用于分析的信息,所述信息包括多个文本数据;
识别所述文本数据的多个逻辑单元;
识别在每个所述逻辑单元中的多个独立正文部;
计算与所述多个正文部的所述独立正文部中的每一个关联的逻辑单元的数量,以便在识别包括用于每个所述独立正文部的各个模式的多个模式中使用;
计算用于每个所述多个模式的重要性测度;
基于满足用于在所述多个模式中保持所述各个模式的预先定义的模式重要性阈值的多个模式对应的重要性测度从所述多个模式中选择所述各个模式;
基于选择的所述各个模式生成多个信息语境定义;以及
分配从选择的所述信息中所获得的生成的所述信息语境定义作为与所述参照系关联的语义语境的语境定义,所述多个信息彼此相关并且通过所述语义语境的语境定义来表示这种关系。
2.根据权利要求1所述的方法,其中,所选择的所述信息和所述多个信息选自包括:电子文档;网络消息;从数据库所获得的内容;网页;电子文件;搜索结果;以及搜索请求参数的组。
3.根据权利要求1所述的方法,其中,所选择的所述信息和所述多个信息选自包括:所述参照系的应用的应用状态信息;以及所述参照系的应用的生成结果的组。
4.根据权利要求3所述的方法,其中,所述应用状态信息选自包括:
桌面图标;最近使用的菜单项;以及应用书签的组。
5.根据权利要求3所述的方法,进一步包括以下步骤:基于所述语义语境的所述语境定义修改所述参照系的所述应用状态。
6.根据权利要求2所述的方法,其中,所述参照系包括多个语义语境,每个所述语义语境均具有相对于彼此的所述语境定义的唯一集合。
7.根据权利要求6所述的方法,其中,所述语境定义包括表示所述参照系的图形用户界面的视觉方面的定义,以使选择所述语义语境之一用于配置所述参照系的视觉显示。
8.根据权利要求6所述的方法,其中,如果确定生成的所述信息语境定义与所述多个语义语境的所述语境定义的任何一个不匹配,则创建新的语义语境并且将生成的所述信息语境定义分配为新的语义语境的语境定义。
9.根据权利要求2所述的方法,进一步包括:接收由用户所选择的正文部以便在生成所述信息语境定义中使用,以使选择的所述正文部包括选自所述文本数据的单词或者单词组合。
10.根据权利要求2所述的方法,其中,从包括:句子;页;一系列页;文本行;段落;以及一系列段落的组中选择所述逻辑单元。
11.根据权利要求10所述的方法,其中,使用选自包括:标点符号;空格;元数据;分行符;以及分页符的组的定义机制识别所述逻辑单元。
12.根据权利要求11所述的方法,其中,从包括:单词;词组;以及预先定义短语的组中选择所述正文部。
13.根据权利要求2所述的方法,进一步包括:计算用于所述多个正文部中的每一个的重要性测度,所述重要性测度包括确定在选择的所述信息中各个所述正文部出现的局部相对频率。
14.根据权利要求13所述的方法,进一步包括:基于训练信息的全局集合使用每个所述正文部的出现的全局相对频率,各个所述正文部的每个的重要性测度进一步基于出现的所述全局相对频率。
15.根据权利要求13所述的方法,进一步包括:基于满足用于在多个所述正文部中保持所述正文部以便在识别所述多个模式中使用的预先定义的重要性阈值的正文部对应的重要性测度,从所述多个正文部中选择正文部。
16.根据权利要求13所述的方法,进一步包括:分配用于每个所述正文部的唯一值以便在识别所述多个模式中使用,所述唯一值被预先定义并且存储在正文部的预先定义列表中。
17.根据权利要求16所述的方法,其中,从包括整数和哈希值的组中选择所述唯一值。
18.根据权利要求17所述的方法,进一步包括:在所述独立正文部的识别的所述多个模式中的所述各个模式的每个中包括相对于彼此的所述正文部的相对定位信息,所述相对定位信息用于基于满足所述预先定义的模式重要性阈值的多个模式对应的重要性测度,从所述多个模式中选择所述各个模式。
19.根据权利要求1所述的方法,进一步包括从多个选择的信息中选择所述语境定义作为所述单独正文部;
识别包括所述语境定义的所述文本数据的多个逻辑单元;
计算与每个所述语境定义关联的逻辑单元的数量以便在识别包括用于所述单独语境定义的每个的各个语境定义模式的多个语境定义模式中使用;
计算用于所述多个语境定义模式中每一个的重要性测度;
基于满足用于在所述多个语境定义模式中保持所述各个语境定义模式的预先定义的语境定义模式重要性阈值的多个模式对应的重要性测度从所述多个语境定义模式中选择所述各个语境定义模式;
基于选择的所述各个语境定义模式生成多个二次信息语境定义;以及
分配从选择的所述多个信息中所获得的生成的所述二次信息语境定义作为与所述参照系关联的语义语境的二次语境定义。
20.根据权利要求19所述的方法,其中,所述二次语境定义表示所述语境定义之间的关系并且所述二次语境定义用于进一步定义与所述语义语境关联的信息之间的关系。
21.根据权利要求2所述的方法,进一步包括接收用于分析的另外信息,所述另外信息包括多个其他文本数据;
识别所述其他文本数据的多个其他逻辑单元;
识别在每个所述逻辑单元中的多个其他独立正文部;
计算与所述多个其他正文部的所述独立其他正文部的每个关联的其他逻辑单元的数量,以便在识别包括用于每个所述独立其他正文部的各个其他模式的多个其他模式中使用;
计算用于所述多个其他模式的每一个的其他重要性测度;
基于满足用于在所述多个其他模式中保持所述各个其他模式的其他预先定义的模式重要性阈值的各个其他模式对应的其他重要性测度,从所述多个其他模式中选择所述各个其他模式;
基于选择的所述各个其他模式生成多个其他信息语境定义;以及
将生成的所述其他信息语境定义与所述语义语境的所述语境定义相比较,以通过与所述语义语境关联的所述多个信息确定接收的所述另外信息的相关性程度。
22.根据权利要求21所述的方法,其中,接收的所述其他信息为从信息查询所获得的信息。
23.根据权利要求22所述的方法,其中,接收的所述其他信息基于用户请求或者与用户交互无关地、基于所述用户的语境引擎的请求。
24.根据权利要求21所述的方法,进一步包括:如果确定比较的所述其他信息语境定义与所述语义语境的所述语境定义匹配,则通过所述语义语境的所述语境定义集合所述其他信息语境定义。
25.根据权利要求24所述的方法,进一步包括:将所述其他信息集合至与所述语义语境关联的所述多个信息。
26.根据权利要求21所述的方法,进一步包括:如果确定比较的所述其他信息语境定义与所述语义语境的所述语境定义匹配,则通过所述语义语境的所述语境定义过滤所述其他信息语境定义。
27.根据权利要求26所述的方法,进一步包括:通过所述语义语境过滤所述其他信息。
28.根据权利要求19所述的方法,其中,从包括:肯定;否定;以及在计算全局匹配中所使用的全局语境的组中选择所述多个语境。
29.根据权利要求1所述的方法,其中,所述语义语境持续所选择的时段。
30.根据权利要求22所述的方法,其中,从包括:数据库查询;文档的结构化查询;以及网页查询的组中选择所述信息查询。
31.根据权利要求23所述的方法,其中,所述语境引擎的所述请求为基于所述用户的活动通过所述语境引擎启动的预测性查询。
32.根据权利要求31所述的方法,其中,所述用户的所述活动选自包括下列内容的组:当所述用户在所述参照系的所述语义语境中时,但是在提交所述用户请求以前;当所述用户在所述参照系的所述语义语境中时,但是在提交所述用户请求期间;以及当所述用户在所述参照系的所述语义语境中时,但是在提交所述用户请求以后。
33.根据权利要求32所述的方法,其中,向所述用户提供来自所述语义语境的语境定义作为用于所述用户进行选择的查询建议。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/217,250 | 2008-07-01 | ||
US12/217,250 US8060513B2 (en) | 2008-07-01 | 2008-07-01 | Information processing with integrated semantic contexts |
PCT/CA2009/000897 WO2010000064A1 (en) | 2008-07-01 | 2009-06-30 | Information processing with integrated semantic contexts |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102138140A true CN102138140A (zh) | 2011-07-27 |
Family
ID=41465148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801337221A Pending CN102138140A (zh) | 2008-07-01 | 2009-06-30 | 利用综合语义语境的信息处理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8060513B2 (zh) |
EP (1) | EP2307983A4 (zh) |
CN (1) | CN102138140A (zh) |
CA (1) | CA2729716A1 (zh) |
WO (1) | WO2010000064A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102436442A (zh) * | 2011-11-03 | 2012-05-02 | 中国科学技术信息研究所 | 一种基于上下文语境的词的语义相关性度量方法 |
CN104067274A (zh) * | 2012-01-19 | 2014-09-24 | 谷歌公司 | 用于改进对搜索结果的访问的系统和方法 |
CN107885747A (zh) * | 2016-09-29 | 2018-04-06 | 西门子公司 | 一种语义关系生成方法和设备 |
CN108027824A (zh) * | 2015-08-12 | 2018-05-11 | 国立研究开发法人情报通信研究机构 | 未来脚本生成装置和方法、以及计算机程序 |
CN108549667A (zh) * | 2018-03-23 | 2018-09-18 | 绍兴诺雷智信息科技有限公司 | 一种结构化工程设计知识的语义检索方法 |
WO2019007041A1 (zh) * | 2017-07-06 | 2019-01-10 | 北京大学深圳研究生院 | 基于多视图联合嵌入空间的图像-文本双向检索方法 |
WO2019142094A1 (en) * | 2018-01-18 | 2019-07-25 | Algoanalytics Pvt. Ltd. | System and method for semantic text search |
CN113077145A (zh) * | 2021-03-31 | 2021-07-06 | 国网新疆电力有限公司电力科学研究院 | 跨高铁输电线路多维度气象环境振颤脱落风险评估方法 |
Families Citing this family (230)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756750B2 (en) | 2003-09-02 | 2010-07-13 | Vinimaya, Inc. | Method and system for providing online procurement between a buyer and suppliers over a network |
US8607167B2 (en) * | 2007-01-07 | 2013-12-10 | Apple Inc. | Portable multifunction device, method, and graphical user interface for providing maps and directions |
US8302033B2 (en) | 2007-06-22 | 2012-10-30 | Apple Inc. | Touch screen device, method, and graphical user interface for providing maps, directions, and location-based information |
US8327272B2 (en) | 2008-01-06 | 2012-12-04 | Apple Inc. | Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars |
US9456054B2 (en) | 2008-05-16 | 2016-09-27 | Palo Alto Research Center Incorporated | Controlling the spread of interests and content in a content centric network |
US10007729B1 (en) | 2009-01-23 | 2018-06-26 | Zakta, LLC | Collaboratively finding, organizing and/or accessing information |
US10191982B1 (en) * | 2009-01-23 | 2019-01-29 | Zakata, LLC | Topical search portal |
US9607324B1 (en) | 2009-01-23 | 2017-03-28 | Zakta, LLC | Topical trust network |
US8930490B2 (en) | 2009-01-27 | 2015-01-06 | Apple Inc. | Lifestream annotation method and system |
US9098574B2 (en) * | 2009-01-27 | 2015-08-04 | Apple Inc. | Semantic note enriching system |
US8645383B2 (en) | 2009-01-27 | 2014-02-04 | Stephen J. Brown | Content management system using sources of experience data and modules for quantification and visualization |
US20120111936A1 (en) | 2009-01-27 | 2012-05-10 | Brown Stephen J | Semantic Note Taking System |
US10089391B2 (en) * | 2009-07-29 | 2018-10-02 | Herbminers Informatics Limited | Ontological information retrieval system |
CN102012900B (zh) * | 2009-09-04 | 2013-01-30 | 阿里巴巴集团控股有限公司 | 信息检索方法和系统 |
US20130138637A1 (en) * | 2009-09-21 | 2013-05-30 | Walter Bachtiger | Systems and methods for ranking media files |
US8923293B2 (en) | 2009-10-21 | 2014-12-30 | Palo Alto Research Center Incorporated | Adaptive multi-interface use for content networking |
US20110112824A1 (en) * | 2009-11-06 | 2011-05-12 | Craig Peter Sayers | Determining at least one category path for identifying input text |
US8862576B2 (en) | 2010-01-06 | 2014-10-14 | Apple Inc. | Device, method, and graphical user interface for mapping directions between search results |
US8239265B2 (en) * | 2010-01-28 | 2012-08-07 | Microsoft Corporation | Providing contextual advertisements for electronic books |
CN102193936B (zh) * | 2010-03-09 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种数据分类的方法及装置 |
US9378202B2 (en) | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US8694304B2 (en) | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US8898324B2 (en) | 2010-06-24 | 2014-11-25 | International Business Machines Corporation | Data access management in a hybrid memory server |
US8478519B2 (en) * | 2010-08-30 | 2013-07-02 | Google Inc. | Providing results to parameterless search queries |
CN102411583B (zh) * | 2010-09-20 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
US9524291B2 (en) * | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
US10068266B2 (en) | 2010-12-02 | 2018-09-04 | Vinimaya Inc. | Methods and systems to maintain, check, report, and audit contract and historical pricing in electronic procurement |
US8799188B2 (en) * | 2011-02-08 | 2014-08-05 | International Business Machines Corporation | Algorithm engine for use in a pattern matching accelerator |
TWI480742B (zh) * | 2011-03-18 | 2015-04-11 | Ind Tech Res Inst | 基於動態語言模型之推薦方法與推薦系統 |
US8682895B1 (en) | 2011-03-31 | 2014-03-25 | Twitter, Inc. | Content resonance |
US11841912B2 (en) | 2011-05-01 | 2023-12-12 | Twittle Search Limited Liability Company | System for applying natural language processing and inputs of a group of users to infer commonly desired search results |
US8732569B2 (en) | 2011-05-04 | 2014-05-20 | Google Inc. | Predicting user navigation events |
US9769285B2 (en) | 2011-06-14 | 2017-09-19 | Google Inc. | Access to network content |
US8788711B2 (en) | 2011-06-14 | 2014-07-22 | Google Inc. | Redacting content and inserting hypertext transfer protocol (HTTP) error codes in place thereof |
US8650139B2 (en) | 2011-07-01 | 2014-02-11 | Google Inc. | Predicting user navigation events |
US8745212B2 (en) | 2011-07-01 | 2014-06-03 | Google Inc. | Access to network content |
US8566696B1 (en) | 2011-07-14 | 2013-10-22 | Google Inc. | Predicting user navigation events |
US8744988B1 (en) | 2011-07-15 | 2014-06-03 | Google Inc. | Predicting user navigation events in an internet browser |
US8600921B2 (en) | 2011-09-15 | 2013-12-03 | Google Inc. | Predicting user navigation events in a browser using directed graphs |
US8655819B1 (en) | 2011-09-15 | 2014-02-18 | Google Inc. | Predicting user navigation events based on chronological history data |
US9104664B1 (en) | 2011-10-07 | 2015-08-11 | Google Inc. | Access to search results |
US20130097139A1 (en) * | 2011-10-17 | 2013-04-18 | Simon Thoresen | Programmable multi-filtering |
US9584579B2 (en) | 2011-12-01 | 2017-02-28 | Google Inc. | Method and system for providing page visibility information |
US9286414B2 (en) * | 2011-12-02 | 2016-03-15 | Microsoft Technology Licensing, Llc | Data discovery and description service |
US9292094B2 (en) | 2011-12-16 | 2016-03-22 | Microsoft Technology Licensing, Llc | Gesture inferred vocabulary bindings |
CN102708498A (zh) * | 2012-01-13 | 2012-10-03 | 合一网络技术(北京)有限公司 | 一种基于主题定向的广告投放方法 |
US9069880B2 (en) * | 2012-03-16 | 2015-06-30 | Microsoft Technology Licensing, Llc | Prediction and isolation of patterns across datasets |
CA2862763A1 (en) * | 2012-03-22 | 2013-09-26 | Ttwick, Inc. | Computerized internet search system and method |
US9158853B2 (en) | 2012-03-22 | 2015-10-13 | Ttwick, Inc. | Computerized internet search system and method |
US9946792B2 (en) | 2012-05-15 | 2018-04-17 | Google Llc | Access to network content |
CN103455507B (zh) * | 2012-05-31 | 2017-03-29 | 国际商业机器公司 | 搜索引擎推荐方法及装置 |
CA2875309C (en) * | 2012-06-01 | 2018-03-06 | Staples, Inc. | Defining and mapping application interface semantics |
US20130326362A1 (en) * | 2012-06-05 | 2013-12-05 | Neil Hamilton Murray | Electronic communicating |
US9275147B2 (en) * | 2012-06-18 | 2016-03-01 | Google Inc. | Providing query suggestions |
US8887239B1 (en) | 2012-08-08 | 2014-11-11 | Google Inc. | Access to network content |
US9305092B1 (en) * | 2012-08-10 | 2016-04-05 | Google Inc. | Search query auto-completions based on social graph |
US9767114B2 (en) | 2012-08-14 | 2017-09-19 | Cisco Technology, Inc. | System and methods for automatically disseminating content based on contexual information |
US9218333B2 (en) * | 2012-08-31 | 2015-12-22 | Microsoft Technology Licensing, Llc | Context sensitive auto-correction |
US9141722B2 (en) | 2012-10-02 | 2015-09-22 | Google Inc. | Access to network content |
US9280546B2 (en) | 2012-10-31 | 2016-03-08 | Palo Alto Research Center Incorporated | System and method for accessing digital content using a location-independent name |
US9400800B2 (en) | 2012-11-19 | 2016-07-26 | Palo Alto Research Center Incorporated | Data transport by named content synchronization |
US10430839B2 (en) | 2012-12-12 | 2019-10-01 | Cisco Technology, Inc. | Distributed advertisement insertion in content-centric networks |
US9223756B2 (en) | 2013-03-13 | 2015-12-29 | Adobe Systems Incorporated | Method and apparatus for identifying logical blocks of text in a document |
US9552421B2 (en) * | 2013-03-15 | 2017-01-24 | Microsoft Technology Licensing, Llc | Simplified collaborative searching through pattern recognition |
US9978025B2 (en) | 2013-03-20 | 2018-05-22 | Cisco Technology, Inc. | Ordered-element naming for name-based packet forwarding |
US9935791B2 (en) | 2013-05-20 | 2018-04-03 | Cisco Technology, Inc. | Method and system for name resolution across heterogeneous architectures |
US9185120B2 (en) | 2013-05-23 | 2015-11-10 | Palo Alto Research Center Incorporated | Method and system for mitigating interest flooding attacks in content-centric networks |
US10430418B2 (en) | 2013-05-29 | 2019-10-01 | Microsoft Technology Licensing, Llc | Context-based actions from a source application |
US11263221B2 (en) | 2013-05-29 | 2022-03-01 | Microsoft Technology Licensing, Llc | Search result contexts for application launch |
US9444722B2 (en) | 2013-08-01 | 2016-09-13 | Palo Alto Research Center Incorporated | Method and apparatus for configuring routing paths in a custodian-based routing architecture |
US9817823B2 (en) * | 2013-09-17 | 2017-11-14 | International Business Machines Corporation | Active knowledge guidance based on deep document analysis |
US11238056B2 (en) | 2013-10-28 | 2022-02-01 | Microsoft Technology Licensing, Llc | Enhancing search results with social labels |
US9407549B2 (en) | 2013-10-29 | 2016-08-02 | Palo Alto Research Center Incorporated | System and method for hash-based forwarding of packets with hierarchically structured variable-length identifiers |
US9276840B2 (en) | 2013-10-30 | 2016-03-01 | Palo Alto Research Center Incorporated | Interest messages with a payload for a named data network |
US9282050B2 (en) | 2013-10-30 | 2016-03-08 | Palo Alto Research Center Incorporated | System and method for minimum path MTU discovery in content centric networks |
US9401864B2 (en) | 2013-10-31 | 2016-07-26 | Palo Alto Research Center Incorporated | Express header for packets with hierarchically structured variable-length identifiers |
US9542440B2 (en) | 2013-11-04 | 2017-01-10 | Microsoft Technology Licensing, Llc | Enterprise graph search based on object and actor relationships |
US9311377B2 (en) | 2013-11-13 | 2016-04-12 | Palo Alto Research Center Incorporated | Method and apparatus for performing server handoff in a name-based content distribution system |
US10101801B2 (en) | 2013-11-13 | 2018-10-16 | Cisco Technology, Inc. | Method and apparatus for prefetching content in a data stream |
US10129365B2 (en) | 2013-11-13 | 2018-11-13 | Cisco Technology, Inc. | Method and apparatus for pre-fetching remote content based on static and dynamic recommendations |
US10089655B2 (en) | 2013-11-27 | 2018-10-02 | Cisco Technology, Inc. | Method and apparatus for scalable data broadcasting |
US9503358B2 (en) | 2013-12-05 | 2016-11-22 | Palo Alto Research Center Incorporated | Distance-based routing in an information-centric network |
US9379979B2 (en) | 2014-01-14 | 2016-06-28 | Palo Alto Research Center Incorporated | Method and apparatus for establishing a virtual interface for a set of mutual-listener devices |
JP2015133047A (ja) * | 2014-01-15 | 2015-07-23 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10098051B2 (en) | 2014-01-22 | 2018-10-09 | Cisco Technology, Inc. | Gateways and routing in software-defined manets |
US10172068B2 (en) | 2014-01-22 | 2019-01-01 | Cisco Technology, Inc. | Service-oriented routing in software-defined MANETs |
US9374304B2 (en) | 2014-01-24 | 2016-06-21 | Palo Alto Research Center Incorporated | End-to end route tracing over a named-data network |
US11645289B2 (en) | 2014-02-04 | 2023-05-09 | Microsoft Technology Licensing, Llc | Ranking enterprise graph queries |
US9954678B2 (en) | 2014-02-06 | 2018-04-24 | Cisco Technology, Inc. | Content-based transport security |
US9531679B2 (en) | 2014-02-06 | 2016-12-27 | Palo Alto Research Center Incorporated | Content-based transport security for distributed producers |
US9870432B2 (en) | 2014-02-24 | 2018-01-16 | Microsoft Technology Licensing, Llc | Persisted enterprise graph queries |
US11657060B2 (en) | 2014-02-27 | 2023-05-23 | Microsoft Technology Licensing, Llc | Utilizing interactivity signals to generate relationships and promote content |
US9678998B2 (en) | 2014-02-28 | 2017-06-13 | Cisco Technology, Inc. | Content name resolution for information centric networking |
US10757201B2 (en) | 2014-03-01 | 2020-08-25 | Microsoft Technology Licensing, Llc | Document and content feed |
US10255563B2 (en) | 2014-03-03 | 2019-04-09 | Microsoft Technology Licensing, Llc | Aggregating enterprise graph content around user-generated topics |
US10394827B2 (en) | 2014-03-03 | 2019-08-27 | Microsoft Technology Licensing, Llc | Discovering enterprise content based on implicit and explicit signals |
US10169457B2 (en) | 2014-03-03 | 2019-01-01 | Microsoft Technology Licensing, Llc | Displaying and posting aggregated social activity on a piece of enterprise content |
US10089651B2 (en) | 2014-03-03 | 2018-10-02 | Cisco Technology, Inc. | Method and apparatus for streaming advertisements in a scalable data broadcasting system |
US9836540B2 (en) | 2014-03-04 | 2017-12-05 | Cisco Technology, Inc. | System and method for direct storage access in a content-centric network |
US9626413B2 (en) | 2014-03-10 | 2017-04-18 | Cisco Systems, Inc. | System and method for ranking content popularity in a content-centric network |
US9473405B2 (en) | 2014-03-10 | 2016-10-18 | Palo Alto Research Center Incorporated | Concurrent hashes and sub-hashes on data streams |
US9391896B2 (en) | 2014-03-10 | 2016-07-12 | Palo Alto Research Center Incorporated | System and method for packet forwarding using a conjunctive normal form strategy in a content-centric network |
US9407432B2 (en) | 2014-03-19 | 2016-08-02 | Palo Alto Research Center Incorporated | System and method for efficient and secure distribution of digital content |
US9916601B2 (en) | 2014-03-21 | 2018-03-13 | Cisco Technology, Inc. | Marketplace for presenting advertisements in a scalable data broadcasting system |
US9363179B2 (en) | 2014-03-26 | 2016-06-07 | Palo Alto Research Center Incorporated | Multi-publisher routing protocol for named data networks |
US9363086B2 (en) | 2014-03-31 | 2016-06-07 | Palo Alto Research Center Incorporated | Aggregate signing of data in content centric networking |
US9716622B2 (en) | 2014-04-01 | 2017-07-25 | Cisco Technology, Inc. | System and method for dynamic name configuration in content-centric networks |
US10521439B2 (en) * | 2014-04-04 | 2019-12-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, apparatus, and computer program for data mining |
US10075521B2 (en) | 2014-04-07 | 2018-09-11 | Cisco Technology, Inc. | Collection synchronization using equality matched network names |
US9390289B2 (en) | 2014-04-07 | 2016-07-12 | Palo Alto Research Center Incorporated | Secure collection synchronization using matched network names |
US9473576B2 (en) | 2014-04-07 | 2016-10-18 | Palo Alto Research Center Incorporated | Service discovery using collection synchronization with exact names |
US9451032B2 (en) | 2014-04-10 | 2016-09-20 | Palo Alto Research Center Incorporated | System and method for simple service discovery in content-centric networks |
US9203885B2 (en) | 2014-04-28 | 2015-12-01 | Palo Alto Research Center Incorporated | Method and apparatus for exchanging bidirectional streams over a content centric network |
US9992281B2 (en) | 2014-05-01 | 2018-06-05 | Cisco Technology, Inc. | Accountable content stores for information centric networks |
US9609014B2 (en) | 2014-05-22 | 2017-03-28 | Cisco Systems, Inc. | Method and apparatus for preventing insertion of malicious content at a named data network router |
US9455835B2 (en) | 2014-05-23 | 2016-09-27 | Palo Alto Research Center Incorporated | System and method for circular link resolution with hash-based names in content-centric networks |
US9276751B2 (en) | 2014-05-28 | 2016-03-01 | Palo Alto Research Center Incorporated | System and method for circular link resolution with computable hash-based names in content-centric networks |
US9537719B2 (en) | 2014-06-19 | 2017-01-03 | Palo Alto Research Center Incorporated | Method and apparatus for deploying a minimal-cost CCN topology |
US9516144B2 (en) | 2014-06-19 | 2016-12-06 | Palo Alto Research Center Incorporated | Cut-through forwarding of CCNx message fragments with IP encapsulation |
US9467377B2 (en) | 2014-06-19 | 2016-10-11 | Palo Alto Research Center Incorporated | Associating consumer states with interests in a content-centric network |
US9426113B2 (en) | 2014-06-30 | 2016-08-23 | Palo Alto Research Center Incorporated | System and method for managing devices over a content centric network |
US9699198B2 (en) | 2014-07-07 | 2017-07-04 | Cisco Technology, Inc. | System and method for parallel secure content bootstrapping in content-centric networks |
US9959156B2 (en) | 2014-07-17 | 2018-05-01 | Cisco Technology, Inc. | Interest return control message |
US9621354B2 (en) | 2014-07-17 | 2017-04-11 | Cisco Systems, Inc. | Reconstructable content objects |
US9590887B2 (en) | 2014-07-18 | 2017-03-07 | Cisco Systems, Inc. | Method and system for keeping interest alive in a content centric network |
US9729616B2 (en) | 2014-07-18 | 2017-08-08 | Cisco Technology, Inc. | Reputation-based strategy for forwarding and responding to interests over a content centric network |
US9535968B2 (en) | 2014-07-21 | 2017-01-03 | Palo Alto Research Center Incorporated | System for distributing nameless objects using self-certifying names |
US9882964B2 (en) | 2014-08-08 | 2018-01-30 | Cisco Technology, Inc. | Explicit strategy feedback in name-based forwarding |
US9503365B2 (en) | 2014-08-11 | 2016-11-22 | Palo Alto Research Center Incorporated | Reputation-based instruction processing over an information centric network |
US9729662B2 (en) | 2014-08-11 | 2017-08-08 | Cisco Technology, Inc. | Probabilistic lazy-forwarding technique without validation in a content centric network |
US9391777B2 (en) | 2014-08-15 | 2016-07-12 | Palo Alto Research Center Incorporated | System and method for performing key resolution over a content centric network |
US9800637B2 (en) | 2014-08-19 | 2017-10-24 | Cisco Technology, Inc. | System and method for all-in-one content stream in content-centric networks |
US9467492B2 (en) | 2014-08-19 | 2016-10-11 | Palo Alto Research Center Incorporated | System and method for reconstructable all-in-one content stream |
US9497282B2 (en) | 2014-08-27 | 2016-11-15 | Palo Alto Research Center Incorporated | Network coding for content-centric network |
US10204013B2 (en) | 2014-09-03 | 2019-02-12 | Cisco Technology, Inc. | System and method for maintaining a distributed and fault-tolerant state over an information centric network |
US10061826B2 (en) | 2014-09-05 | 2018-08-28 | Microsoft Technology Licensing, Llc. | Distant content discovery |
US9553812B2 (en) | 2014-09-09 | 2017-01-24 | Palo Alto Research Center Incorporated | Interest keep alives at intermediate routers in a CCN |
US10069933B2 (en) | 2014-10-23 | 2018-09-04 | Cisco Technology, Inc. | System and method for creating virtual interfaces based on network characteristics |
US9576075B2 (en) | 2014-10-31 | 2017-02-21 | International Business Machines Corporation | Context aware query selection |
US9590948B2 (en) | 2014-12-15 | 2017-03-07 | Cisco Systems, Inc. | CCN routing using hardware-assisted hash tables |
US9536059B2 (en) | 2014-12-15 | 2017-01-03 | Palo Alto Research Center Incorporated | Method and system for verifying renamed content using manifests in a content centric network |
US10237189B2 (en) | 2014-12-16 | 2019-03-19 | Cisco Technology, Inc. | System and method for distance-based interest forwarding |
US9846881B2 (en) | 2014-12-19 | 2017-12-19 | Palo Alto Research Center Incorporated | Frugal user engagement help systems |
US9473475B2 (en) | 2014-12-22 | 2016-10-18 | Palo Alto Research Center Incorporated | Low-cost authenticated signing delegation in content centric networking |
US10003520B2 (en) | 2014-12-22 | 2018-06-19 | Cisco Technology, Inc. | System and method for efficient name-based content routing using link-state information in information-centric networks |
US9660825B2 (en) | 2014-12-24 | 2017-05-23 | Cisco Technology, Inc. | System and method for multi-source multicasting in content-centric networks |
US9916457B2 (en) | 2015-01-12 | 2018-03-13 | Cisco Technology, Inc. | Decoupled name security binding for CCN objects |
US9954795B2 (en) | 2015-01-12 | 2018-04-24 | Cisco Technology, Inc. | Resource allocation using CCN manifests |
US9602596B2 (en) | 2015-01-12 | 2017-03-21 | Cisco Systems, Inc. | Peer-to-peer sharing in a content centric network |
US9946743B2 (en) | 2015-01-12 | 2018-04-17 | Cisco Technology, Inc. | Order encoded manifests in a content centric network |
US9832291B2 (en) | 2015-01-12 | 2017-11-28 | Cisco Technology, Inc. | Auto-configurable transport stack |
US9462006B2 (en) | 2015-01-21 | 2016-10-04 | Palo Alto Research Center Incorporated | Network-layer application-specific trust model |
US9552493B2 (en) | 2015-02-03 | 2017-01-24 | Palo Alto Research Center Incorporated | Access control framework for information centric networking |
US10333840B2 (en) | 2015-02-06 | 2019-06-25 | Cisco Technology, Inc. | System and method for on-demand content exchange with adaptive naming in information-centric networks |
US10075401B2 (en) | 2015-03-18 | 2018-09-11 | Cisco Technology, Inc. | Pending interest table behavior |
US10116605B2 (en) | 2015-06-22 | 2018-10-30 | Cisco Technology, Inc. | Transport stack name scheme and identity management |
US10075402B2 (en) | 2015-06-24 | 2018-09-11 | Cisco Technology, Inc. | Flexible command and control in content centric networks |
WO2017007461A1 (en) * | 2015-07-07 | 2017-01-12 | Seven Medical, Inc. | Integrated medical platform |
US10701038B2 (en) | 2015-07-27 | 2020-06-30 | Cisco Technology, Inc. | Content negotiation in a content centric network |
US9986034B2 (en) | 2015-08-03 | 2018-05-29 | Cisco Technology, Inc. | Transferring state in content centric network stacks |
US10610144B2 (en) | 2015-08-19 | 2020-04-07 | Palo Alto Research Center Incorporated | Interactive remote patient monitoring and condition management intervention system |
WO2017037103A1 (en) | 2015-09-01 | 2017-03-09 | Dream It Get It Limited | Pmedia unit retrieval and related processes |
US9832123B2 (en) | 2015-09-11 | 2017-11-28 | Cisco Technology, Inc. | Network named fragments in a content centric network |
US10355999B2 (en) | 2015-09-23 | 2019-07-16 | Cisco Technology, Inc. | Flow control with network named fragments |
US10313227B2 (en) | 2015-09-24 | 2019-06-04 | Cisco Technology, Inc. | System and method for eliminating undetected interest looping in information-centric networks |
US9977809B2 (en) | 2015-09-24 | 2018-05-22 | Cisco Technology, Inc. | Information and data framework in a content centric network |
US10454820B2 (en) | 2015-09-29 | 2019-10-22 | Cisco Technology, Inc. | System and method for stateless information-centric networking |
US10263965B2 (en) | 2015-10-16 | 2019-04-16 | Cisco Technology, Inc. | Encrypted CCNx |
US9794238B2 (en) | 2015-10-29 | 2017-10-17 | Cisco Technology, Inc. | System for key exchange in a content centric network |
US9807205B2 (en) | 2015-11-02 | 2017-10-31 | Cisco Technology, Inc. | Header compression for CCN messages using dictionary |
US10009446B2 (en) | 2015-11-02 | 2018-06-26 | Cisco Technology, Inc. | Header compression for CCN messages using dictionary learning |
US10021222B2 (en) | 2015-11-04 | 2018-07-10 | Cisco Technology, Inc. | Bit-aligned header compression for CCN messages using dictionary |
US10097521B2 (en) | 2015-11-20 | 2018-10-09 | Cisco Technology, Inc. | Transparent encryption in a content centric network |
US9912776B2 (en) | 2015-12-02 | 2018-03-06 | Cisco Technology, Inc. | Explicit content deletion commands in a content centric network |
US10097346B2 (en) | 2015-12-09 | 2018-10-09 | Cisco Technology, Inc. | Key catalogs in a content centric network |
US10078062B2 (en) | 2015-12-15 | 2018-09-18 | Palo Alto Research Center Incorporated | Device health estimation by combining contextual information with sensor data |
US10257271B2 (en) | 2016-01-11 | 2019-04-09 | Cisco Technology, Inc. | Chandra-Toueg consensus in a content centric network |
US9949301B2 (en) | 2016-01-20 | 2018-04-17 | Palo Alto Research Center Incorporated | Methods for fast, secure and privacy-friendly internet connection discovery in wireless networks |
US10305864B2 (en) | 2016-01-25 | 2019-05-28 | Cisco Technology, Inc. | Method and system for interest encryption in a content centric network |
US10043016B2 (en) | 2016-02-29 | 2018-08-07 | Cisco Technology, Inc. | Method and system for name encryption agreement in a content centric network |
US10003507B2 (en) | 2016-03-04 | 2018-06-19 | Cisco Technology, Inc. | Transport session state protocol |
US10038633B2 (en) | 2016-03-04 | 2018-07-31 | Cisco Technology, Inc. | Protocol to query for historical network information in a content centric network |
US10742596B2 (en) | 2016-03-04 | 2020-08-11 | Cisco Technology, Inc. | Method and system for reducing a collision probability of hash-based names using a publisher identifier |
US10051071B2 (en) | 2016-03-04 | 2018-08-14 | Cisco Technology, Inc. | Method and system for collecting historical network information in a content centric network |
US9832116B2 (en) | 2016-03-14 | 2017-11-28 | Cisco Technology, Inc. | Adjusting entries in a forwarding information base in a content centric network |
US10212196B2 (en) | 2016-03-16 | 2019-02-19 | Cisco Technology, Inc. | Interface discovery and authentication in a name-based network |
US11436656B2 (en) | 2016-03-18 | 2022-09-06 | Palo Alto Research Center Incorporated | System and method for a real-time egocentric collaborative filter on large datasets |
US10067948B2 (en) | 2016-03-18 | 2018-09-04 | Cisco Technology, Inc. | Data deduping in content centric networking manifests |
US10091330B2 (en) | 2016-03-23 | 2018-10-02 | Cisco Technology, Inc. | Interest scheduling by an information and data framework in a content centric network |
US10033639B2 (en) | 2016-03-25 | 2018-07-24 | Cisco Technology, Inc. | System and method for routing packets in a content centric network using anonymous datagrams |
US10320760B2 (en) | 2016-04-01 | 2019-06-11 | Cisco Technology, Inc. | Method and system for mutating and caching content in a content centric network |
US9930146B2 (en) | 2016-04-04 | 2018-03-27 | Cisco Technology, Inc. | System and method for compressing content centric networking messages |
US10425503B2 (en) | 2016-04-07 | 2019-09-24 | Cisco Technology, Inc. | Shared pending interest table in a content centric network |
US10027578B2 (en) | 2016-04-11 | 2018-07-17 | Cisco Technology, Inc. | Method and system for routable prefix queries in a content centric network |
US10404450B2 (en) | 2016-05-02 | 2019-09-03 | Cisco Technology, Inc. | Schematized access control in a content centric network |
US10320675B2 (en) | 2016-05-04 | 2019-06-11 | Cisco Technology, Inc. | System and method for routing packets in a stateless content centric network |
US10547589B2 (en) | 2016-05-09 | 2020-01-28 | Cisco Technology, Inc. | System for implementing a small computer systems interface protocol over a content centric network |
US10084764B2 (en) | 2016-05-13 | 2018-09-25 | Cisco Technology, Inc. | System for a secure encryption proxy in a content centric network |
US10063414B2 (en) | 2016-05-13 | 2018-08-28 | Cisco Technology, Inc. | Updating a transport stack in a content centric network |
US11003667B1 (en) * | 2016-05-27 | 2021-05-11 | Google Llc | Contextual information for a displayed resource |
US10103989B2 (en) | 2016-06-13 | 2018-10-16 | Cisco Technology, Inc. | Content object return messages in a content centric network |
US10305865B2 (en) | 2016-06-21 | 2019-05-28 | Cisco Technology, Inc. | Permutation-based content encryption with manifests in a content centric network |
US10148572B2 (en) | 2016-06-27 | 2018-12-04 | Cisco Technology, Inc. | Method and system for interest groups in a content centric network |
WO2018000273A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种不良语料内容检测装置和方法 |
US10009266B2 (en) | 2016-07-05 | 2018-06-26 | Cisco Technology, Inc. | Method and system for reference counted pending interest tables in a content centric network |
US9992097B2 (en) | 2016-07-11 | 2018-06-05 | Cisco Technology, Inc. | System and method for piggybacking routing information in interests in a content centric network |
US10122624B2 (en) | 2016-07-25 | 2018-11-06 | Cisco Technology, Inc. | System and method for ephemeral entries in a forwarding information base in a content centric network |
US10069729B2 (en) | 2016-08-08 | 2018-09-04 | Cisco Technology, Inc. | System and method for throttling traffic based on a forwarding information base in a content centric network |
US10956412B2 (en) | 2016-08-09 | 2021-03-23 | Cisco Technology, Inc. | Method and system for conjunctive normal form attribute matching in a content centric network |
US10033642B2 (en) | 2016-09-19 | 2018-07-24 | Cisco Technology, Inc. | System and method for making optimal routing decisions based on device-specific parameters in a content centric network |
US10212248B2 (en) | 2016-10-03 | 2019-02-19 | Cisco Technology, Inc. | Cache management on high availability routers in a content centric network |
US10447805B2 (en) | 2016-10-10 | 2019-10-15 | Cisco Technology, Inc. | Distributed consensus in a content centric network |
US10592568B2 (en) | 2016-10-27 | 2020-03-17 | International Business Machines Corporation | Returning search results utilizing topical user click data when search queries are dissimilar |
US10558687B2 (en) * | 2016-10-27 | 2020-02-11 | International Business Machines Corporation | Returning search results utilizing topical user click data when search queries are dissimilar |
US10135948B2 (en) | 2016-10-31 | 2018-11-20 | Cisco Technology, Inc. | System and method for process migration in a content centric network |
US10243851B2 (en) | 2016-11-21 | 2019-03-26 | Cisco Technology, Inc. | System and method for forwarder connection information in a content centric network |
US10706113B2 (en) | 2017-01-06 | 2020-07-07 | Microsoft Technology Licensing, Llc | Domain review system for identifying entity relationships and corresponding insights |
US10366461B2 (en) * | 2017-03-06 | 2019-07-30 | Aon Risk Services, Inc. Of Maryland | Automated document analysis for varying natural languages |
US10643178B1 (en) | 2017-06-16 | 2020-05-05 | Coupa Software Incorporated | Asynchronous real-time procurement system |
US11042596B2 (en) * | 2017-09-29 | 2021-06-22 | Verizon Media Inc. | Preserving contextual relevance of content |
US11646894B2 (en) * | 2017-10-26 | 2023-05-09 | International Business Machines Corporation | Single channel multiple access communications system |
US10887326B2 (en) * | 2018-03-30 | 2021-01-05 | Microsoft Technology Licensing, Llc | Distributed system for adaptive protection against web-service- targeted vulnerability scanners |
US11449764B2 (en) | 2018-06-27 | 2022-09-20 | Microsoft Technology Licensing, Llc | AI-synthesized application for presenting activity-specific UI of activity-specific content |
US11354581B2 (en) | 2018-06-27 | 2022-06-07 | Microsoft Technology Licensing, Llc | AI-driven human-computer interface for presenting activity-specific views of activity-specific content for multiple activities |
US10990421B2 (en) | 2018-06-27 | 2021-04-27 | Microsoft Technology Licensing, Llc | AI-driven human-computer interface for associating low-level content with high-level activities using topics as an abstraction |
US10380997B1 (en) | 2018-07-27 | 2019-08-13 | Deepgram, Inc. | Deep learning internal state index-based search and classification |
US10990763B2 (en) * | 2019-03-01 | 2021-04-27 | Oracle International Corporation | Bias parameters for topic modeling |
TWI701620B (zh) * | 2019-03-21 | 2020-08-11 | 洽吧智能股份有限公司 | 文件資訊提取歸檔系統 |
US11120085B2 (en) * | 2019-06-05 | 2021-09-14 | International Business Machines Corporation | Individual deviation analysis by warning pattern detection |
US11532313B2 (en) * | 2020-08-27 | 2022-12-20 | Google Llc | Selectively storing, with multiple user accounts and/or to a shared assistant device: speech recognition biasing, NLU biasing, and/or other data |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6029165A (en) * | 1997-11-12 | 2000-02-22 | Arthur Andersen Llp | Search and retrieval information system and method |
US20030167276A1 (en) * | 2001-03-07 | 2003-09-04 | Simpson Don M. | System and method for identifying word patterns in text |
US20040205035A1 (en) * | 2000-05-01 | 2004-10-14 | Norbert Rimoux | Method and system for adaptive learning and pattern recognition |
US20070081197A1 (en) * | 2001-06-22 | 2007-04-12 | Nosa Omoigui | System and method for semantic knowledge retrieval, management, capture, sharing, discovery, delivery and presentation |
US7219073B1 (en) * | 1999-08-03 | 2007-05-15 | Brandnamestores.Com | Method for extracting information utilizing a user-context-based search engine |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5519608A (en) * | 1993-06-24 | 1996-05-21 | Xerox Corporation | Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation |
US6701311B2 (en) * | 2001-02-07 | 2004-03-02 | International Business Machines Corporation | Customer self service system for resource search and selection |
US20060074883A1 (en) * | 2004-10-05 | 2006-04-06 | Microsoft Corporation | Systems, methods, and interfaces for providing personalized search and information access |
US7895223B2 (en) * | 2005-11-29 | 2011-02-22 | Cisco Technology, Inc. | Generating search results based on determined relationships between data objects and user connections to identified destinations |
US7627565B2 (en) * | 2006-01-31 | 2009-12-01 | Northwestern University | Organizing context-sensitive search results |
-
2008
- 2008-07-01 US US12/217,250 patent/US8060513B2/en not_active Expired - Fee Related
-
2009
- 2009-06-30 CA CA2729716A patent/CA2729716A1/en not_active Abandoned
- 2009-06-30 CN CN2009801337221A patent/CN102138140A/zh active Pending
- 2009-06-30 EP EP09771874A patent/EP2307983A4/en not_active Withdrawn
- 2009-06-30 WO PCT/CA2009/000897 patent/WO2010000064A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6029165A (en) * | 1997-11-12 | 2000-02-22 | Arthur Andersen Llp | Search and retrieval information system and method |
US7219073B1 (en) * | 1999-08-03 | 2007-05-15 | Brandnamestores.Com | Method for extracting information utilizing a user-context-based search engine |
US20040205035A1 (en) * | 2000-05-01 | 2004-10-14 | Norbert Rimoux | Method and system for adaptive learning and pattern recognition |
US20030167276A1 (en) * | 2001-03-07 | 2003-09-04 | Simpson Don M. | System and method for identifying word patterns in text |
US20070081197A1 (en) * | 2001-06-22 | 2007-04-12 | Nosa Omoigui | System and method for semantic knowledge retrieval, management, capture, sharing, discovery, delivery and presentation |
Non-Patent Citations (1)
Title |
---|
吴晨 等: "跨语种信息检索中的文本比较及结果生成算法", 《计算机工程与应用》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102436442A (zh) * | 2011-11-03 | 2012-05-02 | 中国科学技术信息研究所 | 一种基于上下文语境的词的语义相关性度量方法 |
CN104067274A (zh) * | 2012-01-19 | 2014-09-24 | 谷歌公司 | 用于改进对搜索结果的访问的系统和方法 |
CN108027824A (zh) * | 2015-08-12 | 2018-05-11 | 国立研究开发法人情报通信研究机构 | 未来脚本生成装置和方法、以及计算机程序 |
CN108027824B (zh) * | 2015-08-12 | 2022-05-03 | 国立研究开发法人情报通信研究机构 | 未来脚本生成装置和方法、以及计算机可读存储介质 |
CN107885747A (zh) * | 2016-09-29 | 2018-04-06 | 西门子公司 | 一种语义关系生成方法和设备 |
CN107885747B (zh) * | 2016-09-29 | 2022-06-28 | 西门子公司 | 一种语义关系生成方法和设备 |
WO2019007041A1 (zh) * | 2017-07-06 | 2019-01-10 | 北京大学深圳研究生院 | 基于多视图联合嵌入空间的图像-文本双向检索方法 |
WO2019142094A1 (en) * | 2018-01-18 | 2019-07-25 | Algoanalytics Pvt. Ltd. | System and method for semantic text search |
CN108549667A (zh) * | 2018-03-23 | 2018-09-18 | 绍兴诺雷智信息科技有限公司 | 一种结构化工程设计知识的语义检索方法 |
CN108549667B (zh) * | 2018-03-23 | 2022-04-08 | 绍兴诺雷智信息科技有限公司 | 一种结构化工程设计知识的语义检索方法 |
CN113077145A (zh) * | 2021-03-31 | 2021-07-06 | 国网新疆电力有限公司电力科学研究院 | 跨高铁输电线路多维度气象环境振颤脱落风险评估方法 |
CN113077145B (zh) * | 2021-03-31 | 2022-06-24 | 国网新疆电力有限公司电力科学研究院 | 跨高铁输电线路多维度气象环境振颤脱落风险评估方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2307983A4 (en) | 2012-11-14 |
EP2307983A1 (en) | 2011-04-13 |
US20100005061A1 (en) | 2010-01-07 |
WO2010000064A1 (en) | 2010-01-07 |
CA2729716A1 (en) | 2010-01-07 |
US8060513B2 (en) | 2011-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102138140A (zh) | 利用综合语义语境的信息处理 | |
CN102160329A (zh) | 使用与信息关联的语义语境便于协作搜索 | |
Bouadjenek et al. | Social networks and information retrieval, how are they converging? A survey, a taxonomy and an analysis of social information retrieval approaches and platforms | |
Mattioli | Disclosing big data | |
Terveen et al. | Social matching: A framework and research agenda | |
CN102549563B (zh) | 语义交易所 | |
Li et al. | KDD CUP-2005 report: Facing a great challenge | |
Westerski | Semantic technologies in idea management systems: a model for interoperability, linking and filtering | |
Kawatra | Textbook of information science | |
Schraefel et al. | CS AKTive space: representing computer science in the semantic web | |
CN105787068A (zh) | 基于引用网络及用户熟练度分析的学术推荐方法及系统 | |
Spangler et al. | Mining the talk: Unlocking the business value in unstructured information | |
Carey | Scientific communication before and after networked science | |
Yang | 1 Analysis of user behavior | |
Gkalfas | Studying the impact of a mobile application in food waste reduction, circular economy, and social interaction inside the community. | |
Lucchese et al. | Recommender Systems. | |
Zhang | Design of smart cheerleading competition assistant evaluation system with big data and information retrieval sorting algorithm | |
Indartoyo et al. | A consumer behaviour investigation in search engine utilization through behavioural segmentation approach | |
Sarrafzadeh | Supporting Exploratory Search Tasks through Alternative Representations of Information | |
Tietz et al. | Taking advantage of online communities for generating innovative ideas | |
Wakeling | Establishing user requirements for a recommender system in an online union catalogue: An investigation of WorldCat. org | |
Sesagiri Raamkumar | A task-based scientific paper recommender system for literature review and manuscript preparation | |
Meiselwitz | Social Computing and Social Media. Participation, User Experience, Consumer Experience, and Applications of Social Computing: 12th International Conference, SCSM 2020, Held as Part of the 22nd HCI International Conference, HCII 2020, Copenhagen, Denmark, July 19–24, 2020, Proceedings, Part II | |
Miura et al. | Investigation on work motivation of Japanese seniors and skill discovery from their resumes | |
Papneja | DESIGN AND DEVELOPMENT OF SOCIAL COMMUNITY FRAMEWORK USING DATA MINING |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110727 |