CN101821736A

CN101821736A - 与服务器交互的方法和系统,以及用于产生并呈现搜索结果的方法和系统

Info

Publication number: CN101821736A
Application number: CN200880111571A
Authority: CN
Inventors: 王秦胜塞希亚
Original assignee: Individual
Current assignee: Individual
Priority date: 2007-09-06
Filing date: 2008-02-06
Publication date: 2010-09-01
Also published as: EP2198377A4; WO2009030972A1; WO2009030990A1; AU2008294452B2; US20110066607A1; AU2008294452A1; EP2198377A1; US8738594B2

Abstract

为如下搜索引擎产生搜索结果的方法，该搜索引擎允许用户向搜索引擎提供反馈。对于所执行的所有搜索的历史数据都被搜索引擎保存，该搜索引擎被用于修改通过其他常规工具所产生的结果。当结果被显示给用户时，用户能够与系统相互作用并提供反馈，该反馈可修改历史数据。这种反馈可接下来在未来的搜索中被用于产生如下结果，该结果根据与搜索请求的相关度被更好地排名或聚类。方便地，用户能够通过点击“上升”和“下降”按钮来提供他的至少一部分反馈，除了排名的搜索结果，系统还可显示与搜索查询相关的其他记录，诸如关于该话题的聊天室。

Description

与服务器交互的方法和系统，以及用于产生并呈现搜索结果的方法和系统

技术领域

本发明总体涉及用户终端和服务器之间的交互。在一种应用中，服务器是执行搜索引擎的服务器，也即执行搜索引擎结果的产生的服务器。本发明还涉及如何产生搜索结果和/或如何呈现搜索结果。

背景技术

互联网上的信息量庞大且杂乱。在互联网上搜索信息的一种方法是通过使用搜索引擎。搜索引擎产生网页的指引，当请求一搜索时，这些指引将被使用。搜索引擎将为已索引的网页产生排名(ranking)。这些排名表示了哪些搜索结果被搜索引擎判断为是与客户请求最“相关”的。这通常是使用各种各样的自动化计算机算法完成的。

自动化计算机算法的不利方面之一在于，一些肆无忌惮的用户能够——通过找出并滥用这些算法在计算结果排名时所考虑的因素——找到避开这些算法的方法。例如，如果网页的排名取决于它所获得的点击数，用户可写一些程序以持续访问通往这些网站的链接，从而推高该网页的排名。这导致可能的不相关的聚类的结果在搜索结果中排名非常高。

对于所述情景，加密过程也可以具有压缩技术的形式，所述压缩技术被利用来实现数据的传输和/或出于存储效率上的考虑而利用所述压缩技术。

发明内容

本发明旨在提供一种由用户终端执行的用于与服务器系统的通信中的新颖且有用的方法。所述服务器系统可以是执行搜索引擎的系统。

本发明的第一方面概括地提出，使用表征用户终端的至少一个方面的概况(profile)将数据加密(通常用于用户终端和服务器系统之间的通信，诸如其中一个运行作为搜索引擎)。例如，概况(或其压缩版本)可被用作用于将从终端到服务器和/或从服务器到终端的通信进行加密的密钥。

在关于本发明的第一方面的更加具体说明中，收集与用户的终端相关的数据。相关数据可包括如下细节，诸如用户姓名、年龄、性别、联系详情、系统硬件和软件配置。所述数据被传输至终端的加密系统，诸如基于矩阵的加密系统，该加密系统能够产生表示数据的特定组合的唯一标识符(“ID”)。基于矩阵的加密系统可使用一种散列算法(hashing algorithm)来产生这些ID。可为各用户或各用户组产生ID，并且将ID存储在服务器上。接下来可更加安全地执行在服务器和终端之间的通信——可通过坚持ID存在于服务器和用户终端之间(例如，以任一方向)传输的任意消息中，和/或通过使用ID作为加密过程的一部分中的密钥。

这确保了概况是安全的，因为希望获取任意概况但没有合适的权利这样做的任何人都将要求具有严格相同的用户信息、和计算机硬件及软件设置，或者非法侵入加密/解密过程。

所述ID也可被服务器用于反向过程中，通过对所述ID使用另一算法从而获得其所表示的为用户终端所存储的全部信息。所述数据接下来可通过各种方式被使用，正如下面所描述的。本发明的其他方面(其可独立于第一方面被使用)概括地提出，搜索引擎访问历史数据的数据库，所述历史数据由先前的人类用户产生。该数据库根据搜索词条布置，使得当输入搜索词条时，数据库能够访问历史数据，并基于历史数据将结果显示至用户。所述搜索引擎可由根据本发明的第一方面与用户相通信的服务器系统来执行。本发明的这些其他方面尤其适合于与本发明的第一方面一起使用，因为一旦服务器积累了所述的那种历史数据，安全通信是非常有价值的。

具体地，在第二方面，本发明提出历史数据包括关于存储在多个网站上的互联网网页的特征(“特征数据”)的数据，搜索引擎使用特征数据来决定如何显示链接到与搜索词条相关的网页。从而，与人的交互能够将搜索结果完善至高度相关的信息聚类，而将搜索结果完善至高度相关的信息聚类是大部分计算机算法所不擅长的。

例如，搜索引擎可基于从人类用户的类似在先搜索中所收集的特征数据将搜索结果排名。

搜索结果被显示给客户，同时还显示了用于提供对搜索结果的反馈和与搜索结果的交互的附加工具。这些附加工具可包括用于提供对结果网页的各种质量的反馈的按钮，以便修改所显示的结果。可能的修改包括表决结果应在排名中升高，或者在排名中下降，标明应删除的错误结果，或者标明包含成人内容的结果。

在另一实施方案中——其可与第一方面自由结合——显示出搜索结果以及与搜索词条相关的聊天框。聊天框可允许与执行类似搜索的其他用户的交互。

在任意实施例中，搜索结果的排名和显示也可根据搜索请求的其他特征被修改。这种特征的实例包括：

●请求了搜索的客户的互联网协议(IP)地址

●客户的互联网服务提供商(ISP)

●搜索请求的语言

●与当前的世界性或区域性关注相关的最近的新闻事件

●客户所属的小组/团体

●客户帐号概况的年龄组以及“成熟级”

●客户的操作系统和网络浏览器软件

●浏览历史、安全等级设置、主页设置和从网络浏览器软件中可获得的任何其他信息

●当地时间和天气信息

●在客户系统中安装的软件类型

●客户系统的硬件概况

基于哪些信息可从客户端自动收集或者由客户提供，可确定每个客户的上述特征的任意组合。

利用该信息，通过向客户提供在地理位置、语言和分组方面(诸如年龄、宗教、团体、专家分组)与其更可能相关的网页，搜索结果排名和显示可被进一步完善。在本发明的实施方案中，这种特征数据可被存储在历史数据库中，并且其可通过用户反馈或者通过任意可自动检测到的相关客户特征的变化而被修改。

地理信息可从客户的IP地址中获得——经由域名翻译和将翻译后的域名与具有这种地理信息的数据库相匹配来获得。这种数据库可从互联网上找到，例如由国际因特网地址分配委员会(IANA-http://www.iana.org/domain-names.htm)所建立的，或者它们可基于从用户所收集的历史数据被独立创造。

类似地，ISP也可通过类似分析客户的IP地址而获得。这是可能的，因为ISP通常被分配给预定IP范围，该IP范围接下来被它们的所有用户使用。一旦确定了客户的ISP，包括ISP相关的推销或广告(如果感兴趣的话)在内的信息可被包括在搜索结果的显示中。在一些实施例中，ISP的服务甚至可被扩展为可从搜索结果显示中获得。

语言可从搜索请求使用的语言中直接获得。或者，也可从发出请求的地理位置中推断出。例如，使用中文做出的搜索请求较可能将中文的搜索结果放在任何其他语言的结果之前。类似地，使用英语的但是其IP地址位于法国的(如使用上述方法所确定的)客户所做出的搜索请求较可能返回法语搜索结果。

分组(或团体)也可被建立在系统中，以允许使用者基于每个组所感兴趣的事物来获得搜索结果。这些组可以在年龄、文化、宗教或任意其他方面或其组合上被区分。这种分组可以是隐性的或显性的。它们可由系统的用户创立，或者可基于客户的IP地址的位置推断出。每个组可具有属于自己的独立的历史数据组，该历史数据组存储了组成员对搜索结果的反馈、该组的搜索结果排名偏好，以及表征该组的任何其他相关信息。

每个用户还能够在系统中创立一个个人帐号。这与上述组的区别之处在于，账户满足的是个人，其可存储由用户提供的个人信息，诸如他们的姓名、年龄、性别、地址、联系方式、爱好以及其他相关数据(这可包括关于之前所列出的特征和信息表)。每个用户帐号可以是上述的一个或多个组的一部分。同样地，每个账户也可具有与其关联的其自身的历史数据组，该历史数据组将为每个用户定制搜索结果的排名和显示。

浏览器和操作系统信息也可从客户系统中收集。由于不同的浏览器和操作系统可不同地处理网页的显示，以便向用户提供改进的显示(即，将显示异常、断开的图像链接、错误格式等尽量减少)，系统将能够确定将结果显示给客户的最佳方式。而且，该信息可被用于通过软件补丁通知、更新或促销的方式向客户提供附加信息。除了浏览器和操作系统的类型，基于浏览器设置的信息也可被纳入考虑。这包括浏览历史、安全等级设置、主页设置、防火墙设置以及通过用户的互联网使用习惯所产生的信息。

客户系统的当地时间可直接从时间戳记cookies中获得。或者，时间和天气数据也可根据客户的地理位置被确定，并接下来从其他来源获得相关信息，其他来源诸如国家气象局或诸如http://www.weather.com等的在线网站。该信息可被应用至对时间和/或天气敏感的搜索请求，诸如涉及就餐位置和航空旅行的请求，从而提供更好的搜索结果。

该系统也可收集并描述客户系统的软件概况。这会允许系统更好地对用户类型和属性进行分类。一个其系统具有大量图形编辑软件的客户，对具有类似属性的搜索结果可能会比其系统含有大部分游戏软件的另一客户更加感兴趣。

还可收集客户系统的硬件概况，其基本原理类似于所有那些上述提及的。在知晓客户硬件配置的情况下，可随搜索结果将客户概况的更新、推销和分类包括进来。另外，了解系统的限制(或其缺点)有利于决定显示哪一类的搜索结果。没有DVD-ROM驱动器的客户不可能有兴趣查看DVD租赁的结果。在另一实施例中，具有诸如生物计量读取器(biometric reader)的附加安全硬件的系统可指明对于提供类似安全标准的网站的偏好，而对没有这种类似安全标准的网站则不存在偏好。

在用户在系统上创立一帐号的情况下，可产生cookie或独特的标识符或其组合，以识别用户类别(即，基于所收集的或由用户输入的特征，可产生表明该类别的唯一标识符)。利用这种信息，搜索结果与标识符相关联，以便较好且准确地估计以下方面的倾向或用户看法：什么样的搜索结果和显示界面有可能投合个人或小组需要。

在任意实施例中，在涉及数据收集的情况下，收集的方法可改变。首先，HTTP cookie可被用于收集这种数据并描述单个客户系统的概况。当用户访问搜索引擎系统时，cookie被透明地下载到客户系统上。相关数据将被收集并存储到cookie上，该cookie接下来将被送回至来源。

或者，客户可选择以允许搜索引擎系统在客户系统上下载并运行脚本从而收集相关数据。这种脚本可通过单独程序或插件或applet(诸如ActiveX applet)的形式出现。当这些程序运行时，它们通常能够对客户系统执行比cookie更加彻底的概况描述和数据采集。在另一变体中，用户可通过将信息输入到其用户帐号概况中来手动提供信息。

在已执行数据收集、或者数据被传输的任意实施例中，可使用加密来保护其中的数据的完整性。可对数据进行加密，所述加密可通过密码或诸如生物计量安全系统的其他安全特征被解密。

在本发明的第三方面中，当多个搜索结果被显示给用户时，每个结果被显示为带有向上按钮和向下按钮，通过这些按钮用户可给出反馈，以影响今后进行相同搜索时、搜索结果的序列。

此外，在本发明的第四个独立方面，搜索引擎显示与某个搜索词条相关的搜索结果，连同显示用于记录与相同搜索词条相关的用户评论的一个聊天框(在这里使用的这一术语包括IRC频道或吼吼箱(shoutbox)或类似的变种)。该聊天框被显示用于与执行过类似搜索的其他用户进行交互。

被用于提高上述任一方面中的搜索结果排名的特征数据包括：

搜索引擎所产生的搜索结果排名受到提出请求的客户的地理位置的影响。该地理位置根据客户的IP地址被确定。

搜索引擎所产生的搜索结果排名受到语言的影响。语言可根据搜索请求被确定或者从客户的位置中推断出。

客户可属于一个或多个预限定的客户组，搜索引擎所产生的搜索结果排名受到提出请求的客户的组的影响。该组的历史数据被应用至该客户的搜索请求，以进一步将所获得的搜索结果的排名进行完善。

搜索引擎所产生的搜索结果排名受到互联网服务提供商的影响。ISP可根据客户的IP地址以及每个服务提供商所使用的IP地址范围的参考列表来确定。

搜索引擎所产生的搜索结果排名受到客户的用户帐号概况和设置的影响。该信息基于用户在系统上创建账户时所提供的数据。

搜索引擎所产生的搜索结果排名受到在客户系统上的网络浏览器软件及操作系统软件的类型及两者相应的配置的影响。相关信息是经由对客户系统作自动数据挖掘或经由客户的手动输入获得的。

搜索引擎所产生的搜索结果排名受到用户的当地时间和天气的影响。该数据或者可通过客户系统获得，或者可通过地理位置和相关的在线数据库间接获得。

搜索引擎所产生的搜索结果排名受到与世界性或区域性新闻/关注相关的当前事件的影响。客户对事件信息的反应/兴趣响应可接下来被用作参考以便完善用于人口统计学调查的消费者行为，所述人口统计学调查用于今后的搜索排名列表的出版目的。

搜索引擎所产生的搜索结果排名受到在客户计算机上安装的计算机软件的影响。客户系统可被概括描述以获取这种信息，该信息接下来可被发送至搜索引擎系统。

搜索引擎所产生的搜索结果排名受到在客户计算机上安装的计算机硬件的影响。客户系统可被概括描述以获取这种信息，该信息接下来可被发送至搜索引擎系统。

与用户概况相关的数据的数据收集是通过使用数据收集工具在客户系统上进行的。收集数据可被自动执行，并且其对于用户是一个透明过程，或者可牵涉用户授权和启动。

在收集了与用户概况相关的数据之后，该数据可被加密用于存储或传输以确保数据安全。加密和解密过程可利用密码和/或其他生物计量安全设备。

在本发明的第五方面，当客户做出一搜索请求时，搜索引擎系统判断客户系统是否下载了该搜索引擎的数据挖掘工具，并且如果判断是否定的，就将数据挖掘工具下载到客户系统并利用其来收集并存储与客户相关的数据。否则，就使用数据挖掘工具来更新并存储与客户相关的任意数据。所收集的客户数据接下来被送至搜索引擎，并且以由传输至搜索引擎的与客户相关的数据所确定的方式修改和/或呈现给定的搜索结果集。

在本发明的第六方面，对客户概况的描述可通过判断客户系统是否下载了数据挖掘工具来进行，如果判断是否定的，就将数据挖掘工具下载到客户系统，并使用其来收集并存储与客户相关的数据。如果判断是肯定的，数据挖掘工具就更新并存储与客户相关的任意数据。所收集的数据被使用加密工具加密，然后被存储或传输。通过使用解密工具将加密的客户数据解密，可访问所述数据，所述解密工具利用生物计量安全设备来识别并实现对所述加密的客户数据的解密。

在本发明的一些实施方案中，缓存数据库由搜索引擎执行访问，其用于存储搜索结果。缓存数据库存储历史数据的子集，相比于访问历史数据的时间，该历史数据的子集可在更快的响应时间下被访问，以获取其中所存储的搜索结果。当对缓存数据库进行修改时，在历史数据内，所述修改被影响——在两个数据库被加以周期性地比较时。

在本发明的所有方面，对历史数据的修改可被实时进行，使得效果是即刻的并可被反映在所有接下来的搜索中。事实上，一旦用户提供至少一些类型的输入(例如，通过点击按钮的反馈)，对该特定用户的指定搜索就将被再次执行，使得用户可“瞬间”看到其输入的效果。

附图说明

现在将仅出于示例目的，参照下列附图描述本发明的实施方案，在附图中：

图1示出作为本发明一实施方案的方法的步骤的流程图。

图2示出在图1的实施方案中被显示给用户的屏幕的屏幕截图。

图3是图2的详图，其示出在图1的实施方案中使用的按钮。

图4示出在图1的实施方案中使用的聊天框。

图5示出由图1的实施方案中的搜索引擎所使用的历史数据的数据库的结构；

图6示出图5的数据库的元(element)的结构。

图7示出缓存数据库的内容的结构。

图8示意性地示出图1实施方案中所用的用于搜索结果产生和排名过程中的软件模块和数据库之间的交互。

具体实施方式

现在将参照图1-6解释本发明的方法的一实施方案。图1是该方法中的步骤的流程图。在该方法中，用户通过互联网与搜索引擎通信。也就是说，用户使用他的个人电脑(PC)打开一个由执行搜索引擎的服务器所支持的网页。该搜索引擎使用历史数据的数据库51和缓存数据库71，这两个数据库可能在不同的服务器上。这些将在下面参照图5、6和7进行解释。

缓存数据库71存储历史数据的子集，如图7所示，并通常包含与最近的搜索请求或流行的请求或两者的结合有关的数据。应注意的是，缓存数据库71也可被配置为存储其它数据，这对于本领域读者是显而易见的。在该实施方案中，缓存数据库71根据多种不同的历史数据库内容类型编译而成，所述历史数据库内容类型将在下面进行描述。缓存中的数据可被进一步分为多个集合，使得系统的每个用户在数据库中都有他们自己的缓存数据。系统通过使用互联网协议(IP)地址或用户账户来标识每个用户。

使用位于分立的服务器上的缓存数据库71将能够使用户获得更快的响应，鉴于会针对存储器的存取以及针对相应的更快的响应时间，对缓存服务器进行优化。然而，可针对大量数据的存储以及结果数据的处理，对用于历史数据的数据库进行优化。从而，缓存数据库71将极大地减少历史数据数据库的工作负荷，改善所提供的总体服务。

在步骤11，客户(这里也称为“用户”)将首先做出一搜索请求，该搜索请求包括向搜索引擎中输入一个待被搜索的词或短语。然后，搜索引擎将在步骤12或12a中确定缓存数据库71或数据库51是否包含与搜索词条相关的历史数据。在步骤12中首先检查所述缓存数据库71，相比于历史数据库51，该缓存数据库71通常能够加以更快地访问。如果在缓存数据库71中未发现搜索请求，将在步骤12a中，对历史数据库51进行搜索。如果与搜索请求相关的信息存在于缓存数据中或历史数据中，则在步骤13中，包含历史数据的搜索结果将从缓存数据库71或数据库51中提取出来，处于以下要讲述的排名次序中，然后该结果在步骤14被发送回到客户并被显示。

根据历史数据的数据库51，对在步骤12中所产生的结果执行步骤13中的排名，如图5中所示。图5还示出了在数据库51中的历史数据记录56的结构。尽管图5示出了待被存储到单个数据库51上的总体历史数据，数据库51的各个内容类型也可被存储在分立的数据库中。例如，历史数据数据库51可存储一条目(entry)56，在该条目56内，各个内容(即，聊天框数据53以及诸如音乐和视频数据的其它数据55)可从其它专用数据库56、57、58、59中获得。这意味着，针对所有聊天框型数据56、或所有视频型数据57、所有音乐型数据58和所有图像型数据59中的每一种，存在分立的数据库。该系统不限于上述数据库，因为还有许多其它可能性，其中数据内容可在不同数据库上进行划分以实现不同目的。例如，分立的“通用信息”数据库可存储针对多种搜索的通用目的的数据，这种数据可包括网页图形/标志(logo)/横幅(banner)、搜索引擎起始页、网页中使用的通用文本等。还可实现一分立的“软件下载”数据库，该数据库可被较好地配备以应付大的适于向/自客户处分发文档和其它公共下载/上传交易的宽带传输。

每个记录56与存在于字段(field)52内的可能的搜索条目相关联。每个记录56在其存储的搜索词或短语52中是唯一的(注意，一般上对于搜索词条的每种可能顺序都有相应的记录，因此对于“TomCruise”存在一记录56，对于“Cruise Tom”也存在一记录)。与每个条目52一起，记录56还存储：聊天框数据53、每个都与相应的网页相关联的多个结果条目54、以及可能的其它数据55。

每个结果条目54的结构被示出在图6中。每个结果条目54具有唯一的搜索结果标识符61，该搜索结果标识符在本示例中是与搜索结果相关的网页的互联网地址。在结果条目54中还存在有计数器62、63、64、65、66，所述计数器计数并存储来自于该具体网页上的用户的反馈。每个计数器62、63、64、65、66表示特征数据，表明对网页的特征的相应描述。在该实施方案中，我们有五个计数器，表示如下多个质量：“预计质量”62、“删除”63、“成人内容”64、“等级上升”65和“等级下降”66。所述结果条目54也可存储与搜索结果相关的其它数据67。

计数器“预计质量”是一自动生成的量，其表示对网页与搜索查询的相关度的估值；宽泛而言，该“预计质量”是确定一常规搜索引擎如何对其结果进行排名的参数。通过使用计数器65、66，搜索引擎能够在步骤13将列表中的搜索结果进行排名，从而对这些搜索结果限定一次序(应注意，该次序可在做出搜索请求的同时获得，或者其可对每个记录56提前完成)。在该实施方案中，搜索引擎对质量记录62增加“等级上升”记录65，并减去“等级下降”数字记录66，以产生一合计质量估计，网页以合计质量估计的下降值顺序被呈现出来。

类似地，“删除”和“成人内容”计数器63、64可被用于对结果进行修改，从而提高搜索结果的总体质量。例如，被过去的用户视为不相关、且被过去的用户足够多次地标为删除的结果，可从结果列表中被去除(即，根本不显示给用户)或者被布置在序列的较低排名处。同样地，具有足够的成人内容计数64的结果54可以随着向用户提醒其潜在内容的经修改的显示特征显示给用户。下述阈值从一个实施方案到另一个实施方案有所变化，所述阈值为，某一具体质量对于这些动作中的其中一个的发生来说是足够时的值。这些例如可被应用在如下情况下：当对于一给定的结果条目54，针对具体质量63、64的计数器的值与存储在所有计数器62、63、64、65、66中的值的和之比位于一个预定阈值之上时。

在一些其它实施方案中，类似的计数器可隶属于其它结果类型，诸如视频结果27或音乐结果28，或者所产生的任何其它结果。计数器将以类似于如上所述(对于网页的实施例)的方式影响它们所隶属的结果上。

无论何时做出一搜索请求，搜索词条被记录，并且当以相关的词条执行搜索时，该搜索引擎将利用这一点，分类并编译词条的“网络(network)”，该词条的“网络”将反映这些词条有多么紧密地(或者与此相反)相关。通常，某些词条越紧密相关，搜索引擎就越可能能够利用这些词条产生与搜索请求具有更高相关度的结果。这种算法的一个简单例子可以如下所述，即，使用借助于逆文本频率的词条聚类(tf-idf)来为词条间关系产生定性值(qualitative value)。

相关的词条可被存储在缓存数据库71或用户cookie中(如下所述)。例如，通常相互相关的词条，诸如“aeroplane(飞机)、“aircraft(飞机)”和“plane(飞机)”较有可能在缓存数据库71中被存储为相关词条，因为它们的关系可被应用至包含这些词条的所有搜索中。然而，个性化了用户偏好的词条更可能被存储在客户电脑上。在该示例中，诸如“音乐”、“电源”、“运动”等的示例词条被更佳地用于描述每个人都可能想要搜索的主题，从而这些词条被存储在客户端。

排名步骤13也可使用各种其它特征数据以改善搜索结果排名。在本发明的一实施方案中，地理位置特征被用于推进相关搜索结果的排名。例如，IP地址为123.145.167.189的客户向搜索引擎提出一搜索请求。该搜索引擎将执行域名翻译，以获得该IP地址的域名地址。为了此实施例的目的，假设该IP地址翻译为“www.test.edu.sg”。搜索引擎可使用多种方法来猜出客户的实体位置。其可查找已知的数据库，例如出现在IANA上的数据库，IANA具有一些带国家后缀的域名的列表。在该示例中，当后缀“.sg”与IANA的列表相匹配时，后缀“.sg”允许搜索引擎猜到客户在新加坡。或者，在这不太可能的情况下(对于不具有国家前缀的地址)，该信息可通过根据前述方法的用户反馈而获得，并存储在历史数据51中，使得可推断出具有类似IP地址(B类、C类或D类IP地址)的未来客户的位置。

通过获得客户的地理位置，搜索结果可在排名步骤13中被相应修改。在一个实施例中，客户提出诸如“犹太人(jews)”等方面的敏感信息的搜索请求。对沙特阿拉伯的客户和以色列的客户，搜索引擎会将结果以不同方式进行排名，从而展现不同的搜索结果页。这种差异基于来自类似位置的客户的用户反馈的影响。应注意的是，在搜索请求中使用的语言也可表明客户的位置。

可利用的另一特征是客户的互联网服务提供商(ISP)。这可从客户的IP地址、以及与相应的ISP相关的IP地址范围的预定数据库获得。例如，如果客户的IP是“202.165.3.4”，系统能够通过查找数据库来了解该IP属于哪个组以及哪个ISP拥有该地址范围来确定ISP。通过这样做，系统可向用户提供更全面的搜索结果排名和显示。如果用户提出对“线缆调制解调器故障检修(cable modemtroubleshooting)”的搜索请求，则很有可能将该客户的ISP的技术支持页排名得较高。而且，这也允许系统告知客户由ISP给出的各种推销、广告及相关新闻。

语言是搜索引擎可用于完善搜索结果的排名的另一特征。在本发明的另一实施方案中，搜索引擎将确定在搜索请求中使用的语言，并检查与所使用的语言相关的历史数据51。以日语(或在日本)对“二战中的日本退伍军人(Japanese War Vetarans in World War 2)”作出的搜索请求，很有可能将赞扬过去日本退伍军人的结果排名得较高，然而当使用汉语(或在中国)进行类似搜索时，则可能把将这些退伍军人描述为战犯的结果排名得较高。所有这些结果都基于被持续更新并被存储为历史数据51的用户反馈和与搜索引擎的交互。

系统还可利用与客户的网络浏览器软件、操作系统软件及相应的配置相关的数据。在客户的系统运行网络浏览器软件“MicrosoftInternet Explorer”和操作系统“Windows XP”的情况下，针对“网络浏览问题”或“操作系统驱动”的客户搜索请求将把结果排名得较高些的与正确的软件相关的结果返回。而且，互联网浏览器和操作系统的配置，诸如安全设置、防火墙设置、浏览历史等也被纳入考虑。例如，如果网络浏览器的安全设置被检测为“高”。则相关的但是不符合安全级别要求的搜索结果将相比于符合那些要求的结果排名得较低。此外，所发现的在浏览历史中被频繁访问的网页可表明用户的偏好，从而当在接下来的搜索请求中发现时，来自于这些网站的网页可被排名得较高。

当地时间、天气状况以及计算机的设置和环境也可被用于改进搜索结果。例如，当在新加坡于当地时间下午5:00针对请求“自助晚餐(dinner buffet)”进行搜索时，返回的搜索结果可根据距离用户位置最近的餐厅进行排名。那些在进行该搜索请求的当天的夜间提供自助餐的餐厅也可被排得较高。通过提供适合于搜索当天的具体天气的结果，也可以将天气状况考虑到结果中(即，露天就餐的地点将在下雨天被排名得较低)。

当客户系统的软件概况可获得时，其可用于搜索结果的排名方法中。在本发明的一实施方案中，计算机系统的概况被描述为具有诸如“Adobe Illustrator”或“Macromedia Flash”的软件(图形设计和实现软件)，并且该系统被用于执行关于词条“polygon(多边形)”的搜索请求。该系统所产生的搜索结果应较大倾向于实质上为“绘制多边形”(使用相关联的软件)，而非实质上为“相关于多边形的结构信息”，该后一信息将更加相关于其它类型的用户(诸如安装有“AutoCAD”和“Mathlab”软件的用户)。

在类似于上述的另一实施方案中，客户系统的硬件设置和配置的概况被描述，并且当可得到这种概况时，其可被用于搜索结果的排名中。如果请求搜索“显卡型号驱动升级”，则具有型号“ABC”显卡的系统较可能将具有用于该卡的正确的软件驱动的搜索结果返回。在检测安全设备，诸如生物计量安全设备或类似硬件的情况下，支持这些部件的使用的网站(例如，在线购物网站)将被排名得较高。用于客户的系统硬件的补丁和固件升级也可在搜索结果中被显示给用户——当这些补丁和固件升级可以获取时。

用户也可在搜索引擎系统上创建个人账户，以改善他们的搜索结果。在形成这种账户的过程中，用户将被要求向系统提供基本信息以及可选信息。这通常包括用户的姓名、年龄、地址、兴趣和职业以及其它相关项目。使用之前对“自助晚餐”的搜索的示例，如果用户的账户概况表明用户来自于一个机构并且属于烹饪或食品品尝学校或其内的公寓，则针对该请求返回的结果应更可能相关于针对“自助晚餐”的专家的食谱信息。在另一实施例中，在概况中，位于特定年龄限制之下的用户将获得成人内容已过滤掉的结果。

在本发明的任一实施方案中需要数据挖掘或数据概况的地方，可应用各种方法。实施例包括使用cookie、脚本、客户端的人工输入或其组合。这些数据收集方式可通过对用户透明的过程或者在用户许可下运行。就cookie来说，它们指的是用于存储与用户的概况相关的数据的数据包。无论客户何时连接至搜索引擎系统，其都可阅读、下载或更新在客户的计算机上的cookie内的数据。Cookie是被动的，并且不能够主动收集用户上的数据。然而，它们可存储用户访问那些提供了cookie的网页时所输入的任意数据。所存储的数据的类型各不相同，并且可包括关于用户偏好的信息。例如，可以是表明将要如何显示所述结果的数据，或者特定的个人化关键字相关的信息，或者用户信息和浏览习惯。

或者，可使用脚本、程序、插件或applet来收集数据。这些程序可采用ActiveXapplet、工具栏插件程序、java脚本或仅是关于任意类型的独立软件。这些程序通常能够比cookie获得更多信息并且能够更好地概况描绘用户，因为它们具有对客户机更多的访问，但是这通常需要用户启动运行，然而脚本(如果已允许其在客户机上运行)和cookie可在不需要用户方的额外努力下被利用。当客户连接至搜索引擎系统时，程序将被下载到客户系统中。一旦所述程序运行，其将开始收集其所需要的全部相关信息(这包括在先列出的所述特征)。该信息接下来被发回到搜索引擎系统并且可被用于改善在本发明的实施方案中所述的搜索结果。

在收集了客户信息之后，标识符可被脚本或程序或搜索引擎系统自身生成，以标识属于该客户的唯一数据集。如果用户在搜索引擎系统上有账户，这些数据和标识符将与相应的账户相关联。这种数据以类似于历史数据51的方式被不断更新并存储。在用户概况中所存在的多个特征的每个组合都被分配唯一的标识符。类似地，它们也可被应用至多个组(这将在下面进行描述)。

在其中涉及客户数据的任一实施方案中，可执行加密以保护数据的完整性。在收集了数据之后，该数据可被加密用于存储或传输至搜索引擎系统。诸如密码或生物计量安全设备等安全装置可被纳入到加密过程中。这确保了，只有被授权方才被允许来解密并阅读数据。例如，当传输用户数据时，可能还需要具有密码或生物计量安全(这可取自指纹扫描仪、视网膜扫描仪等的形式)形式的用户授权。一旦接收到必需的授权，数据被传输至搜索引擎系统。该系统可以在其自身一方具有类似的安全措施，其仅允许该系统使用所述信息，未经授权的一方接收该信息。

在本发明的再另一实施方案中，进行用户分组以形成多个组(或团体)。这允许用户组具有对于他们单个组而言唯一的特殊搜索偏好，从而为他们提供更多的相关搜索结果。这种分组可以是隐性的或者显性的。隐性分组可通过识别特定特征来实现。在先前的实施例中，使用地理位置和语言特征来区别不同客户可以被视为隐性分组的一种形式。包含诸如“.edu”、“.gov”等的附加标识符的域名也可被用于将客户隐性地分为“教育(education)”和“政府(government)”组。显性分组指的是客户方主动隶属特定组。这包括用户创立的组，诸如“新加坡国立大学(National University of Singapore)”或“交谊舞(Ballroom Dancing)”组。

所述组以及与每个组相关的独立历史数据51被存储在搜索引擎数据库上。这种分组的优点在于，它提供了一定灵活性，可容纳具有共同兴趣的用户，并在一个组中迎合少至一个客户一直到数百万个客户。由于历史数据51对于每个组被分立地保管并监控，它们不断地完善该组对于搜索结果排名的偏好，并允许每个组形成独特的搜索偏好。

应理解的是，这些排名搜索结果的方法可被应用至客户的其它特征，其包括用户年龄组和宗教组。这些组也可以任意组合相互交叉及重叠。例如，隶属“新加坡国立大学”组的用户也可以在“教育”和“大学”组内。因此，对于“长颈鹿”的搜索很可能返回如下结果，其将科研论文或其它关于长颈鹿的先进课题排名得较高。相应地，一个处于“教育”组中并且也同意加入“幼儿园”的用户，将可能得到关于长颈鹿图片以及较简单信息排名得较高的结果。

在目前所有描述特征数据的使用的实施方案中，它们可由搜索引擎实现，并利用之前所述的类似的计数器系统被存储为历史数据51。

基于上述特征的排名也可以以任意组合的方式被应用于搜索结果。这使得可以结合各种待使用的历史数据51来为极个别(veryspecific)用户完善搜索结果。

用户可能会搜索“Tom Cruise”并希望看到关于他最近电影的结果，在该示例中，用户的cookie可能存储有如下信息，这些信息认为关键字“电影”与该用户更加相关，并将结果如此相应地排名。与此相反，另一用户可能希望看到与Tom Cruise有关的服饰和时装，从而该另一用户的对“Tom Cruise”的类似搜索则可利用该信息产生与“服饰”和“时装”相关的结果。

图8给出了搜索排名过程13的示例的概视图，其中示出了所执行的操作。过程13的子步骤通过多个软件“模块”被执行。用户终端所执行的组件被显示为图左上处的单元823、822。模块82、83和821是在用户终端和服务器之间的接口，包括在终端处执行的特定操作、以及在服务器处和在其它需要终端和服务器的相互作用的地方所执行的其它操作。所述接口包括基于加密的搜索组件82、个人ID概况匹配组件83。应注意，即使服务器系统不是本实施方案中的搜索引擎系统，这些模块仍可操作用于产生到服务器系统的安全通信路径。

压缩和/或加密模块821操作用于在用户终端和服务器系统之间建立安全通信路径。作为第一步，其使用数据挖掘工具822来收集必要的客户数据。数据挖掘工具822扫描客户系统的特征数据823并将其收集。该数据从数据挖掘工具822被通信至压缩和/或加密模块821。这产生唯一的用户ID，并且其可被用于终端和服务器之间的通信。具体而言，从终端到服务器的所有通信都包括该ID。这类通信一般被加密，使该用户ID不可能被窃听通信的第三方获得。当服务器系统从终端接收到包括ID的通信时，服务器的一个单元824识别相应的用户概况。压缩或加密模块821(其通常由在终端和服务器上运行的软件实现)也负责从服务器到用户终端的安全通信。

在作为本实施方案的一部分的服务器系统中，服务器包括搜索模块81，该搜索模块通过访问，包括基于关键字的用户概况组件84、基于搜索的匹配组件85和组件86的模块，来协调搜索操作。

当搜索引擎执行涉及加密的功能——诸如上述的数据挖掘操作——时，请求被发送至基于加密的搜索组件82。这接着被通信至压缩和/或加密模块821。在所收集的数据被压缩和/或加密了之后，其可被发送回基于加密的搜索组件82进行进一步处理，和/或被发送至概况ID模块824以供存储至针对单个客户概况的数据库90。如上所述，每个概况具有其自身独特的在数据被收集时为其所产生的标识符901。该独特的标识符901被用作数据库90的密钥。

个人ID概况匹配组件83允许搜索模块81为了诸如用户鉴别和搜索结果排名的目的访问并检索客户ID。个人ID概况匹配组件从数据库90中获取所请求的概况并将其返回至搜索模块81。或者，如果搜索模块81也需要用户的分组信息，则个人ID概况匹配组件83将与组ID概况匹配和更新组件831通信。组ID概况匹配和更新组件831然后将从数据库90获得个人ID概况，以及从数据库91——其为该系统存储了所有组概况——获得组ID概况。类似于针对个人概况的数据库90，每个组概况被分配一个唯一的被用作数据库91中的密钥的组ID911。一旦从数据库90、91中找到相关的信息，这些相关的信息就被发送回搜索模块81用于进一步处理。应注意的是，组ID概况匹配和更新模块831能够更新数据库90、91中关于组概况信息和个人概况所隶属的组的信息方面的内容。

我们现在开始对单元82、83和821的运行做更加深入的讨论。基于加密的搜索组件82、压缩和/或加密模块821与个人ID概况匹配组件83可被集成为一个基于矩阵的加密组件(matrix based encryptioncomponent)。在本发明的该实施方案中，基于矩阵的加密组件被布置为接收与客户的计算机相关的数据。稍后将针对数据挖掘来详细描述用于获取这种数据的方式。基于从客户计算机所收集的数据的唯一组合，由基于矩阵的加密组件产生唯一的ID。基于矩阵的加密组件可获得下列信息：关于客户的中央处理器(CPU)型号、显卡型号、硬盘型号、软件安装/配置、用户信息和任何其它相关信息。可应用一种方法诸如MD5散列法，或者应用任何其它可实现类似结果的技术，将这种信息加密为唯一的标识符。由于，结合了用户数据的硬件和软件配置极大可能是唯一的，因此其也作为一种非常有效的安全量度，如此一来，ID将很难在不属于该客户的另一系统上复制。如上所述，然后可将该ID传输至概况ID模块824并将其存储进数据库90中。

在此使用的优选的加密技术指的是基于矩阵的加密(MBE)。MBE是使用表征了硬件的配置的数据(“第一数据”或“第一数据结构”)将“第二数据”(或“第二数据结构”)加密的加密方法。第二数据和数据结构被优选分为多个(“n”个)部分，所述多个部分可以具有优先级或不具有优先级，且可以有或没有对所要划分的那些部分的偏好。接下来将这些第二数据和数据结构加密形成加密信息的多个部分。为了对加密信息和/或加密方法进行反向工程(reverse-engineer)，人们需要构建一个类似的系统来将其解密。一般而言，MBE是一种依赖于系统的配置、设置和其它特征(这可包括用户输入的信息，诸如用户名或密码)的特定组合来执行加密和解密过程的方法。因此，只有包含严格相同的配置、设置和特征的系统才可对通过MBE加密的数据进行解密。MBE加密方法依赖于硬件配置，这意味着其既可被用在客户电脑上，也可被用在服务器电脑上，并且可被构造到系统本身内。在本发明的一些实施方案中，MBE是一种在服务器端运行的独立加密方法。如果其在客户端运行，其可被用于ID生成目的。经加密的结果可基于下列的任意组合(可以有或没有给定优先级)：

i)密码

ii)带有密码的用户名

ii)CPU速度(处理器能力)

iii)存储器大小和/或交换区/虚拟空间和/或存储器寻址参考(addressing reference)

iv)所使用的加密方法(或者所进行的重复加密)的数目

v)网络连接速度、MAC地址、人类生物计量、密码输入或任何其它输入。

基于矩阵的加密识别周围环境，并将这些因素纳入考虑范围，以计算所使用的加密方法的最可能的性能。

加密过程(以及结果)也会受到以下因素影响，诸如：

1.对基于矩阵的软件的编译和/或在安装期间的编码，以便根据加密过程的应用修改其特征。

2.一些可根据任意需求进行调整的设置，所述需求如较高的加密强度、将被使用的变量数目、影响针对其而产生的加密结果的因素。

另外，基于矩阵的加密可依赖其它编程加密方法，而与所用的加密方法无关。所形成的输出是基于矩阵形式加密的随机产生的加密的结合，并且可被用于“双向”加密(足够多的编码数据被传输以完全构造第二数据；这在此也被称为“barebone”加密)。然而，以下也描述了多种类型的MBE，其为“单向”加密(即，没有传输足够多的加密数据以完全构造第二数据，尽管也可传输足够多的加密数据以实现另一目的，诸如识别一终端或用户)。

假设输入数据(“第二数据”)是一个密码。产生n个加密密码(每个使用上述第(i)至(v)点中的参数的不同随机选择)，然后由执行加密的系统(例如，主机或终端)将这些密码发送至另一系统(例如，终端或主机)。在该示例中，n个加密密码可从相应的“种子”值(“第一数据”)中获得，该“种子”值是在终端上运行的软件所检测并提取的环境变量。这些值可构成出于较高的安全加密目的而所需的n个附加密码。初始的密码也可被分为n部分，以及需要所用的每个部分来重构密码。应注意的是，在MBE的一些实施方案中，在上述实施例中所提及的“第一数据”和“第二数据”之间可能不存在差异。对MBE的所有输入(无论它们是硬件特征、密码、参数、用户输入或原始输入，等)都可以以分立的部分加以使用或整体上(然后拆开)作为n个密码。它们可被用作加密过程中的密钥(keys)或“种子值”，或者它们也可自身是加密的数据。

应注意，在该部分所称的密码可来源于用户的密钥、密码或系统变量以构成他的种子密码。取决于他的系统和安全设置等级，如果安装了一客户应用程序(具有MBE的工具栏或脚本)，客户可选择使用MBE来自动或手动提高它们的概况描述。由于MBE的性能(在客户终端上)取决于用户的系统，其可如下所述相应地调整其自身。

尽管它确实在系统中产生了附加的传输开销(transmissionoverhead)，如果加密结果的传输是在系统环境内的，这可使用匹配分类方法或直接存储器地址参照从而与鉴别系统的数据库快速匹配。基于矩阵的加密(和解密)以及其变量的一些实施例被给出如下。应注意，这些实施例描述了MBE的某些特征，实际的系统可以是一种或多种此类加密的组合。

我们现在给出多种MBE的一些具体的、但仅是示意性的说明。

1.基于Barebone矩阵的加密(MBE)

这些过程是利用图表所示的下列两个实施例而被解释的。每个图表示出整个加密过程，然后是解密过程。在每个图表中，左边的图表显示输入数据，右边的图表显示输出数据，二者之间的部分间隔地由操作步骤组成，所述操作步骤之后跟随着该操作的结果。

实施例1：

密码-＞MBE-＞加密的密码-＞反向-MBE-＞密码

从而，输入数据(密码)通过MBE被操作以形成一个经加密的密码。该密码可被传输至第二位置，在该第二位置，MBE操作被反向以重新构架密码。例如，密码(如“Person”)可经历MBE过程，从而形成一加密的密码(例如，“nosreP”)。将MBE“反向”的方法也可被应用至加密的“nosreP”以再次获得初始的密码“Person”。

在再一可能性中，可能存在多个加密/解密层。

例如：

Person-＞MBE过程1-＞nosreP-＞MBE过程2-＞rePnos

在上述实施例中，“rePnos”是被随机加密的密码。MBE能够产生关于加密信息的多个值和多个层，并且这些产生的值可被用于强化更好地加密的信息从而获得更进一步且不同的保护水平。在这种情况下，除非“被强行解开(brute forced cracked)”，否则加密数据(rePnos)将没有任何意义。MBE可包括内在的强行破解机制(或散列值存储器地址匹配)，且其解密能力的强度取决于用于进行初始加密的硬件。这意味着，能力(其中包括计算机的处理能力、存储等)将决定加密的强度，从而解密过程也将具有与这种能力相应的难度。

增强的MBE(Enhanced MBE)

在增强的MBE中，密码不仅被加密，还被分为多个加密部分，当被提供至反向MBE过程中时，所述多个加密部分允许检索初始密码。

密码-＞MBE-＞加密的密码1、加密的密码2，...，加密密码n

增强的MBE是barebone MBE的一种发展。它们二者的区别在于，增强的MBE包括将密码分为不同部分。像拼图玩具一样，其中一幅图被分为许多部分，为了获得初始的密码。反向MBE将匹配围绕拼图块的区域，直到获得合理的布置。或者，其可完成拼图块中的其中一个作为解锁整幅图片的密钥。

举一个2×2＝4部分密码(四块拼图)的例子。四块的可能组合数目将是4×4＝16种不同组合。然而，4块的仅一种布置是合理的(初始密码)，从而在反向过程中，当给出多个加密值时，增强的MBE将能够强制促使其匹配一个值以使最终的值合理。

在该示例中，系统将尝试将加密密码块与在加密过程中使用的环境设置的“种子”值相匹配。“拼图”(密码)仅在当它们与种子值相匹配时才“合理”。

在一个更复杂的例子中，密码将被分为100×100＝10000个部分的加密密码。在一些情况下，如今的较高计算平台将一个简单的文本行分为多个二进制值应该不会有问题，所述多个二进制值可接下来被翻译为十六进制值，或者一些类似的值，这取决于计算速度，从而为加密的目的而产生惊人数量的值。为了解密，一些种子值可被产生返回至系统用于与系统相匹配。如果匹配是正确的，将能够进行匹配剩余的值并完成解密过程。

单向MBE

这被表示为下图：

密码-＞MBE-＞加密的密码1

加密的密码2

.

加密的密码n-＞随机选择的加密的密码x，从密码1至密码n的随机选择的密码。

即是说，产生n个加密的密码，但是仅使用(传输)一个加密的密码至不同的位置。由于不执行反向过程(从加密的密码-＞密码)，单向MBE是MBE的一个简单变型。单向MBE可被用在其中仅需要鉴定并由此而不需要从加密的密码获得初始密码(信息)的系统中。

N向MBE(N-Way MBE)

N-向MBE是一种变型，其提供对解密过程的可变程度的“反向”。如上所述，单向MBE意味着人们不能将密码解密以获得实际的值；双向意味着其可以被解密。

N-向意味着系统可将密码单独解密以具有单独的“密码”，而非将它们用作一个整体(多个密码串在一起(串接)以形成一个密码)。

示例：

(‘L’，’o’，’v’，’e’)2×2矩阵＝分成(‘L’，’o’，’v’，’e’)4部分。

Love-＞MBE过程1-＞evoL-＞MBE过程2-＞ovLe

可单独获得4个所产生的“种子密码”：

ovLe-＞反向-N向-MBE-＞o

或者，

ovLe-＞反向-N向-MBE-＞L

或者，

ovLe-＞反向-N向-MBE-＞v

或者，

ovLe-＞反向-N向-MBE-＞e

或者，可重新构造整个初始字串。

ovLe-＞反向-N向-MBE-＞Love(所获得的作为一整体的初始密码)

另一示例：

(‘Santa’，’is’，’coming’，’town’)2×2矩阵＝分成(‘Santa’，’town’，’coming’，’is’)4部分。

Santa，is，coming，town-＞MBE过程1-＞town，coming，is，Santa-＞MBE过程2-＞gnimoc，nwot，atnaS，si

可单独获得4个所产生的“种子密码”：

gnimoc-＞反向-N向-MBE-＞coming

或者，

nwot-＞反向-N向-MBE-＞town

或者，

atnaS-＞反向-N向-MBE-＞Santa

或者，

si-＞反向-N向-MBE-＞is

或者，整个输入字串可被重构为：

gnimoc，nwot，atnaS，si-＞反向-N向-MBE-＞Santa，is，coming，town

这是个非常有用的特点，其允许提取初始密码(信息)的单独部分，而无需为了整个密码经历整个解密过程。选择采取获取单独部分，还是选择采取获取整个密码，将取决于N向MBE的使用目的。

具有上述各种形式的MBE，试图改善当前使用的解密方法的两个缺点：处理能力的速度以及强制促使解密。假设计算平台的处理能力不断增加，强制促使对付加密的数据来产生密码将会越来越容易或越来越快。基于矩阵的加密方法能够通过以下方法在较大程度上防止这种情况，即通过随机选择一些变量来增加算法的复杂度以便根据最近的技术的处理能力而使加密更加有意义，并且使所述加密对于黑客或骇客而言变得更加困难，因为为了将这些信息解密，需要构造类似的系统。

在本发明的一个实施方案中，基于用户信息和用户系统信息所产生和所加密的唯一ID可经由可反向的算法获得。这意味着，可通过将一解密算法应用至所产生的唯一ID来获得用户的信息和系统信息。例如，一个用户的姓名为“Tom”、生日为“01/01/75”，住在“美国”，具有的计算机系统装配为“Intel 2.2GHz”CPU芯片、“nVidia Geforce8800GT”显卡、“80gb western Digital”硬盘驱动，并安装有诸如“Microsoft Windows Vista”、“Firefox网络浏览器”和“AdobePhotoshop”的软件。一旦收集到该信息，基于矩阵的加密模块将为这种配置产生一个唯一ID，该ID可以看似是“ffd93f1687”。该ID被存储在数据库90中并被用于不仅识别用户，还可含有关于该用户的所有信息。在最简单的情况下，该ID可以是对于每个信息的散列代码的简单串接，其中“ff”可相应于“Tom”，“d9”相应于“Intel 2.2Ghz”等。为了检索所有信息，可将一解密算法应用至该ID。在“身份窃取”情况中，这增加了安全级别，因为，如果别的用户试图将他们的身份伪造为合法用户，他们将不仅需要进入合法用户的账户，而且需要具有与在用户系统上收集的信息所限定的系统严格相同的系统。

在合法用户已对其系统硬件或软件配置或用户信息进行修改的情况下，对于该新配置产生一个唯一的新ID。为了使该信息与旧ID相匹配，并相应地更新数据库90，更新过程将包括：使用先前的ID识别需被更新的条目，以及使用所产生的唯一的新ID将旧ID更新。

尽管上述过程针对个人概况ID进行描述，但同样适用于组概况ID，并被基于矩阵的加密模块类似地处理。

在图8所示的实施方案中，当客户做出一搜索请求时，搜索模块81将利用基于搜索的匹配组件85来处理该请求。该请求的关键字被从搜索模块81或基于搜索的匹配组件85传输至基于关键字的用户概况组件84。基于关键字的用户概况组件84将接下来从与该关键字和该搜索请求相关的数据库90、91、92、93、94中检索必要的数据。关于客户和该客户所隶属的组的信息首先被检索，以确认做出请求的客户的性质。基于该信息和请求本身，选择关键字数据库92、行为数据库(behavior database)93和时间线数据库(timeline database)94中的最相关的条目。在一示例中，属于动物物种保护积极分子小组的一个学生概况，请求搜索“渡渡鸟灭绝(dodo extinction)”。在关键字数据库92和时间线数据库94中，将检索与词条“渡渡鸟”和“灭绝”相关的条目921、941。另外，用户行为匹配和更新组件841将被用于访问行为数据库93，以获取客户的最相关“行为”931。在该实施例中，客户的相关行为931可以是关于“动物寿命”和“历史”的行为。行为931接下来被传输回至基于关键字的用户概况组件84。基于关键字的用户概况组件84接下来将组合后的信息传输回至基于搜索的匹配组件85。在本发明的该实施方案中，组件84能够使用新的或经修改的关键字来更新数据库92、94，组件841能够使用新的或经修改的行为更新数据库93。

通过与上述类似的方式，基于搜索的匹配组件85可访问和/或更新基于环境的概况数据库96以进一步将结果分类。使用以上我们所提到的学生这个例子，所选择的环境961可能是“研究(research)”，从而可将与该环境961相关的数据返回至基于搜索的匹配组件85。基于重复搜索的完善匹配组件851被用于针对先前可能已经做过的类似搜索951来检查所述的搜索完善数据库95。如果存在类似的在先搜索，则搜索951返回至组件851，并随后返回至基于搜索的匹配组件85。

使用检索到的信息，基于搜索的组件85将比较并匹配结果，那些在选定类901、911、921、931、941、951和961中出现最多的将被视为是最相关的。然后这些结果被返回至搜索模块81。最后，组件86将访问数据库96，获取作出搜索的客户的环境概况961，并从环境数据库97中获得相应的环境特征971，然后将其返回至搜索模块81。搜索模块81接下来将基于所有可获取的数据选择并排名搜索结果。

在本发明的一些实施方案中，可使用附加的模块来执行重复过程，从而提高其所重复的过程的质量。这可被应用至加密过程、用户行为匹配和更新过程以及基于搜索的匹配过程。

在重复的加密过程中，重复加密完善模块可被包括进与在先所述的基于加密的搜索组件82或基于矩阵的加密模块相通信中。该重复加密完善模块执行如下任务：重复由基于加密的搜索组件82或基于矩阵的加密模块所执行的过程。通过这样做，附加信息可被持续添加——和/或更新——至概况并被相应地加密，从而确保存储在数据库90和91中的概况ID的较好质量。

重复用户行为匹配和更新模块也可被实现为与用户行为匹配和更新组件841相通信。该模块将重复监测并处理用户行为。如果用户将要搜索“苹果”、“派”、“配方”以及“食谱”，这种形式的搜索或者这种“行为”将被记录并更新到数据库93中。这种“行为”可通过一些散列或图形的形式的记录方法被记录，使得具有类似搜索的另一用户将与该行为匹配。在这类“行为”匹配的情况下，向用户呈现出一些具有类似行为的先前用户所感兴趣的结果。

在本发明的一些实施方案中，可为每个个体ID和组ID对这种行为进行概况描述。在允许这种功能时，当用户具有与所述个体和/或组相匹配的行为时，用户可选择访问其它个体概况或组概况的特定部分，这可能从那些匹配的概况内所存储的结果中提供更相近的结果。

应注意的是，上述的基于重复搜索的完善匹配组件851与重复用户行为匹配及更新组件的运行不同，不同之处在于，基于搜索的完善匹配组件851对已经搜素过的单个关键字的结果进行完善，与此不同的是，重复用户行为匹配及更新组件通过用户的动作(所做的搜索的类型、感兴趣的结果的类型)跟踪用户行为。

尽管该实施方案已通过具体方式描述了组件的通信访问及顺序，本领域读者应清楚，检索顺序以及应用至搜索过程的顺序可加以不同地执行以实现类似效果。

一旦产生了排名结果，它们被返回至客户，并在步骤14中通过诸如图2中所示的网页的形式被呈现给客户。与步骤14相随的是，搜索结果也可通过分立的步骤19被存储在缓存数据库71中。

根据本实施方案被显示给用户的结果网页20被示出在图2中。搜索结果21根据基于步骤13中的排名的顺序被列出。搜索框24反映出哪些搜索词或短语被用于搜索。交互按钮22伴随显示的每个结果21，这些交互按钮允许用户针对具体结果实时地向搜索引擎提供反馈。尽管交互按钮22仅伴随图2中的结果21，它们可被应用至视频结果27或音乐结果28或者也可被应用至所产生的任意类型的结果，以实现类似的功能。

参照图3，其示出了在该实施方案中使用的一组交互按钮。四个按钮31-34允许用户提供不同类型的反馈。点击按钮31表决该结果应被删除。按钮32表决该结果应被标明为成人内容。按钮33表决该结果应被确定为较高等级，按钮34表决该结果应被确定为较低等级。

当客户点击按钮31-34中的任一个时，反馈被传输回搜索引擎(步骤15)。例如，如果客户点击等级增加按钮33，搜索引擎接下来将从缓存数据库71内查找搜索条目56。从那里，将查找到相应的结果条目54。表示“等级增加”的反馈的适当计数器65接下来将被增加一。

利用这种反馈，由搜索引擎所保持的缓存数据库71被修改(步骤16)。为了更新包含有历史数据的数据库51，在步骤17中在缓存和历史数据之间进行周期性的比较检查。在缓存中已经有更新修改的情况下，历史数据将被修改以最好纳入那些修改。从而，在今后，针对相同的搜索词条的搜索请求将基于包含有新的反馈的历史数据51而被排名。

的确，或者，一旦用户输入反馈，搜索结果就可被重新产生以包括该反馈(例如，如果用户已点击了相关于具体网页的增加按钮，则搜索结果可再次显示以将该网页排名在较高位置)。从而，实时地纳入人的交互作用是可能的。

如图2中进一步示出的，利用历史数据获得的其它元可被包括在结果页面20中。聊天框25允许客户与其它已做出类似搜索请求的客户交互。当客户做出搜索请求时，也从历史数据的数据库51中检索到聊天框数据53。该聊天框25接下来被包括在显示至客户的结果网页20中。聊天框25包括对话内容区25B，该对话内容区包含由客户贴入到聊天框的消息，以及用于将消息输入到聊天框25的数据输入工具25A。

当客户将其消息输入到聊天框25中时，该消息被送至搜索引擎，该搜索引擎将以类似于如上所述的更新来自交互按钮22的用户反馈的方式来更新历史数据51。合适的搜索条目56被找到，并且以该新条目来更新内容聊天框数据53。

在结果页面20中也可包含其他特征。这些特征包括，但不限于，与最近的消息26相关的特殊结果、与搜索请求相关的视频结果27、以及与搜索请求相关的音乐结果28。正如本领域读者所明了的，在所有这些实施例中，关于这些结果的数据都可通过类似于上述所讨论的实例的方法被存储并更新在历史数据中。在历史数据的数据库51内用于存储其他数据55、63的位置55、63可被用于这些特征。

通过引入人在反馈上的交互的因素，用户能够确定结果的相关度并相应地通知搜索引擎。由于这种交互不容易是自动的，其使得恶意用户更难以绕过这种系统。在恶意用户试图这样做的情况下，其他用户将能够通过给出相反的反馈来对其行为报警。

如果所做出的搜索请求既没有在缓存数据库71中找到，也没有在数据库51中找到，则在步骤18中将对该搜索请求产生一个新的结果条目56。对于该请求进行一新的搜索，并取决于不同实施方案的要求，将结果添加至缓存数据库71或关于历史数据的数据库51或者其组合，或者添加至所述两个数据库。

如果，在步骤12中，确定所做出的搜索请求不相应于现存记录56中的任一个，则在步骤18中对该搜索请求产生一个新的结果条目56。对于该请求执行新的搜索，取决于不同实施方案的要求，将结果添加至缓存数据库71或历史数据的数据库51或者其组合，或者添加至所述两个数据库。在这种情况下，可使用一常规的搜索引擎来执行搜索与该搜索词条相关的网页，并且获得所发现的每个网页的质量指标，其表明该网页的相关度。接下来，对于其质量指标位于预定值之上的每个网页建立一记录54。计数器62被设置成预定质量值，所有其它计数器被设置为零。

此外，因为网页可随着时间而变化，关于该网页的历史数据会逐渐变得过时。为应对该情况，存储在计数器62、63、64、65、66中的值可随着时间而减少(例如，周期性地乘以一个小于1的常数因子，诸如每天乘以0.99)，使得对于计数器的较早修改在决定当前值时逐渐变得不那么重要。实现该目的的方式可以因计数器的不同而不同。

此外，实施方案优选包含将新的网页添加至数据库51的机制。这可通过如下的服务器来完成，该服务器执行具有用于更新数据库51的单元的搜索引擎。该单元试图查找到与现存条目56中的每一个的搜索词条52相关的新网页。当查找到时，该单元向所发现的每个新结果赋予一质量值，表明该结果的相关度，并且如果质量值高于某一阈值，该单元设置一新记录(如图5中的54所示出的类型)，其具有与计数器62相同的质量值，并且其它计数器63、64、65和66的值为零。或者，在将该新记录添加至历史数据51中的记录54的组之前，将存在一个阶段，在该阶段中，当将相应的搜索查询输入到搜索引擎中时，新的记录与投票按钮一起被显示在图2的网页上，并且该新记录被输入作为一记录54——仅在反馈标准得以被满足，即，当其在预定时间内接收到足够量的正面反馈时。

尽管已使用具体实施方案在上文描述了本发明，正如对于本领域读者所清楚的，在权利要求的范围内可以有许多变体。

例如，为了防止某些用户通过持续按下与其网站相关的增加按钮来其网站，数据库51可包含身份信息(例如，互联网地址)，所述身份信息记录哪些用户的输入改变了历史数据，例如，计数器62、63、64、65、66的值，具有相同身份数据的反馈可在历史数据的未来更新中不再被计算。

Claims

1.一种用于将数据编码的方法，该方法包括：

(a)在一用户终端上运行的软件收集表征该终端的第一数据；

(b)使用所收集的数据将第二数据加密，以产生加密的数据。

2.根据权利要求1所述的方法，其中所述第一数据包括以下的一种或多种：

(i)CPU速度；

(ii)内存大小和/或存储器寻址参考；

(iii)交换区空间或虚拟空间；

(iv)网络连接速度；

(v)MAC地址；或

(vi)表征步骤(b)的加密过程的数据。

3.根据权利要求1或权利要求2所述的方法，其中所述加密还包括使用如下的任意一种或多种：

(i)密码；

(ii)带有密码的用户名；

(iii)人类生物计量数据；

4.根据权利要求1-3中任一权利要求所述的方法，其中执行步骤(b)：在终端，创建用于传输至服务器的加密的数据；或者在服务器上，创建用于传输至终端的加密的数据。

5.根据任一上述权利要求所述的方法，其中所述第一数据和第二数据中的至少一种被分为多个部分，所述多个部分被分立地加密以产生所述加密的数据的各个部分。

6.一种用于在用户终端和服务器之间产生安全通信的方法，该方法包括：

(a)在终端上运行的软件收集表征该终端的数据，

(b)使用所收集的数据获取唯一的标识符，

(c)将该唯一的标识符存储在服务器的数据库中，

其中使用所述唯一的标识符来确保接下来从终端到服务器的通信。

7.根据权利要求6所述的方法，其中所述唯一的标识符被服务器用于提取所收集的表征终端的数据。

8.根据权利要求6或权利要求8所述的方法，其中所述接下来的通信使用所述唯一的标识符被加密。

9.根据权利要求6、权利要求7或权利要求8中任一个所述的方法，其中所述步骤(a)至(b)间歇地重复以产生一个经过更新的唯一标识符，并且接下来将一方法设置至所述服务器，以使用所述经过更新的唯一标识符来更新所存储的唯一标识符。

10.根据任一上述权利要求所述的方法，其中所述服务器执行一搜索引擎。

11.一种用于在搜索引擎中产生搜索结果的方法，该方法包括：

(a)登记用户所做出的搜索请求，

(b)判断数据库是否包含由人类用户在先输入的、指示了与该搜索请求相关的条目的特征的特征数据，以及

(c)如果判断是肯定的，就从数据库中提取特征数据，并以一种由特征数据所决定的顺序呈现与搜索请求相关的条目，同时呈现多个相应的可被用户点击来修改特征数据的按钮；

其中所述按钮至少包括，一个如下按钮，该按钮将特征数据进行修改使得，如果该方法重复，将降低相应的搜索结果在序列中的排名；以及一个如下按钮，该按钮修改特征数据使得，如果该方法重复，将增加相应的搜索结果在序列中的排名。

12.一种用于在搜索引擎中产生搜索结果的方法，该方法包括：

(a)登记用户所做出的搜索请求，

(b)判断数据库是否包含有由人类用户在先输入的、指示了与该搜索请求相关的多个互联网网页的特征的特征数据，以及

(c)如果判断是肯定的，就从数据库中提取特征数据，并以一种由特征数据所决定的方式呈现关于网页的搜索结果；

其中搜索引擎被布置为接收来自于用户的输入，该来自于用户的输入修改与给定搜索结果相关的特征数据，用户输入为包含以下各项的组中的一项：(i)建议不响应于未来的搜索显示该搜索结果，(ii)建议将搜索结果标为涉及含有成人内容的网站。

13.根据权利要求12所述的方法，其中所述特征数据的至少一部分指示了数据与搜索请求的相关性，以及在步骤(c)中，搜索结果以一种由特征数据所决定的顺序被呈现。

14.根据权利要求12或权利要求13所述的方法，其中所述搜索结果被呈现，同时呈现可被用户点击来修改特征数据的一个或多个相应的按钮组。

15.根据权利要求14的方法，当其引用权利要求8时，其中所述按钮至少包括，一个如下按钮，该按钮降低相应搜索结果在序列内的排名；以及一个如下按钮，该按钮增加相应搜索结果在序列内的排名。

16.根据权利要求11-15中任一权利要求所述的方法，其中所述搜索结果连同与搜索词条和由人类用户在先输入的词条相关的其他数据一起被呈现。

17.根据权利要求16所述的方法，其中所述其他数据包括与搜索词条相关的聊天室。

18.根据权利要求11-17中任一权利要求所述的方法，其中所述提取特征数据的步骤包括提取与客户的地理位置相关的数据，所述地理位置被用作所述特征数据。

19.根据权利要求11-18中任一权利要求所述的方法，其中所述提取特征数据的步骤包括确定用户做出搜索请求所使用的语言，所述语言被用作所述特征数据。

20.根据权利要求11-19中任一权利要求所述的方法，其中所述提取特征数据的步骤包括确定做出搜索请求的用户的互联网服务提供商，所述互联网服务提供商被用作所述特征数据。

21.根据权利要求11-20中任一权利要求所述的方法，其中所述提取特征数据的步骤包括确定做出搜索请求的系统的互联网浏览器软件或操作系统软件以及相应的软件设置，所述软件和软件设置被用作所述特征数据。

22.根据权利要求11-21中任一权利要求所述的方法，其中所述提取特征数据的步骤包括确定做出搜索请求的用户的位置的当地时间和天气，所述当地时间和天气被用作所述特征数据。

23.根据权利要求11-22中任一权利要求所述的方法，其中所述提取特征数据的步骤包括识别在做出搜索请求的系统上所安装的计算机软件，所述安装的计算机软件被用作所述特征数据。

24.根据权利要求11-23中任一权利要求所述的方法，其中所述提取特征数据的步骤包括识别在做出搜索请求的系统上所安装的计算机硬件，所述安装的计算机硬件被用作所述特征数据。

25.根据权利要求11-24中任一权利要求所述的方法，其中所述提取特征数据的步骤包括确定用户的用户帐号、从所述用户帐号中提取用户概况信息，所述用户概况信息被用作所述特征数据。

26.根据权利要求11-25中任一权利要求所述的方法，其中所述提取特征数据的步骤包括确定用户所属的一个或多个组，从所述组中提取历史数据，来自于所述组的所述历史数据被用作所述特征数据。

27.根据权利要求11-26中任一权利要求所述的方法，其中所述特征数据是通过以下方法获得的，该方法包括：

(a)判断客户系统是否从搜索引擎下载了数据挖掘工具，

(b)如果判断是否定的，自动将数据挖掘工具下载到客户系统，并将在客户端收集的任意数据存储到数据挖掘工具中，或者

(c)如果判断是肯定的，则自动更新在数据挖掘工具上收集的任意数据，以及

(d)将数据挖掘工具中的所述数据传输至搜索引擎，其中，数据挖掘工具中的所述数据被存储并被用作所述特征数据以改善搜索结果。

28.根据权利要求27所述的方法，其中所述被传输的数据被加密，并且该数据仅在解密后是可获得的。(所用软件或所用方法的)压缩和/或加密的水平或程度基于系统/硬件概况、所安装的软件、用户概况和/或执行压缩/加密过程的系统的日期/时间，例如，所采用的加密技术可结合匹配于与处理器速度的阿姆达尔定律一致的最新倾向来进行，使得对信息加密/将加密信息解密所需的时间不会太大偏离于首次使用加密技术时的时间。例如，在2002年，奔腾III 667Ghz系统能够在300天内将一消息解密，2007年，使用类似的奔腾III 667Ghz系统来加密的方法，将尽量适应技术差异中的区别，采用较好的加密技术，以使得具有类似等级分类的最新的奔腾系统也在300天左右将其解密。这样做是为了防止类似等级分类的最新奔腾系统以非常短的时间范围将信息解密，从而在出现加密数据被诸如黑客或骇客的恶意用户盗窃的情况下，允许系统管理者有更多的时间来重新加固或者逐渐灌入更好的系统安全性。

29.根据权利要求28所述的方法，其中所述解密涉及使用生物计量安全设备来识别并实现所述加密特征数据的解密。

30.一种用于在搜索引擎中产生搜索结果的方法，该方法包括：

(a)登记客户所做出的搜索请求，

(b)判断客户系统是否从搜索引擎下载了数据挖掘工具，

(c)如果判断是否定的，将数据挖掘工具下载到客户系统并利用它们来收集并存储与客户相关的信息，或者

(d)如果判断是肯定的，使用数据挖掘工具更新并存储与客户相关的任意信息，

(e)将客户数据传输至搜索引擎，

(f)所述搜索引擎接收所传输的数据，

(g)产生一组搜索结果并将其呈现给用户，其中，所产生的搜索结果通过由传输至搜索引擎的客户数据所决定的方式被修改和/或呈现。

31.根据权利要求30所述的方法，其中在传输至搜索引擎之前，将所述客户数据加密，所述客户数据在解密之后是可获得的。

32.根据权利要求31所述的方法，其中所述解密包括使用生物计量安全设备来识别并实现所述加密客户数据的解密。

33.一种描述客户计算机系统的概况的方法，所述方法包括：

(a)判断客户系统是否下载有数据挖掘工具，

(c)如果判断是否定的，将数据挖掘工具下载到客户系统，并使用其来收集并存储与客户相关的数据，或者

(d)如果判断是肯定的，就使用数据挖掘工具来更新并存储与客户相关的任意数据，

(e)使用加密工具将客户数据加密，

(f)存储或传输所述加密的客户数据，

(g)使用解密工具将加密的客户数据解密；其中，针对所述加密的解密工具利用生物计量安全设备来识别并实现将所述加密的客户数据解密。

34.一种用于在搜索引擎中产生搜索结果的方法，该方法包括：

(a)登记用户所做的搜索请求，

(b)判断数据库是否包含由人类用户在先输入的、与搜索请求相关的聊天室数据，以及

(c)将与搜索请求相关的搜索结果呈现在网页上；

其中，如果判断是肯定的，步骤(c)还包括从数据库中提取聊天室数据并将搜索结果呈现在相同网页上作为聊天室数据。

35.一种被布置用来执行根据权利要求1-34中任一权利要求所述的方法的服务器系统。