CN109416826A

CN109416826A - 在与个人相关的社交网络上搜索和匹配内容的系统和方法

Info

Publication number: CN109416826A
Application number: CN201780035653.5A
Authority: CN
Inventors: 吴尚允; 卡洛斯·A·内瓦雷斯; 尼内尔·霍兹奇
Original assignee: Bpu International Inc
Current assignee: Bpu International Inc
Priority date: 2016-04-08
Filing date: 2017-04-10
Publication date: 2019-03-01
Also published as: IL262157A; WO2017177222A8; EP3440621A1; WO2017177222A1; KR20190017739A; JP2019514117A; US20200410401A1; US20170293864A1; EP3440621A4

Abstract

本发明涉及一种在与特定个人相关的社交网络上搜索和匹配内容的系统和方法。在一方面，个人相关内容搜索系统提供与个人的视角相关的搜索结果和信息。

Description

在与个人相关的社交网络上搜索和匹配内容的系统和方法

相关申请的交叉引用

本申请要求享有于2016年4月8日提交的美国临时申请No.62/319,905的权益，该美国临时申请的全部内容通过引用纳入本文。

技术领域

本发明涉及网络搜索引擎。

背景技术

本质上，互联网是将信息组织成领域特定的数据、社交数据、商业数据、博客数据、搜索数据等的数据库的集合。此外，存在许多与互联网相关联的搜索引擎，这些搜索引擎为它们的用户提供信息。实际的搜索引擎(诸如，Google、Yahoo、Bing、Ask.com以及许多其他搜索引擎)已经建立了极好的搜索系统。然而，这些系统仍未成功提供一种方式来“搜索该搜索(search the search)”。此外，返回的信息与进行搜索的个人不相关，而只是信息本身。该信息仅在搜索词语方面相关；不存在与个人相关的信息。

因此，需要一种产生与个人自身相关的信息的搜索系统以及一种搜索该搜索的系统。

发明内容

本发明涉及用于在与特定个人相关的社交网络上搜索和匹配内容的系统和方法。在一方面，个人相关内容搜索系统提供与个人的视角相关的搜索结果以及信息。换句话说，该系统提供来自用户的观点的信息，而其他现有技术系统提供全局观点。

在一方面，该个人相关内容搜索(IRCS)系统被配置为通过与与该个人相关联的至少一个用户设备和该个人所利用的社交媒体服务器通信来返回特定于个人的信息，从该用户设备和与该个人相关联的社交媒体账户获得信息，以创建数据流；以及，分析该数据流，以确定该个人的见解。在一方面，该IRCS系统可以通过从与该个人相关联的社交媒体账户获取与该个人相关的数据并且将该数据组合成标准化数据表示来创建数据流。在另一方面，该IRCS系统还通过将结构化数据和非结构化数据组合成该数据流来组合数据。在另一方面，该IRCS系统可以使用API来取得结构化数据，并且使用挖取器(scraper)来取得非结构化数据。在另一方面，该IRCS系统可以通过使用领域特定信息和元数据以创建将元数据和内容分开的分组来组合数据，以形成该数据流。

在一方面，该IRCS系统通过了解该数据和分析该数据来分析该数据。在此方面，该IRCS系统可以通过对该数据应用概念词典(concept dictionaries)和基于所述概念词典映射模式来了解该数据。在此方面，该IRCS系统可以将个人的个性化偏好应用于模式映射，和/或基于概念词典和模式映射来建立个性化词典。该IRCS系统还可以通过使数据令牌化来了解该数据。

在一方面，该IRCS系统可以通过确定该数据的相关性、语义、感情和意图来分析数据。在此方面，该IRCS系统可以通过将来自该数据的词语聚集在一起且对所述词语进行排名来确定该数据的相关性，这可以包括经由测量所述词语的频率和密度来创建所述词语的值。在其他方面，该IRCS系统可以通过要求用户训练该系统(即，提供对所述词语的反馈和自己的意思)来确定该数据的语义。

可以通过阅读和理解具体实施方式和附图来实现本发明的这些和其他方面。

附图说明

图1例示了根据本发明的一方面的社交媒体平台的示意性表示，从该社交媒体平台提取个人相关内容搜索系统。

图2例示了根据本发明的一方面的个人相关内容搜索系统的示意性表示。

图3以及图5-图8例示了根据本发明的一方面的与社交媒体服务器通信的图2的个人相关内容搜索服务器的示意性表示。

图4例示了根据本发明的一方面的图2的个人相关内容搜索服务器的示意性表示。

图9例示了根据本发明的一方面的由个人内容搜索服务器的数据摄取模块所创建的数据分组的示意性表示。

图10例示了根据本发明的一方面的个人内容搜索服务器的数据学习模块的示意性表示。

图11是根据本发明的一方面的个人内容搜索服务器的分析模块的示意性表示。

图12是根据本发明的一方面的个人内容搜索服务器的配置文件模块(profilingmodule)的示意性表示。

图13-图14分别例示了根据本发明的一方面的用户设备和个人内容搜索服务器的示意性表示。

图15-图20捕获由根据本发明的一方面的个人相关内容搜索系统所生成的屏幕截图。

具体实施方式

现在将在下文中参考附图更充分地描述本发明，意在结合此具体实施方式、发明内容以及具体讨论或以其他方式公开的任何优选和/或具体实施方案来阅读所述附图。然而，本发明可以以许多不同的形式体现，且不应被解释为限于本文所阐述的实施方案。相反，这些实施方案仅作为例示提供，且使得本公开内容将是周密的、完整的，且将向本领域技术人员充分传达本发明的全部范围。

如说明书和所附权利要求中所使用的，单数形式“一”、“一个”和“该”包括复数指示物，除非上下文另有明确指示。范围在本文中可以被表示为从“大约”一个特定值，和/或到“大约”另一特定值。当表达这样的范围时，另一实施方案包括从该一个特定值和/或到该另一特定值。类似地，当通过使用先行词“大约”将值表达为近似值时，将理解，该特定值形成另一实施方案。将进一步理解，每个范围的端点相对于另一端点都是重要的，且独立于另一端点。

“可选的”或“可选地”意指随后描述的事件或情况可能发生或可能不发生，且该描述包括所述事件或情况发生的实例和所述事件或情况不发生的实例。

在本申请的整个说明书和权利要求书中，单词“包括(comprise)”和该单词的变体，诸如“包括(comprising)”和“包括(comprises)”，意指“包括但不限于”，且不意在排除例如其他添加物、部件、整数或步骤。“示例性”意指“…的一个实施例”且不意在传达一个优选或理想实施方案的指示。“诸如”不是用于限制性意义，而是用于解释的目的。

公开了可以用来执行所公开的方法和系统的部件。本文公开了这些部件和其他部件，且应理解，当公开这些部件的组合、子集、交互、群组等时，虽然可能未明确公开每个不同个体和集体组合以及这些的置换的具体指代，但是对于所有方法和系统，在本文中明确设想和描述了每一种情况。这适用于本申请的所有方面，包括但不限于所公开方法中的步骤。因此，如果存在可以被执行的多个附加步骤，则应理解，可以利用所公开的方法的任何具体实施方案或实施方案的组合来执行这些附加步骤中的每个步骤。

如本领域技术人员将理解的，所述方法和系统可以采用完全硬件实施方案、完全软件实施方案或组合软件方面和硬件方面的实施方案的形式。此外，所述方法和系统可以采用计算机可读存储介质上的计算机程序产品的形式，所述计算机可读存储介质具有包含在存储介质中的计算机可读程序指令(例如，计算机软件)。更具体地，本方法和系统可以采用网络实施的计算机软件的形式。此外，本方法和系统可以由中央定位的服务器、远程定位的服务器、用户设备或云服务来实施。可以利用任何合适的计算机可读存储介质，包括硬盘、CD-ROM、光存储设备或磁存储设备。在一方面，下文讨论的方法和系统可以采用特定功能的机器、计算机和/或计算机程序指令的形式。

下文参考方法、系统、设备和计算机程序产品的方框图和流程图例示来描述方法和系统的实施方案。应理解，方框图和流程图例示的每个方框以及方框图和流程图例示中的方框的组合可以分别由计算机程序指令来实施。这些计算机程序指令可以被加载到一个或多个专用计算机和云服务中所找到的部件，或其他特定的可编程数据处理设备以生产机器，使得在计算机或其他可编程数据处理设备上执行的指令创建用于实施一个或多个流程图方框中指定的功能的装置。

这些计算机程序指令还可以存储在计算机可读存储器中，该计算机可读存储器可以指挥计算机或其他可编程数据处理设备以特定方式起作用，使得存储在计算机可读存储器中的指令产生包括用于实施一个或多个流程图方框中指定的功能的计算机可读指令的制品。计算机程序指令也可以被加载到计算机或其他可编程数据处理设备上，以导致将在计算机或其他可编程设备上执行的一系列操作步骤产生计算机实施的进程，使得在计算机或其他可编程设备上执行的指令提供用于实施一个或多个流程图方框中指定的功能的步骤。计算机程序指令、逻辑、智能也可以存储或实施在芯片或其他硬件部件上。

因此，方框图和流程图例示的方框支持用于执行指定功能的装置的组合、用于执行指定功能的步骤的组合和用于执行指定功能的程序指令装置。还将理解，方框图和流程图例示的每个方框以及方框图和流程图例示中的方框的组合可以由执行特定功能或步骤的基于硬件的专用计算机系统或专用硬件和计算机指令的组合来实施。

上文已经介绍且下文进一步详细讨论的方法和系统已经且将被描述为由单元组成。本领域技术人员将理解，这是功能描述，且相应的功能可以由软件、硬件或软件和硬件的组合来执行。单元可以是软件、硬件或软件和硬件的组合。在一个示例性方面，单元可以包括计算机。此示例性操作环境仅是操作环境的一个实施例，且不意在对操作环境架构的使用范围或功能提出任何限制。也不应将操作环境解释为对示例性操作环境中例示的任何一个部件或部件的组合具有任何依赖性或要求。

所公开的方法和系统的处理可以由软件部件来执行。所公开的系统和方法可以在由一个或多个计算机或其他设备执行的计算机可执行指令(诸如，程序模块)的一般背景中描述。通常，程序模块包括执行特定任务或实施特定抽象数据类型的计算机代码、例程、程序、对象、部件、数据结构等。所公开的方法还可以在基于网格的计算环境和分布式计算环境中实践，在所述计算环境中，由通过通信网络链接的远程处理设备执行任务。在分布式计算环境中，程序模块可以被定位在包括存储器存储设备的本地计算机存储介质和远程计算机存储介质中。

本文描述了用于在与个人相关的社交网络上搜索和匹配内容的系统和方法。如上文讨论的，个人相关内容搜索(IRCS)系统10(如图2-图20中示出的)被设计成向用户返回特定于个人的信息。在一方面，IRCS系统10提供与个人的视角相关的搜索结果和信息。换句话说，该系统提供来自用户的观点的信息。IRCS系统10提供允许使用匿名信息以及安全的个性化可识别信息来改善人类境况的基础设施。在某种意义上，IRCS系统10通过将人类语言与存储有知识的机器处理结合而变得智能。在一方面，IRCS系统(一种新型“搜索引擎”)被设计成基于与个人用户相关和对个人用户有意义的内容来推动新的人类应用；它基于用户的感觉如何以及用户周围的世界关于某事的感觉如何，且更重要的是用户打算如何利用该信息。

在一些实例中，IRCS系统10可以利用个人的社交媒体账户来提供这样的信息。图1例示了若干社交媒体平台，可以从所述社交媒体平台提取信息。然而，图1仅是一个例示性实施例；社交媒体平台可以包括但不限于：

等。从像Google的那些成熟的搜索引擎的视角看待IRCS系统10，Google从森林的视角询问树看起来像什么。根据一方面，IRCS系统10从树的视角询问森林看起来像什么。

从非常高的级别，那里的每一个社交媒体系统(包括但不限于Google、Facebook、Twitter等)都由非常大的用户数据库、用户的内容(或他们的搜索)和他们之间的关系组成。这些社交媒体系统中的大多数(即便不是全部)提供一种方式来搜索人、他们的群组或他们的页面以及他们的帖子，并且提供基于这些搜索来找出其他相关信息的方式。在某种意义上，互联网是将信息组织成领域特定的数据、社交数据、商业数据、博客数据、搜索数据等的数据库的集合。本质上，这些是出于查找(和搜索)用户喜爱(like)的事物并且识别这些喜爱的事物、多次标记此信息的目的的数据库。喜爱的指示可以被IRCS系统10利用，以识别用户喜爱什么或用户与什么相关。通过允许将来自这些领域之一的数据链接到下一领域的数据，例如Google到Facebook、Facebook到twitter等，个人已经产生了可识别的模式和偏好，所述模式和偏好可以被使用且甚至被利用来联系上这些个人。最后，称为互联网的此“云”服务和数据库的确是关于每个用户的一切。

图2例示了根据本发明的一方面的IRCS系统10。IRCS系统10可以利用IRCS服务器20，该IRCS服务器被配置为和与多个用户相关联的设备30通信。用户设备30与社交媒体服务器(S.M.)40有联系，设备30的用户具有该社交媒体服务器(S.M.)40的账户。此外，IRCS服务器20可以经由用户设备30的用户所提供的许可来访问社交媒体服务器40。在一些方面，IRCS服务器20可以通过用户设备30和社交媒体服务器40访问其他第三方(3^rd P.)服务器50(例如，营销和内容提供者)。

IRCS服务器20被配置为提供IRCS系统10的大部分功能和分析，下文更详细地描述的。然而，在一些方面，IRCS系统10经由IRCS服务器20和用户设备30、经由自包含处理机器(SCPM)35(下文更详细地讨论的)被配置为在不同参与者之间共享一些功能。在一些方面，IRCS系统10的某些软件部件和硬件部件可以在用户设备30和IRCS服务器20之间同时共享、拆分和/或托管。

在一方面，IRCS系统10被配置为分析从与个人相关的多个来源(包括社交媒体平台/服务器40)所收集的数据41，且基于该个人返回结果。在其他方面，IRCS系统10可以分析数据41且返回所有用户的结果，或只是返回部分结果。IRCS系统10利用许多模块来执行多种分析和功能，如图3-图4中示出的。在一方面，IRCS系统10可以包括数据摄取模块100、数据学习模块200、分析模块300、数据保留器模块400和配置文件模块500。这些模块(如图4中示出的)连同其他部件一起可以通过多种装置准备数据流、分析所收集的数据、做出关于数据的智能见解，以及提供多种其他类型的服务。如上所述，这些模块和功能可以由在IRCS服务器20和用户设备30/SCPM 35之间共享的部件来执行，这取决于部件所提供的功能。

数据摄取模块100是高度可适配模块，该模块被用于入站(inbound)数据41流，所述数据可以是结构化数据41a或非结构化数据41b以形成数据流，如图4和图5中示出的。数据摄取模块100被配置为学习它从中提取信息/数据41的多种社交媒体平台/服务器40的必需要求，且可以适配至这些平台/服务器40上的必需接口，以产生可以被IRCS系统10的其他模块接受的数据流80。IRCS系统10支持极大的灵活性。可以使用流“挖取器”接口102来使数据41“适配”，因为在某些实例中，数据60可能不可用作流或API，且在某些实例中，可能必需在提交数据之前实际解析和预处理数据，如下文讨论的。这极大地简化了IRCS系统10，因为在数据摄取模块100外部，IRCS系统10将入站数据41视为数据流80。一旦流80准备好，入站和准备服务就接管。例如，可能必需具有人的个人登录才能访问特定流。

使用数据流80具有若干益处。在一方面，一个益处是数据流80不必为了分析被分立地累积和存储；呈数据流80的形式的数据41按原样获取。此外，数据流80可以被多次(例如，递归地)送入IRCS系统10中，每次进一步优化数据流80，这去除了通常在筛选通过大数据集合时所创建的“噪声”。

互联网上的数据41造成了一个问题：数据41的格式和结构从一个站点到下一站点变化。此外，通过内容站点(例如，由社交媒体服务器40托管的Instagram、Facebook等)的优势，数据正变得越来越多地被标记。因此，IRCS系统10且更具体地数据摄取模块100具有越来越多的关于数据41是关于什么的线索，而不需要必须查看数据本身。然而，互联网用户对事物的解释不同，且假设(经由用户设备30的用户的账户)从社交媒体平台/服务器40所收集的大多数数据41是公开的，则自愿提供的信息不是真正可靠的。数据摄取模块100利用自动方式来更好地理解数据41。

从非常高的级别，数据摄取模块100区分结构化数据41a和非结构化数据41b。在一方面，数据摄取模块100可以识别这些不同类型的数据41。在此方面，每种类型的数据可能要求不同类型的适配器或代理：结构化适配器/代理110a和非结构化适配器/代理110b，如图5中示出的。这些适配器110的一项工作是从社交媒体服务器40获取数据41且将其转换为数据流80。这样，下文所讨论的实时处理器130和批处理器140不必担心来自多种社交媒体服务器40的不同类型的数据41；通过单个数据流80示出了数据41：结构化数据41a或非结构化数据41b。处理或经由实时处理器130实时发生，或经由批处理器140以“批”模式发生，这意味着在某个调度的时间(scheduled time)，进程运行并且解释流80，提取必需的分析。

如图4-图6中示出的，数据代理/适配器110唯一的工作是适配来自不管什么样的源40(FB、Twitter、YouTube、Naver、非结构化数据)的数据41，且创建标准化数据表示，然后该标准化数据表示变成数据流80。此标准化不只是简单地将数据从一种格式转换为另一种格式；入站数据适配器110检查数据41的上下文以进行解释。也就是说，数据适配器110确定与数据41相关联的用户的偏见和偏好的优先级是否应高于IRCS系统10的相同优先级。在一方面，用户可以配置与适配器110相关联的设置，以赋予在数据学习模块200(下文进一步讨论的)内找到的个性化词典或通用词典更多或更少的权重，以帮助解释数据。

在一方面，数据流80是内部数据库的集合，其中一些“实时”操作，而一些以“批”模式操作。除此之外，下文所讨论的数据分析模块/引擎300使用用于确定相关性和感情(下文详细讨论的)的公共算法，以及用于维护趋势、评分和长期报告的公共服务(在此上下文中，公共意指在架构的不同部件之间共享)。IRCS系统10还通过将它正在摄取的数据建模来开始形成“智能”基础。

如之前提到的，数据代理/适配器110是数据摄取模块100的一部分，该部分理解数据41是什么样的。在一方面，数据代理110使用领域特定的信息和元数据来创建表示元数据41c(关于帖子的数据)和帖子41d的实际内容(帖子数据)的结构(参见图6)。通过聚集所有这些结构，形成分组的数据流80。

数据摄取模块100的另一有趣的方面是使它是智能的。通常，当使用此类型的架构时，数据代理/适配器110是语言特定的；换句话说，对于每一种所支持的语言，FB西班牙语、FB英语、FB韩语等，存在一个Facebook代理。使这些数据代理/适配器110彼此完全独立的问题是它们之间的任何潜在语义协同作用都会丢失。这是具有与人交互允许IRCS系统10且具体地允许数据学习模块200连同数据摄取模块100的数据代理110一起“学习”且允许人类教导IRCS系统10的地方。

在一方面，数据学习模块200在数据摄取模块100的帮助下，可以通过建立概念词典210且基于概念映射或建立信息的模式220来理解数据41(参见图8)。概念是可以被用来映射入站帖子/数据41的与语言无关的构造。此外，数据学习模块200之后将获取该概念且看看是否可以从一个用户到所有用户根据附加数据确定共识。关于特定概念的“含义”所建立的共识越多，在摄取期间必须完成的工作就越少。一旦建立共识，数据学习模块200就可以开始将通过经证明的概念找到的其他信息映射到相同的概念。

例如，心形表情符号可以与喜爱的概念关联。数据摄取模块100还可以允许用户向IRCS系统10建议心形表示喜爱。然后，IRCS系统10在概念词典210和/或模式220内提出出于通用考虑的概念(即，心形表情符号等于喜爱)。当该用户以及其他用户的越来越多的数据示出该表情符号等于喜爱时，共识正在建立。例如，学习模块200将查看包括一堆心形的帖子41是否可能是关于喜爱的，且可能关于喜爱是积极的。一旦已经建立该概念且在一定程度上验证该概念，数据学习模块200就可以进一步处理帖子且将自然语言映射到常常与喜爱相关联的词语。因此，可以将语义元数据灌输到数据流80内。此外，元数据包括地理定位、人口统计、时间顺序、设备、源等，或包括可以获得关于该数据41的任何事物，以帮助增加分析的价值。

在一方面，利用数据摄取模块100的数据适配器110的数据学习模块200以两种主要方式使用智能：(1)将个性化偏好应用于概念词典210，该概念词典210被用于理解流入数据；(2)建立概念“映射”和模式220，以便将来在遇到相同的概念和模式时应用。这些步骤在数据学习模块200内完成，如图8中示出的。然后，分析模块300可以稍后使用这些概念/词典210和模式/映射220，以执行进一步的工作且以使用IRCS系统10向人提供甚至更多的服务。换句话说，数据摄取模块100检测数据，且数据学习模块200取得概念和模式。

当用户设备30初次使用IRCS系统10时，IRCS系统10不知道用户，且强制关于用户的数据41的连接/概念。然而，一旦IRCS系统10学习了数据流80中的模式和概念中的一些(其可以被保留在数据保留器模块400中)，IRCS系统10可以请求数据学习模块200将(例如，来自概念词典210的)这些概念反馈回数据摄取模块100，所以数据摄取模块100具有较少的工作要做，跳过已识别的概念。

在一方面，数据适配器110包括馈送读取器111，该馈送读取器从特定源(诸如，Facebook、Twitter、YouTube等)取得馈送41的内容，如图6和图9中示出的。这些馈送41常常具有API 112，且数据适配器110使用人的登录凭据简单地模拟用户，且获得馈送41，就好像它是查看馈送41的人一样。尽管有时使用API 112是不可行的或不可用的，且馈送读取器111使用通常被称为挖取器102的东西。挖取器102可以解析(通常HTML中的)本机(native)内容，且将该内容与视觉格式分开。通过使用用户的账户，本机搜索功能也可以被用来检索内容。

读取器111使用数据结构的公共知识或内部知识来创建将元数据与每个个人帖子的实际内容分开的“分组”81。这在解析内容(即，形成数据流80)以进行分析之前完成。在一方面，此类型的处理以用户设备30上所分布的代理的形式移动得更靠近用户，更多的“预分析”将被推送到此初始摄取阶段。通过此进程，来自社交媒体服务器40的数据41并非来自消防管线(fire hose)；当个人设置IRCS系统10的账户时，从经用户授权的个人的个人账户“挖取”数据41。数据摄取模块100提供了在智能建立时使用智能的合理位置。此外，数据摄取模块100与数据学习模块200一起在用户的个人基础上摄入数据41，从而避免与这样的数据获取相关联的普通大数据问题。在一方面，一旦分析数据41，下文详细地讨论的，数据41就快速消失。换句话说，处理帖子类似于处理短期存储器，而长期存储器用于记住概念学习。

在一方面，数据摄取模块100和数据学习模块200的组合创建了概念210和模式220的与语言无关的数据库。所有个人在通信时遵循个人语言模式。因为数据摄取模块100的数据适配器110常常“模仿”个人，所以在数据摄取模块100内嵌入概念和模式智能(即，数据学习模块200)是有效率的，因为数据41被读取而不是必须在分析阶段中稍后“重新读取”数据。在一方面，可以在用户设备30上的SCPM 35上找到两个模块100和200。在此方面，具有分布在用户设备30上的个性化模式识别(数据摄取模块100和数据学习模块200的组合)降低了IRCS服务器20上的负载，同时增加了与个人模式和偏好的密切关系，而不使IRCS服务器20负重担。

图7以及图9-图10例示了数据学习模块200的部件之间的信息流动的实施例。假设个人在Facebook上发布了一个句子41，陈述“我只是喜爱“心形表情”春天里漂亮的花朵”。利用通用语言词典205和概念210的公共语言解析器230使原始句子41令牌化，以使用简单的语言分析来创建令牌化句子84，从而创建含有令牌85的数据结构(链表、树等)。在此情况下，Facebook将个人使用的心形表情符号显示为心形。心形表情符号被Facebook用户理解，但不被自然语言解析器理解。因此，必须在此通过使用领域特定的信息(参见图7)将自然语言与其他伪像(artifact)分开来使用智能。类似地，如果相同的个人开始使用标签，她改述她的帖子：“我只是#喜爱“心形表情符号”#春天里漂亮的#花朵”，则需要使用特定领域的信息来将“心形表情符号”#喜爱、#花朵和#春天作为描述性伪像捕获到元数据内，且将自然语言重新发布回到处理器130/140内，而没有通常将为常规解析器带来许多问题的所有转义字符。此外，此进程是本地化的，且适配至由该工具支持的每种语言，因此可以解释俚语、文化参考和其他当地语言和文化偏见。

返回到原始句子“我只是喜爱“心形表情符号”春天里漂亮的花朵”，数据学习模块200连同仍使用概念词典210的解析器240一起构建个性化词典245，以捕获该句子的含义(参见图10)。用户的意思是她仅仅喜爱漂亮的花朵吗？因为花朵都是漂亮的，所以她喜爱所有的花朵吗？她“只是喜爱”而对花朵没有任何其他感情吗？或者，她喜爱的只是春天的漂亮的花朵吗？如所示出的，语义对个人会是非常语境敏感的。此类型的个性化解析240不排除通用解析。然而，通过用令牌85替换已经由个性化词典245规则所解析的语言的部分，通用解析器230具有较少的工作要做。

句子的令牌化可以继续附加的循环，如图10中示出的。解析中的每个“循环”添加越来越多的“智能”，以理解个人真正的意思是什么。随着时间的推移，越来越多的语言模式由个人建立，并且通过为个人提供检查他们的概念且对他们的语义匹配评分的方法，可以训练引擎以更准确地理解这些模式、概念和语义。

当正在解构句子以进行实际分析时，令牌85变得强大，从而去除了进行附加工作以理解该令牌的“意思”是什么的需要。例如，自然语言解析(由总体语言解析器230完成)要求解构成语言元素(例如，名词、动词、形容词等)，然后将语言元素与说话模式匹配，以建立正在说的内容。由于令牌85，这不再是必需的，因为令牌85已经被“匹配”。因此，随着时间的推移，由于人们在其语言中使用重复的模式，所以实际的“事实真相(nitty-gritty)”解析变得越来越不是必需的，因为他们的帖子通过预处理(经由模式/映射220)与他们的模式之一快速匹配，从而导致不仅更快而且极其准确的处理。

数据学习模块200可以进一步提取关于数据的更多数据，在流80内创建数据结构(即，分组)81且对数据流80的处理进行调度(参见图9)。模式识别和其他算法可以被用于更好地理解数据。此类型的数据分析对更好地定位营销消息是有用的，且允许基于模式的商业活动和社交活动，而非特定内容。

在所有分组81被放置到数据流80内之后，分组81之后被分析模块300接收。分析模块300可以执行为该数据流80请求或配置的多种多样的分析(感情、语义等)。分析模块300可以由多个分析模块/引擎组成。例如，存在不同类型的感情分析引擎，且有些能够分析twitter馈送，但是不能够分析其他馈送，因此重要的是能够“即插即用”不同的引擎。此外，一些引擎基于自然语言处理算法，而其他引擎专注于上下文和元数据。由于此，当数据流80沿着处理路径移动时，数据流80可以被视为作用于数据的一系列处理器。处理器/引擎不限于它们做什么，无论是语义分析还是元数据提取，分析仅受应用于数据流80的规则所限制。分析模块300还允许处理的调度实时发生、以批模式发生或离线发生。处理不必按顺序发生且可以是分布式的。调度系统还管理与不同服务提供者的同步。

本发明的IRCS系统10产生与个人相关的搜索结果。IRCS系统10经由分析模块300执行这些搜索和分析，该分析模块300基于且使用四个主要概念和相关子模块：相关性310、语义320、感情330和意图340，如图11中示出的。

相关性

相关性是一个广义的词语。当它应用于IRCS系统10的搜索时，相关性经由相关性子模块310被用来将词语聚集在一起。因此，例如，如果某人键入“Hillary”，则IRCS系统10将查看搜索返回的内容，且将紧挨着“Hillary”所使用的最常用词语进行排名。此词语排名可以通过查看不同因素来完成，所述不同因素例如为频率，帖子中“Clinton”出现在“Hillary”之后的频率如何？“总统”或“候选人”的频率如何？词频-逆向文件频率(frequency-inverse document frequency)(意在反映单词重要程度的数值统计)可以被用于此排名。

能够使可分配给一个词语的所有这些不同值复合，以扩展到短语、段落和整个文件。通过创建一个文件的数值模型，可以进行比较，而不必将词语相互比较，或者甚至搜索词语的出现。例如，假设简单二进制编码(ASCII)被用于词语“相关性”。十六进制72656C6576616E6365被产生，其可以被很容易地扩展成0和1，然后可以使用简单的二进制数学(OR、XOR等)对照其他词语对其进行容易且快速的评估，且也可以通过将简单值与其他单词的简单值进行比较来将其快速组织成树形结构。

通过以此方式组织短语或者甚至文件，相关性子模块310之后可以创建位映射，以表示这些完整的文件。此外，可以在位级进行比较，而非尝试逐字符地进行比较。通过向该值添加附加函数，即密度、权重、频率，可以使用传统数学来比较内容的这些“物理”特性，而不必实际上单独查看单词本身。然而，考虑到任何两个位映射看起来类似或者甚至相同，它们表示非常类似的某物的可能性非常高，相反地，如果它们不匹配，则它们将根本不会非常类似。这允许IRCS系统10创建“学习的”整个主题的库，且可以简单地通过比较位映射来快速识别类似的模式。

此外，相关性子模块310还可以考虑密度的概念，在任何给定的帖子群组中，频率是否是高，或它是否是分散式的(一些帖子被提及很多次，其他帖子较少被提及)。关键是，无论数学是如何构造的，都可以创建一个算法或一个算法集合，该算法或算法集合在测试和训练之后(即，用户函数获取用户反馈且创建用户词典或可能创建领域特定的词典，所述词典在试图确定一个词语与另一词语的相对值时可以由算法使用)将生成“通常”称为相关性的内容。这将是基于在某个特定时间值上应用的频率和密度的计算的数值。因此，与很少使用的词语相比，频繁且密集地使用的词语与用户具有更大的相关性。IRCS系统10正在生成和识别模式，而不是简单地尝试识别通常使用的词语。

为了确定其他词语与原始词语的相关性，或为了计算实际词语与个人的相关性，IRCS系统10经由相关性子模块310在用户自身的使用中(即，用户的消息、帖子、搜索等)随着时间的推移查看类似频率测量和密度测量。通过查看用户的朋友的流，IRCS系统10可以确定该词语在用户的朋友圈中显露的频率，使它与正在搜索和使用相同词语的用户的更多朋友更相关。

当IRCS系统10开始捕获用户(人)之间的关系而不只是捕获词语时，IRCS系统10开始将频率、权重、量、密度等的属性添加到关于一个关系所测量的元素。如上文讨论的，如果一个词语对于用户的朋友是重要的(因为他们在一段时间内频繁地或密集地使用它)，则IRCS系统10经由相关性子模块310可以将该“模式”匹配到该用户，以查看朋友和用户的相似程度。想象一下，如果频率为正弦波，其中密度是峰值之间(和波谷之间)的距离。如果密度是高的，则波看起来就像是一群彼此非常靠近的峰。如果密度是低的，则波将看起来很长。

通过查看这些“波”模式，模式可以被转换为一个函数。然后可以将该函数与其他函数比较，以检测和比较该模式，这可以通过数学方式很容易地完成，因为每一个波可以被映射到一个正弦函数，且通过多个比较功能以及该功能的多个方面，IRCS系统10可以避免必须比较波本身。比较一个函数(诸如，f(i)＝x(i))在二进制中是简单的。此外，通过将单词转换成数学构造(例如，波)，允许IRCS系统10使用成熟的数学，而无需发明新的数学。

通过将每个词语映射到一个数学函数或值，可以询问简单的问题：它是否等于、小于或大于等。然后，IRCS系统10经由相关性子模块310可以在一个数轴(number line)上建立词语对照其他词语的位置，从而确定数轴的哪个部分与特定个人更多的相关或更少的相关。IRCS系统10可以使用相关性和语义模型，通过将语言构造转换成容易评估的简单函数来创建识别人的语言模式和签名的属性。此外，通过评估一个函数，仅在绝对必需时才评估实际语言。随着全球语言模式的发展，通过避免跨地区的语言差异和文化差异，创造了令人难以置信的效率。

例如，从作为用于检测人们之间的关系的主要驱动器的Facebook开始；“我”是使用IRCS系统10的人。IRCS系统10的其他用户使用他们的Facebook账户来浏览他们的“朋友”、他们的“喜爱”、他们的“追随者”和他们的“提及(Mentions)”。仅仅基于这些元素，IRCS系统10可以建立这些人的映射，且基于某人对我的帖子喜爱的次数或他们与其他人共享这些帖子的频率来分配相关性分数。事实上，人们可以想到一个维度图表，其中与我具有最多互动的人“更接近”我，而其他人更远。

IRCS系统10的不同之处在于，它还可以对那些帖子的感情(下文讨论的)评分(且随着时间的推移，保留该评分)，且创建一个组合的感情相关性评分，该组合的感情相关性评分可以更准确地表示人们对我(即，用户)的真正感受如何，且基于他们的言行来更准确地表示谁更可能与我达成一致。类似地，反过来也可以成立。获取来自用户id的帖子/共享/喜爱的信息，然后实际上将所述信息与其他用户的帖子的文本进行比较，以获得相关性和感情。在一方面，IRCS系统10跟踪用户的帖子，且分析条目，以确定用户在使用某些单词时的意思是什么以及哪些词语与用户相关。随着用户的个性化词典的建立，该系统的智能建立。

然而，为了使相关性分析恰当地工作，重要的是，用户能够训练IRCS系统10。最初，IRCS系统10只能“猜测”，特别是如果它正在查看具有一个短语或词语的所有俚语和城市用法的自然语言。因此，IRCS系统10为用户提供了“训练”引擎以更像用户那样“思考”的能力。在一方面，可以在教导进程中利用数据学习模块200。例如，短语“Hillary Clinton ishot”是含糊不清的；我们不太清楚该短语指的是她的外表、她的民意调查上升，还是她在佐治亚州萨凡纳(Savannah，GA)当时的感觉。IRCS系统10经由数据学习模块200将自动猜测该短语暗示什么。在一方面，IRCS系统10可以让用户给出关于用户认为真正指的是什么的提示，然后给出关于用户是否同意该感情的提示。IRCS系统10可以将语义(语义是我们的意思是什么)与感情(我们的感觉是什么)分开，并且这是一个关键的区别。IRCS系统10用不同的数学函数将它们建模，下文更详细地示出。这是与其他方法的关键区别。

此外，在此分析中(例如，分析模块300)由IRCS系统10所使用的算法都是“可插的(pluggable)”，且用户可以在级别上权衡这些算法的使用。例如，对于自然语言词典，IRCS系统10可以使用城市词典作为“语义”的第一级，使用更通用的词典(例如，维基百科)作为第二级，然后使用个性化词典作为第三级。当与评分算法一起使用它们时，用户可以在将感情评分时定制哪个词典获得较大的权重，然后哪个词典或者第二大的权重等。当用户设备30同意使用IRCS系统10时(例如，将IRCS系统10的部件(SCPM 35)下载到用户设备30上)，这可以由用户设备30的用户完成，其中用户最初且连续地配置IRCS系统，用户指示他们对于什么更重要的偏好、个性化词典或其他。这还意味着，IRCS系统10具有捕获用户的个性化词典的功能，形成“个性化搜索引擎”。用户可以训练IRCS系统10，以识别更接近用户期望从搜索所得到的结果。

语义

经由语义子模块320，IRCS服务器20的分析模块300被配置为开发、实施和捕获多种不同的语义模型和算法。在一方面，分析模块300利用自然语言处理(NLP)。NLP是人类语言的所有细微差别的挑战，及NLP本身与人类语言的所有细微差别的挑战。然而，还存在附加障碍要清除，包括确定语言的含义，以及尝试钻研跨越语言边界的含义。即使面临所有这些挑战，真正的NLP也正在越来越接近现实。例如，Siri和Cortana已经走过很长一段路，尽管从两者都要求在线连接工作这一事实判断，我们认为处理能力仍然超出我们的较小设备的适用范围。

分析模块300且更具体地语义子模块320对自然语言的解释感兴趣，当通读内容流时，人类的意思是什么？使用单词内容，因为IRCS系统10不仅仅对解释互联网上的书面帖子感兴趣；IRCS系统10被配置为也朝向理解音乐和视频中的声音甚至理解可嵌入图像中的词语而建立。

在一方面，IRCS系统10且更具体地分析模块300的语义子模块320将分析分解为三个：(1)内容流的令牌化和解析；(2)实际的语法分析；以及(3)语境或概念映射。获取语言结构且将它们映射到超越语言界限的概念是很困难的。在许多情况下，其他人类因素诸如社交差异或文化差异可能引起不一致。此外，该进程可能涉及变换，该变换是一种近似且还容易出现机器错误。然而，考虑到IRCS系统10的交互性质，人类可以指示机器(即，教导IRCS系统10)，其中可以根据人类经验改进算法。

人类语言被变换成数据、变换成IRCS系统10和分析模块300理解的位和字节，其中分析模块300所采用的算法则理解这一切。语义树、语义表征或者甚至更复杂的建模都需要变换的机器可识别的数据流80，其中计算算法将获取输入且将它变换成输出。

因为许多人很难理解彼此，常常与理解他们自己斗争，所以计算机在理解用户时也会遇到问题。“理解”的此理念是什么？它是如此难以捉摸。IRCS系统10被配置为帮助用户能够将他们自己建模，他们对事物的个人理解和含义是非常宝贵的(例如，翻译感觉和情绪感情)。

分析模块300的语义子模块320允许个人将分析模块的引擎/模块/进程“训练”成按照人们真正认为事物的方式或他们对事物的感觉的方式来解释事物。内在化进程超出了定制内容的简单进程：它改变了实际代码的方式，结果被处理的方式......因为即使输入相同，输出也会转换成无限宝贵的数学构造，因为数学不能够说谎。

感情

与相关性和语义类似，IRCS系统10的分析模块300的感情子模块330捕获帖子、图像、视频和其他内容且分析它们，以获得感情。如上文所讨论的，内容被转换成数据流80、发送通过感情引擎/子模块330以进行分析，包括匹配词语，通“读”流以提取元数据(即，关于帖子的数据)且对条目的内容评分。在一方面，感情子模块330使用分数等级(scorescale)。在计算负面感情时，等级的使用使计算比实际真实数字更快。沿着一个数轴的中间数计算更快。在一方面，分数范围在1-100，其中1为负面的，100为正面的，50为中性的。因此，1-49等于-49到-1(逆序)，且51到100则是正面的1到49，从而去除了对可能被填充在错误的位置的负值的需要。使用整数数学不仅增加处理速度，还降低了这样的处理的成本。

在一方面，IRCS系统10经由感情子模块330使用多种公共词典(例如，城市词典、韦伯斯特、维基百科等)、开发的个性化词典(由IRCS系统10创建的)以及其他类似的服务，已确定其分析的词语的“值”，从而更密切地基于用户自己的语言用法和通信模式来捕获感情。

此感情评分虽然不成熟，但是正在创建语义的“含义”的初始理念。类似地，感情子模块330可以被IRCS系统10的用户教导。通过允许人类同意或不同意评分，感情子模块/引擎330可以“学习”更多什么事物匹配该人的感情，且随着时间的推移，一个人可以通过按照如下方式设置系统来影响结果：相比于由其他词典所提供的权重，赋予个性化感情“模式”更高的权重。

此外，IRCS系统10经由感情子模块330比较不同人之间的“模式”、“足迹”，当人们聚焦共享语义时，IRCS系统10可以变成发现密切关系且甚至帮助在语义分歧的主题上建立共识的方式。想象一下两个人的语义评分截然不同的情况，但不知何故，他们的感情分析彼此匹配。也许从不同的视角看待问题可以基于感情来实际上收敛语义分歧。

意图

一件事情是扫描内容且确定含义和感情，而另一件事情是从这些输入创建“新”事物，以确定输入的意图。IRCS系统10且更具体地分析模块300的意图子模块340分析高度私密且个性化的输入，以确定输入的意图。

例如，如果一个人正在研究汽车，他们是打算购买汽车吗？还是他们仅仅欣赏这些车辆？也许他们已经拥有了一辆且他们想要更多了解它，如何维护它或改进它。随着IRCS系统10越来越多地了解用户消费和制作内容的“原因”，IRCS系统10经由分析模块300的意图子模块340则可以找到更多类似的内容，且甚至找到更多可以成为潜在协作者、导师或学生的个人。可基于能够由系统校正的有根据的猜测，或通过向用户提供伪像(例如，类似按钮)以告知IRCS系统10何时用户打算取得或取消某些东西作为最原始的意图说明符来发现意图。

其他功能

IRCS系统10提供允许使用匿名信息以及安全的个性化可识别的信息来改善人类境况的基础设施。在某种意义上，IRCS系统10通过将人类语言与存储有知识的机器处理结合而变得智能。

如上所述，大多数数据流80移动通过IRCS系统10而未被存储。然而，在一些方面，一些数据被保留作为个人的搜索和结果的历史，且可以被个性化发布门户利用。因此，用户可以创建关于重要的事物且与他们相关的事物的信息图，且向世界显示、邀请朋友和家人等。事实上，一个人将能够创建不同的“视图”，以允许不同的人查看我的搜索的不同方面。

IRCS系统10的另一重要方面是其能够确定个体用户以及总体使用多少系统资源(即，当用户设备30的用户已经同意让IRCS系统10经由SCPM 35使用其资源时)。实际上，此类型的探测变成IRC系统10的一个关键部分，以出于预算目的帮助确定每个用户的成本。IRCS系统10还具有内置计费模块(未示出)，该内置计费模块允许基于用户类型灵活地考虑资源的合理使用，或随着时间的推移，该内置计费模块允许客户基于他们的使用模式购买更多或更好的资源。该计费模块是IRCS系统10的一个基本部分，该基本部分跟踪随着时间的推移每个用户的cpu、ram和磁盘使用情况(它是让用户知道何时他们正在使用太多资源的内部计费模块)，它决定在任何时候可以分配多少资源。在一方面，该计费模块允许IRCS系统10决定用户使用系统资源的费用明细表。

一旦流80被组织成一个数据模型(由元数据和帖子本身组成的数据分组)，就可以应用进一步的智能。由数据学习模块200提供了四个主要功能(除了别的之外)(如在图10中示出的作为识别配置文件、模式、个性化和报告)，主要功能是发现模式。因为模式是语境敏感的，分析模块300的引擎高度依赖于概率算法来设计模式路径，这些语境服务(即，模式识别服务)是按照知识域(这些知识域也是多态的)定制的，且可以横跨模式集合应用。由于IRCS系统10被大量地调整到面向个人，因此它在个性化和群组配置文件模块500(参见图12)上繁荣，该个性化和群组配置文件模块500基于随着时间的推移所收集的模式和智能来建立个性化。此基于时间的智能形成用于在IRCS系统10中学习的基础。为了最终的灵活性，智能平台提供灵活的报告平台，以定制用户和企业所需的许多方面，允许监视社交媒体平台与群组或个人的关联，提供关系分析以及核心分析(来自分析模块300的结果)和个性化购买(参见图12)。

平台(即，基本操作环境(参见图4的下层))本身是非常轻权重的(例如，出于效率目的而成流线型的功能)且在那里提供基本服务以允许平台的不同部件通信和执行它们的工作，且强制实行一致的安全模型。在一方面，该安全模型取决于用户。IRCS系统10可以具有多个不相关的实例，或它可以具有多个相关的实例，最终，目标是具有非常少的集中处理，而是具有大规模分布式计算的数据智能平台。

如上所述，IRCS系统10可以是由采用IRCS系统10的多个部分的若干用户设备30组成的分布式系统。分布式系统的目标是将问题分解为字节大小的组块(chunk)。出于解决大数据问题(Big Data Whales)的目的，IRCS系统10可以在用户设备30上实施自包含处理机器(SCPM)35。在一方面，SCPM 35可以用硬件、软件或二者来实施。可以使用基于自愿的网络来使SCPM 35在一起。SCPM 35可在存在可用资源(CPU、存储器、存储和网络访问)的任何地方操作。SCPM 35可以执行上文讨论的任何功能和所有功能。

SCPM 35的网络将处理能力和智能分布在网络上的不同节点上。SCPM 35为个人提供托管在任何设备上具有低资源消耗和足迹的“虚拟”机器。可以基于将由每个SCPM 35所评估的数据集合的大小来控制占用。为了向用户和商业提供动力以使他们的未使用的资源的多个部分专用于支持SCPM 35，每个都可以参与能够获得个人信用和认可的游戏化系统。公司可以奖励用户，用户可以彼此奖励，且IRCS系统10同样可以提供对于从多个方面参与社区的激励。

当用户将SCPM 35安装在用户设备30上时，用户可以选择允许社区支持。在此模式下，SCPM 35最小限度地利用用户的资源用于此全局智能大脑，同时对用户自身的问题和研究起作用。在一方面，SCPM35可以被设置为只对人自己的处理任务起作用，直到用户进入社区模式。在一方面，用户可以告知SCPM 35且通常告知IRCS系统10资源用于分配给他/她的问题在社区中所占的百分比。当这个完成时，SCPM35训练平台以了解他们的“社区精神”(因为缺乏更好的单词)。此外，当用户正在训练数据学习模块200时，IRCS系统10能够与可在社区中建立共识的那些概念比较，且将用户标记为对接受社区的概念支持，或对其厌恶。因此它正在学习用户与世界的相似程度，或不是同时地。

SCPM 35不仅仅在与用户的相关性和对用户的重要性方面来判断“好或坏”(道德的)。此私人安全虚拟机匿名通信，直到用户以其他方式授权它。换句话说，除非用户授权身份的散播，否则所有工作都是在不公开用户身份的前提下完成的。此外，SCPM 35安全地学习和收集用户的信息(例如，发送加密的数据分组)，这允许用户参与、合作和贡献。

当用户向社区提供结果时，用户还可以与世界共享她的或他的“见解”和“意见”。与人仅能够共享帖子的已知社交媒体平台不同，IRCS系统共享关于帖子的见解。共享见解的重要性在于，有时用户的语言可能与自然语言模式非常不同，以至于正面评论可能被解释为负面的。通过训练IRCS系统10关于用户的“意思”是什么以及何种事物与用户相关，IRCS系统10现在能够提供甚至更好的内容，即使在用户离开时也是如此。在一方面，当IRCS系统10显示搜索结果时，视觉提示可以被利用，以指示符合全局感情以及没有全局感情。在一方面，IRCS系统10还可以基于那些发现建议相关的主题和搜索。即使IRCS系统10并未改变内容本身，IRCS系统10也呈现在UI伪像中，所述UI伪像允许IRCS系统10通过提供个性化见解来告知用户发生了什么。通过与世界共享她的“见解”，用户不仅仅正在共享她的内容：用户正在共享关于她的内容的智能。在非常真实的意义上，IRCS系统10正在建立“共享的”智能云。例如，在政治运动中，与流行的公众公开相比，当用户在社交媒体上提供他们的感情时，人们可以看到用户对所讨论的话题的评分。

到目前为止，已经建立了由不同的网络(电子邮件、社交、财务等)创建的信息孤岛的互联网。数据模型是静态的，且语义已经被深埋在应用程序内的源代码内部。IRCS系统10将该智能带出这些孤岛，且为人们提供对他们自己的资源和他们自己的信息的控制；以及使智能生长和创建与匹配他们的标准的其他人的智能关系(网络)的能力。IRCS系统10提供了一种有目的地使这些网络动态地形成的方法。在一方面，IRCS系统10可以自动地建立连接，或至少向用户呈现匹配，以使用户确认连接。这就是所谓的意图。意图允许用户表达他们想要完成什么，且IRCS系统10允许用户以其他人可以帮助用户完成该意图的方式来表达该意图。

除了个人，这些网络提供以群组、团队或其他合作结构起作用的能力。在一方面，用户可以形成合作结构，其中他们同意采用该语境的语义，创建共享词典，因此创建模式、概念和进程的共享集合。IRCS系统10提供排名的级别和进步，以将领导者识别为思想领导者，以及在IRCS系统10社区内或在他们所建立的关系内贡献他们的资源的领导者。这个想法是用真实数据和真实信息而不是猜测来衡量事物、分析以及引起变化。此外，如果IRCS系统10必须通过捕获那些猜测的结果来猜测，那么系统10不必不断重复相同的错误。当人们所收集的智能建立在IRCS系统10上时，IRCS系统10随着每次电话呼叫、每封电子邮件等而变得更加智能。此外，相应地，IRCS系统10的每个SCPM35变得更加智能，形成病毒智能。

在一方面，整个IRCS系统10(包括SCPM 35)由私人网络促进、协调、管理、保护和操作。当连结私人网络时，一个人正在将他们的SCPM 35(其可以在计算机、移动设备、互联网服务(博客、网站、页面等)中操作)的力量添加到网络的力量中。此大规模处理网络可以递增地处理大数据。规则可以负责管理资源承诺，且访问控制可以负责确保数据得到保护。通过在私人网络上使用SCPM 35，IRCS系统10使一个问题的所有重要部分模糊，以避免安全问题。如果公司想要限制对他们的企业资源的处理，则SCPM 35的私人网络可以确保所有数据停留在该公司的指定资源内。

用户设备30可以包括但不限于个人计算机(台式计算机和膝上型计算机)、平板计算机、智能电话、PDA、手持式计算机、可穿戴计算机以及具有处理能力和对网络的访问的任何设备。如图13中示出的，用户设备30可以包括组合无线接口控制器51和无线电收发器52。无线接口控制器(W.I.C.)51被配置为控制无线电收发器(R.T.)52的操作，包括无线电收发器52的连接以及信息从IRCS服务器20、社交媒体服务器40和其他服务器50的接收和信息到IRCS服务器20、社交媒体服务器40和其他服务器50的传送。无线电收发器52可以在大范围的公共频率上进行通信，所述公共频率包括但不限于频带2.4GHz和/或5GHz-5.8GHz。此外，无线电收发器52在无线接口控制器51的帮助下还可以利用各种公共协议。例如，在本发明的一些实施方案中，组合无线接口控制器51和无线电收发器52可以在多种现有的和所提出的IEEE无线协议上操作，所述IEEE无线协议包括但不限于IEEE802.11b/g/n/a/ac，最大理论数据传送速率/吞吐量分别为11Mbps/54Mbps/600Mbps/54MBps/1GBps。在一方面，无线电收发器52可以包括被配置为在蜂窝网络上通信的无线蜂窝调制解调器52。蜂窝网络可以包括但不限于GPRS、GSM、UMTS、EDGE、HSPA、CDMA2000、EVDO Rev 0、EVDO Rev A、HSPA+和WiMAX、LTE。

在一方面，用户设备30被配置为通过多种网络与其他设备通信。用户设备30可以使用逻辑连接在网络环境中操作，所述逻辑连接包括但不限于局域网(LAN)和一般广域网(WAN)以及互联网。这样的网络连接可以通过网络适配器(Nwk.Adp.)76。网络适配器76可以在有线环境和无线环境中实施。这样的联网环境在办公室、企业范围的计算机网络、内联网、蜂窝网络和互联网中是常规的且是常见的。

用户设备30可以具有一个或多个软件应用程序54，包括网络浏览器应用程序56和多种其他应用程序。在一方面，用户设备30还可以包括SCPM 35，该SCPM 35可以包括所有上文所讨论的模块。用户设备30包括系统存储器58，该系统存储器58可以存储多种应用程序54，包括网络浏览器应用程序56以及操作系统60。系统存储器58还可以包括可由多种软件应用程序54访问的数据62。系统存储器58可以包括随机访问存储器(RAM)或只读存储器(ROM)。存储在用户设备30上的数据62可以是任何类型的可检索数据。该数据可以被存储在各种各样的数据库中，所述数据库包括关系数据库，所述关系数据库包括但不限于Microsoft Access和SQL Server、MySQL、INGRES、DB2、INFORMIX、Oracle、PostgreSQL、Sybase 11、Linux数据存储装置等。

用户设备30可以包括多种其他计算机可读介质，包括存储设备64。存储设备64可以被用于存储计算机代码、计算机可读指令、程序模块和用于用户设备30的其他数据62，且可以被用来备份或替代地运行操作系统60和/或其他应用程序54，包括网络浏览器应用程序56和SCPM35。存储设备54可以包括硬盘、多种磁存储设备(诸如，磁带盒或磁盘)、固态闪存驱动器或其他光存储器、随机访问存储器等。

用户设备30可以包括系统总线68，该系统总线68将用户设备30的多种部件连接到系统存储器58和存储设备64，以及彼此连接。用户设备30的其他部件可以包括一个或多个处理器或处理单元70、用户接口72以及一个或多个输入/输出接口74。用户可以经由用户接口72通过一个或多个输入设备与用户设备30交互，所述输入设备30包括但不限于键盘、鼠标、触摸屏、麦克风、扫描仪、操纵杆等。

此外，用户设备30包括电源78，该电源包括但不限于电池或外部电源。在一方面，用户设备30还可以包括全球定位系统(GPS)芯片79，该全球定位系统(GPS)芯片可以被配置为找到用户设备30的位置。

图14例示了根据一方面的IRCS服务器20。如同用户设备30一样，IRCS服务器20包括所有上文讨论的模块。通常，IRCS服务器20可以利用若干节点或服务器的元件和/或模块。在任何事件中，IRCS服务器20应被解释为包括多个模块、软件应用程序、服务器以及与用户设备30、社交媒体服务器40和其他服务器50分开的其他部件。

IRCS服务器20可以包括系统存储器22，该系统存储器22存储操作系统24和多种软件应用程序26，包括上文所讨论的模块。IRCS服务器20还可以包括由软件应用程序26可访问的数据32。IRCS服务器20可以包括大容量存储设备34。大容量存储设备34可以被用于存储计算机代码、计算机可读指令、程序模块(包括上文所讨论的那些)、多种数据库36以及用于IRCS服务器20的其他数据。大容量存储设备34可以被用来备份或替代地运行操作系统24和/或其他软件应用程序26。大容量存储设备34可以包括硬盘、多种磁存储设备(诸如，磁带盒或磁盘)、固态闪存驱动器、CD-ROM、DVD或其他光存储器、随机访问存储器等。

IRCS服务器20可以包括系统总线38，该系统总线38将IRCS服务器20的多个部件连接到系统存储器22和大容量存储设备34，以及彼此连接。在一方面，可以在相同的IRCS服务器20上找到大容量存储设备34。在另一方面，大容量存储设备34可以包括与IRCS服务器20分立存在的多个大容量存储设备34。然而，在这样的方面，IRCS服务器20可以被提供访问。

IRCS服务器20的其他部件可以包括一个或多个处理器或处理单元42、用户接口44、输入/输出接口46以及被配置为与其他设备通信的网络适配器48，所述其他设备包括用户设备30、社交媒体服务器40和其他服务器50等。网络适配器48可以通过多种网络通信。此外，IRCS服务器20可以包括与显示设备49(诸如，计算机监视器和以多种格式呈现图像和文本的其他设备)通信的显示适配器47。系统管理员可以经由用户接口44通过一个或多个输入设备(未示出)与IRCS服务器20交互，所述输入设备包括但不限于键盘、鼠标、触摸屏、麦克风、扫描仪、操纵杆等。

图15-图20示出了根据一个实施方案的IRCS系统10的一个实施方式的屏幕截图。在此实施方案中，IRCS系统10(称为“GoSocial”)提供可以被容易地定制用于企业使用或公共使用的社交分析工具。然而，与Google不同，GoSocial使用他们的社交账户来提供个性化的视角，即我们可以从他们的观点学习到什么。社交图表的此反向发现提供了强大的见解。

用户可以通过如图15中示出的常规访问页面来访问IRCS系统10。一旦登录，与Google很像的接口(参见图16)是一个非常简单的搜索“条”。虽然Go的初始实施方式集中于关联来自Twitter、Facebook、Flickr和You Tube的数据，但是它非常灵活。可以很容易地添加新数据流。数据可以是结构化的或非结构化的，算法是与语言无关的，训练引擎是开放的和可扩展的。该想法是用户接口提供了一种简单的方式来“搜索”可用数据流以搜索标签和词语的使用，当发现那些时，算法针对感情对每个“帖子”评分(可以是由数据流所呈现的任何语法结构)，且随着时间的推移映射趋势。

图17例示了根据一方面的使用词语“钢铁侠”的来自IRCS系统10的搜索结果。如所示出的，在执行搜索的特定时刻，显然更流行的词语是来自Lego Movie的钢铁侠角色，且通常感情是良好的。查看这些推文，存在一个在Google Play上发行的壁纸的重发帖子。美国的贡献者主要在加利福尼亚州或纽约州，且考虑到推文的时机，人们正在积极讨论社交媒体网络中的话题。像这样的信息对于品牌所有者以及希望发展他们自己声誉的品牌竞争者来说都是非常宝贵的。

如图18中示出的，IRCS系统10经由GoSocial分析面板提供随着时间的推移更适合于管理统计、趋势和分析项目的强大接口。IRCS系统10具有根据设备的类型、天时间或周时间、语言、性别等将更好的人口统计能力、地理能力和信息图更好分类的能力。这样的服务可以被用来监视区域敏感趋势，诸如营销活动、政治感情和社交行为分析。

如图19中示出的，通过使用感情趋势能力，人们可以看到感情的量和变化。在此情况下，该词语从平均50的评分变为几乎80。如果某人正在观看这发生并且它意外地发生，则人们必须询问这为什么发生，或如果正在发起运动，则这可以指示这样的运动的成功或失败。

使用不同的可视化技术，人们可以观察在一段时间内趋势的移动。例如，如图20中示出的，词语是冠军、精神和等级(bracket)，以及三者的组合。如所示出的，最主要的词语是精神，且下一相关词语是等级，其在此情况下将指示在这两天中必须存在某种运动竞赛，其中等级在社交圈中被监视且被关注。

IRCS系统10提供使用“通用”公共接口来收集和训练感兴趣的词语的能力，很像Google通过按搜索频率对关键字排名一样。IRCS系统10可以被用来跟踪搜索次数最多的词语以指示兴趣，除此之外，它可以被用来聚集个人看法和感情，或它可以简单地被用来查看对于社交网络中的一个词语的“个性化视角”。

已经如此描述了示例性实施方案，本领域技术人员应注意，其中的公开内容仅是示例性的，并且可以在本公开内容的范围内进行各种其他替换、适配和修改。因此，本发明不限于本文所例示的具体实施方案，而是仅受所附权利要求限制。

Claims

1.一种被配置为返回特定于个人的信息的个人相关内容搜索(IRCS)系统，该系统被配置为

a.与跟该个人相关联的至少一个用户设备和该个人所利用的社交媒体服务器通信；

b.从跟该个人相关联的该用户设备和社交媒体账户获得信息，以创建数据流；以及

c.分析该数据流，以确定该个人的见解。

2.根据权利要求1所述的IRCS系统，其中创建该数据流包括从跟该个人相关联的社交媒体账户获取与该个人相关的数据，且将该数据组合成标准化数据表示。

3.根据权利要求2所述的IRCS系统，其中组合该数据还包括将结构化数据和非结构化数据组合成该数据流。

4.根据权利要求3所述的IRCS系统，还包括使用领域特定的信息和元数据，以创建将元数据和内容分开的分组，从而形成该数据流。

5.根据权利要求2所述的IRCS系统，其中API被用取得结构化数据，且挖取器被用来取得非结构化数据。

6.根据权利要求2所述的IRCS系统，其中获取与个人社交媒体账户相关的数据还包括学习每个社交媒体服务器提取数据的必需要求。

7.根据权利要求1所述的IRCS系统，其中该数据的分析包括：

i.了解该数据；以及

ii.分析该数据。

8.根据权利要求7所述的IRCS系统，其中了解该数据包括对该数据应用概念词典和基于所述概念词典映射模式。

9.根据权利要求8所述的IRCS系统，还包括将该个人的个性化偏好应用于模式映射。

10.根据权利要求8所述的IRCS系统，还包括基于概念词典和模式映射来建立个性化词典。

11.根据权利要求7所述的IRCS系统，其中了解该数据包括使数据令牌化。

12.根据权利要求7所述的IRCS系统，其中分析该数据包括确定该数据的相关性。

13.根据权利要求7所述的IRCS系统，其中确定该数据的相关性包括将来自该数据的词语聚集在一起且将所述词语排名。

14.根据权利要求13所述的IRCS系统，其中将所述词语排名包括创建用于所述词语的值。

15.根据权利要求14所述的IRCS系统，其中创建所述值还包括测量所述词语的频率和密度。

16.根据权利要求7所述的IRCS系统，其中分析该数据还包括确定该数据的语义。

17.根据权利要求16所述的IRCS系统，其中确定所述语义还包括要求用户训练该系统。

18.根据权利要求7所述的IRCS系统，其中分析该数据还包括确定该数据的感情。

19.根据权利要求7所述的IRCS系统，其中分析该数据还包括从该数据确定用户的意图。

20.根据权利要求7所述的IRCS系统，其中分析该数据还包括从该数据确定数据的相关性、语义和感情以及用户的意图。