CN103917968A

CN103917968A - 用于管理具有交互式评论流的评论网络的系统和方法

Info

Publication number: CN103917968A
Application number: CN201280040125.6A
Authority: CN
Inventors: 亚历山大·阿萨利; 马克·阿萨利; 苏姆亚迪普·保罗; 丹尼尔·克里斯托弗·哈维; 斯潘塞·卡梅伦·凯利; 海伦·路易斯·弗拉特利; 菲利普·詹姆斯·爱德华·格里本
Original assignee: EQUAL MEDIA Ltd
Current assignee: EQUAL MEDIA Ltd
Priority date: 2011-08-15
Filing date: 2012-08-14
Publication date: 2014-07-09
Also published as: WO2013024338A1; US20150089409A1; EP2745210A4; EP2745210A1

Abstract

本公开内容的领域总体上涉及用于管理具有交互式评论流的评论网络的系统和方法，更具体地但非排他地涉及用于采集和分析电子评论数据的系统和方法。一种用于分析电子评论数据的方法，包括以下步骤：接收电子评论数据，其中，所述评论数据包括自然语言词汇；将所述评论数据映射成统一评论对象，所述统一评论对象提供为受控自然语言；以及提供具有与至少一个所述统一评论对应的至少一个部分的呈现。在可替代实施方式中，所述方法还包括对评论图中的统一评论对象进行分级以生成按用户的关联性。

Description

用于管理具有交互式评论流的评论网络的系统和方法

相关申请的交叉引用

本申请请求如下申请的优先权：于2011年8月15日提交的美国临时申请序列号为61/523,823;于2012年4月17日提交的美国临时申请序列号为61/625,560；于2012年5月22日提交的美国临时申请序列号为61/650,240。本申请明确要求这些临时申请的优先权，各个临时申请的公开内容及其所有目的通过引用全部合并到本文中。

技术领域

本公开内容总体上涉及用于管理具有交互式评论流的评论网络的系统和方法，更具体地但非排他地涉及用于采集和分析电子评论数据的系统和方法。

背景技术

网基系统和数据网络例如通过对网基内容（例如网页）的贡献、网络日志（“博客”）及在线论坛等向用户提供交互式体验，使得用户能够通过创建/编辑其他用户可访问的Web内容来相互交流。该Web内容中的一大部分反映了用户对各个对象（例如电子商品、政治和名人）的观点/评论。为了便于理解数量日益增加的观点/评论数据，通常使用评论挖掘（或观点分析）来处理并提取来自数据的主观信息。

评论挖掘、聚合和观点分析的方法传统上试图对较大块的文本执行广泛的观点分析。这些方法将文本分类作为首要目的，并努力识别总体的观点偏向性，通常在对象容易识别的评论网站中获得最佳结果。这些传统方法严重依赖于特定主观性关键词的“词袋”统计关联性和在先偏向性标记。“词袋”模型将例如从句子或文档提取的文本量化为视觉词的无序集合。偏向性标记包括将特定文本分类为肯定、否定或中立的。相似的方法已被应用于博客和新闻文章或微博平台（例如等），结果不同。

这些传统方法的一个缺点是对作为评论对象的实体或概念进行识别时缺乏准确性。有些传统方法使用三角测量法计算主观性关键词与文本内的已知实体的接近度。这些方法在识别关于特定对象的观点时更成功，但会限制对实际评论的理解。例如，术语“大”未必具有相关联的在先偏向性，然而可能通过特定上下文发现传统方法不能捕获的含义。其他传统方法限于手工注释的训练数据，它们很快过时了。

鉴于前述原因，需要一种用于评论挖掘、聚合和观点分析的改进型评论网络和方法，以努力克服现有技术系统中的前述障碍和不足。

发明内容

本公开内容的技术领域总体上涉及用于管理具有交互式评论流(opinion flow)的评论网络(opinion networks)的系统和方法，更具体地但非排他地涉及用于采集和分析电子评论数据(opinion data)的系统和方法。在一个实施方式中，分析评论数据的方法包括以下步骤：接收电子评论数据，其中所述评论数据包括自然语言词汇；将所述评论数据映射到统一评论对象(opinion object)，所述统一评论对象提供为受控自然语言；以及提供一个呈现，该呈现具有与至少一个所述统一评论对应的至少一个部分。

在可替代实施方式中，所述方法还包括对评论(opinion)图中的统一评论对象进行分级以生成对每个用户的关联性。

本发明内容用以介绍本申请公开的主题内容，但并不意在标识所要求保护的主题内容的实质特征，也不意在用于确定所要求保护的主题内容的保护范围。对本领域的技术人员而言通过阅读以下附图和详细描述时，本公开内容的其它系统、方法、特征和优点等将被明显说明或成为显而易见。本申请意在将所有这样的附加系统、方法、特征和优点包括在本说明书内，包括在本公开内容的范围内并且通过所附权利要求进行保护。

附图说明

为更好地理解如何获得本公开内容的上述优点和其它优点以及如何实现本公开内容的目的，现将通过参考在附图中示出的具体实施方式呈现以上简要描述的实施方式的更加具体的描述。应当注意，附图中的部件未必是按照比例的，重点在于示出本公开内容的原理。另外，在附图中，相同的附图标记在不同视图表示对应的相同部件。然而，相同的部件不总是具有相同的附图标记。另外，所有视图均意在表达概念，其中相关尺寸、形状和其它详细属性可能是示意性示出，而不是按照字面意义或精确地示出。

图1示出了根据本公开内容的优选实施方式示例性的基于评论网络的计算环境的示意图；

图2描绘了根据本公开内容的一个实施方式的图1中所示的示例性评论捕获服务器的方面的示意图；

图3A是根据本公开内容的一个实施方式对如图1所示的示例性评论捕获服务器的系统结构进一步详细描述的示意图；

图3B是进一步详细描述图1所示的示例性评论捕获服务器系统结构的另一个示意图；

图4是描绘示例性评论编码处理方面的功能图；

图5是描绘根据本公开内容的至少一个实施方式的示例性实体定位和消歧处理方面的功能图；

图6是描绘根据本公开内容的至少一个实施方式建模的示例性评论图方面的示意图；

图7是描绘根据本公开内容的至少一个实施方式示例性的使用语义关系评论聚合方面的示意图；

图8是示出了根据本公开内容的实施方式的示例性分级处理方面的示意图；以及

图9A至图10D是描绘根据本公开内容的至少一个实施方式的用于参与交互式评论网络流的示例性图形用户界面方面的示意图。

具体实施方式

根据本公开内容的至少一个实施方式，可以使用基于网络的计算系统来维护并分析丰富的评论网络。随着评论网络的增长，使用户能够表达其思想、将其连接至相关用户、内容和评论的更广泛的团体并提供互动平台的方法可以使团体运行起来并影响更广泛的世界。根据在本文中公开的一个实施方式，该结果可以通过如图1所示的基于评论网络的计算系统100来实现。

基于评论网络的计算系统100包括被配置成访问多种因特网服务的数据网络101，例如万维网（“Web”）-因特网上的公知的数据交换系统。该Web通常用于使用应用Web浏览器访问电子内容。作为示例，数据网络101可以包括一个或更多个相互连接的局域网（“LAN”）、广域网（“WAN”）（例如因特网协议（“IP”）网络）和/或移动/蜂窝无线网络。与网络101的通信/数据交换可以通过任何共同的高级协议（例如传输控制协议（“TCP”）/IP、用户数据报协议（“UDP”）等）来进行，且可以包括经由适当网关连接的不同协议的多个网络。所述通信/数据交换支持有线连接和无线连接。

Web服务用户105可以使用用户设备105A、105B、105C和105N访问在数据网络101上的各种网络资源-例如Web服务102、评论捕获服务器103和评论增强Web服务104。在一个实施方式中，Web服务102和评论增强Web服务104代表网页，每个网页可以通过统一资源定位器（“URL”）来唯一地标识，使用任何共同联网协议（例如超文本传输协议（“HTTP”）、HTTP安全协议（“HTTPS”）、传输层安全协议（“TLS”）和安全套接层协议（“SSL”））请求进行访问。

用户设备105A、105B、105C和105N优选地为基于因特网的通信系统，且包括但不限于台式计算机、膝上型计算机、移动电话、个人数字助理（“PDA”）、多媒体播放器、机顶盒和其它可编程消费电子产品、多处理器系统、基于微处理器的系统和分布式计算环境等。

如上讨论的，评论挖掘、聚合和分析的传统方法对较大块的文本执行广泛的观点分析，严重依赖于“词袋”统计关联性和在先偏向性标记，使用三角测量方法计算主观性词汇与已知实体的接近度等。尽管这些方法对容易识别的对象、实体或概念可能有效，但是这些技术在识别非结构化的评论对象和变化实体时仍然缺乏准确性。局限于手动注释数据来充分理解评论数据的方法很快过时了。相应地，图2提供了被配置成解决这些问题的评论捕获服务器103的一个实施方式。

转向图2，其更详细地示意性示出了评论捕获服务器103。图2所示的子系统经由系统总线202互联。作为示例，评论捕获服务器103包括固定硬盘208和耦接至显示适配器212的监视器210。输入设备/键盘206也耦接至系统总线202以接收至服务器103的用户输入。外围和附加输入/输出（“I/O”）设备耦接至I/O控制器214，且可通过本领域中任意数量的已知装置（例如串行接口216）连接至服务器103。例如，串行接口216或外部接口218将服务器103与数据网络101相连或与其它未示出的设备/系统（例如鼠标、扫描器等）相连。可选打印机204也被示为连接至系统总线202。经由系统总线202的相互连接使得一个或更多个处理器220能够与每个子系统进行通信、控制可存储在系统存储器222和/或固定硬盘208中的指令的执行以及在子系统之间交换信息。

系统存储器222和固定硬盘208均可以做为计算机可读介质的具体实现。本领域的技术人员应当理解，系统存储器222和固定硬盘208还可以是任意类型的大容量存储设备或存储介质，例如磁性硬盘、软盘、云存储、光盘（例如CD-ROM）、闪存存储器、DRAM以及设备集成（例如独立磁盘冗余阵列（“RAID”））。尽管在图2中被示为存在于仅一个计算设备上，相似地应理解存储器222和硬盘208可以存在于相互通信的不同计算设备上。

图3A示出了响应于电子评论数据301的服务器103的系统结构的细节。服务器103包括具有定位和消歧引擎32B，还包括用于将输入数据301组织到特定主题领域中的简易信息聚合（“RSS”）馈送聚合器32A的离线处理模块302C。离线处理模块302C还可以包括用于存储从评论中提取的多个实体的实体词典数据库32C。在优选实施方式中，数据库32C被组织为面向对象的关系数据库（例如MySQL），但是应当理解可以使用任何其它的层级式数据库模型或基于网络的数据库模型。服务器103还包括数据库302B。与实体词典数据库32C相似，数据库302B被安排为面向对象的关系数据库（例如MySQL），但是应当相似地理解可以使用任何其它的层级式数据库模型或基于网络的数据库模型。还应当理解，实体词典数据库32C和数据库302B可以存在于同一设备或相互通信的不同计算设备上。

在本文中描述的用于处理电子评论数据301的系统、装置、方法、处理过程和操作均可由一套指令的形式整体或部分地实施，所述一套指令可由一个或更多个已编程的计算机处理器（例如处理器220）执行，包括中央处理单元（“CPU”）或微处理器。所述一套指令可以存储在计算机可读介质，例如存储器222或固定硬盘208上。例如，图3B示出了与图3A相似地存储在服务器103上的一套指令的另一样本结构。

返回图3A，服务器103被示为处理至少两类电子输入数据301：（1）评论数据301A；以及（2）内容数据301B。Web服务用户105可以经由网站、移动应用、书签和/或其用户设备105A、105B、105C和105N上的小工具主动地提交包括评论在内的输入数据301（即评论数据301A和内容数据301B）。例如，书签工具使得用户105能对专门选择的实体贡献评论，或对于Web上的任何网页的贡献评论。该书签工具动态呈现所选择的网页，通过自然语言处理组织文本内的实体，并允许用户对实体、媒体对象或文章内的文本章节贡献评论。用户105可以相似地在现有平台例如社交网络平台上发表评论。在现有社交网络平台上发表评论蔓延性地促进评论网络的增长。

此外，电子输入数据301包括自然语言（例如英语）词汇、自然语言的句子节段、句子以及与自然语言词汇对应的图形/视频/音频。在本文中使用的“自然语言词汇”应当被理解成包括自然语言的短语（例如“在月球上”）。针对与自然语言词汇对应的图形/视频/音频，可以使用公知的图形处理、光学字符识别、音频处理（例如语音识别和语音文本分析）和视频处理来将各种评论数据翻译成电子输入数据301。

评论捕获服务器103经由应用编程接口（“API”）将电子输入数据301传送给核心服务引擎302。该接口使得用户105能迅速并容易地为精确的数据和准确聚合创建评论结构。API描述了执行特定任务的方式，且是作为通过软件部件之间相互通信的接口规范。API可以包括程序、数据结构、对象类和变量的规范。每个规范都可以包括完整的接口、单一功能或一组API。API的使用已成为本领域技术人员公知，并已被本领域技术人员掌握。

由于输入数据301包括来自各种源的评论，用户105通常以多种结构提供输入数据301。例如，输入数据301可以是高度结构化的（例如经由Last.fm的评论）；然而，在其它情况下，输入数据301缺乏一致的结构（例如经由的评论）。在一个实施方式中，受控自然语言界面可以引导用户105以结构化的机器可读形式捕获并模型化作为输入数据301的人类评论。自然语言界面从输入数据301中提取评论的精华，而不使其内容贬值或对其表达性施加显著的约束。用户105可以根据自然语言界面或通过使用预定义的语法通过引导输入流主动构建其评论。

在一个示例中，用户105通过他们的用户设备105A、105B、105C和105N上的Web浏览器将评论(comment)提交给服务器103。服务器103提供包含有预测性文本和/或“自动完成”技术的评论输入界面。用户105可以在网页上或在移动设备的应用中的文本输入框中键入开始的若干字母。作为响应，可以呈现包括存储的实体和评论词汇组合的自动完成选项。用户105然后可以决定完成词汇或使用自动完成建议。作为具体示例，如果用户105输入实体词（例如“火车”），则服务器103将需要评论词（例如“爱”或“恨”）应用于实体。服务器103从与该实体结合使用的前5个热门评论词或者用户105频繁使用的评论提供自动完成建议。相似地，如果用户105输入了评论词，需要服务器103为此提供实体，服务器103将从用户的评论图中选择与该评论词一起使用的前5个热门主题（例如，在用户105的评论图中，当用户105输入“爱”字时，呈现影片和相机），以下将参照图6对此进行进一步讨论。相应地，引导用户输入提供了可以直接馈送给评论图并连接至相关实体、用户105和评论的评论结构。

为了创建结构化的评论数据，服务器103的一个示例性评论输入界面可以捕获每种评论的以下因素：

对象：这是评论表达的实体。这些对象在实体图中被唯一标识并彼此相关。对象链接至公开的数据集例如Freebase（因而链接至链接公开数据图），从而被持续更新和扩展。该对象也可以为地理位置（例如城市或邻近区域）或场所（例如饭店、咖啡店、酒吧、公园、景点等）。此外，用户105可以上传随后变成数据库302B中的对象的照片或视频，或者用户105可由超链接（例如文章、视频、网页等）引用Web上的现有资源。

主体：即评论给出者（即用户105）。服务器103可以从社交媒体平台上的评论给出者的现有简档、Web上的动作、位置和简档信息中提取数据，以将关联性/细节添加到所呈现的数据。系统中的用户105可以为个人、团体、组织或公司。

感情：评论内的主观性内容（即评论词的含义）。服务器103可以捕获该词和相关词的语义含义（例如同义词、反义词和上位词）。在一个实施方式中，感情源自词汇数据库（例如WordNet）的链接，该词汇数据库对概念进行语义性地聚类并使所述概念与上位分类学相关联。例如，感情可以引用一个或更多个同义词组。同义词组是一组同义的或具有足够相似含义的评论词。

强度：即评论表达的强度。强度在向服务器103输入评论时通过作为评论输入用户界面（“UI”）一部分的强度滑动条捕获或通过文本的自然语言分析来捕获。包括固有强度的词被标记在功能表中，但是更一般的情况是强度源自特定修饰语（例如“很”），该特定修饰语沿着强度谱映射其功能。

偏向性：这是指当与各个评论词比较时作为整体考虑否定和修饰语的评论本身的观点偏向性。所有功能均存储在数据库中并用在先偏向性进行标记（即，所有功能包含例如来自手动注释的数据集的固有观点数据）。然而，服务器103还可以基于使用的修饰语或与其相关的实体来改正评论的整体偏向性。

上下文：这是指在Web上表达评论的位置。上下文可以为网页或在Web上标识的文章/媒体项。上下文还包括对另外评论的反应。上下文可以形成评论图内的节点，以使得用户105能够看见哪些评论被所述特定网页提示。

条件：评论可以使用随后跟随自然陈述语言的修饰触发词（例如“因为”或“当”），用来为评论添加额外元数据。

原因：这是指附加至评论以提供附加理由或对所表达评论解释的自然语言评价(comment)。用户105可以表达支持一个评论的多个原因。

评论输入界面还提供随着时间对围绕某一观点的讨论进行建模的能力。例如，服务器103在用户105对另一个用户105作出反应时检测他们持相同还是不同意见及评论反应和由此产生的所采取的动作。服务器103隔离提示评论变化的时刻，并将该时刻附加至含义，而不是跟踪来自Web的特定字符串的频率。这便于形成关于谈话的根茎评论网络系统100，其智能随时间增长并具有广泛用途。

如以上提及的，可以设置受控自然语言界面在输入评论时引导用户并强制特定结构。在优选实施方式中，该受控自然语言在资源描述框架（RDF）三元组上进行建模。RDF是Web上进行数据交换的标准模型，容易学习和理解。通过示例，受控自然语言界面可以将评论编码成各种形式，包括但不限制于：

状态：[用户105]：[形容词]

例如：“高兴”

状态形式捕获用户的情绪或自身感受。这类表达包括单个词，该单个词通常具有“我感觉……”的前缀，并通常之后跟随状态形容词。

意图：[用户105]：[动词]：[名词短语]

例如：“爱：沙拉三明治”

意图形式捕获用户105关于对象的意图的表达，并通常包括表示感情的动词例如“爱”或“恨”。

属性：[用户105]：[名词短语]：[形容词]

例如：“伦敦：令人敬畏的”

当用户105将属性或描述赋予对象时生成属性形式。

联系：[用户105]：[名词短语]：[动词]：[名词短语]

例如，“核电站：降低：全球变暖”

例如，“George Bush：摧毁：伊拉克”

例如，“Obama：应当赢得：美国选举”

当用户105使用动词联系两个对象时即生成联系形式，从而使得所述联系形式支持的陈述成立。

这些基本结构是可扩展的，并响应于用户105的动作而不断演化。例如，用户105可以使用触发词将条件添加至其评论，该触发词被预定义或以解析方式提供围绕这些陈述的附加信息。这可包括对评论（例如，“讨厌：下雨时的伦敦”）或评论原因（例如“讨厌：多雨的伦敦”）的有效性的时间限制或地理限制。如果特定（即未知）的触发词变得在统计上显著，则服务器103则提升触发词，关于触发词的相似条件被聚合，使得修饰词通过用户105的交互不断演化。

用户105还可以对评论的单个成分施加修饰词（例如，“讨厌：缓慢的火车”或“红色的iPod：闪耀”）。附加的评论结构包括从属或者起协调作用的连词，该连词将多个评论结合在一起或相互依赖。

可替代地，当用户105不通过受控自然语言界面引导时，评论捕获服务器103被配置成将非结构化的自然语言输入数据301翻译成前述结构。因此，所述核服务引擎302包括用于将电子输入数据301翻译成统一模型（例如借助于受控自然语言界面的约束）的评论编码模块302A。

在一优选实施方式中，图4示出了用于翻译可以由评论编码模块302A执行的输入数据301的处理4000。如图所示，评论编码模块302A接收通常包含自由格式文本的输入数据301（动作框4001）。将输入数据301进行令牌解析以获得单个词汇、短语、符号或其它令牌元素（动作框4002）。一旦被令牌解析，对令牌进行归类使得评论编码模块302A可以将不同词汇形式映射为结构化的词典（动作框4003）。相关地，归类后的令牌通过部分发言（“POS”）标记器运行以识别关键的动词、形容词以及施加所述动词、形容词的实体（例如名词）等（动作框4004）。从评论提取的实体（例如名词短语）（动作框4009）通过上下文消歧引擎32B运行，以基于领域识别和在所述领域内的词汇的统计频率对词或实体的正确定义进行分级（动作框4010）。将这些分级后的实体映射为实体词典数据库32C（动作框4011）。

根据POS标记器（动作框4004），动词/副词/形容词一起结合到它们修饰的适当POS（动作框4005）。在一个实施方式中，词干分析器随后将每个动词/副词/形容词简化为其词根（例如“fishing”、“fished”和“fishes“均简化为“fish”），以便于对每个词的变型进行映射（动作框4006）。然后将每个词根映射到在数据网络101上可访问的数据库（例如，数据库302B或第三方数据库，例如Freebase）（动作框4007）。映射至第三方数据库为Web上的相似主题提供了即时引用，从而向用户105提供与评论主题相关的附加资源的即时访问。使得多个评论结合在一起或彼此依赖的连词（从属或并列的）（动作框4008）也反应在由此生成的结构化的评论中（结束块4012）。

作为附加输入301源，来自Web上其它地方的结构化评论可以被翻译成网站内的特定评论并由用户105所主张。例如，用户105可以将来自“digg.com”的“喜欢”（“likes”）或“挖掘”（“dig”ed）的文章转换为结构化的评论。用户105向服务器103提供身份凭证（例如用户名和密码）以访问用户105的“喜欢”或“挖掘”的项。一旦被解析和标示后，定位和消歧引擎32B即识别实体、消歧并基于对应网页（例如的网页或项）将评论实体映射为Freebase主题。可以基于消歧方法对每个识别的实体维持置信度。然后使用置信阈值滤除置信低的输入评论。可选地，可将建议的评论呈现给用户105，进行手工滤除/选择。可以针对基于主题的服务提供相似机制，其中用户105可以输入肯定或否定的等级，例如消费媒体/产品评价（例如last.fm,和）。这样使用户105能够在一个位置集中观看在多个平台和多个网络上表达的、被他们收集的评论。

回到图3A，可以从各个网页（例如新闻流）提取内容数据301B以做相似处理。内容数据301B填充实体词典数据库32C在全球且以每特定领域建立各个实体的热门度分级。可以在离线处理模块302C中执行本分析。在一个实施方式中，可以使用多种API服务执行此离线处理，包括Freebase、Extractomatic和定位引擎32B（例如CASE）。

定位和消歧引擎32B采用统计方法及语言解析器识别输入数据301中的相关实体，并基于找到给定术语的上下文来选择该给定术语的适当消歧。定位/识别相关实体创建在原始源输入（例如网页或文章）之上的元数据层，其随后使得可对各个定位的实体进行消歧。然而，除了该基于领域的上下文消歧之外，消歧的关联性还受评论图的影响，总体上在系统100内和在Web上创建根据实体的动作分级的相关热门实体词典。相应地，定位和消歧引擎32B可以帮助用户105表达关于在用户105阅读的文章或网页（例如网页）中表达的主题的评论，输入关于实体和评论的统计以改进系统100的背景关联性统计（例如，在给定时间通常世界上实体和评论词的关联性，而不是特定于特定用户105或评论的上下文），并且基于来自Web（例如新闻流）的定位实体来自动创建在实体词典数据库32C内的实体集合。

还可以对与用户105相关联的内容（例如使用书签工具定位的数据或在上分享的“tweet”）执行相似的分析。除了上述的文本内容之外，内容301B还可以从包括以下各项的组中提取：机器可读标签、元数据、图像、外部数据API及其组合中提取的数据。图5描述了非结构化输入数据301的示例性主题定位处理5000。

在图5中，非结构化输入数据301（起始框5001）首先通过“可读性”风格工具（例如CASE）进行处理以检测输入301的识别数据（例如主标题、描述、作者等）（动作框5002）。然后输入数据301通过自然语言处理（NLP）引擎运行以提取关联部分。与处理4000相似，对非结构化输入数据301进行令牌解析（动作框5003）并归类（动作框5004），并将可变词形式映射为结构化的词典。相结合地，服务器103使用POS标记器（动作框5005）识别关键动词、形容词以及应用所述动词、形容词的实体。当标记后，提取识别的实体（例如名词短语）以定位服务器103中的现有主题（动作框5006）。服务器103针对识别的实体的任何匹配别名在实体词典数据库32C中对于每个实体运行查询（动作框5007）。别名表示便于搜索或实体定位的实体对象词的不同形式（例如“英式足球”可以将“足球”作为别名）。针对任意匹配（决定框5008），将反映当前实体的新别名存储在数据库32C中（动作框5015），并更新实体的使用频率（动作框5013）。然后在数据网络101（例如Freebase）上可访问的（动作框5009）可替代数据库中搜索非匹配的别名（决定框5008）。如果在可替代数据库中找到任何匹配（决定框5011），则更新实体的使用频率（动作框5013）；否则，在可替代数据库和数据库32C二者中创建新项目（动作框5012）。将从动作框5002中提取的识别信息与实体相似地存储（结束框5014）。

当在处理5000中定位了主题后，服务器103可以使用消歧引擎32B基于检测到的领域或输入数据所属的类别可选地对主题进行消歧。具体地，为了检测领域或类别，整个网页的实体根据文章的关联性按顺序分级，以下对此进行进一步描述。如前提及的，基于关联主题/领域的持续反馈会随时间增强消歧结果。

在将输入数据301翻译成统一的结构化模型后，可以将从该模型提取的节点插入核服务引擎302内的数据库302B中。如讨论的，这些评论结构可以对应于受控自然语言，创建评论分析的框架和词汇表。在评论分析的一个实施方式中，捕获围绕评论上下文和语义数据使得服务器103能够填充并导航评论图。评论图是由主观性陈述连接的实体网络。该评论图可以包括到Web上相似的关联主题的映射，从而覆盖例如来自链接公开数据的发展中的结构化Web的实体。链接公开数据项目指用于结合云计算公布和连接Web上的结构化数据的一组公知最佳实践。

可以从评论图内的任意节点的角度来有利地研究评论图，任意节点的角度包括用户105、功能、实体、观点、上下文和强度。在一个实施方式中，评论图包含3个子图：（1）包含用户105间的关系（例如好友的好友）的社交图；（2）包含相关词间链接的功能图；以及（3）包含实体之间的语义关系以及接到链接公开数据云的链接的实体图。评论图600提供了用户105和实体之间的方向关系的附加优点（例如，将评论应用于实体）。以这种方式定义关系使得便于分析评论（例如对相似用户进行聚类等）。图6示出了根据本公开内容的至少一个实施方式的样本评论图600。

如图所示，评论图600（即，结构化的评论“Helen:爱:Barack Obama”）包含3个子图：社交图601、功能图602和实体图603。社交图601为从用户105“跟随”或“赞成”系统100内的其他用户105时创建的异步关系得出的社交网络。当用户105加入系统100时，他们还可以选择引出/输入来自各种社交网络平台的关系。已知的社交网络平台的示例包括但不限于图6描述了具有别名“Helen”的用户105的社交图。

功能图602是按照语义类别由词汇的丰富聚类组成的内置词典。功能图链接至词汇数据库（例如WordNet），该词汇数据库提供了功能间的连接以与其它语言（例如“爱”）等价词汇之间的连接。功能及其等价词汇提供了使得能够聚合评论的语义聚类。每个功能均存储在数据库302B中并如上所述（当适用时）使用偏向性和强度得分对其进行标记。

实体图603示出了应用评论的所提取的实体（例如“Obama”）之间的关系。每个实体通过表达它们的评论来连接。如前提及的，实体在服务器103中被唯一标示并链接至在数据网络101（例如Freebase）上可访问的公知数据库中的等价实体。这提供了对链接的公开数据图中的对象之间的丰富语义链接的访问，并且其可被持续更新。除了结构化关系之外，对实体进行分类使得例如可以示出给定实体的配偶、出生地或职业。实体图603不仅将“Obama”结构化地链接至反应“爱”的评论，而且基于职业和配偶来对Obama进行分类。可以利用这些关系激活建议引擎并添加至关联性的计算。

实体图603还可以反应从Web提取的趋向性主题。RSS聚合器32A提供了消歧引擎32B，主题从Web提取（例如RSS馈送）。引擎32B通过统计按每个领域对实体进行的分级，以提供用于给定实体的特定消歧的基本关联性，从而使得能够分离热门组的实体。分析从RSS聚合器32A提取的数据使得用户能够研究源自查询实体图和来自RSS聚合器32A的统计分析二者的实体集合。例如，实体集合可以包括“在伦敦当前流行的书”或“在政治上最受欢迎的人”。最终，用户105可以通过将任何查询表达到评论图中来生成集合（例如“最激烈争论的电影”）。

因为输入数据301包括来自上述多个环境和网络的大范围的评论，所以服务器103被配置成为得到准确和全面的评论概要聚合跨多个平台的相似评论。用户105可以向任意网络发表评论结构和相关联的数据，增加系统100增长的范围。根据相似思想聚集的用户105的团体被称为“cosm”，其中包括为所述评论做出贡献的所有用户105。当用户105发表评论时，他们与所述“cosm”的其他成员一起的进入一个隐含的组。评论图600示出了一个“macro-cosm”604，其为对给定实体的所有相似态度（例如都喜欢Obama的用户105）的聚类或是所有相似类型的对象/实体的聚类。相反，“micro-cosm”可以示为包括针对给定评论表达的所有特定原因。用户105还可以选择将特定的“cosm”分享至选择的用户105或在另一个“cosm”内的用户105，以结构化地链接非相关的评论。随着时间的推移，创建了包含具有大体相似的观点用户105的“cosm网络”，根据该“cosm网络”形成了其他社交团体。相应地，服务器103提供了如下附加优点：图形分析，以及容易地对来自不同平台的大量评论数据进行导航。

例如，任何组织、政党、团体或个人可以组成“cosm网络”以拓宽他们的支持基础或向特定目标利益团体宣扬其竞选活动。其他用户105可以围绕特定观点聚集，并基于表达的评论采取集体或个人行动。广告商相似地可以根据关于他们自己的产品、服务、兴趣范围等的评论等来创建或选择特定的“cosm网络”，以直接与具有特定相似兴趣的听众群体进行沟通。可以进一步根据听众群体的各个成员的地理位置、特定评论或人口统计信息（例如年龄或性别）来筛选该听众群体。以这种方式，广告商可以选择向例如对滑雪陈述了肯定评论并居住在英国的听众群体的所有成员展示广告。在一个实施方式中，用户105必须选择参加“cosm网络”。

因为每个评论均被聚合到“cosm”，服务器103还被配置成（例如经由电子邮件、移动设备、应用等）通知其评论被聚合的相应用户105：他们的评论已经被计数并发表。在一个实施方式中，该通知包括发表的聚合评论的位置链接，使得用户能够观看他们提交的评论的相关影响。因此，对用户105的该持续反馈提供了如下优点：将新用户吸引至新位置（例如网页），以增强评论被听到的机会并建立新的关联听众。

为了计算评论相似度——例如为生成“cosm”，服务器103可以利用存储在服务器103处的评论词汇的语言理解及使用模型的统计分析（例如数据库302B或32C）。将存储在服务器103处的词汇映射为词典数据库（例如WordNet）以提供词汇间的语义关系。例如，图7示出了根据本公开内容的至少一个实施方式的示例性语义关系700。语义关系700包括反义词701、同义词702、上位词703、下位词（未示出）和特定词汇的相关形式。另外，至词典数据库的映射还提供至其它语言的等价词汇的链接以用于克服语言限制。服务器103可以沿着感情谱映射情绪词汇，这使得用户能够在特定“macro-cosm”内清楚地看见评论的范围。随时间流逝监视词的使用，以使服务器103针对给定实体来根据统计提供适当建议的评论词，如之前针对输入数据301讨论的，或响应于另一个评论词。

服务器103还可以基于用户105的动作来学习。如果一个未知词重复地作为对另一词聚类的反应或结合该另一词聚类重复使用，则服务器103可以推断词汇之间具有可以作为聚合基础的强链接。以这种方式，新词被持续地采纳入服务器103的数据库（例如数据库302B、32C），且内置词典可以与系统100外部的自然语言趋向一样有机地演化。

在可替代实施方式中，服务器103可以基于评论对象内的词汇的共现性使用统计技术来改进词汇聚类和语义关系的准确性。例如，词A和词B通常一起使用（例如通过用户形成的评论）。如果词A和词C被相似地一起使用，则服务器103可以推断出词B与C之间存在一定关系。然而，可以使用在机器学习和数据挖掘领域内公知的针对聚类和聚合的任何相似的统计技术。相似地本领域的技术人员应当理解，该处理可以应用于例如表示较长时间段内的较长讨论的、至服务器103的用户提交评论数据和从文本及网页的语料库中推导出的评论数据。

而在另一个可替代实施方式中，词汇和观点/偏向性得分之间的关系推导可以包括手动分级和样本集处理。多个手动分级得分被平均以计算出“群体智慧”。为了便于该处理，可以使用在Web服务方案中的公知的人工智能，例如来自的土耳其机器人。

存储在数据库302B、32C中的评论词汇还可以被紧密地结合至产生于特定“cosm”的建议动作。用户105能够建议与评论相关的动作，使得用户105能够根据系统内激发并表达的观点来行动。在一个示例中，用户105可以为组织或公司，其可以“赞助”被建议到特定“cosm”的动作。服务器103通过统计分析服务器1033内外的词汇使用模型以指示可以结合至评论的潜在动作。

在可替代实施方式中，当基于领域识别（即经由消歧引擎32B）对结构化的评论分级并图示（例如图5）后，服务器103被配置成向特定用户105建议/推荐适当的内容和评论。关联性分级还使得用户105能够针对结构化的评论搜索实体、评论、评论关键词以及其他用户105。具体地，关联性引擎303包括在服务器103中，用以计算特定词汇与实体（例如图的节点）彼此的关联性以及与特定用户105的关联性。关联性引擎303针对其一般的关联性或与系统100中的活跃用户105的特定关联性检查被插入数据库302B、32C中的每个统一的结构化节点。该处理可以应用于实体、cosm、评论、评价(comment)、用户105、媒体、内容等。用户105输入还可以针对特定领域或应用定制关联性参数。

在一个实施方式中，基于用户特定网络的动作来计算每个用户105的关联性。例如，关联性可以基于以上创建“cosm网络”反应用户105的思想。基于这种关联性的推荐通常以用户105的社交图601为中心。如上所述，用户105还可以从各个社交网络平台引出/输入关系，这最终使得用户105能够在集中位置中接收来自多个社交网络平台的推荐。

针对系统100中的每个用户105，关联性引擎303隔离它们的评论图600内的节点以根据n维矩阵计算各个得分，其中每个维度表示不同的关联性参数。这些参数包括但不限于实体的类型/领域，“Soc分级”（即基于由用户105的社交网络作出的评论在社交图中的权重），“Cosm分级”（即基于由用户在过去作出的评论在评论图中的权重），“网页分级”（即基于以下文章中的文本的匹配，用从手动输入或第三方数据库得到的实体描述对该文章给出评论，以创建用户评论的基于文本的表示），“地理空间分级”（即基于作出评论的地理位置），“趋势分级”（即将来自跟随者和影响者的评论/实体节点分为高于其他评论的级别），“跟踪分级”（即当用户可选地进行跟随/跟踪时将特定用户、实体和类别分为更高级别），将相关实体和类别分级，以及“评论动作分级”（即更高分级反应更大动作，例如响应）。还可以使用用户105的输入将分级参数指定至服务器103。在优选实施方式中，向前述参数中的每个分配在1-10内的数值范围上的权重。

在一个实施方式中，关联性引擎303在用户105交互的点处以离线处理方式计算关联性得分。可以针对新参数添加任意数量的得分，例如新参数是基于新关系或时间信息的数据。图8示出了当关联性计算的离线处理800被添加至在评论图600中的特定节点的分级时用户105交互的各个点。

在可替代实施方式中，紧接着用户105提交新评论后，关联性引擎303从评论图600中检索关联性节点。这些节点被聚合作为“评论结果”呈现给用户105。直接由于当前提交的评论，“评论结果”向用户示出在评论网络中跟随的许多连接和值得关注的路径。这些连接和路径可以包括但不限于关联实体、用户、评论、动作、文章或其组合。

如已讨论的，电子输入数据301包括一般性/全球性的主题801、用户提交的信息802和各个评论流803。通过分析在新闻/遍及Web（例如经由RSS新闻提供者）中的文章801A，处理800从文本定位实体，填充实体词典数据库32C，且根据实体在全球热门的程度来对每领域中的各个实体进行分级（例如使用定位和消歧引擎32B）。相似地，服务器103对一般性/全球性类型的流行实体801B（例如流行的主题）进行解析和消歧，以计算出基于全球趋势的分级得分。

还针对如下用户105提交的信息802进行关联性计算，包括：用户提交的URL802A（即用户105在特定网站上直接表示他们兴趣的地方）；用户共享的URL802B（即，用户105与其社交网络的其他用户105分享链接的地方）；从Web上的其它账户提取的用户105的动作803C（例如，在Last.fm上播放的痕迹、在Amazon.上购买的书或来自的电影）。服务器103对这些实体进行匹配以生成背景关联性数据。

当用户105在服务器103内主动地创建实体802D时，服务器103还被配置成生成可能与用户105具有关联性的相关实体，例如通过语义关系。用户105还可以激活文章或发帖上的书签802E以使得服务器103记录上下文（即领域名）并相应地添加分级。文章801A、用户提交的URL802A、用户分享的URL802B和书签802E文章通过定位和消歧引擎32B来运行（动作框704）以基于上下文识别相关实体并进行消歧。

另外，图8描述了在评论流输入803期间获得的关联性计算，其中包括用户表达情绪的主题、在用户105的社交网络上流行的主题和评论以及在用户的104“cosm”网络上流行的主题和评论。因此，关联性引擎303不仅生成在单个网站内的建议，而且基于生成的评论图600计算特定类型的推断出的兴趣和关联实体。在用户105交互的每个点处，分级计算创建了包括关于评论图600中的节点的适当元数据（例如位置和时间戳）的得分的全矩阵805。该矩阵805可以在用户105的用户设备105A、105B、105C和105N上向用户105显示以被进一步检查从而修改各个被对处理实体计算出的关联性得分（动作框806）。对关联性得分的任何修改均反馈给服务器103以适于用户105的特定偏好。例如，如果用户105选择忽略或“罐装”在他建议的主题/评论中出现的实体，则服务器103利用相关数据降低相似的建议/分级项的等级。相应地，仅向特定用户105本人定向显示关联实体/评论/主题807。通过以这种方式捕获评论和数据，服务器103帮助人们实现了结构化的Web评论驱动的关联性。

基于所计算的关联性得分，用户105还可以浏览并发现还未建议的新的关联内容。当用户105在文章的上下文中进行评论时，例如，服务器103可以向用户105提供针对唯一关联内容建议作出评论的其它源（例如，文章和其它上下文）。相反，用户105可以相似地浏览特定内容提示的其它评论。

在一个实施方式中，当用户105查看关于实体的特定信息或评论时，可以显示有可能也符合用户兴趣（即基于关联性得分）的相关联的和相关的实体。相应地，从一个实体到另一个实体的关联可以来自多个源，例如上述的文本匹配。然而，可以根据手工监护的关联（例如监护人或管理面板）来编译两个或更多个实体的关联。基于在先提交的评论的上下文形成两个或更多个实体的一些关联，这形成了两个或更多个实体之间的双向关系（例如，关于主题“足球”的新闻文章评论将形成“足球”与文章之间的双向关系）。虽然如此，可以响应于不同主题的评论形成实体间的关联，从而形成双向关系（例如，如果关于“蛋糕”的评论收到“油炸圈饼”是“更好的”的评论响应，将创建“油炸圈饼”与“蛋糕”之间的双向关系）。这些关联是基于流行度、语义等来得分和分级的。在一个实施方式中，可以在实体图603中可反应关联。

当输入数据301被翻译成统一的结构化模型、成图并根据关联性得分进行分级时，生成的评论网络使得用户105可以与大量的评论数据进行交互。用户105能够更好地理解团体对于来自跨Web的多个平台的特定实体、产品、商标或议题所说的内容。更具体地，用户105可以选择理解来自具有相似兴趣的想法相似的用户的评论/推荐，这可以增加购买倾向并促进消费交易。作为另一个示例，捕获结构化的丰富评论数据使得公司能够发现关于在各个等级聚合处被映射和组织的具有相关联原因的其产品或商标的特定评论。因此，可识别出各个评论给出者和趋势，包括关键影响者和评论领导者，而用户和公司可以直接与支持者、客户和批评者合作。

在一个实施方式中，该数据可以在用户设备105A、105B、105C和105N上向用户105显示。具体地，用户105可以访问来自他们的用户设备105A、105B、105C和105N的Web服务102。Web服务102可以包括各种网站例如社交网络平台、媒体网页、博客和电子商务网站。然而，诸如由评论捕获服务器103处理的评论数据使得用户105能够体验作为评论增强的Web服务104的Web服务102。用户105请求访问评论增强的Web服务104（例如经由Web浏览器）以观看评论图600、浏览社交网络、接收推荐的评论和产品（例如目标广告）、分析认知/语言数据等。

除了浏览丰富的评论网络之外，评论增强Web服务104提供了跟踪命题、辩解、响应、决定和响应于评论采取的动作的谈话模型。作为具体示例，可以以辩论的形式来呈现评论。当对于使用来自两个或更多个相反词集（例如具有相反含义的词集）的功能词的特定实体存在至少预定义（即可配置）阈值数量的评论时，识别出辩论。可以用来自与实体相关联的每个词集中的被频繁使用的评论词汇来命名辩论的不同方。可以将辩论通知给对所识别的辩论作出评论的用户105。

鼓励用户105与评论增强Web服务104进行交互（例如参加评论网络的交互流）以促进系统100的增长。在一个实施方式中，用户105可以邀请好友和其他用户参加他们的社交网络并参加一个或更多个评论流。例如，当看见某一评论时，用户105可以选择以如下至少三种方式对评论作出响应：（1）同意/不同意；（2）问“为什么”以及（3）评论。如果用户105选择同意或不同意，则还提供生成新评论选项。该新评论维持与原评论的链接（例如存储在数据库302B中并反应在评论图600中的同意/不同意关系）。针对原评论词，以上讨论的受控自然语言界面提示同义词（即在同意的情况下）、反义词（即在不同意的情况下）或自由形式评论指导（即在以“问为什么”来响应的情况下），来帮助用户105为他们创建新评论提供结构化的输入。可以使用所选择的评论词来阐明与原评论词的语义关系（例如同义/反义）的置信度。然后通知原评论的作者：另外的用户105已经回复了他们的评论。

相似地，可以在用户105中分享特定评论。例如，用户105A选择对特定实体分享评论或征求评论。用户105A选择与用户105B分享评论。分享通道包括但不限于社交网络平台、电子邮件和短消息服务（“SMS”）通信。例如经由电子邮件、SMS通信、向用户设备105B送达通知或根据用户105B的随后对评论增强Web服务104的请求来向用户105B发送通知。用户105B包括使用服务器103注册的用户以及未使用服务器103注册的用户。用户105B然后（例如经由超链接）跟随通知，服务器103维护用户105A成功提示用户105B访问评价增强Web服务104的历史。用户105B可以按上述方式对用户105A的评论进行类似响应。

为了进一步激励用户105与评论网络进行交互且输入评论，用户105可以因其参与获得奖励。这些奖励包括特别成就、影响分值和获得状态角色。用户105无论何时达到特定里程标则接收成就。成就意在针对特定动作鼓励用户。一些示例包括：第一个针对给定主题发表评价的用户成就；用户详细阐述创建的评价而不怂恿其他用户参与的“单方辩论”成就；用户参与辩论的“辩论”成就；各个阈值的“评论计数里程标”（例如针对单个用户提交的评论数量达到10、25、100等）；针对特定实体/类别的各个评论阈值的“类别里程标”；产生包括超过各个阈值的响应的评论的“原因里程标”；当阈值比率（例如为90%）的对于实体的评论同意用户评论时的“偏向性同意”成就；当阈值比率（例如为10%）的对于实体的评论同意用户评论时的“偏向性不同意”成就；如以下将详细描述的当用户评论不同意思想领导者的评论时的“思想领导者比较”成就；当用户评论不同意针对特定实体的在他们的社交图内的另外用户的评论时的“好友比较”成就。

相似地，使用影响得分来量化在系统100中的特定用户的影响。在一个实施方式中，表1示出了确定影响得分的累加点数：

表1：示例性影响得分计算表

针对在表1中表示的每个动作，影响得分是在预定的时间段（例如120天）内累计的总点数。

与成就奖励和影响得分相似，各个用户105当他们的评论产生了针对主题的最多数量的同意时可以获得“思想领导者”状态。为了成为思想领导者，针对所述主题的同意的数量要超过最小阈值（例如5个用户）并且思想领导者的总影响得分要超过任意其他用户105至少阈值数量个点（例如2点）。在一个实施方式中，当任何用户105观看特定实体主题时，思想领导者被标示-包括思想领导者的特定评论和提出的同意的数量。然而，在可替代实施方式中，关于给定的主题前5个用户105均可以呈现为思想领导者。当存在阈值数量个已经提出至少一个同意的相关联用户105（例如1个用户）时思想领导者即被标示。每个用户105相似地与所述用户获得的思想领导者角色的数量、用户提出的同意的数量以及所述用户可以成为思想领导者的主题的数量（例如3个用户同意以外）相关联。

与“思想领导者”相似，在可替代实施方式中，服务器103可以向特定用户105分配附加角色，这样为该类型用户105的提供了特殊体验。这些角色包括但不限于：

提倡者：征集支持并用作为针对特定评论的“提倡者”个体。提倡者角色使得其他用户105能够有效地添加支持、权重或针对特定评论提倡者用户提供支持，从而使得提倡者用户能够代表其他用户105的利益发表言论并表达情绪。在系统100内可以出现代表，且团体可以形成针对特定评论的民主支持系统。

思想领导者：基于他们在系统100内的特定影响特定用户105可以成为思想领导者。当用户105激励其他用户105给出评论/改变他们的思想时，服务器103通过给予所述用户105相对于其他用户105更大的可见性来奖励他（例如，在cosm网页上突出显示所述用户或提供直接奖励例如徽章）。

管理员：被信托的用户105有能力充当管理员来调节系统100中的数据和行为。管理职责包括调停争论和侮辱行为，修正对实体或功能呈现的现有评论，以及当新词（例如俚语）出现时对其进行映射。管理员可以是民主提升的也可以是基于系统100中的动作以特权奖励的形式授予的。

组：用户105可以创建或加入对于特定观点、实体或上下文而聚集的组。这些组可以由特定组织、公司或个体用户来领导。组由团体和作为聚集器的服务器来管理，激发进一步的交谈和动作。

人物面貌：根据用户105的评论形成的一种隐含组。例如，评论简档可以表示用户105为共和党员、电影迷或爱狗者。这些“人物面貌”还可以形成进入系统的动作或查询的基础，例如基于特定政党中流行的评论而生成集合，或直接与所有动物爱护者分享一个动作或“cosm”。

在任意给定时间，服务器103还被配置成与服务器103的所有用户105进行全球通信。这提供了以下优点：提供与所有用户相关的评论/消息（例如全球的慈善消息，例如流感疫苗通知），从而提出特定原因并教育任意用户105。可以动态公布用户105的评论和反应。

在可替代实施方式中，在输入301的水平提供仪表板工具以通过用户设备105A、105B、105C和105N对评论增强Web服务104进行快速访问。仪表板是意在将评论网络中值得关注的/特定方面显示给特定用户105的显示器。仪表板包括至少一个“工具”，用于提供评论网络的各个概要的Web或应用内容的控制区域。工具通常为可移动或可根据用户105显示器的尺寸或针对客户布局按比例重缩尺寸。仪表板可以出现在网页上（例如来自合作方的评论增强Web服务104和第三方网页）、移动应用设备、电子公共显示器等上。此外，可以将一组仪表板工具来伴随用户做出评论（例如上述评论结果）之后向用户呈现来自评论网络的值得关注信息。例如，电子文章或网页结合有用于集成特定工具的脚本代码（例如JavaScript）。特定工具被唯一地标示并通过API进行通信以处理各个输入评论数据301。本领域的技术人员对仪表板和工具的使用已经熟知并掌握。仪表盘工具使得用户105能够通过例如评论增强Web服务104流畅地做出评论、查看评论、研究用户简档和浏览各个主题。

例如，可以使用仪表板工具显示偏向性的主题类别。类别被定义为实体的语义分组（例如总统们、公共发言人们和人民）。为了使用户105对于提示高度肯定或否定评论的给定类别中的主题进行评论，可以使用仪表板工具来呈现具有最多平均肯定评论或否定评论的给定类别（例如“荒唐的政客”）中的主题。针对给定的类别，仪表板工具可以呈现在具有相似的整体观点的类别中的所有实体的聚类。

在另一个示例中，仪表板工具可以用于单一功能，例如使得用户能够在提交评论时不离开网页。例如，可以将与文章/网页/产品相关的聚合评论紧挨着对应实体/主题作为工具放置（例如挨着文章链接的“夸张”键）。用户105点击所述工具他们对文章的评论自动化。

仪表板工具不仅对提供评论的用户有效，而且对期望聚合评论以及聚合对他们发表的内容做出的响应的公布者和博主有效。例如，公布者工具在文章水平（即发表的内容）工作并在所发表的文本之上创建了元数据层。公布者工具被集成至所发表的文本（即网页源内的脚本）中并包括唯一的识别代码。针对文章的每个评论或评价，所公布的文本的URL与公布者工具的唯一识别代码一起被传送给服务器103。当服务器103接收所述数据后，定位和消歧引擎32B确定来自所公布的文本文章的关联主题/实体（例如使用上述自然语言处理和文本挖掘，而忽略广告）。每个关联主题/实体链接至例如来自第三方数据库（例如Freebase）的任意关联主题/实体，从而将所述主题/实体连接至提供附加信息的相似引用。当读者团体以及文章的作者阅读文章并形成评论时，公布者工具还被配置成检索来自数据库302B的实体列表用于创建聚合视图。相应地，公布者工具提供了以下另外的优点：获得关于文章的上下文、相关评论和其他读者和作者的简档的知识。

仪表板工具还可以非排他地用于：

–基于用户105提交的评论提供对特定用户105的自然语言描述（例如或图形表示）。服务器103确定用户进行根据规范变化的评论的类别并生成每个类别的描述性标签（例如“Dan是个商人和美食家。Dan对产品线或广告网络纵向没有任何评论。”）；

–显示特定定类别/主题中的最热门的争论以鼓励用户105输入。最热门争论是通过对衰退中评论进行计数来确定的，以强调较新评论高于较旧评论。针对每个类别/主题，使用偏向性最强的词描述争论（例如“在伦敦的争论：使震惊/冻结”）；

–查看具有高度偏向性评论的主题。选择预定义数量的最具观点性的主题（即纯肯定或纯否定的评论）（例如“吸烟引发了强烈的否定评论”）；

–查看每实体的最热争论，其中，全球地（或针对特定类别）确定相同肯定词和否定词的衰退频率以查看最多使用这些词的主题（例如：刺激人的想法与可怕：（1）有危险的体育明星；（2）美国风俗；以及（3）立法）；

–查看特定类别内的最热烈争论的主题。针对给定的类别，根据与其评论的观点得分的标准差对实体进行排序（例如词作者：Paul Simon或者Adele）；

–查看在最近时间内的反应最多的评论。通过对响应的数量进行计数和对随时间衰退的系数进行计算（例如“iPhone”或“出生控制”）来计算评论的得分；

–显示每类别来自特定用户的最常使用词汇。针对特定用户，在具有最多提交评论的类别内选择最频繁使用的词（例如，“在组织主题内频繁使用‘令人敬畏的：’Pixar和Arsenal F.C.”）；

–展示用户即持肯定评论又持否定评论的主题（例如“鹅肝酱美味但残忍”）；

–浏览一组相似用户以提供建议主题。使用组中的用户之间的评论主题的重叠和平均观点得分来计算相似度。建议主题为组中的少数未进行评论的主题（例如“用户A-38个同意，用户B-24个同意以及用户C-13个同意：建议关于灵魂和舞蹈交换主题的评论”）；

–示出用户具有一组极端评论的一组主题。具有相似意图的词（例如爱和爱慕）被聚类以选择接收特定词汇的热门实体（例如，最无礼的名人）；

–突出显示当前使用的值得关注的词汇。使用最近使用的词确定来自所述组使用最少的词（例如，“‘和蔼’上次使用在Ernest Borgine身上”）；

–查看特定评论词汇中出现的值得注意的反常数量的急升。通过将关于一个实体使用此词汇的总次数与所述词汇在整体中使用的相反的次数进行比较来计算出现的反常次数（例如，“对老人来说Hurt Locker比NoCountry更沉重”）；

–示出用户105与另一个用户105的相似度。针对两个用户均进行评论的主题，基于评论的相似度来确定相似度得分（例如，“用户C同意你对903个主题中的581个的评论”；）以及

–突出显示具有不同评论的用户105。针对每个实体，确定与对特定主题进行评论的用户的平均值相比较具有最大观点得分差的用户（例如，“用户B的评论反对艺术的成分-知道为什么”）。

图9A至图10D是描述根据本公开内容的至少一个实施方式的用于参加交互式评论流的示例性图形用户界面（“GUI”）方面的示意图。如图所示，图9A至图9J描述了被配置成使用户105创建评论并查看即时结果的示例性GUI。相似地，图10A至图10D示出了一个或更多个用户105之间的评论流的示例性GUI。

在前述说明书中，参考具体实施方式描述了本公开内容。然而，显然可以在不脱离本公开内容的更广的精神和公开范围的前提下进行各种变型和修改。例如，读者应当理解在本文中描述的处理动作的特定排序和组合仅是示例性的，且本公开内容可以使用不同的或附加的处理动作或处理动作的不同组合或排序来执行。例如，本公开内容特别适于分析来自基于Web的服务器的评论数据；然而，本公开内容也可以用于多种评论挖掘系统。另外，很明显可以根据需要添加或删除特征。因此，除了所附权利要求及其等同物外本公开内容不受限制。

Claims

1.一种用于分析电子评论数据的计算机实施方法，所述方法包括以下步骤：

接收电子评论数据，其中，所述电子评论数据包括自然语言词汇；

将所述电子评论数据映射成统一评论对象，其中，所述统一评论对象提供为受控自然语言，且所述统一评论对象包括实体对象、评论词对象和主体对象，所述评论词对象中的每一个对至少一个所述实体对象进行描述并表示至少一个所述主体对象的评论；以及

提供呈现，该呈现具有与至少一个所述统一评论对象对应的至少一个部分。

2.根据权利要求1所述的计算机实施的方法，还包括对评论图中的所述统一评论对象进行分级，其中，所述评论图表示所述主体对象与所述实体对象之间的方向关系。

3.根据权利要求2所述的计算机实施的方法，其中，所述评论图包括社交图、功能图和实体图。

4.根据权利要求2所述的计算机实施的方法，其中，所述呈现包括评论结果集合，其中，所述评论结果集合是根据所述评论图的分级的相关统一评论对象的集合进行聚合而成的。

5.根据权利要求4所述的计算机实施的方法，其中，所述分级的相关统一评论对象与所述统一评论对象共同地具有实体对象、主体对象和评论词对象中的至少一个。

6.根据权利要求4所述的计算机实施的方法，还包括接收来自所述数据网络上的一个或更多个用户设备的响应，其中，所述响应基于所述评论结果集合。

7.根据权利要求1所述的计算机实施的方法，还包括基于统一评论对象的聚合来确定cosm。

8.根据权利要求7所述的计算机实施的方法，其中，所述cosm是根据所述统一评论对象的结构而构造的。

9.根据权利要求1所述的计算机实施的方法，其中，所述统一评论对象具有选自包括以下结构的组：（1）状态结构；（2）意图结构；（3）属性结构；以及（4）关联结构。

10.根据权利要求1所述的计算机实施的方法，其中，将所述电子评论数据映射成所述统一评论对象的步骤还包括识别所述电子评论数据中的动词、形容词、连词和名词短语。

11.根据权利要求1所述的计算机实施的方法，其中，所述自然语言为英语。

12.根据权利要求1所述的计算机实施的方法，其中，所述电子评论数据包括所述自然语言的句子的节段。

13.根据权利要求1所述的计算机实施的方法，其中，所述评论数据是从多个基于Web的社交网络平台接收的。

14.根据权利要求1所述的计算机实施的方法，其中，所述接收电子评论数据的步骤还包括扫描至少一个网页，以及其中，所述映射所述电子评论数据的步骤还包括基于所述电子评论数据的上下文对所述至少一个网页上的实体对象进行定位。

15.根据权利要求1所述的计算机实施的方法，其中，所述电子评论数据选自包含以下各项的组：（1）统一资源定位器（“URL”）；（2）图形文件；（3）视频文件；以及（4）音频文件。

16.一种用于分析评论网络中电子评论数据的基于网络的系统，包括：

评论捕获服务器，所述评论捕获服务器可通过数据网络进行访问；

一个或更多个用户设备，所述一个或更多个用户设备被配置成可访问所述数据网络上的评论增强Web服务；

计算机程序产品，所述计算机程序产品可操作地耦接至所述评论捕获服务器，所述计算机程序产品具有计算机可用介质，所述计算机可用介质具有当被处理器执行时使得所述处理器执行分析电子评论数据的处理的指令序列，所述处理包括：

从所述一个或更多个用户设备接收电子评论数据，其中，所述电子评论数据包括自然语言词汇；

向所述数据网络上的所述一个或更多个用户设备提供呈现，其中所述呈现包括与至少一个所述统一评论对象对应的至少一个部分。

17.根据权利要求16所述的基于网络的系统，其中，所述处理还包括对评论图中的所述统一评论对象进行分级，其中，所述评论图表示所述主体对象与所述实体对象之间的方向关系。

18.根据权利要求16所述的基于网络的系统，其中，所述处理还包括从所述数据网络上的所述一个或更多个用户设备接收对于所述电子评论数据的响应。

19.根据权利要求18所述的基于网络的系统，其中，所述响应选自包括下列各项的组：（1）同意；（2）不同意；（3）提问；以及（4）评价。

20.根据权利要求16所述的基于网络的系统，其中，所述评论词对象选自预定义评论词对象的建议集合。

21.根据权利要求20所述的基于网络的系统，其中，所述预定义评论词对象的建议集合基于所述统一评论对象的聚合进行个性化处理。

22.根据权利要求16所述的基于网络的系统，还包括通过可操作地耦接至所述评论捕获服务器的自然语言处理器，其中，所述自然语言处理器被配置成从所述统一评论对象中识别所述评论词对象和实体对象。

23.根据权利要求22所述的基于网络的系统，其中，所述自然语言处理器被配置成基于所述电子评论数据的上下文来识别所述评论词对象和实体对象。

24.根据权利要求16所述的基于网络的系统，其中，所述呈现包括基于所述电子评论数据建议的统一评论对象。

25.根据权利要求16所述的基于网络的系统，其中，所述处理还包括基于所述统一评论对象的聚合来确定cosm。

26.根据权利要求16所述的基于网络的系统，其中，所述计算机程序产品对应于仪表板工具。

27.根据权利要求26所述的基于网络的系统，其中，所述呈现包括基于所述评论词对象和所述实体对象对所述主体对象的自然语言描述。

28.根据权利要求26所述的基于网络的系统，其中，所述评论词对象被表征为肯定、否定或中立的；以及其中，所述呈现包括具有最平均的肯定评论词对象或最平均的否定评论词对象的所述实体对象的分组。

29.根据权利要求26所述的基于网络的系统，其中，所述评论词对象被表征为肯定、否定或中立的；以及其中，所述呈现包括具有至少预定义数量的肯定评论词对象和否定评论词对象的所述实体对象。

30.根据权利要求26所述的基于网络的系统，其中，所述评论词对象被表征为肯定、否定或中立的；以及其中，所述呈现包括具有至少预定义数量的肯定评论词对象和否定评论词对象的所述实体对象，并且其中所述肯定评论词对象的数量以偏向性计数阈值超过所否定评论词对象的数量。

31.根据权利要求26所述的基于网络的系统，其中，所述评论词对象被表征为肯定、否定或中立的；以及其中，所述呈现包括具有至少预定数量的肯定评论词对象和否定评论词对象的所述实体对象，并且其中所述否定评论词对象的数量以偏向性计数阈值超过所述肯定评论词对象的数量。

32.根据权利要求26所述的基于网络的系统，其中，所述评论词对象被表征为肯定、否定或中立的；以及其中，所述呈现包括具有最多数量的肯定评论词对象和否定评论词对象的所述实体对象。

33.根据权利要求26所述的基于网络的系统，其中，所述处理还包括从所述数据网络上的一个或更多个用户设备接收至少一个对于所述电子评论数据的响应，以及其中，所述呈现包括具有最多数量的所述至少一个响应的所述电子评论数据的实体对象。

34.根据权利要求26所述的基于网络的系统，其中，所述呈现包括最频繁使用的评论词对象和其描述的对应实体对象。

35.根据权利要求26所述的基于网络的系统，其中，所述处理还包括从所述数据网络上的一个或更多个用户设备接收至少一个对于所述电子评论数据的响应，所述一个或更多个用户设备各自对应于一个主体对象；其中，所述至少一个响应选自包含下列各项的组：（1）同意；（2）不同意；（3）提问；以及（4）评价；以及其中，所述呈现包括具有最多同意的所述主体对象。

36.根据权利要求26所述的基于网络的系统，其中，所述评论词对象被表征为肯定、否定或中立的；以及其中，所述呈现包括具有针对单个主体对象的肯定评论词对象和否定评论词对象的所述实体对象。

37.根据权利要求26所述的基于网络的系统，其中，所述仪表板工具布置在第三方网站。

38.根据权利要求37所述的基于网络的系统，其中，所述处理还包括当所述评论对象在第三方网站公开时，通知所述数据网络上的一个或更多个用户设备。