CN108363790B

CN108363790B - 用于对评论进行评估的方法、装置、设备和存储介质

Info

Publication number: CN108363790B
Application number: CN201810146882.0A
Authority: CN
Inventors: 范淼; 冯悦; 孙明明; 李平; 王海峰
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2018-02-12
Filing date: 2018-02-12
Publication date: 2021-10-22
Anticipated expiration: 2038-02-12
Also published as: CN108363790A; US11403680B2; WO2019153737A1; US20190287142A1

Abstract

根据本公开的示例实施例，提供了用于对评论进行评估的方法、装置、设备和计算机可读存储介质。用于对评论进行评估的方法包括获取针对目标对象的评论中的一组文本项的第一向量化表示。该方法还包括基于第一向量化表示来提取一组文本项中的至少两个连续文本项的语义特征。该方法还包括确定至少两个连续文本项在评论的上下文中的重要程度，以及基于重要程度和语义特征，确定评论有助于用户评估目标对象的程度。以此方式，可以实现对评论的价值的自动、高效且正确的评估。

Description

用于对评论进行评估的方法、装置、设备和存储介质

技术领域

本公开的实施例主要涉及交互领域，并且更具体地，涉及用于对评论进行评估的方法、装置、设备和计算机可读存储介质。

背景技术

随着网络技术发展，越来越多互联网平台支持用户原创内容(UGC)的生成。因此，用户在许多互联网平台中都可以公开评论特定对象。这样的评论不仅丰富了被评论对象(诸如产品，服务，诸如新闻、视频、短文本等内容)的相关信息，而且也有助于其他用户了解被评论对象的质量、特点等。

由于评论通常由用户自主生成，并非所有评论内容都能够向其他用户提供与被评论对象有关的有用或有价值信息，甚至有些评论可能与被评论对象完全无关。如果被评论对象的评论数量过多，有用评论与无用评论混杂在一起，其他用户难以从众多评论中快速获取有用信息，并且无用信息也不利于提供商或其他第三方对被评论对象的正确评价(例如是否值得推荐的判断等)。因此，期望能够对评论的价值或有用程度加以分辨。

发明内容

根据本公开的示例实施例，提供了一种用于对评论进行评估的方案。

在本公开的第一方面中，提供了一种用于对评论进行评估的方法。该方法包括获取针对目标对象的评论中的一组文本项的第一向量化表示。该方法还包括基于第一向量化表示来提取一组文本项中的至少两个连续文本项的语义特征。该方法还包括确定至少两个连续文本项在评论的上下文中的重要程度，以及基于重要程度和语义特征，确定评论有助于用户评估目标对象的程度。

在本公开的第二方面中，提供了一种用于对评论进行评估的装置。该装置包括表示获取模块，被配置为获取针对目标对象的评论中的一组文本项的第一向量化表示。该装置还包括特征提取模块，被配置为基于第一向量化表示来提取一组文本项中的至少两个连续文本项的语义特征。该装置还包括重要程度确定模块，被配置为确定至少两个连续文本项在评论的上下文中的重要程度，以及评论评估模块，被配置为基于重要程度和语义特征，确定评论有助于用户评估目标对象的程度。

在本公开的第三方面中，提供了一种设备，包括一个或多个处理器；以及存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现根据本公开的第一方面的方法。

在本公开的第四方面中，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现根据本公开的第一方面的方法。

应当理解，发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

附图说明

结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标注表示相同或相似的元素，其中：

图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图；

图2示出了根据本公开的一些实施例的对评论进行评估的过程的流程图；

图3示出了根据本公开的一些实施例的用于对评论进行评估的学习网络的架构的示意图；

图4示出了根据本公开的实施例的用于对评论进行评估的装置的示意框图；以及

图5示出了能够实施本公开的多个实施例的计算设备的框图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

在本公开的实施例的描述中，术语“包括”及其类似用语应当理解为开放性包含，即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

如以上提及的，期望能够对特定对象的评论的价值或有用程度加以分辨。在当前应用中，许多展示评论的平台(例如互联网网站)都通过众包方式判断某一条评论的价值，即鼓励其他互联网用户人工对评论的价值进行投票。然而，由于这需要浏览评论的用户的额外工作，统计发现，获得用户关于价值的标注的评论的比例较低。通常较为常见的是，评论者(例如，购买某个产品或服务的用户)根据满意程度对产品或服务进行主观评分(例如，1到5颗星的主观评分)。其他用户对评论本身的价值的标注往往较少。

此外，通过众包方式进行价值标注的方案还存在另一问题。对于一些畅销或热门的产品、服务或内容，可能会吸引大量用户参与评论以及对评论的价值做出标注。然而，对于新上线或较为冷门的产品、服务或内容，短时间内可能难以通过众包方式快速收集到关于评论价值的人工标注(投票)。对于特定平台而言，畅销或热门的产品、服务或内容往往只占一小部分，绝大部分对象仍然分布在不被关注的“长尾”。

虽然已经研究出一些评估方案用于对评论的价值进行自动评估，这些方案仍很大程度上依赖于大量的语言学分析工具。具体地，很多方案首先利用不同语言学分析工具对留言进行文本分析，人工选择并且提取不同层面的特征(评论文本的词性标注、语法、情感、语义特征等等)；然后利用这些人工定义的特征训练支持向量机(SVM)、随机森林(RandomForest)等机器学习分类模型；最后将训练好的模型应用于留言价值的鉴别判定。

可以按所提取的特征层面不同对这些方案进行划分。一些方案基于评论文本的外在结构特征，这样的特征包括对被评论目标的打分和评级，留言文本的句子数量，平均句子长度，每句中词汇的数量等等。一些方案基于评论文本的词法特征，这样的特征包括不同长度(长度为1、2、3)的连续子字符串的出现频率，以及对应计算得到的词频-逆向文件频率(TFIDF)的值。一些方案基于评论文本的词性标注特征，即通过语言学工具，对评论文本中的词汇逐个进行词性标注，并且统计其中名词、动词、形容词、副词等各个词性特征的出现频率。一些方案基于评论文本的情感特征，即利用情感词词典对评论的词汇进行情感类别归纳，并统计这些情感类别的共现情况作为特征。还有一些方案基于评论文本的语义特征，即利用语义词典对评论中的词汇进行语义类别分类，并统计这些语义类别的共现情况作为特征。

总体而言，常规的自动价值评估方案都依赖于语言学分析工具，这将导致诸多局限性。首先，很多语言学分析工具难以保证对目标语言分析的准确性。其次，多语言的应用场景将会带来多种语言学分析工具的购买和研发成本。此外，语言学分析工具所提取的特征是否有利于评论价值的鉴别也没有定论。即使由专家人为定义一些有效特征，但这也可能受限于特定类别的语言环境，导致通用性不足。因此，这些方案通常都无法准确地发现高价值的评论。

根据本公开的实施例，提出了一种用于对评论的价值进行评估的方案。在该方案中，按特定粒度划分目标对象的评论，以获得一组文本项。获取该组文本项的向量化表示，并且基于该向量化表示来提取一组文本项中的至少两个连续文本项的语义特征。另外，还确定至少两个连续文本项在评论的上下文中的重要程度。所确定的重要程度和语义特征一起被用于确定评论有助于用户评估目标对象的程度。以此方式，可以实现对评论的价值的自动、高效且正确的评估。

以下将参照附图来具体描述本公开的实施例。

图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。在该示例环境100中，由计算设备102评估目标对象的评论有助于用户评估该对象的程度(也称为评论的价值或有用程度)。

在本公开的实施例中，评论也可以被称为点评、留言、回复等，指的是与某个对象或某类对象相关的内容(例如，意见、建议、评价、观点等等)。这样的对象可以是物理或虚拟对象，诸如产品、服务、特定形式的内容(新闻、视频、短文本等)。评论通常是由相应的评论者编写，并且被提交给特定网站主机。在本公开的实施例中，在以文本形式给出的评论的基础上进行讨论。在一些情况中，评论也可能包括以音频、视频、图片等形式给出的内容。针对这些情况，可以将这些音频、视频、图片等形式的内容转换为文本形式。

计算设备102可以从评论存储库104获取目标对象的评论。这样的评论可以被呈现在互联网网站的网页中。例如，在图1的示例中，计算设备102从评论存储库104获取网页110，网页110上包括目标对象“帽子”112的一条或多条评论114、116，这些评论分别由对应的评论者“John”和“Sophie”给出。

计算设备102可以从网页110中提取相应的评论114和/或116，然后根据本公开的实施例确定评论114和/或116有助于用户评估目标对象112的程度。在本公开的实施例的中，评论有助于用户评估特定对象的程度也被称为评论的价值或有用程度。在本文中，评论有助于用户评估特定对象的程度、评论的价值和有用程度可互换地使用。通常，用户期望能够从评论者所给出的评论中评估、了解或认知特定对象的一个或多个方面(诸如质量、特点、功能、优缺点、细节等)。如果评论中包含这些方面的信息，用户倾向于认为评论是有价值或有用的。否则，评论将被认为是无价值或无用的。根据本公开的实施例，由计算设备102自动地实现对目标对象的评论的价值评估。

计算设备102可以输出对评论114和/或116的价值评估结果。价值评估结果可以包括评论是否有价值的有、无判断(例如，0或1)，也可以由预定度量值范围内的某个值来指示(例如，由-5至5范围内的某个取值)有价值或无价值的程度)。在一些实施例中，可以将评论的价值评估结果与评论相关联地呈现。价值评估结果的呈现方式可以包括文本、图形、图标、图片、视频或音频等一种或多种方式。在图1的示例中，计算设备102输出网页120。与网页110相比，计算设备102在网页120中对评论114标注了“有用”标识符122，指示评论114有助于用户评估目标对象112。评论116被标注了“无用”标识符124，指示评论114无助于用户评估目标对象112。

应该理解，图1中示出的网页110、120仅是示例，并且图1仅示出了本公开的实施例的一种可能的应用场景。在其他实施例中，计算设备102可以仅接收到评论的内容，而不是记载评论的网页，并且可以仅提供价值评估结果。这样的价值评估结果也可以由第三方、例如目标对象的提供方、拥有评论的互联网平台等使用，以用于与评论相关联的呈现，或者用于其他目的，例如产品推广、有用评论的优先展示等等。

为了更清楚地理解本公开的实施例提供的自动评估评论的方案，将参照图2来详细描述。图2示出了根据本公开的一些实施例的对评论进行评估的过程200的流程图。过程200可以由图1的计算设备102来实现。为便于讨论，将参照图1来描述过程200。

在210，计算设备102获取目标对象的评论中的一组文本项的向量化表示(为便于讨论，称为第一向量化表示)。计算设备102在获得目标对象的评论后，可以按某一粒度划分评论以获得一个或多个文本项。在一些实施例中，可以对评论中包含的全部内容进行划分，以标识其中的文本项。

文本项的划分粒度可以与评论的文本所采用的语言相关。例如，如果评论包含诸如英语、法语、德语等由拉丁拼音组成的文字，可以按单词级别划分评论以获得文本项。每个文本项包括评论中的单次。如果评论包含诸如中文、日文等象形文字，可以按词组级别(或词汇级别)来划分评论，并且每个文本项可以包括评论中的一组单词(其中可以包含一个或多个单词)。对于中文、日文等无法通过空格之类的特定标识符来划分的文本内容，可以采用一些分词工具来实现文本项的划分。

可以理解，根据需要，也可以按其他粒度来划分评论以获得相应的文本项。划分得到的文本项的数目取决于评论所包含的内容。以划分评论114为例，由于评论114包含英文文本，可以以单词级别的粒度来划分，每个文本项包括评论114中的单个单词。如果对中文评论进行划分，则每个文本项可以包括一个或多个中文字。

文本项的向量化表示也可以被称为文本项的向量编码。文本项的向量化表示可以由一定维度的多个数值组成。不同文本项的向量化表示的维度可以相同，但其中包含的数值不同。文本项的向量化表示之间的相似度还可以指示不同文本项之间的语义相似度。在本公开的实施例中，通过将文本信息映射为向量化表示来执行处理，可以有效规避语言之间的差异性，降低了应用局限性。

在一些示例中，可以从预先定义的向量编码集合(码本)中获取文本项的向量化表示。预定义的码本可以是针对词库的文本项进行编码后确定的各个文本项的向量化表示。在一些实施例中，预定义的码本可以通过训练特定学习网络而获得，这将在以下示例中详细讨论。

在220，计算设备102基于第一向量化表示来提取一组文本项中的至少两个连续文本项的语义特征。每个语义特征指示由至少两个连续文本项组成的文本项子集的特征信息。至少两个连续文本项指的是评论中按顺序紧挨着的文本项。可以按预定长度的窗口在一组文本项中连续滑动，从而获取其中的至少两个连续文本项，并基于所获取的文本项的向量化表示来提取相应的语义特征。例如，对于评论114，可以提取三个连续文本项“Theyare thicker”的语义特征，另外三个连续文本项“are thicker than”的语义特征，以及以此类推提取其他连续文本项的特征。这些连续文本项可以认为是一组文本项中的不同文本项子集，子集之间可以重叠。

每个语义特征也可以由一定维度的数值表示。当按特定粒度划分评论时，划分的各个文本项不一定能够完全体现评论的整体语义，例如中文分词手段会导致文本项丢失一些语义特征或者由拉丁拼音组成的单个词组成的文本项单独难以体现语义特征。通过对多个连续文本项的语义特征的提取，可以尽可能的遍历评论中不同字符串、单词或短语的组合，以便探索这些组合带来的语义多样性。因此，语义特征也可以被称为对评论的语义多样性编码。语义特征的提取可以采用多种方法，一种方法可以通过训练特定学习网络来实现，这将在以下示例中详细讨论。当然，其他特征提取方法也是可行的。

可以理解，从文本项的向量化表示到语义特征的提取，使得语义特征能够表征评论中的不同文本项的不同组合，从而能够从词组级别来考虑评论的语义多样性。在一些实施例中，还可以从更多粒度来探索评论的语义多样性。具体地，计算设备102可以进一步划分每个文本项，以获得更细粒度的子文本项。例如，针对英文评论，在按单词级别的粒度划分得到多个单词后，可以继续按字符级别的粒度进一步划分单词，以获得组成每个单词的一个或多个字符(例如，各个字母)，每个字符表示一个子文本项。在另一示例中，针对诸如中文、日文等语言的评论，在按词汇级别的粒度划分得到多个词汇后，可以继续按单词级别的粒度划分文本项，以获得组成一个或多个单词(例如，中文字或日文字)。此时，每个单词表示一个子文本项。

计算设备102可以获取子文本项的向量化表示(为便于描述，称为第二向量化表示)。与第一向量化表示类似，第二向量化表示也可以由一定维度的多个数值组成，不同子文本项的向量化表示之间的相似度还可以指示不同子文本项之间的语义相似度。在一些示例中，可以从预先定义的向量编码集合(码本)中获取子文本项的向量化表示。预定义的码本可以是针对词库的文本项进行编码后确定的各个文本项的向量化表示。在一些实施例中，预定义的码本可以通过训练特定学习网络而获得，这将在以下示例中详细讨论。

计算设备102可以将文本项的第一向量化表示以及组成文本项的子文本项的第二向量化表示进行组合，以生成组合向量化表示。由此，组合向量化表示与评论中的文本项一一对应。如果在按不同粒度分别执行划分后，文本项与子文本项相同(例如，文本项仅包括单个字符或单个单词)，那么第一向量化表示与第二向量化表示可能相同。此时，这两个向量化表示也可以被组合。计算设备102可以从组合向量化表示中提取语义特征。该组合向量化表示包含了不同粒度级别的文本项对应的向量编码，因此更利于对于评论的语义多样性的探索。

在一些实施例中，与文本项的第一向量化表示的处理类似，在组合之前，可以首先在第二粒度级别上继续探索不同子文本项的组合对评论的语义多样性。具体地，可以从每个文本项划分得到的一个或多个子文本项中提取细粒度语义特征。每个细粒度语义特征也可以由一定维度的数值表示。当一个文本项被划分为多个子文本项时，每个细粒度语义特征与该文本项的全部子文本项中的子文本项子集(包含两个或更多连续子文本项)相关联。通过这种方式，可以尽可能的遍历每个单词的不同词根、词缀的组合或者词汇中不同单词组合，以便探索细粒度级别上的语义多样性。细粒度语义特征的提取可以与上述语义特征的提取类似，这也将在以下详细讨论。在一些实施例中，可以将文本项的第一向量化表示以及从组成文本项的子文本项提取的细粒度语义特征进行组合，从而获得与每个文本项对应的组合向量化表示。

每个文本项可能被划分为不同数目的子文本项(例如，一个或多个子文本项)。因此，即使预先定义每个子文本项的向量化表示(或者相关联的细粒度语义特征)的维度相同，组合得到的组合向量化表示也可能维度不同。在一些实施例中，针对不同的文本项，将其包括的子文本项的第二向量化表示映射成具有相同维度的第三向量化表示，或者将相关联的细粒度语义特征映射成具有相同维度的另一细粒度语义特征。在此基础上，可以将第一向量化表示和第三向量化表示(或者另一细粒度语义特征)进行组合，从而获得相同维度的组合向量化表示。

继续参考图2，在230，计算设备102确定至少两个连续文本项在评论的上下文中的重要程度。不同的连续文本项的组合可能在评论的上下文中重要程度不同，对于评论的语义理解的贡献也不同。重要程度可以基于实际确定的语义特征来设置，这将在以下示例中详细讨论。由于每个文本项子集的特征信息由语义特征指示，文本项子集的重要程度也可以被认为是语义特征的重要程度。相应文本项子集的重要程度可以使得在确定评论价值时能够更多关注相关联的语义特征，这有助于提高评论评估结果的准确度。这样的机制也可以被称为“注意力”机制。

在240，计算设备102基于重要程度和语义特征，确定评论有助于用户评估目标对象的程度，也即评论的价值或有用程度。在一些实施例中，可以利用重要程度来对语义特征进行加权组合，以获得组合特征，然后基于组合特征来确定评论有助于用户评估目标对象的程度。组合特征到评论的有用程度之间的映射也可以通过预先训练特定学习网络来表征。重要程度的使用可以使得表征具有更高重要度的文本项子集的语义特征能够对价值评估结果具有更高的贡献，对可能不太有效的语义特征可以对价值评估结果具有较小影响。以此方式，能够提高评估结果的准确度。

如以上提及的，在提取语义特征、确定重要程度和/或确定评论有助于用户评估所述目标对象的程度时均可以采用学习网络来实现。在一些实施例中，文本项和/或子文本项的向量化表示也可以通过学习网络来确定。因此，可以将这些处理的学习网络组合成一个端到端学习网络的架构。该学习网络的主要目标是从输入的评论中确定评论有助于用户评估目标对象的程度以作为输出。

图3示出了根据本公开的一些实施例的用于对评论进行评估的学习网络300的示例架构。如本文所使用的，术语“学习网络”指的是这样的一个模型，该模型能够从训练数据中学习到相应的输入与输出之间的关联，从而在训练完成后基于训练得到的参数集对给定的输入进行处理以生成对应的输出。“学习网络”有时也可以被称为“神经网络”、“学习模型”、“网络”或“模型”。这些术语在本文中可互换地使用。

图3所示的学习网络300的架构可以被实现在图1的计算设备102处。为了便于描述，参照图1来描述图3的示例架构。假设学习网络300的参数集已经通过训练而获得，因而可以用于评估评论的价值。为便于描述，以对图1的评论114为例进行说明。在使用过程中，计算设备102获取评论114的文本项的第一向量化表示301-1、301-2、……、301-m(统称为向量化表示301)，其中m表示评论中文本项的数目。由于评论114包含英文内容，文本项为以单词级别的粒度对评论114进行划分得到的各个单词，因此第一向量化表示301分别表示每个单词的向量化表示，此时m＝11。

假设要评估的评论包含的m个文本项(例如，英文单词或者中文词汇)中第i个索引位置上的文本项v_i，则评论的全部文本项可以被表示为v_1:m＝[v₁,v₂,…,v_m]，并且v_i:j可以代表从第i到第j个连续文本项，即v_i:j＝[v_i,…,v_j]。假设每个文本项v_i的向量化表示为一个维度为d的向量化表示(为方便，表示为v_i)，其中

代表实数域。文本项的向量化表示可以是预先确定的。如果预先确定好向量化表示的全部不同的文本项(例如，英文单词或中文词汇)的数目为|V|个，则这些文本项的向量化表示(向量编码)所能构成的矩阵为

向量化表示v_i便是从V中映射而来。

在一些实施例中，如以上提及的，还可以获取从文本项中划分得到的一个或多个子文本项的第二向量化表示。在评论114的示例中，可以获取组成每个单词的字符的向量化表示。例如，对于评论114的第一个单词“They”，可以获取字符“T”的向量化表示302-1、字符“h”的向量化表示302-2、字符“e”的向量化表示302-3、字符“y”的向量化表示302-4。这样的向量化表示也被称为字符集向量化表示或向量编码。对于评论114中的其他单词，也可以相应地获得这些单词所包括的字符的向量化表示。可以理解，对于包括诸如中文、日文等文字的评论而言，则可以获得单个字级别的向量化表示。

假设文本项中包含n个连续子文本项，被标记为为u_1:n＝[u₁,u₂,…,u_n]，其中u_j代表文本项v_i中的第j个子文本项。与文本项的向量化表示类似，可以定义子文本项u_j的向量化表示为

即子文本项的向量化表示的维度为d′。还可以定义，u_i:j文本项v_i中的从第i到第j个子文本项，即u_i:j＝[u_i,…,u_j]。子文本项的向量化表示可以是预先确定的。如果预先确定好向量化表示的全部不同的子文本项(例如，字符或者单个词)的数目为|U|个，那么子文本项的向量化表示所能构成的矩阵为

向量化表示u_j便是从U中映射而来。

在一些实施例中，可以将第一粒度级别上的第一向量化表示和第二粒度级别上的第二向量化表示组合起来，以用于提取评论的语义特征。在提取评论的语义特征之前，可以在第二粒度级别上探索细粒度的语义特征，并且针对具有不同数目的子文本项的各个文本项，还可以将对应的子文本项的向量化表示映射到相同维度。在一些实施例中，对于细粒度的语义多样性的探索可以通过学习网络300的子网络310来实现。子网络310可以由一个或多个卷积过滤器组成，因此可以被称为卷积学习网络(CNN)310。

假设子网络310中包括k′卷积过滤器，被表示为W′＝[w′₁,w′₂,…,w′_k′]，其中

表示过滤器的参数，该过滤器能够卷积连续长度为l′的序列(即l′个连续子文本项的向量化表示)，且i∈[1,…,k′]。利用卷积过滤器，一个连续长度为l′的子文本项序列的向量化表示u_j:j+l′-1中的信息可以通过卷积(内积)操作被映射为一个标量值p_i,j，被表示如下：

p_i,j＝tanh(w′_i·u_j:j+l′-1+b′), (1)

其中b′是一个偏置参数，并且w′_i和b′都属于学习网络300中的参数集的一部分。

如果利用w′_i对应的卷积过滤器扫描一遍每个文本项v_i中的子文本项的向量化表示u_1:n，可以获得维度为(n+l′-1)的向量p_i。利用子网络310中的k′个过滤器对每个文本项v_i中的子文本项的向量化表示u_1:n执行卷积操作之后，可以获得细粒度语义特征312，被表示为

为了使得针对每个文本项v_i，均生成相同维度的特征，可以将细粒度语义特征312进行过滤(例如，上采样或下采样)。在图3的示例中，利用学习网络300中的最大池化(Maxpooling)子网络320将细粒度语义特征312映射为相同维度的向量化表示(即第三向量化表示)321-1、321-2、……321-m(被统称为向量化表示321)。这些向量化表示分别与m个文本项相对应。在一个示例中，最大池化子网络320对每个细粒度语义特征312执行最大池化操作，以获得向量化表示321，这被表示为：

其中max(x)表示取x中的最大值。针对每个文本项v_i，都可以获得一个维度为k′的向量化表示321，与文本项本身包含的子文本项的数目n无关。

为了提取评论的语义特征，学习网络300将第一粒度级别的向量化表示301与第二粒度级别的处理后获得的向量化表示321进行组合，得到组合向量化表示324，这可以被表示为

其中h_i表示与文本项v_i对应的向量化表示321，并且

因此，针对整个评论，全部组合向量化表示可以被表示为：

e_1:m＝[e₁,e₂,…,e_m] (3)

可以从组合向量化表示324中提取评论114的语义多样化特征。这可以通过学习网络300的子网络330来实现。与子网络310类似，子网络330可以包括一个或多个卷积过滤器来实现特征提取，因此可以被称为CNN 330。

假设子网络310中包括k个卷积过滤器，被表示为W＝[w₁,w₂,…,w_k]，其中

表示过滤器的参数，该过滤器能够卷积连续长度为l的序列(即l个连续文本项对应的组合向量化表示)。可以利用过滤器w_i在e_1:m上依次扫描长度为l的组合向量化表示e_j:j+l-1，以对这些组合向量化表示进行卷积(内积)操作。利用CNN330中的全部k个卷积过滤器对组合向量化表示e_1:m执行卷积操作后，得到评论114的语义特征332，被表示为Q。

语义特征332Q可以被表示为一个矩阵，其中第i行、第j列的元素为：

q_i,j＝tanh(w_i·e_j:j+l-1+b) (4)

其中b是一个偏置参数，并且w_i和b都属于学习网络300中的参数集的一部分。

语义特征332Q的每一列组成的向量表示k个卷积过滤器对评论114的连续l个组合向量化表示e_j:j+l-1的语义特征(或语义多样性编码)。在包含m个文本项的评论中，这样的连续组合向量化表示的数目为m-l+1个。因此，语义特征332Q可以被表示为Q＝[q₁,q₂,…,q_m-l+1]，其中每一个q_j表示一个连续l个组合向量化表示e_j:j+l-1的语义特征。该特征与l个组合向量化对应的文本项相关联。

由于多个语义特征332对应的文本项子集(多个连续文本项)在评论114的上下文中对于评论114的语义理解的贡献程度可能不同，在本公开的实施例中，还确定每个语义特征332对应的文本项子集在评论114的上下文中的重要程度。这个重要程度进而也能表征语义特征332的重要程度。

重要程度的确定可以通过学习网络300的子网络340来实现。子网络340将语义特征332作为输入，以确定相应的权重值用于表示语义特征332对应的文本项子集的重要程度342。在一些实施例中，子网络340可以采用softmax函数对输入的语义特征332执行softmax运算，以输出相应的权重值(表示为权重向量a)作为重要程度342。子网络340中的处理表示为：

a_i＝softmax(r^Ttanh(W_aq_i)) (5)

其中W_a和r是子网络340的参数，也是学习网络30的参数集的一部分；并且a_i表示权重向量a中与语义特征332对应的文本项子集的重要程度。softmax函数的使用使得权重向量a的元素之和为1。当然，子网络340也可以选择其他函数来处理语义特征332，以确定相应的权重值来量化重要程度。

学习网络300还包括组合器350，用于利用重要程度342对语义特征332进行加权组合，以生成评论114的组合特征352。加权组合可以被表示为：

其中x表示组合特征352。

组合特征352可以用于将确定评论114有助于用户评估目标对象的程度。在图3的示例中，假设学习网络300针对每个评论，判断该评论是否有助于用户评估目标对象，则学习网络300可以被认为是完成一个二分类任务(是、否)。在这种情况下，学习网络300可以包括一个逻辑斯蒂(logistic)回归模型360，用于判断评论114是否有用。在评论114的示例中，可以确定评论114有用，即评论114有助于其他用户评估其目标对象。

逻辑斯蒂回归模型360可以对组合特征352执行逻辑斯蒂回归操作，这被表示为：

其中

表示学习网络300对评论114的价值的判断概率，基于这个概率可以确定评论114是否有价值。此外，w_y与b_y分别是逻辑斯蒂回归模型360的预定参数和偏置，这也是学习网络300的整体参数集的一部分。

可以理解，在其他实施例中，也可以采用其他模型来从组合特征中确定评论114的价值。例如，如果期望对评论114的价值进行量化(例如，量化到一个范围内)，则可以利用线性回归模型来对组合特征352进行处理。本公开的实施例在此方面不受限制。

以上讨论了在学习网络300的参数集已经被训练获得的情况下如何使用学习网络300来判断评论的价值。以下将描述对学习网络300的训练过程。训练过程的目的是使得学习网络的参数集从初始值不断进行优化，从而达到一定的收敛条件(也即学习目标)。对学习网络300的训练可以由计算设备102来实现。当然，在其他实施例中，也可以由计算设备102之外的其他设备训练好学习网路300以供计算设备102使用。

在图3的学习网络300中，需要通过训练过程确定的参数集包括：CNN 310中的过滤器组的参数W′和其中每个过滤器执行卷积操作时的偏置参数b′(各个过滤器的偏置参数可以相同或不同)；子网络CNN330的过滤器组的参数W和其中每个过滤器执行卷积操作时的偏置参数b(各个过滤器的偏置参数可以相同或不同)；用于确定重要程度的子网络340的参数W_a和r；逻辑斯蒂回归模型360的参数w_y与b_y。在学习网络300中，还有一些参数可以被自动或手动设置为固定值，诸如参数l,l′,k,k′,d,和d′。这些参数可以被称为超参数。

在训练开始阶段，将学习网络300的参数集进行初始化。可以利用随机初始化来设置每个参数的初始值。备选地，对于一些参数或子网络，可以获取预先训练的参数值来作为初始值。

在一些实施例中，文本项和/或子文本项的向量化表示也可以认为是要被优化的参数。以此方式，可以通过训练过程确定出在评论价值评估的上下文中更有助于确定价值评估结果的向量化表示。在优化学习网络300的各个部分的参数集的同时，也不断更新和优化文本项和/或子文本项的向量化表示，以确定最终的向量化表示。

在训练过程中，获取训练对象的训练评论和训练评论有助于用户评估训练对象的目标程度(真实程度)。然后，基于训练评论和目标程度来优化学习网络300的参数集。参数集优化的收敛条件可以通过设置损失函数来实现。由于学习网络300的主要目标要学习到能够从输入的评论中确定评论是否有价值的能力，损失函数(被表示为

)可以被确定为每次参数优化后学习网络300能够确定的结果与目标结果之间的误差，这被表示为：

其中N表示训练样本的数目，即训练评论的数目；y_i表示第i个训练评论相关联的真实结果(训练评论有助于用户评估训练对象的目标程度)，并且

表示学习网络300在当前参数集的基础上针对第i个训练评论确定的结果(训练评论有助于用户评估所述训练对象的预计程度)。

在训练过程中，可以采用多种学习算法(例如，随机梯度下降算法、后向传播算法等)不断优化学习网络300的参数集，从而使得预计程度与目标程度之间的误差不断降低，进而使得损失函数

也不断减小。如果损失函数

达到收敛(例如，误差达到预定阈值范围内，或者损失函数降低到较小值或最小化，或者达到预定迭代次数)，则将当前学习网络300的参数值确定为训练后的参数集。

在以上训练过程中，训练的收敛条件(也即学习目标)仅基于学习网络300的预期输出(即对评论是否有用的评估)。在一些实现中，还可以在训练学习网络300时设置辅助学习目标。通常，评论者在对特定对象进行评论时，还会对该对象进行主观评分，例如指定某个范围内的分值，用于表达评论者对于特定对象的满意程度。这样的主观评分可以与评论一起相关联地被存储。在一些实施例中，在获取学习网络300的训练数据时，可以获取训练评论的评论者对训练对象的目标评分。然后，将学习网络300的辅助学习目标设置为使得学习网络300能够从输入的训练评论中确定出评论相关联的评分。

为了实现辅助学习目标，在训练时，在学习网络300中增加一个线性回归模型370(如图3所示)。线性回归模型370将组合特征352作为输入(与逻辑斯蒂模块360)，对组合特征352进行线性回归，以评估输入评论的评论者对特定目标的评分(在预定取值范围内)。线性回归模型370中的线性回归操作可以被表示为：

其中

表示学习网络300中的线性回归模型370确定的评分结果，并且w_z与b_z分别是线性回归模型370的参数和偏置。

在训练学习网络300的过程中，要进一步优化w_z与b_z的值，以使得线性回归模型370能够正确评估评论者的评分。在辅助学习目标的基础上，学习网络300的参数集优化的收敛条件还可以与另一损失函数(被表示为

)有关，该损失函数指示线性回归模型370确定的评分与真实(目标)评论之间的误差，被表示如下：

其中N表示训练样本的数目，z_i表示第i个训练样本相关联的真实结果(目标评分)，并且

表示学习网络300在当前参数集的基础上针对第i个训练评论确定的结果(即第i个训练评论的评论者对训练对象的预计评分)。

与主要学习目标相关联的损失函数

和与辅助学习目标相关联的损失函数

可以组合起来，以构成学习网络300的总体损失函数(被表示为

)：

其中λ是预先设置的值，其取值范围可以是0到1。

在训练过程中，可以采用多种学习算法不断优化学习网络300的参数集，从而不仅使得对训练评论的有价值程度的估计误差降低，而且还使得对训练评论的评分的估计误差降低，进而使得总体损失函数

不断减小。如果损失函数

通过利用与评分估计相关的辅助学习目标结合对评论价值估计相关的主学习目标一起来训练学习网络300，可以在多个学习目标约束下促进对学习网络300的参数值的正确学习。

可以理解，线性回归模型370可以在学习网络300的训练过程中用于辅助训练的目的。在学习网络300训练完成之后，可以丢弃该模块，而仅利用学习网络300来评估输入的评论是否有用(有价值)。当然，在一些实施例中，也可以保留线性回归模块370，以使得学习网络300能够额外确定与输入评论相关的评分。

根据本公开的实施例，能够实现对评论价值(有用程度)的高效且准确的自动评估。此外，由于可以将评论的内容直接作为输入而无需利用额外的语言学分析工具进行过多预处理，节约了使用成本。此外，通过将文本信息映射为向量化表示来执行处理，可以有效规避语言之间的差异性，降低了本公开的实施例的局限性。

根据实际应用场景，评估结果可以用于多种目的。例如，在一些应用中，可以对某个互联网平台或站点中的特定对象的评论进行评估，从而可以优先展示被标记为“有用”或“有价值”的评论。优先展示的有用评论可以有助于其他用户从众多评论中快速捕获有用信息，从而能够了解或评估特定对象的各方面特点。在另外一些应用中，还可以基于对特定对象的评论的评估结果来执行其他决策，例如对特定对象的推荐决策等等。应当理解，以上仅是评估结果的一些示例应用，并且本公开的实施例在此方面不受限制。

图4示出了根据本公开实施例的用于对评论进行评估的装置400的示意性框图。装置400可以被包括在图1的计算设备102中或者被实现为计算设备102。如图4所示，装置400包括表示获取模块410，被配置为获取针对目标对象的评论中的一组文本项的第一向量化表示。装置400还包括特征提取模块420，被配置为基于第一向量化表示来提取一组文本项中的至少两个连续文本项的语义特征。装置400还包括重要程度确定模块430，被配置为确定至少两个连续文本项在评论的上下文中的重要程度。此外，装置400还包括评论评估模块440，被配置为基于重要程度和语义特征，确定评论有助于用户评估目标对象的程度。

在一些实施例中，特征提取模块420可以包括：获取模块，被配置为获取一组文本项中的子文本项的第二向量化表示；组合模块，被配置为将第一向量化表示和第二向量化表示进行组合，以生成组合向量化表示；以及提取模块，被配置为从组合向量化表示中提取语义特征。

在一些实施例中，每个文本项可以包括评论中的单词，并且每个子文本项可以包括组成单词的字符。在一些实施例中，每个文本项可以包括评论中的一组单词，并且每个子文本项可以包括单个单词。

在一些实施例中，评论评估模块440可以包括：加权组合模块，被配置为利用重要程度对语义特征进行加权组合，以生成评论的组合特征；以及确定模块，被配置为基于组合特征来确定评论有助于用户评估目标对象的程度。

在一些实施例中，可以利用学习网络来实现以下至少一项：特征提取模块420、重要程度确定模块430和评论评估模块440。

在一些实施例中，装置400可以进一步包括：训练数据获取模块，被配置为获取训练对象的训练评论和训练评论有助于用户评估训练对象的目标程度；以及参数确定模块，被配置为基于训练评论和目标程度来确定学习网络的参数集，以使得利用学习网络确定的训练评论有助于用户评估训练对象的预计程度与目标程度之间的误差在第一误差阈值内。

在一些实施例中，训练数据获取模块还可以被配置为获取训练评论的评论者对训练对象的目标评分。在一些实施例中，参数确定模块还可以被配置为基于目标评分来确定学习网络的参数集，以进一步使得利用学习网络确定的评论者对训练对象的预计评分与目标评分之间的误差在第二误差阈值内。

在一些实施例中，装置400可以进一步包括：初始值获取模块，被配置为获取训练评论中包括的文本项的初始级向量化表示；以及向量化表示更新模块，被配置为在确定参数集的同时更新初始向量化表示，以获得第一向量化表示。

图5示出了可以用来实施本公开的实施例的示例设备500的示意性框图。设备500可以用于实现图1的计算设备102。如图所示，设备500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的计算机程序指令或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序指令，来执行各种适当的动作和处理。在RAM 503中，还可存储设备500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

设备500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理单元501执行上文所描述的各个方法和处理，例如过程200。例如，在一些实施例中，过程200可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由CPU 501执行时，可以执行上文描述的过程200的一个或多个步骤。备选地，在其他实施例中，CPU 501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行过程200。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种用于对评论进行评估的方法，包括：

获取针对目标对象的评论中的一组文本项的第一向量化表示；

基于所述第一向量化表示来提取所述一组文本项中的至少两个连续文本项的语义特征；

确定所述至少两个连续文本项在所述评论的上下文中的重要程度；以及

基于所述重要程度和所述语义特征，确定所述评论有助于用户评估所述目标对象的程度。

2.根据权利要求1所述的方法，其中提取所述语义特征包括：

获取所述一组文本项中的子文本项的第二向量化表示；

将所述第一向量化表示和所述第二向量化表示进行组合，以生成组合向量化表示；以及

从所述组合向量化表示中提取所述语义特征。

3.根据权利要求2所述的方法，其中每个文本项包括所述评论中的单词，并且每个子文本项包括组成单词的字符。

4.根据权利要求2所述的方法，其中每个文本项包括所述评论中的一组单词，并且每个子文本项包括单个单词。

5.根据权利要求1所述的方法，其中确定所述评论有助于用户评估所述目标对象的程度包括：

利用所述重要程度对所述语义特征进行加权组合，以生成所述评论的组合特征；以及

基于所述组合特征来确定所述评论有助于用户评估所述目标对象的程度。

6.根据权利要求1所述的方法，其中利用学习网络来执行以下至少一项：所述语义特征的所述提取、所述重要程度的所述确定、以及所述评论有助于用户评估所述目标对象的程度的所述确定。

7.根据权利要求6所述的方法，进一步包括：

获取训练对象的训练评论和所述训练评论有助于用户评估所述训练对象的目标程度；以及

基于所述训练评论和所述目标程度来确定所述学习网络的参数集，以使得利用所述学习网络确定的所述训练评论有助于用户评估所述训练对象的预计程度与所述目标程度之间的误差在第一误差阈值内。

8.根据权利要求7所述的方法，其中确定所述学习网络的所述参数集还包括：

获取所述训练评论的评论者对所述训练对象的目标评分；以及

基于所述目标评分来确定所述学习网络的所述参数集，以进一步使得利用所述学习网络确定的所述评论者对所述训练对象的预计评分与所述目标评分之间的误差在第二误差阈值内。

9.根据权利要求7所述的方法，还包括：

获取所述训练评论中包括的所述文本项的初始级向量化表示；以及

在确定所述参数集的同时更新所述初始向量化表示，以获得所述第一向量化表示。

10.一种用于对评论进行评估的装置，包括：

表示获取模块，被配置为获取针对目标对象的评论中的一组文本项的第一向量化表示；

特征提取模块，被配置为基于所述第一向量化表示来提取所述一组文本项中的至少两个连续文本项的语义特征；

重要程度确定模块，被配置为确定所述至少两个连续文本项在所述评论的上下文中的重要程度；以及

评论评估模块，被配置为基于所述重要程度和所述语义特征，确定所述评论有助于用户评估所述目标对象的程度。

11.根据权利要求10所述的装置，其中所述特征提取模块包括：

获取模块，被配置为获取所述一组文本项中的子文本项的第二向量化表示；

组合模块，被配置为将所述第一向量化表示和所述第二向量化表示进行组合，以生成组合向量化表示；以及

提取模块，被配置为从所述组合向量化表示中提取所述语义特征。

12.根据权利要求11所述的装置，其中每个文本项包括所述评论中的单词，并且每个子文本项包括组成单词的字符。

13.根据权利要求11所述的装置，其中每个文本项包括所述评论中的一组单词，并且每个子文本项包括单个单词。

14.根据权利要求10所述的装置，其中所述评论评估模块包括：

加权组合模块，被配置为利用所述重要程度对所述语义特征进行加权组合，以生成所述评论的组合特征；以及

确定模块，被配置为基于所述组合特征来确定所述评论有助于用户评估所述目标对象的程度。

15.根据权利要求10所述的装置，其中利用学习网络来实现以下至少一项：所述特征提取模块、所述重要程度确定模块和所述评论评估模块。

16.根据权利要求15所述的装置，进一步包括：

训练数据获取模块，被配置为获取训练对象的训练评论和所述训练评论有助于用户评估所述训练对象的目标程度；以及

参数确定模块，被配置为基于所述训练评论和所述目标程度来确定所述学习网络的参数集，以使得利用所述学习网络确定的所述训练评论有助于用户评估所述训练对象的预计程度与所述目标程度之间的误差在第一误差阈值内。

17.根据权利要求16所述的装置，其中所述训练数据获取模块还被配置为获取所述训练评论的评论者对所述训练对象的目标评分；并且

其中所述参数确定模块还被配置为基于所述目标评分来确定所述学习网络的所述参数集，以进一步使得利用所述学习网络确定的所述评论者对所述训练对象的预计评分与所述目标评分之间的误差在第二误差阈值内。

18.根据权利要求16所述的装置，进一步包括：

初始值获取模块，被配置为获取所述训练评论中包括的所述文本项的初始级向量化表示；以及

向量化表示更新模块，被配置为在确定所述参数集的同时更新所述初始向量化表示，以获得所述第一向量化表示。

19.一种电子设备，所述设备包括：

一个或多个处理器；以及

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9中任一项所述的方法。

20.一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如权利要求1-9中任一项所述的方法。