CN112948677A

CN112948677A - 基于点评美感度的推荐理由确定方法、系统、设备及介质

Info

Publication number: CN112948677A
Application number: CN202110220617.4A
Authority: CN
Inventors: 唐建; 鞠剑勋; 李健
Original assignee: Shanghai Zhilv Information Technology Co ltd
Current assignee: Shanghai Zhilv Information Technology Co ltd
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2021-06-11
Anticipated expiration: 2041-02-26
Also published as: CN112948677B

Abstract

本发明公开了一种基于点评美感度的推荐理由确定方法、系统、设备及介质，该方法包括：获取每个标签的点评文本；将每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分；从每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的美感度评分最高的点评文本作为对应标签的推荐理由。本发明通过将获取到的每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分，将从每个标签的点评文本的美感度评分中确定出的美感度评分最高的点评文本作为对应标签的推荐理由，提高了推荐理由的合理性和优美度，满足了用户的需求，提高了用户体验度。

Description

基于点评美感度的推荐理由确定方法、系统、设备及介质

技术领域

本发明涉及自然语言处理技术领域，特别涉及一种基于点评美感度的推荐理由确定方法、系统、设备及介质。

背景技术

目前，旅游产品的推荐理由是从该产品的简介中找出能够突出该产品特色的若干个词，再通过若干个词组合成推荐理由，并不是将完整的句子作为推荐理由来推荐给用户，而将若干个词作为推荐理由过于概括，没有针对特定方向进行具体的推荐，会导致用户的体验度低。

发明内容

本发明要解决的技术问题是为了克服现有技术中将从旅游产品的简介中找出的若干个词组合成推荐理由推荐给用户，由于该推荐理由过于概括，没有针对特定方向进行具体的推荐，导致用户的体验度低的缺陷，提供一种基于点评美感度的推荐理由确定方法、系统、设备及介质。

本发明是通过下述技术方案来解决上述技术问题：

本发明第一方面提供了一种基于点评美感度的推荐理由确定方法，所述确定方法包括：

获取每个标签的点评文本；

将获取到的所述每个标签的点评文本分别输入bert(预训练语言模型)模型，以得到每个标签的点评文本的美感度评分；

从所述每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的所述美感度评分最高的点评文本作为对应标签的所述推荐理由。

较佳地，所述bert模型的训练步骤包括：

获取已标注美感度评分的点评文本；

用所述已标注美感度评分的点评文本训练所述bert模型。

较佳地，所述获取已标注美感度评分的点评文本的步骤之后，所述bert模型的训练步骤还包括：

预处理所述已标注美感度评分的点评文本，得到处理后的所述已标注美感度评分的点评文本；

用处理后的所述已标注美感度评分的点评文本训练bert模型。

较佳地，所述获取已标注美感度评分的点评文本的步骤包括：

将点评文本序列输入所述bert模型，得到所述点评文本序列中多个字向量表示；

将所述多个字向量表示进行最大值池化处理，得到词汇向量表示；

将所述词汇向量表示进行均值池化处理，得到点评文本向量表示；

将所述点评文本向量表示线性变换后映射到标签分布上，得到已标注美感度评分的点评文本。

和/或，

所述将点评文本序列输入所述bert模型，得到所述点评文本序列中多个字向量表示的步骤包括：

获取所述点评文本序列转换得到的字向量、文本向量和位置向量；

将所述字向量、所述文本向量和所述位置向量拼接后输入所述bert模型，得到所述点评文本序列中多个字向量表示。

较佳地，所述获取每个标签的点评文本的步骤之前，所述确定方法还包括：

获取标签体系，所述标签体系包括多个标签层级；

在所述标签体系中获取所述每个标签的点评文本；

和/或，

所述获取标签体系的步骤之后，所述确定方法还包括：

获取每个标签中点评文本的关键词；

在所述标签体系中根据所述关键词获取每个标签的点评文本。

本发明第二方面提供了一种基于点评美感度的推荐理由确定系统，所述确定系统包括第一获取模块、输入模块和确定模块；

所述第一获取模块用于获取每个标签的点评文本；

所述输入模块用于将获取到的所述每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分；

所述确定模块用于从所述每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的所述美感度评分最高的点评文本作为对应标签的所述推荐理由。

较佳地，所述确定系统还包括第二获取模块和训练模块；

所述第二获取模块用于获取已标注美感度评分的点评文本；

所述训练模块用于用所述已标注美感度评分的点评文本训练所述bert模型。

较佳地，所述确定系统还包括预处理模块；

所述预处理模块用于预处理所述已标注美感度评分的点评文本，得到处理后的所述已标注美感度评分的点评文本；

所述训练模块具体用于用处理后的所述已标注美感度评分的点评文本训练bert模型。

较佳地，所述第二获取模块包括输入单元、第一处理单元、第二处理单元和变换单元；

所述输入单元用于将点评文本序列输入所述bert模型，得到所述点评文本序列中多个字向量表示；

所述第一处理单元用于将所述多个字向量表示进行最大值池化处理，得到词汇向量表示；

所述第二处理单元用于将所述词汇向量表示进行均值池化处理，得到点评文本向量表示；

所述变换单元用于将所述点评文本向量表示线性变换后映射到标签分布上，得到已标注美感度评分的点评文本。

和/或，

所述第二获取模块包括获取单元；

所述获取单元用于获取所述点评文本序列转换得到的字向量、文本向量和位置向量；

所述输入单元具体用于将所述字向量、所述文本向量和所述位置向量拼接后输入所述bert模型，得到所述点评文本序列中多个字向量表示。

较佳地，所述确定系统还包括第三获取模块；

所述第三获取模块用于获取标签体系，所述标签体系包括多个标签层级；

所述第一获取模块具体用于在所述标签体系中获取所述每个标签的点评文本；

和/或，

所述确定系统还包括第四获取模块；

所述第四获取模块用于获取每个标签中点评文本的关键词；

所述第一获取模块具体还用于根据所述关键词获取每个标签的点评文本。

本发明第三方面提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的基于点评美感度的推荐理由确定方法。

本发明第四方面提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的基于点评美感度的推荐理由确定方法的步骤。

本发明的积极进步效果在于：

本发明通过将获取得到的每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分，再从每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的美感度评分最高的点评文本作为对应标签的推荐理由推荐给用户，提高了推荐理由的合理性和优美度，满足了用户的需求，提高了用户体验度。

附图说明

图1为本发明实施例1的基于点评美感度的推荐理由确定方法的流程图。

图2为本发明实施例1的基于点评美感度的推荐理由确定方法的bert模型的训练步骤的流程图。

图3为本发明实施例1的基于点评美感度的推荐理由确定方法的步骤101a的流程图。

图4为本发明实施例2的基于点评美感度的推荐理由确定系统的模块示意图。

图5为本发明实施例3的电子设备的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明，但并不因此将本发明限制在所述的实施例范围之中。

实施例1

本实施例提供了一种基于点评美感度的推荐理由确定方法，如图1所示，该确定方法包括：

步骤101、获取标签体系，标签体系包括多个标签层级。

本实施方式中，标签体系是通过观察大量的用户点评，总结用户点评的主要方面，从而构建成标签体系，标签体系的建立方便为用户推荐该用户关注的某些方面的推荐理由。标签体系可以分为3级，即包括3个标签层级，也可以根据实际情况分成其他数量的标签层级，此处不做具体限定。

例如，如下表所示的部分标签体系，将标签体系分为3个标签层级，其中，1级标签层级、2级标签层级以及3级标签层级是层级的一对多关系，第一列为1级标签层级，第二列为2级标签层级，第三列为3级标签层级。

1级标签层级	2级标签层级	3级标签层级
			服务	领队	领队不错
服务	导游	导游服务好
			服务	导游	导游服务耐心
服务	导游	导游讲解到位
			服务	导游	导游讲解详细
服务	导游	导游帮忙拿行李
			服务	导游	导游帮忙拍照
服务	导游	导游幽默
			服务	导游	导游认真负责
服务	导游	导游热情
			服务	导游	导游有礼貌
服务	导游	导游是当地通
			服务	导游	导游熟悉线路
服务	导游	导游知识渊博
			服务	导游	导游体贴老人
服务	导游	导游照顾小孩
			服务	旅拍	旅拍
服务	旅拍	摄影师技术好
			服务	旅拍	成片非常棒
服务	旅拍	有免费拍照
			服务	特色服务	有中文服务
服务	特色服务	缓解高反
			服务	特色服务	旅行管家
服务	特色服务	慢生活

步骤102、获取每个标签中点评文本的关键词。

步骤103、在标签体系中根据关键词获取每个标签的点评文本。

本实施方式中，为了准确的获取产品中属于不同标签的点评文本，具体地，给3级标签定义了一些关键词，根据关键词获取每个标签的点评文本。

例如，3级标签及对应的部分关键词的具体内容如下表所示，第一列是3级标签；第二列是属于该标签的点评应该要包含的关键词，其中，(A，B)表示必须同时包含A和B；第三列是该标签下的点评不应该包含的关键词。本实施方式中该标签下的点评不应该包含的关键词可以是空的(即没有关键词)，也可以是否定词，还可以是其他影响点评美感度的词。

步骤104、将获取到的每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分。

本实施方式中，美感度可以理解为美感强度。

步骤105、从每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的美感度评分最高的点评文本作为对应标签的推荐理由。

本实施方式会对每个标签的所有点评文本进行评分，例如，评分可以分为1-4分，其中，1分为最低分，4分为最高分，然后将每个标签的所有点评文本的评分从高到低进行排序，将评分最高的点评文本作为对应标签的推荐理由。在将推荐理由推荐给用户时，通常会结合该对应标签在整个旅游产品中的权重和特殊性，优先将权重高的或者有特殊性的推荐理由推荐给用户。

本实施方式中，如图2所示，bert模型的训练步骤包括：

步骤101a、获取已标注美感度评分的点评文本。

本实施方式中，在标签体系中随机获取部分已标注美感度评分的点评文本。

步骤101b、预处理已标注美感度评分的点评文本，得到处理后的已标注美感度评分的点评文本。

本实施方式中，预处理已标注美感度评分的点评文本，具体地，对已标注美感度评分的点评文本进行噪声过滤，去除掉点评文本中非符号、数字、文字等字符，之后再对点评文本进行分词得到词汇序列，记录每个字符所在词汇的词汇位置。

步骤101c、用处理后的已标注美感度评分的点评文本训练bert模型。

本实施方式中，通过点评文本真实标签和预测标签分布计算cross-entropy loss(交叉熵损失函数)，采用Adam(Adaptive Moment Estimation)(自适应矩估计)算法对loss(损失)极小化，最后得到训练后的bert模型。

本实施方式中，如图3所示，上述步骤101a包括：

步骤101a1、将点评文本序列输入bert模型，得到点评文本序列中多个字向量表示。

本实施方式中，将点评文本序列输入bert模型，得到该点评文本序列中每个字对应的字向量表示，该字向量维度为768，也可以为其他数值。

具体地，将点评文本序列

输入bert模型，得到文本字级别表示r_i＝BERT(word_i)。其中，点评文本序列

中，n表示文本长度，i大于等于1且小于等于n。

步骤101a2、将多个字向量表示进行最大值池化处理，得到词汇向量表示。

本实施方式通过max-pooling(最大值池化)将同一个词汇下的不同字向量表示转换成词汇向量表示。

具体地，在数据处理阶段，通过分词工具对文本进行分词，得到词汇序列

每一个词汇都会有若干的字组成，即

其中，s表示构成词汇的首字在文本中的位置，l表示词汇的长度。而词汇向量表示通过以下公式得到：

其中，R_p表示词汇p的向量表示，k表示词汇p中的字在文本中位置，l表示词汇p的字数(即表示词汇p的长度)，

对应每个

的向量表示，k的取值范围是[s,s+l]。

步骤101a3、将词汇向量表示进行均值池化处理，得到点评文本向量表示。

本实施方式中，不同词汇的向量表示经过Mean-pooling(均值池化)处理得到整个文本的向量表示，即全局向量。文本由若干个词汇序列

组成，其中，m表示词汇数量。而文本向量表示通过以下公式得到：

其中，R_sen表示文本的向量表示，j表示词汇在文本中的位置，

对应每个phase_j的向量表示，j的取值范围是[1,m]。

步骤101a4、将点评文本向量表示线性变换后映射到标签分布上，得到已标注美感度评分的点评文本。

本实施方式中，将点评文本向量表示经过一个线性变换后映射到标签类别的分布上，最终得到已标注美感度评分的点评文本。

在本实施例的具体实施过程中，更进一步地，步骤101a1具体包括：

步骤101a11、获取点评文本序列转换得到的字向量、文本向量和位置向量。

步骤101a12、将字向量、文本向量和位置向量拼接后输入bert模型，得到点评文本序列中多个字向量表示。

本实施方式中，bert模型将点评文本序列转换成字向量、文本向量和位置向量，并将字向量、文本向量和位置向量拼接后输入bert模型。

本实施方式通过将在标签体系中根据关键词获取得到的每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分，再从每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的美感度评分最高的点评文本作为对应标签的推荐理由推荐给用户，而通过标签体系以及关键词来获取每个标签的点评文本，提高了推荐理由的合理性，通过bert模型对每个标签的点评文本的美感度进行评分，提高了推荐理由的优美度，从而满足了用户的需求，提高了用户体验度。

实施例2

本实施例提供了基于点评美感度的推荐理由确定系统，如图4所示，该确定系统包括第一获取模块1、输入模块2、确定模块3、第二获取模块4、训练模块5、预处理模块6、第三获取模块7和第四获取模块8。

第三获取模块7用于获取标签体系，标签体系包括多个标签层级。

第四获取模块8用于获取每个标签中点评文本的关键词。

第一获取模块1具体用于在标签体系中根据关键词获取每个标签的点评文本。

输入模块2用于将获取到的每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分。

本实施方式中，美感度可以理解为美感强度。

确定模块3用于从每个标签的点评文本的美感度评分中确定出美感度评分最高的点评文本，并将确定出的美感度评分最高的点评文本作为对应标签的推荐理由。

第二获取模块4用于获取已标注美感度评分的点评文本。

预处理模块6用于预处理已标注美感度评分的点评文本，得到处理后的已标注美感度评分的点评文本。

训练模块5具体用于用处理后的已标注美感度评分的点评文本训练bert模型。

本实施方式中，通过点评文本真实标签和预测标签分布计算cross-entropyloss，采用Adam(Adaptive Moment Estimation)算法对loss极小化，最后得到训练后的bert模型。

本实施方式中，如图4所示，第二获取模块4包括输入单元41、第一处理单元42、第二处理单元43、变换单元44和获取单元45。

输入单元41用于将点评文本序列输入bert模型，得到点评文本序列中多个字向量表示。

具体地，将点评文本序列

中，n表示文本长度，i大于等于1且小于等于n。

第一处理单元42用于将多个字向量表示进行最大池化处理，得到词汇向量表示。

本实施方式通过max-pooling将同一个词汇下的不同字向量表示转换成词汇向量表示。

每一个词汇都会有若干的字组成，即

对应每个word_k的向量表示，k的取值范围是[s,s+l]。

第二处理单元43用于将词汇向量表示进行均值池化处理，得到点评文本向量表示。

本实施方式中，不同词汇的向量表示经过Mean-pooling处理得到整个文本的向量表示，即全局向量。文本由若干个词汇序列

对应每个phase_j的向量表示，j的取值范围是[1,m]。

变换单元44用于将点评文本向量表示线性变换后映射到标签分布上，得到已标注美感度评分的点评文本。

获取单元45用于获取点评文本序列转换成得到的字向量、文本向量和位置向量。

输入单元41具体用于将字向量、文本向量和位置向量拼接后输入bert模型，得到点评文本序列中多个字向量表示。

实施例3

图5为本发明实施例3提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现实施例1的基于点评美感度的推荐理由确定方法。图5显示的电子设备30仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，电子设备30可以以通用计算设备的形式表现，例如其可以为服务器设备。电子设备30的组件可以包括但不限于：上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。

总线33包括数据总线、地址总线和控制总线。

存储器32可以包括易失性存储器，例如随机存取存储器(RAM)321和/或高速缓存存储器322，还可以进一步包括只读存储器(ROM)323。

存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325，这样的程序模块324包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器31通过运行存储在存储器32中的计算机程序，从而执行各种功能应用以及数据处理，例如本发明实施例1所提供的基于点评美感度的推荐理由确定方法。

电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且，生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图5所示，网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白，尽管图中未示出，可以结合模型生成的设备30使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例4

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现实施例1所提供的基于点评美感度的推荐理由确定方法的步骤。

其中，可读存储介质可以采用的更具体可以包括但不限于：便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中，本发明还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行实现实施例1所述的基于点评美感度的推荐理由确定方法的步骤。

其中，可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码，所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这仅是举例说明，本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本发明的保护范围。

Claims

1.一种基于点评美感度的推荐理由确定方法，其特征在于，所述确定方法包括：

获取每个标签的点评文本；

将获取到的所述每个标签的点评文本分别输入bert模型，以得到每个标签的点评文本的美感度评分；

2.如权利要求1所述的基于点评美感度的推荐理由确定方法，其特征在于，所述bert模型的训练步骤包括：

获取已标注美感度评分的点评文本；

用所述已标注美感度评分的点评文本训练所述bert模型。

3.如权利要求2所述的基于点评美感度的推荐理由确定方法，其特征在于，所述获取已标注美感度评分的点评文本的步骤之后，所述bert模型的训练步骤还包括：

用处理后的所述已标注美感度评分的点评文本训练bert模型。

4.如权利要求2所述的基于点评美感度的推荐理由确定方法，其特征在于，所述获取已标注美感度评分的点评文本的步骤包括：

和/或，

5.如权利要求1所述的基于点评美感度的推荐理由确定方法，其特征在于，所述获取每个标签的点评文本的步骤之前，所述确定方法还包括：

获取标签体系，所述标签体系包括多个标签层级；

在所述标签体系中获取所述每个标签的点评文本；

和/或，

所述获取标签体系的步骤之后，所述确定方法还包括：

获取每个标签中点评文本的关键词；

6.一种基于点评美感度的推荐理由确定系统，其特征在于，所述确定系统包括第一获取模块、输入模块和确定模块；

所述第一获取模块用于获取每个标签的点评文本；

7.如权利要求5所述的基于点评美感度的推荐理由确定系统，其特征在于，所述确定系统还包括第二获取模块和训练模块；

所述第二获取模块用于获取已标注美感度评分的点评文本；

8.如权利要求7所述的基于点评美感度的推荐理由确定系统，其特征在于，所述确定系统还包括预处理模块；

9.如权利要求7所述的基于点评美感度的推荐理由确定系统，其特征在于，所述第二获取模块包括输入单元、第一处理单元、第二处理单元和变换单元；

和/或，

所述第二获取模块包括获取单元；

10.如权利要求6所述的基于点评美感度的推荐理由确定系统，其特征在于，所述确定系统还包括第三获取模块；

和/或，

所述确定系统还包括第四获取模块；

所述第四获取模块用于获取每个标签中点评文本的关键词；

11.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-5中任意一项所述的基于点评美感度的推荐理由确定方法。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-5中任意一项所述的基于点评美感度的推荐理由确定方法的步骤。