CN115357777B

CN115357777B - 一种基于模糊理论的用户标签权重评估方法

Info

Publication number: CN115357777B
Application number: CN202211037501.8A
Authority: CN
Inventors: 许力; 徐振宇; 张欣欣; 左雨庭; 叶帼华
Original assignee: Fujian Normal University
Current assignee: Fujian Normal University
Priority date: 2022-08-26
Filing date: 2022-08-26
Publication date: 2023-09-01
Anticipated expiration: 2042-08-26
Also published as: LU502892B1; CN115357777A

Abstract

本发明提供了一种基于模糊理论的用户标签权重评估方法，其包括以下步骤：1）用户标签分析及权重初始化。将用户标签具有的标签分为三类：基本标签、行为标签和社会标签，并对这些标签进行重要性分析，之后初始化三类标签的所有子标签权重；2）确定所有子标签的权重变化区间。对每类标签下的子标签进行等级划分，对每类用户标签权重利用模糊集生成对应的隶属度函数，根据确定所有标签的权重变化区间；3）设计粒子群优化算法对用户标签权重优化，根据每个标签的权重变化区间初始化每个粒子的属性权重，通过粒子群优化算法对用户标签权重进行优化。应用本技术方案可实现对用户标签考虑的更加全面。

Description

一种基于模糊理论的用户标签权重评估方法

技术领域

本发明涉及网络数据挖掘技术领域，特别是一种基于模糊理论的用户标签权重评估方法。

背景技术

随着移动设备的普及以及无线技术的迭代更新，移动社会网络蓬勃发展，越来越多的用户参与到移动社会网络中进行信息的交流分享。而随着用户数量的激增，网络中的数据也在非线性的增长，海量的数据中蕴含着巨大的价值。然而，用户信息复杂，存在信息缺失或虚假信息的情况。用户配置文件是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息抽象出来的带有标签的用户模型。每个标签和标签权重都是用户的一个向量，一个用户可以理解为超维空间的多个向量(标签)之和。数据所描述的用户最终被计算机识别，并在此基础上实现用户文件的应用。标签权重的确定对后续基于用户画像的推荐和精准营销有很大的影响。现有的标签权重算法主要是基于Sparck提出的TF-IDF算法，但目前的算法对用户的标签考虑较不全面。

发明内容

有鉴于此，本发明的目的在于提供一种基于模糊理论的用户标签权重评估方法，实现对用户的标签考虑的更加全面。

为实现上述目的，本发明采用如下技术方案：一种基于模糊理论的用户标签权重评估方法，包括以下步骤：

步骤S1：用户标签分析及权重初始化；将用户标签具有的标签分为三类：基本标签、行为标签和社会标签，并对这些标签进行重要性分析，之后初始化基本标签、行为标签和社会标签的所有子标签权重；

步骤S2：确定所有子标签的权重变化区间；对每类标签下的子标签进行等级划分，对每类用户标签权重利用模糊集生成对应的隶属度函数MDF，根据隶属度函数MDF确定所有标签的权重变化区间；

步骤S3：设计粒子群优化算法对用户标签权重优化；根据所有标签的权重变化区间随机初始化一群粒子的属性权重，通过粒子群优化算法对用户标签权重进行优化。

在一较佳的实施例中：步骤S2的具体步骤为：

步骤S201：对用户每类标签下的子标签根据初始权重的分配进行“小”、“中”、“大”三个等级的划分；

步骤S202：利用高斯公式对该类标签下三个等级的子标签权重生成模糊集，根据模糊集生成该类标签对应的隶属度函数MDF，其中，隶属度函数MDF的方差由初始权重值形成的区间范围确定；

步骤S203：对于每一类标签，根据对应的隶属度函数MDF以及最大MD原则，得到三个等级子标签权重的变化区间；

在一较佳的实施例中：步骤S3中设计粒子群优化算法对用户标签权重优化的具体方法为：

步骤S301：生成一群粒子并将所有用户标签作为粒子的属性；

步骤S302：根据所有标签的权重变化区间随机初始化所有粒子的用户标签权重；

步骤S303：通过粒子群优化算法对用户标签权重进行优化，设置优化收敛条件是最优粒子不再变化或者已经达到最大迭代次数，最优粒子的标签权重即为所求最优标签权重。

与现有技术相比，本发明具有以下有益效果：

与TF-IDF相比，本发明将用户标签权重评估问题转化为寻求最优解的问题，然后设计隶属度函数得到所有用户标签权重的模糊边界，并利用遗传算法得到每个用户标签权重的最优解。本文从三个维度，即基本标签、网络标签和行为标签出发，对不同类型的用户标签进行了划分，更符合移动社会网络的背景。

本发明采用以上技术方案，在网络数据挖掘领域中，提出一种基于模糊理论的用户标签权重评估方法，分析用户标签的重要性并对这些标签的权重进行初始化，对每类标签的子标签进行分级并利用模糊理论生成每类标签的隶属度函数MDF，根据隶属度函数MDF计算每个等级子标签的权重变化区间，设计粒子群优化算法对用户标签权重进行优化。

相较其他方法对用户的标签考虑的更加全面；将用户标签权重评估问题转化为寻求最优解的问题，然后设计隶属度函数得到所有用户标签权重的模糊边界，并利用粒子群优化算法得到每个用户标签权重的最优解。

附图说明

图1为本发明优选实施例中一种基于模糊理论的用户权重评估方法的流程示意图；

图2为本发明优选实施例中所用的隶属度函数MDF图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式；如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本发明提出的一种基于模糊理论的用户标签权重评估方法。为了实现这个目标，首先对用户标签进行分析以及权重进行初始化，然后设计隶属度函数MDF确定所有子标签的权重变化区间，最后利用粒子群优化算法根据初始化的用户标签权重、用户标签分数以及权重变化区间对用户标签权重优化。

参考图1至2，本发明公开了一种基于模糊理论的用户标签权重评估方法，其包括以下步骤：

步骤S1：用户标签分析及权重初始化。将用户标签具有的标签分为三类：基本标签、行为标签和社会标签，并对这些标签进行重要性分析，之后初始化三类标签的所有子标签权重；

步骤S2：确定所有子标签的权重变化区间如图2所示。对每类标签下的子标签进行等级划分，对每类用户标签权重利用模糊集生成对应的隶属度函数MDF，根据MDF确定所有标签的权重变化区间；

步骤S3：设计遗传算法对用户标签权重优化。根据所有用户标签的权重计算适应度函数，利用适应度函数设计遗传算法GA，通过GA对用户标签权重进行优化。

步骤S2的具体步骤为：

步骤S201：对用户每类标签下的子标签根据初始权重的分配进行“小、中、大”三个等级的划分；

步骤S202：利用高斯公式对该类标签下三个等级的子标签权重生成模糊集，根据模糊集生成该类标签对应的隶属度函数MDF。其中，MDF的方差由初始权重值形成的区间范围确定；

步骤S203：对于每一类标签，根据对应的隶属度函数MDF以及最大MD原则，得到三个等级子标签权重的变化区间。

歩骤S3中设计粒子群优化算法对用户标签权重优化的具体方法为：

步骤S301：生成一群粒子并将所有用户标签作为粒子的属性；

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等同变换，或直接或间接运用在相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于模糊理论的用户标签权重评估方法，其特征在于，包括以下步骤：

步骤S3：设计粒子群优化算法对用户标签权重优化；根据所有标签的权重变化区间随机初始化一群粒子的属性权重，通过粒子群优化算法对用户标签权重进行优化；

步骤S2的具体步骤为：

步骤S3中设计粒子群优化算法对用户标签权重优化的具体方法为：

步骤S301：生成一群粒子并将所有用户标签作为粒子的属性；