CN115357777A - 一种基于模糊理论的用户标签权重评估方法 - Google Patents
一种基于模糊理论的用户标签权重评估方法 Download PDFInfo
- Publication number
- CN115357777A CN115357777A CN202211037501.8A CN202211037501A CN115357777A CN 115357777 A CN115357777 A CN 115357777A CN 202211037501 A CN202211037501 A CN 202211037501A CN 115357777 A CN115357777 A CN 115357777A
- Authority
- CN
- China
- Prior art keywords
- labels
- weight
- user
- label
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/02—Computing arrangements based on specific mathematical models using fuzzy logic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
技术领域
本发明涉及网络数据挖掘技术领域,特别是一种基于模糊理论的用户标签权重评估方法。
背景技术
随着移动设备的普及以及无线技术的迭代更新,移动社会网络蓬勃发展,越来越多的用户参与到移动社会网络中进行信息的交流分享。而随着用户数量的激增,网络中的数据也在非线性的增长,海量的数据中蕴含着巨大的价值。然而,用户信息复杂,存在信息缺失或虚假信息的情况。用户配置文件是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息抽象出来的带有标签的用户模型。每个标签和标签权重都是用户的一个向量,一个用户可以理解为超维空间的多个向量(标签)之和。数据所描述的用户最终被计算机识别,并在此基础上实现用户文件的应用。标签权重的确定对后续基于用户画像的推荐和精准营销有很大的影响。现有的标签权重算法主要是基于Sparck提出的TF-IDF算法,但目前的算法对用户的标签考虑较不全面。
发明内容
有鉴于此,本发明的目的在于提供一种基于模糊理论的用户标签权重评估方法,实现对用户的标签考虑的更加全面。
为实现上述目的,本发明采用如下技术方案:一种基于模糊理论的用户标签权重评估方法,包括以下步骤:
步骤S1:用户标签分析及权重初始化;将用户标签具有的标签分为三类:基本标签、行为标签和社会标签,并对这些标签进行重要性分析,之后初始化基本标签、行为标签和社会标签的所有子标签权重;
步骤S2:确定所有子标签的权重变化区间;对每类标签下的子标签进行等级划分,对每类用户标签权重利用模糊集生成对应的隶属度函数MDF,根据隶属度函数MDF确定所有标签的权重变化区间;
步骤S3:设计粒子群优化算法对用户标签权重优化;根据所有标签的权重变化区间随机初始化一群粒子的属性权重,通过粒子群优化算法对用户标签权重进行优化。
在一较佳的实施例中:步骤S2的具体步骤为:
步骤S201:对用户每类标签下的子标签根据初始权重的分配进行“小”、“中”、“大”三个等级的划分;
步骤S202:利用高斯公式对该类标签下三个等级的子标签权重生成模糊集,根据模糊集生成该类标签对应的隶属度函数MDF,其中,隶属度函数MDF的方差由初始权重值形成的区间范围确定;
步骤S203:对于每一类标签,根据对应的隶属度函数MDF以及最大MD原则,得到三个等级子标签权重的变化区间;
在一较佳的实施例中:步骤S3中设计粒子群优化算法对用户标签权重优化的具体方法为:
步骤S301:生成一群粒子并将所有用户标签作为粒子的属性;
步骤S302:根据所有标签的权重变化区间随机初始化所有粒子的用户标签权重;
步骤S303:通过粒子群优化算法对用户标签权重进行优化,设置优化收敛条件是最优粒子不再变化或者已经达到最大迭代次数,最优粒子的标签权重即为所求最优标签权重。
与现有技术相比,本发明具有以下有益效果:
与TF-IDF相比,本发明将用户标签权重评估问题转化为寻求最优解的问题,然后设计隶属度函数得到所有用户标签权重的模糊边界,并利用遗传算法得到每个用户标签权重的最优解。本文从三个维度,即基本标签、网络标签和行为标签出发,对不同类型的用户标签进行了划分,更符合移动社会网络的背景。
本发明采用以上技术方案,在网络数据挖掘领域中,提出一种基于模糊理论的用户标签权重评估方法,分析用户标签的重要性并对这些标签的权重进行初始化,对每类标签的子标签进行分级并利用模糊理论生成每类标签的隶属度函数MDF,根据隶属度函数MDF计算每个等级子标签的权重变化区间,设计粒子群优化算法对用户标签权重进行优化。
相较其他方法对用户的标签考虑的更加全面;将用户标签权重评估问题转化为寻求最优解的问题,然后设计隶属度函数得到所有用户标签权重的模糊边界,并利用粒子群优化算法得到每个用户标签权重的最优解。
附图说明
图1为本发明优选实施例中一种基于模糊理论的用户权重评估方法的流程示意图;
图2为本发明优选实施例中所用的隶属度函数MDF图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式;如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明提出的一种基于模糊理论的用户标签权重评估方法。为了实现这个目标,首先对用户标签进行分析以及权重进行初始化,然后设计隶属度函数MDF确定所有子标签的权重变化区间,最后利用粒子群优化算法根据初始化的用户标签权重、用户标签分数以及权重变化区间对用户标签权重优化。
参考图1至2,本发明公开了一种基于模糊理论的用户标签权重评估方法,其包括以下步骤:
步骤S1:用户标签分析及权重初始化。将用户标签具有的标签分为三类:基本标签、行为标签和社会标签,并对这些标签进行重要性分析,之后初始化三类标签的所有子标签权重;
步骤S2:确定所有子标签的权重变化区间如图2所示。对每类标签下的子标签进行等级划分,对每类用户标签权重利用模糊集生成对应的隶属度函数MDF,根据MDF确定所有标签的权重变化区间;
步骤S3:设计遗传算法对用户标签权重优化。根据所有用户标签的权重计算适应度函数,利用适应度函数设计遗传算法GA,通过GA对用户标签权重进行优化。
步骤S2的具体步骤为:
步骤S201:对用户每类标签下的子标签根据初始权重的分配进行“小、中、大”三个等级的划分;
步骤S202:利用高斯公式对该类标签下三个等级的子标签权重生成模糊集,根据模糊集生成该类标签对应的隶属度函数MDF。其中,MDF的方差由初始权重值形成的区间范围确定;
步骤S203:对于每一类标签,根据对应的隶属度函数MDF以及最大MD原则,得到三个等级子标签权重的变化区间。
歩骤S3中设计粒子群优化算法对用户标签权重优化的具体方法为:
步骤S301:生成一群粒子并将所有用户标签作为粒子的属性;
步骤S302:根据所有标签的权重变化区间随机初始化所有粒子的用户标签权重;
步骤S303:通过粒子群优化算法对用户标签权重进行优化,设置优化收敛条件是最优粒子不再变化或者已经达到最大迭代次数,最优粒子的标签权重即为所求最优标签权重。
本发明采用以上技术方案,在网络数据挖掘领域中,提出一种基于模糊理论的用户标签权重评估方法,分析用户标签的重要性并对这些标签的权重进行初始化,对每类标签的子标签进行分级并利用模糊理论生成每类标签的隶属度函数MDF,根据隶属度函数MDF计算每个等级子标签的权重变化区间,设计粒子群优化算法对用户标签权重进行优化。
相较其他方法对用户的标签考虑的更加全面;将用户标签权重评估问题转化为寻求最优解的问题,然后设计隶属度函数得到所有用户标签权重的模糊边界,并利用粒子群优化算法得到每个用户标签权重的最优解。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (3)
1.一种基于模糊理论的用户标签权重评估方法,其特征在于,包括以下步骤:
步骤S1:用户标签分析及权重初始化;将用户标签具有的标签分为三类:基本标签、行为标签和社会标签,并对这些标签进行重要性分析,之后初始化基本标签、行为标签和社会标签的所有子标签权重;
步骤S2:确定所有子标签的权重变化区间;对每类标签下的子标签进行等级划分,对每类用户标签权重利用模糊集生成对应的隶属度函数MDF,根据隶属度函数MDF确定所有标签的权重变化区间;
步骤S3:设计粒子群优化算法对用户标签权重优化;根据所有标签的权重变化区间随机初始化一群粒子的属性权重,通过粒子群优化算法对用户标签权重进行优化。
2.根据权利要求1所述一种基于模糊理论的用户标签权重评估方法,其特征在于:步骤S2的具体步骤为:
步骤S201:对用户每类标签下的子标签根据初始权重的分配进行“小”、“中”、“大”三个等级的划分;
步骤S202:利用高斯公式对该类标签下三个等级的子标签权重生成模糊集,根据模糊集生成该类标签对应的隶属度函数MDF,其中,隶属度函数MDF的方差由初始权重值形成的区间范围确定;
步骤S203:对于每一类标签,根据对应的隶属度函数MDF以及最大MD原则,得到三个等级子标签权重的变化区间。
3.根据权利要求1所述一种基于模糊理论的用户标签权重评估方法,其特征在于:步骤S3中设计粒子群优化算法对用户标签权重优化的具体方法为:
步骤S301:生成一群粒子并将所有用户标签作为粒子的属性;
步骤S302:根据所有标签的权重变化区间随机初始化所有粒子的用户标签权重;
步骤S303:通过粒子群优化算法对用户标签权重进行优化,设置优化收敛条件是最优粒子不再变化或者已经达到最大迭代次数,最优粒子的标签权重即为所求最优标签权重。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211037501.8A CN115357777B (zh) | 2022-08-26 | 2022-08-26 | 一种基于模糊理论的用户标签权重评估方法 |
LU502892A LU502892B1 (en) | 2022-08-26 | 2022-10-12 | User Label Weight Evaluation Method Based on Fuzzy Theory |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211037501.8A CN115357777B (zh) | 2022-08-26 | 2022-08-26 | 一种基于模糊理论的用户标签权重评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115357777A true CN115357777A (zh) | 2022-11-18 |
CN115357777B CN115357777B (zh) | 2023-09-01 |
Family
ID=84005349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211037501.8A Active CN115357777B (zh) | 2022-08-26 | 2022-08-26 | 一种基于模糊理论的用户标签权重评估方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115357777B (zh) |
LU (1) | LU502892B1 (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030065660A1 (en) * | 2001-09-12 | 2003-04-03 | Yun-Tung Lau | Data ranking with a lorentzian fuzzy score |
DE102012214049A1 (de) * | 2011-08-22 | 2013-02-28 | Xerox Corp. | System zur Co-Cluster-Bildung von Schülerbeurteilungen |
CN104933862A (zh) * | 2015-05-26 | 2015-09-23 | 大连理工大学 | 一种基于浮动车轨迹的城市交通拥堵智能组合预测方法 |
CN106096723A (zh) * | 2016-05-27 | 2016-11-09 | 北京航空航天大学 | 一种基于混合神经网络算法的用于复杂工业产品性能评估方法 |
CN109190675A (zh) * | 2018-08-06 | 2019-01-11 | 浪潮电子信息产业股份有限公司 | 一种基于粒子群优化算法的模糊分类方法及装置 |
CN109215350A (zh) * | 2018-11-02 | 2019-01-15 | 重庆大学 | 一种基于rfid电子车牌数据的短期交通状态预测方法 |
CN111860097A (zh) * | 2020-04-16 | 2020-10-30 | 西安电子科技大学 | 一种基于模糊理论的异常行为检测方法 |
US20210133534A1 (en) * | 2019-10-30 | 2021-05-06 | Inner Mongolia Agricultural University | Cloud task scheduling method based on phagocytosis-based hybrid particle swarm optimization and genetic algorithm |
-
2022
- 2022-08-26 CN CN202211037501.8A patent/CN115357777B/zh active Active
- 2022-10-12 LU LU502892A patent/LU502892B1/en active IP Right Grant
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030065660A1 (en) * | 2001-09-12 | 2003-04-03 | Yun-Tung Lau | Data ranking with a lorentzian fuzzy score |
DE102012214049A1 (de) * | 2011-08-22 | 2013-02-28 | Xerox Corp. | System zur Co-Cluster-Bildung von Schülerbeurteilungen |
CN104933862A (zh) * | 2015-05-26 | 2015-09-23 | 大连理工大学 | 一种基于浮动车轨迹的城市交通拥堵智能组合预测方法 |
CN106096723A (zh) * | 2016-05-27 | 2016-11-09 | 北京航空航天大学 | 一种基于混合神经网络算法的用于复杂工业产品性能评估方法 |
CN109190675A (zh) * | 2018-08-06 | 2019-01-11 | 浪潮电子信息产业股份有限公司 | 一种基于粒子群优化算法的模糊分类方法及装置 |
CN109215350A (zh) * | 2018-11-02 | 2019-01-15 | 重庆大学 | 一种基于rfid电子车牌数据的短期交通状态预测方法 |
US20210133534A1 (en) * | 2019-10-30 | 2021-05-06 | Inner Mongolia Agricultural University | Cloud task scheduling method based on phagocytosis-based hybrid particle swarm optimization and genetic algorithm |
CN111860097A (zh) * | 2020-04-16 | 2020-10-30 | 西安电子科技大学 | 一种基于模糊理论的异常行为检测方法 |
Non-Patent Citations (1)
Title |
---|
王玉;王志腾;: "深度网络的显著性目标检测", 电子测量技术, no. 21 * |
Also Published As
Publication number | Publication date |
---|---|
CN115357777B (zh) | 2023-09-01 |
LU502892B1 (en) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363282B (zh) | 一种基于图卷积网络的网络节点标签主动学习方法和系统 | |
CN107330461B (zh) | 基于情感与信任的协同过滤推荐方法 | |
Papadakis et al. | SCoR: a synthetic coordinate based recommender system | |
CN110990718B (zh) | 一种公司形象提升系统的社会网络模型构建模块 | |
CN112231592B (zh) | 基于图的网络社团发现方法、装置、设备以及存储介质 | |
Niu et al. | A label-based evolutionary computing approach to dynamic community detection | |
Gong et al. | Novel heuristic density-based method for community detection in networks | |
CN109255000B (zh) | 一种标签数据的维度管理方法及装置 | |
Xin et al. | An overlapping semantic community detection algorithm base on the ARTs multiple sampling models | |
CN113190670A (zh) | 一种基于大数据平台的信息展示方法及系统 | |
Xin et al. | The adaptive dynamic community detection algorithm based on the non-homogeneous random walking | |
CN115062732A (zh) | 基于大数据用户标签信息的资源共享合作推荐方法及系统 | |
CN112561599A (zh) | 一种融合域特征交互的基于注意力网络学习的点击率预测方法 | |
CN109783805A (zh) | 一种网络社区用户识别方法及装置 | |
Zhou et al. | Research on hybrid intrusion detection based on improved Harris Hawk optimization algorithm | |
CN114896977A (zh) | 一种物联网实体服务信任值的动态评估方法 | |
Zhang et al. | Quality of web service prediction by collective matrix factorization | |
CN115357777A (zh) | 一种基于模糊理论的用户标签权重评估方法 | |
Abellana et al. | A novel hybrid DEMATEL-K-means clustering algorithm for modeling the barriers of green computing adoption in the Philippines | |
Zhong et al. | Recommendations for mobile apps based on the hits algorithm combined with association rules | |
Luo et al. | DeepAttr: Inferring demographic attributes via social network embedding | |
Chen et al. | Community Detection Based on DeepWalk Model in Large‐Scale Networks | |
CN114298118B (zh) | 一种基于深度学习的数据处理方法、相关设备及存储介质 | |
CN114897290A (zh) | 业务流程的演化识别方法、装置、终端设备以及存储介质 | |
CN113987363A (zh) | 一种基于隐因子预测的冷启动推荐算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |