CN117952726A - 一种基于运营商数据分析的个性化权益包推荐系统 - Google Patents
一种基于运营商数据分析的个性化权益包推荐系统 Download PDFInfo
- Publication number
- CN117952726A CN117952726A CN202410356025.9A CN202410356025A CN117952726A CN 117952726 A CN117952726 A CN 117952726A CN 202410356025 A CN202410356025 A CN 202410356025A CN 117952726 A CN117952726 A CN 117952726A
- Authority
- CN
- China
- Prior art keywords
- users
- similarity
- user
- similar
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,提出了一种基于运营商数据分析的个性化权益包推荐系统,包括:采集用户若干内容项的相关数据;将用户若干内容项的相关数据转换为样本空间中的样本点;获取每个样本点的范围区分度;得到若干相似分组;对同一相似分组的用户基于内容项的相关数据构建二维矩阵;根据二维矩阵中各行元素的差异及用户对应样本点的范围区分度,获取同一相似分组下的不同用户之间的数据差异度;获取同一相似分组下不同用户之间的相似度调整系数;对相似分组中用户间的相似度进行调整;基于相似分组构建推荐模型,并对用户权益包进行个性化定制推荐。本发明旨在解决用户个人独特偏好体现不明显导致推荐效果不理想的问题。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于运营商数据分析的个性化权益包推荐系统。
背景技术
通过分析用户在运营商网络上的通信、消费行为数据,可以深入了解用户的需求、偏好,从而为用户推荐个性化的权益包,并结合私域载体的定制化服务,可以有效提升用户体验,增加用户满意度。但由于用户群体的偏好多样性以及权益包类别组合的多样化,导致利用协同过滤算法对于运营商数据处理,提取用户偏好特征的过程中,存在用户的错误偏好提取,进而导致权益包的个性化定制结果不准确。
现有技术中采用基于模型的协同过滤算法对运营商网络上的用户通信、消费行为数据进行用户偏好特征提取处理,其主要利用机器学习的方法,对运营商用户相关数据进行建模,并将训练好的模型来预测未知的用户偏好信息,最终得出权益包个性化定制服务推荐;但利用协同过滤算法对运营商网络上的用户相关数据进行处理的过程中,用户权益包定制推荐模型的推荐准确度取决于权益包内容项与用户项的匹配精准度,然而覆盖面较广的流行性偏向导致单个用户的独特偏好无法明显体现,进而使得构建出用户权益包定制推荐模型的定制推荐结果不理想。
发明内容
本发明提供一种基于运营商数据分析的个性化权益包推荐系统,以解决现有的用户个人独特偏好体现不明显导致推荐效果不理想的问题,所采用的技术方案具体如下:
本发明一个实施例提供了一种基于运营商数据分析的个性化权益包推荐系统,该系统包括:
用户数据采集模块,用于采集用户若干内容项的相关数据;
用户分组构建模块,用于将用户若干内容项的相关数据转换为样本空间中的样本点;根据样本点的分布,获取每个样本点的范围区分度;基于样本点欧式距离聚类得到若干相似分组;
对同一相似分组的用户基于内容项的相关数据构建二维矩阵;根据二维矩阵中各行元素的差异及用户对应样本点的范围区分度,获取同一相似分组下的不同用户之间的数据差异度;基于数据差异度及行向量之间的相似性,获取同一相似分组下不同用户之间的相似度调整系数;通过相似度调整系数对相似分组中用户间的相似度进行调整;
个性化权益包推荐模块,用于基于相似分组构建推荐模型,并对用户权益包进行个性化定制推荐。
进一步地,所述每个样本点的范围区分度,具体的获取方法为:
根据样本点间的欧式距离,通过协同过滤算法获取每个样本点的邻域范围;对于第个样本点,获取第/>个样本点与其邻域范围内所有样本点的欧式距离的方差,将方差的反比例归一化值作为第/>个样本点的范围区分度。
进一步地,所述对同一相似分组的用户基于内容项的相关数据构建二维矩阵,包括的具体方法为:
对于任意一个相似分组,将每个内容项作为一列,将该相似分组中每个用户每个内容项的相关数据作为一行,得到该相似分组的二维矩阵。
进一步地,所述同一相似分组下不同用户之间的数据差异度,具体的获取方法为:
根据同一相似分组下不同用户相同内容项的相关数据,获取同一相似分组下不同用户之间的行差异;任意一个相似分组中第个用户与第/>个用户之间的数据差异度/>的计算方法为:
其中,表示第/>个用户与第/>个用户之间的行差异,/>表示第/>个用户的范围区分度,/>表示第/>个用户的范围区分度,/>表示该相似分组中第/>个用户的范围区分度,/>表示该相似分组中用户的数量,/>表示以自然常数为底的指数函数。
进一步地,所述同一相似分组下不同用户之间的行差异,具体的获取方法为:
计算第个用户与第/>个用户相同内容项之间相关数据的差值绝对值,将所有内容项得到的差值绝对值的均值作为第/>个用户与第/>个用户之间的行差异。
进一步地,所述同一相似分组下不同用户之间的相似度调整系数,具体的获取方法为:
根据同一相似分组的二维矩阵中不同用户一行的元素,获取每个相似分组中每个用户的行差异程度;任意一个相似分组中第个用户与第/>个用户之间的相似度调整系数的计算方法为:
其中,表示第/>个用户与第/>个用户之间的相似度调整因子,/>表示第/>个用户与第/>个用户之间的数据差异度,/>表示该相似分组中不同用户之间的数据差异度的最大值,/>表示第/>个用户的行差异程度,/>表示第/>个用户的行差异程度;
获取该相似分组中任意两个用户之间的相似度调整因子,对所有相似度调整因子进行线性归一化,得到的结果作为两个用户之间的相似度调整系数。
进一步地,所述每个相似分组中每个用户的行差异程度,具体的获取方法为:
对于任意一个相似分组的二维矩阵,对该相似分组中任意两个用户的行向量计算DTW距离,所述行向量为二维矩阵中任意一个用户一行的元素按顺序排列形成的向量;计算该相似分组中第个用户与相似分组内其他所有用户的行向量之间DTW距离的方差,记为第个用户的行差异程度。
进一步地,所述通过相似度调整系数对相似分组中用户间的相似度进行调整,包括的具体方法为:
对于任意一个相似分组,对该相似分组通过协同过滤算法获取任意两个用户之间的相似度;根据任意两个用户之间的相似度调整系数对相似度进行调整,得到每个相似分组中不同用户之间的最终相似度。
进一步地,所述得到每个相似分组中不同用户之间的最终相似度,包括的具体方法为:
对于任意一个相似分组中任意两个用户,若该两个用户之间的相似度调整系数大于调整阈值,将该两用户之间的相似度与相似度调整系数的乘积,作为调整后的相似度;
若该两个用户之间的相似度调整系数小于或等于调整阈值,不对两个用户之间的相似度进行调整,将调整后的相似度及无需调整的相似度,记为该相似分组中不同用户之间的最终相似度。
进一步地,所述基于相似分组构建推荐模型,包括的具体方法为:
基于相似分组中用户间的最终相似度,通过深度学习网络模型构建推荐模型。
本发明的有益效果是:本发明通过对用户进行样本点转换,基于样本点及其邻域样本点的分布量化范围区分度,通过范围区分度对样本点的距离进行调整并完成用户的分组;通过相似分组的二维矩阵构建,并基于二维矩阵中行向量的差异,结合范围区分度,初步量化用户间的数据差异度,进而调整用户间的相似度,从而使得推荐模型充分考虑用户的独特行为偏好,进而输出最佳的权益包推荐结果;本发明期望对实现分组化的组内用户间的相似度调整,从单个用户在不同私域载体平台上的显性及隐性行为指标构成的行为偏好数据模式上进行分析,以最大程度保留目标用户特异性偏好;其中通过对相似分组内用户构建二维矩阵,基于二维矩阵中用户的行向量之间的差异量化用户间的数据差异度,并通过范围区分度进行调整,保证分组信息更加准确,进而反映相似分组内用户间的行为偏好差异,进而结合行向量之间的相似性量化相似度调整系数,并基于相似度调整系数对协同过滤算法中用户间的相似度进行调整;避免了存在覆盖面较广的流行性偏向导致的单个用户的独特偏好无法明显体现,进而导致构建出用户权益包的推荐模型的定制推荐结果不理想的缺点,使得针对用户特征的相似分组与整体上分布特征的特异性相似度关系的调整,可以更有利于进行后续深度学习模型的构建,从而使得权益包推荐会更加准确与具体。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种基于运营商数据分析的个性化权益包推荐系统结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明一个实施例所提供的一种基于运营商数据分析的个性化权益包推荐系统结构框图,该系统包括:
用户数据采集模块101,用于采集用户若干内容项的相关数据。
本实施例的目的是基于运营商信息数据库中不同用户不同内容项的相关数据,进行用户的个性化权益包定制推荐,因此首先需要获取用户若干内容项的相关数据。
具体的,通过在运营商信息数据库中内容投放系统的不同API接口处进行运营数据监测,包括用户在不同私域载体平台上的显性及隐性行为指标,例如提取不同用户的不同类别权益包的订购与否、续订时长这类显性行为指标,以及不同类型平台关注频率、停留时长这类隐性行为指标,将显性指标及隐性指标均作为用户的内容项,并对相同内容项下不同用户采集到的数据进行数值化处理,将处理后的数据作为每个用户每个内容项的相关数据;需要说明的是,本实施例对内容投放系统中所有用户各个内容项的相关数据进行采集。
用户分组构建模块102:
需要说明的是,在基于运营商网络上用户的相关数据进行协同过滤算法处理的过程中,行为指标往往可以直观地反应出用户对于私域载体平台的偏好程度,但用户面对多种权益包对应的私域载体的选择,其用户存在行为指标的偏好往往是一部分,存在数据稀疏性的问题,因此在计算用户项与内容项间的相似度时,应当在不同稀疏性分布分组的前提下进行分析,并根据精准分组结果实现相似度组合调整,最终完成用户权益包定制推荐模型的构建与调整,实现权益包的个性化定制推荐。
(1)对用户若干内容项的相关数据转换为样本空间中的样本点;根据每个样本点的邻域范围内所有样本点的分布,通过主成分分析获取每个样本点的范围一致性;根据每个样本点的邻域范围内不同样本点的范围一致性,获取每个样本点的范围区分度;基于样本点的范围区分度进行聚类,得到若干相似分组。
需要说明的是,由于用户对于权益包对应的私域载体平台的偏好选择是具有稀疏性的,其数据分布稀疏性特征会削弱用户偏好选择的显著性,即用户对不同私域载体平台的偏好选择存在多种情况,一种是此用户对私域载体平台的内容较为感兴趣,存在显性或隐性行为指标,另一种则是用户偶然性使用某一私域载体平台,存在的隐性行为指标,但在数据总量较大的情况下,偏好选择的稀疏性使得这两种情况对应的数据点的区分度较小,容易造成数据相似性分析的误判;因此需要根据运营商用户相关数据的数据分布稀疏性特征,对运营商用户相关数据进行分组划分,通过分布稀疏性差异确定分组条件,进而完成分组。
优选的,在本发明一个实施例中,对用户若干内容项的相关数据转换为样本空间中的样本点,包括的具体方法为:
将每个内容项作为一个维度,构建多维样本空间;对于任意一个用户,根据该用户每个内容项的相关数据,该用户在样本空间中对应一个样本点,该样本点在每个维度的坐标即为对应内容项下该用户的相关数据,则将所有用户都转换为样本空间中的样本点,得到若干样本点。
需要说明的是,通过将各用户基于各内容项的相关数据转换为样本点,而协同过滤算法需要获取样本点的邻居进行相似性推荐,通常采用预设的范围阈值的邻居规则,即邻域范围内的样本点作为该样本点的邻域样本点,然而在多维样本空间的不同区域上样本点对于范围阈值的响应程度不同,具体表现为样本点的邻域样本点的分布特征,对于单个样本点而言其邻域样本点在主成分方向上的分布均匀性状况可反映其样本点所处局部区域的样本点的相似程度,因此需要对邻域范围内样本点分布通过主成分分析,来对样本点的邻域进行范围一致性的量化。
优选的,在本发明一个实施例中,根据每个样本点的邻域范围内所有样本点的分布,通过主成分分析获取每个样本点的范围一致性,包括的具体方法为:
对样本空间中不同样本点计算欧式距离,对于第个样本点,通过协同过滤算法中预设的范围阈值,基于第/>个样本点与其他样本点的欧式距离,获取第/>个样本点的邻域范围,将邻域范围中的样本点记为第/>个样本点的邻域样本点;其中协同过滤算法中预设的范围阈值为算法中的现有参数,实际含义为一个预设的距离半径,则通过距离半径及第/>个数据点与其他数据点的欧式距离,得到邻域范围及邻域样本点。
进一步的,对第个样本点及邻域范围内所有邻域样本点通过PCA主成分分析得到若干主成分方向,每个主成分方向均对应一个特征值及投影长度,对所有主成分方向按照特征值大小降序的顺序进行排列,得到主成分方向之间的顺序;需要说明的是,主成分方向对应的特征值及投影长度通过PCA算法可直接得到,本实施例不再赘述;对于任意一个主成分方向,获取该主成分方向所在直线上两侧分别包含的第/>个样本点的邻域样本点的数量,将两个数量的比值作为第/>个样本点在该主成分方向下的邻域分布因子,其中比值为小值比大值,则第/>个样本点的范围一致性/>的计算方法为:
其中,表示第/>个样本点及邻域范围得到的主成分方向的数量,/>表示第/>个样本点在第/>个主成分方向下的邻域分布因子,/>表示第/>个样本点的第/>个主成分方向对应的投影长度,/>表示第/>个样本点在第/>个主成分方向下的邻域分布因子,/>表示第/>个样本点的第/>个主成分方向对应的投影长度,/>表示求绝对值,/>表示以自然常数为底的指数函数,本实施例采用/>模型来呈现反比例关系及归一化处理,/>为模型的输入,实施者可根据实际情况设置反比例函数及归一化函数;按照上述方法获取每个样本点的范围一致性。
所需说明的是,通过邻域范围内主成分方向的变化来量化范围一致性,相邻特征值下主成分方向变化越小,即邻域分布因子及投影长度变化均越小,则邻域范围内样本点分布越均匀,该样本点对应的用户在不同私域载体平台上的行为偏好属于常规偏好的可能性越大,即范围一致性越大。
需要说明的是,范围一致性反映的是局部区域的样本点的分布特征,是与预设范围阈值限制的邻域空间密切相关的,则对于邻域空间内的样本点的范围一致性差异则可以表征该预设范围阈值在此样本点构建的邻域空间的区分度,即样本点间的范围一致性差异在更大的空间尺度上的显著水平表征此范围阈值的区分度,更进一步反映出样本点的稀疏性分布特征对于范围阈值的影响程度大小,则表现得是用户的不同内容项组合在划分相邻用户结果时的可信程度。
优选的,在本发明一个实施例中,根据每个样本点的邻域范围内不同样本点的范围一致性,获取每个样本点的范围区分度,包括的具体方法为:
对于第个样本点及其邻域范围内的邻域样本点,分别计算第/>个样本点的范围一致性与每个邻域样本点的范围一致性之间的差值绝对值,得到的结果记为第/>个样本点与每个邻域样本点的范围差异,将第/>个样本点与所有邻域样本点的范围差异的均值,作为第/>个样本点的局部范围差异;按照上述方法获取第/>个样本点的每个邻域样本点的局部范围差异。
进一步的,第个样本点的范围区分度/>的计算方法为:
其中,表示第/>个样本点的局部范围差异,/>表示第/>个样本点及其所有邻域样本点的局部范围差异的均值,/>表示第/>个样本点及其所有邻域样本点的局部范围差异中的最大值,/>表示第/>个样本点及其所有邻域样本点的局部范围差异中的最小值,/>表示求绝对值,/>表示以自然常数为底的指数函数,本实施例采用/>模型来呈现反比例关系及归一化处理,/>为模型的输入,实施者可根据实际情况设置反比例函数及归一化函数;按照上述方法获取每个样本点的范围区分度。
所需说明的是,该样本点的局部范围差异与局部范围差异的均值越接近,比值越接近1,则邻域范围内局部范围差异的波动越小,范围一致性越好,则范围区分度越大;而邻域范围内局部范围差异的极差越大,局部范围差异的分布越不均匀,范围一致性越差,则范围区分度越小;而范围区分度越大,该样本点的邻域范围越符合常规偏好,越不需要对样本点间的距离进行调整,而范围区分度越小,该样本点的邻域范围中包含稀疏性特征的可能性越大,则需要对样本点间距离进行适当放大,从而避免未考虑独特偏好所带来的分组结果不理想的影响。
可选的,在其他实施例中,在获取到样本点的邻域范围后,不计算样本点的范围一致性,以第个样本点为例,获取第/>个样本点与其所有邻域样本点的欧式距离的方差,将方差的反比例归一化值作为第/>个样本点的范围区分度,本实施例采用/>模型来呈现反比例关系及归一化处理,/>为模型的输入,实施者可根据实际情况设置反比例函数及归一化函数。
优选的,在本发明一个实施例中,基于样本点的范围区分度进行聚类,得到若干相似分组,包括的具体方法为:
将所有样本点的范围区分度的均值,记为区分阈值;对于任意两个样本点,若该两个样本点的范围区分度均大于或等于区分阈值,则计算两个样本点的范围区分度的差值绝对值,并将1减去差值绝对值得到的差值,作为距离调整系数,并与两个样本点之间的欧式距离相乘,得到的乘积作为两个样本点之间的距离度量;若该两个样本点的范围区分度均小于区分阈值,或一个小于区分阈值而另一个大于或等于区分阈值,则计算两个样本点的范围区分度的差值绝对值,并将2减去差值绝对值得到的差值,作为距离调整系数,并与两个样本点之间的欧式距离相乘,得到的乘积作为两个样本点之间的距离度量。
进一步的,对样本空间中所有样本点基于距离度量进行DBSCAN聚类,得到若干聚簇,将同一聚簇中每个样本点对应的用户组成同一个分组,记为一个相似分组,则得到若干相似分组。
所需说明的是,通过样本点的范围区分度进行距离调整,范围区分度越小则需要将距离调整得越大,从而保证充分考虑独特偏好所带来的距离影响;而范围区分度越大,更偏向常规偏好,适当调小距离以便更容易将类似的常规偏好划分到同一相似分组中。
可选的,在其他实施例中,对样本点直接基于欧式距离作为距离度量进行DBSCAN聚类,得到若干聚簇,将同一聚簇中每个样本点对应的用户组成同一个分组,记为一个相似分组,则得到若干相似分组。
至此,通过对用户不同内容项的相关数据构建多维样本空间,并转换为样本点,通过样本点的分布进行主成分分析来量化范围一致性,进而基于范围一致性的差异得到范围区分度,在传统密度聚类的基础上充分考虑独特偏好不同于常规偏好所带来的稀疏性分布特征的影响,进而提高相似分组的分类结果的准确性。
(2)对同一相似分组的用户基于内容项的相关数据构建二维矩阵;根据二维矩阵中各行元素的差异及用户对应样本点的范围区分度,获取同一相似分组下不同用户之间的数据差异度;基于数据差异度及行向量之间的相似性,获取同一相似分组下不同用户之间的相似度调整系数;通过相似度调整系数对相似分组中用户间的相似度进行调整。
需要说明的是,由于获得的样本点的分组结果,其分组结果是对于数据的范围分布层面的上的相似性分组度量,对于单个用户的行为偏好而言,往往存在覆盖面较广的流行性偏向导致的单个用户的独特偏好无法明显体现,进而导致构建出用户权益包定制推荐模型的定制推荐结果不理想;因此应当从样本点所在的分组内的样本点对应的用户与内容项的匹配模式分析,以目标用户的偏好模式分析分组内的用户间的行为偏好差异,获取相似度调整系数,实现用户间数据相似度的调整,并利用调整后分组数据构建出用户权益包定制推荐模型,实现用户权益包个性化定制推荐。
优选的,在本发明一个实施例中,对同一相似分组的用户基于内容项的相关数据构建二维矩阵,包括的具体方法为:
对于任意一个相似分组,将每个内容项作为一列,将该相似分组中每个用户每个内容项的相关数据作为一行,则得到该相似分组的二维矩阵,二维矩阵中每个矩阵元素对应一个用户一个内容项的相关数据,同一行为同一用户不同内容项的相关数据,同一列为不同用户相同内容项的相关数据,按照上述方法获取每个相似分组的二维矩阵。
优选的,在本发明一个实施例中,根据二维矩阵中各行元素的差异及用户对应样本点的范围区分度,获取同一相似分组下不同用户之间的数据差异度,包括的具体方法为:
对于任意一个相似分组的二维矩阵,其中第个用户与第/>个用户之间的数据差异度/>的计算方法为:
其中,表示第/>个用户与第/>个用户之间的行差异,具体的计算方法为:计算第/>个用户与第/>个用户相同内容项之间相关数据的差值绝对值,将所有内容项得到的差值绝对值的均值作为第/>个用户与第/>个用户之间的行差异;/>表示第/>个用户的范围区分度,/>表示第/>个用户的范围区分度,/>表示该相似分组中第/>个用户的范围区分度,/>表示该相似分组中用户的数量,/>表示以自然常数为底的指数函数,本实施例采用/>模型来呈现反比例关系及归一化处理,/>为模型的输入,实施者可根据实际情况设置反比例函数及归一化函数;按照上述方法获取该相似分组中任意两个用户之间的数据差异度。
所需说明的是,通过两个用户的范围区分度在相似分组中所有范围区分度的占比均值,该值越大,两个用户的显著程度越大,该两用户的分组结果越可信,作为权重来基于行差异进行数据差异度的获取,则该相似分组内的用户对于各私域载体平台上的权益包偏好相似度更高;进而基于数据差异度对相似分组内用户间的相似度进行调整,从而保证相似分组内用户的分组信息更加准确。
优选的,在本发明一个实施例中,基于数据差异度及行向量之间的相似性,获取同一相似分组下不同用户之间的相似度调整系数,包括的具体方法为:
对于任意一个相似分组的二维矩阵,对该相似分组中任意两个用户的行向量计算DTW距离,行向量即为二维矩阵中任意一个用户一行的元素按顺序排列形成的向量;计算该相似分组中第个用户与相似分组内其他所有用户的行向量之间DTW距离的方差,记为第/>个用户的行差异程度,同理获取该相似分组中每个用户的行差异程度,则第/>个用户与第/>个用户之间的相似度调整系数的计算方法为:
其中,表示第/>个用户与第/>个用户之间的相似度调整因子,/>表示第/>个用户与第/>个用户之间的数据差异度,/>表示该相似分组中不同用户之间的数据差异度的最大值,/>表示第/>个用户的行差异程度,/>表示第/>个用户的行差异程度;按照上述方法获取该相似分组中任意两个用户之间的相似度调整因子,对所有相似度调整因子进行线性归一化,得到的结果作为两个用户之间的相似度调整系数。
所需说明的是,数据差异度越大,用户之间的相似度越需要考虑不同用户上各内容项的差异,则需要对用户之间的相似度进行调整;同时用户的行差异程度越大,则表明行向量的波动程度越大,该相似分组内用户之间的相似度越需要调整,则相似度调整系数越大。
优选的,在本发明一个实施例中,通过相似度调整系数对相似分组中用户间的相似度进行调整,包括的具体方法为:
对于任意一个相似分组,对该相似分组通过协同过滤算法获取任意两个用户之间的相似度,其中基于相似分组进行相似度计算为协同过滤算法的现有技术,本实施例不再赘述;预设一个调整阈值,若任意两个用户之间的相似度调整系数大于调整阈值,则表明需要对用户之间的相似度进行调整,则将该两用户之间的相似度与相似度调整系数的乘积,作为调整后的相似度;若任意两个用户之间的相似度调整系数小于或等于调整阈值,则不需要对两个用户之间的相似度进行调整,将调整后的相似度及无需调整的相似度,记为该相似分组中不同用户之间的最终相似度;按照上述方法获取每个相似分组中不同用户之间的最终相似度。
至此,通过对相似分组内用户构建二维矩阵,基于二维矩阵中用户的行向量之间的差异量化用户间的数据差异度,并通过范围区分度进行调整,保证分组信息更加准确,进而反映相似分组内用户间的行为偏好差异,进而结合行向量之间的相似性量化相似度调整系数,并基于相似度调整系数对协同过滤算法中用户间的相似度进行调整,从而提高后续基于相似分组及最终相似度构建的推荐模型的准确性。
个性化权益包推荐模块103,基于相似分组构建推荐模型,并对用户权益包进行个性化定制推荐。
优选的,在本发明一个实施例中,基于相似分组构建推荐模型,并对用户权益包进行个性化定制推荐,包括的具体方法为:
本实施例采用深度学习神经网络并基于相似分组构建推荐模型,根据不同相似分组给予不同的信息权重,即以高斯分布衡量组内与组外样本点间信息的权重,预设权重阈值,本实施例采用0.93进行叙述,相似分组内样本点间的权重大于权重阈值,不同相似分组的样本点的权重小于权重阈值,对深度学习神经网络卷积过程中的初始随机权重进行调整,即在卷积过程中初始随机权重上添加权重,并由此完成后续深度学习神经网络的相应操作,并通过反向传播机制调整参数,构建出用户权益包的推荐模型,其中深度学习网络模型为现有技术,本实施例不再赘述,基于相似分组进行推荐模型构建的过程中,基于用户间的最终相似度进行构建。
可选的,在其他实施例中,在获取到相似分组后,无需对用户间的相似度进行调整,以协同过滤算法输出的用户间的相似度进行推荐模型的构建。
进一步的,对于任意一个待分析用户,将该用户各内容项的相关数据输入到构建好的推荐模型中,输出该用户的权益包推荐结果,则完成用户的权益包个性化定制推荐。
至此,通过对用户进行样本点转换,基于样本点及其邻域样本点的分布量化范围区分度,通过范围区分度对样本点的距离进行调整并完成用户的分组;通过相似分组的二维矩阵构建,并基于二维矩阵中行向量的差异,结合范围区分度,初步量化用户间的数据差异度,进而调整用户间的相似度,从而使得推荐模型充分考虑用户的独特行为偏好,进而输出最佳的权益包推荐结果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,该系统包括:
用户数据采集模块,用于采集用户若干内容项的相关数据;
用户分组构建模块,用于将用户若干内容项的相关数据转换为样本空间中的样本点;根据样本点的分布,获取每个样本点的范围区分度;基于样本点欧式距离聚类得到若干相似分组;
对同一相似分组的用户基于内容项的相关数据构建二维矩阵;根据二维矩阵中各行元素的差异及用户对应样本点的范围区分度,获取同一相似分组下的不同用户之间的数据差异度;基于数据差异度及行向量之间的相似性,获取同一相似分组下不同用户之间的相似度调整系数;通过相似度调整系数对相似分组中用户间的相似度进行调整;
个性化权益包推荐模块,用于基于相似分组构建推荐模型,并对用户权益包进行个性化定制推荐。
2.根据权利要求1所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述每个样本点的范围区分度,具体的获取方法为:
根据样本点间的欧式距离,通过协同过滤算法获取每个样本点的邻域范围;对于第个样本点,获取第/>个样本点与其邻域范围内所有样本点的欧式距离的方差,将方差的反比例归一化值作为第/>个样本点的范围区分度。
3.根据权利要求1所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述对同一相似分组的用户基于内容项的相关数据构建二维矩阵,包括的具体方法为:
对于任意一个相似分组,将每个内容项作为一列,将该相似分组中每个用户每个内容项的相关数据作为一行,得到该相似分组的二维矩阵。
4.根据权利要求1所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述同一相似分组下不同用户之间的数据差异度,具体的获取方法为:
根据同一相似分组下不同用户相同内容项的相关数据,获取同一相似分组下不同用户之间的行差异;任意一个相似分组中第个用户与第/>个用户之间的数据差异度/>的计算方法为:
其中,表示第/>个用户与第/>个用户之间的行差异,/>表示第/>个用户的范围区分度,表示第/>个用户的范围区分度,/>表示该相似分组中第/>个用户的范围区分度,/>表示该相似分组中用户的数量,/>表示以自然常数为底的指数函数。
5.根据权利要求4所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述同一相似分组下不同用户之间的行差异,具体的获取方法为:
计算第个用户与第/>个用户相同内容项之间相关数据的差值绝对值,将所有内容项得到的差值绝对值的均值作为第/>个用户与第/>个用户之间的行差异。
6.根据权利要求1所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述同一相似分组下不同用户之间的相似度调整系数,具体的获取方法为:
根据同一相似分组的二维矩阵中不同用户一行的元素,获取每个相似分组中每个用户的行差异程度;任意一个相似分组中第个用户与第/>个用户之间的相似度调整系数的计算方法为:
其中,表示第/>个用户与第/>个用户之间的相似度调整因子,/>表示第/>个用户与第个用户之间的数据差异度,/>表示该相似分组中不同用户之间的数据差异度的最大值,表示第/>个用户的行差异程度,/>表示第/>个用户的行差异程度;
获取该相似分组中任意两个用户之间的相似度调整因子,对所有相似度调整因子进行线性归一化,得到的结果作为两个用户之间的相似度调整系数。
7.根据权利要求6所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述每个相似分组中每个用户的行差异程度,具体的获取方法为:
对于任意一个相似分组的二维矩阵,对该相似分组中任意两个用户的行向量计算DTW距离,所述行向量为二维矩阵中任意一个用户一行的元素按顺序排列形成的向量;计算该相似分组中第个用户与相似分组内其他所有用户的行向量之间DTW距离的方差,记为第/>个用户的行差异程度。
8.根据权利要求1所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述通过相似度调整系数对相似分组中用户间的相似度进行调整,包括的具体方法为:
对于任意一个相似分组,对该相似分组通过协同过滤算法获取任意两个用户之间的相似度;根据任意两个用户之间的相似度调整系数对相似度进行调整,得到每个相似分组中不同用户之间的最终相似度。
9.根据权利要求8所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述得到每个相似分组中不同用户之间的最终相似度,包括的具体方法为:
对于任意一个相似分组中任意两个用户,若该两个用户之间的相似度调整系数大于调整阈值,将该两用户之间的相似度与相似度调整系数的乘积,作为调整后的相似度;
若该两个用户之间的相似度调整系数小于或等于调整阈值,不对两个用户之间的相似度进行调整,将调整后的相似度及无需调整的相似度,记为该相似分组中不同用户之间的最终相似度。
10.根据权利要求8所述的一种基于运营商数据分析的个性化权益包推荐系统,其特征在于,所述基于相似分组构建推荐模型,包括的具体方法为:
基于相似分组中用户间的最终相似度,通过深度学习网络模型构建推荐模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410356025.9A CN117952726B (zh) | 2024-03-27 | 2024-03-27 | 一种基于运营商数据分析的个性化权益包推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410356025.9A CN117952726B (zh) | 2024-03-27 | 2024-03-27 | 一种基于运营商数据分析的个性化权益包推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117952726A true CN117952726A (zh) | 2024-04-30 |
CN117952726B CN117952726B (zh) | 2024-07-23 |
Family
ID=90804094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410356025.9A Active CN117952726B (zh) | 2024-03-27 | 2024-03-27 | 一种基于运营商数据分析的个性化权益包推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117952726B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118229349A (zh) * | 2024-05-07 | 2024-06-21 | 摘星社信息科技(浙江)股份有限公司 | 基于偏好分析的用户权益包个性化处理方法及系统 |
CN118468323A (zh) * | 2024-07-12 | 2024-08-09 | 智选数字技术(广州)股份有限公司 | 一种数字化商品运营平台数据安全保护方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120076477A (ko) * | 2010-11-25 | 2012-07-09 | 주식회사 케이티 | 상점 추천 방법 및 시스템 |
KR101821790B1 (ko) * | 2016-10-19 | 2018-01-24 | 단국대학교 산학협력단 | 사용자 선호도를 고려한 군집화 기반 추천 장치 및 방법 |
CN107944485A (zh) * | 2017-11-17 | 2018-04-20 | 西安电子科技大学 | 基于聚类群组发现的推荐系统及方法、个性化推荐系统 |
CN110287423A (zh) * | 2019-05-05 | 2019-09-27 | 江苏一乙生态农业科技有限公司 | 一种基于协同过滤的农场产品推荐系统及方法 |
WO2020073534A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于重聚类的推送方法、装置、计算机设备及存储介质 |
CN112100512A (zh) * | 2020-04-10 | 2020-12-18 | 南京邮电大学 | 一种基于用户聚类和项目关联分析的协同过滤推荐方法 |
US11062602B1 (en) * | 2020-05-01 | 2021-07-13 | Here Global B.V. | Method and apparatus for recommending temporary parking |
WO2022024946A1 (ja) * | 2020-07-28 | 2022-02-03 | 川崎重工業株式会社 | 状態監視装置、状態異常判別方法及び状態異常判別プログラム |
CN115907181A (zh) * | 2022-12-01 | 2023-04-04 | 郑州铁路职业技术学院 | 一种城市轨道交通乘客流量预测方法及系统 |
CN116541607A (zh) * | 2023-07-04 | 2023-08-04 | 量子数科科技有限公司 | 基于商品检索数据分析的智能推荐方法 |
-
2024
- 2024-03-27 CN CN202410356025.9A patent/CN117952726B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120076477A (ko) * | 2010-11-25 | 2012-07-09 | 주식회사 케이티 | 상점 추천 방법 및 시스템 |
KR101821790B1 (ko) * | 2016-10-19 | 2018-01-24 | 단국대학교 산학협력단 | 사용자 선호도를 고려한 군집화 기반 추천 장치 및 방법 |
CN107944485A (zh) * | 2017-11-17 | 2018-04-20 | 西安电子科技大学 | 基于聚类群组发现的推荐系统及方法、个性化推荐系统 |
WO2020073534A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于重聚类的推送方法、装置、计算机设备及存储介质 |
CN110287423A (zh) * | 2019-05-05 | 2019-09-27 | 江苏一乙生态农业科技有限公司 | 一种基于协同过滤的农场产品推荐系统及方法 |
CN112100512A (zh) * | 2020-04-10 | 2020-12-18 | 南京邮电大学 | 一种基于用户聚类和项目关联分析的协同过滤推荐方法 |
US11062602B1 (en) * | 2020-05-01 | 2021-07-13 | Here Global B.V. | Method and apparatus for recommending temporary parking |
WO2022024946A1 (ja) * | 2020-07-28 | 2022-02-03 | 川崎重工業株式会社 | 状態監視装置、状態異常判別方法及び状態異常判別プログラム |
CN115907181A (zh) * | 2022-12-01 | 2023-04-04 | 郑州铁路职业技术学院 | 一种城市轨道交通乘客流量预测方法及系统 |
CN116541607A (zh) * | 2023-07-04 | 2023-08-04 | 量子数科科技有限公司 | 基于商品检索数据分析的智能推荐方法 |
Non-Patent Citations (3)
Title |
---|
张海燕, 丁峰, 姜丽红: "基于模糊聚类的协同过滤推荐方法", 计算机仿真, no. 08, 30 August 2005 (2005-08-30) * |
私域深度运营: "私域运营指南_用户分层的底层逻辑", Retrieved from the Internet <URL:https://www.niuxuan.cn/redian/78481.html> * |
霍纬纲;程震;程文莉;: "面向不等长多维时间序列的聚类改进算法", 计算机应用, no. 12, 10 December 2017 (2017-12-10) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118229349A (zh) * | 2024-05-07 | 2024-06-21 | 摘星社信息科技(浙江)股份有限公司 | 基于偏好分析的用户权益包个性化处理方法及系统 |
CN118229349B (zh) * | 2024-05-07 | 2024-08-09 | 摘星社信息科技(浙江)股份有限公司 | 基于偏好分析的用户权益包个性化处理方法及系统 |
CN118468323A (zh) * | 2024-07-12 | 2024-08-09 | 智选数字技术(广州)股份有限公司 | 一种数字化商品运营平台数据安全保护方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117952726B (zh) | 2024-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117952726B (zh) | 一种基于运营商数据分析的个性化权益包推荐系统 | |
CN109583651A (zh) | 一种保险电商平台用户流失预测的方法和装置 | |
CN116431931B (zh) | 实时增量数据统计分析方法 | |
CN107894998A (zh) | 视频推荐方法及装置 | |
CN108615177B (zh) | 基于加权提取兴趣度的电子终端个性化推荐方法 | |
CN110766042A (zh) | 一种基于最大相关最小冗余的多标记特征选择方法及装置 | |
CN116541607B (zh) | 基于商品检索数据分析的智能推荐方法 | |
CN110321492A (zh) | 一种基于社区信息的项目推荐方法及系统 | |
Zhao et al. | Bank customer churn prediction based on support vector machine: Taking a commercial bank's VIP customer churn as the example | |
CN109271555B (zh) | 信息聚类方法、系统、服务器及计算机可读存储介质 | |
CN118132965B (zh) | 基于大数据的社交平台用户智能分析方法 | |
Chen et al. | Using function approximation for personalized point-of-interest recommendation | |
CN111144430A (zh) | 基于遗传算法的养卡号码识别方法及装置 | |
CN117522584A (zh) | 基于智慧金融大数据的金融产品推荐方法 | |
CN117743692A (zh) | 一种个性化内容推荐的方法及装置 | |
Moscati et al. | Multiobjective Hyperparameter Optimization of Recommender Systems. | |
CN118827775B (zh) | 智能机器人辅助的短信推送管理系统及方法 | |
CN118410418B (zh) | 一种产品质量监测方法及系统 | |
CN118861440B (zh) | 一种基于云计算实现数据推荐的方法及系统 | |
CN116501977B (zh) | 线上检测委托中用户画像的构建方法及系统 | |
CN117808549B (zh) | 一种基于企业数据提供健康度解决方案的产品推荐方法 | |
CN118034844B (zh) | 一种平板电脑多用户共享界面管理方法及系统 | |
CN115689128B (zh) | 基于crm的客户数据分析方法及系统 | |
CN118332197B (zh) | 基于数字金融的大数据推送方法及系统 | |
CN118410362A (zh) | 一种用户多维度指标数据的聚合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |