CN115203500A - 一种用户标签的丰富方法、装置、计算机设备和存储介质 - Google Patents
一种用户标签的丰富方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN115203500A CN115203500A CN202110382668.7A CN202110382668A CN115203500A CN 115203500 A CN115203500 A CN 115203500A CN 202110382668 A CN202110382668 A CN 202110382668A CN 115203500 A CN115203500 A CN 115203500A
- Authority
- CN
- China
- Prior art keywords
- user
- matrix
- association degree
- generate
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Abstract
本发明实施例提供了一种用户标签的丰富方法、装置、计算机设备和存储介质。本发明实施例提供的技术方案中,获取用户终端的状态值;根据状态值,生成状态矩阵;对用户终端的状态矩阵进行计算,生成相似度矩阵;根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新,可以保证用户信息的完整性,从而提高用户标签的准确性和丰富性。
Description
【技术领域】
本发明涉及网络应用领域,尤其涉及一种用户标签的丰富方法、装置、计算机设备和存储介质。
【背景技术】
随着互联网快速发展,使用移动终端的网民越来越多,移动终端每天根据网络行为会产生大量移动数据,企业可以通过互联网对移动数据进行大数据分析,从而实现针对用户偏好的精准营销。
相关技术中,主要是针对用户行为进行大数据分析并根据分析结果为用户添加不同的标签,按照用户标签对用户进行产品推荐;由于产品数量庞大,导致用户标签存在大量空值,相关技术中通过单值分解或聚类方法来丰富用户标签。但通过上述单值分解或聚类方法进行抽取主要信息的过程中,会丢失用户信息,导致生成的用户标签的准确性较低。
【发明内容】
有鉴于此,本发明实施例提供了一种用户标签的丰富方法、装置、计算机设备和存储介质,可以保证用户信息的完整性,从而提高用户标签的准确性和丰富性。
一方面,本发明实施例提供了一种用户标签的丰富方法,所述方法包括:
获取用户终端的状态值;
根据状态值,生成状态矩阵;
对用户终端的状态矩阵进行计算,生成相似度矩阵;
根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;
根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新。
可选地,用户终端的状态值包括处理器平均使用率、存储器平均使用率和屏幕点亮平均时间;
根据状态值,生成状态矩阵,包括:
对处理器平均使用率进行归一化处理,生成第一矩阵;
对存储器平均使用率进行归一化处理,生成第二矩阵;
对屏幕点亮平均时间进行归一化处理,生成第三矩阵;
对第一矩阵、第二矩阵和第三矩阵进行拼接,生成状态矩阵。
可选地,内容偏好关联矩阵包括至少一个用户和每个用户在每个时间间隔的标签关联度;
根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,包括:
从相似度矩阵选取出与当前用户之间的相似度大于相似度阈值的相关用户;
将相关用户与内容偏好关联矩阵进行匹配,匹配出相关用户对应的标签关联度;
将相关用户的标签关联度和当前用户的标签关联度确定为用户向量集合。
可选地,根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新,包括:
对当前用户的标签关联度进行遍历,获取当前用户的标签关联度为空值对应的时间间隔;
对时间间隔对应的相关用户的标签关联度进行计算,生成当前用户的更新关联度;
将更新关联度确定为当前用户的标签关联度。
可选地,对时间间隔对应的相关用户的标签关联度进行计算,生成当前用户的更新关联度,包括:
将时间间隔对应的相关用户的标签关联度相加,生成相加结果;
将相加结果除以用户总数量,生成当前用户的更新关联度。
可选地,获取用户终端的状态值,包括:
在设置的时间周期内,按照预设时间间隔从终端日志中获取用户终端的状态值。
可选地,对用户终端的状态矩阵进行计算,生成相似度矩阵,包括:
通过皮尔逊系数,对用户终端的状态矩阵进行计算,生成相似度矩阵。
另一方面,本发明实施例提供了一种辅助设备的确定装置,包括:
获取单元,用于获取用户终端的状态值;
第一生成单元,用于根据状态值,生成状态矩阵;
第二生成单元,用于对用户终端的状态矩阵进行计算,生成相似度矩阵;
第三生成单元,用于根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;
更新单元,用于根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新。
另一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述用户标签的丰富方法。
另一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现上述用户标签的丰富方法。
本发明实施例的方案中,获取用户终端的状态值;根据状态值,生成状态矩阵;对用户终端的状态矩阵进行计算,生成相似度矩阵;根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新,可以保证用户信息的完整性,从而提高用户标签的准确性和丰富性。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种用户标签的丰富方法的流程图;
图2为本发明实施例提供的又一种用户标签的丰富方法的流程图;
图3为本发明实施例提供的一种用户标签的丰富装置的结构示意图;
图4为本发明实施例提供的一种计算机设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述设定阈值,但这些设定阈值不应限于这些术语。这些术语仅用来将设定阈值彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一设定阈值也可以被称为第二设定阈值,类似地,第二设定阈值也可以被称为第一设定阈值。
目前,大数据系统中,用户标签的丰富程度和准确程度直接决定了产品推荐结果的个性化契合度,用户标签越丰富越准确,产品推荐结果的契合度越高。相关技术中,通过采集用户基础信息以及基于终端应用的用户使用行为分析,为用户添加用户标签,用户标签主要包括个人述性标签、规则标签、行为标签、兴趣标签、群组标签等。其中,基于终端应用的用户使用行为包括内容搜索、内容浏览和购买等操作。
本发明实施例的数据源不仅关注于用户对终端的使用行为,主要关注终端硬件产生的终端日志,通过单位时间内处理器(CPU)、内存、屏幕点亮时间三个因素对用户进行画像,从新的角度提出了一种分析用户之间相似度的方式。
图1为本发明实施例提供的一种用户标签的丰富方法的流程图,如图1所示,该方法包括:
步骤101、获取用户终端的状态值。
步骤102、根据状态值,生成状态矩阵。
步骤103、对用户终端的状态矩阵进行计算,生成相似度矩阵。
步骤104、根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度。
步骤105、根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新。
本发明实施例提供的技术方案中,获取用户终端的状态值;根据状态值,生成状态矩阵;对用户终端的状态矩阵进行计算,生成相似度矩阵;根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新,可以保证用户信息的完整性,从而提高用户标签的准确性和丰富性。
图2为本发明实施例提供的又一种用户标签的丰富方法的流程图,如图2所示,该方法包括:
步骤201、获取用户终端的状态值。
本发明实施例中,各步骤由服务器执行。
本发明实施例中,用户终端包括但不限于手机、平板电脑、可穿戴设备、音箱或者个人计算机。
本发明实施例中,用户终端的状态值包括处理器(CPU)平均使用率、存储器(RAM)平均使用率和屏幕点亮平均时间。
具体地,在设置的时间周期内,按照预设时间间隔从终端日志中获取用户终端的状态值。在用户终端的运行过程中,会生成大量终端日志,终端日志中记载有用户终端在运行过程中的信息,例如:CPU使用率、RAM使用率和屏幕点亮时间。其中,时间周期和时间间隔可以根据实际需求进行设置。作为一种可选方案,时间周期设置为24小时,时间间隔设置为1小时。服务器根据获取的CPU使用率,计算出1小时内的CPU平均使用率;根据获取的RAM使用率,计算出1小时内的RAM平均使用率;根据获取的屏幕点亮时间,计算出1小时内的屏幕点亮平均时间。
步骤202、根据状态值,生成状态矩阵。
本发明实施例中,步骤202具体包括:
步骤2021、对CPU平均使用率进行归一化处理,生成第一矩阵。
本发明实施例中,通过离差标准化(Min-max normalization)方式对CPU平均使用率进行归一化处理,生成第一矩阵,第一矩阵包括多个用户和每个用户在每个时间间隔内归一化CPU使用率。
具体地,通过公式Cij=(Cxj-Cmin)/(Cmax-Cmin),对CPU平均使用率进行计算,生成第一矩阵。其中,Cij为用户i在第j个小时的归一化CPU使用率,Cxj为用户x在第j个小时的CPU平均使用率,Cmin为用户x在时间周期的所有时间间隔内的最小CPU平均使用率,Cmax为用户x在时间周期的所有时间间隔内的最大CPU平均使用率。例如:第一矩阵如表1所示。
表1
T1 | T2 | T3 | … | T24 | |
U1 | C<sub>1,1</sub> | C<sub>1,2</sub> | C<sub>1,3</sub> | … | C<sub>1,24</sub> |
U2 | C<sub>2,1</sub> | C<sub>2,2</sub> | C<sub>2,3</sub> | … | C<sub>2,24</sub> |
… | … | … | … | … | … |
其中,T1为第1个时间间隔,T2为第2个时间间隔,T3为第3个时间间隔,T24为第24个时间间隔,U1为用户1,U2为用户2,C1,1为用户1在第1个小时的归一化CPU使用率,C1,2为用户1在第2个小时的归一化CPU使用率,C2,1为用户2在第1个小时的归一化CPU使用率,以此类推。
步骤2022、对RAM平均使用率进行归一化处理,生成第二矩阵。
本发明实施例中,通过离差标准化(Min-max normalization)方式对RAM平均使用率进行归一化处理,生成第二矩阵,第二矩阵包括多个用户和每个用户在每个时间间隔内归一化RAM使用率。
具体地,通过公式Rij=(Rxj-Rmin)/(Rmax-Rmin),对RAM平均使用率进行计算,生成第二矩阵。其中,Rij为用户i在第j个小时的归一化RAM使用率,Rxj为用户x在第j个小时的RAM平均使用率,Rmin为用户x在时间周期的所有时间间隔内的最小RAM平均使用率,Rmax为用户x在时间周期的所有时间间隔内的最大RAM平均使用率。例如:第二矩阵如表2所示。
表2
T1 | T2 | T3 | … | T24 | |
U1 | R<sub>1,1</sub> | R<sub>1,2</sub> | R<sub>1,3</sub> | … | R<sub>1,24</sub> |
U2 | R<sub>2,1</sub> | R<sub>2,2</sub> | R<sub>2,3</sub> | … | R<sub>2,24</sub> |
… | … | … | … | … | … |
其中,T1为第1个时间间隔,T2为第2个时间间隔,T3为第3个时间间隔,T24为第24个时间间隔,U1为用户1,U2为用户2,R1,1为用户1在第1个小时的归一化RAM使用率,R1,2为用户1在第2个小时的归一化RAM使用率,R2,1为用户2在第1个小时的归一化RAM使用率,以此类推。
步骤2023、对屏幕点亮平均时间进行归一化处理,生成第三矩阵。
本发明实施例中,通过离差标准化(Min-max normalization)方式对屏幕点亮平均时间进行归一化处理,生成第三矩阵,第三矩阵包括多个用户和每个用户在每个时间间隔内归一化屏幕点亮时间。
具体地,通过公式Dij=(Dxj-Rmin)/(Dmax-Dmin),对屏幕点亮平均时间进行计算,生成第三矩阵。其中,Dij为用户i在第j个小时的归一化屏幕点亮时间,Dxj为用户x在第j个小时的屏幕点亮平均时间,Dmin为用户x在时间周期的所有时间间隔内的最小屏幕点亮平均时间,Dmax为用户x在时间周期的所有时间间隔内的最大屏幕点亮平均时间。例如:第三矩阵如表3所示。
表3
T1 | T2 | T3 | … | T24 | |
U1 | D<sub>1,1</sub> | D<sub>1,2</sub> | D<sub>1,3</sub> | … | D<sub>1,24</sub> |
U2 | D<sub>2,1</sub> | D<sub>2,2</sub> | D<sub>2,3</sub> | … | D<sub>2,24</sub> |
… | … | … | … | … | … |
其中,T1为第1个时间间隔,T2为第2个时间间隔,T3为第3个时间间隔,T24为第24个时间间隔,U1为用户1,U2为用户2,D1,1为用户1在第1个小时的归一化屏幕点亮时间,D1,2为用户1在第2个小时的归一化屏幕点亮时间,D2,1为用户2在第1个小时的归一化屏幕点亮时间,以此类推。
步骤2024、对第一矩阵、第二矩阵和第三矩阵进行拼接,生成状态矩阵。
具体地,对第一矩阵、第二矩阵和第三矩阵进行向量拼接,生成状态矩阵,状态矩阵包括多个特征值。状态矩阵可以表示用户在时间周期的用户终端的使用状态,以时间周期为24小时为例,第i个用户在24小时的用户终端的使用状态为Ui=(Ci,1,Ci,2,…,Ci,24,Ri,1,Ri,2,…,Ri,24,Di,1,Di,2,…,Di,24),其中,Ci,1,Ci,2,…,Ci,24,Ri,1,Ri,2,…,Ri,24,Di,1,Di,2,…,Di,24为用户i的72个特征值。例如:状态矩阵如表4所示。
表4
步骤203、通过皮尔逊系数,对用户终端的状态矩阵进行计算,生成相似度矩阵,相似度矩阵包括用户之间的相似度。
具体地,通过皮尔逊系数对用户终端的状态矩阵进行计算,生成相似度矩阵,相似度矩阵包括多个用户和用户之间的相似度。其中,wij为用户i与用户j之间的相似度,Ui,k为用户i在第k个特征值下的取值,Uj,k为用户j在第k个特征值下的取值,为用户i的平均值,为用户j的平均值,G为用户的特征值总个数。例如:相似度矩阵如表5所示。
表5
用户相似度 | U1 | U2 | U3 | U4 | U5 | … |
U1 | w<sub>1,1</sub> | w<sub>1,2</sub> | w<sub>1,3</sub> | w<sub>1,4</sub> | w<sub>1,5</sub> | … |
U2 | w<sub>2,1</sub> | w<sub>2,2</sub> | w<sub>2,3</sub> | w<sub>2,4</sub> | w<sub>2,5</sub> | … |
U3 | w<sub>3,1</sub> | w<sub>3,2</sub> | w<sub>3,3</sub> | w<sub>3,4</sub> | w<sub>3,5</sub> | … |
U4 | w<sub>4,1</sub> | w<sub>4,2</sub> | w<sub>4,3</sub> | w<sub>4,4</sub> | w<sub>4,5</sub> | … |
U5 | w<sub>5,1</sub> | w<sub>5,2</sub> | w<sub>5,3</sub> | w<sub>5,4</sub> | w<sub>5,5</sub> | … |
… | … | … | … | … | … | … |
其中,w1,1为用户1与用户1之间的用户相似度,w1,2为用户1与用户2之间的用户相似度,w1,3为用户1与用户3之间的用户相似度,以此类推。
步骤204、从相似度矩阵选取出与当前用户之间的相似度大于相似度阈值的相关用户。
本发明实施例中,相似度阈值具备相似度范围,例如:相似度范围包括(0.5,1),相似度阈值的具体取值可以根据实际试验效果进行设置。作为一种可选方案,相似度阈值为0.75。
具体地,预先选定当前用户,根据当前用户,从相似度矩阵选取出与当前用户之间的相似度大于相似度阈值的用户;将选取出的用户确定为相关用户。例如:当前用户选定为用户1(U1),根据相似度矩阵确定出相关用户为用户3(U3)、用户4(U4)和用户7(U7)。
步骤205、将相关用户与内容偏好关联矩阵进行匹配,匹配出相关用户对应的标签关联度。
本发明实施例中,内容偏好关联矩阵为存储介质中预先存储的基于内容偏好的用户-标签关联矩阵,内容偏好关联矩阵包括至少一个用户和每个用户在每个时间间隔的标签关联度。例如:内容偏好关联矩阵如表6所示。
表6
其中,NULL表示用户1在第1个时间间隔的标签相似度为空值,UsrTag1,2表示用户1在第2个时间间隔的标签相似度的值,以此类推。由表6可见,内容偏好矩阵中存在较多空值,即:内容偏好矩阵的稀疏性较高。
例如:当前用户选定为用户1(U1),相关用户为用户3(U3)、用户4(U4)和用户7(U7);将相关用户与内容偏好关联矩阵进行匹配,匹配出相关用户对应的标签关联度。相关用户U3的标签关联度为UsrTag3,1、NULL、NULL、UsrTag3,4、UsrTag3,5;相关用户U4的标签关联度为NULL、UsrTag4,2、UsrTag4,3、UsrTag4,4、UsrTag4,5;相关用户U7的标签关联度为UsrTag7,1、NULL、UsrTag7,3、NULL、NULL。
步骤206、将相关用户的标签关联度和当前用户的标签关联度确定为用户向量集合。
例如:当前用户U1的标签关联度为NULL、UsrTag1,2、NULL、UsrTag1,4、UsrTag1,5;相关用户U3的标签关联度为UsrTag3,1、NULL、NULL、UsrTag3,4、UsrTag3,5;相关用户U4的标签关联度为NULL、UsrTag4,2、UsrTag4,3、UsrTag4,4、UsrTag4,5;相关用户U7的标签关联度为UsrTag7,1、NULL、UsrTag7,3、NULL、NULL。用户向量集合Us如表7所示。
表7
Us | T1 | T2 | T3 | T4 | T5 | … |
U1 | NULL | UsrTag<sub>1,2</sub> | NULL | UsrTag<sub>1,4</sub> | UsrTag<sub>1,5</sub> | … |
U3 | UsrTag<sub>3,1</sub> | NULL | NULL | UsrTag<sub>3,4</sub> | UsrTag<sub>3,5</sub> | … |
U4 | NULL | UsrTag<sub>4,2</sub> | UsrTag<sub>4,3</sub> | UsrTag<sub>4,4</sub> | UsrTag<sub>4,5</sub> | … |
U7 | UsrTag<sub>7,1</sub> | NULL | UsrTag<sub>7,3</sub> | NULL | NULL | … |
步骤207、对当前用户的标签关联度进行遍历,获取当前用户的标签关联度为空值对应的时间间隔。
本发明实施例中,当前用户U1的标签关联度为NULL、UsrTag1,2、NULL、UsrTag1,4、UsrTag1,5,空值对应的时间间隔分别为第1个时间间隔T1和第3个时间间隔T3。
步骤208、对时间间隔对应的相关用户的标签关联度进行计算,生成当前用户的更新关联度。
本发明实施例中,步骤208具体包括:
步骤2081、将时间间隔对应的相关用户的标签关联度相加,生成相加结果。
本发明实施例中,第1个时间间隔对应的相关用户U3的标签关联度为UsrTag3,1,相关用户U4对应的标签关联度为NULL,相关用户U7对应的标签关联度为UsrTag7,1。将时间间隔对应的相关用户的标签关联度相加,即:UsrTag3,1+UsrTag7,1。
步骤2082、将相加结果除以用户总数量,生成当前用户的更新关联度。
本发明实施例中,相加结果为UsrTag3,1+UsrTag7,1,用户总数量为M,则当前用户U1的更新关联度为(UsrTag3,1+UsrTag7,1)/M。
步骤209、将更新关联度确定为当前用户的标签关联度。
本发明实施例中,更新后的用户向量机如表8所示。
表8
本发明实施例提供的用户标签的丰富方法的技术方案中,获取用户终端的状态值;根据状态值,生成状态矩阵;对用户终端的状态矩阵进行计算,生成相似度矩阵,相似度矩阵包括用户之间的相似度;根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新,可以保证用户信息的完整性,从而提高用户标签的准确性和丰富性。
图3为本发明实施例提供的一种用户标签的丰富装置的结构示意图,该装置用于执行上述用户标签的丰富方法,如图3所示,该装置包括:获取单元11、第一生成单元12、第二生成单元13、第三生成单元14和更新单元15。
获取单元11用于获取用户终端的状态值。
第一生成单元12用于根据状态值,生成状态矩阵。
第二生成单元13用于对用户终端的状态矩阵进行计算,生成相似度矩阵。
第三生成单元14用于根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度。
更新单元15用于根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新。
本发明实施例中,第一生成单元12具体用于对处理器平均使用率进行归一化处理,生成第一矩阵;对存储器平均使用率进行归一化处理,生成第二矩阵;对屏幕点亮平均时间进行归一化处理,生成第三矩阵;对第一矩阵、第二矩阵和第三矩阵进行拼接,生成状态矩阵。
本发明实施例中,第三生成单元14具体用于从相似度矩阵选取出与当前用户之间的相似度大于相似度阈值的相关用户;将相关用户与内容偏好关联矩阵进行匹配,匹配出相关用户对应的标签关联度;将相关用户的标签关联度和当前用户的标签关联度确定为用户向量集合。
本发明实施例,更新单元15具体用于对当前用户的标签关联度进行遍历,获取当前用户的标签关联度为空值对应的时间间隔;对时间间隔对应的相关用户的标签关联度进行计算,生成当前用户的更新关联度;将更新关联度确定为当前用户的标签关联度。
本发明实施例中,更新单元15具体用于将时间间隔对应的相关用户的标签关联度相加,生成相加结果;将相加结果除以用户总数量,生成当前用户的更新关联度。
本发明实施例中,获取单元11具体用于在设置的时间周期内,按照预设时间间隔从终端日志中获取用户终端的状态值。
本发明实施例中,第二生成单元13具体用于通过皮尔逊系数,对用户终端的状态矩阵进行计算,生成相似度矩阵。
本发明实施例的方案中,获取用户终端的状态值;根据状态值,生成状态矩阵;对用户终端的状态矩阵进行计算,生成相似度矩阵;根据预设的相似度阈值、存储的内容偏好关联矩阵和相似度矩阵,生成当前用户的相关用户向量集合,当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;根据相关用户的标签关联度,对当前用户的标签关联度进行遍历更新,可以保证用户信息的完整性,从而提高用户标签的准确性和丰富性。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述用户标签的丰富方法的实施例的各步骤,具体描述可参见上述用户标签的丰富方法的实施例。
本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现上述用户标签的丰富方法的实施例的各步骤,具体描述可参见上述用户标签的丰富方法的实施例。
图4为本发明实施例提供的一种计算机设备的示意图。如图4所示,该实施例的计算机设备30包括:处理器31、存储器32以及存储在存储32中并可在处理器31上运行的计算机程序33,该计算机程序33被处理器31执行时实现实施例中的应用于用户标签的丰富方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器31执行时实现实施例中应用于用户标签的丰富装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备30包括,但不仅限于,处理器31、存储器32。本领域技术人员可以理解,图4仅仅是计算机设备30的示例,并不构成对计算机设备30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器31可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器32可以是计算机设备30的内部存储单元,例如计算机设备30的硬盘或内存。存储器32也可以是计算机设备30的外部存储设备,例如计算机设备30上配备的插接式硬盘,智能存储(Smart Media,SM)卡,安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器32还可以既包括计算机设备30的内部存储单元也包括外部存储设备。存储器32用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器32还可以用于暂时地存储已经输出或者将要输出的数据。
关于上述实施例中描的各个装置、产品包含模块/单元,其可以是软件模块/单元,也可以是硬件模块/单元,或者也可以部分是软件模块/单元,部分是硬件模块/单元。例如,对于应用或集成芯片的各个装置、产品其包含的各个模块/单元可以都采用电路等硬件的方式实现,或者至少部分模块/单元可以采用软件程序的方式实现,该运行于芯片内部集成处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应于或集成芯片模组的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同模块/单元可以位于芯片模组的同一件(例如片、电路模块等)或者不同组件中,至少部分/单元可以采用软件程序的方式实现,该软件程序运行于芯片模组内部集成处理器剩余(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于终端的各个装置、产品,其包含的模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于终端内同一组件(例如,芯片、电路模块等)或者不同组件中,或者至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于终端内部集成的处理器,剩余(如果有)部分模块/单元可以采用电路等硬件方式实现。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种用户标签的丰富方法,其特征在于,所述方法包括:
获取用户终端的状态值;
根据所述状态值,生成状态矩阵;
对所述用户终端的状态矩阵进行计算,生成相似度矩阵;
根据预设的相似度阈值、存储的内容偏好关联矩阵和所述相似度矩阵,生成当前用户的相关用户向量集合,所述当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;
根据所述相关用户的标签关联度,对所述当前用户的标签关联度进行遍历更新。
2.根据权利要求1所述的方法,其特征在于,所述用户终端的状态值包括处理器平均使用率、存储器平均使用率和屏幕点亮平均时间;
所述根据所述状态值,生成状态矩阵,包括:
对所述处理器平均使用率进行归一化处理,生成第一矩阵;
对所述存储器平均使用率进行归一化处理,生成第二矩阵;
对所述屏幕点亮平均时间进行归一化处理,生成第三矩阵;
对所述第一矩阵、所述第二矩阵和所述第三矩阵进行拼接,生成所述状态矩阵。
3.根据权利要求1所述的方法,其特征在于,所述内容偏好关联矩阵包括至少一个用户和每个所述用户在每个时间间隔的标签关联度;
所述根据预设的相似度阈值、存储的内容偏好关联矩阵和所述相似度矩阵,生成当前用户的相关用户向量集合,包括:
从所述相似度矩阵选取出与所述当前用户之间的相似度大于所述相似度阈值的所述相关用户;
将所述相关用户与所述内容偏好关联矩阵进行匹配,匹配出所述相关用户对应的标签关联度;
将所述相关用户的标签关联度和所述当前用户的标签关联度确定为所述用户向量集合。
4.根据权利要求1所述的方法,其特征在于,所述根据所述相关用户的标签关联度,对所述当前用户的标签关联度进行遍历更新,包括:
对所述当前用户的标签关联度进行遍历,获取所述当前用户的标签关联度为空值对应的时间间隔;
对所述时间间隔对应的所述相关用户的标签关联度进行计算,生成所述当前用户的更新关联度;
将所述更新关联度确定为所述当前用户的标签关联度。
5.根据权利要求4所述的方法,其特征在于,所述对所述时间间隔对应的所述相关用户的标签关联度进行计算,生成所述当前用户的更新关联度,包括:
将所述时间间隔对应的所述相关用户的标签关联度相加,生成相加结果;
将所述相加结果除以用户总数量,生成所述当前用户的更新关联度。
6.根据权利要求1所述的方法,其特征在于,所述获取用户终端的状态值,包括:
在设置的时间周期内,按照预设时间间隔从终端日志中获取用户终端的状态值。
7.根据权利要求1所述的方法,其特征在于,所述对所述用户终端的状态矩阵进行计算,生成相似度矩阵,包括:
通过皮尔逊系数,对所述用户终端的状态矩阵进行计算,生成相似度矩阵。
8.一种用户标签的丰富装置,其特征在于,所述装置包括:
获取单元,用于获取用户终端的状态值;
第一生成单元,用于根据所述状态值,生成状态矩阵;
第二生成单元,用于对所述用户终端的状态矩阵进行计算,生成相似度矩阵;
第三生成单元,用于根据预设的相似度阈值、存储的内容偏好关联矩阵和所述相似度矩阵,生成当前用户的相关用户向量集合,所述当前用户的相关用户向量集合包括当前用户的标签关联度和相关用户的标签关联度;
更新单元,用于根据所述相关用户的标签关联度,对所述当前用户的标签关联度进行遍历更新。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的用户标签的丰富方法。
10.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现权利要求1至7任意一项所述的用户标签的丰富方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110382668.7A CN115203500A (zh) | 2021-04-09 | 2021-04-09 | 一种用户标签的丰富方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110382668.7A CN115203500A (zh) | 2021-04-09 | 2021-04-09 | 一种用户标签的丰富方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115203500A true CN115203500A (zh) | 2022-10-18 |
Family
ID=83570940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110382668.7A Pending CN115203500A (zh) | 2021-04-09 | 2021-04-09 | 一种用户标签的丰富方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115203500A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117075756A (zh) * | 2023-10-12 | 2023-11-17 | 深圳市麦沃宝科技有限公司 | 用于智能触摸键盘的实时感应数据处理方法 |
-
2021
- 2021-04-09 CN CN202110382668.7A patent/CN115203500A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117075756A (zh) * | 2023-10-12 | 2023-11-17 | 深圳市麦沃宝科技有限公司 | 用于智能触摸键盘的实时感应数据处理方法 |
CN117075756B (zh) * | 2023-10-12 | 2024-03-19 | 深圳市麦沃宝科技有限公司 | 用于智能触摸键盘的实时感应数据处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019200806A1 (zh) | 文本分类模型的生成装置、方法及计算机可读存储介质 | |
US20200311113A1 (en) | Method and device for extracting core word of commodity short text | |
US10423664B2 (en) | Method and system for providing recommended terms | |
US20150081683A1 (en) | Ranking search results based on word weight | |
CN109508458B (zh) | 法律实体的识别方法及装置 | |
US10650274B2 (en) | Image clustering method, image clustering system, and image clustering server | |
CN103268317A (zh) | 对图像进行语义注释的系统和方法 | |
CN110334209B (zh) | 文本分类方法、装置、介质及电子设备 | |
WO2019061664A1 (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
WO2020233360A1 (zh) | 一种产品测评模型的生成方法及设备 | |
US8290925B1 (en) | Locating product references in content pages | |
CN110909768B (zh) | 一种标注数据获取方法及装置 | |
CN115203500A (zh) | 一种用户标签的丰富方法、装置、计算机设备和存储介质 | |
CN113723542A (zh) | 一种日志聚类处理方法及系统 | |
WO2019085118A1 (zh) | 基于主题模型的关联词分析方法、电子装置及存储介质 | |
CN113590811A (zh) | 文本摘要生成方法、装置、电子设备及存储介质 | |
CN110264311B (zh) | 一种基于深度学习的商业推广信息精准推荐方法及系统 | |
CN112818068A (zh) | 基于大数据和多维特征的数据溯源方法及系统 | |
CN114547257B (zh) | 类案匹配方法、装置、计算机设备及存储介质 | |
CN116610810A (zh) | 基于调控云知识图谱血缘关系的智能搜索方法及系统 | |
CN116155597A (zh) | 访问请求的处理方法、装置及计算机设备 | |
CN111708862B (zh) | 文本匹配方法、装置及电子设备 | |
CN114021716A (zh) | 一种模型训练的方法、系统及电子设备 | |
CN113988057A (zh) | 基于概念抽取的标题生成方法、装置、设备及介质 | |
CN114218431A (zh) | 视频搜索方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |