CN113780415B

CN113780415B - 基于小程序游戏的用户画像生成方法、装置、设备及介质

Info

Publication number: CN113780415B
Application number: CN202111062665.1A
Authority: CN
Inventors: 李恒; 王耀; 陈又新; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-09-10
Filing date: 2021-09-10
Publication date: 2023-08-15
Anticipated expiration: 2041-09-10
Also published as: CN113780415A

Abstract

本发明涉及一种基于小程序游戏的用户画像生成方法、装置、设备及介质，方法包括：获取用户信息，确定与用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个目标小程序游戏进行聚类，得到多个游戏聚类；从多个游戏聚类中确定目标聚类，获取与目标聚类相关联的用户标签数据和参考数据；根据用户标签数据和参考数据得到迭代权重；当获取到全部的游戏聚类所对应的迭代权重，将迭代权重的集合确定为用户画像。根据本发明实施例提供的方案，能够通过对多个目标小程序游戏的数据进行聚类，相比起单一游戏在数据上更加全面，同时，根据多个维度的权重得到迭代权重，有效提高了用户画像的准确性。

Description

基于小程序游戏的用户画像生成方法、装置、设备及介质

技术领域

本发明涉及但不限于人工智能领域，尤其涉及一种基于小程序游戏的用户画像生成方法、装置、设备及介质。

背景技术

微信小程序正越来越受到用户和企业的青睐，企业可以通过用户在使用小程序时产生的数据作为精细化运营的依据，尤其是对于而健康领域的企业，由于其产品功效的差异性，需要针对特定的人群进行销售。基于此，很多企业开始利用小程序获取的用户数据生成用户画像，根据用户画像向用户推荐适用的产品，实现精准销售。小程序游戏是获取用户数据的重要载体，不仅能够获取用户的身高和体重等静态参数，还可以通过游戏内容引导用户运动，从而产生动态的行为数据，使得生成的用户画像更能够体现用户的健康状况。但是现有方法虽然能够从一个游戏中获取多个维度的用户数据，但是小程序游戏通常较为简单，仅从单一游戏采集到的数据内容较少，生成的用户画像准确率并不会太高。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供了一种基于小程序游戏的用户画像生成方法、装置、设备及介质，能够根据多个游戏的数据生成用户画像，提高用户画像的准确性。

第一方面，本发明实施例提供了一种基于小程序游戏的用户画像生成方法，包括：

获取用户信息，确定与所述用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个所述目标小程序游戏进行聚类，得到多个游戏聚类；

从多个所述游戏聚类中确定目标聚类，根据所述用户信息从数据库中获取与所述目标聚类相关联的用户标签数据，所述用户标签数据包括聚类时长、聚类编号、聚类次数和聚类分数；

从所述数据库中获取所述目标聚类的参考数据，所述参考数据包括参考时长、参考次数和参考分数；

根据所述聚类编号获取预设的类型权重，将所述聚类时长和所述参考时长的比值确定为时长权重，根据所述聚类次数和所述参考次数确定次数权重，根据所述聚类分数和所述参考分数确定分数权重；

根据所述类型权重、所述时长权重、所述次数权重和所述分数权重得到迭代权重；

当获取到全部的所述游戏聚类所对应的所述迭代权重，将所述迭代权重的集合确定为用户画像。

在一些实施例中，所述根据所述聚类次数和所述参考次数确定次数权重，包括：

当所述聚类次数小于所述参考次数，获取第一预设次数权重作为所述次数权重；

或者，

当所述聚类次数等于所述参考次数，获取第二预设次数权重作为所述次数权重；

或者，

当所述聚类次数大于所述参考次数，获取第三预设次数权重作为所述次数权重。

在一些实施例中，所述根据所述聚类分数和所述参考分数确定分数权重，包括：

当所述聚类分数小于所述参考分数，获取第一预设分数权重作为所述分数权重；

或者，

当所述聚类分数等于所述参考分数，获取第二预设分数权重作为所述分数权重；

或者，

当所述聚类分数大于所述参考分数，获取第三预设分数权重作为所述分数权重。

在一些实施例中，所述根据所述类型权重、所述时长权重、所述次数权重和所述分数权重得到迭代权重，包括：

根据所述类型权重、所述时长权重和所述分数权重确定行为权重；

根据所述聚类次数确定所述目标聚类的词频和逆向文件频率；

获取预先设定的时间衰减因子；

根据所述词频、所述逆向文件频率、所述时间衰减因子、所述行为权重和所述次数权重得到所述迭代权重。

在一些实施例中，所述根据所述词频、所述逆向文件频率、所述时间衰减因子、所述行为权重和所述次数权重得到所述迭代权重，通过以下公式得到：

Target_m,j＝ω_m·TF_m,j·IDF_m·ω_n,m·r；

其中，ω_m＝ω_G,m·ω_T,m·ω_S,m；

其中，Target_m,j为迭代权重，ω_n,m为所述次数权重，r为时间衰减因子；m为所述聚类编号，ω_m为所述行为权重，ω_G,m为所述类型权重，ω_T,m为所述时长权重，ω_S,m为所述分数权重；j表示第j个用户，n_m,j为所述聚类次数，k为大于1的自然数，G^*为全部的所述游戏聚类的所述用户标签数据的数量，为所述目标聚类的所述用户标签数据的数量，TF为所述词频，IDF为所述逆向文件频率。

在一些实施例中，在所述将所述迭代权重的集合确定为用户画像之后，所述方法还包括：

将首次得到的所述用户画像确定为初始用户画像；

根据所述初始用户画像生成初始推荐信息；

保存所述初始用户画像和所述初始推荐信息。

获取与所述用户信息相对应的最新的登录时间信息；

获取当前时间信息，当所述登录时间信息与所述当前时间信息之间的时间差大于预设的时间差阈值，将所述用户信息所对应的用户标记为低频用户；

根据所述用户信息获取所述初始用户画像，将所述初始用户画像确定为所述低频用户的用户画像。

第二方面，本发明实施例还提供了一种基于小程序游戏的用户画像生成装置，包括：

聚类单元，用于获取用户信息，确定与所述用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个所述目标小程序游戏进行聚类，得到多个游戏聚类；

第一获取单元，用于从多个所述游戏聚类中确定目标聚类，根据所述用户信息从数据库中获取与所述目标聚类相关联的用户标签数据，所述用户标签数据包括聚类时长、聚类编号、聚类次数和聚类分数；

第二获取单元，用于从所述数据库中获取所述目标聚类的参考数据，所述参考数据包括参考时长、参考次数和参考分数；

权重计算单元，用于根据所述聚类编号获取预设的类型权重，将所述聚类时长和所述参考时长的比值确定为时长权重，根据所述聚类次数和所述参考次数确定次数权重，根据所述聚类分数和所述参考分数确定分数权重；

迭代单元，用于根据所述类型权重、所述时长权重、所述次数权重和所述分数权重得到迭代权重；

用户画像生成单元，用于当获取到全部的所述游戏聚类所对应的所述迭代权重，将所述迭代权重的集合确定为用户画像。

第三方面，本发明实施例还提供了一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的基于小程序游戏的用户画像生成方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行如第一方面所述的基于小程序游戏的用户画像生成方法。

本发明实施例包括：获取用户信息，确定与所述用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个所述目标小程序游戏进行聚类，得到多个游戏聚类；从多个所述游戏聚类中确定目标聚类，根据所述用户信息从数据库中获取与所述目标聚类相关联的用户标签数据，所述用户标签数据包括聚类时长、聚类编号、聚类次数和聚类分数；从所述数据库中获取所述目标聚类的参考数据，所述参考数据包括参考时长、参考次数和参考分数；根据所述聚类编号获取预设的类型权重，将所述聚类时长和所述参考时长的比值确定为时长权重，根据所述聚类次数和所述参考次数确定次数权重，根据所述聚类分数和所述参考分数确定分数权重；根据所述类型权重、所述时长权重、所述次数权重和所述分数权重得到迭代权重；当获取到全部的所述游戏聚类所对应的所述迭代权重，将所述迭代权重的集合确定为用户画像。根据本发明实施例提供的方案，能够通过对多个目标小程序游戏的数据进行聚类，相比起单一游戏在数据上更加全面，同时，根据多个维度的权重得到迭代权重，有效提高了用户画像的准确性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1是本发明一个实施例提供的基于小程序游戏的用户画像生成方法的流程图；

图2是本发明一个实施例提供的确定次数权重的流程图；

图3是本发明一个实施例提供的确定分数权重的流程图；

图4是本发明一个实施例提供的得到迭代权重的流程图；

图5是本发明一个实施例提供的确定初始用户画像的流程图；

图6是本发明一个实施例提供的标记低频用户的流程图；

图7是本发明一个实施例提供的基于小程序游戏的用户画像生成装置的结构图；

图8是本发明一个实施例提供的电子设备的结构。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

需要说明的是，本发明实施例的技术方案可以在任意电子设备的客户端运行，例如电脑、手机、平板电脑等。本发明实施例的数据可以保存在服务器中，服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

本发明提供了一种基于小程序游戏的用户画像生成方法、装置、设备及介质，方法包括：获取用户信息，确定与所述用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个所述目标小程序游戏进行聚类，得到多个游戏聚类；从多个所述游戏聚类中确定目标聚类，根据所述用户信息从数据库中获取与所述目标聚类相关联的用户标签数据，所述用户标签数据包括聚类时长、聚类编号、聚类次数和聚类分数；从所述数据库中获取所述目标聚类的参考数据，所述参考数据包括参考时长、参考次数和参考分数；根据所述聚类编号获取预设的类型权重，将所述聚类时长和所述参考时长的比值确定为时长权重，根据所述聚类次数和所述参考次数确定次数权重，根据所述聚类分数和所述参考分数确定分数权重；根据所述类型权重、所述时长权重、所述次数权重和所述分数权重得到迭代权重；当获取到全部的所述游戏聚类所对应的所述迭代权重，将所述迭代权重的集合确定为用户画像。根据本发明实施例提供的方案，能够通过对多个目标小程序游戏的数据进行聚类，相比起单一游戏在数据上更加全面，同时，根据多个维度的权重得到迭代权重，有效提高了用户画像的准确性。

下面结合附图，对本发明实施例作进一步阐述。

如图1所示，图1是本发明一个实施例提供的一种基于小程序游戏的用户画像生成方法，包括但不限于有以下步骤：

步骤S110，获取用户信息，确定与用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个目标小程序游戏进行聚类，得到多个游戏聚类；

步骤S120，从多个游戏聚类中确定目标聚类，根据用户信息从数据库中获取与目标聚类相关联的用户标签数据，用户标签数据包括聚类时长、聚类编号、聚类次数和聚类分数；

步骤S130，从数据库中获取目标聚类的参考数据，参考数据包括参考时长、参考次数和参考分数；

步骤S140，根据聚类编号获取预设的类型权重，将聚类时长和参考时长的比值确定为时长权重，根据聚类次数和参考次数确定次数权重，根据聚类分数和参考分数确定分数权重；

步骤S150，根据类型权重、时长权重、次数权重和分数权重得到迭代权重；

步骤S160，当获取到全部的游戏聚类所对应的迭代权重，将迭代权重的集合确定为用户画像。

需要说明的是，用户信息可以包括与用户相关的信息，例如姓名、性别、年龄、所在地、所使用的设备等，本领域技术人员熟知如何通过用户注册获取用户信息，在此不多做赘述。对于小程序游戏而言，每个用户在使用之前通常需要登录，因此，可以根据每个用户的用户信息在数据库中建立存储区域，将获取于该用户的游戏数据保存至该存储区域，便于后续的数据获取。

需要说明的是，对于健康领域的小程序游戏，通常关联度较高，聚类方法可以通过实现设定游戏属性的方式实现，例如对于瑜伽游戏和增高操游戏都属于肢体类伸展游戏，在当获取到的目标小程序游戏中包括瑜伽游戏和增高操游戏，则可以将其聚类成为肢体类伸展游戏聚类，当然也可以用其他游戏划分方式进行聚类，本实施例对聚类的具体方式和规则不多作限定，本领域技术人员可以根据实际需求调整，通过对游戏聚类，由于每个游戏涉及的健康动作不同，能够将多个游戏的游戏数据进行迭代，能够从更多方面生成更加准确的用户画像。

需要说明的是，用户标签数据可以是预先设定的，具体的用户标签数据类型可以根据用户画像所需要的数据确定，例如对于健康类游戏，与动作和行为相关的数据的参考价值较高，以及用户玩游戏的时长也能从一定程度上反映用户的身体状况，因此可以从时长、次数和分数维度设计用户标签数据，通过用户标签数据的设定，能够在游戏结束之后采集每一次的游戏时长、并累计该用户总共完成的游戏次数，以及每一次的平均分，为得到多个维度的权重，从而得到更加准确的用户画像提供数据基础。

需要说明的是，为了能够根据用户信息获取多个关联的目标小程序游戏，可以通过每个小程序游戏关联同一个用户信息实现，在游戏聚类之后，可以根据用户信息从数据库中获取针对多个目标小程序游戏的数据，例如聚类后得到的游戏聚类1包括瑜伽游戏和增高操游戏，则可以根据用户信息从数据库中获取瑜伽游戏和增高操游戏的游戏数据，再根据相同的用户标签数据进行叠加计算，例如两个游戏的游戏时长进行累加，得到聚类时长，又如，聚类编号可以是预先设定，例如预先设定肢体类伸展游戏聚类的聚类编号为编号1，又如，将瑜伽游戏和增高操游戏总共的游戏次数确定为聚类次数，将瑜伽游戏和增高操游戏每次的得分进行累计之后计算出平均值作为聚类分数。

需要说明的是，对于健康类游戏，为了体现每个用户的身体情况，需要具有参考数值，通过人为制定针对每种用户标签数据的参考数值较为困难，因此可以通过每个游戏聚类的全部用户的数据作为参考，例如，在确定目标聚类之后，获取与该目标聚类相关联的每个用户信息所对应的游戏时长、游戏次数和游戏分数，对游戏时长进行累计之后计算出的平均值作为游戏参考时长，取游戏次数的中位数作为参考次数，对游戏分数进行求和之后计算出游戏平均分作为参考分数，本领域技术人员也可以根据实际需求调整参考数据的计算方式，能够基于游戏数据得到即可，在此不多作限定。

需要说明的是，基于上述实施例，游戏聚类可以是预先设定好的，因此为了减少计算的复杂度，可以在制定游戏聚类之后预先设定每个游戏聚类的类型权重，例如设定聚类编号为编号1的肢体类伸展游戏聚类的类型权重为1，聚类编号为编号2的肩颈健康游戏聚类的类型权重为0.3，具体数值根据实际需求调整即可。

需要说明的是，在具备参考数据的基础上，可以根据实际需求选择权重的计算方式，例如对于时长权重，可以选取聚类时长和参考时长的比值，以反映该用户与全部用户的平均水平之间的差异；又如，由于参考次数如上述实施例所述可以采用中位数的方式确定，因此可以通过比对参考次数和聚类次数的数值大小，并设定3个预设的次数权重，当聚类次数大于参考次数、当聚类次数等于参考次数和当聚类次数小于参考次数分别对应不同的次数权重；又如，参考分数为平均分，可以参考上述次数权重的方式处理，在此不多作赘述。另外，上述实施例仅为示例，本领域技术人员有动机根据实际需求确定计算方式，这并不会对本实施例的技术方案造成限定。

需要说明的是，在得到多个权重之后，可以通过权重相加的方式得到迭代权重，也可以通过相乘的方式得到，本领域技术人员能够根据迭代权重的实际应用场景调整计算方式，在此不多作限定。

需要说明的是，在针对每个游戏聚类得到迭代权重之后，可以对与用户信息相关联的全部游戏聚类进行遍历，通过不同的迭代权重能够反映出用户画像，例如，得到肢体类伸展游戏聚类的迭代权重为0.3，肩颈健康游戏聚类的类型权重为0.02，则该用户画像可以表征该用户偏好肢体类伸展运动，能够更好地反映用户的实际需求。

另外，参考图2，在一实施例中，图1中所示的步骤S140，还包括但不限于有以下步骤：

步骤S210，当聚类次数小于参考次数，获取第一预设次数权重作为次数权重；

或者，

步骤S220，当聚类次数等于参考次数，获取第二预设次数权重作为次数权重；

或者，

步骤S230，当聚类次数大于参考次数，获取第三预设次数权重作为次数权重。

需要说明的是，根据上述实施例的描述，在参考次数可以采用任意类型的统计数值，例如中位数、均值、方差等，根据实际需求选取即可。同时，为了统一标准，可以预先设定第一预设次数权重、第二预设次数权重和第三预设次数权重，例如，第一预设次数权重的数值为0.3，第二预设次数权重的数值为0.8，第三预设次数权重的数值为1，当聚类次数小于参考次数，次数权重为0.3，当聚类次数等于参考次数，次数权重为0.8，当聚类次数大于参考次数，次数权重为1。

另外，参考图3，在一实施例中，图1中所示的步骤S140，还包括但不限于有以下步骤：

步骤S310，当聚类分数小于参考分数，获取第一预设分数权重作为分数权重；

或者，

步骤S320，当聚类分数等于参考分数，获取第二预设分数权重作为分数权重；

或者，

步骤S330，当聚类分数大于参考分数，获取第三预设分数权重作为分数权重。

需要说明的是，根据上述实施例的描述，在参考分数可以采用任意类型的统计数值，例如中位数、均值、方差等，根据实际需求选取即可。同时，为了统一标准，可以预先设定第一预设分数权重、第二预设分数权重和第三预设分数权重，例如，第一预设分数权重的数值为0.5，第二预设分数权重的数值为0.75，第三预设分数权重的数值为1，当聚类分数小于参考分数，分数权重为0.5，当聚类分数等于参考分数，分数权重为0.75，当聚类分数大于参考分数，分数权重为1。

另外，在另一个示例中，可以通过参考分数及其标准差确定分数权重，在此情况下，可以增加预设分数权重的数量，例如当S_i<S_A-σ时分数权重计为0.25，当S_A-σ≤S_i<S_A时分数权重计为0.5，当S_A≤S_i<S_A+σ时分数权重计为0.75，当S_i≥S_A+σ时分数权重计为1，其中S_i为聚类分数S_A为参考分数，σ为全部用户的分数的标准差。

另外，参考图4，在一实施例中，图1中所示的步骤S150，还包括但不限于有以下步骤：

步骤S410，根据类型权重、时长权重和分数权重确定行为权重；

步骤S420，根据聚类次数确定目标聚类的词频和逆向文件频率；

步骤S430，获取预先设定的时间衰减因子；

步骤S440，根据词频、逆向文件频率、时间衰减因子、行为权重和次数权重得到迭代权重。

其中，根据词频、逆向文件频率、时间衰减因子、行为权重和次数权重得到迭代权重，通过以下公式得到：

Target_m,j＝ω_m·TF_m,j·IDF_m·ω_n,m·r；

其中，ω_m＝ω_G,m·ω_T,m·ω_S,m；

其中，Target_m,j为迭代权重，ω_n,m为次数权重，r为时间衰减因子；m为聚类编号，ω_m为行为权重，ω_G,m为类型权重，ω_T,m为时长权重，ω_S,m为分数权重；j表示第j个用户，n_m,j为聚类次数，k为大于1的自然数，G^*为全部的游戏聚类的用户标签数据的数量，为目标聚类的用户标签数据的数量，TF为所述词频，IDF为所述逆向文件频率。

需要说明的是，词频能够体现出该目标聚类在所有的聚类中出现次数，因此能够体现目标聚类的用户标签的权重，在上述表达式中，∑_m＝1→kn_m,j表示同一用户在全部游戏聚类中的次数。

需要说明的是，逆向文件频率用于描述逆向文件频率，能够体现目标聚类在所有游戏聚类中受用户的欢迎程度，当逆向文件频率值越大，此类游戏受用户的欢迎程度越小，对使用此聚类游戏的用户标识则越具有代表性。需要说明的是，若是首次生成用户画像，则实际上只有来自于一个游戏的数据，在这种情况下，逆向文件频率并没有实际意义，因此可以省去逆向文件频率，其中，在上述表达式中，表示在该用户所有的由此

需要说明的是，时间衰减因子可以根据以下公式得到：其中t为时间，s为用户粘性。

为了更好的说明本实施例计算迭代权重的方法，以下提出一个具体示例：

在本示例中，以5个游戏聚类为例，分别由1200、3000、2000、1000、1000人参与了相关聚类游戏，其中聚类编号为1的肢体伸展类游戏包括增强现实(Augmented Reality，AR)瑜伽、增高操及人工智能(Artificial Intelligence，AI)拉伸，类型权重以ω_G,m＝1为例，参考时长分别为2分钟、2分钟和3分钟，用户数量为2000人，参考次数采用中位数，以6次/周为例，参考分数以平均分60分为例，全部用户的分数的标准差为8，依靠运营数据可知经过2周将流失20％的用户，时间衰减因子以r＝0.446为例。当某用户j在一个月内仅在肢体伸展类游戏中进行了40次游戏(10次AR瑜伽、15次增高操及15次AI拉伸)共80分钟，均分为58分，该用户j在其他聚类游戏中游戏次数为10次。

由此可知，则可以确定ω_T,m＝80/(2×10+2×15+3×15)；由于满足60-8<58<60,因此ω_S,m＝0.5，在5个游戏聚类中，用户标签数据标签总数为1200+3000+2000+1000+1000＝8000，目标聚类的用户标签数量为2000，因此基于此，迭代标签的计算过程如下：

另外，参考图5，在一实施例中，在执行完图1中所示的步骤S160之后，还包括但不限于有以下步骤：

步骤S510，将首次得到的用户画像确定为初始用户画像；

步骤S520，根据初始用户画像生成初始推荐信息；

步骤S530，保存初始用户画像和初始推荐信息。

需要说明的是，对于每个用户而言，初始用户画像通常根据首次运行游戏得到的数据产生，由于只有一个游戏的数据，因此可以省去聚类的步骤，其他原理与上述实施例的相似，以下通过一个示例对初始用户画像的获取方式进行解释：

需要说明的是，由于只有一个游戏的数据，因此按照上述实施例的描述，省去逆向文件频率，仅引入词频进行计算，即通过以下方式计算偏好权重：

肩颈健康游戏的游戏编号为1，规定单次游戏时长为30秒，整体用户游玩次数中位数为5次，整体均分为30分，标准差为8；肢体健康类游戏的游戏编号为2，规定单次游戏时长为2分钟，整体用户游玩次数中位数为5次，整体均分为30分，标准差为5。

用户j进行了5次游戏共2分钟，该游戏规定时长为30秒，均分为30分，在AR瑜伽玩法游戏了3次共3分钟，均分为25分，此用户偏好标签权重为：

对于游戏编号为1的肩颈健康游戏：

Target_1,j＝1x(2/0.5x5)x0.75x5/8x0.8＝0.3；

对于游戏编号为2的肢体健康类游戏：

Target_2,j＝1x(3/2x3)x0.5x3/8x0.3＝0.0281。

由此根据得到的偏好标签权重的集合作为初始用户画像：对此肩颈健康游戏偏好权重为0.3，对该肢体健康游戏偏好权重为0.0281。

需要说明的是，在确定初始用户画像后，可以根据初始用户画像生成针对该用户的初始推荐信息，例如生成初步的营销和推荐方案，无需等待多次迭代，提高用户画像的使用效率。

另外，参考图6，在一实施例中，在执行完图1中所示的步骤S160之后，还包括但不限于有以下步骤：

步骤S610，获取与用户信息相对应的最新的登录时间信息；

步骤S620，获取当前时间信息，当登录时间信息与当前时间信息之间的时间差大于预设的时间差阈值，将用户信息所对应的用户标记为低频用户；

步骤S630，根据用户信息获取初始用户画像，将初始用户画像确定为低频用户的用户画像。

需要说明的是，对于健康类领域，其用户画像用于反映用户的健康需求，因此，若用户长时间未运行游戏，数据相对较为滞后，不一定能够反映用户当前的真实情况，因此，可以通过预设时间差阈值的方式判断用户是否长时间未运行游戏，时间差阈值可以设置为一周、一个月等，根据实际需求调整具体数值即可。

可以理解的是，登录时间信息是较为容易获取的数据，因此可以定时对每个用户的最新的登录时间信息进行判断，例如获取用户A的最近一次登录为1月1日，而当前时间为1月10日，时间差阈值取一周为7日，则登录时间信息与当前时间信息之间的时间差为9日，则确定该用户为低频用户，通过图5所示实施例得到的初始用户画像作为用户画像。

另外，参照图7，本发明实施例还提供了一种基于小程序游戏的用户画像生成装置，该基于小程序游戏的用户画像生成装置700包括：

聚类单元710，用于获取用户信息，确定与用户信息相关联的多个目标小程序游戏，并根据预设的聚类规则对多个目标小程序游戏进行聚类，得到多个游戏聚类；

第一获取单元720，用于从多个游戏聚类中确定目标聚类，根据用户信息从数据库中获取与目标聚类相关联的用户标签数据，用户标签数据包括聚类时长、聚类编号、聚类次数和聚类分数；

第二获取单元730，用于从数据库中获取目标聚类的参考数据，参考数据包括参考时长、参考次数和参考分数；

权重计算单元740，用于根据聚类编号获取预设的类型权重，将聚类时长和参考时长的比值确定为时长权重，根据聚类次数和参考次数确定次数权重，根据聚类分数和参考分数确定分数权重；

迭代单元750，用于根据类型权重、时长权重、次数权重和分数权重得到迭代权重；

用户画像生成单元760，用于当获取到全部的游戏聚类所对应的迭代权重，将迭代权重的集合确定为用户画像。

另外，参照图8，本发明的一个实施例还提供了一种电子设备，该电子设备800包括：存储器810、处理器820及存储在存储器810上并可在处理器820上运行的计算机程序。

处理器820和存储器810可以通过总线或者其他方式连接。

实现上述实施例的基于小程序游戏的用户画像生成方法所需的非暂态软件程序以及指令存储在存储器810中，当被处理器820执行时，执行上述实施例中基于小程序游戏的用户画像生成方法，例如，执行以上描述的图1中的方法步骤S110至步骤S160、图2中的方法步骤S210至步骤S230、图3中的方法步骤S310至步骤S330、图4中的方法步骤S410至步骤S440、图5中的方法步骤S510至步骤S530、图6中的方法步骤S610至步骤S630。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

此外，本发明的一个实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个处理器或控制器执行，例如，被上述电子设备实施例中的一个处理器执行，可使得上述处理器执行上述实施例中基于小程序游戏的用户画像生成方法，例如，执行以上描述的图1中的方法步骤S110至步骤S160、图2中的方法步骤S210至步骤S230、图3中的方法步骤S310至步骤S330、图4中的方法步骤S410至步骤S440、图5中的方法步骤S510至步骤S530、图6中的方法步骤S610至步骤S630。本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上是对本发明的较佳实施进行了具体说明，但本发明并不局限于上述实施方式，熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换，这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims

1.一种基于小程序游戏的用户画像生成方法，其特征在于，包括：

获取预先设定的时间衰减因子；

根据所述词频、所述逆向文件频率、所述时间衰减因子、所述行为权重和所述次数权重通过以下公式得到迭代权重：Target_m,j＝ω_m·TF_m,j·IDF_m·ω_n,m·r，其中，ω_m＝ω_G,m·ω_T,m·ω_S,m，其中，Target_m,j为迭代权重，ω_n,m为所述次数权重，r为时间衰减因子；m为所述聚类编号，ω_m为所述行为权重，ω_G,m为所述类型权重，ω_T,m为所述时长权重，ω_S,m为所述分数权重；j表示第j个用户，n_m,j为所述聚类次数，k为大于1的自然数，G^*为所述游戏聚类的所述用户标签数据的数量，/>为所述目标聚类的所述用户标签数据的数量，TF为所述词频，IDF为所述逆向文件频率，card(G^*)为所述游戏聚类的数量；

2.根据权利要求1所述的方法，其特征在于，所述根据所述聚类次数和所述参考次数确定次数权重，包括：

或者，

3.根据权利要求1所述的方法，其特征在于，所述根据所述聚类分数和所述参考分数确定分数权重，包括：

或者，

4.根据权利要求1所述的方法，其特征在于，在所述将所述迭代权重的集合确定为用户画像之后，所述方法还包括：

将首次得到的所述用户画像确定为初始用户画像；

根据所述初始用户画像生成初始推荐信息；

保存所述初始用户画像和所述初始推荐信息。

5.根据权利要求4所述的方法，其特征在于，在所述将所述迭代权重的集合确定为用户画像之后，所述方法还包括：

获取与所述用户信息相对应的最新的登录时间信息；

6.一种基于小程序游戏的用户画像生成装置，其特征在于，包括：

迭代单元，用于根据所述类型权重、所述时长权重和所述分数权重确定行为权重；根据所述聚类次数确定所述目标聚类的词频和逆向文件频率；获取预先设定的时间衰减因子；根据所述词频、所述逆向文件频率、所述时间衰减因子、所述行为权重和所述次数权重通过以下公式得到迭代权重：Target_m,j＝ω_m·TF_m,j·IDF_m·ω_n,m·r，其中，ω_m＝ω_G,m·ω_T,m·ω_S,m，其中，Target_m,j为迭代权重，ω_n,m为所述次数权重，r为时间衰减因子；m为所述聚类编号，ω_m为所述行为权重，ω_G,m为所述类型权重，ω_T,m为所述时长权重，ω_S,m为所述分数权重；j表示第j个用户，n_m,j为所述聚类次数，k为大于1的自然数，G^*为所述游戏聚类的所述用户标签数据的数量，/>为所述目标聚类的所述用户标签数据的数量，TF为所述词频，IDF为所述逆向文件频率，card(G^*)为所述游戏聚类的数量；

7.一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的基于小程序游戏的用户画像生成方法。

8.一种计算机可读存储介质，存储有计算机可执行指令，其特征在于，所述计算机可执行指令用于执行如权利要求1至5中任意一项所述的基于小程序游戏的用户画像生成方法。