CN113420018A

CN113420018A - 用户行为数据分析方法、装置、设备及存储介质

Info

Publication number: CN113420018A
Application number: CN202110691891.XA
Authority: CN
Inventors: 杨鑫
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2021-09-21

Abstract

本发明涉及大数据领域，公开了一种用户行为数据分析方法、装置、设备及存储介质。本方法包括：获取用户行为数据，并对用户行为数据进行数据清洗，得到目标用户行为数据；将目标用户行为数据输入预置服务偏好分析模型，得到目标用户的服务偏好信息；通过预置意图识别模型对目标用户行为数据进行分析处理，得到用户意图标签数据；根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；将服务偏好信息输入预置推荐评分模型，根据评分结果和用户画像获取与目标用户对应的推荐内容。通过对用户行为数据精准分析，提高了用户偏好数据推荐准确率。本发明中的用户行为数据可以存储于区块链中。

Description

用户行为数据分析方法、装置、设备及存储介质

技术领域

本发明涉及大数据领域，尤其涉及一种用户行为数据分析方法、装置、设备及存储介质。

背景技术

现有数据打点功能，更多的是统计用户某些操作，产品某些功能曝光率等，并没有完整的一次应用生命周期中，用户所有行为链路的统计。一旦出现一些非特定步骤的偶现的崩溃或者异常时，仅仅从设备日志统计、数据打点并不能复现问题，往往只能推断修复，反复测试，才可能将问题修复。

同时，现有的打点数据更多的是为产品提供服务，比如某次活动上线的曝光、参与用户数等等，但是从用户角度来看，收集的用户行为、偏好等信息完整性、正确性不足，推荐算法团队无法以这个为准做用户行为、偏好分析。因此，充分利用用户行为数据，提高用户偏好数据推荐准确率成了本领域技术人员需要解决的技术问题。

发明内容

本发明通过对用户行为数据进行精准分析确定用户类别，并根据用户的对应类别进行推广数据的推荐，从而能够高效地将用户偏好数据推荐给用户，主要解决了现有技术中用户偏好数据推荐准确率低的技术问题。

本发明第一方面提供了一种用户行为数据分析方法，包括：获取预设场景下、预设时间段内目标用户的用户行为数据；对所述用户行为数据进行数据清洗，得到目标用户行为数据；将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息；通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据；根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像；将所述服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和所述用户画像，得到与所述目标用户对应的推荐内容。

可选地，在本发明第一方面的第一种实现方式中，在所述获取预设场景下、预设时间段内目标用户的用户行为数据之前，还包括：提取预置用户访问日志中的用户行为信息以及与所述用户行为信息对应的响应信息；根据预设分类规则，对用户行为信息和所述响应信息进行分类，得到至少一个行为数据；根据预置筛选参数对所述行为数据进行筛选，得到用户行为数据。

可选地，在本发明第一方面的第二种实现方式中，所述对所述用户行为数据进行数据清洗，得到目标用户行为数据包括：确定所述用户行为数据对应的数据类型；根据所述用户行为数据的数据类型在预存的至少一个清洗规则中为所述用户行为数据选择目标清洗规则；根据所述目标清洗规则对所述用户行为数据进行清洗，得到目标用户行为数据。

可选地，在本发明第一方面的第三种实现方式中，所述将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息包括：对获取到的所述目标用户行为数据进行分析，确定所述目标用户行为数据对应的数据区间；根据所述数据区间确定所述目标用户行为数据的计算权重；根据所述计算权重、所述目标用户行为数据得分和预置服务偏好得分公式，得到所述用户的服务偏好信息。

可选地，在本发明第一方面的第四种实现方式中，所述通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据包括：将所述目标用户行为数据输入预置意图识别模型进行特征提取，得到所述用户行为特征；对所述用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与所述初始意图标签数据对应的意图标签置信度值；当所述意图标签置信度值大于预设阈值时，将所述初始意图标签数据标记为用户意图标签数据。

可选地，在本发明第一方面的第五种实现方式中，所述根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像包括：查询预设标签规则表，得到对应的标签更新规则；根据所述用户意图标签数据对所述目标用户进行画像，得到所述目标用户的初始用户画像；根据所述标签更新规则对所述初始用户画像进行更新，得到所述目标用户的用户画像。

本发明第二方面提供了一种用户行为数据分析装置，包括：获取模块，用于获取预设场景下、预设时间段内目标用户的用户行为数据；数据清洗模块，用于对所述用户行为数据进行数据清洗，得到目标用户行为数据；偏好分析模块，用于将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息；意图识别模块，用于通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据；画像模块，用于根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像；评分模块，用于将所述服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和所述用户画像，得到与所述目标用户对应的推荐内容。

可选地，在本发明第二方面的第一种实现方式中，所述用户行为数据分析装置还包括：提取模块，用于提取预置用户访问日志中的用户行为信息以及与所述用户行为信息对应的响应信息；分类模块，用于根据预设分类规则，对用户行为信息和所述响应信息进行分类，得到至少一个行为数据；筛选模块，用于根据预置筛选参数对所述行为数据进行筛选，得到用户行为数据。

可选地，在本发明第二方面的第二种实现方式中，所述数据清洗模块具体用于：确定所述用户行为数据对应的数据类型；根据所述用户行为数据的数据类型在预存的至少一个清洗规则中为所述用户行为数据选择目标清洗规则；根据所述目标清洗规则对所述用户行为数据进行清洗，得到目标用户行为数据。

可选地，在本发明第二方面的第三种实现方式中，所述偏好分析模块具体用于：对获取到的所述目标用户行为数据进行分析，确定所述目标用户行为数据对应的数据区间；根据所述数据区间确定所述目标用户行为数据的计算权重；根据所述计算权重、所述目标用户行为数据得分和预置服务偏好得分公式，得到所述用户的服务偏好信息。

可选地，在本发明第二方面的第四种实现方式中，所述意图识别模块包括：特征提取单元，用于将所述目标用户行为数据输入预置意图识别模型进行特征提取，得到所述用户行为特征；意图识别单元，用于对所述用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与所述初始意图标签数据对应的意图标签置信度值；标记单元，用于当所述意图标签置信度值大于预设阈值时，将所述初始意图标签数据标记为用户意图标签数据。

可选地，在本发明第二方面的第五种实现方式中，所述画像模块具体用于：查询预设标签规则表，得到对应的标签更新规则；根据所述用户意图标签数据对所述目标用户进行画像，得到所述目标用户的初始用户画像；根据所述标签更新规则对所述初始用户画像进行更新，得到所述目标用户的用户画像。

本发明第三方面提供了一种用户行为数据分析设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述用户行为数据分析设备执行上述的用户行为数据分析方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的用户行为数据分析方法。

本发明提供的技术方案中，通过获取用户行为数据，并对用户行为数据进行数据清洗，得到目标用户行为数据；将目标用户行为数据输入预置服务偏好分析模型，得到目标用户的服务偏好信息；通过预置意图识别模型对目标用户行为数据进行分析处理，得到用户意图标签数据；根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；将服务偏好信息输入预置推荐评分模型，根据评分结果和用户画像获取与目标用户对应的推荐内容。通过对用户行为数据进行分析，解决了现有技术中用户偏好数据推荐准确率低的技术问题。

附图说明

图1为本发明用户行为数据分析方法的第一个实施例示意图；

图2为本发明用户行为数据分析方法的第二个实施例示意图；

图3为本发明用户行为数据分析方法的第三个实施例示意图；

图4为本发明用户行为数据分析方法的第四个实施例示意图；

图5为本发明用户行为数据分析方法的第五个实施例示意图；

图6为本发明用户行为数据分析装置的第一个实施例示意图；

图7为本发明用户行为数据分析装置的第二个实施例示意图；

图8为本发明用户行为数据分析设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种用户行为数据分析方法、装置、设备及存储介质，本发明的技术方案中，首先获取用户行为数据，并对用户行为数据进行数据清洗，得到目标用户行为数据；将目标用户行为数据输入预置服务偏好分析模型，得到目标用户的服务偏好信息；通过预置意图识别模型对目标用户行为数据进行分析处理，得到用户意图标签数据；根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；将服务偏好信息输入预置推荐评分模型，根据评分结果和用户画像获取与目标用户对应的推荐内容。通过对用户行为数据进行分析，解决了现有技术中用户偏好数据推荐准确率低的技术问题。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中用户行为数据分析方法的第一个实施例包括：

101、获取预设场景下、预设时间段内目标用户的用户行为数据；

本实施例中，获取预设场景下、预设时间段内目标用户的用户行为数据。在获取用户行为数据时，可以从该预设场景对应的交互日志记录中获取，该用户行为数据可以理解为用户在该预设场景下的用户交互行为信息，用户行为数据可以包括访问流程、访问入口、访问的服务、在该访问服务下的停留时间、访问的时间、回访的次数、回访的时间间隔、访问时的查询关键字中的一种或者多种数据，当然，该用户行为数据还可以为上述以外的用户交互行为信息。

102、对用户行为数据进行数据清洗，得到目标用户行为数据；

本实施例中，对所述用户行为数据进行数据清洗，得到目标用户行为数据。其中，数据清洗包括数据脱敏、数据校验和数据转换。其中，数据脱敏用于对源业务数据中的敏感数据进行加密处理。比如，该数据中包括个人的身份证号等，可对该身份证号进行加密。数据校验用于查询源业务数据中是否存在脏数据，并删除该脏数据，以消除脏数据对精算结果的影响。服务器针对各个类型的数据设置了脏数据判定方法，根据预设的判定方法检测是否为脏数据。比如，可设置每个类型的数据的字符长度范围或数值的大小范围等，当某一类型的数据的字符长度不处于预设范围之内，或数值的大小不处于预设的大小范围之内，则判定该数据为脏数据。数据校验是将存在多种不同表述方式的数据统一转换成同一种预设表述方式的过程。

服务器针对每种类型的数据设置了一种对应的表述方式，当检测到某一类型的数据与所设置的表述方式不一致时，可根据该类型数据的表述方式和所设置的表述方式之间的转换关系，将其转换成所设置的表述方式。比如，该数据为药品类数据，同一药品的编码在不同地区所使用的编码不同，服务器可设置该药品类数据的编码方式，并将检测到的编码方式与所设置的不同的数据，根据对应的转换关系，将其转换成对应设置的编码，从而形成统一的编码。在完成对源业务数据的清洗后，将清洗后的数据保存为目标用户行为数据。

103、将目标用户行为数据输入预置服务偏好分析模型，得到目标用户的服务偏好信息；

本实施例中，将所述目标用户行为数据输入预置服务偏好分析模型，得到所述目标用户的服务偏好信息。将获取到的目标用户行为数据输入到预先建立好的服务偏好分析模型，得到用户的服务偏好信息时，优选地，该服务偏好分析模型包含服务偏好得分公式，该服务偏好得分公式为C(i)＝αi×Bi+βi×Pi，其中，C(i)表示第i个服务对应的服务偏好得分，αi、βi分别表示第i个服务对应的用户行为数据的计算权重，Bi、Pi分别表示第i个服务对应的用户行为数据得分得分，以便于根据服务偏好得分公式得出用户的第一服务偏好信息。在这里需要说明的是，该计算权重可以是一固定值，也可以根据获取到的用户行为数据确定，根据获取到的用户行为数据确定该计算权重。

具体地，该服务偏好分析模型中包含每个服务与目标用户行为数据的关联关系，服务偏好分析模型根据上述关联关系将获取到的目标用户行为数据以及分别进行统计和分类，得到基于服务的用户行为集合和用户属性集合。

104、通过预置意图识别模型对目标用户行为数据进行分析处理，得到用户意图标签数据；

本实施例中，通过预置意图识别模型对所述目标用户行为数据进行分析处理，得到用户意图标签数据。其中，用户行为特征包括用户浏览特征和用户操作特征。用户浏览特征可以包括用户浏览时长特征和用户浏览数据项特征，用户操作特征可以包括用户购买行为特征、用户收藏行为特征，具体此处不做限定。

可选的，服务器从预设数据库中获取用户行为数据(用户操作行为数据和用户浏览行为数据)，服务器将用户操作行为数据和用户浏览行为数据输入至已训练的意图识别模型中，并通过已训练的意图识别模型提取特征，得到用户操作特征和用户浏览特征；服务器对用户操作特征和用户浏览特征依次进行语义相似度计算与意图识别处理，得到初始意图标签数据和对应的意图标签置信度值；当对应的意图标签置信度值大于或等于预设意图阈值时，服务器确定初始意图标签数据为用户意图标签数据。

需要说明的是，用户意图标签数据，也就是计算用户最感兴趣的标签集。对应的意图标签置信度值为在0至1区间中的任意一个值。进一步地，若对应的意图标签置信度值小于预设意图阈值，则服务器调整预设意图阈值，得到新的意图标签数据，并将新的意图标签数据设置为用户意图标签数据。

105，根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；

本实施例中，根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像。其中，标签是细粒度的用户信息，而用户画像(初始用户画像和目标用户画像)是基于用户不同维度的标签综合的信息。具体的，服务器采用用户标识数据从预设数据库中读取初始用户画像，并利用对应的标签更新规则将用户意图标签数据添加和/或删除至初始用户画像中，得到目标用户画像。例如，一个用户可以具有“中年”、“肥胖”、“高血压”、“经常熬夜”和“高油高脂”的标签，其中，“中年”标签可以根据年龄规则关联，“肥胖”标签可以根据体重和身高规则关联，“高血压”可以根据血压规则关联，“经常熬夜”标签可以根据用户访问预设应用服务的时间规则关联，“高油高脂”标签可以根据用户经常看油炸食谱规则关联。根据这些规则，可以刻画出一个肥胖中年的用户画像。

106、将服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和用户画像，得到与目标用户对应的推荐内容。

本实施例中，将所述服务偏好信息输入预置推荐评分模型，根据评分结果和所述用户画像，得到与所述目标用户对应的推荐内容。其中，根据所述用户行为数据获取用户画像标签；根据所述用户画像标签从所述第一候选内容中召回第二候选内容。具体的，用户画像标签可以包含用户的人口属性(性别，学历等)、历史行为、短期行为、兴趣内容和个人偏好等多个维度的数据，是给用户做个性化推荐的基础。

本实施例中，输入特征为各类型内容的点击序列与当前进行评分的第二候选内容低维向量构成的二维矩阵的数据，因此输出可得到各第二候选内容的预测点击率，该预测点击率即是对当前的第二候选内容的评分结果。对所述预测点击率进行排序；选出排名满足预设条件的第二候选内容作为推荐内容。实际应用中，预设条件可以根据实际需要进行设定。例如，可以设定为，对各第二候选内容的预测点击率从高到低进行排序，选择排名在前两位的第二候选内容生成推荐内容并推荐给用户。

本发明实施例中，通过获取用户行为数据，并对用户行为数据进行数据清洗，得到目标用户行为数据；将目标用户行为数据输入预置服务偏好分析模型，得到目标用户的服务偏好信息；通过预置意图识别模型对目标用户行为数据进行分析处理，得到用户意图标签数据；根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；将服务偏好信息输入预置推荐评分模型，根据评分结果和用户画像获取与目标用户对应的推荐内容。通过对用户行为数据进行分析，解决了现有技术中用户偏好数据推荐准确率低的技术问题。

请参阅图2，本发明实施例中用户行为数据分析方法的第二个实施例包括：

201、提取预置用户访问日志中的用户行为信息以及与用户行为信息对应的响应信息；

本实施例中，提取预置用户访问日志中的用户行为信息以及与所述用户行为信息对应的响应信息。由于在用户访问日志中是通过一条一条代码的形式记录用户访问目标网站的访问情况，因此需要在用户访问日志中提取具体的用户访问目标网站过程中产生的用户行为信息以及对应的响应信息，以便后续根据用户行为信息以及对应的响应信息生成目标网站服务器侧记录的用户行为数据。

202、根据预设分类规则，对用户行为信息和响应信息进行分类，得到至少一个行为数据；

本实施例中，根据预设分类规则，对用户行为信息和所述响应信息进行分类，得到至少一个行为数据。由于提取得到用户行为信息以及对应的响应信息是杂乱无章排序的，为了便于后续处理，需要根据预设分类规则，对提取得到的用户行为信息以及对应的响应信息进行分类。其中，预设的分类规则中可以包含一个分类参数，也可以包含多个分类参数，在实际应用过程中，可以根据实际需求设定预设分类规则中包含几个分类参数以及选择何种分类参数。预设的分类规则中具体包含几个分类参数以及包含何种分类参数，在本发明实施例，不进行限定。

203、根据预置筛选参数对行为数据进行筛选，得到用户行为数据；

本实施例中，根据预置筛选参数对所述行为数据进行筛选，得到用户行为数据。其中，获取得到预处理指令中包含的可配置筛选参数后，首先，根据可配置筛选参数对至少一个行为数据文件进行筛选，即将行为数据文件中与可配置筛选参数相关的行为信息以及对应的响应信息保留，将与配置筛选参数无关的行为信息以及对应的响应信息删除；然后，将经过筛选操作后的行为数据作为用户行为数据。

204、获取预设场景下、预设时间段内目标用户的用户行为数据；

205、确定所述用户行为数据对应的数据类型；

本实施例中，确定所述用户行为数据对应的数据类型。其中，不同数据类型的数据对应数据清洗规则不同。

206、根据用户行为数据的数据类型在预存的至少一个清洗规则中为用户行为数据选择目标清洗规则；

本实施例中，根据所述用户行为数据的数据类型在预存的至少一个清洗规则中为所述用户行为数据选择目标清洗规则。不同的数据可以有对应的业务场景，不同的业务场景对应有数据需要满足的规则或条件。例如：对于理赔业务场景，通常理赔政策会设置一定的门槛，只有达到这个门槛的理赔申请才会进行理赔，或者，购物平台的促销活动，也需要满足一定的条件才能参与促销活动。本说明书实施例可以根据数据清洗请求，确定出数据清洗的业务场景，获取对应业务场景的业务需求，根据业务需求定义对应的数据清洗规则，数据清洗规则中可以包括清洗特征因子和清洗特征因子满足的清洗条件。其中，清洗特征因子可以表示数据清洗的关键特征，如：理赔申请金额、理赔申请类型、理赔申请来源、理赔申请时间等。

207、根据目标清洗规则对用户行为数据进行清洗，得到目标用户行为数据；

本实施例中，根据所述目标清洗规则对所述用户行为数据进行清洗，得到目标用户行为数据。不同的业务场景都可能需要进行数据清洗，如：某保险理赔平台需要对一笔理赔申请数据进行数据清洗，用户可以通过理赔平台或其他客户端向数据清洗装置发送数据清洗请求。数据清洗请求中可以包括一些数据清洗关键信息，如：若要对某个理赔申请数据进行数据清洗，则数据清洗请求中可以包括该笔理赔的出险车辆的车牌号、出险时间、出险地点以及出险原因等信息。数据清洗请求中还可以包括数据清洗的需求，如：将什么样的数据清洗出来。数据清洗请求还可以对应有数据清洗场景如：理赔数据清洗场景、理赔类型清洗场景等。本说明书实施例中的数据清洗请求可以包括离线数据清洗请求，离线数据清洗可以实现大数据量的清洗，如：针对过去三个月的车险理赔数据进行清洗，清洗出符合某出险原因的理赔数据。

本实施例中，在确定用于对待清洗数据进行数据清洗的目标清洗规则之后，即可根据该目标清洗规则对待清洗数据进行数据清洗，使得对待清洗数据的清洗效果满足前述清洗需求，最终得到所需的目标理赔数据。

208、将目标用户行为数据输入预置服务偏好分析模型进行分析，得到目标用户的服务偏好信息；

209、通过预置意图识别模型对目标用户行为数据进行意图识别，得到用户意图标签数据；

210、根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；

211、将服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和用户画像，得到与目标用户对应的推荐内容。

本实施例中步骤204、208-211与第一实施例中的步骤101、103-106类似，此处不再赘述。

请参阅图3，本发明实施例中用户行为数据分析方法的第三个实施例包括：

301、获取预设场景下、预设时间段内目标用户的用户行为数据；

302、对用户行为数据进行数据清洗，得到目标用户行为数据；

303、对获取到的目标用户行为数据进行分析，确定目标用户行为数据对应的数据区间；

本实施例中，对获取到的目标用户行为数据进行分析，确定目标用户行为数据对应的数据区间。其中，在对获取到的目标用户行为数据进行分析时，可以将获取到的目标用户行为数据与预设的阈值进行比较，根据比较结果确定目标用户行为数据对应的数据区间，该阈值可以是单一的用户行为数据或用户属性数据阈值，例如，访问次数阈值，又如访问驻留时间阈值，该阈值还可以包括多个用户行为数据，例如，该阈值包括行为数量阈值和行为时间阈值。相应地，该数据区间是根据阈值确定的数据区间，该数据区间可以是两个，也可以是更多个，在此不作限定。比如，若A服务对应的阈值为访问次数阈值，该访问次数阈值为10，对应的数据区间包括第一数据区间(0，10)，第二数据区间[10，∞)，统计得到A服务对应的用户访问次数为4，则确定获取到的用户行为数据对应的数据区间为第一数据区间(0，10)。

在对获取到的目标用户行为数据进行分析，确定获取到的目标用户行为数据的数据区间时，还可以对获取到的目标用户行为数据的完整性进行分析，得出数据完整度，根据数据完整度与数据完整度阈值的比较，确定目标用户行为数据对应的数据区间，当然，还可以采用上述两种方式的结合来确定用户行为数据对应的数据区间，在此不作限定。

304、根据数据区间确定目标用户行为数据的计算权重；

本实施例中，根据数据区间确定目标用户行为数据的计算权重。其中，每个数据区间均对应有相应的计算权重，根据该数据区间确定用户行为数据的计算权重，以进一步提高用户服务偏好的准确性。例如，若设置有3个数据区间(0，5]、[5，20)、[20，∞)，相应地，该三个数据区间对应的计算权重分别为αi-0.2、βi+0.2，αi、βi，αi-0.1、βi+0.1，用户行为数据对应的数据区间为[20，∞)，则确定用户行为数据的权重分别为αi-0.1、βi+0.1。

305、根据计算权重、目标用户行为数据得分和预置服务偏好得分公式，得到用户的服务偏好信息；

本实施例中，根据所述计算权重、所述目标用户行为数据得分和预置服务偏好得分公式，得到所述用户的服务偏好信息。其中，考虑到每个服务对用户行为数据或用户属性数据的依赖程度不同，每个服务下的用户行为数据或用户属性数据的权重可能并不相同，在得到基于服务的用户行为集合和用户属性集合后，根据已定义的每个具体地服务对应的用户行为数据的得分计算方式，得到基于用户行为的服务偏好向量：(服务1，服务2，...，服务n)＝(B1，B2，B3，...，Bn)，以及基于用户属性的服务偏好向量：(服务1，服务2，...，服务n)＝(P1，P2，P3，...，Pn)。

在定义每个服务对应的用户行为数据或用户属性数据的得分计算方式时，可以为每个具体的用户行为或用户属性赋予一个特定的行为数值或属性数值，然后根据每个服务对应的用户行为或者用户属性，以及该用户行为或用户属性对应的行为数值或属性数值，求和后得到每个服务对应的用户行为得分或用户属性得分。作为示例地，服务1对应的用户行为数据为30天内用户对服务1的访问次数以及每次访问的驻留时间，已定义的服务1对应的用户行为数据的计算方式为：访问次数分值+驻留时间分值，其中，每一次访问的分值定义为0.8，驻留时间≤10秒对应的分值为0.1，10秒＜驻留时间≤1分钟对应的分值为0.2，驻留时间＞1分钟时对应的分值为0.6，若30天内用户对服务1的访问次数为3次，对应的驻留时间分别为30秒、2分钟、5分钟，则服务1对应的用户行为得分B1＝0.8×3+0.2+0.6+0.6＝3.8。

然后，根据上述基于用户行为的服务偏好向量和基于用户属性的服务偏好向量，以及服务偏好得分公式：C(i)＝αi×Bi+βi×Pi，计算得到用户的服务偏好向量：(服务1，服务2，...，服务n)＝(C1，C2，C3，...，Cn)，再根据服务偏好向量输出用户的服务偏好信息。

306、将目标用户行为数据输入预置服务偏好分析模型进行分析，得到目标用户的服务偏好信息；

307、通过预置意图识别模型对目标用户行为数据进行意图识别，得到用户意图标签数据；

308、根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；

309、将服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和用户画像，得到与目标用户对应的推荐内容。

本实施例中步骤301-302、306-309与第一实施例中的步骤101-106类似，此处不再赘述。

请参阅图4，本发明实施例中用户行为数据分析方法的第四个实施例包括：

401、获取预设场景下、预设时间段内目标用户的用户行为数据；

402、对用户行为数据进行数据清洗，得到目标用户行为数据；

403、将目标用户行为数据输入预置服务偏好分析模型进行分析，得到目标用户的服务偏好信息；

404、将目标用户行为数据输入预置意图识别模型进行特征提取，得到用户行为特征；

本实施例中，将所述目标用户行为数据输入预置意图识别模型进行特征提取，得到所述用户行为特征。其中，用户行为数据特征包括用户浏览特征和用户操作特征，用户浏览特征可以包括用户浏览时长特征和用户浏览数据项特征，用户操作特征可以包括用户购买行为特征、用户收藏行为特征，具体此处不做限定。可选的，服务器从预设数据库中获取用户行为数据。服务器将用户行为数据输入至已训练的意图识别模型中，并通过已训练的意图识别模型提取特征，得到用户行为特征。

本实施例中，特征提取是指机器学习数据预处理，包括数据特征提取。其中，数据特征提取包括：数据表达和特征提取。比如，有时,我们通过对数据集原来的特征进行转换,生成新的"特征"或者说成分,会比直接使用原始的特征效果要好,即数据表达(datarepresentation)；如图像识别,数据表达显得十分重要,因为图像是有成千上万个像素组成的,每个像素又有不同的RGB色彩值,所以我们要使用特征提取这种数据处理方法,特征提取是指使用计算机提取图像中属于特征性的信息的方法及过程。

405、对用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与初始意图标签数据对应的意图标签置信度值；

本实施例中，对用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与初始意图标签数据对应的意图标签置信度值。其中，语义相似度计算的计算方法有基于知识体系的计算，基于大规模语料库的计算和基于网络的计算。基于分类体系计算词语语义距离的方法，这种方法也成为了基于树的语义相似度计算方法，大体分为两种：一种是基于距离的语义相似度计算；一种是基于信息内容的语义相似度计算。

本实施例中，意图识别顾名思义就是判断用户要做什么，比如一个用户向机器人问了一个问题，于是机器人就需要判断这个用户他问的是天气、是旅游还是问某部电影的信息呢？说到底意图识别就是一个文本分类的问题。既然对应文本分类，那么首先就需要将明确有哪几类意图，也就是说我们需要预先定义好意图的类别然后才能考虑意图识别的问题。其中，意图分类是需要将其置于特定的场景中来考虑的，不同应用场景就有不同的意图分类。比如在美团APP上，它把用户的搜索意图分为订外卖、订酒店、订旅游门票、订电影票、订机票等类别。

406、当意图标签置信度值大于预设阈值时，将初始意图标签数据标记为用户意图标签数据；

本实施例中，当所述意图标签置信度值大于预设阈值时，将所述初始意图标签数据标记为用户意图标签数据。其中，需要说明的是，用户意图标签数据，也就是计算用户最感兴趣的标签集。对应的意图标签置信度值为在0至1区间中的任意一个值。进一步地，若对应的意图标签置信度值小于预设意图阈值，则服务器调整预设意图阈值，得到新的意图标签数据，并将新的意图标签数据设置为用户意图标签数据。

407、根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；

408、将服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和用户画像，得到与目标用户对应的推荐内容。

本实施例中步骤401-403、407-408与第一实施例中的步骤101-103、105-106类似，此处不再赘述。

请参阅图5，本发明实施例中用户行为数据分析方法的第五个实施例包括：

501、获取预设场景下、预设时间段内目标用户的用户行为数据；

502、对用户行为数据进行数据清洗，得到目标用户行为数据；

503、将目标用户行为数据输入预置服务偏好分析模型进行分析，得到目标用户的服务偏好信息；

504、通过预置意图识别模型对目标用户行为数据进行意图识别，得到用户意图标签数据；

505、查询预设标签规则表，得到对应的标签更新规则；

本实施例中，查询预设标签规则表，得到对应的标签更新规则。其中，预设标签规则表为预先设置的标签更新处理原则，具体的，服务器按照用户意图标签数据从预设标签规则表中读取对应的标签更新规则，对应的标签更新规则用于指示添加标签、删除标签以及添加和删除标签。例如，对应的标签更新规则为体重跟瘦身标签的规则，若用户的体重超过正常范围的30％，得到用户意图标签数据为超重，则服务器确定对应的标签更新规则为对用户关联减肥或者超重的标签，并删除体重正常的标签。

506、根据用户意图标签数据对目标用户进行画像，得到目标用户的初始用户画像；

本实施例中，根据所述用户意图标签数据获取初始用户画像，根据所述标签更新规则对所述初始用户画像进行更新，得到所述目标用户的用户画像。其中，标签是细粒度的用户信息，而用户画像(初始用户画像和目标用户画像)是基于用户不同维度的标签综合的信息。具体的，服务器采用用户标识数据从预设数据库中读取初始用户画像，并利用对应的标签更新规则将用户意图标签数据添加和/或删除至初始用户画像中，得到目标用户画像。例如，一个用户可以具有“中年”、“肥胖”、“高血压”、“经常熬夜”和“高油高脂”的标签，其中，“中年”标签可以根据年龄规则关联，“肥胖”标签可以根据体重和身高规则关联，“高血压”可以根据血压规则关联，“经常熬夜”标签可以根据用户访问预设应用服务的时间规则关联，“高油高脂”标签可以根据用户经常看油炸食谱规则关联。根据这些规则，可以刻画出一个肥胖中年的用户画像。

507、根据标签更新规则对初始用户画像进行更新，得到目标用户的用户画像；

本实施例中，根据标签更新规则对初始用户画像进行更新，得到目标用户的用户画像。用户画像(初始用户画像和目标用户画像)是基于用户不同维度的标签综合的信息。具体的，服务器采用用户标识数据从预设数据库中读取初始用户画像，并利用对应的标签更新规则将用户意图标签数据添加和/或删除至初始用户画像中，得到目标用户画像。

508、将服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和用户画像，得到与目标用户对应的推荐内容。

本实施例中步骤501-505、510与第一实施例中的101-105、106类似，此处不再赘述。

在本发明实施例中，通过获取用户行为数据，并对用户行为数据进行数据清洗，得到目标用户行为数据；将目标用户行为数据输入预置服务偏好分析模型，得到目标用户的服务偏好信息；通过预置意图识别模型对目标用户行为数据进行分析处理，得到用户意图标签数据；根据意图标签数据对目标用户进行画像，得到目标用户的用户画像；将服务偏好信息输入预置推荐评分模型，根据评分结果和用户画像获取与目标用户对应的推荐内容。通过对用户行为数据进行分析，解决了现有技术中用户偏好数据推荐准确率低的技术问题。

上面对本发明实施例中用户行为数据分析方法进行了描述，下面对本发明实施例中用户行为数据分析装置进行描述，请参阅图6，本发明实施例中用户行为数据分析装置的第一个实施例包括：

获取模块601，用于获取预设场景下、预设时间段内目标用户的用户行为数据；

数据清洗模块602，用于对所述用户行为数据进行数据清洗，得到目标用户行为数据；

偏好分析模块603，用于将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息；

意图识别模块604，用于通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据；

画像模块605，用于根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像；

评分模块606，用于将所述服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和所述用户画像，得到与所述目标用户对应的推荐内容。

请参阅图7，本发明实施例中用户行为数据分析装置的第二个实施例，该用户行为数据分析装置具体包括：

本实施例中，用户行为数据分析装置还包括：

提取模块607，用于提取预置用户访问日志中的用户行为信息以及与所述用户行为信息对应的响应信息；

分类模块608，用于根据预设分类规则，对用户行为信息和所述响应信息进行分类，得到至少一个行为数据；

筛选模块609，用于根据预置筛选参数对所述行为数据进行筛选，得到用户行为数据。

本实施例中，所述数据清洗模块602具体用于：

确定所述用户行为数据对应的数据类型；

根据所述用户行为数据的数据类型在预存的至少一个清洗规则中为所述用户行为数据选择目标清洗规则；

根据所述目标清洗规则对所述用户行为数据进行清洗，得到目标用户行为数据。

本实施例中，所述偏好分析模块603具体用于：

对获取到的所述目标用户行为数据进行分析，确定所述目标用户行为数据对应的数据区间；

根据所述数据区间确定所述目标用户行为数据的计算权重；

根据所述计算权重、所述目标用户行为数据得分和预置服务偏好得分公式，得到所述用户的服务偏好信息。

本实施例中，所述意图识别模块604包括：

特征提取单元6041，用于将所述目标用户行为数据输入预置意图识别模型进行特征提取，得到所述用户行为特征；

意图识别单元6042，用于对所述用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与所述初始意图标签数据对应的意图标签置信度值；

标记单元6043，用于当所述意图标签置信度值大于预设阈值时，将所述初始意图标签数据标记为用户意图标签数据。

本实施例中，所述画像模块605具体用于：

查询预设标签规则表，得到对应的标签更新规则；

根据所述用户意图标签数据对所述目标用户进行画像，得到所述目标用户的初始用户画像；

根据所述标签更新规则对所述初始用户画像进行更新，得到所述目标用户的用户画像。

上面图6和图7从模块化功能实体的角度对本发明实施例中的用户行为数据分析装置进行详细描述，下面从硬件处理的角度对本发明实施例中用户行为数据分析设备进行详细描述。

图8是本发明实施例提供的一种用户行为数据分析设备的结构示意图，该用户行为数据分析设备800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)810(例如，一个或一个以上处理器)和存储器820，一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中，存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对用户行为数据分析设备800中的一系列指令操作。更进一步地，处理器810可以设置为与存储介质830通信，在用户行为数据分析设备800上执行存储介质830中的一系列指令操作，以实现上述各方法实施例提供的用户行为数据分析方法的步骤。

用户行为数据分析设备800还可以包括一个或一个以上电源840，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口860，和/或，一个或一个以上操作系统831，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图8示出的用户行为数据分析设备结构并不构成对本申请提供的用户行为数据分析设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行上述用户行为数据分析方法的步骤。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所述领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用户行为数据分析方法，其特征在于，所述用户行为数据分析方法包括：

获取预设场景下预设时间段内目标用户的用户行为数据；

对所述用户行为数据进行数据清洗，得到目标用户行为数据；

将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息；

通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据；

根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像；

将所述服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和所述用户画像，得到与所述目标用户对应的推荐内容。

2.根据权利要求1所述的用户行为数据分析方法，其特征在于，在所述获取预设场景下预设时间段内目标用户的用户行为数据之前，还包括：

提取预置用户访问日志中的用户行为信息以及与所述用户行为信息对应的响应信息；

根据预设分类规则，对用户行为信息和所述响应信息进行分类，得到至少一个行为数据；

根据预置筛选参数对所述行为数据进行筛选，得到用户行为数据。

3.根据权利要求2所述的用户行为数据分析方法，其特征在于，所述对所述用户行为数据进行数据清洗，得到目标用户行为数据包括：

确定所述用户行为数据对应的数据类型；

4.根据权利要求3所述的用户行为数据分析方法，其特征在于，所述将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息包括：

根据所述数据区间确定所述目标用户行为数据的计算权重；

5.根据权利要求4所述的用户行为数据分析方法，其特征在于，所述通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据包括：

将所述目标用户行为数据输入预置意图识别模型进行特征提取，得到所述用户行为特征；

对所述用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与所述初始意图标签数据对应的意图标签置信度值；

当所述意图标签置信度值大于预设阈值时，将所述初始意图标签数据标记为用户意图标签数据。

6.根据权利要求5所述的用户行为数据分析方法，其特征在于，所述根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像包括：

查询预设标签规则表，得到对应的标签更新规则；

7.一种用户行为数据分析装置，其特征在于，所述用户行为数据分析装置包括：

获取模块，用于获取预设场景下预设时间段内目标用户的用户行为数据；

数据清洗模块，用于对所述用户行为数据进行数据清洗，得到目标用户行为数据；

偏好分析模块，用于将所述目标用户行为数据输入预置服务偏好分析模型进行分析，得到所述目标用户的服务偏好信息；

意图识别模块，用于通过预置意图识别模型对所述目标用户行为数据进行意图识别，得到用户意图标签数据；

画像模块，用于根据所述意图标签数据对所述目标用户进行画像，得到所述目标用户的用户画像；

评分模块，用于将所述服务偏好信息输入预置推荐评分模型进行评分，根据评分结果和所述用户画像，得到与所述目标用户对应的推荐内容。

8.根据权利要求7所述的用户行为数据分析装置，其特征在于，所述意图识别模块包括：

特征提取单元，用于将所述目标用户行为数据输入预置意图识别模型进行特征提取，得到所述用户行为特征；

意图识别单元，用于对所述用户行为特征进行语义相似度计算与意图识别，得到初始意图标签数据和与所述初始意图标签数据对应的意图标签置信度值；

标记单元，用于当所述意图标签置信度值大于预设阈值时，将所述初始意图标签数据标记为用户意图标签数据。

9.一种用户行为数据分析设备，其特征在于，所述用户行为数据分析设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述用户行为数据分析设备执行如权利要求1-6中任一项所述的用户行为数据分析方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的用户行为数据分析方法的步骤。