CN114676318A

CN114676318A - 数据处理方法及装置、电子设备及可读存储介质

Info

Publication number: CN114676318A
Application number: CN202210190186.6A
Authority: CN
Inventors: 王润奇; 方瑞玉; 张路浩; 胡懋地
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2022-02-28
Filing date: 2022-02-28
Publication date: 2022-06-28

Abstract

本发明公开了一种数据处理方法及装置、电子设备及可读存储介质。其中，该方法包括：将行为数据输入至预先训练完成的解释模型中；通过解释模型，确定行为数据对应的场景分布；根据场景分布对预设推荐模型进行训练。本发明解决了由于相关技术中人工构建场景信息较为复杂，通过自动化模型构建场景信息，但是细分场景优化差，意义较低，对推荐模型训练没有指导作用的技术问题。

Description

数据处理方法及装置、电子设备及可读存储介质

技术领域

本发明涉及数据分类技术领域，具体而言，涉及一种数据处理方法及装置、电子设备及可读存储介质。

背景技术

用户在电商平台消费的过程，是其基于所处的场景进行决策的过程。对于外卖用户来说，其所处的场景由时间(如早餐时段)、空间(如在公司、在外地)、用户属性(如消费水平、口味偏好)等因素共同组成。可以说，当前用户所处的场景信息，对判断用户决策有重要的参考价值。

目前的个性化推荐模型，通常通过以下两种方式补充场景信息：

1.手动构建：增加模型特征，人工对时间、空间、用户属性等特征做交叉，手动构建场景信息；

2.自动化模型：优化模型结构，模型自动对各类特征做抽取、交叉，隐式拟合场景信息。

申请人在实现本发明的过程中，发现相关技术中至少存在以下技术问题。

1.人工构建样本数据成本高，且对个人的领域知识要求较高；

2.由于推荐模型往往面向用户做精准的个性化推荐，所以用户的历史行为往往占据较高的权重，场景信息不能得到足够的重视。此外，推荐模型往往基于海量数据，对头部场景拟合效果较好，细分场景仍然存在较多优化空间。

可见，相关技术中针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种数据处理方法及装置、电子设备及可读存储介质，以至少解决由于相关技术中人工构建场景信息较为复杂，通过自动化模型构建场景信息，但是细分场景优化差，意义较低，对推荐模型训练没有指导作用的技术问题。

根据本发明实施例的一个方面，提供了一种数据处理方法，包括：将行为数据输入至预先训练完成的解释模型中；通过所述解释模型，确定所述行为数据对应的场景分布；根据所述场景分布对预设推荐模型进行训练。

进一步地，所述行为数据包括场景信息以及行为信息，其中，通过所述解释模型，确定所述行为数据对应的场景分布，包括：通过所述解释模型，根据所述场景信息以及所述行为信息确定所述场景分布。

进一步地，根据所述场景分布对预设推荐模型进行训练，包括：将所述场景分布中的所述场景信息以及所述行为信息作为输入特征，所述概率分布作为训练目标，对所述预设推荐模型进行训练。

进一步地，根据所述场景分布对预设推荐模型进行训练，包括：将所述场景分布中的所述场景信息作为节点，对所述预设推荐模型进行训练。

进一步地，所述行为数据还包括实体信息，其中，根据所述场景分布对预设推荐模型进行训练，包括：将所述实体信息转换对应的实体向量，根据所述实体向量所述预设推荐模型进行训练。

根据本发明实施例的另一方面，还提供了一种数据处理装置，包括：输入模块，用于将行为数据输入至预先训练完成的解释模型中；确定模块，用于通过所述解释模型，确定所述行为数据对应的场景分布；训练模块，用于根据所述场景分布对预设推荐模型进行训练。

进一步地，所述行为数据包括场景信息以及行为信息，其中，所述确定模块包括：确定子模块，用于通过所述解释模型，根据所述场景信息以及所述行为信息确定所述场景分布。

进一步地，所述训练模块，包括：第一训练子模块，用于将所述场景分布中的所述场景信息以及所述行为信息作为输入特征，所述概率分布作为训练目标，对所述预设推荐模型进行训练。

进一步地，所述训练模块，包括：第二训练子模块，用于将所述场景分布中的所述场景信息作为节点，对所述预设推荐模型进行训练。

进一步地，所述行为数据还包括实体信息，其中，所述确定模块包括：第三训练子模块，用于将所述实体信息转换对应的实体向量，根据所述实体向量所述预设推荐模型进行训练。

根据本发明实施例的另一方面，还提供了一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如上所述的数据处理方法的步骤。

根据本发明实施例的另一方面，还提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如上所述的数据处理方法的步骤。

在本发明实施例中，通过将行为数据输入至预先训练完成的解释模型中；通过解释模型，确定行为数据对应的场景分布；根据场景分布对预设推荐模型进行训练，通过解释模型构建行为数据的场景分布，使得构建出的场景信息有意义、可解释，能够实现对预设推荐模型进行有效地知道，进而解决了由于相关技术中人工构建场景信息较为复杂，通过自动化模型构建场景信息，但是细分场景优化差，意义较低，对推荐模型训练没有指导作用的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的数据处理方法的流程示意图；

图2是根据本发明实施例的一种可选的决策树的示意图；

图3是根据本发明实施例的一种可选的数据处理装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，提供了一种数据处理方法，如图1所示，该方法包括：

S102，将行为数据输入至预先训练完成的解释模型中；

在本实施例中，行为数据包括但不限于经过用户授权的用户完成订单交易、服务请求以及文娱体验等行为产生的相关数据。行为数据具体包括但不限于用户的个人信息、时间、空间、订单、价格等其他信息。

在上述的行为数据中，有些用户行为会伴随着相应的场景信息，例如在定外卖的行为数据中，场景信息包括但不限于收货地址、订餐时间等信息。

本实施例中的行为数据是从预设平台中的数据库中获取得到的，预设平台包括但不限于导航、文娱、服务、购物等任何网络平台。在用户完成订单交易、服务请求以及文娱体验等行为后，会产生相应的行为数据。在得到用户授权的情况下，预设平台的数据库会对行为数据进行记录并保存。

需要说明的是，本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应信息或数据的所有者给予授权的情况下进行的。还需要说明的是，本实施例的技术方案为海量数据建模分析，不针某个用户的个人数据进行分析以及业务应用。

S104，通过解释模型，确定行为数据对应的场景分布；

在获取到行为数据后，基于行为数据对推荐模型进行训练，使得训练完成后的推荐模型能够对用户行为进行预测或分类等。

而在现有技术中，由行为数据构建的样本数据对推荐模型进行训练，由于海量数据中对头部场景拟合效果较好，推荐模型的预测结果只会对一些场景进行推荐预测，而忽视或无法感知其他细分的场景。例如，模型对“下午茶时段”场景往往会推荐饮品甜点类商品，而对于用户“下午茶时段但午饭还未下单”这一细分场景缺少感知，无法推荐出快餐类商品。

为了解决上述问题，在本实施例中，通过解释模型来确定行为数据中场景信息与模型训练目标之间的概率分布。获取训练目标在细分场景中的概率分布，以增加细分场景中的可解释性。需要说明的是，本实施例中的对行为数据的获取以及处理动作均是在获取了用户授权允许的情况下进行的。

在本实施例中，行为数据包括多个维度的特征，通过多个维度的特征对预设推荐模型进行训练，解释模型用于根据行为数据中场景信息对应的场景特征与行为特征之间的逻辑关系来确定场景信息的场景分布。

在一个例子中，解释模型包括但不限于决策树模型、注意力神经网络等，通过决策树模型以及行为数据，拟合不同场景下用户行为的偏好程度。

可选地，在本实施例中，行为数据包括场景信息以及行为信息，其中，通过解释模型，确定行为数据对应的场景分布，包括但不限于：通过解释模型，根据场景信息以及行为信息确定场景分布。

在本实施例中，解释模型包括但不限于决策树模型Tree Based Model、注意力神经网络Attention Based Neural Network等，通过解释模型保证筛选得到的样本数据结果的可解释性。

在本实施例中，行为数据包括但不限于场景信息。其中，场景信息包括但不限于时间段、季节、商圈、位置等信息，行为信息包括但不限于用户的点击、收藏、下单以及搜索等行为信息。获取用户的点击、下单、搜索等行为产生的行为数据，然后通过解释模型，根据行为数据中的场景信息以及行为信息对用户行为所对应的场景进行解释。

需要说明的是，本实施例中的对行为数据的获取以及处理动作均是在获取了用户授权允许的情况下进行的。本实施例中的行为数据为获取了用户授权的数据，行为数据用于进行海量数据建模以及大数据分析，不透彻单个用户数据信息。

在一个例子中，如图2所示，以决策树模型为例进行说明，拟合不同场景下用户对“健康餐/轻食”类商家的偏好程度，收集包括不同时段、季节、城市级别、所处位置、商品价格、商圈等信息的行为数据，以“健康餐/轻食”类商家为正样本数据，其他类商家为负样本数据，基于决策树ID3/C4.5/CART等算法，以扩大两类商家的数量的差距为目标，进行决策树的扩展分类，来完成行为数据对应的场景分布。

在图2的决策树中，逐层对细分场景的用户的行为信息进行分类，在决策树的第一层顶点为用户的订单数据，在决策树的第二层中通过用餐类型对订单数据进行分类，然后在决策树的第三层基于位置信息进一步对订单数据进行分类，接下来，在决策树的第四层通过时间信息对订单数据做进一步地分类。通过决策树模型来实现对用户订单数据中各个场景信息对应的用户行为分布。

此外，在一些实施例的技术方案中，在通过解释模型根据场景信息以及行为信息确定场景分布之后，基于预设设置的规则对一些场景信息进行过滤。例如根据用户行为的发生的次数、以及用户行为发生的概率等。

在一个例子中，仍以不同场景下用户对“健康餐/轻食”类商家的偏好程度为例，设定过滤规则为“健康餐占比>0.2且健康餐占比>父节点健康餐占比”，经过阈值判断与筛选，筛选出面向“健康餐/轻食”类商家的场景及偏好程度。

接下来，在通过解释模型根据场景信息以及欣慰信息确定场景分布之后，通过比较用户在场景下实际的行为数据，与非场景下的交易行为，偏差是否满足预设条件。若满足预设条件，则判断挖掘出的结果对用户行为具备解释性，若不满足预设条件，则判断挖掘出的场景分布对用户行为不具备可解释性，丢弃相应的场景信息。

例如，比较行为数据中不存在场景信息的交易行为的数量，与存在场景信息的交易行为的数量的差值，是否满足预设差值阈值，若用户在不同时间的场景信息的交易行为与非场景信息对应的交易行为之间差值满足预设条件，则判断挖掘出的时间对应的场景信息对用户行为具备解释性，若不满足预设条件，则判断挖掘出的时间对应的场景信息对用户行为不具备可解释性。

S106，根据场景分布对预设推荐模型进行训练。

在获取到行为数据对应的用户行为在不同场景下的场景分布后，对场景分布中的场景信息进行合理性验证，保留存在对用户行为具备可解释性的场景信息。

然后基于场景分布中的场景信息对预设推荐模型进行训练，直至预设推荐模型收敛，或迭代预设次数。

可选地，在本实施例中，根据场景分布对预设推荐模型进行训练，包括但不限于：将场景分布中的场景信息以及行为信息作为输入特征，概率分布作为训练目标，对预设推荐模型进行训练。

具体地，对于输入为特征类的预设推荐模型，可以将挖掘出的场景信息直接作为推荐模型的特征维度，如[是否场景a，是否场景b，……]，其中场景a可以为时间，场景b可以为空间等。

通过对将不同场景信息作为训练特征对预设推荐模型进行训练，使得训练完成后的模型能够对场景变化、长尾场景敏感，直接获取到特征需要高维交叉才能够学习到的场景信息。

可选地，在本实施例中，根据场景分布对预设推荐模型进行训练，包括但不限于：将场景分布中的场景信息作为节点，对预设推荐模型进行训练。

在一个例子中，针对图向量模型，将场景分布中的场景信息作为节点加入到异构图模型中，对场景信息进行特征提取以得到场景向量，将场景向量加入到模型中。

在另一个例子中，对于i2i(item-item相似度)类模型，可以将场景信息作为节点加入到用户与商家的向量训练中，在模型的训练过程中补充有价值的场景信息。

可选地，在本实施例中，行为数据还包括实体信息，其中，根据场景分布对预设推荐模型进行训练，包括但不限于：将实体信息转换对应的实体向量，根据实体向量预设推荐模型进行训练。

在具体地应用场景中，若预设推荐模型的训练数据来自于知识图谱KnowledgeGraph)，知识图谱用于将复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来，通过知识图谱可以将行为数据可视化。在本实施例中，将场景信息作为实体加入到知识图谱中，对各类实体训练出向量后，加入推荐模型进行训练

需要说明的是，本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应信息或数据的所有者给予授权的情况下进行的。

还需要说明的是，本实施例的技术方案为海量数据建模分析，不针某个用户的个人数据进行分析以及业务应用。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

根据本发明实施例，还提供了一种用于实施上述数据处理方法的数据处理装置，如图3所示，该装置包括：

1)输入模块30，用于将行为数据输入至预先训练完成的解释模型中；

2)确定模块32，用于通过所述解释模型，确定所述行为数据对应的场景分布；

3)训练模块34，用于根据所述场景分布对预设推荐模型进行训练。

可选地，在本实施例中，所述行为数据包括场景信息以及行为信息，其中，所述确定模块32包括：

1)确定子模块，用于通过所述解释模型，根据所述场景信息、所述时间信息以及所述行为信息确定所述场景分布。

可选地，在本实施例中，所述训练模块34，包括：

1)第一训练子模块，用于将所述场景分布中的所述场景信息以及所述行为信息作为输入特征，所述概率分布作为训练目标，对所述预设推荐模型进行训练。

可选地，在本实施例中，所述训练模块34，包括：

1)第二训练子模块，用于将所述场景分布中的所述场景信息作为节点，对所述预设推荐模型进行训练。

可选地，在本实施例中，所述行为数据还包括实体信息，其中，所述确训练模块34包括：

1)第三训练子模块，用于将所述实体信息转换对应的实体向量，根据所述实体向量所述预设推荐模型进行训练。

实施例3

根据本发明实施例，还提供了一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如上所述的数据处理方法的步骤。

可选地，在本实施例中，存储器被设置为存储用于执行以下步骤的程序代码：

S1，将行为数据输入至预先训练完成的解释模型中；

S2，通过所述解释模型，确定所述行为数据对应的场景分布；

S3，根据所述场景分布对预设推荐模型进行训练。

可选地，本实施例中的具体示例可以参考上述实施例1中所描述的示例，本实施例在此不再赘述。

实施例4

本发明的实施例还提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如上所述的数据处理方法的步骤。

可选地，在本实施例中，可读存储介质被设置为存储用于执行以下步骤的程序代码：

S1，将行为数据输入至预先训练完成的解释模型中；

S3，根据所述场景分布对预设推荐模型进行训练。

可选地，可读存储介质还被设置为存储用于执行上述实施例1中的方法中所包括的步骤的程序代码，本实施例中对此不再赘述。

可选地，在本实施例中，上述可读存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地，本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例，本实施例在此不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种数据处理方法，其特征在于，包括：

将行为数据输入至预先训练完成的解释模型中；

通过所述解释模型，确定所述行为数据对应的场景分布；

根据所述场景分布对预设推荐模型进行训练。

2.根据权利要求1所述的方法，其特征在于，所述行为数据包括场景信息以及行为信息，其中，通过所述解释模型，确定所述行为数据对应的场景分布，包括：

通过所述解释模型，根据所述场景信息以及所述行为信息确定所述场景分布。

3.根据权利要求2所述的方法，其特征在于，根据所述场景分布对预设推荐模型进行训练，包括：

将所述场景分布中的所述场景信息以及所述行为信息作输入特征，所述概率分布作为训练目标，对所述预设推荐模型进行训练。

4.根据权利要求2所述的方法，其特征在于，根据所述场景分布对预设推荐模型进行训练，包括：

将所述场景分布中的所述场景信息作为节点，对所述预设推荐模型进行训练。

5.根据权利要求1所述的方法，其特征在于，所述行为数据还包括实体信息，其中，根据所述场景分布对预设推荐模型进行训练，包括：

将所述实体信息转换对应的实体向量，根据所述实体向量所述预设推荐模型进行训练。

6.一种数据处理装置，其特征在于，包括：

输入模块，用于将行为数据输入至预先训练完成的解释模型中；

确定模块，用于通过所述解释模型，确定所述行为数据对应的场景分布；

训练模块，用于根据所述场景分布对预设推荐模型进行训练。

7.根据权利要求6所述的装置，其特征在于，所述行为数据包括以及行为信息，其中，所述确定模块包括：

确定子模块，用于通过所述解释模型，根据所述场景信息以及所述行为信息确定所述场景分布。

8.根据权利要求7所述的装置，其特征在于，所述训练模块，包括：

第一训练子模块，用于将所述场景分布中的所述场景信息以及所述行为信息作为输入特征，所述概率分布作为训练目标，对所述预设推荐模型进行训练。

9.根据权利要求7所述的装置，其特征在于，所述训练模块，包括：

第二训练子模块，用于将所述场景分布中的所述场景信息作为节点，对所述预设推荐模型进行训练。

10.根据权利要求6所述的装置，其特征在于，所述行为数据还包括实体信息，其中，所述确定模块包括：

第三训练子模块，用于将所述实体信息转换对应的实体向量，根据所述实体向量所述预设推荐模型进行训练。

11.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1-5所述的数据处理方法的步骤。

12.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-5所述的数据处理方法的步骤。