CN114912934A

CN114912934A - 用户意愿识别方法、装置以及电子设备

Info

Publication number: CN114912934A
Application number: CN202110178927.4A
Authority: CN
Inventors: 樊鹏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2022-08-16

Abstract

本公开提供一种用户意愿识别方法、装置以及电子设备，涉及机器学习技术领域。该用户意愿识别方法包括：通过用户端的用户行为数据构建用户画像信息；采集所述用户端在目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应的特征编码方式进行编码，以确定所述场景行为数据对应的特征向量；利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。本公开提供的技术方案能够通过深度学习的方式对目标业务场景下的用户意愿进行识别，可以提高用户意愿的识别精度。

Description

用户意愿识别方法、装置以及电子设备

技术领域

本公开涉及机器学习技术领域，具体而言，涉及一种用户意愿识别方法、用户意愿识别装置，以及实现上述用户意愿识别方法的电子设备。

背景技术

随着信息网络的发展，电子化的广告逐步成为最主要的广告投放形式，在互联网上投放的广告在品牌推广、产品销售回馈、市场反应分析等各个方面都要比传统的广告更具有优势。结合人工智能技术对用户数据进行分析，还可以实现广告的精准投放，实现广告效果的最大化。

二类电商是指在电商平台之外，独立的产品网站，可以通过一切可以引流的渠道进行推广产生订单，不受电商平台的规则限制。在二类电商广告推荐的相关技术中，通常是基于业务经验和投放广告的商品特征来设定潜在人群的划分规则，比如中高端护肤品广告，选择对中高端手机设备、女性群体进行投放等。人工经验确定数据规则的方式，不仅使用的规则数量非常有限，而且无法确定每个规则的最优参数，导致二类电商广告的投放效果差的问题。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种用户意愿识别方法、用户意愿识别装置、电子设备以及计算机可读存储介质，进而在一定程度上避免通过人为规则来识别广告意愿用户，降低人工时间成本，以及提升意愿识别的准确性。

根据本公开的第一方面，提供一种用户意愿识别方法，该方法包括：通过用户端的用户行为数据构建用户画像信息；采集目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量类型对应特征编码方式进行编码，以确定所述场景行为数据对应的特征向量；采用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

在本公开的一种示例性实施例中，基于前述实施例，通过用户端的用户行为数据构建用户画像信息包括：统计所述用户端在不同时间窗口的用户行为数据，以获取所述用户端的线上时间特征以及基础属性特征，作为所述用户画像信息。

在本公开的一种示例性实施例中，基于前述实施例，所述变量包括网络连接变量以及类目变量，按照变量对应的特征编码方式进行编码，以确定所述场景行为数据对应的特征向量包括：对所述场景行为数据中包含的网络连接变量进行计数，以获取所述网络连接变量对应的第一向量；对所述场景行为数据中包含的类目变量按照独热编码方式进行编码，以获取所述类目变量对应的第二向量；将所述第一向量与所述第二向量进行拼接，以获取所述场景行为数据对应的特征向量。

在本公开的一种示例性实施例中，基于前述实施例，对所述场景行为数据中包含的类目变量按照独热编码方式进行编码，以获取所述类目变量对应的第二向量包括：将存在两种取值的类目变量按照独热编码方式进行编码，获取对应的所述第二向量；将存在三种以上取值的类目变量进行特征归纳处理，对处理后取值进行独热编码，以获取对应的第二向量。

在本公开的一种示例性实施例中，基于前述实施例，所述方法还包括：按照所述场景行为数据中包含的各个变量的取值，对所述场景行为数据进行缺失值编码，以确定所述特征向量。

在本公开的一种示例性实施例中，基于前述实施例，采用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型包括：对所述用户画像信息以及所述特征向量进行拼接，以获得训练样本；根据所述场景行为数据确定所述训练样本对应的意愿标签；利用所述训练样本以及对应的意愿标签对深度学习模型进行训练，以获得训练后的用户意愿识别模型。

在本公开的一种示例性实施例中，基于前述实施例，所述目标业务场景包括二类电商广告，所述通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿包括：将待识别用户端的用户行为数据输入所述用户意愿识别模型，以通过所述用户意愿识别模型预测所述待识别用户端点击二类电商广告的概率。

在本公开的一种示例性实施例中，基于前述实施例，所述方法还包括：在所述目标业务场景变化时，更新变化后场景对应的所述场景行为数据；利用所述用户画像信息以及更新后的场景行为数据重新构建意愿识别模型，以识别所述待识别用户端对所述变化后场景的意图。

根据本公开的第二方面，提供了一种用户意愿识别装置，该装置包括：

用户画像模块，用于通过用户端的用户行为数据构建用户画像信息；特征表示模块，用于采集目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应特征编码方式进行编码，以确定所述场景行为数据对应的特征向量；模型应用模块，用于利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

在本公开的一种示例性实施例中，基于前述实施例，用户画像模块可以被配置为：统计所述用户端在不同时间窗口的用户行为数据，以获取所述用户端的线上时间特征以及基础属性特征，作为所述用户画像信息。

在本公开的一种示例性实施例中，基于前述实施例，所述特征表示模块可以包括第一编码模块、第二编码模块以及特征拼接模块。

其中，第一编码模块可被配置为：对所述场景行为数据中包含的网络连接变量进行计数，以获取所述网络连接变量对应的第一向量。

第二编码模块被配置为用于：对所述场景行为数据中包含的类目变量按照独热编码方式进行编码，以获取所述类目变量对应的第二向量。

特征拼接模块用于将所述第一向量与所述第二向量进行拼接，以获取所述场景行为数据对应的特征向量。

在本公开的一种示例性实施例中，基于前述实施例，第二编码模块可配置为：将存在两种取值的类目变量按照独热编码方式进行编码，获取对应的所述第二向量；将存在三种以上取值的类目变量进行特征归纳处理，对处理后取值进行独热编码，以获取对应的第二向量。

在本公开的一种示例性实施例中，基于前述实施例，该装置还可以包括缺失值编码模块，可配置为按照所述场景行为数据中包含的各个变量的取值，对所述场景行为数据进行缺失值编码，以确定所述特征向量。

在本公开的一种示例性实施例中，基于前述实施例，该模型应用模块可以包括训练样本获取模块、意愿标签确定模块以及模型训练模块。

其中，训练样本获取模块用于对所述用户画像信息以及所述特征向量进行拼接，以获得训练样本。

意愿标签确定模块，用于根据所述场景行为数据确定所述训练样本对应的意愿标签。

模型训练模块，用于利用所述训练样本以及对应的意愿标签对深度学习模型进行训练，以获得训练后的用户意愿识别模型。

在本公开的一种示例性实施例中，基于前述实施例，所述目标业务场景包括二类电商广告，该模型应用模块可配置为：将待识别用户端的用户行为数据输入所述用户意愿识别模型，以通过所述用户意愿识别模型预测所述待识别用户端点击二类电商广告的概率。

在本公开的一种示例性实施例中，基于前述实施例，该装置还包括业务场景更新模块以及模型更新模块。

其中，业务场景更新模块，用于在所述目标业务场景变化时，更新变化后场景对应的所述场景行为数据。

模型更新模块，用于利用所述用户画像信息以及更新后的场景行为数据重新构建意愿识别模型，以识别所述待识别用户端对所述变化后场景的意图。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意实施例所述的用户意愿识别方法。

根据本公开的第四方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述任意实施例所述的用户意愿识别方法。

根据本公开的第五方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质中读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各个实施例中提供的用户意愿识别方法。

本公开示例性实施例可以具有以下部分或全部有益效果：

在本公开的一示例实施方式所提供的用户意愿识别方法中，通过用户端的用户行为数据构建用户画像信息，并通过对场景行为数据，按照变量对应的特征编码方式进行编码，确定场景行为数据对应的特征向量，进一步采用深度学习算法结合用户画像信息以及特征向量进行模型训练，获得训练后的用户意愿识别模型，从而通过获得的用户意愿识别模型来预测用户端对目标业务场景的意愿。

可见，本技术方案中，无需通过人为制定规则来确定目标人群，而是通过深度学习训练得到的用户意愿识别模型来识别用户意愿，能够提高意愿识别的准确性。并且，通过用户行为数据构建用户画像信息，客观准确地表征人群特点，通过场景行为数据表征业务场景的特点，从而使得模型能够捕捉用户端与目标业务场景之间交互的高维特征信息，提高模型精度。同时，采取目标业务场景与用户端自身的用户行为数据相结合的方式，可以使用户意愿识别模型满足不同场景的识别需求，提高模型的复用性，降低成本。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了可以应用本公开实施例的用户意愿识别方法的系统架构图。

图2示意性示出了根据本公开的一实施例的用户意愿识别方法的流程示意图。

图3示意性示出了根据本公开的另一实施例的用户意愿识别方法的流程示意图。

图4示意性示出了根据本公开的一实施例的用户意愿识别方法的流程示意图。

图5示意性示出了根据本公开的另一实施例的用户意愿识别方法的流程图。

图6示意性示出了根据本公开的一实施例中用户意愿识别模型的测试效果示意图。

图7示意性示出了根据本公开的一实施例的用户意愿识别模型的应用效果示意图。

图8示意性示出了根据本公开的一实施例的用户意愿识别方法的流程示意图。

图9示出了可以应用本公开一实施例的用户意愿识别装置的结构示意图。

图10示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

本技术方案中，用户端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等终端设备，但并不局限于此。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

本技术方案提供的用户意愿识别方法的使用场景可以是：二类电商通常以H5落地页为基础，以信息流广告方式触达用户，以货到付款等方式作为推广模式。在二类电商广告进行精准投放时，需要识别出对二类电商广告具有高意愿的用户。

本技术方案提供的用户意愿识别方法的使用场景还可以是：随着AI(ArtificialIntelligence,人工智能)技术的发展，机器学习模型的应用越来越广泛。进而在用户端浏览互联网信息时，对用户意愿进行识别，根据用户意愿向用户推荐需要的信息。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

具体的，图1示出了可以应用本公开实施例的一种用户意愿识别方法的示例性应用环境的系统架构的示意图。

如图1所示，该系统架构100可以包括：作为用户端的终端设备101、102、103中的一个或多个、网络104以及服务器105。

其中，终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。

网络104用以在终端设备101、102、103和服务器之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

服务器105可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105是多个服务器组成的服务器集群等。

基于上述系统架构，以下对本技术方案提供的用户意愿识别方法的实施例进行详细阐述：

图2示意性示出了根据本公开的一实施例的用户意愿识别方法的流程图。具体的，本实施例所提供的用户意愿识别方法以服务器为执行主体。参考图2，该图所示实施例包括步骤S21、步骤S22以及步骤S23。

在步骤S21中，通过用户端的用户行为数据构建用户画像信息。

用户行为数据可以包括用户的标识信息，例如用户名、用户ID等，还可以包括用户端自身的标识信息和属性信息，例如设备ID、设备型号等，或者用户端的网络连接信息，例如网络类型、连接时长等等，本实施方式对此不做限定。

在用户端在线时用户的每一次服务请求通过线上日志数据进行记录，因此可以从线上缓存中拉取实时记录的日志数据，并将拉取的数据存储在分布式文件系统(HadoopDistributed File System，可简称为HDFS)中。HDFS具有高容错性的特点，并且可设计用于部署在低成本的硬件上，能够提供高吞吐量来访问数据，适合超大规模数据集的场景。从HDFS中可以读取日志数据，从读取的日志数据中提取出需要的数据作为用户行为数据。或者对日志数据进行离线统计等计算处理，从而得到需要的用户行为数据。例如，从日志数据中提取出用户端每一次在线时记录的用户ID、设备型号、网络连接类型、网络连接时长等信息，作为用户行为数据。

对每一个用户端的所有用户行为数据进行分析计算可以建构出用户端的用户画像信息。其中，用户画像信息可以包括用户端的基础属性特征以及用户端的线上时间特征。基础属性特征可以包括用户属性，例如用户性别、用户年龄等；设备属性，例如用户端自身的设备类型、设备等级等；以及网络连接属性，例如网络类型(如热点连接、宽带连接等)、连接时间、断开时间等等。线上时间特征可以指用户端在线的时间规律，具体可以包括用户端在线的时间段，例如周末、工作日时间段、活动时间、休息时间等等。

通过从用户端拉取的用户行为数据可以解析出用户端在哪个时间段在线，以及该时间段对应的网络连接属性，例如，用户端工作日在20点至22点以热点连接的方式在线，周末在11点至14点以宽带连接的方式在线等等。示例性实施方式中，统计用户端在不同时间窗口的用户行为数据；进而得出用户端的线上时间特征以及基础属性特征作为用户画像信息。由于用户不同时期的线上行为不同，以不同时间窗口的数据积累更能体现出用户的行为特征。举例而言，定时离线统计用户端近半年、近三个月、近一个月、近一周、近三天的用户行为数据，从而得出不同时间窗口的用户画像信息，例如用户近半年的网络连接类型以及对应的在线时间段等。

在步骤S22中，采集所述用户端在目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应的特征编码方式进行编码，以确定所述场景行为数据对应的特征向量。

场景行为数据为用户在目标业务场景下记录的数据，其中可以包括多个变量，每条场景行为数据中包含的变量的取值不同。具体的，场景行为数据中可以包括广告信息，例如广告属性、广告类目、广告渠道等，同时还可以包括用户端的信息以及用户端对于广告的行为信息，例如用户端当前在线的时间、浏览广告的时长、是否点击广告、是否购买广告商品等。目标业务场景对应的场景行为数据也可以从用户端记录的日志数据中提取，具体的，目标业务场景的日志数据通常保存在该业务场景对应的特定目录中，利用通过数据采集工具定时从该特定目录中拉取数据到服务器，或者文件存储系统中进行存储。

示例性的，按照一定的时间周期来更新场景行为数据，例如每周采集一次场景行为数据，每10天采集更新一次、每一个月更新一次、每三个月更新一次等等，从而使得场景行为数据保持一定的时效性，有利用提高模型识别的精确性。

场景行为数据中的每个变量可以对应不同的特征编码方式。在二类电商广告的场景中，用户的场景行为数据比较复杂，特征信息在数据表征上很难显示表达，导致该场景下无法采用深度学习的方式对数据进行学习处理。因此本实施方式中按照场景行为数据中包含的变量采用多种编码方式对数据进行编码，每个变量可以采取不同的特征编码方式，从而充分表征特征，提高特征表征的准确性，以便于机器学习模型对数据进行处理。

对数据进行编码指的是将计算机不能识别的数据编码成计算机可以识别和处理的数据，即将特征转换成数字表示，例如性别“男、女”在计算时无法进行处理则会导致该特征丢失，可以将“男”编码为1，“女”编码为0，从而可以进行计算等数据处理，使模型学习该特征与其他特征之间的联系。

本实施方式中预先分析场景行为数据中包括的所有可能的变量，确定所有的变量类型，例如性别变量、网络连接变量、广告类目变量、设备类目变量、应用程序类目、数值型变量等等。并且建立每个变量类型与特征编码方式之间的对应关系，使得每个变量可以对应一种特征编码方式，例如，性别变量采用独热编码技术等。此外，根据实际需求不同的变量也可以对应相同的特征编码方式，例如性别变量对应的特征编码方式为独热编码，网络连接变量也同样采用独热编码进行编码。

示例性的，图3示意性示出了本公开的一实施例的编码方法的流程图。本实施例的执行主体可以为服务器。在本实施例中，场景行为数据中可以包括网络连接变量以及类目变量，参考图3所示，该实施例可以包括步骤S31、步骤S32以及步骤S33。

在步骤S31中，对所述场景行为数据中包含的网络连接变量进行计数，以获取所述网络连接变量的第一向量。对场景行为数据中包含的网络连接变量进行计数，将获取的计数结果作为网络连接变量对应的第一向量。通常情况下，不同地点用户端会采取不同的网络连接方式，因此通过网络连接变量的取值可以反映用户端所处地点特征。网络连接变量可以包括多种取值，网络连接变量的取值可以为连接的网络名称，例如WiFi热点名称、宽带名称等。对该网络连接变量的每一种取值进行计数，得到计数结果，将计数结果作为该变量对应的编码，从而将该变量转换为向量。例如，采集半个月内的场景行为数据，网络连接变量为“美食-中国菜-粤菜”的热点共3次，则该“美食-中国菜-粤菜”编码为3，网络连接变量为“饮品-奶茶”的热点共5吃，则“饮品-奶茶”对应的编码为5，可以得到该网络连接变量对应的第一向量为(3，5)。

在步骤S32中，对所述场景行为数据中包含的类目变量按照独热编码方式进行编码，以获取所述类目变量对应的第二向量。独热编码在本领域中也称为one-hot编码，或者一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候只有一位有效。采用独热编码可以将离散特征的取值扩展到欧式空间，离散特征的某个取值就对应欧式空间中的某个点。类目变量是场景行为数据中存在分类类目的数据，其取值可以为具体的分类类目，例如广告商品的类目“日常用品-餐具-陶瓷制品”等。根据类目变量的所有取值，为每个取值确定对应的编码值，例如，类目变量共有三种取值，则通过独热编码后，该三种取值可以分别对应100，010，001。根据场景行为数据中该类目变量的具体取值，可以确定该变量对应的第二向量，例如类目变量的取值为“食品-饼干”对应的编码为100，则对应的第二向量为100。

示例性的，图4示意性示出了本公开一种实施例中对类目变量按照热独编码获得第二向量的方法的流程图。参考图4所示，该方法可以包括：

步骤S41，将存在两种取值的类目变量按照独热编码方式进行编码，以获取对应的所述第二向量。步骤S42，将存在三种以上取值的类目变量进行特征归纳处理，对处理后取值进行独热编码，以获取对应的第二向量。

场景行为数据中可以包括多个类目变量，例如系统版本类目、广告商品类目、性别分类、网络连接分类等。不同的类目变量取值不同，当类目变量只存在两种取值时，可以直接采用独热编码进行编码得到第二向量。当类目变量存在多种取值时，可以首先对类目变量的取值进行特征归纳处理，从而减少类目变量的取值。例如安卓手机的系统版本特征的多个取值里包括“4.2”、“4.4”和“5.0”等，可以将这三个值归纳处理为“低版本安卓系统”，将“5.1、6.0”等大于“5.0”的值可以归纳为“高版本安卓系统”。实验证明通过特征归纳处理的方式，比直接对“安卓系统版本”这一类目变量的各个取值进行one-hot能带来更大的正向收益。

在步骤S33中，将上述第一向量与上述第二向量进行拼接，以获取所述场景行为数据对应的特征向量。需要理解的是，本公开采用第一向量与第二向量的描述是为了便于描述网络连接变量以及类目变量所对应的不同的特征编码方式，实际上场景行为数据中每个变量可以转换成一个向量，最终将各个变量对应的向量进行连接可以得到完整的场景行为数据对应的特征向量。并且，在本公开的实施例中，场景行为数据中还包括其他类型的变量，例如数值型变量、缺失值的变量等。

示例性实施方式中，网络连接变量可以表征用户网络连接的轨迹，例如从宽带连接到WiFi热点连接，从家中热点到公司热点等等，因此本实施方式还可以对网络连接变量的轨迹进行编码，捕捉用户网络行为的信息。例如，通过基于最小生成树(MST，MinimumSpanning Tree)的卷积神经网络来提取网络连接的轨迹特征，将轨迹转换成Embedding特征。

示例性的实施方式中，稀疏性较强的类目变量可能导致模型过拟合，为了避免该过拟合以及提高模型稳定性，对于类目变量还可以采用神经网络Embedding将高维稀疏的分类类目变量转换为低维稠密的Embedding变量。Embedding可以将离散变量转为连续向量表示。并且，基于List-Embedding的方式还可以对类目变量的不同取值进行Embedding提取，例如对不同类目APP的流量使用情况进行Embedding提取等，获取低维稠密的特征表示。

示例性实施方式中，对于数值型变量可以通过归一化方法来消除特征之间的量纲差异，使得模型更加稳定。例如对于符合或近似正太分布的特征，选择高斯归一化方法。

数据经常存在缺失值的情况，对于场景行为数据中缺失值的变量可以进行填充处理，例如按照特定值或者平均值进行填充等，或者直接将缺失值进行剔除；或者按照缺失标记的方式对缺失值进行处理等等，以便于将场景行为数据转换为特征向量。但是，将缺失值直接进行填充或者剔除等方式进行处理后，对应的变量对于模型学习的意义将会减小。因此示例性的，按照场景行为数据中包含的各个变量的取值，对场景行为数据进行缺失值编码，以确定特征向量。其中，缺失值编码可以指对场景行为数据的变量取值状态进行编码，从而表征数据的完整性特征。举例而言，将存在取值的变量可以编码为1，将缺失值的变量编码为0，从而将场景行为数据的缺失值状态转换为一向量，例如场景行为数据中包含5个变量，其中第一个变量的取值缺失，则对应的编码结果为01111。可见，本实施方式可以通过缺失值编码，增加一表征数据缺失状态的特征，从而充分利用缺失值为模型带来最大正向收益。

对场景行为数据进行缺失值编码之后，可以将编码结果作为一特征，与各个变量对应的向量进行连接，最终得到场景行为数据的特征向量。

每一种特征编码方式均可以得到场景行为数据的一个特征(向量)，将得到的特征进行拼接最终可以得到场景行为数据的特征向量。例如，首先通过计数的方式对场景行为数据中的网络连接变量进行编码，得到第一向量；再通过独热编码方式对场景行为数据中的类目变量进行编码，得到第二向量；再通过Embedding方式对场景行为数据中的类目变量进行处理，得到低维的第三向量；再通过缺失值编码的方式对场景行为数据进行处理得到第四向量，将第一向量、第二向量、第三向量以及第四向量进行合并，从而得到场景行为数据最终的特征向量。再例如，通过Embedding方式对各类目变量对应的取值进行处理，得到第一向量；再对类目变量的各个取值进行Embedding提取，得到第二向量；再通过归一化处理的方式对场景行为数据中的数值型变量进行处理，得到第三向量；再通过MST-CNN深度学习网络对网络连接变量的轨迹进行Embedding，得到第四向量；将第一、第二、第三、第四向量进行合并得到最终的特征向量等。可见，本实施方式可以从各个维度对特征进行表征，从而使得模型学习特征之间的交互，有利用提高模型的识别精度。

在本公开的其他实施例中，特征编码方式还可以包括其他方式，例如标签编码(Label Encoding)，Label Encoding是为特征变量自定义数字标签，将特征变量转化成数字表示的方式；再例如采用Dummy coding(虚拟编码)等等，本公开实施例不限于此。

继续参考图2，在步骤S23中，利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

本实施方式中，结合用户画像信息以及场景行为数据对应的特征向量可以得到训练样本，从而构建深度学习模型利用训练样本对深度学习模型进行训练。训练的具体过程可以如图5所示，参考图5，训练得到用户意愿识别模型的方法可以包括步骤S51、步骤S52以及步骤S53。

在步骤S51中，将用户画像信息以及特征向量进行拼接，以获得用户意愿识别模型的训练样本。对于每一用户端，可以将该用户端的用户画像信息以及该用户端的场景行为数据对应的特征向量进行拼接，从而将用户行为数据与场景行为数据的特征进行合并，得到用户端对应的训练样本。该训练样本结合了用户行为数据以及场景行为数据这两方面的特征，可以表示用户端在目标业务场景中的意愿。

在步骤S52中，根据场景行为数据确定训练样本对应的意愿标签。具体的，场景行为数据中可以包括一特定变量，该特定变量可以用于表示用户对目标业务场景的意愿，例如对广告的点击行为或者购买行为。举例而言，若场景行为数据中特定变量的值为1，则可以确定意愿标签为1，表示用户端存在意愿，若特定变量的值为0，则可以表示用户不存在意愿，意愿标签为0。通过意愿标签可以将训练样本分为正样本和负样本。

在步骤S53中，利用训练样本以及对应的意愿标签对深度学习模型进行训练，以获取训练后的用户意愿识别模型。深度学模型可以通过各种深度学习算法来构建，例如多层感知器和神经网络、深度神经网络、循环神经网络和递归神经网络等。通过构建深度学习模型可以对训练样本进行特征学习，确定训练样本与其意愿标签之间的映射规律。

举例而言，可以采用深度学习模型RALM(real-time attention based look-alike model)来进行训练，训练结束后可以得到符合需求的用户意愿识别模型。

RALM模型本质上是一个基于相似性的模型，其中包括“用户表示学习”和“look-alike模型学习”两部分。look-alike模型采用双塔的结构，左侧的输入是种子用户的Embedding向量，右侧的输入是目标用户(待识别用户端)的Embedding向量，两侧的Embedding经过一层全连接层完成到低维空间的映射。其中，种子用户可以指训练样本对应的用户端，而目标用户则指待识别用户端。由于右侧的目标用户的Embedding向量是经过用户表征学习得到的，为了防止过拟合，双塔的第一层全连接层是共享的。在经过全连接层之后，左侧的塔可以得到各个簇对应的Embedding，然后将各个簇的Embedding和目标用户的Embedding分别输入给Global Attention Unit(全局注意单元)和Local Attention Unit(局部注意单元)就可以得到Global Embedding(全局特征表示)和Local Embedding(局部特征表示)。该模型优化了用户表示学习的效果，针对多域用户兴趣表示学习问题，引入了“注意力融合层”的深度兴趣网络，可以解决由强相关特征和弱相关特征分别带来的过拟合和噪音问题，注意力融合层能够捕获用户各种不同场景的兴趣偏好。全局注意单元可以对单个用户的表示进行加权，并且惩罚噪音用户，与所有用户用相同权重更具有鲁棒性。局部注意单元来学习种子用户的局部表示，可以对种子用户与目标用户的相关性进行加权，对于不同的目标用户，学习到的种子用户表示不同，能够极大地提升种子用户的表达能力。

在模型训练阶段，FALM模型通过聚类进行特征提取，聚类过程反复迭代耗时较多，聚类中心数会影响聚类效果，根据实际需求可以灵活设置聚类中心数，例如10、20、30等，在二类电商广告的业务场景中，聚类中心数可以选择10-50，即能够保证聚类效果又在一定程度上减少耗时。

示例性的实施方式中，在对场景行为数据进行编码得到特征向量的数据处理阶段，以及模型训练阶段可以采用不同的计算引擎提供计算支持。例如，对于非Embedding特征可以采用spark计算引擎进行计算处理，对于通过Embedding方式提取的Embedding类型的特征可以采取TensorFlow计算引擎进行计算，并将结果存储在HDFS中，以便于确定场景行为数据的特征向量。在训练时可以从HDFS中读取计算结果，然后基于TensorFlow进行模型构建，得到用户意愿识别模型。

训练完成后可以对得到的用户意愿识别模型进行评估，如果评估指标符合要求，则可以将模型推到线上，进行A/B Test，进一步确定A/B Test的测试指标，如果测试指标正常，则可以接入全部流量进行正式使用。如果评估指标不符合要求，则可以重新对模型进行训练，知道模型效果符合要求。其中，A/B Test指的是一种用来测试新产品或新功能的在线测试方法。可以将线上流量分为两组，一组为实验组采用新产品或新功能，另一组为对照组采用已有的产品或功能，从而确定新产品或新功能是否带来更好的效果。举例而言，在二类电商广告的业务场景中，采用本实施例中的用户意愿识别模型对用户端进行识别，以及采用原有的方式对用户端的意愿进行识别，其测试出的识别效果可以如图6所示。示例性的，采用AUC值作为模型的评价指标，AUC值越大表示模型的识别效果越好。图6中线下AUC可以表示通过离线方式利用测试数据对用户意愿识别模型进行测试时的模型识别效果。线上AUC则为对在线的待识别用户端进行识别的用户意愿识别模型的识别效果。可见，基于RALM算法的用户意愿识别模型具有更高的识别效果。

以二类电商广告的业务场景为例，训练得到用户意愿识别模型之后，可以通过用户意愿识别模型来识别线上的待识别用户端点击二类电商广告的概率。具体的，可以先收集一定时间周期内待识别用户的用户行为数据，将收集的用户行为数据输入用户意愿识别模型，得到预测结果，根据该预测结果可以确定该待识别用户是否会点击二类电商广告。该预测结果可以表示用户点击二类电商广告的概率。根据该预测结果可以将二类电商广告推进给对应的用户端。当该概率较大超过一定阈值可以向该待识别用户端投放二类电商广告，例如，当预测结果超过0.6时推荐二类电商广告等。根据推荐之后的推荐效果还可以对模型再次进行评价，从而在推荐效果较低时对模型再次进行训练改进，提高模型应用的效果。举例而言，将二类电商广告推荐给预测结果较高的待识别用户之后，可以接收用户的反馈行为，例如点击二类电商广告的点击行为，或者购买二类电商广告对应商品的购买行为等。图7示意性示出了用户意愿识别模型应用于二类电商广告的推荐效果示意图。参考图7，通过人工制定规则、非深度学习方案以及本实施例中用户意愿识别模型分别对用户端的意愿进行识别，并根据识别结果对二类电商广告进行推荐，可以看出本实施例中的用户意愿识别模型能够取得较高的广告点击率以及购买率。

在本公开的示例实施例中，目标业务场景可以根据实际需求进行改变，当目标业务场景变化时，将目标业务场景更新为变化后场景，并进一步更新该变化后场景对应的场景行为数据；利用更新后的场景行为数据以及用户画像信息重新构建符合变化后场景的用户意愿识别模型，从而识别待识别用户端对变化后场景的意愿。例如，变化后场景可以为游戏应用广告，通过采集游戏应用广告对应的场景行为数据来更新模型，例如游戏应用广告对应的场景行为数据可以包括游戏的信息，如游戏名称、游戏分类类型，还可以包括用户端对该游戏应用广告的行为信息，例如点击行为、下载行为等。根据更新后的用户意愿识别模型来识别待识别用户端点击该游戏应用广告的概率，进而将游戏应用广告向概率较高的用户端进行推荐。

图8示意性示出了本公开一实施例中的用户意愿识别方法的流程图。如图8所示，该方法可以包括步骤S801至步骤S811。其中：

在步骤S801中，提取用户行为数据；在步骤S802中，确定用户画像信息；在步骤S803中，积累用户端一个月内的二类电商广告对应的场景行为数据，计算特征向量；在步骤S804中，将用户画像信息与特征向量进行拼接；在步骤S805中，通过拼接后的特征训练得到用户意愿识别模型；在步骤S806中，对用户意愿识别模型进行线下评估；线下评估可以指利用预先收集的测试数据对模型进行测试；在步骤S807中，判断评估结果是否达到预期，如果是则执行步骤S808，如果否则返回步骤S805继续训练模型；可以预先设置阈值，如果评估结果超出该阈值则可以确定达到预期，如果评估结果未超出该阈值则没有达到预期，例如设置一AUC值，如果模型线下测试评估的值不大于该AUC值，则确定没有达到预期，如果测试的值大于该AUC值则可以确定达到预期；在步骤S808中，对用户意愿识别模型进行线上评估；线上评估可以指利用模型对在线用户端进行识别，对比识别结果与原始线上用户端的识别结果的差异，例如A/B Test测试方式等；在步骤S809中，判断线上效果是否达到预期，如果是执行步骤S810，如果否则返回步骤S805，继续进行训练；线上效果可以采用点击率、购买率等指标来判断，例如点击率超出特定值时则确定达到预期，若点击率未超出该特定值则未达到预期；在步骤S810中，在线上服务中调用用户意愿识别模型，对用户推荐二类电商广告；在步骤S811中，获取推荐后用户端的反馈行为；利用反馈行为可以进一步确定用户意愿识别模型在线上服务中的效果，便于后续对模型进行调整。可见，本实施例可以将用户端的用户行为数据与二类电商广告的业务场景相结合，从而使得基于深度学习的用户意愿识别模型能够适应于二类电商广告场景，提高对用户端二类电商广告的识别精度，进而对二类电商广告进行精准推荐。

本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由处理器(包含CPU和GPU)执行的计算机程序。在该计算机程序被处理器执行时，执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中，该存储介质可以是只读存储器，磁盘或光盘等。

此外，需要注意的是，上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

以下对本技术方案提供的用户意愿识别装置进行介绍：

本示例实施方式中提供的一种用户意愿识别装置，可以用于执行本公开上述的用户意愿识别方法。参考图9所示，该用户意愿识别装置90包括：用户画像模块91、特征表示模块92以及模型应用模块93。

其中，上述用户画像模块91，用于通过用户端的用户行为数据构建用户画像信息。

上述特征表示模块92，用于采集目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应特征编码方式进行编码，以确定所述场景行为数据对应的特征向量。

上述模型应用模块93，用于利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

在本公开的一种示例性实施例中，基于前述实施例，上述用户画像模块91可以被配置为：统计所述用户端在不同时间窗口的用户行为数据，以获取所述用户端的线上时间特征以及基础属性特征，作为所述用户画像信息。

在本公开的一种示例性实施例中，基于前述实施例，上述特征表示模块92可以包括第一编码模块、第二编码模块以及特征拼接模块。

在本公开的一种示例性实施例中，基于前述实施例，该装置90还可以包括缺失值编码模块，可配置为按照所述场景行为数据中包含的各个变量的取值，对所述场景行为数据进行缺失值编码，以确定所述特征向量。

在本公开的一种示例性实施例中，基于前述实施例，该模型应用模块93可以包括训练样本获取模块、意愿标签确定模块以及模型训练模块。

在本公开的一种示例性实施例中，基于前述实施例，所述目标业务场景包括二类电商广告，该模型应用模块93可配置为：将待识别用户端的用户行为数据输入所述用户意愿识别模型，以通过所述用户意愿识别模型预测所述待识别用户端点击二类电商广告的概率。

在本公开的一种示例性实施例中，基于前述实施例，该装置90还包括业务场景更新模块以及模型更新模块。

上述用户意愿识别装置中各模块或单元的具体细节已经在对应的用户意愿识别方法中进行了详细的描述，因此此处不再赘述。

图10示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

需要说明的是，图10示出的电子设备的计算机系统1000仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图10所示，计算机系统1000包括处理器1001，其中处理器1001可以包含：图形处理单元(Graphics Processing Unit，GPU)、中央处理单元(Central Processing Unit，CPU)，其可以根据存储在只读存储器(Read-Only Memory，ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(Random Access Memory，RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中，还存储有系统操作所需的各种程序和数据。处理器(GPU/CPU)1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(Input/Output，I/O)接口1005也连接至总线1004。

以下部件连接至I/O接口1005：包括键盘、鼠标等的输入部分1006；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分1007；包括硬盘等的存储部分1008；以及包括诸如LAN(Local AreaNetwork，局域网)卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1010上，以便于从其上读出的计算机程序根据需要被安装入存储部分1008。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1009从网络上被下载和安装，和/或从可拆卸介质1011被安装。在该计算机程序被处理器(GPU/CPU)1001执行时，执行本申请的系统中限定的各种功能。在一些实施例中，计算机系统1000还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

需要说明的是，本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现上述实施例中所述的方法。

例如，所述的电子设备可以实现如图2中所示的：步骤S21，通过用户端的用户行为数据构建用户画像信息；步骤S22，采集所述用户端在目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应的特征编码方式进行编码，以确定所述场景行为数据对应的特征向量；以及步骤S23，利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

再例如，所述的电子设备可以实现如图3至图5中所示的各个步骤。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种用户意愿识别方法，其特征在于，包括：

通过用户端的用户行为数据构建用户画像信息；

采集所述用户端在目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应的特征编码方式进行编码，以确定所述场景行为数据对应的特征向量；

利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

2.根据权利要求1所述的用户意愿识别方法，其特征在于，通过用户端的用户行为数据构建用户画像信息包括：

统计所述用户端在不同时间窗口的用户行为数据，以获取所述用户端的线上时间特征以及基础属性特征，作为所述用户画像信息。

3.根据权利要求1所述的用户意愿识别方法，其特征在于，所述变量包括网络连接变量以及类目变量，按照变量对应的特征编码方式进行编码，以确定所述场景行为数据对应的特征向量包括：

对所述场景行为数据中包含的网络连接变量进行计数，以获取所述网络连接变量对应的第一向量；

对所述场景行为数据中包含的类目变量按照独热编码方式进行编码，以获取所述类目变量对应的第二向量；

将所述第一向量与所述第二向量进行拼接，以获取所述场景行为数据对应的特征向量。

4.根据权利要求3所述的用户意愿识别方法，其特征在于，对所述场景行为数据中包含的类目变量按照独热编码方式进行编码，以获取所述类目变量对应的第二向量包括：

将存在两种取值的类目变量按照独热编码方式进行编码，获取对应的所述第二向量；

将存在三种以上取值的类目变量进行特征归纳处理，对处理后取值进行独热编码，以获取对应的第二向量。

5.根据权利要求1所述的用户意愿识别方法，其特征在于，所述方法还包括：

按照所述场景行为数据中包含的各个变量的取值，对所述场景行为数据进行缺失值编码，以确定所述特征向量。

6.根据权利要求1所述的用户意愿识别方法，其特征在于，采用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型包括：

对所述用户画像信息以及所述特征向量进行拼接，以获得训练样本；

根据所述场景行为数据确定所述训练样本对应的意愿标签；

利用所述训练样本以及对应的意愿标签对深度学习模型进行训练，以获得训练后的用户意愿识别模型。

7.根据权利要求1所述的用户意愿识别方法，其特征在于，所述目标业务场景包括二类电商广告，所述通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿包括：

将待识别用户端的用户行为数据输入所述用户意愿识别模型，以通过所述用户意愿识别模型预测所述待识别用户端点击二类电商广告的概率。

8.根据权利要求1所述的用户意愿识别方法，其特征在于，所述方法还包括：

在所述目标业务场景变化时，更新变化后场景对应的所述场景行为数据；

利用所述用户画像信息以及更新后的场景行为数据重新构建意愿识别模型，以识别所述待识别用户端对所述变化后场景的意图。

9.一种用户意愿识别装置，其特征在于，包括：

用户画像模块，用于通过用户端的用户行为数据构建用户画像信息；

特征表示模块，用于采集目标业务场景对应的场景行为数据，对所述场景行为数据中包含的变量，按照变量对应特征编码方式进行编码，以确定所述场景行为数据对应的特征向量；

模型应用模块，用于利用深度学习算法对所述用户画像信息以及所述特征向量进行训练，获取训练后的用户意愿识别模型，以通过所述用户意愿识别模型预测待识别用户端对所述目标业务场景的意愿。

10.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述的用户意愿识别方法。