CN111552827A

CN111552827A - 标注方法和装置、行为意愿预测模型训练方法和装置

Info

Publication number: CN111552827A
Application number: CN202010350143.0A
Authority: CN
Inventors: 李鸣; 杨柳; 王超
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2020-08-18
Anticipated expiration: 2040-04-28
Also published as: CN111552827B

Abstract

本申请涉及人工智能领域的一种标注方法和装置、行为意愿预测模型训练方法和装置。该标注方法包括：获取待标注用户的多维度用户数据；获取为各维度用户数据预设的用于表示行为意愿的预设关键字；在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定待标注用户在该维度体现的行为意愿；根据所述待标注用户在各维度体现的行为意愿，为所述待标注用户标注行为意愿。该方法提高了数据标注效率。

Description

标注方法和装置、行为意愿预测模型训练方法和装置

技术领域

本申请涉及人工智能技术领域，特别是涉及一种标注方法和装置，行为意愿预测模型训练方法和装置。

背景技术

机器学习就是让机器具备人一样学习的能力，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

机器学习通常需要很多标注数据来供机器进行学习，通过对标注数据不断的学习和优化从而使其建立一个泛化的模型，当新的数据通过这个模型时机器便会对其进行分类或者预测。因此，数据标注在人工智能技术起着非常关键的作用，准确以及高效率的数据标注能够提高机器学习的准确性和效率。

传统的数据标注方法为依靠人工对样本进行标注，例如，图像识别的标注数据需要人工标注图片中的每个实体。因此，利用人工标注数据的方法需要花费大量时间，导致标注效率低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高效率的标注方法、装置、计算机设备和存储介质，以及行为意愿预测模型训练方法、装置、计算机设备和存储介质。

一种标注方法，所述方法包括：

获取待标注用户的多维度用户数据；

获取为各维度用户数据预设的用于表示行为意愿的预设关键字；

在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定待标注用户在各维度体现的行为意愿；

根据所述待标注用户在各维度体现的行为意愿，为所述待标注用户标注行为意愿。

一种行为意愿预测模型训练方法，所述方法包括：

采用上述的标注方法，对训练样本的行为意愿进行标注，得到所述训练样本的标注行为意愿；

对所述训练样本进行预处理；

对预处理后的所述训练样本进行特征编码，得到特征矩阵；

将所述特征矩阵输入神经网络模型进行训练，输出所述训练样本的预测行为意愿；

根据所述预测行为意愿和所述标注行为意愿进行反向传播，调整所述神经网络模型；

利用所述训练样本对调整后的所述神经网络模型迭代训练，直到达到迭代停止条件，得到行为意愿预测模型。

一种标注装置，所述装置包括：

数据获取模块，用于获取待标注用户的多维度用户数据；

关键字获取模块，用于获取为各维度用户数据预设的用于表示行为意愿的预设关键字；

查找模块，用于在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定待标注用户在该维度体现的行为意愿；

标注模块，用于根据所述待标注用户在各维度体现的行为意愿，为所述待标注用户标注行为意愿。

一种行为意愿预测模型训练装置，所述装置包括：

标注模块，采用上述的标注方法，对训练样本的行为意愿进行标注，得到所述训练样本的标注行为意愿；

预处理模块，用于对所述训练样本进行预处理；

编码模块，用于对预处理后的所述训练样本进行特征编码，得到特征矩阵；

预测模块，用于将所述特征矩阵输入神经网络模型进行训练，输出所述训练样本的预测行为意愿；

反向传播模块，用于根据所述预测行为意愿和所述标注行为意愿进行反向传播，调整所述神经网络模型；

训练模块，用于利用所述训练样本对调整后的所述神经网络模型迭代训练，直到达到迭代停止条件，得到行为意愿预测模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，，所述处理器执行所述计算机程序时实现上述各实施所述方法的步骤。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述各实施所述的方法的步骤。

上述的标注方法、装置、计算机设备和存储介质，对各维度用户数据预先设置表示行为意愿的关键字，通过在各维度用户数据中查找对应的关键字，确定用户在各维度体现的行为意愿，根据用户在各维度体现的行为意愿，为用户标注行为意愿。该方法只需要人工预先设置好各维度用户数据中表示行为意愿的关键字，即可根据关键字在用户数据中查找，根据查找结果确定用户在该维度体现的行为意愿，以此标注用户的行为意愿，从而无需人工标注，提高了数据标注效率。

附图说明

图1为一个实施例中标注方法和行为意愿预测模型训练方法的应用环境图；

图2为一个实施例中标注方法的流程示意图；

图3为一个实施例中预设关键字列表的示意图；

图4为一个实施例中标注函数投票的说明示意图；

图5为一个实施例中行为意愿预测模型训练方法的流程示意图；

图6为一个实施例中行为意愿预测模型训练过程示意图；

图7为一个实施例中应用场景说明示意图；

图8为一个实施例中标注装置的结构框图；

图9为一个实施例中行为意愿预测模型训练装置的结构框图；

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

其中，机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案涉及人工智能的标注和神经网络模型训练等技术，具体通过如下实施例进行说明:

本申请提供的一种标注方法和行为意愿预测模型训练方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与云计算服务器104通过网络进行通信。云计算(cloud computing)是一种计算模式，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。作为云计算的基础能力提供商，会建立云计算资源池(简称云平台，一般称为IaaS(Infrastructure as a Service，基础设施即服务)平台，在资源池中部署多种类型的虚拟资源，供外部客户选择使用。云计算资源池中主要包括：计算设备(为虚拟化机器，包含操作系统)、存储设备、网络设备。按照逻辑功能划分,在IaaS(Infrastructure as aService，基础设施即服务)层上可以部署PaaS(Platform as a Service,平台即服务)层，PaaS层之上再部署SaaS(Software as a Service,软件即服务)层，也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台，如数据库、web容器等。SaaS为各式各样的业务软件，如web门户网站、短信群发器等。一般来说，SaaS和PaaS相对于IaaS是上层。

服务运营方期望通过云计算服务器对用户的行为意愿进行分析，通过终端102上传待标注用户的多维度用户数据至云计算服务器104，希望利用云计算服务器104预测用户的行为意愿。云计算服务器104利用神经网络模型进行预测，而神经网络模型需要利用大量标注数据进行学习训练。标注数据是指对人工智能学习数据进行加工添加分类标注。如根据多维度用户数据，将某个用户A标注为有意愿购车用户，将某个用户B标注为无意愿购车用户。然后利用标注数据训练用于行为意愿预测的神经网络模型。因此，标注是神经网络模型训练和预测一个非常关键的步骤。

服务器获取待标注用户的多维度用户数据；获取为各维度用户数据预设的用于表示行为意愿的预设关键字；在各维度用户数据中查找对应的预设关键字，根据查找结果确定待标注用户在各维度体现的行为意愿；根据待标注用户在各维度体现的行为意愿，为待标注用户标注行为意愿。进而基于已标注的多维度用户数据进行行为意愿预测模型训练，得到行为意愿预测模型。利用训练好的行为意愿预测模型基于对多维度用户数据进行用户行为意愿进行预测。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种标注方法，以该方法应用于图2中的服务器为例进行说明，包括以下步骤：

步骤202，获取待标注用户的多维度用户数据。

待标注用户是本次标注的对象，基于该用户的多维度用户数据进行标注。维度是指用户数据的类别，为便于处理，将用户数据的每一数据源作为一个维度，即一个数据源的用户数据为一个维度的用户数据。其中，数据源是指用户数据的数据来源。

用户数据是指用户在应用程序的行为所产生的记录。通常，用户在应用程序的行为记录隐含着用户的兴趣与需求，通过对用户在应用程序的行为记录进行分析，可以预测用户的兴趣与需求。其中，行为记录是指用户在应用程序的操作行为所产生的记录数据，操作行为包括在应用程序的查询、浏览、观看、点击和购买等行为。用户行为能够一定程度反应用户的兴趣和需求，通过对用户数据进行分析，可以确定用户的兴趣和需求。例如，用户在应用程序搜索“新车报价”，用户在应用程序搜索4S店地址，都隐含着用户有购车需求。又例如，用户在视频应用程序观看赛车视频，隐含着用户对汽车感兴趣。

数据源可以是单个应用程序的全部应用数据，如服务运营方上传了用户在多个应用程序的行为记录，则一个应用程序的行为记录可以作为一个数据源。数据源也可以是一个应用程序中某个方面的应用数据，如视频观看应用数据、阅读应用数据和查询应用数据分别为一个数据源。如汽车运营方上传了用户在某个应用程序的行为记录，则根据应用程序中数据记录路径，提取各方面应用数据分别作为数据源。如将视频观看应用数据作为一个数据源，将阅读应用数据作为一个数据源，将查询应用数据作为一个数据源。根据数据源得到待标注用户的多维度用户数据。

步骤204，获取为各维度用户数据预设的用于表示行为意愿的预设关键字。

行为意愿是指实施某个行为的倾向和/或倾向程度。行为意愿的类别与服务运营方所提供的服务相关，代表着服务运营方期望的预测方向。如，服务运营方为汽车服务运营方，则行为意愿可以为购车意愿，汽车服务运营方期望对用户的购车意愿进行预测。又如，服务运营方为保险服务运营方，则行为意愿可以为购险意愿，保险服务运营方期望对用户的购买保险意愿进行预测。

其中，为全面评估用户的行为意愿，对于每一维度的用户数据，根据应用实际业务内容和行为意愿的类别，预先设置用于表示行为意愿的预设关键字表。应用实际业务内容即用户数据来源应用的服务内容，不同的业务场景所产生的用户行为数据不同，如视频类应用，所产生的用户行为数据包括视频观看记录，地图类应用，所产生的用户行为数据包括定位记录。而用户数据是用户在应用程序的操作记录，隐含着用户的需求和兴趣。根据用户行为与用户需求的关系，将用户数据中体现用户需求的关键字作为预设关键字。同时，结合每个数据源应用的服务内容，个性化的设置各维度用户数据的预设关键字。以行为意愿为购车意愿为例，对于数据源为定位的用户数据，可设置预设关键字为“4S店”，对于数据源为搜索记录的用户数据，可设置预设关键字为“新车报价”。

数据维度与预设关键字对应，有多少个数据维度，就具有多少个预设关键字表，预设关键字表中包括了多个表示行为意愿的关键字。如视频内应用的实际业务内容为视频服务，多维度数据包括查找记录和视频观看记录。相应的预设关键字可包括“开车教学视频”、“汽车新闻”等。

预设关键字表中设置有体现行为意愿的多个关键字，如关键字“新车报价”，“车贷”等。若对该维度用户数据进行分析，确定该维度用户数据中包括这些关键字，则可认为该用户在该维度具有行为意愿。

更进一步地，预设关键字表设置有体现行为意愿等级的多个关键字，不同的关键字表示不同的行为意愿等级。即预设关键字表中包括预设关键字，以及各预设关键字对应的行为意愿等级。若多维度用户数据中包括这些关键字，可认为该用户具有行为意愿，进而根据关键字所表示的行为意愿等级，确定该用户的行为意愿意等级，即实施该行为意愿的倾向等级。例如，关键字“新车报价”表示的行为意愿等级最高，关键字“汽车保养”表示的行为意愿等级为中等。

步骤206，在各维度用户数据中查找对应的预设关键字，根据查找结果确定待标注用户在各维度的行为意愿。

具体地，以预设关键字作为查找目标，分别在相应维度的用户数据中查找是否存在对应的预设关键字。具体地，根据该维度的用户数据所对应的预设关键字列表，检测预设关键字列表中的字符串是否出来在该维度的用户数据中，即该维度的用户数据中是否有预设关键字列表的字符串。

对应地，查找结果包括查找到预设关键字和未查找到预设关键字。若查找到预设关键字，则表示该维度用户数据中，具有表示行为意愿的预设关键字。而用户数据是用户行为的结果，说明用户实施过具有行为意愿的行为。因而可以确定用户在该维度具有行为意愿。若未查找到预设关键字，则表示该维度用户数据中，不具有表示行为意愿的预设关键字。例如，一个用汽车丝毫没有兴趣，但对动漫感兴趣的用户，其多维度用户数据包括大量动漫浏览记录，购买记录包括大量手办购买记录，在该用户的各维度用户数据中，查找不到与汽车相关的预设关键字，因而可以确定用户在该维度不具有购车意愿。

步骤208，根据待标注用户在各维度体现的行为意愿，为待标注用户标注行为意愿。

具体地，待标注用户的行为意愿是用户在全部数据维度的行为意愿的体现，可以根据具有行为意愿在全部数据维度中的占比情况，为待标注用户标注行为意愿。如，该用户在超过50％的数据维度中具有购车意愿，则可将待标注用户标注为具有购车意愿。如，该用户在超过50％的数据维度中不具有购车意愿，则可将待标注用户标注为不具有购车意愿。在其它实施例中，还可增加重要数据维度的权重，如购买记录的权重大于查找记录的权重，而查找记录的权重大于文字浏览的权重，设置具有行为意愿的数值为1，不具有行为意愿的数值为0，根据各数据维度的权重和数值加权求和得到行为意愿值，将行为意愿值与阈值进行比较，若行为意愿值超过了阈值，则将待标注用户标注为具有行为意愿，若行为意愿值小于阈值，则将待标注用户标注为不具有行为意愿。

上述的标注方法，对各维度用户数据预先设置表示行为意愿的关键字，通过在各维度用户数据中查找对应的关键字，确定用户在各维度体现的行为意愿，根据用户在各维度体现的行为意愿，为用户标注行为意愿。该方法只需要人工预先设置好各维度用户数据中表示行为意愿的关键字，即可根据关键字在用户数据中查找，根据查找结果确定用户在该维度体现的行为意愿，以此标注用户的行为意愿，从而无需人工标注，提高了数据标注效率。

在另一个实施例中，行为意愿包括行为意愿等级。在各维度用户数据中查找对应的预设关键字，根据查找结果确定待标注用户在各维度体现的行为意愿，包括：在各维度用户数据中查找对应的预设关键字；若查找到对应的预设关键字，则获取预设关键字的预设意愿等级；根据查找结果和预设意愿等级确定待标注用户在该维度体现的行为意愿等级。

其中，每一维度用户数据根据业务内容以及行为意愿的类别，预先设置有关键字列表。预设关键字体现行为意愿类别且与业务内容相关。以行为意愿类别为购车意愿，业务内容为视频流，则预设关键字为视频内容体现购车意愿的字眼，如“如何检查新车”、“提车注意事项”等。

行为意愿等级为实施某个行为的倾向程度，行为意愿等级与实施行为的倾向程度成正比。行为意愿等级越高，表示用户具有较强实施行为的倾向，用户实施该行为的可能性越大。行为意愿等级越低，表示用户具有较低实施行为的倾向，用户实施该行为的可能性越小。

其中，关键字列表由开发人员预先根据用户数据来源的实际业务确定，将体现该业务场景中的行为意愿的用户行为数据添加为预设关键字。同时，根据用户行为与行为意愿的关系，设置对应预设关键字的行为意愿等级，例如，将体现行为意愿较高的用户行为的预设关键字设置较高的行为意愿等级，将体现行为意愿较低的预设关键字设置较低的行为意愿等级。例如，相比较而言，主动搜索“新车报价”的用户比搜索“驾校”的用户具有更高的行为意愿，因此，可将预设关键字“新车报价”的行为意愿等级设置为高等，将预设关键字“驾校”的行为意愿等级设置为中等。

一个实施例中，设置有四种用户行为意愿等级，分别为高、中、低和无，这四种行为意愿依次由高到低。其中，无表示不具有行为意愿，具体为在该维度用户数据中查找不到对应的预设关键字。

一个实施例中，某一维度用户数据预设的关键字及各关键字等级如图3所示。具体地，在各维度用户数据中查找对应的预设关键字，根据查找结果，若查找不到对应的预设关键字，确定待标注用户在该维度无行为意愿，若查找到对应的预设关键字，则获取预设关键字对应的意愿等级。若该预设关键字为高等行为意愿等级，则确定待标注用户在该维度具有高等行为意愿，若该预设关键字为中等行为意愿等级，则确定待标注用户在该维度具有中等行为意愿，该预设关键字为低等行为意愿等级，则确定待标注用户在该维度具有低等行为意愿。

在实际的应用中，预设关键字有多个，可能在同一维度用户行为数据中查找到多个预设关键字，且多个预设关键字表示不同的意愿等级。此时，可将最高行为意愿等级确定为用户在该维度的行为意愿等级。即若在同一维度用户数据中查找到多个对应的预设关键字且多个预设关键字具有不同预设意愿等级，则将最高的预设意愿等级确定为待标注用户在该维度体现的行为意愿等级。

本实施例中，待标注用户的行为意愿标注结果不仅仅包括用户是否具有行为意愿，还包括用户实施行为意愿的倾向等级，以便能够根据行为意愿等级针对性进行推广。如，只选择行为意愿等级高的用户进行推广，由于其行为意愿高，通常能够得到较好的推广效果。

在另一个实施例中，根据待标注用户在各维度体现的行为意愿，为待标注用户标注行为意愿，包括：若具有行为意愿的维度占比大于预设值，则将用户标注为具有行为意愿。

具体地，预设值可根据推广精度需要确定。通常情况将预设值设置有50％。即待标注用户在超过一半的维度具有行为意愿，则将该用户标注具有行为意愿。若推广要求高精度，则可调高预设值，例如，待标注用户在超过75％的维度具有行为意愿，则将该用户标注具有行为意愿。

若不同行为意愿结果在全部维度的占比相同，则放弃对该用户进行标注。具体地，一个查找预设关键字的函数可以作为一个标注函数。标注函数的标注结果包括：正类、负类和弃权。当查找到预设关键字时，标注函数的标注结果为正类，当未查找到标注结果时，标注结果为负类。当标注函数无法确定标注结果时，弃权。如图4所示，每个圆圈代表一个标注函数，标注函数基于某一维度的用户数据进行标注。其投票结果如右图所示，对于一个维度用户数据确定的行为意愿，三个标注函数标注为负类，三个标注函数标注为正负，两个标注函数弃权。即正类的结果为3/8,负类的结果为3/8,弃权的结果为2/8，存在两个相同的最大占比的标注结果，则弃权不对该用户标注。

在另一个实施例中，行为意愿包括行为意愿等级。根据待标注用户在各维度体现的行为意愿，为待标注用户标注行为意愿，包括：将在所有维度中最大占比的行为意愿等级，标注为待标注用户的行为意愿等级。

具体地，在一个维度用户数据中，若查找到多个关键字，且多个关键字具有不同的行为意愿等级，则将在所有维度中最大占比的行为意愿等级，确定为待标记用户的行为意愿等级。例如，具有十个用户数据维度，其中有两个用户数据维度为低行为意愿等级，一个用户数据维度为无行为意愿等级，一个用户数据维度为中行为意愿等级，六个用户数据维度为高行为意愿等级，高行为意愿等级在所有维度的占比最高，为6/10，则将待标注用户标注为高行为意愿等级。

若各行为意愿等级全部维度的占比相同，则放弃对该用户进行标注。

在另一个实施例中，在各维度用户数据中查找对应的预设关键字，根据查找结果确定待标注用户在该维度体现的行为意愿，包括：获取各维度的权重以及行为意愿的数值；根据权重和数值加权求和得到行为意愿值；若行为意愿值大于预设值，则将待标注用户标注为具有行为意愿。

具体地，可增加重要数据维度的权重，如购买记录的权重大于查找记录的权重，而查找记录的权重大于文字浏览的权重，设置具有行为意愿的数值为1，不具有行为意愿的数值为0，根据各数据维度的权重和数值加权求和得到行为意愿值，将行为意愿值与阈值进行比较，若行为意愿值超过了阈值，则将待标注用户标注为具有行为意愿，若行为意愿值小于阈值，则将待标注用户标注为不具有行为意愿。

在另一个实施例中，一个查找预设关键字的函数可以作为一个标注函数，全部的标注函数组成标注模型，用于对样本进行标注。每个标注函数都会投票：正类、负类或弃权。基于这些投票以及标注函数的权重，标注模型能够地为百万级的数据点自动进行概率型标注。最终的目标是训练一个可以超过标注函数性能的分类器。

具体地，用可对标注结果统计覆盖率和冲突率，评估标注模型，即标注函数的设置的合理性，根据覆盖率和冲突率不断调整标注函数，使其覆盖率和冲突率达到标准，得到用于标注的标注模型。其中，调整标注函数的方式可是以删除某条冲突率高的标注函数。

在一个实施例中，标注方法，还包括：根据确定的行为意愿以及各维度体现的行为意愿，确定各维度的覆盖率和冲突率；当各维度的覆盖率和冲突率符合要求时，输出待标注用户标注行为意愿。

其中，覆盖率是被成功标注的样本占比，一个待标注用户为一个样本，待标注用户被标注为具有行为意愿或不具有行为意愿，则表示被成功标注。需要尽可能提高这个值，尽可能让所有的样本能够被准确标注。冲突率是一个标注函数与其他标注函数冲突情况，若一个标注函数的标注结果与最终确定的标注结果不同，则认为存在冲突。例如，将用户标注为具有行为意愿，但多维度用户数据中其中一维的标注函数的标注结果为不具有行为意愿，则该标注函数与其它标注函数冲突。

在样本标注过程中，根据覆盖率和冲突率不断调整标注函数，提高标注模型的准确率。进而，利用标注模型进行行为意愿标注。通过规则函数对不同维度的值进行弱评级，进行训练，对于不同维度结合其覆盖率及冲突率，进行最终评级打分。得出单个用户处于哪个分段最具有可信度的打分值，以此作为训练的标注结果。

在一个实施例中，服务器还实现一种行为意愿模型训练方法，如图5所示，该方法包括：

步骤502，对训练样本进行预处理。

预处理的目的是剔除干扰数据，提高模型准确率。预处理的具体处理方式包括：剔除异常值和特征降维。

剔除异常值是指剔除明显不符合逻辑的异常数据，如年龄负值。

特征降维是指降低特征的个数，如一个特征，有多个不同的属性值，特征个数多导致训练该维度张量很大，影响训练结果。比如，居住城市，直接使用原始值导致训练该维度张量很大，影响训练结果。可以精简为华南，华北等，从而降低居住城市这个特征的维度。其中，用户本人的特征存在很多种，但是涉及用户可能产生购车行为可能不多，训练前首先剔除低相关的维度(游戏时长，游戏类型等)，可以有效提高模型准确率，避免无关因子的干扰。

步骤504，对预处理后的训练样本进行特征编码，得到特征矩阵。

具体地，编码方式包括：一位有效编码和哈希法编码。

一位有效编码(One-Hot编码)，主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后，每个整数值被表示为二进制向量，除了整数的索引之外，它都是零值，它被标记为1。例如，对于学历，居住地类型等展开维度不多的特征，采用one-hot编码，将类别变量转换为深度学习算法易于利用的变量。具体实现就是在变量编码的时候，在目标类别的索引位置是1，在其他位置是0。以前单个特征训练会展开为相应维度长度的向量。以学历为例，包括博士、硕士、本科、大专，则使用One-Hot编码["博士","硕士","本科","大专"]分别为[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]]。

哈希法编码(Hash-encoding)，是指采用哈希算法进行编码。哈希算法并不是一个特定的算法而是一类算法的统称。哈希算法也叫散列算法，一般来说满足这样的关系：f(data)＝key，输入任意长度的data数据，经过哈希算法处理后输出一个定长的数据key。同时这个过程是不可逆的，无法由key逆推出data。对于星座，所在地区等展开维度多的特征，使用其hash值进行编码，将类别变量取hash值进行编码。具体实现就是在变量编码的时候，通过hash函数计算其相应hash值放置到目标索引位置。以前单个特征训练展开长度由hash函数决定。

Embedding(嵌入)，对于星座，所在地区等展开维度多的特征，通过hash函数编码容易不同特征在训练的时候编码一致，导致训练结果弱于预期。Embedding就是把正整数(索引)转换为固定大小的稠密向量。one hot之后的特征乘上embedding matrix(嵌入矩阵)(WE∈RV×D)，得到的就是embedding之后的特征。通过该方法既能降低特征维度，又可以保留原始特征信息。

针对不同特征，进行特征编码，方便后续模型训练。

步骤506，采用前面各实施例的标注方法，对训练样本的行为意愿进行标注，得到训练样本的标注行为意愿。

训练样本为大量待标注用户的多维用户数据，每个待标注用户作为一个训练样本，利用前面各实施例的标注方法，对训练样本的行为意愿进行标注，得到训练样本的标注行为意愿。

其中，除了从数据源获取的多维用户数据外，样本还包括用户特征(如年龄，性别等)，社会特征(如学历、职业和居住地等)以及设备特征(如手机价格和手机年龄等)。使用样本的用户特征、社会特征、内容特征和设备特征对用户进行全面分析。

步骤508，将特征矩阵输入神经网络模型进行训练，输出训练样本的预测行为意愿。

一个实施例的模型训练的过程如图6所示，其中神经网络模型可采用多层结构，在输入层和输出层之前构建两个隐藏层。输入为提前挑选的百万级用户近期的特征信息，输出为基于当前训练数据得到的训练模型。

步骤510，根据预测行为意愿和标注行为意愿进行反向传播，调整神经网络模型。

步骤512，利用训练样本对调整后的神经网络模型迭代训练，直到达到迭代停止条件，得到行为意愿预测模型，行为意愿预测模型用于根据多维度用户数据预测用户的行为意愿，基于行为意愿确定具有实施行为意愿的用户群，以对用户群推荐与行为相关的产品。

如图6所示，原始数据通过特征编码后的张量以及标注结果，特征编码和特征标注如前文，通过第一层隐藏层进行处理，得到N*128的张量，再通过第二层隐藏层得到N*32的张量，依次减少特征输入，中间通过ReLU激活函数，经过网络层层处理后，输出行为意愿预测结果，最大值所在的位置为预测结果，值为预测准确率。中间采用两层隐藏层既可以减少训练的复杂度，也可以尽可能保证特征准确度。

在模型训练阶段，使用dropout(是指在深度学习网络的训练过程中对于神经网络单元，按照一定的概率将其暂时从网络中丢弃)对高权重因子进行适当的丢弃，保证不会由于单因子权重过高导致模型的过拟合(训练集效果良好，实际验证效果差)。

其中，行为意愿预测模型用于根据多维度用户数据预测用户的行为意愿，基于行为意愿确定具有实施行为意愿的用户群，以对用户群推荐与行为相关的产品。以行为意愿为购车意愿为例，根据多维度用户数据预测用户的购车意愿，基于行为意愿确定具有购车意愿的用户群，对该用户群推荐购车相关产品。

上述的行为意愿预测模型训练方法，只需要人工预先设置好各维度用户数据中表示行为意愿的关键字，即可根据关键字在用户数据中查找，根据查找结果确定用户在该维度体现的行为意愿，以此标注用户的行为意愿，从而无需人工标注，提高了数据标注效率，进而提高了意愿预设模型的训练效率。

在一个实施例中，利用行为意愿预测模型，可对用户行为意愿进行预测。

具体地，如图7所示，以行为意愿为购车意愿为例，汽车服务运营方上传用户数据至云计算服务器，输入用户原始特征->特征转换->购车预测->预测结果输出

具体业务流程为，用户输入混淆后的特征信息，SAAS服务对请求进行鉴权后，处理特征信息为模型需要的特征编码输入到离线模型，模型反馈预测结果，SAAS服务处理预测结果通过json格式返回给调用方，告知其行为意愿等级。采用该方案进行行为意愿预测，能够更精准的进行数字化营销。返回的行为意愿预测结果包括用户标识以及该用户的行为意愿预测等级。汽车服务运营方根据意愿预测结果，进行购车意愿预测，能够更精准的进行数字化营销。

应该理解的是，虽然图2和图5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和图5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图8所示，提供了一种标注装置，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：：

数据获取模块802，用于获取待标注用户的多维度用户数据。

关键字获取模块804，用于获取为各维度用户数据预设的用于表示行为意愿的预设关键字。

查找模块806，用于在各维度用户数据中查找对应的预设关键字，根据查找结果确定待标注用户在各维度体现的行为意愿。

标注模块808，用于根据待标注用户在各维度体现的行为意愿，为待标注用户标注行为意愿。

上述的标注装置，对各维度用户数据预先设置表示行为意愿的关键字，通过在各维度用户数据中查找对应的关键字，确定用户在各维度体现的行为意愿，根据用户在各维度体现的行为意愿，为用户标注行为意愿。该方法只需要人工预先设置好各维度用户数据中表示行为意愿的关键字，即可根据关键字在用户数据中查找，根据查找结果确定用户在该维度体现的行为意愿，以此标注用户的行为意愿，从而无需人工标注，提高了数据标注效率

在一个实施例中，查找模块包括：

关键字查找模块，用于在各维度用户数据中查找对应的预设关键字；

等级查找模块，用于若查找到对应的预设关键字，则获取预设关键字的预设意愿等级；

等级标注模块，用于根据查找结果和预设意愿等级确定待标注用户在该维度体现的行为意愿等级。

在另一个实施例中，等级标注模块，用于若在同一维度用户数据中查找到多个对应的预设关键字且多个预设关键字具有不同预设意愿等级，则将最高的预设意愿等级确定为待标注用户在该维度体现的行为意愿等级。

在另一个实施例中，标注模块，用于若具有行为意愿的维度占比大于预设值，则将用户标注为具有行为意愿。

在另一个实施例中，标注模块，用于将在所有维度中最大占比的行为意愿等级，标注为待标注用户的行为意愿等级。

在另一个实施例中，参数计算模块，用于根据确定的行为意愿以及各维度体现的行为意愿，确定各维度的覆盖率和冲突率。

输出模块，用于当各维度的覆盖率和冲突率符合要求时，输出待标注用户标注行为意愿。

上述的标注装置，对各维度用户数据预先设置表示行为意愿的关键字，通过在各维度用户数据中查找对应的关键字，确定用户在该维度的行为意愿，根据用户在各维度的行为意愿，为用户标注行为意愿。该方法只需要人工预先设置好各维度用户数据中表示行为意愿的关键字，无需人工标注，提高了数据标注效率。

在一个实施例中，提供一种行为意愿预测模型训练装置，如图9所示，该装置包括：

预处理模块902，用于对训练样本进行预处理。

编码模块904，用于对预处理后的训练样本进行特征编码，得到特征矩阵。标注模块906，采用上述的标注方法，对训练样本的行为意愿进行标注，得到训练样本的标注行为意愿。

预测模块908，用于将特征矩阵输入神经网络模型进行训练，输出训练样本的预测行为意愿。

反向传播模块910，用于根据预测行为意愿和标注行为意愿进行反向传播，调整神经网络模型。

训练模块912，用于利用训练样本对调整后的神经网络模型迭代训练，直到达到迭代停止条件，得到行为意愿预测模型，行为意愿预测模型用于根据多维度用户数据预测用户的行为意愿，基于行为意愿确定具有实施行为意愿的用户群，以对用户群推荐与行为相关的产品。

上述的行为意愿预测模型训练装置，只需要人工预先设置好各维度用户数据中表示行为意愿的关键字，即可根据关键字在用户数据中查找，根据查找结果确定用户在该维度体现的行为意愿，以此标注用户的行为意愿，从而无需人工标注，提高了数据标注效率，进而提高了意愿预设模型的训练效率。

关于标注装置的具体限定可以参见上文中对于标注方法的限定，在此不再赘述。上述标注装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

关于行为意愿预测模型训练装置的具体限定可以参见上文中对于行为意愿预测模型训练方法的限定，在此不再赘述。上述行为意愿预测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储多数据用户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种标注方法和行为意愿预测模型训练方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种标注方法，所述方法包括：

获取待标注用户的多维度用户数据；

在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定所述待标注用户在各维度体现的行为意愿；

2.根据权利要求1所述的方法，其特征在于，所述行为意愿包括行为意愿等级；在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定所述待标注用户在各维度体现的行为意愿，包括：

在各维度用户数据中查找对应的预设关键字；

若查找到对应的预设关键字，则获取所述预设关键字的预设意愿等级；

根据所述查找结果和所述预设意愿等级确定所述待标注用户在各维度体现的行为意愿等级。

3.根据权利要求2所述的方法，其特征在于，在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定待标注用户在各维度体现的行为意愿，包括：

若在同一维度用户数据中查找到多个对应的预设关键字且多个所述预设关键字具有不同预设意愿等级，则将最高的预设意愿等级确定为所述待标注用户在该维度体现的行为意愿等级。

4.根据权利要求1-3任一项所述的方法，其特征在于，根据所述待标注用户在各维度体现的行为意愿，为所述待标注用户标注行为意愿，包括：若具有行为意愿的维度占比大于预设值，则将所述用户标注为具有行为意愿。

5.根据权利要求2所述的方法，其特征在于，根据所述待标注用户在各维度体现的行为意愿，为所述待标注用户标注行为意愿，包括：将在所有维度中最大占比的行为意愿等级，标注为所述待标注用户的行为意愿等级。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据确定的行为意愿以及各维度体现的行为意愿，确定各维度的覆盖率和冲突率；

当各维度的所述覆盖率和冲突率符合要求时，输出所述待标注用户标注行为意愿。

7.一种行为意愿预测模型训练方法，所述方法包括：

对训练样本进行预处理；

对预处理后的所述训练样本进行特征编码，得到特征矩阵；

采用如权利要求1至6任一项所述的标注方法，对所述训练样本的行为意愿进行标注，得到所述训练样本的标注行为意愿；

利用所述训练样本对调整后的所述神经网络模型迭代训练，直到达到迭代停止条件，得到行为意愿预测模型，所述行为意愿预测模型用于根据多维度用户数据预测用户的行为意愿，基于所述行为意愿确定具有实施行为意愿的用户群，以对所述用户群推荐与行为相关的产品。

8.一种标注装置，其特征在于，所述装置包括：

数据获取模块，用于获取待标注用户的多维度用户数据；

查找模块，用于在各维度用户数据中查找对应的所述预设关键字，根据查找结果确定待标注用户在各维度体现的行为意愿；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。