CN116662814B - 对象意向预测方法、装置、计算机设备及存储介质 - Google Patents

对象意向预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116662814B
CN116662814B CN202310935825.1A CN202310935825A CN116662814B CN 116662814 B CN116662814 B CN 116662814B CN 202310935825 A CN202310935825 A CN 202310935825A CN 116662814 B CN116662814 B CN 116662814B
Authority
CN
China
Prior art keywords
feature
sample
features
target
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310935825.1A
Other languages
English (en)
Other versions
CN116662814A (zh
Inventor
林炳怀
王丽园
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310935825.1A priority Critical patent/CN116662814B/zh
Publication of CN116662814A publication Critical patent/CN116662814A/zh
Application granted granted Critical
Publication of CN116662814B publication Critical patent/CN116662814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了一种基于人工智能的对象意向预测方法、装置、计算机设备及存储介质,包括:获取操作对象的M个第一特征和被操作对象的N个第二特征;根据M个第一特征和N个第二特征,得到K个初始特征;通过预测模型将每一初始特征编码为第一编码特征和第二编码特征;根据第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征;根据第二编码特征,通过预测模型确定每一目标编码特征的目标特征缩放参数;根据目标特征缩放参数,通过预测模型得到每一目标编码特征的目标缩放特征;根据目标缩放特征通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作,提高了意向预测的准确性。

Description

对象意向预测方法、装置、计算机设备及存储介质
技术领域
本申请涉及互联网技术领域,具体涉及一种对象意向预测方法、装置、计算机设备及存储介质,其中,该装置为对象意向预测装置,存储介质为计算机可读存储介质。
背景技术
随着互联网技术的快速发展,通过互联网进行数据交互越来越普及,由此衍生了丰富的大数据应用场景,如大数据应用场景可以包括通过大数据线索预测用户执行某个行为的意向度,进而可以根据意向度评估数据安全性。
相关技术中,针对用户执行某个行为的意向度的预测,是通过预测模型根据用户的相关特征,以及可能的被执行对象的相关特征进行的,存在预测准确率较低的问题。
发明内容
本申请实施例提供一种对象意向预测方法、装置、计算机设备及存储介质,可以提高意向预测的准确性。
为解决上述技术问题,本申请实施例提供以下技术方案:
本申请实施例提供了一种对象意向预测方法,包括:
获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征;
根据所述M个第一特征和所述N个第二特征,得到K个初始特征;
通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征,所述第一编码特征表征所述初始特征的不同特征取值的共有部分,所述第二编码特征表征所述初始特征的不同特征取值的差异部分;
根据每一初始特征的第一编码特征和第二编码特征,通过所述预测模型得到每一初始特征的目标编码特征,所述目标编码特征用于表征所述初始特征的不同特征取值;
根据每一初始特征的第二编码特征,通过所述预测模型,确定每一目标编码特征的目标特征缩放参数;
根据每一目标特征缩放参数,通过所述预测模型,得到每一目标编码特征的目标缩放特征;
根据K个目标缩放特征,通过所述预测模型进行意向预测,得到所述操作对象针对所述被操作对象执行预设操作的操作意向。
根据本申请的一个方面,还提供了一种对象意向预测装置,包括:
第一获取单元,用于获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征;
第二获取单元,用于根据所述M个第一特征和所述N个第二特征,得到K个初始特征;
特征编码单元,用于通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征,以及根据每一初始特征的第一编码特征和第二编码特征,通过所述预测模型得到每一初始特征的目标编码特征,所述第一编码特征表征所述初始特征的不同特征取值的共有部分,所述第二编码特征表征所述初始特征的不同特征取值的差异部分,所述目标编码特征用于表征所述初始特征的不同特征取值;
特征缩放单元,用于根据每一初始特征的第二编码特征,通过所述预测模型,确定每一目标编码特征的目标特征缩放参数,以及根据每一目标特征缩放参数,通过所述预测模型,得到每一目标编码特征的目标缩放特征;
意向预测单元,用于根据K个目标缩放特征,通过所述预测模型进行意向预测,得到所述操作对象针对所述被操作对象执行预设操作的操作意向。
在一些实施例中,所述K个初始特征包括所述M个第一特征和所述N个第二特征,或所述K个初始特征包括所述M个第一特征、所述N个第二特征以及P个融合特征,所述融合特征是由一个所述第一特征和一个所述第二特征融合得到。
在一些实施例中,所述对象意向预测装置还包括:
第三获取单元,用于获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征,以及获取所述样本操作对象针对所述样本被操作对象执行预设操作的操作意向标签;
第四获取单元,用于根据所述M个样本第一特征和所述N个样本第二特征,得到K个样本初始特征;
样本特征编码单元,用于通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,以及根据每一样本初始特征的样本第一编码特征和样本第二编码特征,通过所述预测模型得到每一样本初始特征的样本目标编码特征,所述样本第一编码特征表征所述样本初始特征的不同特征取值的共有部分,所述样本第二编码特征表征所述样本初始特征的不同特征取值的差异部分,所述样本目标编码特征用于表征所述样本初始特征的不同特征取值;
样本特征缩放单元,用于根据每一样本初始特征的样本第二编码特征,通过所述预测模型,确定每一样本目标编码特征的样本目标特征缩放参数,以及根据每一样本目标特征缩放参数,通过所述预测模型,得到每一样本目标编码特征的样本目标缩放特征;
样本操作意向预测单元,用于根据K个样本目标缩放特征,通过所述预测模型进行意向预测,得到所述样本操作对象针对所述样本被操作对象执行预设操作的样本操作意向;
更新单元,用于根据所述样本操作意向和所述操作意向标签的差异,更新所述预测模型的网络参数,直至满足预设停止条件。
在一些实施例中,所述样本操作意向预测单元包括:
丢弃子单元,用于通过所述预测模型,对所述K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征;
预测子单元,用于根据所述K'个处理后样本特征,通过所述预测模型进行意向预测,得到所述样本操作对象针对所述样本被操作对象执行预设操作的样本操作意向。
在一些实施例中,所述丢弃子单元具体用于:
根据每一样本目标缩放特征对应的样本目标特征缩放参数,通过所述预测模型,确定每一样本目标缩放特征的特征丢弃概率,所述特征丢弃概率和所述样本目标特征缩放参数正相关;
根据每一样本目标缩放特征的特征丢弃概率,通过预测模型,对每一样本目标缩放特征进行特征丢弃处理,得到每一样本目标缩放特征的处理后样本特征。
在一些实施例中,所述第一获取单元具体用于:接收终端发送的意向评估请求;获取所述意向评估请求指示的操作对象的M个第一特征,以及获取所述意向评估请求指示的被操作对象的N个第二特征;
所述对象意向预测装置还包括:
返回单元,用于将所述操作意向返回给所述终端。
在一些实施例中,所述操作对象为多个,所述返回单元具体用于:
按照操作意向从高至低的顺序,对多个操作对象对应的操作意向进行排序,得到排序结果;
将所述排序结果返回给所述终端,所述排序结果用于所述终端展示。
在一些实施例中,所述操作对象为多个,所述对象意向预测装置还包括:
筛选单元,用于从多个操作对象中筛选出操作意向大于操作意向阈值的目标操作对象;
推送单元,用于向所述目标操作对象推送所述被操作对象的操作信息。
根据本申请的一个方面,还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序被处理器加载,以执行本申请实施例提供的任一种对象意向预测方法。
根据本申请的一个方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器加载,以执行本申请实施例提供的任一种对象意向预测方法。
本申请中,首先获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征,并根据M个第一特征和N个第二特征,得到K个初始特征;考虑到每个初始特征的不同特征取值对预测结果的影响,以每一初始特征为处理对象,通过预测模型将每一初始特征编码为两个编码特征,分别为表征初始特征的不同特征取值的共有部分的第一编码特征,和表征初始特征不同特征取值的差异部分的第二编码特征;然后,根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征,以及根据表征每一初始特征不同特征取值的差异部分的第二编码特征,通过预测模型确定出每一目标编码特征的目标特征缩放参数;其次,根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征,实现对每一目标编码特征的抑制或激活,从而在整体上达成特征值粒度的特征选择,最后,根据K个目标缩放特征,也即是选择后的特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。以此,通过在特征值粒度上进行特征选择,能够在特征取值不同时,动态的改变不同特征对预测结果的贡献,使其与实际的特征取值相匹配,即对于同一特征,建立了表征不同取值的共有部分的第一编码特征,并通过第二编码特征区分不同取值的差异部分,而现有技术未考虑不同取值间的联系,本申请通过第一编码特征建立了不同取值间的联系,使得意向预测更准确,从而达到提高预测模型预测准确率的目的。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的对象意向预测方法应用的场景示意图;
图2是本申请实施例提供的对象意向预测方法的流程示意图;
图3是本申请实施例提供的预测模型训练的流程示意图;
图4是本申请实施例提供的预测模型的模型结构的示意图;
图5是本申请实施例提供的预测模型的模型结构的另一示意图;
图6是本申请实施例提供的预测模型训练的结构示意图;
图7是本申请实施例提供的用户意向显示的示意图;
图8是本申请实施例提供的预测模型应用的示意图;
图9是本申请实施例提供的预测模型训练的另一流程示意图;
图10是本申请实施例提供的预测模型应用的流程示意图;
图11是本申请实施例提供的终端和服务器交互的流程示意图;
图12是本申请实施例提供的对象意向预测装置的示意图;
图13是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请以下描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
本申请以下描述中,所涉及的术语“第一\第二”等仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
本申请实施例提供一种对象意向预测方法、装置、计算机设备及存储介质。
请参阅图1,图1为本申请实施例所提供的对象意向预测方法应用的场景示意图,该对象意向预测方法可以应用于对象意向预测系统,该对象意向预测系统可以包括服务器10和终端20等,服务器10可以集成有本申请提供的对象意向预测装置,该服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。该终端20可以是手机、平板电脑、笔记本电脑、台式电脑、或者可穿戴设备等。
服务器10与终端20之间可以通过有线或无线通信方式进行直接或间接地连接,基于该连接进行数据交互,例如可以通过有线网络或无线网络进行连接,其中,有线网络可以包括局域网、城域网和广域网等,该无线网络可以包括蓝牙、WIFI及其他实现无线通信的网络,本申请在此不做限制。可以在服务器10上或独立于服务器10设置数据库30,用于为服务器10提供数据存储服务,例如,可以在服务器10上设置用于存储特征的特征库。
其中,在模型训练阶段,服务器10可以从数据库30中获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征,以及获取样本操作对象针对样本被操作对象执行预设操作的操作意向标签;然后,根据M个样本第一特征和N个样本第二特征,得到K个样本初始特征;通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,样本第一编码特征表征样本初始特征的不同特征取值的共有部分,样本第二编码特征表征样本初始特征的不同特征取值的差异部分;根据每一样本初始特征的样本第一编码特征和样本第二编码特征,通过预测模型得到每一样本初始特征的样本目标编码特征,样本目标编码特征用于表征样本初始特征的不同特征取值;其次,根据每一样本初始特征的样本第二编码特征,通过预测模型,确定每一样本目标编码特征的样本目标特征缩放参数;根据每一样本目标特征缩放参数,通过预测模型,得到每一样本目标编码特征的样本目标缩放特征;根据K个样本目标缩放特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向;最后,根据样本操作意向和操作意向标签的差异,更新预测模型的网络参数,直至满足预设停止条件,避免预测模型过拟合于某一特征值,提高了预测模型的鲁棒性。
在模型应用阶段,服务器10可以接收终端20发送的意向评估请求,从数据库30中获取意向评估请求指示的操作对象的M个第一特征和被操作对象的N个第二特征,并根据M个第一特征和N个第二特征,得到K个初始特征;考虑到每个初始特征的不同特征取值对预测结果的影响,以每一初始特征为处理对象,通过预测模型将每一初始特征编码为两个编码特征,分别为表征初始特征的不同特征取值的共有部分的第一编码特征,和表征初始特征不同特征取值的差异部分的第二编码特征;然后,根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征,以及根据表征每一初始特征不同特征取值的差异部分的第二编码特征,通过预测模型确定出每一目标编码特征的目标特征缩放参数;其次,根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征,实现对每一目标编码特征的抑制或激活,从而在整体上达成特征值粒度的特征选择,最后,根据K个目标缩放特征,也即是选择后的特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。以此,通过在特征值粒度上进行特征选择,能够在特征取值不同时,动态的改变不同特征对预测结果的贡献,使其与实际的特征取值相匹配,即对于同一特征,建立了表征不同取值的共有部分的第一编码特征,并通过第二编码特征区分不同取值的差异部分,而现有技术未考虑不同取值间的联系,本申请通过第一编码特征建立了不同取值间的联系,使得意向预测更准确,从而达到提高预测模型预测准确率的目的。若操作对象包括多个,则在得到操作意向后,服务器10可以按照操作意向从高至低的顺序对多个操作对象进行排序,得到排序结果,将排序结果返回给终端20,终端20显示该排序结果。服务器10还可以向操作意向大于预设意向阈值的操作对象推送被操作对象的操作信息等。
需要说明的是,图1所示的对象意向预测方法应用的场景示意图仅仅是一个示例,本申请实施例描述的对象意向预测方法应用以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着对象意向预测方法应用的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请实施例中,可以采用人工智能学习方式实现预测操作对象针对被操作对象执行预设操作的操作意向,如在模型训练阶段,通过对样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征进行特征编码、特征缩放等处理,并基于样本目标缩放特征对预测模型进行训练,避免预测模型过拟合于某一特征值,提高了预测模型的鲁棒性,从而在模型应用阶段,提高了通过预测模型预测操作对象针对被操作对象执行预设操作的意向的准确性。需要说明的是,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能、感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括机器学习(Machine Learning, ML)技术,其中,深度学习(Deep Learning,DL)是机器学习中一个新的研究方向,它被引入机器学习以使其更接近于最初的目标,即人工智能。目前,深度学习主要应用在机器视觉、语音处理技术、自然语言处理等领域。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及意向程度论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。
可以理解的是,在本申请的具体实施方式中,涉及到第一特征、第二特征、样本第一特征、以及样本第二特征等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
在本实施例中,将从对象意向预测装置的角度进行描述,该对象意向预测装置具体可以集成在服务器等计算机设备中。
请参阅图2,图2是本申请一实施例提供的对象意向预测方法的流程示意图。该对象意向预测方法可以包括步骤S101至S107:
S101、获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征。
本申请实施例中,对象意向预测方法的应用场景可以根据实际需求进行灵活设置,在此不做限定,例如,可以应用于购买物品、视频播放以及即时通信等应用场景。针对购买物品的应用场景,可以预测用户购买物品的意向;针对视频播放的应用场景,可以预测用户观看视频的意向;针对即时通信交友的应用场景,可以预测用户交友的意向。
其中,操作对象、第一特征、被操作对象、以及第二特征等,可以根据应用场景的不同而不同,在此不做限定。例如,针对购买物品的应用场景,操作对象可以是用户,第一特征可以包括用户的属性特征(如性别等)、经历特征(包括生活、学习和工作等)、消费特征、位置特征(如居住地)、以及兴趣特征等对象特征,被操作对象可以是物品,第二特征可以包括物品售卖的门店信息(即门店特征)、渠道信息(即渠道特征)和物品信息(即物品特征)等。
又例如,针对视频播放的应用场景,操作对象可以是用户,第一特征可以包括用户的属性特征、以及兴趣特征等,被操作对象可以是视频,第二特征可以包括视频的视频信息、视频渠道和会员信息等。
又例如,针对即时通信交友的应用场景,操作对象可以是用户,第一特征可以包括用户的属性特征、经历特征、消费特征、位置特征、以及兴趣特征等,被操作对象可以是其他用户,第二特征可以包括其他用户的属性特征、经历特征、消费特征、位置特征、以及兴趣特征等。
可以理解的是,在本申请的具体实施方式中,涉及到属性特征、经历特征、消费特征、位置特征、兴趣特征、门店信息、渠道信息、物品信息、视频信息、视频渠道、会员信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在一些实施方式中,可以从服务器上预设的特征库中获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征。该特征库中可以关联存储有多个操作对象的对象标识及其对应的多个第一特征,以及关联存储有被操作对象的对象标识及其对应的多个第二特征,此时可以接收终端发送的预测请求,该预测请求中携带操作对象的对象标识,以及被操作对象的对象标识,响应于预测请求从特征库中获取与操作对象的对象标识匹配的M个第一特征,以及与被操作对象的对象标识匹配的N个第二特征。或者是,该特征库中关联存储有操作对象的对象标识、第一特征、以及被操作对象,此时可以接收终端发送的携带操作对象的对象标识的预测请求,响应于预测请求从特征库中获取与对象标识匹配的M个第一特征和N个第二特征。
在一些实施方式中,可以接收终端发送的操作对象的M个第一特征,以及被操作对象的N个第二特征,第一特征和第二特征可以是终端接收用户基于输入指令输入。当然,操作对象的第一特征,以及被操作对象的第二特征还可以通过其他方式获取,在此不做限定。其中,M和N的具体取值可以根据实际需求进行灵活设置,在此不做限定。
需要说明的是,第一特征和第二特征可以由多个特征组成,如M个第一特征,以及N个第二特征,每个特征具有不同的意义,且有不同的取值。为了提高数据传输的安全性,第一特征和第二特征可以是加密后的特征,在此不做限定,针对加密后的特征,可以对加密后的特征进行解密,得到明文特征,对明文特征进行特征合并、特征编码、及特征选择等操作。
S102、根据M个第一特征和N个第二特征,得到K个初始特征。
其中,K的具体取值可以根据实际需求进行灵活设置,在此不做限定。
在一些实施方式中,K个初始特征包括M个第一特征和N个第二特征,或K个初始特征包括M个第一特征、N个第二特征以及P个融合特征,融合特征是由一个第一特征和一个第二特征融合得到。
例如,可以将M个第一特征和N个第二特征进行拼接,得到K个初始特征。
又例如,可以对M个第一特征和N个第二特征进行特征融合处理,得到P个融合特征:[第一特征1和第二特征1]、[第一特征2和第二特征2]、......、[第一特征M和第二特征N];然后,将M个第一特征、N个第二特征和P个融合特征进行特征拼接,得到K个初始特征:[第一特征1,第二特征1,第一特征1和第二特征1,第一特征2,第二特征2,第一特征2和第二特征2,......,第一特征M,第二特征N,第一特征M和第二特征N],从而可以提高初始特征获取的灵活性和便捷性。
S103、通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征。
在得到K个初始特征后,可以通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征,其中,第一编码特征表征初始特征的不同特征取值的共有部分,第二编码特征表征初始特征的不同特征取值的差异部分,第一编码特征和第二编码特征的存在形式在此不做限定,如第一编码特征和第二编码特征可以是以向量矩阵的形式存在。为了便于理解,可以将第一编码特征称为共有特征,以及将第二编码特征称为独有特征。
该预测模型为经过训练得到的预测模型,该预测模型的具体模型结构可以根据实际需求进行灵活设置,在此不做限定,例如,该预测模型可以是深度神经网络(Deep NeuralNetworks,DNN)或其他深度网络。
以下将对预测模型的训练进行详细说明。
在一些实施方式中,通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征之前,预先对预测模型进行训练,在模型训练阶段,如图3所示,对象意向预测方法还包括步骤S201至S208:
S201、获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征,以及获取样本操作对象针对样本被操作对象执行预设操作的操作意向标签。
其中,样本操作对象、样本第一特征、样本被操作对象、样本第二特征等,可以根据应用场景的不同而不同,在此不做限定。M个样本第一特征和N个样本第二特征由多维特征组成,每维特征可以具有不同的取值,M和N的具体取值可以根据实际需求进行灵活设置,在此不做限定。
在一些实施方式中,可以从服务器上预设的特征库中获取多个样本操作对象的M个样本第一特征,以及多个样本被操作对象的N个样本第二特征。该特征库中可以存储有多个样本操作对象及其对应的多个样本第一特征,以及存储有多个样本被操作对象及其对应的多个样本第二特征。
S202、根据M个样本第一特征和N个样本第二特征,得到K个样本初始特征。
在得到样本操作对象的M个样本第一特征,以及样本被操作对象的N个样本第二特征后,可以根据M个样本第一特征和N个样本第二特征,得到K个样本初始特征。
例如,可以将M个样本第一特征和N个样本第二特征进行拼接,得到K个样本初始特征。
又例如,可以对M个样本第一特征和N个样本第二特征进行特征融合处理,得到P个样本融合特征:[样本第一特征1和样本第二特征1]、[样本第一特征2和样本第二特征2]、......、[样本第一特征M和样本第二特征N];然后,将M个样本第一特征、N个样本第二特征和P个样本融合特征进行特征拼接,得到K个样本初始特征:[样本第一特征1,样本第二特征1,样本第一特征1和样本第二特征1,样本第一特征2,样本第二特征2,样本第一特征2和样本第二特征2,......,样本第一特征M,样本第二特征N,样本第一特征M和样本第二特征N],从而可以提高样本初始特征获取的灵活性和便捷性,并且可以通过样本初始特征对预测模型进行训练,可以提高预测模型的非线性建模能力。
S203、通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征。
在得到K个样本初始特征后,可以通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,其中,样本第一编码特征表征样本初始特征的不同特征取值的共有部分,样本第二编码特征表征样本初始特征的不同特征取值的差异部分。为了便于理解,可以将样本第一编码特征称为样本共有特征,以及将样本第二编码特征称为样本独有特征。
即,本申请考虑到每个样本初始特征的不同特征取值对预测结果的影响,以每一样本初始特征为处理对象,通过预测模型将每一样本初始特征编码为两个编码特征,分别为表征初始特征的不同特征取值的共有部分的样本第一编码特征,和表征初始特征不同特征取值的差异部分的样本第二编码特征。
其中,样本第一编码特征和样本第二编码特征的存在形式在此不做限定,如样本第一编码特征和样本第二编码特征可以是以向量矩阵的形式存在。
S204、根据每一样本初始特征的样本第一编码特征和样本第二编码特征,通过预测模型得到每一样本初始特征的样本目标编码特征。
其中,样本目标编码特征用于表征样本初始特征的不同特征取值。
在得到样本第一编码特征和样本第二编码特征后,可以通过预测模型将每一样本初始特征的样本第一编码特征和样本第二编码特征,融合为每一样本初始特征的样本目标编码特征。
S205、根据每一样本初始特征的样本第二编码特征,通过预测模型,确定每一样本目标编码特征的样本目标特征缩放参数。
例如,可以通过预测模型对每一样本初始特征的样本第二编码特征进行特征变换及特征映射等处理,得到每一样本目标编码特征的样本目标特征缩放参数。
S206、根据每一样本目标特征缩放参数,通过预测模型,得到每一样本目标编码特征的样本目标缩放特征。
例如,可以通过预测模型将每一样本目标特征缩放参数与每一样本目标编码特征进行相乘,得到每一样本目标编码特征的样本目标缩放特征,实现对每一目标编码特征的抑制或激活,从而在整体上达成特征值粒度的特征选择。通过样本目标特征缩放参数对样本目标编码特征进行特征缩放处理,得到样本目标缩放特征,避免预测模型过拟合于某一特征值,在基于样本目标缩放特征对预测模型进行训练时,可以提高预测模型的鲁棒性。
S207、根据K个样本目标缩放特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向。
其中,样本操作意向用于表征样本操作对象针对样本被操作对象执行预设操作的概率。
在一些实施方式中,根据K个样本目标缩放特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向,包括:
通过预测模型,对K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征;
根据K'个处理后样本特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向。
为了进一步提高预测模型的鲁棒性,可以对样本目标缩放特征进行特征丢弃处理,并根据处理后样本特征预测样本操作意向。具体地,可以通过预测模型,对K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征,K'的具体取值可以根据实际需求进行灵活设置,在此不做限定。例如,可以通过对预测模型的神经网络单元按照一定的概率将其暂时从网络中失活,从而达到将经过该神经网络单元的特征进行丢弃的目的。在得到K'个处理后样本特征后,可以通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向。
在一些实施方式中,通过预测模型,对K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征,包括:
根据每一样本目标缩放特征对应的样本目标特征缩放参数,通过预测模型,确定每一样本目标缩放特征的特征丢弃概率,特征丢弃概率和样本目标特征缩放参数正相关;
根据每一样本目标缩放特征的特征丢弃概率,通过预测模型,对每一样本目标缩放特征进行特征丢弃处理,得到每一样本目标缩放特征的处理后样本特征。
例如,可以通过预测模型,对每一样本目标缩放特征对应的样本目标特征缩放参数进行线性网络变换,并经过激活函数sigmoid映射等处理后,得到每一样本目标缩放特征的特征丢弃概率,以及通过预测模型根据每一样本目标缩放特征的特征丢弃概率,对每一样本目标缩放特征进行特征丢弃处理,得到每一样本目标缩放特征的处理后样本特征。
S208、根据样本操作意向和操作意向标签的差异,更新预测模型的网络参数,直至满足预设停止条件。
其中,该预设停止条件可以是样本操作意向和操作意向标签之间的差异达到最小,或者是,训练迭代此时达到预设次数,该预设次数在此不做限定。例如,可以构建交叉熵损失函数,通过交叉熵损失函数计算样本操作意向和操作意向标签之间的差异,并基于差异更新预测模型的网络参数,当样本操作意向和操作意向标签之间的差异达到最小化时,停止模型训练,从而可以训练得到预测模型。
以下将基于模型结构对模型训练的过程进行详细说明,如图4所示,预测模型可以包括特征编码层、特征选择层、特征丢弃层和预测层等网络层,针对各个网络层的作用以下将进行详细说明。
首先,获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征。以及根据M个样本第一特征和N个样本第二特征,得到K个样本初始特征。
然后,通过特征编码层,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征。
例如,特征编码层可以包括向量化网络embedding,该embedding可以用一个低维的向量表示一个类别特征(如物品、视频等)或其他特征等。通过学习,embedding可以更准确地表示对应特征的内在含义,使几何距离相近的向量对应的特征有相近的含义。在对embedding进行初始化时,可以给每个特征进行初始化一个v×d的矩阵,其中v表示特征的不同取值,d表示每个取值的维度,每个特征的不同特征取值最终表现为1×d的矩阵。这种情况下的初始化,往往不考虑一个特征下不同特征取值的之间的关联关系,将一个特征的不同特征值和不同特征的差异建模成一样的互相独立的向量。
由于考虑到每个特征内部不同特征取值的影响,即样本初始特征中每一维度特征对应的不同特征取值与被操作对象之间的关联关系,因此,可以通过特征编码层,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,第二编码特征即为样本独有特征(如独立向量I,也可以称为样本独有向量I),样本第一编码特征即为样本共有特征(如共享向量share,也可以称为样本共有向量S)。样本共有向量S的维度为m×d,样本独有向量I的的维度为v×m,样本共有向量S为每个特征共享的部分,不同特征初始化为不同的m×d共享向量,样本独有向量I为每个特征内部不同特征取值的向量,用来区分同一特征的不同特征值。其中,m、d、v的具体取值在此不做限定。
其次,通过特征选择层,根据每一样本初始特征的样本第一编码特征和样本第二编码特征,得到每一样本初始特征的样本目标编码特征,以及根据每一样本初始特征的样本第二编码特征,确定每一样本目标编码特征的样本目标特征缩放参数,根据每一样本目标特征缩放参数,得到每一样本目标编码特征的样本目标缩放特征。
在得到样本第一编码特征(即样本共有特征)和样本第二编码特征(即样本独有特征)后,可以通过预测模型的特征选择层,将每一样本初始特征的样本第一编码特征和样本第二编码特征,融合为每一样本初始特征的样本目标编码特征。
例如,样本共有特征为m×d维度的样本共有向量S,样本独有特征为v×m维度的样本独有向量I,将样本共有向量S和样本独有向量I相乘,可以融合得到v×d维度的向量矩阵f(即样本目标编码特征)。以及,对样本独有向量I进行网络变换及映射等处理后得到样本目标特征缩放参数,该样本目标特征缩放参数/>的取值范围可以是0至1范围,然后,将样本目标特征缩放参数/>与样本目标编码特征/>相乘,可以得到样本目标缩放特征/>,该样本目标缩放特征也可以称为选择后样本特征。
在一些实施方式中,如图5所示,预测模型的特征选择层包括变换子层、映射子层、融合子层和缩放子层等多个子层,通过特征选择层,根据每一样本初始特征的样本第一编码特征和样本第二编码特征,得到每一样本初始特征的样本目标编码特征,以及根据每一样本初始特征的样本第二编码特征,确定每一样本目标编码特征的样本目标特征缩放参数,根据每一样本目标特征缩放参数,得到每一样本目标编码特征的样本目标缩放特征,包括:
通过融合子层,将每一样本初始特征的样本第一编码特征和样本第二编码特征,融合为每一样本初始特征的样本目标编码特征;
通过变换子层,对每一样本初始特征的样本第二编码特征进行特征变换处理,得到每一样本初始特征的变换后样本特征;
通过映射子层,将每一样本初始特征的变换后样本特征映射为每一样本目标编码特征的样本目标特征缩放参数;
根据每一样本目标特征缩放参数,通过缩放子层对样本目标编码特征进行特征缩放处理,得到每一样本目标编码特征的样本目标缩放特征。
例如,如图5所示,可以将样本初始特征的每一维特征(如特征1、特征2、特征k等)输入特征编码层,编码得到样本第一编码特征和样本第二编码特征,样本第二编码特征即为样本独有特征(即独有特征),样本第一编码特征即为样本共有特征(即共有特征),例如,针对特征1可以编码得到共有特征S1和独有特征I1,针对特征2可以编码得到共有特征S2和独有特征I2,针对特征k可以编码得到共有特征Sk和独有特征Ik等。然后,可以通过特征选择层中的融合子层,对样本独有特征和样本共有特征进行特征融合fusion(如特征矩阵相乘),得到每一样本初始特征的样本目标编码特征(如v×d维度的矩阵f)。
以及,通过变换子层对样本独有特征进行特征变换处理transformation,得到变换后样本特征,通过映射子层将变换后样本特征映射为对应样本目标编码特征的样本目标特征缩放参数,每一维度特征均进行处理后,可以得到每一维度特征对应的特征缩放参数,即每一样本目标编码特征的样本目标特征缩放参数。此时,可以通过缩放子层根据每一维度特征的样本目标特征缩放参数对样本目标编码特征进行特征缩放处理,得到每一样本目标编码特征的样本目标缩放特征。
例如,样本共有特征为m×d维度的样本共有向量S,样本独有特征为v×m维度的样本独有向量I,样本独有向量I可以描述为样本共有向量S的每一行权重系数,如某个特征值的权重为1×m,则样本共有向量S为m×d。对于每个特征值的权重系数1×m,通过变换子层对其进行网络变换(可以是多层网络),并经过映射子层的激活函数sigmoid进行特征映射,得到0-1范围的值,作为样本目标特征缩放参数,通过缩放子层基于样本目标特征缩放参数/>,对融合子层融合样本独有向量I和样本共有向量S得到的向量矩阵f,进行每一维度特征的特征选择,得到选择后样本特征(即样本目标缩放特征):/>
本实施例通过融合样本共有特征和样本独有特征得到样本目标编码特征,以及根据样本独有特征的特征取值确定每一维度特征的样本目标特征缩放参数,基于样本目标特征缩放参数对样本目标编码特征进行特征缩放处理,得到样本目标缩放特征,避免预测模型过拟合于某一特征值,在基于样本目标缩放特征对预测模型进行训练时,可以提高预测模型的鲁棒性。
在得到样本目标缩放特征后,可以根据K个样本目标缩放特征,通过预测层进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向,样本操作意向用于表征样本操作对象针对样本被操作对象执行预设操作的概率。
在一些实施方式中,预测模型还包括特征丢弃层,根据K个样本目标缩放特征,通过预测层进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向,包括:
使能特征丢弃层,并通过特征丢弃层对K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征;
根据K'个处理后样本特征,通过预测层进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向。
为了进一步提高预测模型的鲁棒性,可以对样本目标缩放特征进行特征丢弃处理,并根据处理后样本特征预测样本操作意向。具体地,在模型训练阶段,可以使能预测模型的特征丢弃层,即激活特征丢弃层,并通过特征丢弃层对K个样本目标缩放特征进行特征丢弃处理dropout,得到K'处理后样本特征,K'的具体取值可以根据实际需求进行灵活设置,在此不做限定。例如,可以通过特征丢弃层对神经网络单元按照一定的概率将其暂时从网络中失活,从而达到将经过该神经网络单元的特征进行丢弃的目的。其中,随机失活(dropout)是对具有深度结构的神经网络进行优化的方法,在模型学习过程中可以通过将隐含层的部分权重或输出随机归零,降低各网络节点(即神经网络单元)之间的相互依赖性(co-dependence),从而实现神经网络的正则化(regularization),降低其结构风险(structural risk)。在得到处理后样本特征后,可以通过预测层根据处理后样本特征进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向。
在一些实施方式中,通过特征丢弃层对K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征,包括:
通过特征丢弃层根据每一样本目标缩放特征对应的样本目标特征缩放参数,确定每一样本目标缩放特征的特征丢弃概率;
通过特征丢弃层根据每一样本目标缩放特征的特征丢弃概率,通过预测模型,对每一样本目标缩放特征进行特征丢弃处理,得到每一样本目标缩放特征的处理后样本特征。
例如,可以通过特征丢弃层对用于表征每一维度特征的不同特征取值的特征重要程度的样本目标特征缩放参数进行线性网络变换,并经过激活函数sigmoid映射等处理后,得到样本目标缩放特征中每一维度特征的特征丢弃概率(即p值),其计算公式可以如下:
其中,p表示特征丢弃概率,sigmoid为激活函数,表示样本目标特征缩放参数,w表示网络权重参数weight,b表示网络偏置参数bias,w和b的具体取值在此处不做限定。每一维度特征的不同特征取值具有不同的p值,当某一维度特征对应的/>越大时,说明该特征重要性越高时,对应的p值越大,反之,当某一维度特征对应的/>越小时,说明该特征重要性越低,对应的p值越小。
通过特征丢弃层根据每一样本目标缩放特征的特征丢弃概率,对每一样本目标缩放特征进行特征丢弃处理,得到处理后样本特征,通过预测层根据处理后样本特征预测得到样本操作意向,例如可以对处理后样本特征进行多层网络变换,最终输出一个0-1范围的分数,该分数用于表征样本操作对象针对样本被操作对象执行预设操作的概率,将该分数作为样本操作意向,从而达到抑制特征过拟合的效果,避免预测模型在训练过程中过拟合于某一特征值,可以提高预测模型的鲁棒性。
最后,可以根据样本操作意向和操作意向标签的差异,更新预测模型的网络参数,直至满足预设停止条件。在通过预测模型的预测层预测得到样本操作意向后,可以获取样本操作对象针对样本被操作对象执行预设操作的操作意向标签(即真实意向),该操作意向标签用于表征样本操作对象针对样本被操作对象执行预设操作的真实概率。然后可以根据样本操作意向(即预测概率)和操作意向标签(即真实概率)之间的差异,更新预测模型的网络参数,直至满足预设停止条件,得到训练后的预测模型,该预设停止条件可以是样本操作意向和操作意向标签之间的差异达到最小,或者是,训练迭代此时达到预设次数,该预设次数在此不做限定。例如,可以构建交叉熵损失函数,通过交叉熵损失函数计算样本操作意向(即预测概率)和操作意向标签(即真实概率)之间的差异,并基于差异更新预测模型的网络参数,当样本操作意向和操作意向标签之间的差异达到最小化时,停止模型训练,从而可以训练得到预测模型。
以下将对模型训练进行举例说明,以样本第一编码特征为样本共有特征,样本第二编码特征为样本独有特征为例,例如,如图6所示,可以获取样本操作对象的M个样本第一特征,以及样本被操作对象的N个样本第二特征,对M个样本第一特征和N个样本第二特征进行特征融合处理,得到样本融合特征,将样本第一特征、样本第二特征和样本融合特征进行特征拼接,得到K个样本初始特征。将样本初始特征输入预测模型的特征编码层,对该样本初始特征编码为[0,2,...,1]等向量矩阵,通过特征编码层将该向量矩阵中的每一维特征,分别编码为样本独有特征和样本共有特征。
针对特征0,可以将特征0编码为独有特征I1[0.1,0.2,…,0.5]和共有特征S1,通过特征选择层的融合子层fusion,将样本独有特征和样本共有特征融合为样本目标编码特征[0.2,0.3,…,0.5];以及,通过特征选择层的变换子层transformation,对样本独有特征进行特征变换处理,得到变换后样本特征;通过特征选择层的映射子层,将变换后样本特征映射为样本目标编码特征的样本目标特征缩放参数0.3;通过特征选择层的缩放子层根据样本目标特征缩放参数0.3,对样本目标编码特征[0.2,0.3,…,0.5]进行特征缩放处理,得到样本目标缩放特征[0.06,0.09,…,0.15]。通过特征丢弃层根据样本目标特征缩放参数0.3,确定样本目标缩放特征中每一维度特征的特征丢弃概率(p值),并根据每一维度特征的特征丢弃概率,对样本目标缩放特征进行特征丢弃处理,得到处理后样本特征[0.06,0.0,…,0.15],即被丢弃的特征赋予0值。
针对特征1,可以将特征1编码为独有特征Ik[0.2,0.3,…,0.4]和共有特征Sk,通过特征选择层的融合子层fusion,将样本独有特征和样本共有特征融合为样本目标编码特征[0.1,0.3,…,0.5];以及,通过特征选择层的变换子层transformation,对样本独有特征进行特征变换处理,得到变换后样本特征;通过特征选择层的映射子层,将变换后样本特征映射为样本目标编码特征的样本目标特征缩放参数0.8;通过特征选择层的缩放子层根据样本目标特征缩放参数0.8,对样本目标编码特征[0.1,0.3,…,0.5]进行特征缩放处理,得到样本目标缩放特征[0.08,0.24,…,0.4]。通过特征丢弃层根据特征缩放参数0.8,确定样本目标缩放特征中每一维度特征的特征丢弃概率(p值),并根据每一维度特征的特征丢弃概率,对样本目标缩放特征进行特征丢弃处理,得到处理后样本特征[0.0,0.0,…,0.4],即被丢弃的特征赋予0值。
样本初始特征中每一维度特征均按照上述方式进行特征编码、特征选择及特征丢弃处理后,可以将每一维度特征对应的处理后样本特征输入预测层,预测得到样本操作对象针对样本被操作对象执行预设操作的预测概率0.8(即样本操作意向,也可以称为分数),根据预测概率0.8和真实概率之间的差异,更新预测模型的网络参数,直至预测概率0.8和真实概率之间的差异达到最小。
本实施例在模型训练阶段从更加细粒度的维度进行特征选择,从特征的不同特征值粒度进行模型的鲁棒性增强,每个特征的不同特征值有共有的特征权重和各自独有的权重,并分别进行特征选择,基于特征选择输出的样本目标特征缩放参数确定dropout参数(即特征丢弃概率),自适应进行特征丢弃,使得预测模型达到更好的鲁棒性的效果。具体地,考虑到样本操作对象的不同特征的不同特征值和样本被操作对象的相关性差异较大,比如是否买车,30-40岁的用户与买车这个标签更相关,20-30岁的用户与买车这个标签关系会弱一些,如果不考虑特征不同取值下与标签的相关性,将会造成模型过拟合于某个特征值,如会输出30-40岁的的用户买车概率高于20-30岁的用户,但其实30-40岁有不买车的用户,20-30岁也有买车的用户,因此最终会造成模型过拟合于某个特征。本申请在特征值粒度上鲁棒的预测模型(如深度网络),该预测模型考虑每个特征的不同特征值对最终结果的影响,在特征值粒度上进行特征选择,同时自适应进行特征丢弃dropout,避免预测模型过拟合于某一特征值,最终可以实现预测模型的鲁棒性更强以及泛化能力更强的效果。
在模型训练阶段训练得到预测模型后,可以进入模型应用阶段,在模型应用阶段可以对操作对象的第一特征,以及被操作对象的第二特征,进行特征编码、特征选择、以及预测等处理。
需要说明的是,由于在模型应用阶段不需要进行特征丢弃处理,因此,在模型应用阶段可以去使能特征丢弃层,即在模型应用阶段,将特征丢弃层的特征丢弃功能关闭。
S104、根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征。
其中,目标编码特征用于表征初始特征的不同特征取值。
例如,可以通过预测模型的特征编码层将每一初始特征编码为第一编码特征(即m×d维度的共有向量S)和第二编码特征(即v×m维度的独立向量I),共有向量S为每个特征共享的部分,独有向量I为每个特征内部不同特征取值的差异向量,用来区分同一特征的不同特征值。然后,通过预测模型的特征选择层,将每一初始特征的第一编码特征和第二编码特征融合为目标编码特征,例如,将v×m维度的独立向量I和m×d维度的共有向量S相乘,得到v×d维度的目标编码特征
S105、根据每一初始特征的第二编码特征,通过预测模型,确定每一目标编码特征的目标特征缩放参数。
S106、根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征。
具体地,通过预测模型的特征编码层,将每一初始特征编码为第一编码特征和第二编码特征,通过预测模型的特征选择层,将每一初始特征的第一编码特征和第二编码特征融合为目标编码特征,以及根据每一初始特征的第二编码特征确定每一目标编码特征的目标特征缩放参数,并根据每一目标特征缩放参数对目标编码特征进行特征缩放处理,得到每一目标编码特征的目标缩放特征。
例如,可以通过预测模型的特征选择层,对每一初始特征的第二编码特征(即独有向量I)进行网络变换及映射等处理后得到取值范围为0至1的目标特征缩放参数,将目标特征缩放参数/>与目标编码特征/>相乘,可以得到目标缩放特征,该目标缩放特征也可以称为选择后特征。
在一些实施方式中,特征选择层包括变换子层、映射子层、融合子层和缩放子层,通过特征选择层,将每一初始特征的第一编码特征和第二编码特征融合为目标编码特征,以及根据每一初始特征的第二编码特征确定每一目标编码特征的目标特征缩放参数,并根据每一目标特征缩放参数对目标编码特征进行特征缩放处理,得到每一目标编码特征的目标缩放特征,包括:
通过融合子层,将每一初始特征的第一编码特征和第二编码特征融合为目标编码特征;
通过变换子层,对每一初始特征的第二编码特征进行特征变换处理,得到变换后特征;
通过映射子层,将变换后特征映射为每一目标编码特征的目标特征缩放参数;
通过缩放子层根据每一目标特征缩放参数对目标编码特征进行特征缩放处理,得到每一目标编码特征的目标缩放特征。
例如,可以将初始特征的每一维特征(如特征1、特征2、特征k等)输入特征编码层,编码得到共有特征(即第一编码特征)和独有特征(即第二编码特征),如针对特征1可以编码得到共有特征S1和独有特征I1,针对特征2可以编码得到共有特征S2和独有特征I2,针对特征k可以编码得到共有特征Sk和独有特征Ik等。然后,可以通过特征选择层中的融合子层,对独有特征和共有特征进行特征融合fusion(如特征矩阵相乘),得到目标编码特征(如v×d维度的矩阵f)。
以及,通过变换子层对独有特征进行特征变换处理transformation(可以是多层网络变换处理),得到变换后特征,通过映射子层(如激活函数sigmoid)将变换后特征映射为对应目标编码特征的目标特征缩放参数,每一维度特征均进行处理后,可以得到每一目标编码特征的目标特征缩放参数。此时,可以通过缩放子层根据每一目标编码特征的目标特征缩放参数对目标编码特征中每一维度特征进行特征缩放处理,得到目标缩放特征。
S107、根据K个目标缩放特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。
例如,可以通过预测模型的预测层基于根据K个目标缩放特征进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。在模型应用阶段通过对第一特征和第二特征进行特征编码、特征选择、以及预测等处理,提高了通过预测模型预测操作对象针对被操作对象执行预设操作的操作意向的准确性。
其中,该操作意向用于表征操作对象针对被操作对象执行预设操作的概率。该预设操作可以针对应用场景的不同而不同,例如,针对购买物品的应用场景,可以通过预测模型预测用户购买物品的意向,用户购买物品的意向可以用于表征用户会购买该物品的概率。又例如,针对视频播放的应用场景,可以通过预测模型预测用户观看视频的意向,用户观看视频的意向可以用于表征用户会注册视频播放账号来播放视频的概率。又例如,针对即时通信交友的应用场景,可以通过预测模型预测用户交友的意向,用户交友的意向可以用于表征用户会添加其他用户为好友的概率。
在一些实施方式中,获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征,包括:接收终端发送的意向评估请求;获取意向评估请求指示的操作对象的M个第一特征,以及获取意向评估请求指示的被操作对象的N个第二特征。
根据K个目标缩放特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向之后,对象意向预测方法还包括:将操作意向返回给终端。
在模型应用阶段,为了提高对意向预测的灵活性,可以由终端发起请求,响应于该请求进行意向预测。具体地,可以接收终端发送的意向评估请求,该意向评估请求可以携带对象标识以及其他信息,在此处不做限定,响应于意向评估请求,获取意向评估请求中对象标识指示的操作对象的M个第一特征,以及被操作对象的N个第二特征。通过预测模型对M个第一特征和N个第二特征进行特征编码、特征选择、以及预测等处理,得到操作对象针对被操作对象执行预设操作的操作意向,此时可以将操作意向返回给终端,以供终端显示该操作意向。
在一些实施方式中,操作对象为多个,将操作意向返回给终端,包括:
按照操作意向从高至低的顺序,对多个操作对象对应的操作意向进行排序,得到排序结果;
将排序结果返回给终端,排序结果用于终端展示。
例如,如图7所示,操作对象可以包括用户1、用户2、用户3、......、以及用户n等,n的具体取值在此不做限定,可以通过终端的用户意向预测显示界面输入待预测的操作对象:用户1、用户2、用户3、......、以及用户n等,点击输入完成后,生成意向评估请求,在接收到终端发送的意向评估请求后,可以从特征库中获取意向评估请求指示的用户1、用户2、用户3、......、以及用户n等的M个第一特征,以及被操作对象的N个第二特征,通过预测模型对M个第一特征和N个第二特征进行特征编码、特征选择、以及预测等处理,得到用户1、用户2、用户3、......、以及用户n等针对被操作对象(如物品)执行预设操作(如购买)的操作意向,此时可以按照操作意向从高至低的顺序对用户1、用户2、用户3、......、以及用户n等进行排序,得到排序结果:用户3、用户1、用户5、......、用户8,即按照意向度从高至低的顺序对用户1、用户2、用户3、......、以及用户n等进行意向评级,得到评级结果。将排序结果返回给终端,以供终端显示排序结果,提高了对操作意向处理的灵活性和便捷性。
在一些实施方式中,操作对象为多个,根据K个目标缩放特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向之后,对象意向预测方法还包括:
从多个操作对象中筛选出操作意向大于操作意向阈值的目标操作对象;
向目标操作对象推送被操作对象的操作信息。
在模型应用阶段,在得到多个操作对象针对被操作对象执行预设操作的操作意向后,可以从多个操作对象中筛选出操作意向大于预设意向阈值的操作对象,得到目标操作对象,其中,预设意向阈值可以根据实际需求进行灵活设置,在此不做限定。然后,可以向目标操作对象推送被操作对象的操作信息,该操作信息可以根据应用场景的不同而不同,以便目标操作对象可以基于操作信息执行相应的操作,提高了操作的便捷性和多样性。
针对购买物品的应用场景,通过预测模型预测多个用户购买物品的购买意向,从多个用户中筛选出购买意向大于预设意向阈值的目标用户,向该目标用户推送物品的购买信息(如链接),以便目标用户可以基于购买信息购买物品。
又例如,针对视频播放的应用场景,通过预测模型预测多个用户观看视频的观看意向,从多个用户中筛选出观看意向大于预设意向阈值的目标用户,向该目标用户推送视频的播放信息(如播放应用程序的下载链接),以便目标用户可以基于播放信息播放视频。
又例如,针对即时通信交友的应用场景,通过预测模型预测多个用户与其他用户交友的意向,从多个用户中筛选出观看意向大于预设意向阈值的目标用户,向该目标用户推送其他用户的账号信息,以便目标用户可以基于账号信息添加其他用户为好友。
本申请中,首先获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征,并根据M个第一特征和N个第二特征,得到K个初始特征;考虑到每个初始特征的不同特征取值对预测结果的影响,以每一初始特征为处理对象,通过预测模型将每一初始特征编码为两个编码特征,分别为表征初始特征的不同特征取值的共有部分的第一编码特征,和表征初始特征不同特征取值的差异部分的第二编码特征;然后,根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征,以及根据表征每一初始特征不同特征取值的差异部分的第二编码特征,通过预测模型确定出每一目标编码特征的目标特征缩放参数;其次,根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征,实现对每一目标编码特征的抑制或激活,从而在整体上达成特征值粒度的特征选择,最后,根据K个目标缩放特征,也即是选择后的特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。以此,通过在特征值粒度上进行特征选择,能够在特征取值不同时,动态的改变不同特征对预测结果的贡献,使其与实际的特征取值相匹配,即对于同一特征,建立了表征不同取值的共有部分的第一编码特征,并通过第二编码特征区分不同取值的差异部分,而现有技术未考虑不同取值间的联系,本申请通过第一编码特征建立了不同取值间的联系,使得意向预测更准确,从而达到提高预测模型预测准确率的目的。
根据上述实施例所描述的方法,以下将举例作进一步详细说明。
本实施例以对象意向预测装置集成在服务器为例,在模型训练阶段,服务器可以通过预测模型的特征编码层进行特征编码,通过预测模型的特征选择层进行特征选择,通过预测模型的特征丢弃层进行特征丢弃,以及通过预测模型的预测层进行意向预测等一系列处理,实现对预测模型的训练。在模型应用阶段,如图8所示,服务器可以接收终端发送的携带对象列表(如用户列表)的意向评估请求,响应于意向评估请求,从特征库中获取对象特征(即第一特征)和线索特征(即第二特征),通过预测模型的特征编码层进行特征编码,通过预测模型的特征选择层进行特征选择,以及通过预测模型的预测层进行意向预测等一系列处理,得到意向度(即操作意向),并将意向度返回给终端。以下将对模型训练阶段和模型应用阶段展开说明。
(一)模型训练阶段
针对购买物品的应用场景,以样本操作对象为样本用户、样本第一特征为对象特征、样本被操作对象为物品、样本第二特征为物品特征、样本初始特征为样本合并特征、样本第一编码特征为样本共有特征、样本第二编码特征为样本独有特征、样本目标编码特征为样本特征、样本目标特征缩放参数为特征缩放参数、预设操作为购买操作为例进行详细说明。请参阅图9,图9为本申请实施例提供的模型训练阶段的对象意向预测方法的流程示意图。该方法流程可以包括步骤S301至S312:
S301、服务器从特征库中获取样本用户的对象特征以及物品特征。
其中,对象特征可以包括用户的属性特征、经历特征、消费特征、位置特征、以及兴趣特征等,物品特征可以包括物品售卖的门店信息、渠道信息和物品信息等,对象特征及物品特征可以由多维特征组成,每维特征可以具有不同的取值。
S302、服务器对对象特征和物品特征进行特征交叉处理,得到样本组合特征。
S303、服务器将对象特征、物品特征和样本组合特征进行特征拼接,得到样本合并特征。
例如,服务器可以对对象特征和物品特征进行特征交叉处理,得到样本组合特征1[对象和物品特征1],样本组合特征2[对象和物品特征2],...,样本组合特征k[对象和物品特征k]等。将对象特征、物品特征和样本组合特征进行特征拼接,得到样本合并特征:[对象特征1,对象特征2,...,对象特征n,物品特征1,物品特征2,...,物品特征m,对象和物品特征1,对象和物品特征2,...,对象和物品特征k]。
S304、服务器通过预测模型的特征编码层,将样本合并特征的每一维特征,编码为样本独有特征和样本共有特征。
例如,服务器可以通过预测模型的特征编码层,将特征1编码为共有特征S1和独有特征I1,将特征2编码为共有特征S2和独有特征I2,将特征k编码为共有特征Sk和独有特征Ik等。
S305、服务器通过预测模型的特征选择层中的融合子层,将样本独有特征和样本共有特征融合为样本特征。
服务器通过预测模型的特征选择层中的融合子层,对样本独有特征和样本共有特征进行特征融合fusion处理(如特征矩阵相乘),得到样本特征(如v×d维度的矩阵f)。
S306、服务器通过预测模型的特征选择层中的变换子层,对样本独有特征进行特征变换处理,得到变换后样本特征。
S307、服务器通过预测模型的特征选择层中的映射子层,将变换后样本特征映射为对应样本特征的特征缩放参数。
服务器通过预测模型的特征选择层中的变换子层对样本独有特征进行特征变换处理transformation,得到变换后样本特征,并通过映射子层将变换后样本特征映射为对应样本特征的特征缩放参数,每一维度特征均进行处理后,可以得到每一维度特征对应的特征缩放参数。
S308、服务器通过预测模型的特征选择层中的缩放子层,根据特征缩放参数对样本特征进行特征缩放处理,得到样本目标缩放特征。
服务器通过预测模型的特征选择层中的缩放子层基于特征缩放参数,对融合得到的样本特征f中的每一维度特征进行特征缩放处理,得到样本目标缩放特征:/>
S309、服务器通过预测模型的特征丢弃层根据特征缩放参数,确定样本目标缩放特征中每一维度特征的特征丢弃概率。
S310、服务器通过预测模型的特征丢弃层根据特征丢弃概率,对样本目标缩放特征进行特征丢弃处理,得到处理后样本特征。
服务器通过预测模型的特征丢弃层,对特征缩放参数进行线性网络变换,并经过激活函数sigmoid映射等处理后,得到样本目标缩放特征中每一维度特征的特征丢弃概率(即p值),并根据每一维度特征的特征丢弃概率,对样本目标缩放特征进行特征丢弃处理,得到处理后样本特征。
S311、服务器通过预测模型的预测层,根据处理后样本特征预测得到样本用户针对物品执行购买操作的样本操作意向。
S312、服务器根据样本操作意向与操作意向标签之间的差异,更新预测模型的网络参数,直至差异达到最小,得到训练后的预测模型。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对对象意向预测方法的详细描述,此处不再赘述。
本申请实施例中在模型训练阶段,服务器可以对对象特征和物品特征进行特征合并,得到样本合并特征,通过预测模型的特征编码层,将样本合并特征的每一维特征,编码为样本独有特征和样本共有特征,通过预测模型的特征选择层,将样本独有特征和样本共有特征融合为样本特征,以及对样本独有特征进行特征变换及映射处理,得到特征缩放参数,并根据特征缩放参数对样本特征进行特征缩放处理,得到样本目标缩放特征。通过预测模型的特征丢弃层根据特征缩放参数,确定样本目标缩放特征中每一维度特征的特征丢弃概率,并根据特征丢弃概率,对样本目标缩放特征进行特征丢弃处理,得到处理后样本特征。通过预测模型的预测层,根据处理后样本特征预测得到样本用户针对物品执行购买操作的样本操作意向,根据样本操作意向与操作意向标签之间的差异,更新预测模型的网络参数,直至差异达到最小,得到训练后的预测模型。通过预测模型的特征编码层进行特征编码,通过预测模型的特征选择层进行特征选择,通过预测模型的特征丢弃层进行特征丢弃,以及通过预测模型的预测层进行意向预测等一系列处理,解决了预测模型过拟合问题,提高了预测模型的鲁棒性。
(二)模型应用阶段
针对购买物品的应用场景,以操作对象为用户、第一特征为对象特征、被操作对象为物品、第二特征为物品特征、初始特征为目标特征、第一编码特征为共有特征、第二编码特征为独有特征、目标编码特征为融合后特征、预设操作为购买操作、操作意向为购买意向为例进行详细说明。请参阅图10,图10为本申请实施例提供的模型应用阶段的对象意向预测方法的流程示意图。该方法流程可以包括步骤S401至S411:
S401、终端向服务器发送的意向评估请求。
其中,意向评估请求中可以携带用户的用户标识以及其他信息。终端可以通过客户端接收用户输入的用户标识,并基于用户标识生成意向评估请求,向服务器发送意向评估请求,该客户端可以是应用程序,在此不做限定。
S402、服务器响应于意向评估请求,获取用户的对象特征,以及物品的物品特征。
服务器响应于意向评估请求,从特征库中获取与用户标识匹配的对象特征,以及物品的物品特征。其中,对象特征可以包括用户的属性特征、经历特征、消费特征、位置特征、以及兴趣特征等,物品特征可以包括物品售卖的门店信息、渠道信息和物品信息等。
S403、服务器对对象特征和物品特征进行特征交叉处理,得到组合特征。
S404、服务器将对象特征、物品特征和组合特征进行特征拼接,得到目标特征。
例如,服务器可以对对象特征和物品特征进行特征交叉处理,得到组合特征1[对象和物品特征1],组合特征2[对象和物品特征2],...,组合特征k[对象和物品特征k]等。将对象特征、物品特征和组合特征进行特征拼接,得到目标特征:[对象特征1,对象特征2,...,对象特征n,物品特征1,物品特征2,...,物品特征m,对象和物品特征1,对象和物品特征2,...,对象和物品特征k]。
S405、服务器通过预测模型的特征编码层,将目标特征的每一维特征,编码为独有特征和共有特征。
该预测模型即为训练后的预测模型。例如,服务器可以通过预测模型的特征编码层,将特征1编码为共有特征S1和独有特征I1,将特征2编码为共有特征S2和独有特征I2,将特征k编码为共有特征Sk和独有特征Ik等。
S406、服务器通过预测模型的特征选择层中融合子层,将独有特征和共有特征融合为融合后特征。
服务器通过预测模型的特征选择层中的融合子层,对独有特征和共有特征进行特征融合fusion处理,得到融合后特征。
S407、服务器通过预测模型的特征选择层中变换子层,对独有特征进行特征变换处理,得到变换后特征。
S408、服务器通过预测模型的特征选择层中映射子层,将变换后特征映射为对应融合后特征的目标特征缩放参数。
服务器通过预测模型的特征选择层中的变换子层对独有特征进行特征变换处理transformation,得到变换后特征,并通过映射子层将变换后特征映射为对应融合后特征的目标特征缩放参数,每一维度特征均进行处理后,可以得到每一维度特征对应的目标特征缩放参数。
S409、服务器通过预测模型的特征选择层中缩放子层,根据目标特征缩放参数对融合后特征进行特征缩放处理,得到目标缩放特征。
服务器通过预测模型的特征选择层中的缩放子层基于目标特征缩放参数,对融合后特征中的每一维度特征进行特征缩放处理,得到目标缩放特征。
S410、服务器通过预测模型的预测层基于缩后特征进行意向预测,得到用户针对物品执行购买操作的购买意向。
S411、服务器将购买意向返回给终端。
在得到购买意向后,服务器可以将购买意向返回给终端。服务器可以是对一个或多个用户进行购买意向的预测,当服务器对多个用户进行购买意向的预测时,服务器可以对多个用户的购买意向进行排序后返回给终端,如图11所示,服务器和终端之间的交互可以包括:
S10、终端向服务器发送的携带多个用户标识的意向评估请求。
S11、服务器基于多个用户标识,从特征库中获取多个用户的对象特征,以及物品的物品特征。
S12、服务器对对象特征和物品特征进行特征合并,得到目标特征,并通过预测模型对目标特征进行特征编码、特征选择、及意向预测等处理,得到每个用户对物品的购买意向。
S13、服务器对按照购买意向从高至低的顺序对多个用户进行排序,得到排序结果。
S14、服务器将多个用户的购买意向的排序结果返回给终端。
S15、终端显示多个用户的购买意向的排序结果。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对对象意向预测方法的详细描述,此处不再赘述。
本申请实施例中在模型应用阶段,服务器可以对对象特征和物品特征进行特征合并,得到目标特征,通过预测模型的特征编码层,将目标特征的每一维特征,编码为独有特征和共有特征,通过预测模型的特征选择层将独有特征和共有特征融合为融合后特征,以及对独有特征进行特征变换及映射处理,得到目标特征缩放参数,根据目标特征缩放参数对融合后特征进行特征缩放处理,得到目标缩放特征,通过预测模型的预测层基于缩后特征进行意向预测,得到用户针对物品执行购买操作的购买意向,提高了通过预测模型预测用户针对物品执行购买操作的购买意向的准确性。
为便于更好的实施本申请实施例提供的对象意向预测方法,本申请实施例还提供一种基于上述对象意向预测方法的装置。其中名词的含义与上述对象意向预测方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图12,图12为本申请实施例提供的对象意向预测装置的结构示意图,其中该对象意向预测装置500可以包括第一获取单元501、第二获取单元502、特征编码单元503、特征缩放单元504、以及意向预测单元505等。
其中,第一获取单元501,用于获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征;
第二获取单元502,用于根据M个第一特征和N个第二特征,得到K个初始特征;
特征编码单元503,用于通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征,以及根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征,第一编码特征表征初始特征的不同特征取值的共有部分,第二编码特征表征初始特征的不同特征取值的差异部分,目标编码特征用于表征初始特征的不同特征取值;
特征缩放单元504,用于根据每一初始特征的第二编码特征,通过预测模型,确定每一目标编码特征的目标特征缩放参数,以及根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征;
意向预测单元505,用于根据K个目标缩放特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。
在一些实施例中,K个初始特征包括M个第一特征和N个第二特征,或K个初始特征包括M个第一特征、N个第二特征以及P个融合特征,融合特征是由一个第一特征和一个第二特征融合得到。
在一些实施例中,对象意向预测装置500还包括:
第三获取单元,用于获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征,以及获取样本操作对象针对样本被操作对象执行预设操作的操作意向标签;
第四获取单元,用于根据M个样本第一特征和N个样本第二特征,得到K个样本初始特征;
样本特征编码单元,用于通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,以及根据每一样本初始特征的样本第一编码特征和样本第二编码特征,通过预测模型得到每一样本初始特征的样本目标编码特征,样本第一编码特征表征样本初始特征的不同特征取值的共有部分,样本第二编码特征表征样本初始特征的不同特征取值的差异部分,样本目标编码特征用于表征样本初始特征的不同特征取值;
样本特征缩放单元,用于根据每一样本初始特征的样本第二编码特征,通过预测模型,确定每一样本目标编码特征的样本目标特征缩放参数,以及根据每一样本目标特征缩放参数,通过预测模型,得到每一样本目标编码特征的样本目标缩放特征;
样本操作意向预测单元,用于根据K个样本目标缩放特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向;
更新单元,用于根据样本操作意向和操作意向标签的差异,更新预测模型的网络参数,直至满足预设停止条件。
在一些实施例中,样本操作意向预测单元包括:
丢弃子单元,用于通过预测模型,对K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征;
预测子单元,用于根据K'个处理后样本特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向。
在一些实施例中,丢弃子单元具体用于:根据每一样本目标缩放特征对应的样本目标特征缩放参数,通过预测模型,确定每一样本目标缩放特征的特征丢弃概率,特征丢弃概率和样本目标特征缩放参数正相关;根据每一样本目标缩放特征的特征丢弃概率,通过预测模型,对每一样本目标缩放特征进行特征丢弃处理,得到每一样本目标缩放特征的处理后样本特征。
在一些实施例中,第一获取单元501具体用于:接收终端发送的意向评估请求;获取意向评估请求指示的操作对象的M个第一特征,以及获取意向评估请求指示的被操作对象的N个第二特征;
对象意向预测装置500还包括:返回单元,用于将操作意向返回给终端。
在一些实施例中,操作对象为多个,返回单元具体用于:按照操作意向从高至低的顺序,对多个操作对象对应的操作意向进行排序,得到排序结果;将排序结果返回给终端,排序结果用于终端展示。
在一些实施例中,操作对象为多个,对象意向预测装置500还包括:
筛选单元,用于从多个操作对象中筛选出操作意向大于操作意向阈值的目标操作对象;
推送单元,用于向目标操作对象推送被操作对象的操作信息。
本申请实施例中,首先由第一获取单元501获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征,并由第二获取单元502根据M个第一特征和N个第二特征,得到K个初始特征;考虑到每个初始特征的不同特征取值对预测结果的影响,以每一初始特征为处理对象,由特征编码单元503通过预测模型将每一初始特征编码为两个编码特征,分别为表征初始特征的不同特征取值的共有部分的第一编码特征,和表征初始特征不同特征取值的差异部分的第二编码特征;然后,由特征编码单元503根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征,以及由特征缩放单元504根据表征每一初始特征不同特征取值的差异部分的第二编码特征,通过预测模型确定出每一目标编码特征的目标特征缩放参数;其次,由特征缩放单元504根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征,实现对每一目标编码特征的抑制或激活,从而在整体上达成特征值粒度的特征选择,最后,由意向预测单元505根据K个目标缩放特征,也即是选择后的特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。以此,通过在特征值粒度上进行特征选择,能够在特征取值不同时,动态的改变不同特征对预测结果的贡献,使其与实际的特征取值相匹配,即对于同一特征,建立了表征不同取值的共有部分的第一编码特征,并通过第二编码特征区分不同取值的差异部分,而现有技术未考虑不同取值间的联系,本申请通过第一编码特征建立了不同取值间的联系,使得意向预测更准确,从而达到提高预测模型预测准确率的目的。
本申请实施例还提供一种计算机设备,该计算机设备可以是服务器等,如图13所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器601、一个或一个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。本领域技术人员可以理解,图13中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器601是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器602内的数据,执行计算机设备的各种功能和处理数据。可选的,处理器601可包括一个或多个处理核心;优选的,处理器601可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。
存储器602可用于存储软件程序以及模块,处理器601通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。
计算机设备还包括给各个部件供电的电源603,优选的,电源603可以通过电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源603还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元604,该输入单元604可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器601会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器601来运行存储在存储器602中的应用程序,从而实现各种功能,如下:
在模型训练阶段,获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征,以及获取样本操作对象针对样本被操作对象执行预设操作的操作意向标签;根据M个样本第一特征和N个样本第二特征,得到K个样本初始特征;通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,样本第一编码特征表征样本初始特征的不同特征取值的共有部分,样本第二编码特征表征样本初始特征的不同特征取值的差异部分;根据每一样本初始特征的样本第一编码特征和样本第二编码特征,通过预测模型得到每一样本初始特征的样本目标编码特征,样本目标编码特征用于表征样本初始特征的不同特征取值;根据每一样本初始特征的样本第二编码特征,通过预测模型,确定每一样本目标编码特征的样本目标特征缩放参数;根据每一样本目标特征缩放参数,通过预测模型,得到每一样本目标编码特征的样本目标缩放特征;根据K个样本目标缩放特征,通过预测模型进行意向预测,得到样本操作对象针对样本被操作对象执行预设操作的样本操作意向;根据样本操作意向和操作意向标签的差异,更新预测模型的网络参数,直至满足预设停止条件。避免预测模型过拟合于某一特征值,提高了预测模型的鲁棒性。
在模型应用阶段,获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征;根据M个第一特征和N个第二特征,得到K个初始特征;通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征,第一编码特征表征初始特征的不同特征取值的共有部分,第二编码特征表征初始特征的不同特征取值的差异部分;根据每一初始特征的第一编码特征和第二编码特征,通过预测模型得到每一初始特征的目标编码特征,目标编码特征用于表征初始特征的不同特征取值;根据每一初始特征的第二编码特征,通过预测模型,确定每一目标编码特征的目标特征缩放参数;根据每一目标特征缩放参数,通过预测模型,得到每一目标编码特征的目标缩放特征;根据K个目标缩放特征,通过预测模型进行意向预测,得到操作对象针对被操作对象执行预设操作的操作意向。提高了通过预测模型预测操作对象针对被操作对象执行预设操作的操作意向的准确性。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对对象意向预测方法的详细描述,此处不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中各种可选实现方式中提供的方法。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机指令来完成,或通过计算机指令控制相关的硬件来完成,该计算机指令可以存储于一计算机可读存储介质(即存储介质)中,并由处理器进行加载和执行。为此,本申请实施例提供一种存储介质,其中存储有计算机程序,计算机程序可以包括计算机指令,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种对象意向预测方法。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种对象意向预测方法中的步骤,因此,可以实现本申请实施例所提供的任一种对象意向预测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种对象意向预测方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种对象意向预测方法,其特征在于,包括:
获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征;
根据所述M个第一特征和所述N个第二特征,得到K个初始特征;
通过预测模型,基于每个初始特征的不同特征取值对预测结果的影响,将每一初始特征编码为第一编码特征和第二编码特征,所述第一编码特征表征所述初始特征的不同特征取值的共有部分,用于建立不同取值间的联系,所述第二编码特征表征所述初始特征的不同特征取值的差异部分;
根据每一初始特征的第一编码特征和第二编码特征,通过所述预测模型得到每一初始特征的目标编码特征,所述目标编码特征用于表征所述初始特征的不同特征取值;
根据每一初始特征的第二编码特征,通过所述预测模型,确定每一目标编码特征的目标特征缩放参数;
根据每一目标特征缩放参数,通过所述预测模型,得到每一目标编码特征的目标缩放特征,以实现在特征值粒度上进行特征选择;
根据K个目标缩放特征,通过所述预测模型进行意向预测,得到所述操作对象针对所述被操作对象执行预设操作的操作意向。
2.根据权利要求1所述的对象意向预测方法,其特征在于,所述K个初始特征包括所述M个第一特征和所述N个第二特征,或所述K个初始特征包括所述M个第一特征、所述N个第二特征以及P个融合特征,所述融合特征是由一个所述第一特征和一个所述第二特征融合得到。
3.根据权利要求1所述的对象意向预测方法,其特征在于,所述通过预测模型,将每一初始特征编码为第一编码特征和第二编码特征之前,所述方法还包括:
获取样本操作对象的M个样本第一特征、样本被操作对象的N个样本第二特征,以及获取所述样本操作对象针对所述样本被操作对象执行预设操作的操作意向标签;
根据所述M个样本第一特征和所述N个样本第二特征,得到K个样本初始特征;
通过预测模型,将每一样本初始特征编码为样本第一编码特征和样本第二编码特征,所述样本第一编码特征表征所述样本初始特征的不同特征取值的共有部分,所述样本第二编码特征表征所述样本初始特征的不同特征取值的差异部分;
根据每一样本初始特征的样本第一编码特征和样本第二编码特征,通过所述预测模型得到每一样本初始特征的样本目标编码特征,所述样本目标编码特征用于表征所述样本初始特征的不同特征取值;
根据每一样本初始特征的样本第二编码特征,通过所述预测模型,确定每一样本目标编码特征的样本目标特征缩放参数;
根据每一样本目标特征缩放参数,通过所述预测模型,得到每一样本目标编码特征的样本目标缩放特征;
根据K个样本目标缩放特征,通过所述预测模型进行意向预测,得到所述样本操作对象针对所述样本被操作对象执行预设操作的样本操作意向;
根据所述样本操作意向和所述操作意向标签的差异,更新所述预测模型的网络参数,直至满足预设停止条件。
4.根据权利要求3所述的对象意向预测方法,其特征在于,所述根据K个样本目标缩放特征,通过所述预测模型进行意向预测,得到所述样本操作对象针对所述样本被操作对象执行预设操作的样本操作意向,包括:
通过所述预测模型,对所述K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征;
根据所述K'个处理后样本特征,通过所述预测模型进行意向预测,得到所述样本操作对象针对所述样本被操作对象执行预设操作的样本操作意向。
5.根据权利要求4所述的对象意向预测方法,其特征在于,所述通过所述预测模型,对所述K个样本目标缩放特征进行特征丢弃处理,得到K'个处理后样本特征,包括:
根据每一样本目标缩放特征对应的样本目标特征缩放参数,通过所述预测模型,确定每一样本目标缩放特征的特征丢弃概率,所述特征丢弃概率和所述样本目标特征缩放参数正相关;
根据每一样本目标缩放特征的特征丢弃概率,通过预测模型,对每一样本目标缩放特征进行特征丢弃处理,得到每一样本目标缩放特征的处理后样本特征。
6.根据权利要求1至5任一项所述的对象意向预测方法,其特征在于,所述获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征,包括:
接收终端发送的意向评估请求;
获取所述意向评估请求指示的操作对象的M个第一特征,以及获取所述意向评估请求指示的被操作对象的N个第二特征;
所述根据K个目标缩放特征,通过所述预测模型进行意向预测,得到所述操作对象针对所述被操作对象执行预设操作的操作意向之后,所述方法还包括:
将所述操作意向返回给所述终端。
7.根据权利要求6所述的对象意向预测方法,其特征在于,所述操作对象为多个,所述将所述操作意向返回给所述终端,包括:
按照操作意向从高至低的顺序,对多个操作对象对应的操作意向进行排序,得到排序结果;
将所述排序结果返回给所述终端,所述排序结果用于所述终端展示。
8.根据权利要求1至5任一项所述的对象意向预测方法,其特征在于,所述操作对象为多个,所述根据K个目标缩放特征,通过所述预测模型进行意向预测,得到所述操作对象针对所述被操作对象执行预设操作的操作意向之后,所述方法还包括:
从多个操作对象中筛选出操作意向大于操作意向阈值的目标操作对象;
向所述目标操作对象推送所述被操作对象的操作信息。
9.一种对象意向预测装置,其特征在于,包括:
第一获取单元,用于获取操作对象的M个第一特征,以及获取被操作对象的N个第二特征;
第二获取单元,用于根据所述M个第一特征和所述N个第二特征,得到K个初始特征;
特征编码单元,用于通过预测模型,基于每个初始特征的不同特征取值对预测结果的影响,将每一初始特征编码为第一编码特征和第二编码特征,以及根据每一初始特征的第一编码特征和第二编码特征,通过所述预测模型得到每一初始特征的目标编码特征,所述第一编码特征表征所述初始特征的不同特征取值的共有部分,用于建立不同取值间的联系,所述第二编码特征表征所述初始特征的不同特征取值的差异部分,所述目标编码特征用于表征所述初始特征的不同特征取值;
特征缩放单元,用于根据每一初始特征的第二编码特征,通过所述预测模型,确定每一目标编码特征的目标特征缩放参数,以及根据每一目标特征缩放参数,通过所述预测模型,得到每一目标编码特征的目标缩放特征,以实现在特征值粒度上进行特征选择;
意向预测单元,用于根据K个目标缩放特征,通过所述预测模型进行意向预测,得到所述操作对象针对所述被操作对象执行预设操作的操作意向。
10.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至8任一项所述的对象意向预测方法。
11.一种存储介质,其特征在于,所述存储介质用于存储计算机程序,所述计算机程序被处理器加载以执行权利要求1至8任一项所述的对象意向预测方法。
CN202310935825.1A 2023-07-28 2023-07-28 对象意向预测方法、装置、计算机设备及存储介质 Active CN116662814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310935825.1A CN116662814B (zh) 2023-07-28 2023-07-28 对象意向预测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310935825.1A CN116662814B (zh) 2023-07-28 2023-07-28 对象意向预测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN116662814A CN116662814A (zh) 2023-08-29
CN116662814B true CN116662814B (zh) 2023-10-31

Family

ID=87717424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310935825.1A Active CN116662814B (zh) 2023-07-28 2023-07-28 对象意向预测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116662814B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160409A (zh) * 2019-12-11 2020-05-15 浙江大学 一种基于共同特征学习的异构神经网络知识重组方法
CN111681059A (zh) * 2020-08-14 2020-09-18 支付宝(杭州)信息技术有限公司 行为预测模型的训练方法及装置
WO2021151296A1 (zh) * 2020-07-22 2021-08-05 平安科技(深圳)有限公司 多任务分类方法、装置、计算机设备及存储介质
CN114049529A (zh) * 2021-09-22 2022-02-15 北京小米移动软件有限公司 用户行为预测方法、模型训练方法、电子设备及存储介质
CN115237732A (zh) * 2022-06-30 2022-10-25 华为技术有限公司 一种操作预测方法及相关装置
CN115618271A (zh) * 2022-05-05 2023-01-17 腾讯科技(深圳)有限公司 对象类别识别方法、装置、设备及存储介质
CN115795153A (zh) * 2022-11-28 2023-03-14 杭州电子科技大学 一种基于特征交互和分数集成的ctr推荐方法
WO2023061087A1 (zh) * 2021-10-12 2023-04-20 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN116204709A (zh) * 2022-12-30 2023-06-02 华为技术有限公司 一种数据处理方法及相关装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160409A (zh) * 2019-12-11 2020-05-15 浙江大学 一种基于共同特征学习的异构神经网络知识重组方法
WO2021151296A1 (zh) * 2020-07-22 2021-08-05 平安科技(深圳)有限公司 多任务分类方法、装置、计算机设备及存储介质
CN111681059A (zh) * 2020-08-14 2020-09-18 支付宝(杭州)信息技术有限公司 行为预测模型的训练方法及装置
CN114049529A (zh) * 2021-09-22 2022-02-15 北京小米移动软件有限公司 用户行为预测方法、模型训练方法、电子设备及存储介质
WO2023061087A1 (zh) * 2021-10-12 2023-04-20 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN115618271A (zh) * 2022-05-05 2023-01-17 腾讯科技(深圳)有限公司 对象类别识别方法、装置、设备及存储介质
CN115237732A (zh) * 2022-06-30 2022-10-25 华为技术有限公司 一种操作预测方法及相关装置
CN115795153A (zh) * 2022-11-28 2023-03-14 杭州电子科技大学 一种基于特征交互和分数集成的ctr推荐方法
CN116204709A (zh) * 2022-12-30 2023-06-02 华为技术有限公司 一种数据处理方法及相关装置

Also Published As

Publication number Publication date
CN116662814A (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN113626719B (zh) 信息推荐方法、装置、设备、存储介质及计算机程序产品
Ralha et al. A multi-agent data mining system for cartel detection in Brazilian government procurement
Wang et al. Perceiving the next choice with comprehensive transaction embeddings for online recommendation
CN110209922A (zh) 对象推荐方法、装置、存储介质及计算机设备
CN111506820B (zh) 推荐模型、方法、装置、设备及存储介质
CN115917535A (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN114282681A (zh) 多任务处理及模型的训练方法、装置、介质及设备
CN112182362A (zh) 训练用于在线预测点击率的模型的方法、设备及推荐系统
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN110245310B (zh) 一种对象的行为分析方法、装置及存储介质
CN114330704A (zh) 语句生成模型更新方法、装置、计算机设备和存储介质
Jeejoe et al. Building a Recommender System Using Collaborative Filtering Algorithms and Analyzing its Performance
CN116662814B (zh) 对象意向预测方法、装置、计算机设备及存储介质
CN116340643A (zh) 对象推荐的调整方法及装置、存储介质、电子设备
CN117033760A (zh) 一种对象推荐方法、装置、设备、存储介质及程序产品
CN113254788B (zh) 一种基于大数据的推荐方法、系统及可读存储介质
CN115879508A (zh) 一种数据处理方法及相关装置
CN116205700A (zh) 目标产品的推荐方法、装置、计算机设备和存储介质
CN116764236A (zh) 游戏道具推荐方法、装置、计算机设备和存储介质
Wang et al. Multiscale Information Diffusion Prediction With Minimal Substitution Neural Network
CN112488355A (zh) 基于图神经网络预测用户评级的方法和装置
Pinnapareddy Deep Learning Based Recommendation Systems
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN116881575B (zh) 内容推送方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant