CN117195957A - 预测模型的确定方法和相关装置 - Google Patents

预测模型的确定方法和相关装置 Download PDF

Info

Publication number
CN117195957A
CN117195957A CN202210583176.9A CN202210583176A CN117195957A CN 117195957 A CN117195957 A CN 117195957A CN 202210583176 A CN202210583176 A CN 202210583176A CN 117195957 A CN117195957 A CN 117195957A
Authority
CN
China
Prior art keywords
probability
prediction model
sample
loss function
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210583176.9A
Other languages
English (en)
Inventor
石志林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210583176.9A priority Critical patent/CN117195957A/zh
Publication of CN117195957A publication Critical patent/CN117195957A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了预测模型的确定方法和相关装置,第一对象特征为对象点击物品前获取的对象特征,可以用于离线预测和在线预测,第二对象特征为对象点击物品后获取的对象特征,只能用于离线预测。为了学习第二对象特征,将物品特征、第一对象特征和第二对象特征作为输入,通过用于离线预测对象点击物品概率的第一预测模型,得到对象点击物品的第一概率。为了能够实现在线预测,将物品特征和第一对象特征输入至初始第二预测模型,得到对象点击物品的第二概率,为了能够在在线预测的同时学习到第二对象特征,根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。通过第二预测模型可以预测广告的点击率。

Description

预测模型的确定方法和相关装置
技术领域
本申请涉及互联网技术领域,特别是涉及一种预测模型的确定方法和相关装置。
背景技术
近年来,推荐技术在电商、广告等领域得到了快速发展,并为其创造了不可估量的价值。
相关技术中,推荐技术通常是基于推荐模型来实现的。具体,对象打开物品所在的展示页面后,通过用于表征对象特点的对象特征、用于表征物品特点的物品特征,以及推荐模型预测该对象对物品的点击率等指标。以应用人工智能的广告领域为例,对象打开带有广告的展示页面后,推荐模型能够预测对象针对广告的点击率,进而可以通过点击率确定广告投放效果。
但是该种推荐模型的准确性较低。
发明内容
为了解决上述技术问题,本申请提供了一种预测模型的确定方法和相关装置,用于提高点击率预测的准确性。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供一种预测模型的确定方法,所述方法包括:
获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
将所述物品特征、所述第一对象特征和所述第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到所述对象点击所述物品的第一概率;将所述物品特征和所述第一对象特征输入至初始第二预测模型中,得到所述对象点击所述物品的第二概率;
根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
另一方面,本申请实施例提供一种预测模型的确定方法,所述方法包括:
获取对象针对物品产生的行为数据;其中,所述行为数据包括观测样本,所述观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,所述样本最大回传窗口与所述样本最小回传窗口的起点均为所述对象点击所述物品的时间,所述样本最大回传窗口的长度大于所述样本最小回传窗口的长度;
根据所述观测样本,通过第三预测模型得到所述观测样本的转化结果为未回传转化样本的第三概率;其中,所述第三预测模型为根据历史观测样本与所述历史观测样本的转化结果训练得到的;
根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率;
根据所述第三概率和所述第四概率训练所述初始第四预测模型,得到用于在线预测所述对象针对所述物品执行转化行为概率的第四预测模型。
另一方面,本申请实施例提供一种预测模型的确定装置,所述装置包括:特征获取单元、概率获取单元和训练单元;
所述特征获取单元,用于获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
所述概率获取单元,用于将所述物品特征、所述第一对象特征和所述第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到所述对象点击所述物品的第一概率;将所述物品特征和所述第一对象特征输入至初始第二预测模型中,得到所述对象点击所述物品的第二概率;
所述训练单元,用于根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
另一方面,本申请实施例提供一种预测模型的确定装置,所述装置包括:数据获取单元、第三概率获取单元、第四概率获取单元和训练单元;
所述数据获取单元,用于获取对象针对物品产生的行为数据;其中,所述行为数据包括观测样本,所述观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,所述样本最大回传窗口与所述样本最小回传窗口的起点均为所述对象点击所述物品的时间,所述样本最大回传窗口的长度大于所述样本最小回传窗口的长度;
所述第三概率获取单元,用于根据所述观测样本,通过第三预测模型得到所述观测样本的转化结果为未回传转化样本的第三概率;其中,所述第三预测模型为根据历史观测样本与所述历史观测样本的转化结果训练得到的;
所述第四概率获取单元,用于根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率;
所述训练单元,用于根据所述第三概率和所述第四概率训练所述初始第四预测模型,得到用于在线预测所述对象针对所述物品执行转化行为概率的第四预测模型。
另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
所述处理器用于根据所述计算机程序中的指令执行上述方面所述的方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。
由上述技术方案可以看出,获取物品对应的物品特征、对象对应的第一对象特征和第二对象特征。其中,第一对象特征为对象点击物品前获取的对象特征,可以用于离线预测和在线预测,第二对象特征为对象点击物品后获取的对象特征,只能用于离线预测。为了学习第二对象特征,将物品特征、第一对象特征和第二对象特征作为输入,通过用于离线预测对象点击物品概率的第一预测模型,得到对象点击物品的第一概率。为了能够实现在线预测,将物品特征和第一对象特征输入至初始第二预测模型,得到对象点击物品的第二概率,为了能够在在线预测的同时学习到第二对象特征,根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。由此,不仅将物品特征和第一对象特征作为初始第二预测模型的输入,还在训练初始第二预测模型的过程中,引入第一预测模型得到的第一概率,使得初始第二预测模型通过第一概率学习第一预测模型的模型参数,从而间接利用第二对象特征提升第二预测模型的预测准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种预测模型的确定系统的示意图;
图2为本申请实施例提供的一种预测模型的确定方法的流程图;
图3为本申请实施例提供的一种预测模型的确定方法的流程图;
图4为本申请实施例提供的一种预测模型的确定方法的应用场景示意图;
图5为本申请实施例提供的一种预测模型的确定装置的结构示意图;
图6为本申请实施例提供的一种预测模型的确定装置的结构示意图;
图7为本申请实施例提供的服务器的结构示意图;
图8为本申请实施例提供的终端设备的结构示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
由于相关技术中推荐模型是实时预测的,即在对象点击页面中物品之前预测用户的点击率,使得推荐模型无法利用到对象点击物品后的特征,如对象在点击页面后的各种行为、访问时长等特征,导致推荐模型无法获取较多的特征,使得通过推荐模型预测得到的点击率的准确性较低。
基于此,本申请实施例提供一种预测模型的确定方法,结合对象点击物品后获取的对象特征,训练得到用于在线预测对象点击物品概率的第二预测模型。
该方法应用于图1所示的预测模型的确定系统,如图所示,预测模型的确定系统包括服务器和终端设备,其中,终端设备具体可以为手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端、飞行器等,但并不局限于此;服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
示例性地,对象通过终端设备打开物品所在页面,终端设备采集对象的行为数据,并将其发送服务器,服务器通过行为数据获取物品对应的物品特征、对象对应的第一对象特征和对象对应的第二对象特征;其中,第一对象特征为对象点击物品前获取的对象特征,第二对象特征为对象点击物品后获取的对象特征。服务器将物品特征、第一对象特征和第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到对象点击物品的第一概率;将物品特征和第一对象特征输入至初始第二预测模型中,得到对象点击物品的第二概率;根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
本申请实施例所提供的预测模型的确定方法可以由服务器执行。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的预测模型的确定方法,或者由终端设备和服务器共同执行本申请实施例所提供的预测模型的确定方法,本实施例对此不做限定。
本申请实施例提供的预测模型的确定方法还可以基于云技术实现。云技术(Cloudtechnology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术(Cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
在本申请实施例提供的预测模型的确定方法中,主要涉及对云技术中的人工智能云服务。所谓人工智能云服务,一般也被称作是AIaaS(AI as a Service,中文为“AI即服务”)。这是目前主流的一种人工智能平台的服务方式,具体来说AIaaS平台会把几类常见的人工智能(Artificial Intelligence,AI)服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过应用程序编程接口(Application Programming Interface,API)的方式来接入使用平台提供的一种或者是多种人工智能服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。
其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
在本申请实施例中,主要涉及的人工智能技术包括上述机器学习/深度学习等方向。机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络等技术。
在本申请实施例提供的预测模型的确定方法中,采用的人工智能模型主要涉及对机器学习的应用,通过人工神经网络等技术训练得到预测模型。
下面结合附图,以服务器作为预测模型的确定设备,对本申请实施例提供的一种预测模型的确定方法进行介绍。
参见图2,该图为本申请实施例提供的一种预测模型的确定方法的流程图。如图2所示,该预测模型的确定方法包括以下步骤:
S201:获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征。
以广告推荐领域为例,如用户(即对象)打开带有广告(即物品)的展示页面后,相关技术中的推荐模型根据对象特征和广告特征预测对象针对广告的点击率,由于推荐模型是实时预测,故推荐模型无法利用对象点击物品后的特征,导致推荐模型准确性较低。
基于此,本申请实施例推荐模型不仅获取对象点击物品前的对象特征(即第一对象特征),还获取对象点击物品后的对象特征(即第二对象特征),以及物品对应的物品特征。
其中,物品特征用于描述物品的特点,可以是物品标识、物品类别、物品品牌等一种或多种组合。以物品为广告为例,物品特征可以是广告类型、广告时长等。
第一对象特征为对象点击物品前获取的对象特征,可以是对象基础属性特征、兴趣特征等一种或多种组合。以用户为对象为例,第一对象特征可以是用户年龄、用户性别、用户学历等。
第二对象特征为对象点击物品后获取的对象特征,可以是行为序列等。以用户为对象为例,第二对象特征可以是用户先点击广告A、再点击广告B构成的行为序列特征。
作为一种可能实现方式,还可以获取如访问的上下文信息、时间、机型等上下文特征。继续以广告为例,上下文信息可以为广告的观看时间、观看位置等。以便后续将上下文信息与物品特征等特征共同输入至预测模型中,以丰富预测模型在训练过程学习的信息。
S202:将物品特征、第一对象特征和第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到对象点击物品的第一概率;将物品特征和第一对象特征输入至初始第二预测模型中,得到对象点击物品的第二概率。
相关技术中,为了有效利用对象点击物品后特征,一般会通过两种方式实现。方式一:针对对象点击物品后的特征再建立一个预测模型,但是由于该种方式存在两个预测模型,通过两个预测模型得到的针对点击率的预测结果不好融合。方式二:通过多任务建模方式分别对对象点击物品前后的特征进行处理,但是由于底层参数共享,故不同任务间会互相干扰,从而影响预测结果。
基于此,本申请实施例构建两个预测模型,即第一预测模型和第二预测模型,其中,第一预测模型用于离线预测对象点击物品概率,第二预测模型用于在线预测对象点击物品的概率。在训练过程中,第一预测模型和第二预测模型的学习目标是相关联的,得到的预测结果能够较好的融合,且第一预测模型和第二预测模型的底层参数不共享,避免了由于相互干扰导致的预测结果不准确的问题。
下面分别对第一预测模型和第二预测模型的训练过程进行说明。
第一预测模型能够在离线状态下预测对象点击物品的概率,由此,第一预测模型可以利用到对象点击物品后获取的特征,即第二对象特征。在训练第一预测模型的过程中,可以获取对象点击物品对应的训练样本,训练样本具有对象点击物品的标签,即对象点击物品或对象未点击物品,然后将训练样本对应的物品特征、第一对象特征和第二对象特征作为输入,通过初始第一预测模型,得到对象点击物品的第一概率,然后基于第一概率和标签结果调整初始第一预测模型,进而得到训练好的第一预测模型。需要说明的是,若标签结果是对象点击物品,则可以看作对象点击物品的概率为100%,若标签结果是对象未点击物品,则可以看作对象点击物品的概率为0%。需要说明的是,相比于第一预测模型,初始第一预测模型是模型参数还未训练好的预测模型,还需要再进行训练。
第二预测模型能够在在线状态下预测对象点击物品的概率,故第二预测模型无法利用到对象点击物品后获取的特征,即第二对象特征。只能够将物品特征和第一对象作为第二预测模型的输入,以便通过第二预测模型得到对象点击物品的第二概率。故在对第二预测模型进行训练的过程中,将物品特征和第一对象特征作为输入,输入至初始第二预测模型中,得到对象点击物品的第二概率。需要说明的是,相比于第二预测模型,初始第二预测模型是模型参数还未训练好的预测模型,还需要再进行训练。
S203:根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
本申请实施例需要的是能够在线预测对象点击物品概率的预测模型,由于在线预测无法得到第二对象特征,故通过第一预测模型学习第二对象特征,通过第二预测模型学习第一预测模型的模型参数。为了让初始第二预测模型能够学习到第二对象特征,且第一预测模型和第二预测模型得到的预测结果能够较好的融合到一起,在训练初始第二预测模型的过程中,基于第一概率和第二概率训练初始第二预测模型,得到第二预测模型。由此,通过引入第一概率训练初始第二预测模型,使得初始第二预测模型学习第一预测模型的模型参数,从而间接利用第二对象特征提升第二预测模型的预测准确性。
作为一种可能的实现方式,第一预测模型和第二预测模型的模型结构相同,但是二者输入不同,模型参数不同。第一预测模型的输入增加了第二对象特征,第二预测模型通过第一概率学习第一预测模型,以便接利用第二对象特征提升第二预测模型的预测准确性。
由上述技术方案可知,获取物品对应的物品特征、对象对应的第一对象特征和第二对象特征。其中,第一对象特征为对象点击物品前获取的对象特征,可以用于离线预测和在线预测,第二对象特征为对象点击物品后获取的对象特征,只能用于离线预测。为了学习第二对象特征,将物品特征、第一对象特征和第二对象特征作为输入,通过用于离线预测对象点击物品概率的第一预测模型,得到对象点击物品的第一概率。为了能够实现在线预测,将物品特征和第一对象特征输入至初始第二预测模型,得到对象点击物品的第二概率,为了能够在在线预测的同时学习到第二对象特征,根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。由此,不仅将物品特征和第一对象特征作为初始第二预测模型的输入,还在训练初始第二预测模型的过程中,引入第一预测模型得到的第一概率,使得初始第二预测模型通过第一概率学习第一预测模型的模型参数,从而间接利用第二对象特征提升第二预测模型的预测准确性。
为了方便说明,下面以交叉熵函数作为预测模型的损失函数、预测模型为多层神经网络结构为例,对预测模型进行说明。
(1)第一预测模型。
第一预测模型的输出可以表示为ft(Xu,Xc,Xi),计算过程如下所示:
其中,ft表示第一预测模型,Xu表示第一对象特征,Xc表示第二对象特征,Xi表示物品特征,Wu表示对象侧模型参数,Wi表示物品侧模型参数,表示对象侧模型的输出向量,/>表示物品侧模型的输出向量,<>表示内积。
第一预测模型的损失函数如下所示:
Lt=Ft(y-ft(Xu,Xc,Xi))
其中,Lt表示第一损失函数,Ft表示交叉熵损失函数,ft(Xu,Xc,Xi)表示第一预测模型的输出,y为标签结果,若标签结果是对象点击物品,则可以看作对象点击物品的概率为100%,若标签结果是对象未点击物品,则可以看作对象点击物品的概率为0%。
(2)第二预测模型。
第一预测模型与第二预测模型的模型结构相同。第一预测模型为离线使用的模型,输入为物品特征、第一对象特征和第二对象特征。第二预测模型为在线使用的模型,输入为物品特征和第二对象特征。
第二预测模型的输出可以表示为fs(Xu,Xi),其中,fs表示第二预测模型,Xu表示第一对象特征。
第二预测模型的损失函数如下所示:
Ls=Fs(y-fs(Xu,Xi))
其中,Ls表示第二损失函数,Fs表示交叉熵损失函数,fs(Xu,Xi)表示第二预测模型的输出,y为标签结果。
作为一种可能的实现方式,本申请实施例提供一种S203,即根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型的具体实现方式,具体包括S2031-S2033。
S2031:根据第一概率和真实概率确定第一损失函数,根据第二概率和真实概率确定第二损失函数。
其中,真实概率为对象点击物品实际产生的结果对应的概率。以训练样本为例,真实概率是对象点击物品的标签结果(y),若标签结果是对象点击物品,则可以看作对象点击物品的概率为100%,若标签结果是对象未点击物品,则可以看作对象点击物品的概率为0%。
S2032:根据第一损失函数和第二损失函数确定第三损失函数。
下面介绍三种确定第三损失函数的确定方式。
第一种:根据第一损失函数、第二损失函数和调节参数确定第三损失函数。其中,调节参数用于调节第一损失函数和第二损失函数对第三损失函数的影响,从而调节初始第二预测模型学习第一预测模型的程度。
若第一损失函数如Lt所示,第二损失函数如Ls所示,第三损失函数可以表示如下:
Ls*=(1-λ)*Lt+λ*Ls
其中,Ls*表示第三损失函数,λ表示调节参数,Lt表示第一损失函数,Ls表示第二损失函数。
由此,第二预测模型通过学习第一预测模型的损失函数,使得第一预测模型和第二预测模型有关联的学习目标,进而实现更好的融合。
第二种:根据第一损失函数和第二损失函数确定第一预测模型与初始第二预测模型间的距离;根据第一损失函数、第二损失函数、调节参数和距离确定第三损失函数。
若第一损失函数如Lt所示,第二损失函数如Ls所示,第一预测模型与初始第二预测模型间的距离可以表示如下:
Ld=Fd(ft(Xu,Xc,Xi)-ft(Xu,Xi))
其中,Ld表示第一预测模型与初始第二预测模型间的距离,Fd表示距离函数,如曼哈顿距离函数、余弦距离函数等,ft(Xu,Xc,Xi)表示第一预测模型的输出,ft(Xu,Xi)表示初始第二预测模型的输出。
第三损失函数可以表示如下:
Ls*=(1-λ)*Lt+λ*Ls+Ld
其中,Ls*表示第三损失函数,λ表示调节参数,Lt表示第一损失函数,Ls表示第二损失函数,Ld表示第一预测模型与初始第二预测模型间的距离。
由此,若第一预测模型和第二预测模型的距离越近,证明第二预测模型与第一预测模型越相似,即第二预测模型对第一预测模型的模型参数学习的越好。
第三种:根据第一损失函数和第二损失函数确定第一预测模型与初始第二预测模型间的距离;根据第一损失函数和距离确定第三损失函数。
若第一损失函数如Lt所示,第二损失函数如Ls所示,第一预测模型与初始第二预测模型间的距离可以表示如下:
Ld=Fd(ft(Xu,Xc,Xi)-ft(Xu,Xi))
其中,Ld表示第一预测模型与初始第二预测模型间的距离,Fd表示距离函数,如曼哈顿距离函数、余弦距离函数等,ft(Xu,Xc,Xi)表示第一预测模型的输出,ft(Xu,Xi)表示初始第二预测模型的输出。
第三损失函数可以表示如下:
Ls*=Lt+Ld
其中,Ls*表示第三损失函数,Lt表示第一损失函数,Ld表示第一预测模型与初始第二预测模型间的距离。
S2033:基于最小化第三损失函数训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
通过最小化第三损失函数,能够保证初始第二预测模型能够尽可能学习第一预测模型的模型参数,从而间接利用第二对象特征,在保证能够学习到第二对象特征的同时,实现在线预测对象点击物品的概率,提高点击率预测的准确性。
作为一种可能的实现方式,前述所述调节参数能在初始训练的前几轮(如迭代次数小于K次)设置为0,在后续训练轮次(如迭代次数大于或等于K次)中设置为固定的值,如λ值范围取[0.5,1],从而加快学习速度。
作为一种可能的实现方式,在初始第一预测模型的训练过程中,初始第一预测模型的参数更新可以表示如下:
其中,Wt表示初始第一预测模型的模型参数,表示初始第一预测模型的参数梯度,η表示参数更新步长,又称学习速率,Lt表示第一损失函数。
作为一种可能的实现方式,在初始第二预测模型的训练过程中,可以根据迭代次数对模型参数进行更新,从而加快收敛,提高模型的训练速度。
若迭代次数小于预设迭代阈值,根据学习速率、初始第二预测模型的参数梯度和第二损失函数,更新初始第二预测模型的参数。初始第二预测模型的参数更新可以表示如下:
其中,Ws表示初始第二预测模型的模型参数,表示初始第二预测模型的参数梯度,η表示参数更新步长,又称学习速率,Ls表示第二损失函数。
若迭代次数大于或等于预设迭代阈值,根据学习速率、初始第二预测模型的参数梯度和第三损失函数,更新初始第二预测模型的参数,直至初始第二预测模型迭代N次,或者初始第二预测模型实现收敛。初始第二预测模型的参数更新可以表示如下:
其中,Ws表示初始第二预测模型的模型参数,表示初始第二预测模型的参数梯度,η表示参数更新步长,又称学习速率,Ls*表示第三损失函数。
对于物品推荐,除了需要预测点击率外,还可以预测转化率。需要说明的是,点击率为物品被点击的次数与物品被展示次数的比值,转化率为产生转化行为的对象数量与浏览物品的对象数量。转化行为包括下载、付费、咨询等行为。
相关技术中,一般采集对象针对物品的行为数据训练得到推荐模型,但是该推荐模型得到的转化率的准确性较低。经过研究发现,从对象点击物品到产生转化行为往往需要等待一段时间,可能是几个小时,也可能是很多天。另外,即使对象产生转化行为后,如广告主等物品推广方也需要一定的时间才会回传行为数据,才能够利用行为数据训练推荐模型。但是,在回传行为数据之前,这部分数据会作为负样本(即该数据的样本标签为没有转化)对推荐模型进行训练,但是该部分数据中存在虽然回传之前被标记为负样本,而回传后被标记为正样本(即该数据的样本标签为已转化)的数据。也就是说,由于行为数据中存在回传延迟等问题,导致训练推荐模型的训练样本的标签准确性较低,进而导致推荐模型对转化率预测的准确性较低。
基于此,本申请实施例提供一种模型训练方法,通过修正观测样本的转化结果,即用于预测转化率的第四预测模型的输入,提高第四预测模型预测转化率的准确性。
为了方便后续说明,下面对本申请实施例涉及的一些名词进行说明。
(1)样本回传窗口:起点为对象点击物品的时间,终点为对象针对物品产生转化行为的时间,样本回传窗口的长度为对象针对物品的转化行为距离对象点击物品的时间。
(2)模型选择样本窗口:可以表示为w,第四预测模型选择的样本回传窗口,起点为对象点击物品的时间,长度为根据实际需要设置。需要说明的是,为了保证模型的实时性,不能选择太长的窗口作为模型选择窗口,通常为1-3天。
(3)样本最小回传窗口:可以表示为w1,起点为对象点击物品的时间,长度为根据实际需要设置,可以设置为10分钟,所有的样本回传窗口必须大于w1才会加入第四预测模型作为训练样本。
(4)样本最大回传窗口:可以表示为w2,起点为对象点击物品的时间,即与样本最小回传窗口一样,长度为根据实际需要设置,但是样本最大回传窗口的长度大于样本最小回传窗口的长度,可以设置为30天,经过w2后基本所有的样本都已经回传。
(5)转化结果:对象点击物品后,是否会继续产生转化行为,可以表示为y。例如,y=1表示正样本(已经转化的样本),y=0表示负样本(未转化的样本)。
(6)未转化样本:经过样本最大回传窗口后,还没有检测到转化行为的数据,可以表示为y=0|w>w2
(7)未回传转化样本:在经过样本最小回传窗口后,且在样本最大回传窗口内没有检测到转化行为,但最终,即在样本最大回传窗口外检测到了转化行为的数据,可以表示为y=0|w1<w<w2、y=1|w>w2
下面结合附图,以服务器作为预测模型的确定设备,对本申请实施例提供的一种预测模型的确定方法进行介绍。
参见图3,该图为本申请实施例提供的一种预测模型的确定方法的流程图。如图3所示,该预测模型的确定方法包括以下步骤:
S301:获取对象针对物品产生的行为数据。
由前述可知,由于行为数据中存在回传延迟等问题,导致训练推荐模型的训练样本的标签准确性较低,进而导致推荐模型对转化率预测的准确性较低。故本申请实施例针对训练样本中没回传之前未转化、但是回传之后转化的样本,即未回传转化样本进行修正,使其在训练预测模型时,不再作为负样本进行训练。
行为数据是对象针对物品做出行为产生的数据,如对象点击物品、对象购买物品等产生的数据。行为数据包括两种类型的数据:观测样本和真实样本。
其中,真实样本为不处于样本最大回传窗口内的数据,可以表示为处于w>w2的样本。观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,可以表示为处于w1<w<w2的样本。由于在实际业务中为了保证预测模型的实时性,模型选择样本窗口的长度不会太长,故观测样本中包括未回传转化样本。
故为了避免观测样本中未回传转化样本被当做负样本训练模型,本申请实施例将通过第三预测模型预测观测样本的转化结果,下面具体进行说明。
S302:根据观测样本,通过第三预测模型得到观测样本的转化结果为未回传转化样本的第三概率。
其中,第三预测模型为根据历史观测样本与历史观测样本的转化结果训练得到的。相比于观测样本,历史观测样本是具有标签的观测样本,标签是观测样本的转化结果,转化结果具有两种:历史观测样本为未回传转化样本(第三概率为100%)或历史观测样本为未回传未转化样本(第三概率为0%)。历史观测样本用于训练初始第三预测模型得到第三预测模型,以便第三预测模型能够根据观测样本得到观测样本的转化结果为未回传转化样本的第三概率。需要说明的是,相比于第三预测模型,初始第三预测模型是模型参数还未训练好的预测模型,还需要再进行训练。
本申请实施例不具体限定第三预测模型的训练过程,下面以有监督训练的方式为例进行说明,参见S3021-S3023。
S3021:确定历史观测样本的转化结果。
由前述可知,观测样本中存在未回传转化样本,需要识别观测样本中的未回传转化样本,故历史观测样本的转化结果包括未回传转化样本和未回传未转化样本。
其中,未回传转化样本为在样本最大回传窗口内没有转化、且在样本最大回传窗口外转化的样本,可以表示为y=0|w1<w<w2、y=1|w>w2
未回传未转化样本为在样本最大回传窗口外未转化的样本,可以表示为y=0|w1<w<w2、y=0|w>w2,还可以简化成y=0|w>w2进行表示。未回传未转化样本作为负样本不会影响模型的准确性,只有未回传转化样本才会影响模型的准确性。
S3022:根据历史观测样本和初始第三预测模型,确定历史观测样本的预测转化结果。
可以将历史观测样本输入至初始第三预测模型中,确定历史观测样本的预测转化结果。还可以根据历史观测样本获取物品特征、第一对象特征、第二对象特征、上下文特征等中的一种或多种组合,将特征输入至初始第三预测模型中,以便其学习未回传转化样本的特点,从而确定出历史观测样本的预测转化结果。
本申请实施例不具体限定初始第三预测模型,其可以为神经网络模型,还可以为通过函数拟合等方式建模得到的模型。
S3023:根据预测转化结果和历史观测样本的转化结果的差异训练初始第三预测模型,得到用于预测转化结果为未回传转化样本的概率的第三预测模型。
将历史观测样本的转化结果作为基准,调整初始第三预测模型,使其输出的预测转化结果越来越接近历史观测样本的转化结果。从而的得到用于预测转化结果为未回传转化样本的概率的第三预测模型。
S303:根据行为数据和初始第四预测模型,得到对象针对物品产生转化行为的第四概率。
作为一种可能的实现方式,可以将行为数据直接输入至初始第四预测模型中,得到对象针对物品产生转化行为的第四概率。
作为一种可能的实现方式,根据行为数据获取物品对应的物品特征、对象对应的第一对象特征和对象对应的第二对象特征;其中,第一对象特征为对象点击物品前获取的对象特征,第二对象特征为对象点击物品后获取的对象特征;将物品特征、第一对象特征和第二对象特征输入至初始第四预测模型中,得到对象针对物品产生转化行为的第四概率。
作为一种可能的实现方式,还可以根据行为数据获取物品特征、第一对象特征、第二对象特征、上下文特征等中的一种或多种组合,将特征输入至初始第四预测模型中,以便其学习转化样本的特点,从而确定出对象针对物品产生转化行为的第四概率。需要说明的是,相比于第四预测模型,初始第四预测模型是模型参数还未训练好的预测模型,还需要再进行训练。
S304:根据第三概率和第四概率训练初始第四预测模型,得到用于在线预测对象针对物品执行转化行为概率的第四预测模型。
由于相关技术中,并未发现是由于行为数据包括的观测样本中存在未回传转化样本,将所有观测样本作为负样本进行训练。基于此,本申请通过第三预测模型预测出观测样本中存在未回传转化样本,基于观测样本的转化结果为未回传转化样本的第三概率和第四概率训练初始第四预测模型,得到用于在线预测对象针对物品执行转化行为概率的第四预测模型。
由上述技术方案可知,本申请实施例发现了相关技术中预测转化率的预测模型不准确的原因,即将未回传转化样本作为负样本对预测模型进行训练,而在实际业务中,1天内发生转化的样本占比较少,80%以上的转化样本均需要等待1天以上才会发生转化和回传。故针对未回传转化样本和回传延迟,本申请实施例通过第三预测模型预测出观测样本的转化结果为未回传转化样本的第三概率,并通过第三概率和第四概率共同训练初始第四预测模型,从而降低行为数据中与真实样本的样本分布差异,使得训练得到的第四预测模型能够降低转化率的预测偏差,提高第四预测模型预测转化率的准确性。
作为一种可能的实现方式,本申请实施例提供一种训练初始第四预测模型所用的损失函数,具体如下:
其中,x表示初始第四预测模型的输入,一般为物品特征、第一对象特征、第二对象特征、上下文特征等输入特征。
y表示转化结果,如y=1表示正样本(已经转化的样本),y=0表示负样本(未转化的样本)。
fθ(x)表示初始第四预测模型的输出,即第四概率。
pdp(x)表示真实样本中未回传正样本的条件概率,即通过第三预测模型得到多大的观测样本的转化结果为未回传转化样本的第三概率。
下面对前述损失函数的推导过程进行说明。为了方便说明,下面先对一些数学表示进行说明。
l(x,y;fθ(x))表示初始第四预测模型的损失函数。本申请实施例对此不做具体限定,例如可以为交叉熵损失函数。
p(x)表示真实样本(w>w2)上的输入特征的概率分布。
p(y|x)表示真实样本中,对象针对物品产生转化行为的第四概率,或者说真实样本上的输出样本是否转化的概率值,如p(y=1|x)表示样本转化的概率,p(y=0|x),表示样本未发生转化的概率。
q(y|x)表示观测样本的转化结果为未回传转化样本的第三概率,或者说观测样本(w1<w<w2)上是否转化的概率值。
L表示模型的损失函数在整个训练样本上的总损失,是l(x,y;fθ(x))的另一种表现形式。
由于观测样本中存在的偏差不会影响特征的分布,令p(x)≈q(x)。
当损失函数l为交叉熵损失函数时,引入观测样本,整体的损失函数L可以转换为如下形式:
令p(x,y=1,z>w1)表示真实样本中输入特征x与未回传转化样本(即z>w1时回传的正样本)的联合概率分布。
令p(x,y=0)表示真实样本中输入特征x与负样本y=0的联合概率分布。
令q(x,y=0)表示观测样本中输入特征x与负样本y=0的联合概率分布。
则q(x,y=0)计算如下:
q(x,y=0)=p(x,y=0)+pdp(x)
由于最终模型的训练数据都是使用的观测样本,无法知道真实样本的分别。所以在训练时所用的训练样本等同于观测样本,输入特征x在训练样本上的分布p(x)和观测样本上面分布q(x)相同,即p(x)=q(x)
观测样本中负样本的条件概率公式为:
/>
所以观测样本中负样本的条件概率计算如下:
q(y=0|x)=p(y=0|x)+pdp(x)
同理观测样本中正样本的条件概率计算如下:
q(y=1|x)=p(y=1|x)-pdp(x)
因此损失函数计算如下:
其中,对象针对物品产生转化行为的第四概率fθ(x)=p(y=1|x)
由此,p(y=0|x)=1-fθ(x)
因此整体的损失函数如下:
作为一种可能的实现方式,在初始第四预测模型的训练过程中,初始第四预测模型的参数更新可以如下:
其中,Wl表示初始第四预测模型的模型参数,表示初始第四预测模型的参数梯度,η表示参数更新步长,又称学习速率,L表示初始第四预测模型的损失函数。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息、第一对象特征、第二对象特征等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。作为一种可能的实现方式,本申请的具体实施方式中,使用的是脱敏后的用户信息、第一对象特征、第二对象特征等相关的数据,例如,虽然使用了对象特征,但是不知道该对象特征是属于哪一个用户的特征,仅能够明确在批量的用户中存在该对象特征。
下面以广告推荐领域为应用场景,对本申请实施例提供的预测模型的确定方法进行说明。
参见图4,该图为本申请实施例提供的一种预测模型的确定方法的应用场景示意图。
S401:获取用户的行为数据,根据行为数据获取输入特征。
输入特征可以为物品特征、第一对象特征、第二对象特征和上下文特征中的一种或多种组合。
S402:确定第二预测模型。
通过前述S201-S203的方式训练得到用于在线预测对象点击物品概率的第二预测模型。
S403:确定第三预测模型。
通过前述S3021-S3023的方式训练得到用于预测转化结果为未回传转化样本的概率的第三预测模型。通过第三预测模型得到修正后的样本,从而提高第四预测模型针对转化率预测的准确性。
S404:确定第四预测模型。
通过前述S301-S303的方式训练得到用于在线预测对象针对物品执行转化行为概率的第四预测模型。
S405:在线获取用户对广告产生的行为数据。
S406:在线根据行为数据和第一预测模型确定用户点击广告的点击率,在线根据行为数据、第三预测模型和第四预测模型确定用户针对广告产生的转化率。
从而根据点击率和转化率进行优化广告的召回等,从而提升广告的推荐效果。如点击率乘以转化率乘以广告出价,得到广告的排序。
针对上述实施例提供的预测模型的确定方法,本申请实施例还提供了一种预测模型的确定装置。
参见图5,该图为本申请实施例提供的一种预测模型的确定装置的结构示意图。如图5所示,该预测模型的确定装置500包括特征获取单元501、概率获取单元502和训练单元503;
所述特征获取单元501,用于获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
所述概率获取单元502,用于将所述物品特征、所述第一对象特征和所述第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到所述对象点击所述物品的第一概率;将所述物品特征和所述第一对象特征输入至初始第二预测模型中,得到所述对象点击所述物品的第二概率;
所述训练单元503,用于根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
作为一种可能的实现方式,所述训练单元503,具体用于:
根据所述第一概率和真实概率确定第一损失函数,根据所述第二概率和所述真实概率确定第二损失函数;
根据所述第一损失函数和所述第二损失函数确定第三损失函数;
基于最小化所述第三损失函数训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
作为一种可能的实现方式,所述训练单元503,具体用于:
根据所述第一损失函数、所述第二损失函数和调节参数确定第三损失函数。
作为一种可能的实现方式,所述训练单元503,具体用于:
根据所述第一损失函数和所述第二损失函数确定所述第一预测模型与所述初始第二预测模型间的距离;
根据所述第一损失函数、所述第二损失函数、调节参数和所述距离确定第三损失函数。
作为一种可能的实现方式,所述训练单元503,具体用于:
根据所述第一损失函数和所述第二损失函数确定所述第一预测模型与所述初始第二预测模型间的距离;
根据所述第一损失函数和所述距离确定第三损失函数。
作为一种可能的实现方式,所述预测模型的确定装置500还包括更新单元,用于:
所述基于最小化所述第三损失函数训练所述初始第二预测模型的过程中,若迭代次数小于预设迭代阈值,根据学习速率、所述初始第二预测模型的参数梯度和所述第二损失函数,更新所述初始第二预测模型的参数;
所述基于最小化所述第三损失函数训练所述初始第二预测模型的过程中,若所述迭代次数大于或等于所述预设迭代阈值,根据学习速率、所述初始第二预测模型的参数梯度和所述第三损失函数,更新所述初始第二预测模型的参数。
作为一种可能的实现方式,所述预测模型的确定装置500还包括更新单元,用于:
所述基于最小化所述第三损失函数训练所述初始第二预测模型的过程中,根据学习速率、所述初始第二预测模型的参数梯度和所述第三损失函数,更新所述初始第二预测模型的参数,所述学习速率大于预设学习速率阈值。
由上述技术方案可知,获取物品对应的物品特征、对象对应的第一对象特征和第二对象特征。其中,第一对象特征为对象点击物品前获取的对象特征,可以用于离线预测和在线预测,第二对象特征为对象点击物品后获取的对象特征,只能用于离线预测。为了学习第二对象特征,将物品特征、第一对象特征和第二对象特征作为输入,通过用于离线预测对象点击物品概率的第一预测模型,得到对象点击物品的第一概率。为了能够实现在线预测,将物品特征和第一对象特征输入至初始第二预测模型,得到对象点击物品的第二概率,为了能够在在线预测的同时学习到第二对象特征,根据第一概率和第二概率训练初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。由此,不仅将物品特征和第一对象特征作为初始第二预测模型的输入,还在训练初始第二预测模型的过程中,引入第一预测模型得到的第一概率,使得初始第二预测模型通过第一概率学习第一预测模型的模型参数,从而间接利用第二对象特征提升第二预测模型的预测准确性。
参见图6,该图为本申请实施例提供的一种预测模型的确定装置的结构示意图。如图6所示,该预测模型的确定装置600包括数据获取单元601、第三概率获取单元602、第四概率获取单元603和训练单元604;
所述数据获取单元601,用于获取对象针对物品产生的行为数据;其中,所述行为数据包括观测样本,所述观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,所述样本最大回传窗口与所述样本最小回传窗口的起点均为所述对象点击所述物品的时间,所述样本最大回传窗口的长度大于所述样本最小回传窗口的长度;
所述第三概率获取单元602,用于根据所述观测样本,通过第三预测模型得到所述观测样本的转化结果为未回传转化样本的第三概率;其中,所述第三预测模型为根据历史观测样本与所述历史观测样本的转化结果训练得到的;
所述第四概率获取单元603,用于根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率;
所述训练单元604,用于根据所述第三概率和所述第四概率训练所述初始第四预测模型,得到用于在线预测所述对象针对所述物品执行转化行为概率的第四预测模型。
作为一种可能的实现方式,所述预测模型的确定装置600还包括第三预测模型训练单元,用于:
确定历史观测样本的转化结果;其中,所述转化结果包括未回传转化样本和未回传未转化样本,所述未回传转化样本为在所述样本最大回传窗口内没有转化、且在所述样本最大回传窗口外转化的样本,所述未回传未转化样本为在所述样本最大回传窗口外未转化的样本;
根据所述历史观测样本和初始第三预测模型,确定所述历史观测样本的预测转化结果;
根据所述预测转化结果和所述历史观测样本的转化结果的差异训练所述初始第三预测模型,得到用于预测转化结果为未回传转化样本的概率的第三预测模型。
作为一种可能的实现方式,所述第四概率获取单元603,具体用于:
根据所述行为数据获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
将所述物品特征、所述第一对象特征和所述第二对象特征输入至初始第四预测模型中,得到所述对象针对所述物品产生转化行为的第四概率。
由上述技术方案可知,本申请实施例发现了相关技术中预测转化率的预测模型不准确的原因,即将未回传转化样本作为负样本对预测模型进行训练,而在实际业务中,1天内发生转化的样本占比较少,80%以上的转化样本均需要等待1天以上才会发生转化和回传。故针对未回传转化样本和回传延迟,本申请实施例通过第三预测模型预测出观测样本的转化结果为未回传转化样本的第三概率,并通过第三概率和第四概率共同训练初始第四预测模型,从而降低行为数据中与真实样本的样本分布差异,使得训练得到的第四预测模型能够降低转化率的预测偏差,提高第四预测模型预测转化率的准确性。
本申请实施例还提供了一种计算机设备,该计算机设备为前述介绍的计算机设备,该计算机设备可以为服务器或者终端设备,前述所述的预测模型的确定装置可以内置于服务器或终端设备中,下面将从硬件实体化的角度对本申请实施例提供的计算机设备进行介绍。其中,图7所示为服务器的结构示意图,图8所示为终端设备的结构示意图。
参见图7,该图为本申请实施例提供的一种服务器结构示意图,该服务器1400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(CentralProcessing Units,CPU)1422和存储器1432,一个或一个以上应用程序1442或数据1444的存储介质1430(例如一个或一个以上海量存储设备)。其中,存储器1432和存储介质1430可以是短暂存储或持久存储。存储在存储介质1430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,CPU 1422可以设置为与存储介质1430通信,在服务器1400上执行存储介质1430中的一系列指令操作。
服务器1400还可以包括一个或一个以上电源1426,一个或一个以上有线或无线网络接口1450,一个或一个以上输入输出接口1458,和/或,一个或一个以上操作系统1441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图7所示的服务器结构。
其中,CPU 1422用于执行如下步骤:
获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
将所述物品特征、所述第一对象特征和所述第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到所述对象点击所述物品的第一概率;将所述物品特征和所述第一对象特征输入至初始第二预测模型中,得到所述对象点击所述物品的第二概率;
根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
或者,执行以下步骤:
获取对象针对物品产生的行为数据;其中,所述行为数据包括观测样本,所述观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,所述样本最大回传窗口与所述样本最小回传窗口的起点均为所述对象点击所述物品的时间,所述样本最大回传窗口的长度大于所述样本最小回传窗口的长度;
根据所述观测样本,通过第三预测模型得到所述观测样本的转化结果为未回传转化样本的第三概率;其中,所述第三预测模型为根据历史观测样本与所述历史观测样本的转化结果训练得到的;
根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率;
根据所述第三概率和所述第四概率训练所述初始第四预测模型,得到用于在线预测所述对象针对所述物品执行转化行为概率的第四预测模型。
可选的,CPU 1422还可以执行本申请实施例中预测模型的确定方法任一具体实现方式的方法步骤。
参见图8,该图为为本申请实施例提供的一种终端设备的结构示意图。图8示出的是与本申请实施例提供的终端设备相关的智能手机的部分结构的框图,该智能手机包括:射频(Radio Frequency,简称RF)电路1510、存储器1520、输入单元1530、显示单元1540、传感器1550、音频电路1560、无线保真(简称WiFi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解,图8中示出的智能手机结构并不构成对智能手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图8对智能手机的各个构成部件进行具体的介绍:
RF电路1510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1580处理;另外,将设计上行的数据发送给基站。
存储器1520可用于存储软件程序以及模块,处理器1580通过运行存储在存储器1520的软件程序以及模块,从而实现智能手机的各种功能应用以及数据处理。
输入单元1530可用于接收输入的数字或字符信息,以及产生与智能手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1530可包括触控面板1531以及其他输入设备1532。触控面板1531,也称为触摸屏,可收集用户在其上或附近的触摸操作,并根据预先设定的程式驱动相应的连接装置。除了触控面板1531,输入单元1530还可以包括其他输入设备1532。具体地,其他输入设备1532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1540可用于显示由用户输入的信息或提供给用户的信息以及智能手机的各种菜单。显示单元1540可包括显示面板1541,可选的,可以采用液晶显示器(LiquidCrystal Display,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板1541。
智能手机还可包括至少一种传感器1550,比如光传感器、运动传感器以及其他传感器。至于智能手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1560、扬声器1561,传声器1562可提供用户与智能手机之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输到扬声器1561,由扬声器1561转换为声音信号输出;另一方面,传声器1562将收集的声音信号转换为电信号,由音频电路1560接收后转换为音频数据,再将音频数据输出处理器1580处理后,经RF电路1510以发送给比如另一智能手机,或者将音频数据输出至存储器1520以便进一步处理。
处理器1580是智能手机的控制中心,利用各种接口和线路连接整个智能手机的各个部分,通过运行或执行存储在存储器1520内的软件程序和/或模块,以及调用存储在存储器1520内的数据,执行智能手机的各种功能和处理数据。可选的,处理器1580可包括一个或多个处理单元。
智能手机还包括给各个部件供电的电源1590(比如电池),优选的,电源可以通过电源管理系统与处理器1580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,智能手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该智能手机所包括的存储器1520可以存储程序代码,并将所述程序代码传输给所述处理器。
该智能手机所包括的处理器1580可以根据所述程序代码中的指令执行上述实施例提供的预测模型的确定方法。
本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行上述实施例提供的预测模型的确定方法。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面的各种可选实现方式中提供的预测模型的确定方法。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:Read-Only Memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (15)

1.一种预测模型的确定方法,其特征在于,所述方法包括:
获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
将所述物品特征、所述第一对象特征和所述第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到所述对象点击所述物品的第一概率;将所述物品特征和所述第一对象特征输入至初始第二预测模型中,得到所述对象点击所述物品的第二概率;
根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型,包括:
根据所述第一概率和真实概率确定第一损失函数,根据所述第二概率和所述真实概率确定第二损失函数;
根据所述第一损失函数和所述第二损失函数确定第三损失函数;
基于最小化所述第三损失函数训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一损失函数和所述第二损失函数确定第三损失函数,包括:
根据所述第一损失函数、所述第二损失函数和调节参数确定第三损失函数。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一损失函数和所述第二损失函数确定第三损失函数,包括:
根据所述第一损失函数和所述第二损失函数确定所述第一预测模型与所述初始第二预测模型间的距离;
根据所述第一损失函数、所述第二损失函数、调节参数和所述距离确定第三损失函数。
5.根据权利要求2所述的方法,其特征在于,所述根据所述第一损失函数和所述第二损失函数确定第三损失函数,包括:
根据所述第一损失函数和所述第二损失函数确定所述第一预测模型与所述初始第二预测模型间的距离;
根据所述第一损失函数和所述距离确定第三损失函数。
6.根据权利要求2-5任意一项所述的方法,其特征在于,所述基于最小化所述第三损失函数训练所述初始第二预测模型的过程中,所述方法还包括:
若迭代次数小于预设迭代阈值,根据学习速率、所述初始第二预测模型的参数梯度和所述第二损失函数,更新所述初始第二预测模型的参数;
若所述迭代次数大于或等于所述预设迭代阈值,根据学习速率、所述初始第二预测模型的参数梯度和所述第三损失函数,更新所述初始第二预测模型的参数。
7.根据权利要求2-5任意一项所述的方法,其特征在于,所述基于最小化所述第三损失函数训练所述初始第二预测模型的过程中,所述方法还包括:
根据学习速率、所述初始第二预测模型的参数梯度和所述第三损失函数,更新所述初始第二预测模型的参数,所述学习速率大于预设学习速率阈值。
8.一种预测模型的确定方法,其特征在于,所述方法包括:
获取对象针对物品产生的行为数据;其中,所述行为数据包括观测样本,所述观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,所述样本最大回传窗口与所述样本最小回传窗口的起点均为所述对象点击所述物品的时间,所述样本最大回传窗口的长度大于所述样本最小回传窗口的长度;
根据所述观测样本,通过第三预测模型得到所述观测样本的转化结果为未回传转化样本的第三概率;其中,所述第三预测模型为根据历史观测样本与所述历史观测样本的转化结果训练得到的;
根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率;
根据所述第三概率和所述第四概率训练所述初始第四预测模型,得到用于在线预测所述对象针对所述物品执行转化行为概率的第四预测模型。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
确定历史观测样本的转化结果;其中,所述转化结果包括未回传转化样本和未回传未转化样本,所述未回传转化样本为在所述样本最大回传窗口内没有转化、且在所述样本最大回传窗口外转化的样本,所述未回传未转化样本为在所述样本最大回传窗口外未转化的样本;
根据所述历史观测样本和初始第三预测模型,确定所述历史观测样本的预测转化结果;
根据所述预测转化结果和所述历史观测样本的转化结果的差异训练所述初始第三预测模型,得到用于预测转化结果为未回传转化样本的概率的第三预测模型。
10.根据权利要求8所述的方法,其特征在于,所述根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率,包括:
根据所述行为数据获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
将所述物品特征、所述第一对象特征和所述第二对象特征输入至初始第四预测模型中,得到所述对象针对所述物品产生转化行为的第四概率。
11.一种预测模型的确定装置,其特征在于,所述装置包括:特征获取单元、概率获取单元和训练单元;
所述特征获取单元,用于获取物品对应的物品特征、对象对应的第一对象特征和所述对象对应的第二对象特征;其中,所述第一对象特征为所述对象点击所述物品前获取的对象特征,所述第二对象特征为所述对象点击所述物品后获取的对象特征;
所述概率获取单元,用于将所述物品特征、所述第一对象特征和所述第二对象特征输入至用于离线预测对象点击物品概率第一预测模型中,得到所述对象点击所述物品的第一概率;将所述物品特征和所述第一对象特征输入至初始第二预测模型中,得到所述对象点击所述物品的第二概率;
所述训练单元,用于根据所述第一概率和所述第二概率训练所述初始第二预测模型,得到用于在线预测对象点击物品概率的第二预测模型。
12.一种预测模型的确定装置,其特征在于,所述装置包括:数据获取单元、第三概率获取单元、第四概率获取单元和训练单元;
所述数据获取单元,用于获取对象针对物品产生的行为数据;其中,所述行为数据包括观测样本,所述观测样本为处于样本最大回传窗口内、且不处于样本最小回传窗口内的数据,所述样本最大回传窗口与所述样本最小回传窗口的起点均为所述对象点击所述物品的时间,所述样本最大回传窗口的长度大于所述样本最小回传窗口的长度;
所述第三概率获取单元,用于根据所述观测样本,通过第三预测模型得到所述观测样本的转化结果为未回传转化样本的第三概率;其中,所述第三预测模型为根据历史观测样本与所述历史观测样本的转化结果训练得到的;
所述第四概率获取单元,用于根据所述行为数据和初始第四预测模型,得到所述对象针对所述物品产生转化行为的第四概率;
所述训练单元,用于根据所述第三概率和所述第四概率训练所述初始第四预测模型,得到用于在线预测所述对象针对所述物品执行转化行为概率的第四预测模型。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
所述处理器用于根据所述计算机程序中的指令执行权利要求1-7中任意一项所述的方法或执行权利要求8-10中任意一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于权利要求1-7中任意一项所述的方法或执行权利要求8-10中任意一项所述的方法。
15.一种包括计算机程序的计算机程序产品,其特征在于,当其在计算机设备上运行时,使得所述计算机设备执行权利要求1-7中任意一项所述的方法或执行权利要求8-10中任意一项所述的方法。
CN202210583176.9A 2022-05-26 2022-05-26 预测模型的确定方法和相关装置 Pending CN117195957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210583176.9A CN117195957A (zh) 2022-05-26 2022-05-26 预测模型的确定方法和相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210583176.9A CN117195957A (zh) 2022-05-26 2022-05-26 预测模型的确定方法和相关装置

Publications (1)

Publication Number Publication Date
CN117195957A true CN117195957A (zh) 2023-12-08

Family

ID=89003886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210583176.9A Pending CN117195957A (zh) 2022-05-26 2022-05-26 预测模型的确定方法和相关装置

Country Status (1)

Country Link
CN (1) CN117195957A (zh)

Similar Documents

Publication Publication Date Title
US9934515B1 (en) Content recommendation system using a neural network language model
US11113745B1 (en) Neural contextual bandit based computational recommendation method and apparatus
US11294891B2 (en) Interactive search experience using machine learning
CN102208086B (zh) 面向领域的个性化智能推荐系统及实现方法
US11983646B2 (en) Bias scoring of machine learning project data
CN111353091A (zh) 信息处理方法、装置、电子设备及可读存储介质
EP3926554A1 (en) Method and apparatus for optimizing recommendation system, device and computer storage medium
JP2024503774A (ja) 融合パラメータの特定方法及び装置、情報推奨方法及び装置、パラメータ測定モデルのトレーニング方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN112084413B (zh) 一种信息推荐的方法、装置及存储介质
CN114519435A (zh) 模型参数更新方法、模型参数更新装置和电子设备
CN113869377A (zh) 训练方法、装置及电子设备
CN115700548A (zh) 用户行为预测的方法、设备和计算机程序产品
US20190324606A1 (en) Online training of segmentation model via interactions with interactive computing environment
CN114119123A (zh) 信息推送的方法和装置
CN116956996A (zh) 数据处理方法、装置、介质及设备
CN116204709A (zh) 一种数据处理方法及相关装置
CN117195957A (zh) 预测模型的确定方法和相关装置
CN115618065A (zh) 一种数据处理方法及相关设备
CN112395490B (zh) 用于生成信息的方法和装置
CN112269942A (zh) 一种推荐对象的方法、装置、系统及电子设备
CN113886674A (zh) 资源推荐方法、装置、电子设备及存储介质
CN116720003B (zh) 排序处理方法、装置、计算机设备、及存储介质
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置
CN112633952B (zh) 广告推送方法和装置、存储介质及电子设备
CN111507471B (zh) 一种模型训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination