CN111767982A - 用户转换预测模型的训练方法、装置、存储介质以及电子设备 - Google Patents

用户转换预测模型的训练方法、装置、存储介质以及电子设备 Download PDF

Info

Publication number
CN111767982A
CN111767982A CN202010433441.6A CN202010433441A CN111767982A CN 111767982 A CN111767982 A CN 111767982A CN 202010433441 A CN202010433441 A CN 202010433441A CN 111767982 A CN111767982 A CN 111767982A
Authority
CN
China
Prior art keywords
characteristic data
sample
user
service characteristic
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010433441.6A
Other languages
English (en)
Inventor
马文康
王鹏
包英泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dami Technology Co Ltd
Original Assignee
Beijing Dami Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dami Technology Co Ltd filed Critical Beijing Dami Technology Co Ltd
Priority to CN202010433441.6A priority Critical patent/CN111767982A/zh
Publication of CN111767982A publication Critical patent/CN111767982A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种用户转换预测模型的训练方法、装置、存储介质以及电子设备。所述方法包括:将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,其中,M为大于1的整数,N为大于1的整数,分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型,将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率,其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系,对所述N个样本转化率进行模型训练得到第二用户转换预测模型。通过执行本申请的方法,在输入层将特征数据进行分组,降低了输入层的参数数量,简化了网络模型的训练。

Description

用户转换预测模型的训练方法、装置、存储介质以及电子设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户转换预测模型的训练方法、装置、存储介质以及电子设备。
背景技术
全连接神经网络是潜在用户转化预测问题常用的一种模型,通常可以将该模型分为训练和使用两个阶段。在训练阶段,利用潜在户业务特征和是否转化的真实情况数据对作为训练数据,将潜在用户的业务特征作为神经网络输入,迭代神经网络的网络参数,使得网络的输出尽可能拟合用户真实转化情况,直至网络收敛。在使用阶段,将潜在用户的业务特征作为神经网络的输入,经过网络前向运算得到用户转化情况的预测结果,输出预测结果。
发明人发现:将所有的业务特征同时作为输入,使得输入的维度较高,网络浅层的参数较多,增加了模型训练的难度。
发明内容
本申请实施例提供了一种用户转换预测模型的训练方法、装置、计算机存储介质以及电子设备,旨在解决相关技术中,全连接神经网络在进行训练时,同时输入的参数较多,输入的参数维度高,模型难以训练的技术问题。所述技术方案如下:
第一方面,本申请实施例提供了一种用户转换预测模型的训练方法,所述方法包括:
将M个样本业务特征数据进行分组处理得到N组样本业务特征数据;其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息;
分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型;
将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率;其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
对所述N个样本转化率进行模型训练得到第二用户转换预测模型。第二方面,本申请实施例提供了一种。
第二方面,本申请实施例提供了一种用户转换预测模型的训练装置,所述装置包括:
特征分组模块,用于将M个样本业务特征数据进行分组处理得到N组样本业务特征数据;其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息;
第一训练模块,用于分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型;
确定转化率模块,用于将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率;其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
第二训练模块,用于对所述N个样本转化率进行模型训练得到第二用户转换预测模型。
第三方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供了一种电子设备,可包括:存储器和处理器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述存储器加载并执行上述的方法步骤。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例的方案在执行时,将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息,分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型,将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率,其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系,对所述N个样本转化率进行模型训练得到第二用户转换预测模型。本申请通过在输入层将特征进行分组,降低了输入层的参数数量,简化了网络模型的训练,同时利用深层次概率作为最终预测模型的输入特征,得到用户转化概率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的电子设备的结构示意图;
图2是本申请实施例提供的一种用户转换预测模型的训练方法的流程示意图;
图3是本申请实施例提供的一种用户转换预测模型的训练方法的流程示意图;
图4是本申请实施例提供的一种用户转换预测模型的训练装置的结构示意图。
具体实施方式
为使得本申请实施例的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
参见图1,其示出了本申请实施例所涉及的一种电子设备的结构示意图,该电子设备可以用于实施上述实施例中用户转换预测模型的训练方法。具体来讲:
存储器120可用于存储软件程序以及模块,处理器190通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器190和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131(例如:触摸屏、触摸板或触摸框)。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器190,并能接收处理器190发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器190以确定触摸事件的类型,随后处理器190根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图1中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
处理器190是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端设备的各种功能和处理数据,从而对终端设备进行整体监控。可选的,处理器190可包括一个或多个处理核心;其中,处理器190可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器190中。
具体在本实施例中,电子设备的显示单元是触摸屏显示器,电子设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行述一个或者一个以上程序包含实现用户转换预测模型的训练方法的步骤。
在下述方法实施例中,为了便于说明,仅以各步骤的执行主体为电子设备进行介绍说明。
请参见图2,为本申请实施例提供的一种用户转换预测模型的训练方法的流程示意图。如图2所示,本申请实施例的所述方法可以包括以下步骤:
S201,将M个样本业务特征数据进行分组处理得到N组样本业务特征数据。
其中,M为大于1的整数,N为大于1的整数。样本业务特征数据包括业务特征数据和转化结果信息。业务特征数据是指在实际网络环境中,样本用户在使用应用程序或者网页的各项功能时所产生的业务特征数据。转化结果信息是指用户由非特定用户转化为特定用户的结果信息,比如说:用户由非付费用户转化为付费用户,用户由非注册用户转化为注册用户等等。
样本用户可以包括采集的若干个特定用户和非特定用户。样本业务特征数据可以包括特定用户的业务特征数据和非特定用户的业务特征数据。业务特征数据可以包括样本用户账号注册时长数据、样本用户账号登录数据以及样本用户对应用程序功能事件的点击数据等等。样本用户账号注册时长数据可以是用户在注册应用程序或者网站的账号之后,服务器记录的用户账号注册的时间所生成的注册时长数据。样本用户登录数据可以是服务器记录的用户登录账号的次数以及每次登录账号的时长等所生成的账号登录数据。样本用户对应用程序功能事件的点击数据可以是用户在使用应用程序时,对于应用程序上的各个功能事件的点击次数以及每次点击的时长等所生成的点击数据。
一般的,可以按照各个样本的业务特征数据的信息来源种类将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,信息来源可以是各种宣传渠道,可以包括网站宣传、线下宣传、公众号宣传、微博宣传、特定用户推荐等等。
S202,分别对N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型。
其中,第一用户转换预测模型是指能够根据输入的样本业务特征数据,输出各个样本业务特征数据对应的样本转化率的模型。在进行模型训练时,可以选择全连接神经网络,神经网络模拟的就是一个将输入信号,对其进行一层一层的神经元去解析,得到输出的过程,并将上述步骤数字化的过程。全连接神经网络的规则是神经元按照层来布局,最左边的层叫做输入层,负责接收输入数据,最右边的层叫输出层,可以从这层获取神经网络输出数据,输入层和输出层之间的层叫做隐藏层,因为它们对于外部来说是不可见的;同一层的神经元之间没有连接;第N层的每个神经元和第N-1层的所有神经元相连(这就是fullconnected的含义),第N-1层神经元的输出就是第N层神经元的输入;每个连接都有一个权值。
N组样本业务特征数据是根据各个样本的信息来源来划分的,是N组不同的信息来源对应的样本业务特征数据。将M个样本的N组业务特征分别作为神经网络的输入特征,M个样本的实际转化情况作为输出结果,训练N个独立的全连接神经网络,在网络收敛后,输出模型A1,A2…AN,为N个第一用户转换预测模型。
S203,将N组样本业务特征数据输入至N个第一用户转换预测模型得到N个样本转化率。
其中,N组样本业务特征数据和N个第一用户转换预测模型是一一对应关系,即每组样本业务特征数据分别对应一个第一用户转换预测模型。可以将N组业务特征数据分别输入至N个训练好的第一用户转换预测模型,那么输出的是N组业务特征数据对应的N个样本转化率。
S204,对N个样本转化率进行模型训练得到第二用户转换预测模型。
其中,第二用户转换预测模型是指能够根据输入的N个转化率,输出M个样本的转化率的模型。在训练时,将N组样本业务特征数据对应的N个转化率作为神经网络的输入特征,将M个样本的实际转化情况作为输出结果,对神经网络进行训练。
本申请实施例的方案在执行时,将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息,分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型,将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率,其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系,对所述N个样本转化率进行模型训练得到第二用户转换预测模型。本申请通过在输入层将特征进行分组,降低了输入层的参数数量,简化了网络模型的训练,同时利用深层次概率作为最终预测模型的输入特征,得到用户转化概率。
请参见图3,为本申请实施例提供的一种用户转换预测模型的训练方法的流程示意图。如图3所示,本申请实施例的所述方法可以包括以下步骤:
S301,获取M个样本业务特征数据中各个样本业务特征数据的信息来源。
其中,信息来源是指采集的若干样本用户的样本业务数据的来源种类,可以是各种宣传渠道,可以包括网站宣传、线下宣传、公众号宣传、微博宣传、特定用户推荐等等,样本用户可以包括特定样本用户或非特定样本用户。样本业务特征数据可以包括业务特征数据和转化结果信息,转化结果信息是样本用户的实际转化结果,业务特征数据是样本用户在实际网络中,使用应用程序或者网站时,所产生的业务特征数据。
举例来说:业务特征数据可以是样本用户在使用应用程序或者网站时所生成的对各种功能事件的点击数据,点击数据可以是样本用户在应用程序或者网站中点击链接、购买商品、收藏商品、发表评论、查看评论、转发信息等执行的操作生成的点击数据。业务特征数据可以是样本用户在注册账号之后所生成的注册时长数据,服务器通过样本用户首次注册账号之后,计算样本用户的账号注册时长,生成注册时长数据。业务特征数据可以是样本用户在使用应用程序或者网站时,登录账号信息所产生的的账号登录数据,服务器通过在样本用户每次登录账号时,记录每一次的登录时间、登录时长等等,生成账号登录数据。业务特征数据可以是根据样本用户的个人信息生成的个人信息数据,个人信息数据可以包括样本用户的年龄、地区、教育信息等等。
S302,根据信息来源对M个样本业务特征数据进行分组得到N组样本业务特征数据。
一般的,基于S301中获取的M个样本业务特征的信息来源,按照信息来源的分组,将M个样本业务特征数据进行分组,得到N组样本业务特征数据。
S303,对N组样本业务特征数据进行预处理。
其中,预处理是指对样本业务特征数据进行补全处理和归一化处理。通常数据的缺失类型可以分为三种:完全随机缺失,随机缺失和非随机缺失。完全随机缺失是指缺失的变量和其余的变量没有关系。随机缺失是指缺失的变量和完全变量存在一定的关系。非随机缺失是指缺失的变量和非完全变量存在一定的关系。对于数据的缺失可以进行补全处理,补全处理的方法包括多种,比如人工填充、平均值填充和特殊值填充等等。数据的归一化处理是指一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。把数转化为(0,1)之间的小数,把数据映射到0~1范围之内处理,更加便捷快速。
S304,分别对N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型。
S305,将N组样本业务特征数据输入至N个第一用户转换预测模型得到N个样本转化率。
S306,对N个样本转化率进行模型训练得到第二用户转换预测模型。
一般的,S304~S306具体可参见图2中的S202~S204,在此不再赘述。
S307,获取待识别的K个业务特征数据,K为大于1的整数。
其中,K个业务特征数据是在实际应用中待检测的K个用户的业务特征数据,业务特征数据是指在实际网络环境中,用户在使用应用程序或者网页的各项功能时所产生的业务特征数据。待检测的K个用户可以包括若干个特定用户和若干个非特定用户。业务特征数据可以包括特定用户的业务特征数据和非特定用户的业务特征数据。业务特征数据可以包括用户账号注册时长数据、用户账号登录数据以及用户对应用程序功能事件的点击数据等等。用户账号注册时长数据可以是用户在注册应用程序或者网站的账号之后,服务器记录的用户账号注册的时间所生成的注册时长数据。用户登录数据可以是服务器记录的用户登录账号的次数以及每次登录账号的时长等所生成的账号登录数据。用户对应用程序功能事件的点击数据可以是用户在使用应用程序时,对于应用程序上的各个功能事件的点击次数以及每次点击的时长等所生成的点击数据。
S308,获取K个业务特征数据的业务信息来源,根据业务信息来源将K个业务数据进行分组得到N组业务特征数据。
其中,业务信息来源是获取K个待检测用户的业务特征数据的信息来源,可以按照各个用户的业务特征数据的信息来源种类将K个业务特征数据进行分组处理得到N组业务特征数据,可以按照图2中的S201中的信息来源种类对待检测用户的K个业务特征数据进行分类。信息来源可以是各种宣传渠道,可以包括网站宣传、线下宣传、公众号宣传、微博宣传、特定用户推荐等等。
S309,对N组业务特征数据进行预处理。
其中,预处理包括:对N组业务特征数据进行特征补全处理和归一化处理。
S310,将N组业务特征数据作为输入分别输入至N个第一用户转换预测模型,分别输出N个预测转化率。
一般的,N组业务特征数据是待检测的K个用户的业务特征数据分组得到的,将上述N组业务特征数据输入至训练好的N个第一用户转换预测模型,输N个预测转化率,这N个预测转化率是K个待检测用户分组之后的业务特征数据对应的转化率。
S311,将N个预测转化率输入至第二用户转化预测模型中进行特征前向运算,输出N个预测转化率共同对应的综合转化率。
一般的,前向算法的作用是计算输入层结点对隐藏层结点的影响,也就是说,把网络正向的走一遍:从输入层到隐藏层,再从隐藏层到输出层,计算每个结点对其下一层结点的影响。在本申请实施例中,从输入层N组业务特征数据到隐藏层N个第一用户转换预测模型,再到隐藏层第二用户转化预测模型,经过上述前向运算过程,再由输出层输出K个待检测用户的业务特征数据对应的综合转化率。
本申请实施例的方案在执行时,将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息,分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型,将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率,其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系,对所述N个样本转化率进行模型训练得到第二用户转换预测模型。本申请通过在输入层将特征进行分组,降低了输入层的参数数量,简化了网络模型的训练,同时利用深层次概率作为最终预测模型的输入特征,得到用户转化概率。
请参见图4,为本申请实施例提供的一种用户转换预测模型的训练装置的结构示意图。该用户转换预测模型的训练装置400可以通过软件、硬件或者两者的结合实现成为服务器的全部或一部分。装置400包括:
特征分组模块410,用于将M个样本业务特征数据进行分组处理得到N组样本业务特征数据;其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息;
第一训练模块420,用于分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型;
确定转化率模块430,用于将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率;其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
第二训练模块440,用于对所述N个样本转化率进行模型训练得到第二用户转换预测模型。
可选地,特征分组模块410包括:
信息来源单元,用于获取所述M个样本业务特征数据中各个样本业务特征数据的信息来源;
数据分组单元,用于根据所述信息来源对所述M个样本业务数据进行分组得到N组样本业务特征数据。
可选地,装置400包括:
预处理模块,用于对所述N组样本业务特征数据进行预处理;其中,所述预处理包括:对所述样本业务特征数据进行补全处理和归一化处理。
可选地,装置400还包括:
待识别业务第一获取模块,用于获取待识别的K个业务特征数据;其中,K为大于1的整数;
待识别业务第二获取模块,用于获取所述K个业务特征数据的业务信息来源,根据所述业务信息来源将所述K个业务数据进行分组得到N组业务特征数据;
转化率第一计算模块,用于将N组业务特征数据作为输入分别输入至所述N个第一用户转换预测模型,分别输出N个预测转化率;其中,所述N组业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
转化率第二计算模块,用于将所述N个预测转化率输入至所述第二用户转化预测模型中进行特征前向运算,输出所述N个预测转化率共同对应的综合转化率。
可选地,装置400还包括:
待识别业务数据预处理模块,用于对所述N组业务特征数据进行预处理;其中,所述预处理包括:对所述N组业务特征数据进行特征补全处理和归一化处理。
本申请实施例的方案在执行时,将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息,分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型,将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率,其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系,对所述N个样本转化率进行模型训练得到第二用户转换预测模型。本申请通过在输入层将特征进行分组,降低了输入层的参数数量,简化了网络模型的训练,同时利用深层次概率作为最终预测模型的输入特征,得到用户转化概率。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述的方法步骤,具体执行过程可以参见图2和图3所示实施例的具体说明,在此不进行赘述。
本申请还提供了一种电子设备,包括处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种用户转换预测模型的训练方法,其特征在于,所述方法包括:
将M个样本业务特征数据进行分组处理得到N组样本业务特征数据;其中,M为大于1的整数,N为大于1的整数;
分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型;
将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率;其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
对所述N个样本转化率进行模型训练得到第二用户转换预测模型。
2.根据权利要求1所述的方法,其特征在于,所述将M个样本业务特征数据进行分组处理得到N组样本业务特征数据,包括:
获取所述M个样本业务特征数据中各个样本业务特征数据的信息来源;
根据所述信息来源对所述M个样本业务数据进行分组得到N组样本业务特征数据。
3.根据权利要求1所述的方法,其特征在于,所述分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型之前,包括:
对所述N组样本业务特征数据进行预处理;其中,所述预处理包括:对所述样本业务特征数据进行补全处理和归一化处理。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待识别的K个业务特征数据;其中,K为大于1的整数;
根据训练的第一用户转化预测模型和第二用户转化预测模型对所述K个业务特征数据进行识别,输出所述K个业务特征数据共同对应的综合转化率。
5.根据权利要求4所述的方法,其特征在于,所述根据训练的第一用户转化预测模型和第二用户转化预测模型对所述K个业务特征数据进行识别,输出所述K个业务特征数据共同对应的综合转化率,包括:
获取所述K个业务特征数据的业务信息来源,根据所述业务信息来源将所述K个业务数据进行分组得到N组业务特征数据;
将N组业务特征数据作为输入分别输入至所述N个第一用户转换预测模型,分别输出N个预测转化率;其中,所述N组业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
将所述N个预测转化率输入至所述第二用户转化预测模型中进行特征前向运算,输出所述N个预测转化率共同对应的综合转化率。
6.根据权利要求5所述的方法,其特征在于,所述将N组业务特征数据作为输入分别输入至所述N个第一用户转换预测模型,分别输出N个预测转化率之前,还包括:
对所述N组业务特征数据进行预处理;其中,所述预处理包括:对所述N组业务特征数据进行特征补全处理和归一化处理。
7.根据权利要求1或5所述的方法,其特征在于,所述样本业务特征数据包括:样本用户注册时长数据、样本用户账号登录数据以及样本用户对应用程序功能事件的点击数据等中的一种或多种;和/或,
所述业务特征数据包括:当前用户注册时长数据、当前用户账号登录数据以及当前用户对应用程序功能事件的点击数据等中的一种或多种。
8.一种用户转换预测模型的训练装置,其特征在于,所述装置包括:
特征分组模块,用于将M个样本业务特征数据进行分组处理得到N组样本业务特征数据;其中,M为大于1的整数,N为大于1的整数,所述样本业务特征数据包括业务特征数据和转化结果信息;
第一训练模块,用于分别对所述N组样本业务特征数据进行模型训练得到N个第一用户转换预测模型;
确定转化率模块,用于将所述N组样本业务特征数据输入至所述N个第一用户转换预测模型得到N个样本转化率;其中,所述N组样本业务特征数据和所述N个第一用户转换预测模型是一一对应关系;
第二训练模块,用于对所述N个样本转化率进行模型训练得到第二用户转换预测模型。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~7任意一项的方法步骤。
10.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~7任意一项的方法步骤。
CN202010433441.6A 2020-05-20 2020-05-20 用户转换预测模型的训练方法、装置、存储介质以及电子设备 Pending CN111767982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010433441.6A CN111767982A (zh) 2020-05-20 2020-05-20 用户转换预测模型的训练方法、装置、存储介质以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010433441.6A CN111767982A (zh) 2020-05-20 2020-05-20 用户转换预测模型的训练方法、装置、存储介质以及电子设备

Publications (1)

Publication Number Publication Date
CN111767982A true CN111767982A (zh) 2020-10-13

Family

ID=72719510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010433441.6A Pending CN111767982A (zh) 2020-05-20 2020-05-20 用户转换预测模型的训练方法、装置、存储介质以及电子设备

Country Status (1)

Country Link
CN (1) CN111767982A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411644A (zh) * 2021-05-28 2021-09-17 北京达佳互联信息技术有限公司 样本数据的处理方法、装置、服务器及存储介质
CN114792173A (zh) * 2022-06-20 2022-07-26 支付宝(杭州)信息技术有限公司 预测模型训练方法和装置
CN115098771A (zh) * 2022-06-09 2022-09-23 阿里巴巴(中国)有限公司 推荐模型更新方法、推荐模型训练方法及计算设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339384A (zh) * 2011-09-16 2012-02-01 北京交通大学 一种人脸识别方法
CN106908752A (zh) * 2017-03-17 2017-06-30 广东电网有限责任公司电力科学研究院 一种基于特征分组的电能计量异常诊断方法及系统
CN108573358A (zh) * 2018-05-09 2018-09-25 平安普惠企业管理有限公司 一种逾期预测模型生成方法及终端设备
CN109034903A (zh) * 2018-07-27 2018-12-18 广州视源电子科技股份有限公司 用户转化率预测方法及装置、计算机可读存储介质
CN109063900A (zh) * 2018-07-16 2018-12-21 广州视源电子科技股份有限公司 用户转化率预测模型的训练及用户转化率预测方法和装置
WO2019114423A1 (zh) * 2017-12-15 2019-06-20 阿里巴巴集团控股有限公司 对模型预测值进行融合的方法、装置和设备
CN109978284A (zh) * 2019-04-25 2019-07-05 中国人民解放军国防科技大学 一种基于混合神经网络模型的光伏发电功率分时预测方法
CN110134868A (zh) * 2019-05-14 2019-08-16 辽宁工程技术大学 一种基于用户偏好异构性分析的推荐方法
CN110766231A (zh) * 2019-10-30 2020-02-07 上海天壤智能科技有限公司 基于多头神经网络的犯罪预测方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339384A (zh) * 2011-09-16 2012-02-01 北京交通大学 一种人脸识别方法
CN106908752A (zh) * 2017-03-17 2017-06-30 广东电网有限责任公司电力科学研究院 一种基于特征分组的电能计量异常诊断方法及系统
WO2019114423A1 (zh) * 2017-12-15 2019-06-20 阿里巴巴集团控股有限公司 对模型预测值进行融合的方法、装置和设备
CN108573358A (zh) * 2018-05-09 2018-09-25 平安普惠企业管理有限公司 一种逾期预测模型生成方法及终端设备
CN109063900A (zh) * 2018-07-16 2018-12-21 广州视源电子科技股份有限公司 用户转化率预测模型的训练及用户转化率预测方法和装置
CN109034903A (zh) * 2018-07-27 2018-12-18 广州视源电子科技股份有限公司 用户转化率预测方法及装置、计算机可读存储介质
CN109978284A (zh) * 2019-04-25 2019-07-05 中国人民解放军国防科技大学 一种基于混合神经网络模型的光伏发电功率分时预测方法
CN110134868A (zh) * 2019-05-14 2019-08-16 辽宁工程技术大学 一种基于用户偏好异构性分析的推荐方法
CN110766231A (zh) * 2019-10-30 2020-02-07 上海天壤智能科技有限公司 基于多头神经网络的犯罪预测方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
习华勇;赵林明;习华元;: "基于多智能算法混凝土强度预测系统设计", 微计算机信息, no. 06, 28 February 2007 (2007-02-28) *
张庆;刘丙杰;王新宇;: "快速SVM算法及在陀螺仪参数漂移预测中的应用", 舰船电子工程, no. 11, 20 November 2008 (2008-11-20) *
章顺华;连晶晶;丁建平;刘菁;: "基于人工神经网络短期负荷预测的数据处理", 南昌工程学院学报, no. 03, 30 June 2008 (2008-06-30) *
陈启伟;王伟;马迪;毛伟;: "基于Ext-GBDT集成的类别不平衡信用评分模型", 计算机应用研究, no. 02, 15 March 2017 (2017-03-15) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411644A (zh) * 2021-05-28 2021-09-17 北京达佳互联信息技术有限公司 样本数据的处理方法、装置、服务器及存储介质
CN113411644B (zh) * 2021-05-28 2022-10-04 北京达佳互联信息技术有限公司 样本数据的处理方法、装置、服务器及存储介质
CN115098771A (zh) * 2022-06-09 2022-09-23 阿里巴巴(中国)有限公司 推荐模型更新方法、推荐模型训练方法及计算设备
CN114792173A (zh) * 2022-06-20 2022-07-26 支付宝(杭州)信息技术有限公司 预测模型训练方法和装置

Similar Documents

Publication Publication Date Title
US10438111B2 (en) Machine learning based webinterface generation and testing system
US11403532B2 (en) Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm
US9569536B2 (en) Identifying similar applications
CN111767982A (zh) 用户转换预测模型的训练方法、装置、存储介质以及电子设备
WO2020164268A1 (zh) 验证码生成方法、装置及存储介质、计算机设备
US20170337449A1 (en) Program, system, and method for determining similarity of objects
CN106874253A (zh) 识别敏感信息的方法及装置
CN110929799B (zh) 用于检测异常用户的方法、电子设备和计算机可读介质
EP4006909B1 (en) Method, apparatus and device for quality control and storage medium
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
CN113947336A (zh) 评估投标企业风险的方法、装置、存储介质及计算机设备
US11481648B2 (en) Software categorization based on knowledge graph and machine learning techniques
CN111563198A (zh) 一种物料召回方法、装置、设备及存储介质
JP7128311B2 (ja) 文書種別の推奨方法、装置、電子機器、可読記憶媒体及びコンピュータプログラム製品
WO2017176562A1 (en) Identifying query abandonment using gesture movement
CN110442803A (zh) 由计算设备执行的数据处理方法、装置、介质和计算设备
CN114175018A (zh) 新词分类技术
CN110276183B (zh) 反向图灵验证方法及装置、存储介质、电子设备
CN112541145A (zh) 一种页面展现方法、装置、设备及存储介质
CN114035729B (zh) 电子投票方法及装置、终端设备
CN111612280B (zh) 一种数据分析方法和装置
CN111507471B (zh) 一种模型训练方法、装置、设备及存储介质
CN111949860B (zh) 用于生成相关度确定模型的方法和装置
CN113688232A (zh) 招标文本分类方法、装置、存储介质及终端
CN112308016A (zh) 表情图像获取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination