CN114491342A - 个性化模型的训练方法、信息显示方法及设备 - Google Patents

个性化模型的训练方法、信息显示方法及设备 Download PDF

Info

Publication number
CN114491342A
CN114491342A CN202210095340.1A CN202210095340A CN114491342A CN 114491342 A CN114491342 A CN 114491342A CN 202210095340 A CN202210095340 A CN 202210095340A CN 114491342 A CN114491342 A CN 114491342A
Authority
CN
China
Prior art keywords
training
personalized model
user
model
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210095340.1A
Other languages
English (en)
Other versions
CN114491342B (zh
Inventor
吴帆
吕承飞
严谊凯
牛超越
顾仁杰
丁雨成
华立锋
陈贵海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210095340.1A priority Critical patent/CN114491342B/zh
Publication of CN114491342A publication Critical patent/CN114491342A/zh
Application granted granted Critical
Publication of CN114491342B publication Critical patent/CN114491342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供的个性化模型的训练方法、信息显示方法及设备,其中,终端通过利用从服务器获取的多个第二用户的浏览行为的历史数据以及存储于所述终端本地的第一用户的浏览行为的历史数据,在终端本地对个性化模型进行迁移训练的训练机制,丰富了训练样本数据的数据量,降低的泛化误差;同时,由于第二用户是与第一用户具有相似性的用户,其训练样本数据中各样本数据的分布差异较小,训练后的个性化模型的预测准确性能够得到保证,从而使得利用该训练方式所得到个性化模型对第一用户的浏览行为具有较好的预测准确性和较小的泛化误差,进行利于对信息显示的显示效果提升。

Description

个性化模型的训练方法、信息显示方法及设备
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种个性化模型的训练方法、信息显示方法及设备。
背景技术
“千人千面”是指将海量信息按照用户个性化的偏好进行展示,以让不同用户看到不同的显示信息。为了实现“千人千面”的显示效果,“千人千模”便应运而生。“千人千模”是指针对每个用户均设置个性化的个性化模型,以用于为用户提供“千人千面”的显示效果。
为了让每个用户终端均部署个性化的个性化模型,现有技术中,通过采集各用户的数据以对各用户的个性化模型进行训练,得到各用户的个性化模型。
但是,受限于训练数据的数量和训练数据的数据质量,通过上述方式所获得的个性化模型容易产生预测不准确、泛化误差较大、模型过拟合等问题,进而影响使用个性化模型所得到的信息显示的显示效果。
发明内容
本申请实施例提供一种个性化模型的训练方法、信息显示方法及设备,以降低个性化模型的泛化误差,提升个性化模型的预测准去性,从而使得利用个性化模型进行信息显示时的信息显示效果更好,提升用户体验。
第一方面,本申请实施例提供一种个性化模型的训练方法,该个性化模型的训练方法应用于终端;该训练方法包括:
获取待训练的个性化模型以及训练样本数据;其中,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户;利用训练样本数据,在终端本地对待训练的个性化模型进行迁移训练,得到训练后的个性化模型;其中,训练后的个性化模型用于预测第一用户的浏览行为。
可知的是,本实施方式中利用终端从服务器获取的多个第二用户的浏览行为的历史数据以及存储于终端本地的第一用户的浏览行为的历史数据共同对个性化模型进行迁移训练的训练机制,丰富了训练样本数据的数据量,降低个性化模型的泛化误差;同时,由于第二用户是与第一用户具有相似性的用户,其训练样本数据中各样本数据的分布差异较小,训练后的个性化模型的预测准确性能够得到保证,从而使得利用该训练方式所得到个性化模型对第一用户的浏览行为具有较好的预测准确性和较小的泛化误差,进行利于对信息显示的显示效果提升。
可选的,利用训练样本数据,在终端本地对待训练的个性化模型进行迁移训练,得到训练后的个性化模型,包括:
将不同的第二用户的浏览行为的历史数据作为不同源域的源样本数据,将第一用户的浏览行为的历史数据作为目标域的目标样本数据;利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型;利用目标样本数据对中间模型进行增量训练,得到训练后的个性化模型。
可知的是,通过先利用各源域的源样本数据以及目标域的目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,再利用目标样本数据对中间模型进行增量训练的方式,以进一步提升个性化模型的预测准确率。
可选的,利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型,包括:
将待训练的个性化模型作为第一个性化模型;从各源域的源样本数据中选取任一源域的源样本数据作为训练数据;利用训练数据对第一个性化模型进行训练,得到第二个性化模型;利用目标样本数据对第二个性化模型进行验证,并根据验证结果确定本次训练所得到的第三个性化模型;判断是否还存在未被选取的源域的源样本数据;若是,则将第三个性化模型作为新的第一个性化模型,并返回执行从各源域的源样本数据中选取任一源域的源样本数据作为训练数据的步骤,以对新的第一个性化模型进行训练;若否,则将本次训练所得到的第三个性化模型作为中间模型。
可知的是,在利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练的过程中,通过采用迭代式的增量训练的训练方式,能够在训练样本数据的数据总量受限的情况下,实现可用的训练样本数据的数据增量,进一步提升了训练后的个性化模型的模型精度得到有效提升。
可选的,利用目标样本数据对第二个性化模型进行验证,并根据验证结果确定本次训练所得到的第三个性化模型,包括:
根据目标样本数据确定第一个性化模型和第二个性化模型的预测准确率;若第二个性化模型的预测准确率高于第一个性化模型的预测准确率,则将第二个性化模型作为本次训练所得到的第三个性化模型;若第二个性化模型的预测准确率不高于第一个性化模型的预测准确率,则将第一个性化模型作为本次训练所得到的第三个性化模型。
可知的是,通过在确定每轮训练所得到的第三个性化模型时,采用基于预测准确率的模型回滚的迭代方式,以使得每轮训练后所得到的个性化模型均为当前训练过程中预测准确率最高的那个模型,进而保证训练后所得到的个性化模型为预测准确率最高的模型。
可选的,利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型,包括:
对各源域的源样本数据进行遍历组合处理,得到多个源样本数据组合,其中,每一源样本数据组合中包括有至少一个源域的源样本数据;利用各源样本数据组合分别对待训练的个性化模型进行训练,得到多个第四个性化模型;利用目标样本数据确定各第四个性化模型的预测准确率,并将预测准确率最高的第四个性化模型作为中间模型。
可知的是,在利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型的过程中,还可通过利用分次训练的方式,从各训练得到的模型中找到较好模型以进行输出。
可选的,该训练方法还包括:向服务器发送第一获取请求,第一获取请求中包括存储于终端本地的第一用户的浏览行为的历史数据;接收服务器根据第一获取请求返回的多个第二用户的浏览行为的历史数据。
可知的是,在触发对个性化模型的训练时,终端还需向服务器发送第一获取请求,以使服务器可按照预定逻辑返回第二用户的浏览行为的历史数据,以便于终端对模型的训练。
可选的,获取待训练的个性化模型,包括:
判断终端的本地是否存有历史个性化模型;若是,则将历史个性化模型作为待训练的个性化模型;若否,则向服务器发送第二获取请求,接收服务器发送的初始个性化模型,并将初始个性化模型作为待训练的个性化模型;其中,初始个性化模型是服务器利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练所得到的个性化模型。
可知的是,在触发对个性化模型的训练时,终端还需向服务器发送第一获取请求,以使服务器可按照预定逻辑返回第二用户的浏览行为的历史数据,以便于终端对模型的训练。
第二方面,本申请实施例提供一种信息显示方法,信息显示方法应用于终端;信息显示方法包括:
利用终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测;根据行为预测的预测结果,对从服务器获取的信息进行显示;
其中,终端本地训练得到的个性化模型是终端利用训练样本数据对待训练的个性化模型进行迁移训练获得的,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户。
可选的,利用终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测,包括:获取服务器发送的待显示对象;利用终端本地训练得到的个性化模型,计算第一用户浏览各待显示对象的概率;
根据行为预测的预测结果,对从服务器获取的信息进行显示,包括:根据各显示对象的概率,对各显示对象进行显示。
可知的是,终端通过利用训练后的个性化模型可对于第一用户的浏览行为进行预测,进而基于预测得到的预测结果对从服务器获取到的信息进行一系列处理并进行显示,以为第一用户智能化程度更好且符合第一用户个性的信息显示服务。
第三方面,本申请实施例提供一种个性化模型的训练方法,个性化模型的训练方法,其特征在于,个性化模型的训练方法应用于服务器;该训练方法包括:
接收终端发送的第一获取请求,第一获取请求中包括有第一用户的浏览行为的历史数据;根据第一用户的浏览行为的历史数据,在全部用户中确定出与第一用户具有相似性的至少一个第二用户;将各第二用户的浏览行为的历史数据发送至终端;其中,第一用户的浏览行为的历史数据,以及多个第二用户的浏览行为的历史数据用于构成训练样本数据,训练样本数据用于在终端本地对待训练的个性化模型进行训练以得到用于预测第一用户的浏览行为的个性化模型。
可选的,根据第一用户的浏览行为的历史数据,在全部用户中确定出与第一用户具有相似性的至少一个第二用户,包括:
根据全部用户中每个用户的浏览行为的历史数据,确定各用户的表示向量;计算第一用户的表示向量与其他各用户的表示向量之间的欧式距离;根据各欧式距离在各用户中确定与第一用户的具有相似性至少一个第二用户。
可选的,该训练方法还包括:利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练,得到初始个性化模型;
该训练方法还包括:接收终端发送第二获取请求;将初始个性化模型发送至终端,初始个性化模型用于进行训练以得到训练后的个性化模型。
可知的是,本实施方式中服务器可利用第一用户的浏览行为的历史数据确定与第一用户具有相似性的第二用户,并将第二用户的浏览行为的历史数据下发至终端,以供终端可利用第二用户的浏览行为的历史数据结合其已有的第一用户的浏览行为的历史数据以对个性化模型进行训练,通过这样的方式得到的云联后的个性化模型,其泛化误差较小且预测准确性较高。
第四方面,本申请实施例提供了一种个性化模型的训练装置,该个性化模型的训练装置设置于终端;该训练装置,包括:
获取模块,用于获取待训练的个性化模型以及训练样本数据;其中,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户;
训练模块,用于利用训练样本数据,在终端本地对待训练的个性化模型进行迁移训练,得到训练后的个性化模型;其中,训练后的个性化模型用于预测第一用户的浏览行为。
第五方面,本申请实施例提供了一种信息显示装置,该信息显示装置设置在终端;
信息显示装置,包括:
预测模块,用于利用终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测;
信息显示模块,用于根据行为预测的预测结果,对从服务器获取的信息进行显示;
其中,终端本地训练得到的个性化模型是终端利用训练样本数据对待训练的个性化模型进行迁移训练获得的,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户。
第六方面,本申请实施例提供了一种个性化模型的训练装置,该个性化模型的训练装置设置在服务器;
该训练装置,包括:
收发模块,用于接收终端发送的第一获取请求,第一获取请求中包括有第一用户的浏览行为的历史数据;
处理模块,用于根据第一用户的浏览行为的历史数据,在全部用户中确定出与第一用户具有相似性的至少一个第二用户;
收发模块,还用于将各第二用户的浏览行为的历史数据发送至终端;其中,第一用户的浏览行为的历史数据,以及多个第二用户的浏览行为的历史数据用于构成训练样本数据,训练样本数据用于在终端本地对待训练的个性化模型进行训练以得到用于预测第一用户的浏览行为的个性化模型。
第七方面,本申请实施例提供了一种电子设备,包括:存储器,处理器;至少一个处理器;以及
存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面或第二方面或第三方面任一项所述方法。
第八方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面或第二方面或第三方面任一项所述方法。
第九方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面或第三方面任一项所述方法。
本申请实施例提供一种个性化模型的训练方法、信息显示方法及设备,其中,终端通过利用多个第二用户的浏览行为的历史数据以及第一用户的浏览行为的历史数据共同对个性化模型进行迁移训练的训练机制,丰富了训练样本数据的数据量,降低个性化模型的泛化误差;同时,由于第二用户是与第一用户具有相似性的用户,其训练样本数据中各样本数据的分布差异较小,训练后的个性化模型的预测准确性能够得到保证,从而使得利用该训练方式所得到个性化模型对第一用户的浏览行为具有较好的预测准确性和较小的泛化误差,进行利于对信息显示的显示效果提升。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为一种训练个性化模型过程的示意图;
图2为另一种训练个性化模型过程的示意图;
图3为本申请所基于的一种网络架构的示意图;
图4为本申请实施例提供的一种个性化模型的训练方法的流程示意图;
图5为本申请提供的一种个性化模型的训练方法的循环流程示意图;
图6为本申请实施例提供的一种信息显示方法的流程示意图;
图7为本申请提供的信息显示方法对应的第一界面示意图;
图8为本申请实施例提供的另一种个性化模型的训练方法;
图9为本申请实施例提供的个性化模型的训练装置的结构框图;
图10为本申请实施例提供的信息显示装置的结构框图;
图11为本申请实施例提供的又一个性化模型的训练装置的结构框图;
图12为本申请提供的一种电子设备的硬件结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本申请的技术方案中,所涉及的用户行为信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
随着大数据时代的发展,为用户提供个性化的服务成为技术发展的主流。在信息显示领域中,将海量信息按照用户个性化的偏好进行展示,让不同用户看到不同的显示信息的服务成为可能。为了实现个性化的显示服务,“千人千模”的网络框架便应运而生。
与海量用户共用全局个性化模型的传统架构不同的是,在“千人千模”的网络框架中,服务器将为每个用户终端部署独立的具有个性化的个性化模型,而每个用户将利用该个性化的个性化模型对终端所显示信息进行相应的处理,以实现不同用户看到不同显示信息的显示效果。
现有技术中往往采用如下两种方式对每个用户终端的个性化的个性化模型的训练:
图1为一种训练个性化模型过程的示意图,如图1所示的,服务器会获取海量用户的数据以作为源域数据,获取目标用户的数据以作为目标域数据,服务器通过利用域迁移技术对目标用户的个性化的个性化模型进行训练,并将该个性化模型下发部署在终端上。
但是,由于源域数据和目标域数据分布差异较大,这将使得训练得到的个性化模型的预测误差较大,准确性较低。当用户再利用个性化模型进行信息显示时,过大的预测误差和较低的准确性将会使得用户得到较差的显示体验,用户留存度较低。
为了改善上述训练提及的预测误差过大的问题,在图1所示的方式的基础上,图2为另一种训练个性化模型过程的示意图,其中如图2所示的,为了提升个性化模型的准确性,服务器将利用用户自身提供的数据对个性化的个性化模型进行训练,以得到准确性较高的个性化模型。
但是,模型泛化误差的大小一般与训练数据量的平方根成反比,由于用户自身提供的数据的数量有限,其训练后的个性化模型存在较大的泛化误差。
面对上述问题,本申请在训练个性化的个性化模型时将借鉴域迁移训练机制,服务器通过在海量用户数据中筛选出与目标用户(即本申请中的第一用户)具有相似性的第二用户,第二用户的数据被发送至终端以作为源域数据,同时,终端还将利用本地存储的目标用户的数据以作为目标域数据,可在本地直接利用域迁移技术在本地对目标用户的个性化的个性化模型进行训练,得到训练后的个性化模型。相对于图1所示方案,本申请中源域数据和目标域数据之间的分布差异较小,训练得到的个性化模型的预测误差较小,预测准确性较高;而对于图2所示方案,本申请中训练数据量较大,模型泛化误差较小,基于个性化模型进行信息显示的显示效果较好,用户体验较好。
参考图3,图3为本申请所基于的一种网络架构的示意图,图3所示网络架构具体可包括服务器1以及终端2。
其中,服务器1具体可为设置在云端的服务器集群,该服务器1中将存储有用户数据、显示信息数据等多种类型的数据,通过服务器1中预设运算逻辑,服务器1可实现对模型训练、数据处理等多种运算功能。
终端2具体可为具有网络通信功能、运算功能以及信息显示功能的硬件设备,其包括但不限于智能手机、平板电脑、台式电脑、物联网设备等。
通过与服务器1的通信交互,终端2将获取源域数据,并在终端2本地进行个性化模型训练以及基于个性化模型的信息显示等处理。
下面通过具体的实施例对本申请提供的个性化模型的训练方法、信息显示方法及设备进行详细说明。下面的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
需要说明的是,本实施例中提供的个性化模型的训练方法的执行主体为前述提及的终端,图4为本申请实施例提供的一种个性化模型的训练方法的流程示意图。如图4所示的,该个性化模型的训练方法可以包括如下几个步骤:
步骤401、获取待训练的个性化模型以及训练样本数据;其中,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户。
具体的,待训练的个性化模型具体是用于对用户的浏览行为进行预测的待训练的模型,其个性化模型具体可采用多种模型架构,如线性逻辑回归(Logistic Regression,LR)模型、DeepFM、深度兴趣网络(Deep Interest Network,DIN)等。其中,对于待训练的个性化模型来说,其具体可为存储在终端本地的历史个性化模型,即终端在前一次训练周期所获得的个性化模型;或者,该待训练的个性化模型也可为由服务器下发的初始个性化模型,即服务器利用全部用户的相关数据训练所得到的全局个性化模型。
而训练样本数据具体可指用于训练该个性化模型的数据,其具体应包括有使用本终端的用户在历史时刻触发浏览行为所产生的数据,即存储于终端本地的第一用户的浏览行为的历史数据;训练样本数据还应包括与本终端的用户具有相似性的其他终端用户在历史时刻触发浏览行为所产生的数据,即第二用户的浏览行为的历史数据,其中,第二用户的浏览行为的历史数据的确定过程是由服务器来进行的,终端将通过数据通信渠道从服务器获取该第二用户的浏览行为的历史数据。
需要说明的是,无论是第一用户的浏览行为的历史数据,还是第二用户的浏览行为的历史数据,其数据用于描述有如下信息:用户在触发浏览行为时浏览到的页面以及页面上可被触发的各对象的信息,以及用户在各对象中选中的触发对象的信息。
当然,对于上述页面以及各对象的具体内容,应于个性化模型所预测的实际内容相关。示例性的,个性化模型可用于用户在浏览当前页面时,预测用户可能点击触发的图标或选项。此时,用户浏览行为的历史数据具体可为历史时刻下用户在页面上进行点击时的点击序列,如在用户发生每一次点击时,当前页面上全部图标或全部选项的信息以及被点击的图标或选项的信息等。
在其他示例中,个性化模型可用于在用户输入文字或语句时,预测用户可能输入的下一文字或下一语句。此时,用户浏览行为的历史数据中应包括有历史时刻下用户在输入栏中所输入的文字序列或语句序列等。
本实施方式中的第二用户是指与第一用户在浏览行为上具有一定相似性的用户,如前所述的,该第二用户的历史数据一般由服务器确定并下发,即终端可通过向服务器发送第一获取请求,第一获取请求中包括终端本地存储的第一用户的浏览行为的历史数据;然后,终端将接收服务器根据第一获取请求返回的多个第二用户的浏览行为的历史数据。其中,服务器确定第二用户的具体方式可参见后续实施例,在本实施例中不进行赘述。
步骤402、利用训练样本数据,在终端本地对待训练的个性化模型进行迁移训练,得到训练后的个性化模型;其中,训练后的个性化模型用于预测第一用户的浏览行为。
具体的,为了能够得到预测效果较好的个性化模型,本实施方式将采用基于域迁移训练的迭代式增量训练的训练机制,实现个性化模型的获取。
在该训练机制下,可知的是,在网络的域迁移训练中,源域用于表示已有知识,而目标域用于表示网络要学习的新知识。通过训练,网络可学会对知识的“举一反三”,从而能够利用已有知识学会新知识。
基于该原理,终端会确认训练中的源域数据和目标域数据。图4为本申请提供的一种个性化模型的训练方法的训练流程示意图,终端将不同的第二用户的浏览行为的历史数据作为不同源域的源样本数据,将第一用户的浏览行为的历史数据作为目标域的目标样本数据。
在训练时,终端会先利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型,以实现将网络对“已有知识”的理解迁移到网络“新知识”的理解上。然后,终端利用目标样本数据对中间模型进行增量训练,得到训练后的个性化模型,进而确定网络对“新知识”的理解是正确没有偏差的,至此网络学会对“已有知识”的“举一反三”。
在基于域迁移得到中间模型的过程中,为了使得域迁移的迁移效果更好,本实施方式中将采用增量式的迭代训练的方式对待训练的个性化模型进行训练,以保证训练得到的中间模型是效果较好的模型。
当“已有知识”的数量足够多时,网络对于“已有知识”的学习将更准确。基于此,终端可针对各源域的源样本数据进行预先处理,以使源域的样本数量得到增长。
在终端利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型的过程中,可采用多种不同的训练方式实现。
示例性的,图5为本申请提供的一种个性化模型的训练方法的循环流程示意图,如图5所示的,该方式下的中间模型的训练将包括有多轮训练。
其中,在第一轮循环训练中,该获取的待训练的个性化模型作为第一个性化模型,首先,终端将从前述得到的各源域的源样本数据中选取任一源域的源样本数据作为训练数据;然后,终端会利用该训练数据对当前的第一个性化模型进行训练,得到第二个性化模型。
为了保证训练效果,终端在得到第二个性化模型后,还会利用目标样本数据对该第二个性化模型进行验证,并根据验证结果确定本次训练所得到的第三个性化模型。
示例性的,对于第二个性化模型的验证可通过预测准确率来实现,即,终端将利用目标样本数据确定第一个性化模型和所述第二个性化模型的预测准确率,若第二个性化模型的预测准确率高于第一个性化模型的预测准确率,则将该第二个性化模型作为本次训练所得到的第三个性化模型;若该第二个性化模型的预测准确率不高于第一个性化模型的预测准确率,则将该第一个性化模型作为本次训练所得到的第三个性化模型。
当终端得到第三个性化模型之后,还将确定是否完成训练得到中间模型,即终端可判断是否还存在未被选取的源域的源样本数据。若还存在未被选取到的源域的源样本数据,则说明训练未完成。此时,终端需要将当前第三个性化模型作为新的第一个性化模型,并开始下一轮循环训练。若不存在未被选取到的源域的源样本数据,则说明训练以完成,此时,当前所得到的第三个性化模型则为利用各源域的源样本数据和目标样本数据所能训练得到的效果较好的模型。此时,该第三个性化模型将作为中间模型进入至下一训练环节,直至得到中间模型。
为了提升训练效率,对于第一轮循环训练所使用待训练的个性化模型来说,其具体基于服务器提供的初始个性化模型,即通过第二获取请求以得到服务器预先利用全局数据进行训练而得到的初始个性化模型,在该初始个性化模型基础上进行中间模型的训练使得训练效率得到提升。或者,对于第一轮循环训练所使用的待训练的个性化模型来说,其具体还可为终端在前一工作周期中或历史工作周期中进行完整的个性化模型训练所得到的训练后的个性化模型,即历史个性化模型。可知的是,该历史个性化模型能够对历史时刻的第一用户的浏览行为进行准确预测,而以该历史个性化模型作为当前工作周期下待训练的个性化模型,能够使得模型能够更快的得到收敛,提升训练效率。
基于上述理由,在执行第一轮循环训练之前,终端还需要判断本地是否存有历史个性化模型;若存储,则将该历史个性化模型作为第一轮循环训练所使用的训练的个性化模型;若未存储,将终端需要则向服务器发送第二获取请求,接收服务器发送的初始个性化模型,并将初始个性化模型作为第一轮循环训练所使用的训练的个性化模型。可知的是,该初始个性化模型是服务器利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练所得到的个性化模型。
或者,终端利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型,还可采用分批训练的方式实现。示例性的,对各源域的源样本数据进行遍历组合处理,得到多个源样本数据组合,其中,每一源样本数据组合中包括有至少一个源域的源样本数据;利用各源样本数据组合分别对待训练的个性化模型进行训练,得到多个第四个性化模型;利用目标样本数据确定各第四个性化模型的预测准确率,并将预测准确率最高的第四个性化模型作为中间模型。
无论上述哪一种训练方式,当得到中间模型之后,终端还将利用目标样本数据对中间模型再次进行增量训练,以使得模型进一步收敛,提升训练后的个性化模型的收敛程度。
经过实际测试,采用上述训练方法所得到的训练后的个性化模型的预测准确率相对于图1所示的现有技术中的个性化模型的预测准确率提升了约0.5%;相对于图2所示的现有技术中的个性化模型的预测准确率提升了0.45%。
本实施方式的模型训练过程中,由于训练样本数据不仅包括第一用户的历史数据,还包括有与第一用户具有一定相似性的第二用户的历史数据。通过采用这样的数据对个性化模型进行训练,一方面能够使得训练样本数据中的数据量足够大,使得训练后的个性化模型的不会出现模型过拟合的现象,降低模型的泛化误差;另一方面使得训练样本数据中的数据分布差异性较小,使得个性化模型的预测准确性较高。
在上述各实现方式的基础上,本实施例中提供的个性化模型的训练方法的执行主体为前述提及的终端,图6为本申请实施例提供的一种信息显示方法的流程示意图。如图6所示的,该信息显示方法可以包括如下几个步骤:
步骤601、利用终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测。
步骤602、根据行为预测的预测结果,对从服务器获取的信息进行显示。
其中,终端本地训练得到的个性化模型是终端利用训练样本数据对待训练的个性化模型进行迁移训练获得的,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户。
在本实施方式中,终端可利用前述得到的训练后的个性化模型,对待显示的信息进行预测和显示。可知的是,根据不同的待显示信息的信息内容,个性化模型所输出的预测数据所表征的数据内容以及对待显示信息进行的处理均不同。
具体的,上述利用终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测的步骤可包括:获取服务器发送的待显示对象;利用终端本地训练得到的个性化模型,计算第一用户浏览各待显示对象的概率;根据行为预测的预测结果,对从服务器获取的信息进行显示,包括:根据各显示对象的概率,对各显示对象进行显示。
示例性的,图7为本申请提供的信息显示方法对应的第一界面示意图,如图7所示的,在当前工作周期,当第一用户触发终端的某一功能后(如图7所示的打开某APP),前述提及的训练方法启动,并调用前一工作周期所得到的个性化模型或初始个性化模型以进行相应的训练,得到如图7所示的当前工作周期下的个性化模型。
随后,服务器将待显示的包括有多个图片对象的页面下发至终端,终端会调用当前工作周期得到的个性化模型对第一用户浏览和触发各图片对象的概率进行预测计算,得到各图片对象的触发概率值。然后,终端将根据各图片对象的触发概率值将各图片对象进行重新排序,以使触发概率值较高的图片对象的显示顺序相对靠前。最后,按照排序后的顺序对各图片对象进行显示。
由于每个终端均调用部署在自身终端内的个性化模型,以对各自得到的待显示信息进行显示,基于不同的个性化模型,其每个终端为各自用户所展现的显示效果是不同的,满足用户“千人千面”的显示需求。
在上述各实现方式的基础上,本实施例中提供的个性化模型的训练方法的执行主体为前述提及的服务器,图8为本申请实施例提供的另一种个性化模型的训练方法,如图8所示的,该个性化模型的训练方法可以包括如下几个步骤:
步骤801、接收终端发送的第一获取请求,第一获取请求中包括有第一用户的浏览行为的历史数据。
步骤802、根据第一用户的浏览行为的历史数据,在全部用户中确定出与第一用户具有相似性的至少一个第二用户。
步骤803、将各第二用户的浏览行为的历史数据发送至终端;其中,第一用户的浏览行为的历史数据,以及多个第二用户的浏览行为的历史数据用于构成训练样本数据,训练样本数据用于在终端本地对待训练的个性化模型进行训练以得到用于预测第一用户的浏览行为的个性化模型。
结合前述实施方式,在本实施方式中,服务器会接收并存储来自各终端上传的用户的浏览行为的历史数据。当第一用户的终端开始执行对其自身个性化模型的训练时,会将第一用户的浏览行为的历史数据发送给服务器。
此时,服务器会按照既定算法,对各用户的表示向量进行计算,并利用各用户的表示向量,确定出第一用户相似的第二用户。即,服务器可根据全部用户中每个用户的浏览行为的历史数据,确定各用户的表示向量;计算第一用户的表示向量与其他各用户的表示向量之间的欧式距离;根据各欧式距离在各用户中确定与第一用户的具有相似性至少一个第二用户。
当然,在确定第二用户时,服务器还可采用除欧式距离以外的其他距离表示方式实现,如利用随机匹配算法,或,搜索表示向量余弦距离等其他算法,以衡量距离第一用户最近的第二用户。
再后,服务器会将各所述第二用户的浏览行为的历史数据发送至所述终端以供终端使用。其终端对数据的具体使用方式可参见前述实施方式,本实施方式不做赘述。
当然,为了降低各终端在训练时的运算量,服务器还可为终端提供初始个性化模型,以供终端使用。具体来说,服务器将利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练,得到初始个性化模型;当服务器接收终端发送第二获取请求时,服务器会将初始个性化模型发送至终端,初始个性化模型用于进行训练以得到训练后的个性化模型。
通过这样的方式,能够使得终端在初次使用训练方法时,能够基于已利用全局数据进行过训练队初始个性化模型进行个性化的模型训练,便于部署在终端上的模型能够快速收敛,提升训练效率。
本申请实施例提供的本申请实施例提供一种个性化模型的训练方法,服务器根据第一用户的浏览行为的历史数据以确定出与第一用户相似的多个第二用户,并将各第二用户的浏览行为的历史数据下发至第一用户的终端,以使终端利用多个第二用户的浏览行为的历史数据以及第一用户的浏览行为的历史数据共同对个性化模型进行迁移训练,通过这样的方式得到的终端的个性化模型,其泛化误差较低,预测准确性较高,对信息显示的显示效果较好。
对应于上文实施例提供的个性化模型的训练方法,图9为本申请实施例提供的个性化模型的训练装置的结构框图。为了便于说明,仅示出了与本申请实施例相关的部分。参照图9,该个性化模型的训练装置设置于终端,该个性化模型的训练装置,包括:
获取模块910,用于获取待训练的个性化模型以及训练样本数据;其中,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户;
训练模块920,用于利用训练样本数据,在终端本地对待训练的个性化模型进行迁移训练,得到训练后的个性化模型;其中,训练后的个性化模型用于预测第一用户的浏览行为。
可选实施例中,训练模块920,具体用于将不同的第二用户的浏览行为的历史数据作为不同源域的源样本数据,将第一用户的浏览行为的历史数据作为目标域的目标样本数据;利用各源域的源样本数据以及目标样本数据对待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型;利用目标样本数据对中间模型进行增量训练,得到训练后的个性化模型。
可选实施例中,训练模块920,具体用于将所述待训练的个性化模型作为第一个性化模型;从各源域的源样本数据中选取任一源域的源样本数据作为训练数据;利用所述训练数据对所述第一个性化模型进行训练,得到第二个性化模型;利用所述目标样本数据对所述第二个性化模型进行验证,并根据验证结果确定本次训练所得到的第三个性化模型;判断是否还存在未被选取的源域的源样本数据;若是,则将所述第三个性化模型作为新的第一个性化模型,并返回执行从各源域的源样本数据中选取任一源域的源样本数据作为训练数据的步骤,以对所述新的第一个性化模型进行训练;若否,则将本次训练所得到的第三个性化模型作为所述中间模型。
可选实施例中,训练模块920,具体用于根据所述目标样本数据确定所述第一个性化模型和所述第二个性化模型的预测准确率;若所述第二个性化模型的预测准确率高于所述第一个性化模型的预测准确率,则将所述第二个性化模型作为本次训练所得到的第三个性化模型;若所述第二个性化模型的预测准确率不高于所述第一个性化模型的预测准确率,则将所述第一个性化模型作为本次训练所得到的第三个性化模型。
可选实施例中,训练模块920,具体还用于对各源域的源样本数据进行遍历组合处理,得到多个源样本数据组合,其中,每一源样本数据组合中包括有至少一个源域的源样本数据;利用各源样本数据组合分别对所述待训练的个性化模型进行训练,得到多个第四个性化模型;利用所述目标样本数据确定各第四个性化模型的预测准确率,并将预测准确率最高的第四个性化模型作为所述中间模型。
可选实施例中,获取模块910,还用于向服务器发送第一获取请求,第一获取请求中包括存储于终端本地的第一用户的浏览行为的历史数据;接收服务器根据第一获取请求返回的多个第二用户的浏览行为的历史数据。
可选实施例中,训练模块920还用于判断终端的本地是否存有历史个性化模型;若是,训练模块920则将历史个性化模型作为待训练的个性化模型;若否,则获取模块910还用于向服务器发送第二获取请求,接收服务器发送的初始个性化模型,并训练模块920用于将初始个性化模型作为待训练的个性化模型;其中,初始个性化模型是服务器利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练所得到的个性化模型。
对应于上文实施例提供的信息显示方法,图10为本申请实施例提供的信息显示装置的结构框图。为了便于说明,仅示出了与本申请实施例相关的部分。参照图10,该信息显示装置设置于终端,该信息显示装置,包括:
预测模块1010,用于利用终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测;
信息显示模块1020,用于根据行为预测的预测结果,对从服务器获取的信息进行显示;
其中,终端本地训练得到的个性化模型是终端利用训练样本数据对待训练的个性化模型进行迁移训练获得的,训练样本数据包括存储于终端本地的第一用户的浏览行为的历史数据,以及终端从服务器获取的多个第二用户的浏览行为的历史数据,第二用户是与第一用户具有相似性的用户。
可选实施例中,预测模块1010具体用于获取服务器发送的待显示对象;利用终端本地训练得到的个性化模型,计算第一用户浏览各待显示对象的概率;信息显示模块1020,具体用于根据各显示对象的概率,对各显示对象进行显示。
对应于上文实施例提供的个性化模型的训练方法,图11为本申请实施例提供的又一个性化模型的训练装置的结构框图。为了便于说明,仅示出了与本申请实施例相关的部分。参照图11,该个性化模型的训练装置设置于服务器,该个性化模型的训练装置,包括:
收发模块1110,用于接收终端发送的第一获取请求,第一获取请求中包括有第一用户的浏览行为的历史数据;
处理模块1120,用于根据第一用户的浏览行为的历史数据,在全部用户中确定出与第一用户具有相似性的至少一个第二用户;
收发模块1110,还用于将各第二用户的浏览行为的历史数据发送至终端;其中,第一用户的浏览行为的历史数据,以及多个第二用户的浏览行为的历史数据用于构成训练样本数据,训练样本数据用于在终端本地对待训练的个性化模型进行训练以得到用于预测第一用户的浏览行为的个性化模型。
可选实施例中,处理模块1120,具体根据全部用户中每个用户的浏览行为的历史数据,确定各用户的表示向量;计算第一用户的表示向量与其他各用户的表示向量之间的欧式距离;根据各欧式距离在各用户中确定与第一用户的具有相似性至少一个第二用户。
可选实施例中,还包括:全局训练模块;
该全局训练模块具体用于利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练,得到初始个性化模型;
收发模块1110,具体还用于:接收终端发送第二获取请求;将初始个性化模型发送至终端,初始个性化模型用于进行训练以得到训练后的个性化模型。
图12为本申请提供的一种电子设备的硬件结构示意图,如图12所示的,本申请实施例提供一种电子设备,电子设备的存储器可用于存储至少一个程序指令,处理器用于执行至少一个程序指令,以实现上述方法实施例的技术方案。其实现原理和技术效果与上述方法相关实施例类似,此处不再赘述。
本申请实施例提供一种芯片。芯片包括处理器,处理器用于调用存储器中的计算机程序,以执行上述实施例中的技术方案。其实现原理和技术效果与上述相关实施例类似,此处不再赘述。
本申请实施例提供一种计算机程序产品,当计算机程序产品在电子设备运行时,使得电子设备执行上述实施例中的技术方案。其实现原理和技术效果与上述相关实施例类似,此处不再赘述。
本申请实施例提供一种计算机可读存储介质,其上存储有程序指令,程序指令被电子设备执行时,使得电子设备执行上述实施例的技术方案。其实现原理和技术效果与上述相关实施例类似,此处不再赘述。
以上的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本申请的保护范围之内。

Claims (14)

1.一种个性化模型的训练方法,其特征在于,所述个性化模型的训练方法应用于终端;
所述训练方法包括:
获取待训练的个性化模型以及训练样本数据;其中,所述训练样本数据包括存储于所述终端本地的第一用户的浏览行为的历史数据,以及所述终端从服务器获取的多个第二用户的浏览行为的历史数据,所述第二用户是与所述第一用户具有相似性的用户;
利用所述训练样本数据,在所述终端本地对所述待训练的个性化模型进行迁移训练,得到训练后的个性化模型;其中,所述训练后的个性化模型用于预测所述第一用户的浏览行为。
2.根据权利要求1所述的训练方法,其特征在于,所述利用所述训练样本数据,在所述终端本地对所述待训练的个性化模型进行迁移训练,得到训练后的个性化模型,包括:
将不同的第二用户的浏览行为的历史数据作为不同源域的源样本数据,将所述第一用户的浏览行为的历史数据作为目标域的目标样本数据;
利用各源域的源样本数据以及所述目标样本数据对所述待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型;
利用所述目标样本数据对所述中间模型进行增量训练,得到所述训练后的个性化模型。
3.根据权利要求2所述的训练方法,其特征在于,所述利用各源域的源样本数据以及所述目标样本数据对所述待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型,包括:
将所述待训练的个性化模型作为第一个性化模型;
从各源域的源样本数据中选取任一源域的源样本数据作为训练数据;
利用所述训练数据对所述第一个性化模型进行训练,得到第二个性化模型;
利用所述目标样本数据对所述第二个性化模型进行验证,并根据验证结果确定本次训练所得到的第三个性化模型;
判断是否还存在未被选取的源域的源样本数据;若是,则将所述第三个性化模型作为新的第一个性化模型,并返回执行从各源域的源样本数据中选取任一源域的源样本数据作为训练数据的步骤,以对所述新的第一个性化模型进行训练;若否,则将本次训练所得到的第三个性化模型作为所述中间模型。
4.根据权利要求3所述的训练方法,其特征在于,所述利用所述目标样本数据对所述第二个性化模型进行验证,并根据验证结果确定本次训练所得到的第三个性化模型,包括:
根据所述目标样本数据确定所述第一个性化模型和所述第二个性化模型的预测准确率;
若所述第二个性化模型的预测准确率高于所述第一个性化模型的预测准确率,则将所述第二个性化模型作为本次训练所得到的第三个性化模型;
若所述第二个性化模型的预测准确率不高于所述第一个性化模型的预测准确率,则将所述第一个性化模型作为本次训练所得到的第三个性化模型。
5.根据权利要求2所述的训练方法,其特征在于,所述利用各源域的源样本数据以及所述目标样本数据对所述待训练的个性化模型进行基于目标域的域迁移训练,得到中间模型,包括:
对各源域的源样本数据进行遍历组合处理,得到多个源样本数据组合,其中,每一源样本数据组合中包括有至少一个源域的源样本数据;
利用各源样本数据组合分别对所述待训练的个性化模型进行训练,得到多个第四个性化模型;
利用所述目标样本数据确定各第四个性化模型的预测准确率,并将预测准确率最高的第四个性化模型作为所述中间模型。
6.根据权利要求1-5任一项所述的训练方法,其特征在于,所述获取待训练的个性化模型,包括:
判断所述终端的本地是否存有历史个性化模型;
若是,则将所述历史个性化模型作为所述待训练的个性化模型;
若否,则向所述服务器发送第二获取请求,接收所述服务器发送的初始个性化模型,并将所述初始个性化模型作为所述待训练的个性化模型;其中,所述初始个性化模型是所述服务器利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练所得到的个性化模型。
7.一种信息显示方法,其特征在于,所述信息显示方法应用于终端;
所述信息显示方法包括:
利用所述终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测;
根据所述行为预测的预测结果,对从服务器获取的信息进行显示;
其中,所述终端本地训练得到的个性化模型是所述终端利用训练样本数据对待训练的个性化模型进行迁移训练获得的,所述训练样本数据包括存储于所述终端本地的第一用户的浏览行为的历史数据,以及所述终端从服务器获取的多个第二用户的浏览行为的历史数据,所述第二用户是与所述第一用户具有相似性的用户。
8.根据权利要求7所述的信息显示方法,其特征在于,所述利用所述终端本地训练得到的个性化模型,对第一用户的浏览行为进行行为预测,包括:
获取服务器发送的待显示对象;
利用所述终端本地训练得到的个性化模型,计算所述第一用户浏览各待显示对象的概率;
所述根据所述行为预测的预测结果,对从服务器获取的信息进行显示,包括:
根据各显示对象的概率,对所述各显示对象进行显示。
9.一种个性化模型的训练方法,其特征在于,所述个性化模型的训练方法应用于服务器;
所述训练方法包括:
接收终端发送的第一获取请求,所述第一获取请求中包括有第一用户的浏览行为的历史数据;
根据所述第一用户的浏览行为的历史数据,在全部用户中确定出与所述第一用户具有相似性的至少一个第二用户;
将各所述第二用户的浏览行为的历史数据发送至所述终端;其中,所述第一用户的浏览行为的历史数据,以及多个第二用户的浏览行为的历史数据用于构成训练样本数据,所述训练样本数据用于在所述终端本地对待训练的个性化模型进行训练以得到用于预测所述第一用户的浏览行为的个性化模型。
10.根据权利要求9所述的训练方法,其特征在于,所述根据所述第一用户的浏览行为的历史数据,在全部用户中确定出与所述第一用户具有相似性的至少一个第二用户,包括:
根据全部用户中每个用户的浏览行为的历史数据,确定各用户的表示向量;
计算所述第一用户的表示向量与其他各用户的表示向量之间的欧式距离;
根据各欧式距离在各用户中确定与所述第一用户的具有相似性至少一个第二用户。
11.根据权利要求9所述的训练方法,其特征在于,还包括:
利用全部用户的浏览行为的历史数据对待训练的初始个性化模型进行训练,得到初始个性化模型;
所述训练方法还包括:
接收所述终端发送第二获取请求;
将所述初始个性化模型发送至所述终端,所述初始个性化模型用于进行训练以得到训练后的个性化模型。
12.一种电子设备,其中,包括:
至少一个处理器;以及
存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-6或如权利要求7或8或如权利要求9-11任一项所述方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-6或如权利要求7或8或如权利要求9-11任一项所述方法。
14.一种计算机程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现如权利要求1-6或如权利要求7或8或如权利要求9-11任一项所述方法。
CN202210095340.1A 2022-01-26 2022-01-26 个性化模型的训练方法、信息显示方法及设备 Active CN114491342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210095340.1A CN114491342B (zh) 2022-01-26 2022-01-26 个性化模型的训练方法、信息显示方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210095340.1A CN114491342B (zh) 2022-01-26 2022-01-26 个性化模型的训练方法、信息显示方法及设备

Publications (2)

Publication Number Publication Date
CN114491342A true CN114491342A (zh) 2022-05-13
CN114491342B CN114491342B (zh) 2023-09-22

Family

ID=81475868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210095340.1A Active CN114491342B (zh) 2022-01-26 2022-01-26 个性化模型的训练方法、信息显示方法及设备

Country Status (1)

Country Link
CN (1) CN114491342B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118332189A (zh) * 2024-04-17 2024-07-12 星汉智能科技股份有限公司 基于预训练用户表征向量和自注意力机制的app预测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130031107A1 (en) * 2011-07-29 2013-01-31 Jen-Yi Pan Personalized ranking method of video and audio data on internet
CN110162706A (zh) * 2019-05-22 2019-08-23 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统
CN110852446A (zh) * 2019-11-13 2020-02-28 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置和计算机可读存储介质
CN111125519A (zh) * 2019-12-11 2020-05-08 腾讯科技(深圳)有限公司 用户行为预测方法、装置、电子设备以及存储介质
US20200410418A1 (en) * 2019-06-28 2020-12-31 EMC IP Holding Company LLC Analyzing cloud backup service options using historical data protection activities
CN112288471A (zh) * 2020-10-26 2021-01-29 杭州电子科技大学 一种基于用户历史行为序列的广告点击率预测方法
US20210216913A1 (en) * 2020-01-14 2021-07-15 Alibaba Group Holding Limited Prediction method, apparatus, and system for performing an image search
US20210280195A1 (en) * 2020-03-04 2021-09-09 Accenture Global Solutions Limited Infrastructure automation platform to assist in performing actions in response to tasks

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130031107A1 (en) * 2011-07-29 2013-01-31 Jen-Yi Pan Personalized ranking method of video and audio data on internet
CN110162706A (zh) * 2019-05-22 2019-08-23 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统
US20200410418A1 (en) * 2019-06-28 2020-12-31 EMC IP Holding Company LLC Analyzing cloud backup service options using historical data protection activities
CN110852446A (zh) * 2019-11-13 2020-02-28 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置和计算机可读存储介质
CN111125519A (zh) * 2019-12-11 2020-05-08 腾讯科技(深圳)有限公司 用户行为预测方法、装置、电子设备以及存储介质
US20210216913A1 (en) * 2020-01-14 2021-07-15 Alibaba Group Holding Limited Prediction method, apparatus, and system for performing an image search
US20210280195A1 (en) * 2020-03-04 2021-09-09 Accenture Global Solutions Limited Infrastructure automation platform to assist in performing actions in response to tasks
CN112288471A (zh) * 2020-10-26 2021-01-29 杭州电子科技大学 一种基于用户历史行为序列的广告点击率预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张椰;朱卫纲;: "基于迁移学习的SAR图像目标检测", 雷达科学与技术, no. 05 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118332189A (zh) * 2024-04-17 2024-07-12 星汉智能科技股份有限公司 基于预训练用户表征向量和自注意力机制的app预测方法

Also Published As

Publication number Publication date
CN114491342B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
US11687832B1 (en) Training a model using parameter server shards
US11669744B2 (en) Regularized neural network architecture search
US20210295163A1 (en) Neural architecture search
US12008445B2 (en) Black-box optimization using neural networks
US11544536B2 (en) Hybrid neural architecture search
US20210232929A1 (en) Neural architecture search
US20240127058A1 (en) Training neural networks using priority queues
US11922281B2 (en) Training machine learning models using teacher annealing
CN110692054A (zh) 预测数字分量的不可观察参数
US20190138912A1 (en) Determining insights from different data sets
US20190197077A1 (en) Machine learning based identification of broken network connections
US12131244B2 (en) Hardware-optimized neural architecture search
US11109085B2 (en) Utilizing one hash permutation and populated-value-slot-based densification for generating audience segment trait recommendations
CN114491342B (zh) 个性化模型的训练方法、信息显示方法及设备
CN115688002A (zh) 分类方法及装置、训练分类模型的方法及装置、分类模型
CN110502715B (zh) 点击概率的预测方法及装置
CN116720003B (zh) 排序处理方法、装置、计算机设备、及存储介质
US20240346811A1 (en) Method, apparatus, device and storage medium for feature aggregation
CN111131354A (zh) 用于生成信息的方法和装置
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置
US11455311B2 (en) Multi-locator system for tracking data elements in resources
CN115457500A (zh) 点云数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant