CN110874440A - 一种信息推送及其模型训练的方法、装置及电子设备 - Google Patents

一种信息推送及其模型训练的方法、装置及电子设备 Download PDF

Info

Publication number
CN110874440A
CN110874440A CN202010047773.0A CN202010047773A CN110874440A CN 110874440 A CN110874440 A CN 110874440A CN 202010047773 A CN202010047773 A CN 202010047773A CN 110874440 A CN110874440 A CN 110874440A
Authority
CN
China
Prior art keywords
user
cloud server
information
terminal devices
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010047773.0A
Other languages
English (en)
Other versions
CN110874440B (zh
Inventor
刘磊
杨耀
陈凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010047773.0A priority Critical patent/CN110874440B/zh
Publication of CN110874440A publication Critical patent/CN110874440A/zh
Application granted granted Critical
Publication of CN110874440B publication Critical patent/CN110874440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本说明书实施例公开了一种信息推送及其模型训练的方法、装置及电子设备,该方法包括:多个终端设备分别获取终端设备的用户的私有数据和对应的兴趣标签;多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。

Description

一种信息推送及其模型训练的方法、装置及电子设备
技术领域
本文件涉及计算机软件技术领域,尤其涉及一种信息推送及其模型训练的方法、装置及电子设备。
背景技术
目前,端云联邦学习往往包括一个中心化的云端训练平台和多个移动端训练器。在模型训练过程中,云端和移动端之间则会存在大量的数据交互,比如用户的原始数据、模型参数的传递以及加密后的梯度的传递等数据,再在云端基于用户的原始数据合并这些传递过来的模型参数和加密后的梯度,最后通过云端更新得到最终的模型参数和梯度等模型训练过程中的相关数据。
然而,在实际应用中,由于大多移动端的数据质量和通信速度质量往往会有所差异,这将会对模型训练的速度和质量带来不良的影响。此外,移动端向云端传递用户的原始数据也会涉及到用户私有数据的泄露,存在一定的安全隐患。
发明内容
本说明书实施例的目的是提供一种信息推送及其模型训练的方法、装置及电子设备,以优化模型的训练过程并保护用户的私有数据。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种信息推送模型的训练方法,包括:
多个终端设备分别获取终端设备的用户的私有数据和对应的兴趣标签;
多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;
所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第二方面,提出了一种信息推送方法,所述方法应用于云端服务器,包括:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
第三方面,提出了一种信息推送模型的训练方法,所述方法应用于终端设备,包括:
获取终端设备的用户的私有数据和对应的兴趣标签;
将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第四方面,提出了一种信息推送模型的训练方法,所述方法应用于云端服务器,包括:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第五方面,提出了一种信息推送模型的训练系统,包括多个终端设备和云端服务器,其中:
多个所述终端设备分别获取终端设备的用户的私有数据和对应的兴趣标签;以及分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;
所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第六方面,提出了一种云端服务器,包括:
接收单元,接收来自目标终端设备的用户的嵌入向量;
预测单元,将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
推送单元,将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
第七方面,提出了一种终端设备,包括:
获取单元,获取终端设备的用户的私有数据和对应的兴趣标签;
发送单元,将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第八方面,提出了一种云端服务器,包括:
训练单元,基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
预测单元,通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第九方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
第十方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
第十一方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取终端设备的用户的私有数据和对应的兴趣标签;
将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第十二方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取终端设备的用户的私有数据和对应的兴趣标签;
将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第十三方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
第十四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
由以上本说明书实施例提供的技术方案可见,本说明书实施例方案至少具备如下一种技术效果:
本说明书提供的一种或多个实施例,多个终端设备能够分别获取终端设备的用户的私有数据和对应的兴趣标签,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发射至云端服务器,云端服务器能够基于多个终端设备发射的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。由于终端设备向云端服务器发送的是经过特征提取模型提取得到的目标用户的特征向量,一方面,这些特征向量在一段时间内相对稳定,且相对于传输目标用户的私有数据而言,节省了终端设备与云端服务器之间传输数据占用的带宽;另一方面,这些特征向量能够保留目标用户的原始特征信息,且无法反推得到其原始数据,避免了终端设备的用户的私有数据的泄露。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书的一个实施例提供的一种信息推送模型的训练方法的实施流程示意图。
图2是本说明书的一个实施例提供的一种信息推送方法的流程示意图。
图3是本说明书的一个实施例提供的一种信息推送模型的训练方法应用于终端设备的流程示意图。
图4是本说明书的一个实施例提供的一种信息推送模型的训练方法应用于云端服务器的流程示意图。
图5是本说明书的一个实施例提供的一种信息推送模型的训练系统的结构示意图。
图6是本说明书的一个实施例提供的一种云端服务器的结构示意图。
图7是本说明书的一个实施例提供的一种终端设备的结构示意图。
图8是本说明书的一个实施例提供的另一种云端服务器的结构示意图。
图9是本说明书的一个实施例提供的第一种电子设备的结构示意图。
图10是本说明书的一个实施例提供的第二种电子设备的结构示意图。
图11是本说明书的一个实施例提供的第三种电子设备的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本文件一部分实施例,而不是全部的实施例。基于本文件中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文件保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
为避免用户私有数据的泄露,本说明书的一个实施例提供一种信息推送方法,多个终端设备能够分别获取终端设备的用户的私有数据和对应的兴趣标签,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发射至云端服务器,云端服务器能够基于多个终端设备发射的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
由于终端设备向云端服务器发送的是经过特征提取模型提取得到的目标用户的特征向量,一方面,这些特征向量在一段时间内相对稳定,且相对于传输目标用户的私有数据而言,节省了终端设备与云端服务器之间传输数据占用的带宽,优化了模型训练过程;另一方面,这些特征向量能够保留目标用户的原始特征信息,且无法反推得到其原始数据,避免了终端设备的用户的私有数据的泄露。
图1是本说明书的一个实施例提供的一种信息推送模型的训练方法的实施流程示意图。图1的方法可包括:
S110,多个终端设备分别获取终端设备的用户的私有数据和对应的兴趣标签;
其中,终端设备的用户的私有数据可包括用户的姓名、年龄、职业等社会属性相关的私有数据、以及用户对终端设备中的应用的行为操作记录。其中,该行为操作记录可包括终端设备中的用户对终端设备中的购物应用的消费记录、新闻类应用的浏览记录、购票应用的购票记录、以及用户与终端设备中的应用之间的交互记录等等数据。
兴趣标签可以是能够概括终端设备的用户感兴趣的标签,该兴趣标签可用于表征终端设备的用户感兴趣的内容标签,比如对年度旅游次数较多的用户来说,其兴趣标签可归纳为“旅游”、“特价机票”、“名胜古迹”等等,对于观看娱乐类新闻次数较频繁的用户来说,其兴趣标签可归纳为“八卦新闻”、“娱乐新闻”、“明星动态”等等。
S120,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;
可选地,为了提高获取终端设备中用户的私有数据对应的嵌入向量的效率,本说明书实施例可预先基于多个终端设备中用户的私有数据训练得到特征提取模型,用于基于终端设备中用户的私有数据提取得到用户的嵌入向量。多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,包括:
多个终端设备分别将终端设备中用户的私有数据输入到终端设备中的特征提取模型,得到多个终端设备中用户的嵌入向量;
多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器。
其中,特征提取模型可通过有监督和无监督两种方式训练得到,用户的私有数据对应的嵌入向量为基于用户的私有数据通过特征提取模型提取得到的。
可选地,为了提高通信效率,减小云端服务器的计算和处理压力,本说明书实施例可预先基于多个终端设备之间的通信距离将多个终端设备划分为几个通信群组(即团簇),先将团簇中各终端设备发送的数据先行聚合,再统一发送至云端服务器。其中,一个通信群组中选取一个通信位置在中心位置区域的终端设备作为通信节点,用于汇总其通信群组中的终端设备发送的用户的嵌入向量。具体地,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,包括:
云端服务器分别获取多个终端设备之间的通信距离;
云端服务器基于多个终端设备之间的通信距离,从多个终端设备中选取至少一个终端设备作为通信节点;
云端服务器将多个终端设备中与通信节点之间的通信距离小于或等于预设距离阈值的终端设备划分到对应的通信群组中,以通过通信节点汇总对应通信组群中的终端设备的用户的嵌入向量,其中,一个通信群组中包含一个通信节点,一个通信节点对应于一个终端设备;
通过通信节点分别将汇总后对应通信组群中的终端设备的用户的嵌入向量,发送给云端服务器。
可选地,由于在实际应用中,多个终端设备中可能存在一些终端设备发送的用户的嵌入向量的延时较长,这就可能会影响模型整体的训练效率,本说明书实施例为了解决这个问题,可对各个终端设备的延时时间段进行评估,去除延时时间段较长的终端设备。具体地,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器之后,所述方法还包括:
云端服务器获取多个终端设备发送对应的用户的特征向量的延时时间段;
云端服务器从多个终端设备中,去除延时时间段大于或等于预设时间阈值的终端设备。
S130,云端服务器基于多个终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
可选地,为了保证信息推送模型的质量,本说明书实施例中的云端服务器可对接收到的用户的嵌入向量进行校验,将与基准向量偏差较大的用户的嵌入向量进行淘汰。具体地,云端服务器基于多个终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,包括:
云端服务器对多个终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量;
云端服务器基于与基准向量的偏差小于或等于预设阈值的用户的嵌入向量,通过联邦学习训练得到信息推送模型。
其中,该基准向量可根据信息推送模型应用于实际的业务场景中的业务反馈来确定。
可选地,本说明书实施例中的云端服务器可根据用户的嵌入向量与基准向量之间的欧式距离,来对用户的嵌入向量进行校验。具体地,云端服务器对多个终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量,包括:
云端服务器分别确定多个终端设备中用户的嵌入向量、与基准向量之间的欧式距离;
云端服务器获取所述欧式距离小于或等于预设阈值的用户的嵌入向量。
本说明书提供的一种或多个实施例,多个终端设备能够分别获取终端设备的用户的私有数据和对应的兴趣标签,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发射至云端服务器,云端服务器能够基于多个终端设备发射的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。由于终端设备向云端服务器发送的是经过特征提取模型提取得到的目标用户的特征向量,一方面,这些特征向量在一段时间内相对稳定,且相对于传输目标用户的私有数据而言,节省了终端设备与云端服务器之间传输数据占用的带宽;另一方面,这些特征向量能够保留目标用户的原始特征信息,且无法反推得到其原始数据,避免了终端设备的用户的私有数据的泄露。
图2是本说明书的一个实施例提供的一种信息推送方法应用于云端服务器的流程示意图,包括:
S210,接收来自目标终端设备的用户的嵌入向量;
可选地,为了提高数据传输的安全级别,本说明书实施例中的终端设备在将目标终端设备的用户的嵌入向量发送给云端服务器之前,可对目标终端设备的用户的嵌入向量进行加密处理。具体地,终端设备将目标终端设备的用户的特征向量发送给云端服务器,包括:
对目标终端设备的用户的嵌入向量进行加密处理,得到加密处理后的目标终端设备的用户的特征向量;
将加密处理后的目标终端设备的用户的特征向量发送给云端服务器。
其中,对目标终端设备的用户的特征向量进行加密处理,具体可以通过终端设备的私钥对目标终端设备的用户的特征向量进行加密处理,在云端服务器接收到该目标终端设备的用户的特征向量之后,可通过与终端设备的私钥配对的公钥对加密处理后的目标终端设备的用户的特征向量进行解密处理,得到目标终端设备的用户的特征向量。
S220,将目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测目标终端设备的用户的兴趣标签;
其中,信息推送模型为基于多个终端设备发送的终端设备中用户的嵌入向量和对应的兴趣标签,通过联邦学习的训练方式训练得到的。
应理解,该兴趣标签可用于表征终端设备的用户感兴趣的内容标签,比如对年度旅游次数较多的用户来说,其兴趣标签可归纳为“旅游”、“特价机票”、“名胜古迹”等等,对于观看娱乐类新闻次数较频繁的用户来说,其兴趣标签可归纳为“八卦新闻”、“娱乐新闻”、“明星动态”等等。
S230,将与目标终端设备的用户的兴趣标签对应的信息推送给目标终端设备的用户。
应理解,为便于为用户确定其感兴趣的信息并推送给用户,本说明书实施例可预先基于信息所属类别、包含的关键字等归类因素将待推荐给用户的信息进行归类,并对不同类别的信息标记对应的兴趣标签。这样在确定了目标终端设备的用户的兴趣标签之后,便可基于该兴趣标签,为目标终端设备的用户推送与兴趣标签相对应的信息。
本说明书实施例提供的信息推送方法,能够通过云端服务器接收来自目标终端设备的用户的嵌入向量,并将目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测目标终端设备的用户的兴趣标签,最后,将与目标终端设备的用户的兴趣标签对应的信息推送给目标终端设备的用户。由于终端设备向云端服务器传递的数据为终端设备的用户的嵌入向量,该嵌入向量相对于用户的私有数据而言,不会泄露用户的隐私,因此在为用户确定待推送的信息过程中,不会泄露终端设备的用户的私有数据,保障了终端设备的用户的私有数据不会被泄露。
图3是本说明书的一个实施例提供的一种信息推送模型的训练方法应用于终端设备的流程示意图,包括:
S310,获取终端设备的用户的私有数据和对应的兴趣标签;
S320,将终端设备的用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得云端服务器基于多个终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
可选地,将终端设备的用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,包括:
将终端设备中用户的私有数据输入到终端设备中的特征提取模型,得到多个所述终端设备中用户的嵌入向量;
将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器。
可选地,为提高终端设备与云端服务器之间的数据传输效率,可根据多个终端设备之间的通信距离,将多个终端设备划分为一些通信群组,一个通信群组中有一个通信节点,该通信节点为基于这个通信群组中包含的终端设备之间的通信距离选取的一个终端设备,该通信节点可以是通信位置在该通信群组中心附近的一个终端设备。该通信节点可以先将对应的通信群组中的终端设备发送的用户的嵌入向量和兴趣标签进行汇总,再统一发送至云端服务器,从而减少云端服务器的通信和计算压力。
图3所示实施例相关步骤的具体实现可参考图1所示实施例中对应的步骤的具体实现,本说明书一个或多个实施例在此不再赘述。
本说明书提供的一种或多个实施例,多个终端设备能够分别获取终端设备的用户的私有数据和对应的兴趣标签,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发射至云端服务器,云端服务器能够基于多个终端设备发射的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。由于终端设备向云端服务器发送的是经过特征提取模型提取得到的目标用户的特征向量,一方面,这些特征向量在一段时间内相对稳定,且相对于传输目标用户的私有数据而言,节省了终端设备与云端服务器之间传输数据占用的带宽;另一方面,这些特征向量能够保留目标用户的原始特征信息,且无法反推得到其原始数据,避免了终端设备的用户的私有数据的泄露。
图4是本说明书的一个实施例提供的一种信息推送模型的训练方法应用于云端服务器的流程示意图,包括:
S410,基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
可选地,基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,包括:
对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量;
基于与所述基准向量的偏差小于或等于预设阈值的用户的嵌入向量,通过联邦学习训练得到所述信息推送模型。
可选地,基于所述多个终端设备对应用户的嵌入向量和对应的兴趣标签,通过联邦学习训练得到信息推送模型,包括:
对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量;
基于与所述基准向量的偏差小于或等于预设阈值的用户的嵌入向量,通过联邦学习训练得到所述信息推送模型。
可选地,对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量,包括:
分别确定多个所述终端设备中用户的嵌入向量、与所述基准向量之间的欧式距离;
获取所述欧式距离小于或等于预设阈值的用户的嵌入向量。
可选地,在获取了多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签之后,所述方法还包括:
获取所述多个终端设备发送对应的用户的特征向量的延时时间段;
从所述多个终端设备中,去除所述延时时间段大于或等于预设时间阈值的终端设备。
S420,通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
图4所示实施例相关步骤的具体实现可参考图1所示实施例中对应的步骤的具体实现,本说明书一个或多个实施例在此不再赘述。
本说明书提供的一种或多个实施例,多个终端设备能够分别获取终端设备的用户的私有数据和对应的兴趣标签,多个终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发射至云端服务器,云端服务器能够基于多个终端设备发射的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。由于终端设备向云端服务器发送的是经过特征提取模型提取得到的目标用户的特征向量,一方面,这些特征向量在一段时间内相对稳定,且相对于传输目标用户的私有数据而言,节省了终端设备与云端服务器之间传输数据占用的带宽;另一方面,这些特征向量能够保留目标用户的原始特征信息,且无法反推得到其原始数据,避免了终端设备的用户的私有数据的泄露。
图5是本说明书的一个实施例提供的一种信息推送模型的训练系统500的结构示意图,包括多个终端设501和云端服务器502,其中:
多个终端设备501分别获取终端设备的用户的私有数据和对应的兴趣标签;以及分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;
云端服务器502基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
可选地,在一种实施方式中,多个所述终端设备501还用于:
分别将终端设备中用户的私有数据输入到终端设备中的特征提取模型,得到多个所述终端设备中用户的嵌入向量;
分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器。
可选地,在一种实施方式中,所述云端服务器502还用于:
分别获取多个所述终端设备之间的通信距离;
基于多个所述终端设备之间的通信距离,从多个所述终端设备中选取至少一个终端设备作为通信节点;
将多个所述终端设备中与所述通信节点之间的通信距离小于或等于预设距离阈值的终端设备划分到对应的通信群组中,以通过所述通信节点汇总对应通信组群中的终端设备的用户的嵌入向量,其中,一个通信群组中包含一个通信节点,一个通信节点对应于一个终端设备。
可选地,在一种实施方式中,通过所述通信节点分别将所述汇总后对应通信组群中的终端设备的用户的嵌入向量,发送给所述云端服务器。
可选地,在一种实施方式中,所述云端服务器502还用于:
对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量;
基于与所述基准向量的偏差小于或等于预设阈值的用户的嵌入向量,通过联邦学习训练得到所述信息推送模型。
可选地,在一种实施方式中,所述云端服务器502还用于:
分别确定多个所述终端设备中用户的嵌入向量、与所述基准向量之间的欧式距离;
获取所述欧式距离小于或等于预设阈值的用户的嵌入向量。
可选地,在一种实施方式中,所述云端服务器502还用于:
获取所述多个终端设备发送对应的用户的特征向量的延时时间段;
从所述多个终端设备中,去除所述延时时间段大于或等于预设时间阈值的终端设备。
信息推送模型的训练系统500能够实现图1的方法实施例的方法,具体可参考图1所示实施例的信息推送模型的训练方法,不再赘述。
图6是本说明书的一个实施例提供的一种云端服务器600的结构示意图,包括:
接收单元601,接收来自目标终端设备的用户的嵌入向量;
预测单元602,将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
推送单元603,将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
云端服务器600能够实现图1~图2的方法实施例的方法,具体可参考图1~图2所示实施例的信息推送方法,不再赘述。
图7是本说明书的一个实施例提供的一种终端设备700的结构示意图,包括:
获取单元701,获取终端设备的用户的私有数据和对应的兴趣标签;
发送单元702,将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
可选地,在一种实施方式中,所述发送单元702,用于:
分别将终端设备中用户的私有数据输入到终端设备中的特征提取模型,得到多个所述终端设备中用户的嵌入向量;
分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器。
可选地,在一种实施方式中,所述发送单元702,用于:
分别多个所述终端设备中用户的嵌入向量及对应的兴趣标签进行加密处理;
分别将加密处理后的终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器。
终端设备700能够实现图1~图2的方法实施例的方法,具体可参考图1~图2所示实施例的信息推送模型的训练方法,不再赘述。
图8是本说明书的一个实施例提供的另一种云端服务器800的结构示意图,包括:
训练单元801,基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
预测单元802,通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
可选地,在一种实施方式中,所述云端服务器800还包括:
获取单元803,分别获取多个所述终端设备之间的通信距离;
选取单元804,基于多个所述终端设备之间的通信距离,从多个所述终端设备中选取至少一个终端设备作为通信节点;
分组单元805,将多个所述终端设备中与所述通信节点之间的通信距离小于或等于预设距离阈值的终端设备划分到对应的通信群组中,以通过所述通信节点汇总并发送对应通信组群中的终端设备的用户的嵌入向量,其中,一个通信群组中包含一个通信节点,一个通信节点对应于一个终端设备。
可选地,在一种实施方式中,所述预测单元802,用于:
对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量;
基于与所述基准向量的偏差小于或等于预设阈值的用户的嵌入向量,通过联邦学习训练得到所述信息推送模型。
可选地,在一种实施方式中,所述预测单元802,用于:
分别确定多个所述终端设备中用户的嵌入向量、与所述基准向量之间的欧式距离;
获取所述欧式距离小于或等于预设阈值的用户的嵌入向量。
可选地,在一种实施方式中,所述云端服务器800还包括:
延时获取单元806,获取所述多个终端设备发送对应的用户的特征向量的延时时间段;
去除单元807,从所述多个终端设备中,去除所述延时时间段大于或等于预设时间阈值的终端设备。
云端服务器800能够实现图1~图2的方法实施例的方法,具体可参考图1~图2所示实施例的信息推送模型的训练方法,不再赘述。
图9是本说明书的一个实施例电子设备的结构示意图。请参考图9,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成信息推送装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
上述如本说明书图2所示实施例揭示的信息推送方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图2的方法,并实现信息推送装置在图2所示实施例的功能,本说明书实施例在此不再赘述。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图2所示实施例的方法,并具体用于执行以下操作:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
图10是本说明书的一个实施例电子设备的结构示意图。请参考图10,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成信息推送模型的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取终端设备的用户的私有数据和对应的兴趣标签;
将所述终端设备的用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
上述如本说明书图3所示实施例揭示的信息推送模型的训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图3的方法,并实现信息推送模型的训练装置在图3所示实施例的功能,本说明书实施例在此不再赘述。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图3所示实施例的方法,并具体用于执行以下操作:
获取终端设备的用户的私有数据和对应的兴趣标签;
将所述终端设备的用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
图11是本说明书的一个实施例电子设备的结构示意图。请参考图11,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成信息推送模型的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
上述如本说明书图4所示实施例揭示的信息推送模型的训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图4的方法,并实现信息推送模型的训练装置在图4所示实施例的功能,本说明书实施例在此不再赘述。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图4所示实施例的方法,并具体用于执行以下操作:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (19)

1.一种信息推送模型的训练方法,包括:
多个终端设备分别获取终端设备的用户的私有数据和对应的兴趣标签;
多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;
所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
2.如权利要求1所述的方法,多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,包括:
多个所述终端设备分别将终端设备中用户的私有数据输入到终端设备中的特征提取模型,得到多个所述终端设备中用户的嵌入向量;
多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器。
3.如权利要求1所述的方法,多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,包括:
所述云端服务器分别获取多个所述终端设备之间的通信距离;
所述云端服务器基于多个所述终端设备之间的通信距离,从多个所述终端设备中选取至少一个终端设备作为通信节点;
所述云端服务器将多个所述终端设备中与所述通信节点之间的通信距离小于或等于预设距离阈值的终端设备划分到对应的通信群组中,以通过所述通信节点汇总对应通信组群中的终端设备的用户的嵌入向量,其中,一个通信群组中包含一个通信节点,一个通信节点对应于一个终端设备;
通过所述通信节点分别将所述汇总后对应通信组群中的终端设备的用户的嵌入向量,发送给所述云端服务器。
4.如权利要求1所述的方法,所述云端服务器基于所述多个终端设备对应用户的嵌入向量和对应的兴趣标签,通过联邦学习训练得到信息推送模型,包括:
所述云端服务器对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量;
所述云端服务器基于与所述基准向量的偏差小于或等于预设阈值的用户的嵌入向量,通过联邦学习训练得到所述信息推送模型。
5.如权利要求4所述的方法,所述云端服务器对多个所述终端设备中用户的嵌入向量进行校验,得到与基准向量的偏差小于或等于预设阈值的用户的嵌入向量,包括:
所述云端服务器分别确定多个所述终端设备中用户的嵌入向量、与所述基准向量之间的欧式距离;
所述云端服务器获取所述欧式距离小于或等于预设阈值的用户的嵌入向量。
6.如权利要求1所述的方法,多个所述终端设备分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器之后,所述方法还包括:
所述云端服务器获取所述多个终端设备发送对应的用户的特征向量的延时时间段;
所述云端服务器从所述多个终端设备中,去除所述延时时间段大于或等于预设时间阈值的终端设备。
7.一种信息推送方法,所述方法应用于云端服务器,包括:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
8.一种信息推送模型的训练方法,所述方法应用于终端设备,包括:
获取终端设备的用户的私有数据和对应的兴趣标签;
将所述终端设备的用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
9.一种信息推送模型的训练方法,所述方法应用于云端服务器,包括:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
10.一种信息推送模型的训练系统,包括多个终端设备和云端服务器,其中:
多个所述终端设备分别获取终端设备的用户的私有数据和对应的兴趣标签;以及分别将终端设备中用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器;
所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
11.一种云端服务器,包括:
接收单元,接收来自目标终端设备的用户的嵌入向量;
预测单元,将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
推送单元,将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
12.一种终端设备,包括:
获取单元,获取终端设备的用户的私有数据和对应的兴趣标签;
发送单元,将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
13.一种云端服务器,包括:
训练单元,基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
预测单元,通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
14.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
15.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
接收来自目标终端设备的用户的嵌入向量;
将所述目标终端设备的用户的嵌入向量输入到通过联邦学习训练得到的信息推送模型,预测所述目标终端设备的用户的兴趣标签;
将与所述目标终端设备的用户的兴趣标签对应的信息推送给所述目标终端设备的用户。
16.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取终端设备的用户的私有数据和对应的兴趣标签;
将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
17.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取终端设备的用户的私有数据和对应的兴趣标签;
将用户的私有数据对应的嵌入向量及兴趣标签发送至云端服务器,以使得所述云端服务器基于多个所述终端设备发送的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型,以及通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
18.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
19.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于多个终端设备发送的用户的私有数据对应的嵌入向量及兴趣标签,通过联邦学习训练得到信息推送模型;
通过所述信息推送模型预测用户的兴趣标签并推送兴趣标签对应的信息。
CN202010047773.0A 2020-01-16 2020-01-16 一种信息推送及其模型训练的方法、装置及电子设备 Active CN110874440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047773.0A CN110874440B (zh) 2020-01-16 2020-01-16 一种信息推送及其模型训练的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047773.0A CN110874440B (zh) 2020-01-16 2020-01-16 一种信息推送及其模型训练的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110874440A true CN110874440A (zh) 2020-03-10
CN110874440B CN110874440B (zh) 2020-05-05

Family

ID=69718312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047773.0A Active CN110874440B (zh) 2020-01-16 2020-01-16 一种信息推送及其模型训练的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110874440B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428887A (zh) * 2020-03-19 2020-07-17 腾讯云计算(北京)有限责任公司 一种基于多个计算节点的模型训练控制方法、装置及系统
CN111476376A (zh) * 2020-06-24 2020-07-31 支付宝(杭州)信息技术有限公司 联盟学习方法、联盟学习装置及联盟学习系统
CN111737586A (zh) * 2020-08-19 2020-10-02 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN111736712A (zh) * 2020-06-24 2020-10-02 北京百度网讯科技有限公司 输入信息的预测方法、系统、服务器及电子设备
CN111800411A (zh) * 2020-07-02 2020-10-20 支付宝(杭州)信息技术有限公司 保护隐私的业务预测模型联合更新方法及装置
CN112085208A (zh) * 2020-07-30 2020-12-15 北京聚云科技有限公司 一种利用云端进行模型训练的方法及装置
CN112383440A (zh) * 2020-12-01 2021-02-19 苏州中德双智科创发展有限公司 云端模型准确性提高方法、装置、电子设备及存储介质
CN112396189A (zh) * 2020-11-27 2021-02-23 中国银联股份有限公司 一种多方构建联邦学习模型的方法及装置
CN112800467A (zh) * 2021-02-18 2021-05-14 支付宝(杭州)信息技术有限公司 基于数据隐私保护的在线模型训练方法、装置以及设备
CN112819180A (zh) * 2021-01-26 2021-05-18 华中科技大学 一种基于联邦生成模型的多业务数据生成方法和装置
CN113271328A (zh) * 2020-09-23 2021-08-17 苏州市中拓互联信息科技有限公司 一种云服务器信息管理方法及系统
CN113537512A (zh) * 2021-07-15 2021-10-22 青岛海尔工业智能研究院有限公司 基于联邦学习的模型训练方法、装置、系统、设备和介质
WO2021254269A1 (zh) * 2020-06-17 2021-12-23 华为技术有限公司 确定用户的特征的方法、设备及计算机可读介质
WO2022057694A1 (en) * 2020-09-16 2022-03-24 International Business Machines Corporation Semantic learning in federated learning system
CN114549951A (zh) * 2020-11-26 2022-05-27 未岚大陆(北京)科技有限公司 获得训练数据的方法、相关设备、系统及存储介质
CN118332196A (zh) * 2024-06-13 2024-07-12 时趣互动(北京)科技有限公司 基于用户兴趣标签的信息推送方法、设备与介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104159258A (zh) * 2013-05-15 2014-11-19 电信科学技术研究院 一种通信节点状态调整方法、装置及系统
CN110297848A (zh) * 2019-07-09 2019-10-01 深圳前海微众银行股份有限公司 基于联邦学习的推荐模型训练方法、终端及存储介质
CN110516161A (zh) * 2019-08-30 2019-11-29 深圳前海微众银行股份有限公司 一种推荐方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104159258A (zh) * 2013-05-15 2014-11-19 电信科学技术研究院 一种通信节点状态调整方法、装置及系统
CN110297848A (zh) * 2019-07-09 2019-10-01 深圳前海微众银行股份有限公司 基于联邦学习的推荐模型训练方法、终端及存储介质
CN110516161A (zh) * 2019-08-30 2019-11-29 深圳前海微众银行股份有限公司 一种推荐方法及装置

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428887A (zh) * 2020-03-19 2020-07-17 腾讯云计算(北京)有限责任公司 一种基于多个计算节点的模型训练控制方法、装置及系统
WO2021254269A1 (zh) * 2020-06-17 2021-12-23 华为技术有限公司 确定用户的特征的方法、设备及计算机可读介质
CN111476376A (zh) * 2020-06-24 2020-07-31 支付宝(杭州)信息技术有限公司 联盟学习方法、联盟学习装置及联盟学习系统
CN111736712A (zh) * 2020-06-24 2020-10-02 北京百度网讯科技有限公司 输入信息的预测方法、系统、服务器及电子设备
CN111736712B (zh) * 2020-06-24 2023-08-18 北京百度网讯科技有限公司 输入信息的预测方法、系统、服务器及电子设备
CN111800411A (zh) * 2020-07-02 2020-10-20 支付宝(杭州)信息技术有限公司 保护隐私的业务预测模型联合更新方法及装置
CN111800411B (zh) * 2020-07-02 2021-04-02 支付宝(杭州)信息技术有限公司 保护隐私的业务预测模型联合更新方法及装置
CN112085208A (zh) * 2020-07-30 2020-12-15 北京聚云科技有限公司 一种利用云端进行模型训练的方法及装置
CN111737586A (zh) * 2020-08-19 2020-10-02 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
US11494700B2 (en) 2020-09-16 2022-11-08 International Business Machines Corporation Semantic learning in a federated learning system
GB2614151A (en) * 2020-09-16 2023-06-28 Ibm Semantic learning in federated learning system
US11681951B2 (en) 2020-09-16 2023-06-20 International Business Machines Corporation Semantic learning in a federated learning system
WO2022057694A1 (en) * 2020-09-16 2022-03-24 International Business Machines Corporation Semantic learning in federated learning system
CN113271328B (zh) * 2020-09-23 2022-07-19 苏州市中拓互联信息科技有限公司 一种云服务器信息管理方法及系统
CN113271328A (zh) * 2020-09-23 2021-08-17 苏州市中拓互联信息科技有限公司 一种云服务器信息管理方法及系统
CN114549951B (zh) * 2020-11-26 2024-04-23 未岚大陆(北京)科技有限公司 获得训练数据的方法、相关设备、系统及存储介质
CN114549951A (zh) * 2020-11-26 2022-05-27 未岚大陆(北京)科技有限公司 获得训练数据的方法、相关设备、系统及存储介质
CN112396189B (zh) * 2020-11-27 2023-09-01 中国银联股份有限公司 一种多方构建联邦学习模型的方法及装置
CN112396189A (zh) * 2020-11-27 2021-02-23 中国银联股份有限公司 一种多方构建联邦学习模型的方法及装置
CN112383440A (zh) * 2020-12-01 2021-02-19 苏州中德双智科创发展有限公司 云端模型准确性提高方法、装置、电子设备及存储介质
CN112819180A (zh) * 2021-01-26 2021-05-18 华中科技大学 一种基于联邦生成模型的多业务数据生成方法和装置
CN112800467B (zh) * 2021-02-18 2022-08-26 支付宝(杭州)信息技术有限公司 基于数据隐私保护的在线模型训练方法、装置以及设备
CN112800467A (zh) * 2021-02-18 2021-05-14 支付宝(杭州)信息技术有限公司 基于数据隐私保护的在线模型训练方法、装置以及设备
CN113537512A (zh) * 2021-07-15 2021-10-22 青岛海尔工业智能研究院有限公司 基于联邦学习的模型训练方法、装置、系统、设备和介质
CN113537512B (zh) * 2021-07-15 2024-03-15 卡奥斯工业智能研究院(青岛)有限公司 基于联邦学习的模型训练方法、装置、系统、设备和介质
CN118332196A (zh) * 2024-06-13 2024-07-12 时趣互动(北京)科技有限公司 基于用户兴趣标签的信息推送方法、设备与介质

Also Published As

Publication number Publication date
CN110874440B (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN110874440B (zh) 一种信息推送及其模型训练的方法、装置及电子设备
CN110321958B (zh) 神经网络模型的训练方法、视频相似度确定方法
CN107423085B (zh) 用于部署应用的方法和装置
CN110826006B (zh) 基于隐私数据保护的异常采集行为识别方法和装置
CN110598157B (zh) 目标信息识别方法、装置、设备及存储介质
CN108550046B (zh) 一种资源和营销推荐方法、装置及电子设备
CN110633423B (zh) 目标账号识别方法、装置、设备及存储介质
CN110392155B (zh) 通知消息的显示、处理方法、装置及设备
CN111291258A (zh) 搜索热词的推荐方法、装置、电子设备及可读介质
CN111262744B (zh) 多媒体信息发送方法、备份服务器及介质
CN110245684B (zh) 数据处理方法、电子设备和介质
CN116108150A (zh) 一种智能问答方法、装置、系统及电子设备
US20230315990A1 (en) Text detection method and apparatus, electronic device, and storage medium
CN113343069A (zh) 用户信息的处理方法、装置、介质及电子设备
CN113191257A (zh) 笔顺检测方法、装置和电子设备
CN111275071B (zh) 预测模型训练、预测方法、装置及电子设备
CN109120509B (zh) 一种信息收集的方法及装置
CN114329093B (zh) 数据的处理方法、装置及设备
CN114462502B (zh) 一种核身推荐模型训练方法及装置
CN115269978A (zh) 一种视频标签生成方法、装置、设备及介质
CN110443746B (zh) 基于生成对抗网络的图片处理方法、装置及电子设备
CN113284027A (zh) 团伙识别模型的训练方法、异常团伙识别方法及装置
CN112860999A (zh) 信息推荐方法、装置、设备和存储介质
CN111461825A (zh) 一种虚拟资源的生成方法、装置、电子设备及存储介质
CN111625721A (zh) 内容推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Yang Yao

Inventor after: Liu Lei

Inventor after: Chen Ling

Inventor before: Liu Lei

Inventor before: Yang Yao

Inventor before: Chen Ling