CN111797869A - 模型训练方法、装置、存储介质及电子设备 - Google Patents

模型训练方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111797869A
CN111797869A CN201910282429.7A CN201910282429A CN111797869A CN 111797869 A CN111797869 A CN 111797869A CN 201910282429 A CN201910282429 A CN 201910282429A CN 111797869 A CN111797869 A CN 111797869A
Authority
CN
China
Prior art keywords
model
training
user
parameters
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910282429.7A
Other languages
English (en)
Inventor
何明
陈仲铭
黄粟
刘耀勇
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910282429.7A priority Critical patent/CN111797869A/zh
Publication of CN111797869A publication Critical patent/CN111797869A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本申请实施例提供一种模型训练方法、装置、存储介质及电子设备,所述模型训练方法包括:使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;获取所述第一模型的第一模型参数;获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。所述模型训练方法中,由于第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。

Description

模型训练方法、装置、存储介质及电子设备
技术领域
本申请涉及电子技术领域,特别涉及一种模型训练方法、装置、存储介质及电子设备。
背景技术
随着电子技术的发展,诸如智能手机等电子设备能够为用户提供的服务越来越多。例如,电子设备能够将用户存储的大量图像进行分类、能够根据用户的出行习惯推荐旅游目的地。而为了能够给用户提供针对性、个性化的服务,电子设备需要根据用户的数据对用户进行针对性的建模。
发明内容
本申请实施例提供一种模型训练方法、装置、存储介质及电子设备,可以提高模型对任务处理的处理效果,同时保护其他用户的隐私信息。
本申请实施例提供一种模型训练方法,包括:
使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;
获取所述第一模型的第一模型参数;
获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;
对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
本申请实施例还提供一种模型训练装置,包括:
第一训练模块,用于使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;
第一获取模块,用于获取所述第一模型的第一模型参数;
第二获取模块,用于获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;
第二训练模块,用于对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述模型训练方法。
本申请实施例还提供一种电子设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行上述模型训练方法。
本申请实施例提供的模型训练方法,包括:使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;获取所述第一模型的第一模型参数;获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。所述模型训练方法中,由于通过多个第二模型参数对第一模型参数进行补充,并通过训练得到第一用户的第三模型,也即所述第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的电子设备中的全景感知架构示意图。
图2为本申请实施例提供的模型训练方法的应用场景示意图。
图3为本申请实施例提供的模型训练方法的第一种流程示意图。
图4为本申请实施例提供的模型训练方法的第二种流程示意图。
图5为本申请实施例提供的模型训练方法的第三种流程示意图。
图6为本申请实施例提供的模型训练装置的第一种结构示意图。
图7为本申请实施例提供的模型训练装置的第二种结构示意图。
图8为本申请实施例提供的电子设备的第一种结构示意图。
图9为本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
参考图1,图1为本申请实施例提供的电子设备中的全景感知架构示意图。所述全景感知架构为电子设备中用于实现本申请的模型训练方法的硬件和软件的集成。
其中,全景感知架构包括信息感知层、数据处理层、特征抽取层、情景建模层以及智能服务层。
信息感知层用于获取电子设备自身的信息或者外部环境中的信息。所述信息感知层可以包括多个传感器。例如,所述信息感知层包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
其中,距离传感器可以用于检测电子设备与外部物体之间的距离。磁场传感器可以用于检测电子设备所处环境的磁场信息。光线传感器可以用于检测电子设备所处环境的光线信息。加速度传感器可以用于检测电子设备的加速度数据。指纹传感器可以用于采集用户的指纹信息。霍尔传感器是根据霍尔效应制作的一种磁场传感器,可以用于实现电子设备的自动控制。位置传感器可以用于检测电子设备当前所处的地理位置。陀螺仪可以用于检测电子设备在各个方向上的角速度。惯性传感器可以用于检测电子设备的运动数据。姿态感应器可以用于感应电子设备的姿态信息。气压计可以用于检测电子设备所处环境的气压。心率传感器可以用于检测用户的心率信息。
数据处理层用于对信息感知层获取到的数据进行处理。例如,数据处理层可以对信息感知层获取到的数据进行数据清理、数据集成、数据变换、数据归约等处理。
其中,数据清理是指对信息感知层获取到的大量数据进行清理,以剔除无效数据和重复数据。数据集成是指将信息感知层获取到的多个单维度数据集成到一个更高或者更抽象的维度,以对多个单维度的数据进行综合处理。数据变换是指对信息感知层获取到的数据进行数据类型的转换或者格式的转换等,以使变换后的数据满足处理的需求。数据归约是指在尽可能保持数据原貌的前提下,最大限度的精简数据量。
特征抽取层用于对数据处理层处理后的数据进行特征抽取,以提取所述数据中包括的特征。提取到的特征可以反映出电子设备自身的状态或者用户的状态或者电子设备所处环境的环境状态等。
其中,特征抽取层可以通过过滤法、包装法、集成法等方法来提取特征或者对提取到的特征进行处理。
过滤法是指对提取到的特征进行过滤,以删除冗余的特征数据。包装法用于对提取到的特征进行筛选。集成法是指将多种特征提取方法集成到一起,以构建一种更加高效、更加准确的特征提取方法,用于提取特征。
情景建模层用于根据特征抽取层提取到的特征来构建模型,所得到的模型可以用于表示电子设备的状态或者用户的状态或者环境状态等。例如,情景建模层可以根据特征抽取层提取到的特征来构建关键值模型、模式标识模型、图模型、实体联系模型、面向对象模型等。
智能服务层用于根据情景建模层所构建的模型为用户提供智能化的服务。例如,智能服务层可以为用户提供基础应用服务,可以为电子设备进行系统智能优化,还可以为用户提供个性化智能服务。
此外,全景感知架构中还可以包括多种算法,每一种算法都可以用于对数据进行分析处理,所述多种算法可以构成算法库。例如,所述算法库中可以包括马尔科夫算法、隐含狄里克雷分布算法、贝叶斯分类算法、支持向量机分类算法、K均值聚类算法、K近邻算法、条件随机场、残差网络、长短期记忆网络、卷积神经网络、循环神经网络等算法。
本申请实施例提供一种模型训练方法,所述模型训练方法可以应用于电子设备。所述电子设备可以为智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
参考图2,图2为本申请实施例提供的模型训练方法的应用场景示意图。
其中,所述模型训练方法可以应用于一数据共享系统中,所述数据共享系统包括服务器、第一电子设备以及多个第二电子设备。所述第一电子设备、每一所述第二电子设备均与所述服务器数据连接,也即所述第一电子设备、每一所述第二电子设备都能够与所述服务器进行数据通信。
其中,所述第一电子设备对应于第一用户。所述第一电子设备可以获取第一用户的数据,并进行训练以生成针对所述第一用户的模型。所述第一电子设备可以将训练得到的模型中的参数上传至服务器,也可以从所述服务器获取第二电子设备上传的模型参数。
每一所述第二电子设备对应于一个第二用户。所述第二电子设备可以获取第二用户的数据,并进行训练以生成针对所述第二用户的模型。所述第二电子设备可以将训练得到的模型中的参数上传至服务器,也可以从所述服务器获取所述第一电子设备或者其它第二电子设备上传的模型参数。
以下从上述第一电子设备的角度对本申请的实施方式进行阐述。需要说明的是,在实际应用中,所述第一电子设备与任意一个所述第二电子设备的角度可以互换。也即,在所述数据共享系统中,所述第一电子设备也可以作为第二电子设备,任意一个所述第二电子设备也可以作为第一电子设备。
参考图3,图3为本申请实施例提供的模型训练方法的第一种流程示意图。
其中,所述模型训练方法包括以下步骤:
110,使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型。
其中,第一电子设备可以获取第一用户的训练数据,并使用获取到的第一训练数据进行模型训练,以得到所述第一用户的第一模型。例如,第一电子设备可以通过全景感知架构中的各个硬件结构或者硬件与软件的结合来采集第一用户的训练数据。
所述训练数据可以随着任务需求的不同而不同。例如,当本申请训练得到的最终模型用于处理图像分类任务时,所述训练数据可以包括图像数据。当本申请训练得到的最终模型用于向用户推荐信息时,所述训练数据可以包括用户的行为习惯数据。
所述第一模型是根据所述第一用户的训练数据得到的,由于一个用户的训练数据的数据量是有限的,因此所述第一模型在处理相应的任务时,得到的处理结果往往与所述第一用户的预期存在差距。
例如,当所述第一模型用于处理图像分类任务时,也即所述第一模型为图像分类模型时,所述第一模型对图像进行分类的准确性可能会比较低。因此,需要对所述第一模型继续进行完善。
其中,第一电子设备使用第一用户的训练数据进行模型训练时,可以根据预设算法进行训练。例如,所述预设算法可以包括诸如卷积神经网络算法、循环神经网络算法等神经网络算法中的一种。所述预设算法也可以包括诸如贝叶斯分类算法、支持向量机分类算法等分类算法中的一种。
需要说明的是,所述预设算法可以根据任务需求进行选择。需要处理的任务不同时,所述预设算法可以是不同的。需要处理的任务相同,而任务的复杂程度不同时,所述预设算法也可以是不同的。
120,获取所述第一模型的第一模型参数。
第一电子设备训练得到第一模型后,可以获取所述第一模型的第一模型参数。其中,所述第一模型参数可以包括所述第一模型的全部参数,也可以包括所述第一模型的部分参数。
当所述第一模型不同时,所述第一模型参数的参数类型也可以是不同的。
例如,当所述预设算法包括神经网络算法时,所述第一模型可以包括神经网络模型。此时,所述第一模型参数可以包括神经网络模型中神经元的权重值。
再例如,当所述预设算法包括分类算法时,所述第一模型可以包括分类模型。此时,所述第一模型参数可以包括分类模型中类的特征值。
需要说明的是,所述第一用户的训练数据由于是直接采集得到的,因此所述训练数据可以反映出所述第一用户的个人特征。也即,所述训练数据涉及到所述第一用户的个人隐私信息。而所述第一模型参数是从所述第一模型中得到的,所述第一模型又是经过训练得到的,因此所述第一模型参数只能反映出所述训练数据的数据特征。也即,所述第一模型参数不涉及所述第一用户的个人隐私信息。
130,获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到。
第一电子设备还可以获取多个第二模型参数,以对所述第一模型参数进行补充,扩大模型参数的数据量。其中,每一所述第二模型参数对应于一个第二模型,也即每一所述第二模型参数从一个第二模型中得到。每一所述第二模型由一个第二用户的训练数据训练得到。
其中,每一所述第二模型的类型与所述第一模型的类型是相同的。每一所述第二模型参数的类型与所述第一模型参数的类型也是相同的。由第二用户的训练数据训练得到第二模型的过程可以参考上述第一模型的训练过程,从第二模型中得到第二模型参数可以参考上述第一模型参数的获取过程,在此不再赘述。
在一些实施例中,每一所述第二模型由一个第二用户的训练数据根据所述预设算法训练得到。也即,每一所述第二模型与所述第一模型根据相同的预设算法训练得到。
当所述预设算法包括神经网络算法时,每一所述第二模型可以包括神经网络模型。此时,每一所述第二模型参数可以包括神经网络模型中神经元的权重值。
当所述预设算法包括分类算法时,每一所述第二模型可以包括分类模型。此时,每一所述第二模型参数可以包括分类模型中类的特征值。
需要说明的是,由于第二用户的训练数据与第一用户的训练数据是不完全相同的,因此每一所述第二模型与所述第一模型也是不同的。虽然每一所述第二模型的类型与所述第一模型的类型相同,但是所述第二模型本身、所述第二模型中的特征与所述第一模型也是不同的。
此外,由于第二用户的训练数据也是直接采集得到的,因此第二用户的训练数据可以反映出第二用户的个人特征,也即第二用户的训练数据涉及到第二用户的个人隐私信息。而第二模型参数是从第二模型中得到的,而第二模型又是根据第二用户的训练数据训练得到的,因此所述第二模型参数只能反映出第二用户的训练数据的数据特征。也即,所述第二模型参数不涉及第二用户的个人隐私信息。
在一些实施例中,所述第一电子设备可以从服务器获取多个第二模型参数。其中,每一所述第二模型参数由一个第二用户上传至服务器。也即,每一第二电子设备通过第二用户的训练数据训练得到第二模型后,可以获取所述第二模型中的第二模型参数,并将获取到的第二模型参数上传到服务器。随后,第一电子设备即可从服务器获取到第二模型参数。
140,对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
第一电子设备获取到多个第二模型参数后,即可对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。例如,第一电子设备可以根据神经网络算法、分类算法等预设算法对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。其中,所述第三模型即为针对所述第一用户的最终的模型。通过所述第三模型即可对第一用户的任务进行处理。
可以理解的,所述第三模型也不是固定不变的。在第一用户的实际使用过程中,也可以不断地对所述第三模型进行更新。
由于多个第二模型参数可以包括大量的模型参数,多个第二模型参数反映出了大量的数据特征,因此训练得到的第三模型相对于所述第一模型更加完善,对任务进行处理的处理效果也会更好,例如对图像进行分类的准确性更高。并且,由于第二模型参数不涉及到第二用户的隐私信息,因此可以很好地保护第二用户的隐私信息。
例如,在一些实施例中,电子设备可以通过信息感知层获取第一用户的训练数据,并通过情景建模层使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型。可以理解的,通过情景建模层使用第一用户的训练数据进行模型训练之前,还可以通过数据处理层对第一用户的训练数据进行处理,例如进行数据清理、数据变换等处理。随后,通过情景建模层对数据处理层处理后的训练数据进行训练,以得到第一用户的第一模型。
随后,可以通过情景建模层获取所述第一模型的第一模型参数,并通过情景建模层获取多个第二模型参数。随后,通过情景建模层对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
得到第一用户的第三模型后,电子设备的智能服务层即可通过所述第三模型为第一用户提供个性化的服务,例如通过所述第三模型对所述第一用户的任务进行处理。
本申请实施例提供的模型训练方法中,由于通过多个第二模型参数对第一模型参数进行补充,并通过训练得到第一用户的第三模型,也即所述第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。
在一些实施例中,参考图4,图4为本申请实施例提供的模型训练方法的第二种流程示意图。
其中,步骤110、使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型,包括以下步骤:
111,获取第一用户的多个图像以及每一所述图像对应的图像标签;
112,根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
本申请实施例中,第一用户的训练数据包括第一用户的多个图像以及每一所述图像对应的图像标签。例如,所述多个图像可以为存储在第一电子设备中的照片、图片等。所述图像标签表示图像所属的类别。
第一电子设备可以获取第一用户的多个图像以及每一所述图像对应的图像标签,并根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
其中,所述预设分类算法例如可以为贝叶斯分类算法、支持向量机分类算法等分类算法中的一种。所述第一用户的图像分类模型即为第一模型。所述图像分类模型可以用于对图像进行分类,也即执行图像分类任务。
在一些实施例中,参考图5,图5为本申请实施例提供的模型训练方法的第三种流程示意图。
其中,步骤140、对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型之后,还包括以下步骤:
151,获取所述第三模型的第三模型参数;
152,将所述第三模型参数上传至服务器。
第一电子设备训练得到第一用户的第三模型后,可以获取所述第三模型的第三模型参数。其中,所述第三模型参数可以包括所述第三模型的全部参数,也可以包括所述第三模型的部分参数。例如,当所述第三模型为神经网络模型时,所述第三模型参数可以包括所述神经网络模型的各个神经元的权重值。
随后,第一电子设备将所述第三模型参数上传到服务器。从而,其它用户也可以从服务器获取到所述第三模型参数,以进行训练。
在本申请的描述中,需要理解的是,诸如“第一”、“第二”等术语仅用于区分类似的对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
具体实施时,本申请不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
由上可知,本申请实施例提供的模型训练方法,包括:使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;获取所述第一模型的第一模型参数;获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。所述模型训练方法中,由于通过多个第二模型参数对第一模型参数进行补充,并通过训练得到第一用户的第三模型,也即所述第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。
本申请实施例还提供一种模型训练装置,所述模型训练装置可以集成在电子设备中,也即上述数据共享系统中的第一电子设备。所述电子设备可以为智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
参考图6,图6为本申请实施例提供的模型训练装置的第一种结构示意图。
其中,所述模型训练装置200包括:第一训练模块201、第一获取模块202、第二获取模块203、第二训练模块204。
第一训练模块201,用于使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型。
其中,第一训练模块201可以获取第一用户的训练数据,并使用获取到的第一训练数据进行模型训练,以得到所述第一用户的第一模型。例如,第一训练模块201可以通过电子设备中的全景感知架构中的各个硬件结构或者硬件与软件的结合来采集第一用户的训练数据。
所述训练数据可以随着任务需求的不同而不同。例如,当本申请训练得到的最终模型用于处理图像分类任务时,所述训练数据可以包括图像数据。当本申请训练得到的最终模型用于向用户推荐信息时,所述训练数据可以包括用户的行为习惯数据。
所述第一模型是根据所述第一用户的训练数据得到的,由于一个用户的训练数据的数据量是有限的,因此所述第一模型在处理相应的任务时,得到的处理结果往往与所述第一用户的预期存在差距。
例如,当所述第一模型用于处理图像分类任务时,也即所述第一模型为图像分类模型时,所述第一模型对图像进行分类的准确性可能会比较低。因此,需要对所述第一模型继续进行完善。
其中,第一训练模块201使用第一用户的训练数据进行模型训练时,可以根据预设算法进行训练。例如,所述预设算法可以包括诸如卷积神经网络算法、循环神经网络算法等神经网络算法中的一种。所述预设算法也可以包括诸如贝叶斯分类算法、支持向量机分类算法等分类算法中的一种。
需要说明的是,所述预设算法可以根据任务需求进行选择。需要处理的任务不同时,所述预设算法可以是不同的。需要处理的任务相同,而任务的复杂程度不同时,所述预设算法也可以是不同的。
第一获取模块202,用于获取所述第一模型的第一模型参数。
第一训练模块201训练得到第一模型后,第一获取模块202可以获取所述第一模型的第一模型参数。其中,所述第一模型参数可以包括所述第一模型的全部参数,也可以包括所述第一模型的部分参数。
当所述第一模型不同时,所述第一模型参数的参数类型也可以是不同的。
例如,当所述预设算法包括神经网络算法时,所述第一模型可以包括神经网络模型。此时,所述第一模型参数可以包括神经网络模型中神经元的权重值。
再例如,当所述预设算法包括分类算法时,所述第一模型可以包括分类模型。此时,所述第一模型参数可以包括分类模型中类的特征值。
需要说明的是,所述第一用户的训练数据由于是直接采集得到的,因此所述训练数据可以反映出所述第一用户的个人特征。也即,所述训练数据涉及到所述第一用户的个人隐私信息。而所述第一模型参数是从所述第一模型中得到的,所述第一模型又是经过训练得到的,因此所述第一模型参数只能反映出所述训练数据的数据特征。也即,所述第一模型参数不涉及所述第一用户的个人隐私信息。
第二获取模块203,用于获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到。
第二获取模块203可以获取多个第二模型参数,以对所述第一模型参数进行补充,扩大模型参数的数据量。其中,每一所述第二模型参数对应于一个第二模型,也即每一所述第二模型参数从一个第二模型中得到。每一所述第二模型由一个第二用户的训练数据训练得到。
其中,每一所述第二模型的类型与所述第一模型的类型是相同的。每一所述第二模型参数的类型与所述第一模型参数的类型也是相同的。由第二用户的训练数据训练得到第二模型的过程可以参考上述第一模型的训练过程,从第二模型中得到第二模型参数可以参考上述第一模型参数的获取过程,在此不再赘述。
在一些实施例中,每一所述第二模型由一个第二用户的训练数据根据所述预设算法训练得到。也即,每一所述第二模型与所述第一模型根据相同的预设算法训练得到。
当所述预设算法包括神经网络算法时,每一所述第二模型可以包括神经网络模型。此时,每一所述第二模型参数可以包括神经网络模型中神经元的权重值。
当所述预设算法包括分类算法时,每一所述第二模型可以包括分类模型。此时,每一所述第二模型参数可以包括分类模型中类的特征值。
需要说明的是,由于第二用户的训练数据与第一用户的训练数据是不完全相同的,因此每一所述第二模型与所述第一模型也是不同的。虽然每一所述第二模型的类型与所述第一模型的类型相同,但是所述第二模型本身、所述第二模型中的特征与所述第一模型也是不同的。
此外,由于第二用户的训练数据也是直接采集得到的,因此第二用户的训练数据可以反映出第二用户的个人特征,也即第二用户的训练数据涉及到第二用户的个人隐私信息。而第二模型参数是从第二模型中得到的,而第二模型又是根据第二用户的训练数据训练得到的,因此所述第二模型参数只能反映出第二用户的训练数据的数据特征。也即,所述第二模型参数不涉及第二用户的个人隐私信息。
在一些实施例中,所述第二获取模块203可以从服务器获取多个第二模型参数。其中,每一所述第二模型参数由一个第二用户上传至服务器。也即,每一第二电子设备通过第二用户的训练数据训练得到第二模型后,可以获取所述第二模型中的第二模型参数,并将获取到的第二模型参数上传到服务器。随后,所述第二获取模块203即可从服务器获取到第二模型参数。
第二训练模块204,用于对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
第二获取模块203获取到多个第二模型参数后,第二训练模块204即可对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。例如,第二训练模块204可以根据神经网络算法、分类算法等预设算法对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。其中,所述第三模型即为针对所述第一用户的最终的模型。通过所述第三模型即可对第一用户的任务进行处理。
可以理解的,所述第三模型也不是固定不变的。在第一用户的实际使用过程中,也可以不断地对所述第三模型进行更新。
由于多个第二模型参数可以包括大量的模型参数,多个第二模型参数反映出了大量的数据特征,因此训练得到的第三模型相对于所述第一模型更加完善,对任务进行处理的处理效果也会更好,例如对图像进行分类的准确性更高。并且,由于第二模型参数不涉及到第二用户的隐私信息,因此可以很好地保护第二用户的隐私信息。
本申请实施例提供的模型训练装置中,由于通过多个第二模型参数对第一模型参数进行补充,并通过训练得到第一用户的第三模型,也即所述第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。
在一些实施例中,第一训练模块201用于执行以下步骤:
获取第一用户的多个图像以及每一所述图像对应的图像标签;
根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
本申请实施例中,第一用户的训练数据包括第一用户的多个图像以及每一所述图像对应的图像标签。例如,所述多个图像可以为存储在第一电子设备中的照片、图片等。所述图像标签表示图像所属的类别。
第一训练模块201可以获取第一用户的多个图像以及每一所述图像对应的图像标签,并根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
其中,所述预设分类算法例如可以为贝叶斯分类算法、支持向量机分类算法等分类算法中的一种。所述第一用户的图像分类模型即为第一模型。所述图像分类模型可以用于对图像进行分类,也即执行图像分类任务。
在一些实施例中,参考图7,图7为本申请实施例提供的模型训练装置的第二种结构示意图。
其中,模型训练装置200还包括参数上传模块205,所述参数上传模块205用于执行以下步骤:
获取所述第三模型的第三模型参数;
将所述第三模型参数上传至服务器。
第二训练模块204训练得到第一用户的第三模型后,参数上传模块205可以获取所述第三模型的第三模型参数。其中,所述第三模型参数可以包括所述第三模型的全部参数,也可以包括所述第三模型的部分参数。例如,当所述第三模型为神经网络模型时,所述第三模型参数可以包括所述神经网络模型的各个神经元的权重值。
随后,参数上传模块205将所述第三模型参数上传到服务器。从而,其它用户也可以从服务器获取到所述第三模型参数,以进行训练。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现。
由上可知,本申请实施例提供的模型训练装置200,包括:第一训练模块201,用于使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;第一获取模块202,用于获取所述第一模型的第一模型参数;第二获取模块203,用于获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;第二训练模块204,用于对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。所述模型训练装置中,由于通过多个第二模型参数对第一模型参数进行补充,并通过训练得到第一用户的第三模型,也即所述第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。
本申请实施例还提供一种电子设备。所述电子设备可以为智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
参考图8,图8为本申请实施例提供的电子设备的第一种结构示意图。
其中,电子设备300包括处理器301和存储器302。其中,处理器301与存储器302电性连接。
处理器301是电子设备300的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器302内的计算机程序,以及调用存储在存储器302内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备300中的处理器301会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器302中,并由处理器301来运行存储在存储器302中的计算机程序,从而执行以下步骤:
使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;
获取所述第一模型的第一模型参数;
获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;
对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
在一些实施例中,获取多个第二模型参数时,处理器301执行以下步骤:
从服务器获取多个第二模型参数,其中每一所述第二模型参数由一个第二用户上传至服务器。
在一些实施例中,使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型时,处理器301执行以下步骤:
根据预设算法使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;其中
每一所述第二模型由一个第二用户的训练数据根据所述预设算法训练得到。
在一些实施例中,所述预设算法包括神经网络算法、分类算法中的一种;当所述预设算法包括神经网络算法时,所述第一模型参数、每一所述第二模型参数均包括神经网络模型中神经元的权重值;当所述预设算法包括分类算法时,所述第一模型参数、每一所述第二模型参数均包括分类模型中类的特征值。
在一些实施例中,对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型之后,处理器301还执行以下步骤:
获取所述第三模型的第三模型参数;
将所述第三模型参数上传至服务器。
在一些实施例中,使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型时,处理器301执行以下步骤:
获取第一用户的多个图像以及每一所述图像对应的图像标签;
根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
存储器302可用于存储计算机程序和数据。存储器302存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器301通过调用存储在存储器302的计算机程序,从而执行各种功能应用以及数据处理。
在一些实施例中,参考图9,图9为本申请实施例提供的电子设备的第二种结构示意图。
其中,电子设备300还包括:显示屏303、控制电路304、输入单元305、传感器306以及电源307。其中,处理器301分别与显示屏303、控制电路304、输入单元305、传感器306以及电源307电性连接。
显示屏303可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
控制电路304与显示屏303电性连接,用于控制显示屏303显示信息。
输入单元305可用于接收输入的数字、字符信息或用户特征信息(例如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中,输入单元305可以包括指纹识别模组。
传感器306用于采集电子设备自身的信息或者用户的信息或者外部环境信息。例如,传感器306可以包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
电源307用于给电子设备300的各个部件供电。在一些实施例中,电源307可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图9中未示出,电子设备300还可以包括摄像头、蓝牙模块等,在此不再赘述。
由上可知,本申请实施例提供了一种电子设备,所述电子设备执行以下步骤:使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;获取所述第一模型的第一模型参数;获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。所述电子设备由于通过多个第二模型参数对第一模型参数进行补充,并通过训练得到第一用户的第三模型,也即所述第三模型是基于大量的模型参数训练得到的,因此可以提高所述第三模型对任务处理的处理结果,并且由于所述多个第二模型参数不涉及第二用户的隐私信息,因此可以很好地保护其他用户的隐私信息。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的模型训练方法。
需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述存储介质可以包括但不限于:只读存储器(ROM,Read OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本申请实施例所提供的模型训练方法、装置、存储介质及电子设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种模型训练方法,其特征在于,包括:
使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;
获取所述第一模型的第一模型参数;
获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;
对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述获取多个第二模型参数的步骤包括:
从服务器获取多个第二模型参数,其中每一所述第二模型参数由一个第二用户上传至服务器。
3.根据权利要求1所述的模型训练方法,其特征在于,所述使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型,包括:
根据预设算法使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;其中
每一所述第二模型由一个第二用户的训练数据根据所述预设算法训练得到。
4.根据权利要求3所述的模型训练方法,其特征在于,所述预设算法包括神经网络算法、分类算法中的一种;
当所述预设算法包括神经网络算法时,所述第一模型参数、每一所述第二模型参数均包括神经网络模型中神经元的权重值;
当所述预设算法包括分类算法时,所述第一模型参数、每一所述第二模型参数均包括分类模型中类的特征值。
5.根据权利要求1所述的模型训练方法,其特征在于,所述对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型之后,还包括:
获取所述第三模型的第三模型参数;
将所述第三模型参数上传至服务器。
6.根据权利要求1所述的模型训练方法,其特征在于,所述使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型,包括:
获取第一用户的多个图像以及每一所述图像对应的图像标签;
根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
7.一种模型训练装置,其特征在于,包括:
第一训练模块,用于使用第一用户的训练数据进行模型训练,以得到所述第一用户的第一模型;
第一获取模块,用于获取所述第一模型的第一模型参数;
第二获取模块,用于获取多个第二模型参数,其中每一所述第二模型参数对应于一个第二模型,每一所述第二模型由一个第二用户的训练数据训练得到;
第二训练模块,用于对所述第一模型参数、多个所述第二模型参数进行训练,以得到所述第一用户的第三模型。
8.根据权利要求7所述的模型训练装置,其特征在于,所述第二获取模块用于:
从服务器获取多个第二模型参数,其中每一所述第二模型参数由一个第二用户上传至服务器。
9.根据权利要求7所述的模型训练装置,其特征在于,所述第一训练模块用于:
获取第一用户的多个图像以及每一所述图像对应的图像标签;
根据预设分类算法对所述多个图像以及每一所述图像对应的图像标签进行训练,以得到所述第一用户的图像分类模型。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行权利要求1至6任一项所述的模型训练方法。
11.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行权利要求1至6任一项所述的模型训练方法。
CN201910282429.7A 2019-04-09 2019-04-09 模型训练方法、装置、存储介质及电子设备 Pending CN111797869A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910282429.7A CN111797869A (zh) 2019-04-09 2019-04-09 模型训练方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910282429.7A CN111797869A (zh) 2019-04-09 2019-04-09 模型训练方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN111797869A true CN111797869A (zh) 2020-10-20

Family

ID=72805312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910282429.7A Pending CN111797869A (zh) 2019-04-09 2019-04-09 模型训练方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111797869A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116072096A (zh) * 2022-08-10 2023-05-05 荣耀终端有限公司 模型训练方法、声学模型、语音合成系统和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103877A (zh) * 2009-12-22 2011-06-22 索尼公司 用于编辑图像/视频数据的图像/视频数据编辑设备和方法
CN105378699A (zh) * 2013-11-27 2016-03-02 Ntt都科摩公司 基于机器学习的自动任务分类
CN107609461A (zh) * 2017-07-19 2018-01-19 阿里巴巴集团控股有限公司 模型的训练方法、数据相似度的确定方法、装置及设备
CN107766940A (zh) * 2017-11-20 2018-03-06 北京百度网讯科技有限公司 用于生成模型的方法和装置
CN108182389A (zh) * 2017-12-14 2018-06-19 华南师范大学 基于大数据与深度学习的用户数据处理方法、机器人系统
CN108304935A (zh) * 2017-05-09 2018-07-20 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置和计算机设备
CN109389412A (zh) * 2017-08-02 2019-02-26 阿里巴巴集团控股有限公司 一种训练模型的方法及装置
WO2019052810A1 (en) * 2017-09-13 2019-03-21 Koninklijke Philips N.V. TRAINING A MODEL

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103877A (zh) * 2009-12-22 2011-06-22 索尼公司 用于编辑图像/视频数据的图像/视频数据编辑设备和方法
CN105378699A (zh) * 2013-11-27 2016-03-02 Ntt都科摩公司 基于机器学习的自动任务分类
CN108304935A (zh) * 2017-05-09 2018-07-20 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置和计算机设备
CN107609461A (zh) * 2017-07-19 2018-01-19 阿里巴巴集团控股有限公司 模型的训练方法、数据相似度的确定方法、装置及设备
CN109389412A (zh) * 2017-08-02 2019-02-26 阿里巴巴集团控股有限公司 一种训练模型的方法及装置
WO2019052810A1 (en) * 2017-09-13 2019-03-21 Koninklijke Philips N.V. TRAINING A MODEL
CN107766940A (zh) * 2017-11-20 2018-03-06 北京百度网讯科技有限公司 用于生成模型的方法和装置
CN108182389A (zh) * 2017-12-14 2018-06-19 华南师范大学 基于大数据与深度学习的用户数据处理方法、机器人系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116072096A (zh) * 2022-08-10 2023-05-05 荣耀终端有限公司 模型训练方法、声学模型、语音合成系统和电子设备
CN116072096B (zh) * 2022-08-10 2023-10-20 荣耀终端有限公司 模型训练方法、声学模型、语音合成系统和电子设备

Similar Documents

Publication Publication Date Title
CN109964236B (zh) 用于检测图像中的对象的神经网络
CN111797858A (zh) 模型训练方法、行为预测方法、装置、存储介质及设备
US11915400B2 (en) Location mapping for large scale augmented-reality
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN111797302A (zh) 模型处理方法、装置、存储介质及电子设备
CN111814475A (zh) 用户画像构建方法、装置、存储介质和电子设备
CN111798259A (zh) 应用推荐方法、装置、存储介质及电子设备
CN111797854A (zh) 场景模型建立方法、装置、存储介质及电子设备
CN111797861A (zh) 信息处理方法、装置、存储介质及电子设备
CN111797851A (zh) 特征提取方法、装置、存储介质及电子设备
CN111796925A (zh) 算法模型的筛选方法、装置、存储介质和电子设备
CN111798367A (zh) 图像处理方法、装置、存储介质及电子设备
CN111798019B (zh) 意图预测方法、装置、存储介质及电子设备
CN111797856B (zh) 建模方法、装置、存储介质及电子设备
CN111797873A (zh) 场景识别方法、装置、存储介质及电子设备
CN111797869A (zh) 模型训练方法、装置、存储介质及电子设备
CN111797867A (zh) 系统资源优化方法、装置、存储介质及电子设备
CN111796663B (zh) 场景识别模型更新方法、装置、存储介质及电子设备
CN111797849A (zh) 用户活动识别方法、装置、存储介质及电子设备
CN111814812A (zh) 建模方法、装置、存储介质、电子设备及场景识别方法
WO2020207294A1 (zh) 服务处理方法、装置、存储介质及电子设备
Aravindan et al. A Smart Assistive System for Visually Impaired to Inform Acquaintance Using Image Processing (ML) Supported by IoT
WO2020207297A1 (zh) 信息处理方法、存储介质及电子设备
CN111797656B (zh) 人脸关键点检测方法、装置、存储介质及电子设备
CN111797875B (zh) 场景建模方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination