CN112434806A - 深度学习训练方法、装置、计算机设备及存储介质 - Google Patents
深度学习训练方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112434806A CN112434806A CN202011295289.6A CN202011295289A CN112434806A CN 112434806 A CN112434806 A CN 112434806A CN 202011295289 A CN202011295289 A CN 202011295289A CN 112434806 A CN112434806 A CN 112434806A
- Authority
- CN
- China
- Prior art keywords
- model
- sample
- deep learning
- verification
- user data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 118
- 238000013135 deep learning Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012795 verification Methods 0.000 claims abstract description 62
- 238000002372 labelling Methods 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种深度学习训练方法、装置、计算机设备及存储介质,应用于计算机设备,所述计算机设备设置于用户本地,该方法包括:获取基于用户数据样本生成的标注样本;根据所述标注样本对预设模型进行训练,得到训练完成的模型;获取验证数据,并根据验证数据对训练完成的模型进行验证;当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。通过本申请,实现了用户基于现场的深度学习训练,减少了中间环节,保护了用户隐私。
Description
技术领域
本申请涉及深度学习技术领域,特别是涉及一种深度学习训练方法、装置、计算机设备及存储介质。
背景技术
随着人工智能技术不断的发展,人工智能技术已从萌芽阶段进入快速发展时期。机器学习是人工智能的核心,其中深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
目前,当客户有新的智能化应用需求时,一般需要收集客户的数据,对数据进行标注、算法设计、模型训练、应用开发后部署到客户现场,最后收集现场样本,根据现场的效果进行优化,经过多次的模型迭代提升算法效果,最终达到客户的要求。
然而,随着细分行业的智能化应用需求越来越旺盛,客户对数据隐私也越来越重视,在训练一个新的算法模型时,需要不断收集客户数据进行训练和优化,中间环节繁杂,这样就无法保证客户数据安全性,致使客户不愿对外提供数据,导致无法进行算法的训练。
发明内容
本申请实施例提供了一种深度学习训练方法、装置、计算机设备及存储介质,以至少解决相关技术中无法保证用户数据隐私的问题。
第一方面,本申请实施例提供了一种深度学习训练方法,应用于计算机设备,所述计算机设备设置于用户本地,该方法包括:
获取基于用户数据样本生成的标注样本;
根据所述标注样本对预设模型进行训练,得到训练完成的模型;
获取验证数据,并根据验证数据对训练完成的模型进行验证;
当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
在其中一些实施例中,获取基于用户数据样本生成的标注样本包括:
获取待标注的用户数据样本;
判定是否存在所述用户数据样本对应的训练完成的匹配模型;
当不存在匹配模型时,创建所述用户数据样本对应的样本库,并对所述样本库内的所有用户数据样本进行样本标注,得到标注样本;
当存在匹配模型时,基于所述匹配模型对所述用户数据样本进行样本预处理,并根据样本预处理结果进行样本标注,得到标注样本。
在其中一些实施例中,当存在匹配模型时,基于所述匹配模型对所述用户数据样本进行样本预处理,并根据样本预处理结果进行样本标注,得到标注样本包括:
基于所述匹配模型对所有用户数据样本进行校验,并对校验未通过的样本进行样本标注,得到标注样本。
在其中一些实施例中,根据所述标注样本对预设模型进行训练,得到训练完成的模型包括:
基于所述标注样本创建模型训练任务;
获取用户配置的任务启动方式,根据所述任务启动方式启动模型训练;所述任务启动方式包括立即启动和定时启动。
在其中一些实施例中,还包括:
当所述模型满足验证时,将所述模型部署至应用设备。
在其中一些实施例中,当所述模型满足验证时,将所述模型部署至应用设备包括:
获取所述模型和待部署的应用设备;
根据所述应用设备对所述模型进行自动适配;
将自动适配后的模型部署至所述应用设备。
第二方面,本申请实施例提供了一种深度学习训练装置,应用于计算机设备,所述计算机设备设置于用户本地,包括:
样本标注模块,用于获取基于用户数据样本生成的标注样本;
模型训练模块,用于根据所述标注样本对预设模型进行训练,得到训练完成的模型;
模型验证模块,用于获取验证数据,并根据验证数据对训练完成的模型进行验证;
循环单元,用于当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
在其中一个实施例中,深度学习训练装置还包括:
模型部署模块,用于当所述模型满足验证时,将所述模型部署至应用设备。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的深度学习训练方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的深度学习训练方法。
相比于相关技术,本申请实施例提供的深度学习训练方法,通过将应用于该方法的计算机设备设置于用户本地,获取基于用户数据样本生成的标注样本;根据所述标注样本对预设模型进行训练,得到训练完成的模型;最后并根据验证数据对训练完成的模型进行验证,实现了样本标注、模型训练、模型验证的一体化,便于用户进行现场的深度学习训练,减少了中间环节,保护了用户隐私。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请其中一个实施例中深度学习训练方法的流程示意图;
图2是本申请其中一个实施例中深度学习训练方法中样本标注的流程示意图;
图3是本申请其中一个实施例中深度学习训练方法中的模型训练的流程示意图;
图4是本申请其中一个实施例中深度学习训练方法的优选流程示意图;
图5是本申请其中一个实施例中深度学习训练方法中的模型部署的流程示意图;
图6是本申请其中一个优选实施例中深度学习训练方法中样本标注的流程示意图;
图7是本申请其中一个优选实施例中深度学习训练方法中的模型训练的流程示意图;
图8是本申请其中一个优选实施例中深度学习训练方法的优选流程示意图;
图9是本申请其中一个优选实施例中深度学习训练方法中的模型部署的流程示意图;
图10是本申请其中一个实施例中深度学习训练装置的结构框图;
图11是本申请其中一个优选实施例中深度学习训练装置的结构框图;
图12是本申请其中一个实施例中计算机设备的结构示意图。
附图说明:201、样本标注模块;202、模型训练模块;203、模型验证模块;204、循环模块;205、模型部署模块;120、总线;121、处理器;122、存储器;123、通信接口。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
深度学习技术成为是信息化时代应用最广泛的技术之一。深度学习的发展和应用使移动互联网技术与智能化技术更紧密的结合,其应用不断深入到交通管理、网络安全、医疗保健、智能家居等生活的各个领域。深度学习的基本训练过程,一是自下而上的非监督学习,采用无标定数据(有标定数据也可)分层训练各层参数,即从底层开始,逐层训练,直到顶层时训练结束;二是自顶向下的监督学习,即通过带标签的数据进行训练,将产生的误差从顶部向下层传输,对整个网络进行微调。
本实施例提供了一种深度学习训练方法,应用于计算机设备,该深度学习训练方法可以应用于各种训练场景中,如图像识别、自动驾驶、虚拟游戏等等。图1是根据本申请实施例的深度学习训练方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,获取基于用户数据样本生成的标注样本。
在本实施例中,所述计算机设备部署于用户本地,通过对用户本地的计算机设备进行用户数据样本的本地收集,进行本地样本标注、以及后续模型训练和模型验证,可以严格控制用户数据泄露,保护用户隐私。所述计算机设备可以是可与用户进行人机交互的模型训练设备,例如手机、个人电脑、个人工作站等终端设备或者服务器等,所述服务器独立服务器,也可以是集群式服务器。
其中,在进行模型训练之前,需要采集用户数据样本并进行样本标注,以确保模型训练过程中的样本识别。具体的,当采集到用户数据样本后,根据每一个单位用户数据样本以及预设的标识信息,对采集到的对应单位用户数据样本进行标注,作为后续模型训练的样本。所述用户数据样本可以是图像数据、浏览历史记录、文本消息等,可以是由人工收集得到,或者是由计算机设备自动生成,可根据应用场景灵活设置,本申请不作具体限定。
步骤S102,根据所述标注样本对预设模型进行训练,得到训练完成的模型。
在本实施例中,所述标注样本通过标识信息标记待识别对象,将带有标识信息的标记样本输入预设模型中训练,让预设模型自动学习得到采集的用户数据样本和待识别对象的对应关系,从而将该模型应用于实际应用场景中,实现用户数据样本的智能识别。
步骤S103,获取验证数据,并根据验证数据对训练完成的模型进行验证。
步骤S104,当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
在本实施例中,在得到训练完成的模型后,需要利用不包含在所述用户数据样本以内的验证数据对训练完成的模型进行校验,以确定当下模型是否满足用户的应用需求。其中,所述验证数据可以是预订数量的验证样本,可选地,当获取到用户数据后,可以将部分用户数据作为用户数据样本经样本标注后进行模型训练,另外部分用户数据作为验证样本。
具体的,当所述模型未满足验证时,表明该模型的样本识别准确率较低,此时通过循环执行上述步骤,在训练完成的模型基础上进行标记样本的增量迭代训练,直至所述模型满足验证,使模型的识别准确率达到用户要求。
综上,本申请实施例提供的深度学习训练方法,通过将应用于该方法的计算机设备设置于用户本地,获取基于用户数据样本生成的标注样本;根据所述标注样本对预设模型进行训练,得到训练完成的模型;最后并根据验证数据对训练完成的模型进行验证,实现了样本标注、模型训练、模型验证的一体化,便于用户进行现场的深度学习训练,减少了中间环节,保护了用户隐私。
下面通过优选实施例对本申请实施例进行描述和说明。
图2是根据本申请实施例的深度学习训练方法的优选流程图,如图2所示,该深度学习训练方法包括如下步骤:
步骤S1011,获取待标注的用户数据样本;
步骤S1012,判定是否存在所述用户数据样本对应的训练完成的匹配模型;
步骤S1013,当不存在匹配模型时,创建所述用户数据样本对应的样本库,并对所述样本库内的所有用户数据样本进行样本标注,得到标注样本;
步骤S1014,当存在匹配模型时,基于所述匹配模型对所述用户数据样本进行样本预处理,并根据样本预处理结果进行样本标注,得到标注样本。
在本实施例中,在进行样本标注过程中,当获取到待标注的用户数据样本后,需要判定是否存在所述用户数据样本对应的训练完成的匹配模型,以根据判定结果进行样本处理。具体的,当不存在匹配模型时,则创建所述用户数据样本对应的样本库,将所述用户数据样本存入样本库中,并对所述样本库中的所有用户数据样本进行标注,得到标注样本;当存在匹配模型时,基于所述匹配模型对所有用户数据样本进行校验,当校验结果未通过时,对对应的用户数据样本进行样本标注,得到标注样本,以便基于该标注样本进一步进行匹配模型参数调整;当校验通过时,无需对对应的用户数据样本进行样本标注,舍弃该样本,从而提高样本的标注效率,缩短模型训练速度。
如图3所示,在其中一些实施例中,步骤S102包括以下步骤:
步骤S1021,基于所述标注样本创建模型训练任务;
步骤S1022,获取用户配置的任务启动方式,根据所述任务启动方式启动模型训练;所述任务启动方式包括立即启动和定时启动。
在本实施例中,基于标注样本创建训练任务。模型训练任务可根据实际需求配置的任务启动方式。具体的,根据任务启动方式判定模型训练任务是否立即启动,当任务启动方式为立即启动时,马上启动模型训练工作;当任务启动方式为定时启动时,在指定时间启动模型训练工作。
需要说明的是,在模型训练过程中,可以利用基于MapReduce的大规模集群技术、GPU的应用或其他优化算法,将耗时数月的模型训练过程缩短为数天甚至数小时,尽快模型训练和模型迭代的速度,使深度学习在实践中能够快速落地。
在其中一些实施例中,图4是根据本申请实施例的深度学习训练方法的优选流程图,如图4所示,该深度学习训练方法包括如下步骤:
步骤S101,获取基于用户数据样本生成的标注样本;
步骤S102,根据所述标注样本对预设模型进行训练,得到训练完成的模型;
步骤S103,获取验证数据,并根据验证数据对训练完成的模型进行验证;
步骤S104,当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
步骤S105,当所述模型满足验证时,将所述模型部署至应用设备。
在上述实施例的基础上,在本实施例中,当训练完成的模型满足验证时,直接将该模型部署至客户本地指定的应用设备,从而实现样本标注、模型训练、模型验证和模型部署的一体化,从而在保证用户隐私的前提下,满足用户在指定应用设备上高效构建深度学习模型的应用,方便进行进一步网络测试和升级,使得智能化应用能够快速落地。
如图5所示,所述步骤S105具体包括:
步骤S1051,获取所述模型和待部署的应用设备;
步骤S1052,根据所述应用设备对所述模型进行自动适配;
步骤S1053,将自动适配后的模型部署至所述应用设备。
具体的,首先在部署之前获取模型和待部署的应用设备。可选地,应用设备可以通过系统自动搜索网络或手动添加等方法获取。然后根据所述应用设备对所述模型进行自动适配。可选地,基于所述应用设备的硬件配置和运算特性判定所述模型是否适配,当所述模型不适配所述应用设备时,将训练所得模型自动转化成应用设备支持的可选格式,最后将自动适配后的模型部署至所述应用设备。
在其中一个实施例中,图6-9是根据本申请实施例的深度学习训练方法的优选流程图,如图6-9所示,该深度学习训练方法包括以下步骤:
如图6所示,首先获取用户数据样本,然后判定是否存在所述用户数据样本对应的训练完成的匹配模型。当不存在匹配模型时,则创建所述用户数据样本对应的样本库,并对所述样本库中的所有用户数据样本进行标注,得到标注样本;当存在匹配模型时,基于所述匹配模型对所有用户数据样本进行校验,当校验结果未通过时,对对应的用户数据样本进行样本标注,得到标注样本,当校验通过时,不对该用户数据样本进行样本标注。
如图7所示,在进行模型训练时,获取标注样本,基于所述标注样本创建模型训练任务,然后根据用户配置的任务启动方式判定模型训练任务是否立即启动。当任务启动方式为立即启动时,立即启动模型训练工作;否则,定时启动模型训练工作。
如图8所示,当完成模型标注、模型训练后进行模型验证。具体的,当满足验证时将所述模型部署至应用设备,否则循环执行上述步骤,直至所述模型满足验证。
如图9所示,在进行模型部署时,部署之前获取模型和待部署的应用设备,判定所述模型是否适配所述应用设备,当所述模型不适配所述应用设备时,根据所述应用设备进行模型自动适配,最后将自动适配后的模型部署至所述应用设备。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种深度学习训练装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图10是根据本申请实施例的深度学习训练装置的结构框图,该装置应用于计算机设备,所述计算机设备设置于用户本地,如图10所示,该装置包括:样本标注模块201、模型训练模块202、模型验证模块203和循环模块204。
样本标注模块201,用于获取基于用户数据样本生成的标注样本;
模型训练模块202,用于根据所述标注样本对预设模型进行训练,得到训练完成的模型;
模型验证模块203,用于获取验证数据,并根据验证数据对训练完成的模型进行验证;
循环模块204,用于当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
在其中一个实施例中,样本标注模块201包括:样本获取单元、判定单元、第一样本标注单元和第二样本标注单元。
样本获取单元,用于获取待标注的用户数据样本;
判定单元,用于判定是否存在所述用户数据样本对应的训练完成的匹配模型;
第一样本标注单元,用于当不存在匹配模型时,创建所述用户数据样本对应的样本库,并对所述样本库内的所有用户数据样本进行样本标注,得到标注样本;
第二样本标注单元,用于当存在匹配模型时,基于所述匹配模型对所述用户数据样本进行样本预处理,并根据样本预处理结果进行样本标注,得到标注样本。
在其中一个实施例中,第二样本标注单元具体用于:
基于所述匹配模型对所有用户数据样本进行校验,并对校验未通过的样本进行样本标注,得到标注样本。
在其中一个实施例中,模型训练模块202包括:任务创建单元和训练启动单元。
任务创建单元,用于基于所述标注样本创建模型训练任务;
训练启动单元,用于获取用户配置的任务启动方式,根据所述任务启动方式启动模型训练;所述任务启动方式包括立即启动和定时启动。
图11是根据本申请实施例的深度学习训练装置的优选结构框图,如图11所示,该装置包括图6所示的所有模块,此外还包括:模型部署模块205。
模型部署模块205,用于当所述模型满足验证时,将所述模型部署至应用设备。
在其中一个实施例中,模型部署模块205包括:应用设备获取单元、自动适配单元和部署单元。
应用设备获取单元,用于获取所述模型和待部署的应用设备;
自动适配单元,用于根据所述应用设备对所述模型进行自动适配;
部署单元,用于将自动适配后的模型部署至所述应用设备。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
另外,结合图1描述的本申请实施例深度学习训练方法可以由计算机设备来实现。图12为根据本申请实施例的计算机设备的硬件结构示意图。
计算机设备可以包括处理器121以及存储有计算机程序指令的存储器122。
具体地,上述处理器121可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器122可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器122可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(Solid State Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerial Bus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器122可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器122可在数据处理装置的内部或外部。在特定实施例中,存储器122是非易失性(Non-Volatile)存储器。在特定实施例中,存储器122包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(Random Access Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(ErasableProgrammable Read-Only Memory,简称为EPROM)、电可擦除PROM(Electrically ErasableProgrammable Read-Only Memory,简称为EEPROM)、电可改写ROM(ElectricallyAlterable Read-Only Memory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-AccessMemory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode DynamicRandom Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDate Out Dynamic Random Access Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器122可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器121所执行的可能的计算机程序指令。
处理器121通过读取并执行存储器122中存储的计算机程序指令,以实现上述实施例中的任意一种深度学习训练方法。
在其中一些实施例中,计算机设备还可包括通信接口123和总线120。其中,如图12所示,处理器121、存储器122、通信接口123通过总线120连接并完成相互间的通信。
通信接口123用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信接口123还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线120包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线120包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线120可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(Front Side Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线120可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该计算机设备可以基于获取到的程序指令,执行本申请实施例中的深度学习训练方法,从而实现结合图1描述的深度学习训练方法。
另外,结合上述实施例中的深度学习训练方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种深度学习训练方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种深度学习训练方法,其特征在于,应用于计算机设备,所述计算机设备设置于用户本地,该方法包括:
获取基于用户数据样本生成的标注样本;
根据所述标注样本对预设模型进行训练,得到训练完成的模型;
获取验证数据,并根据验证数据对训练完成的模型进行验证;
当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
2.根据权利要求1所述的深度学习训练方法,其特征在于,获取基于用户数据样本生成的标注样本包括:
获取待标注的用户数据样本;
判定是否存在所述用户数据样本对应的训练完成的匹配模型;
当不存在匹配模型时,创建所述用户数据样本对应的样本库,并对所述样本库内的所有用户数据样本进行样本标注,得到标注样本;
当存在匹配模型时,基于所述匹配模型对所述用户数据样本进行样本预处理,并根据样本预处理结果进行样本标注,得到标注样本。
3.根据权利要求2所述的深度学习训练方法,其特征在于,当存在匹配模型时,基于所述匹配模型对所述用户数据样本进行样本预处理,并根据样本预处理结果进行样本标注,得到标注样本包括:
基于所述匹配模型对所有用户数据样本进行校验,并对校验未通过的样本进行样本标注,得到标注样本。
4.根据权利要求1所述的深度学习训练方法,其特征在于,根据所述标注样本对预设模型进行训练,得到训练完成的模型包括:
基于所述标注样本创建模型训练任务;
获取用户配置的任务启动方式,根据所述任务启动方式启动模型训练;所述任务启动方式包括立即启动和定时启动。
5.根据权利要求1所述的深度学习训练方法,其特征在于,还包括:
当所述模型满足验证时,将所述模型部署至应用设备。
6.根据权利要求5所述的深度学习训练方法,其特征在于,当所述模型满足验证时,将所述模型部署至应用设备包括:
获取所述模型和待部署的应用设备;
根据所述应用设备对所述模型进行自动适配;
将自动适配后的模型部署至所述应用设备。
7.一种深度学习训练装置,其特征在于,应用于计算机设备,所述计算机设备设置于用户本地,包括:
样本标注模块,用于获取基于用户数据样本生成的标注样本;
模型训练模块,用于根据所述标注样本对预设模型进行训练,得到训练完成的模型;
模型验证模块,用于获取验证数据,并根据验证数据对训练完成的模型进行验证;
循环单元,用于当所述模型未满足验证时,循环执行上述步骤,直至所述模型满足验证。
8.根据权利要求7所述的深度学习训练装置,其特征在于,还包括:
模型部署模块,用于当所述模型满足验证时,将所述模型部署至应用设备。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的深度学习训练方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的深度学习训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011295289.6A CN112434806A (zh) | 2020-11-18 | 2020-11-18 | 深度学习训练方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011295289.6A CN112434806A (zh) | 2020-11-18 | 2020-11-18 | 深度学习训练方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112434806A true CN112434806A (zh) | 2021-03-02 |
Family
ID=74694155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011295289.6A Pending CN112434806A (zh) | 2020-11-18 | 2020-11-18 | 深度学习训练方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434806A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112975985A (zh) * | 2021-03-22 | 2021-06-18 | 梅卡曼德(北京)机器人科技有限公司 | 抓取机器人及其控制方法和定位模型训练方法 |
CN113902121A (zh) * | 2021-07-15 | 2022-01-07 | 陈九廷 | 一种电池劣化推测装置校验的方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034190A (zh) * | 2018-06-15 | 2018-12-18 | 广州深域信息科技有限公司 | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
CN110135263A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 人像属性模型构建方法、装置、计算机设备和存储介质 |
CN110909807A (zh) * | 2019-11-26 | 2020-03-24 | 深圳市信联征信有限公司 | 基于深度学习的网络验证码识别方法、装置及计算机设备 |
-
2020
- 2020-11-18 CN CN202011295289.6A patent/CN112434806A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034190A (zh) * | 2018-06-15 | 2018-12-18 | 广州深域信息科技有限公司 | 一种动态选择策略的主动样本挖掘的物体检测系统及方法 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
CN110135263A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 人像属性模型构建方法、装置、计算机设备和存储介质 |
CN110909807A (zh) * | 2019-11-26 | 2020-03-24 | 深圳市信联征信有限公司 | 基于深度学习的网络验证码识别方法、装置及计算机设备 |
Non-Patent Citations (1)
Title |
---|
HEHE FAN: "Unsupervised Person Re-identification: Clustering and Fine-tuning", ARXIV, 30 June 2017 (2017-06-30), pages 9 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112975985A (zh) * | 2021-03-22 | 2021-06-18 | 梅卡曼德(北京)机器人科技有限公司 | 抓取机器人及其控制方法和定位模型训练方法 |
CN113902121A (zh) * | 2021-07-15 | 2022-01-07 | 陈九廷 | 一种电池劣化推测装置校验的方法、装置、设备及介质 |
CN113902121B (zh) * | 2021-07-15 | 2023-07-21 | 陈九廷 | 一种电池劣化推测装置校验的方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6832867B2 (ja) | 画像検証コードに基づいて画像を検証するための方法及び装置 | |
CN111062495A (zh) | 机器学习方法及相关装置 | |
CN107516090A (zh) | 一体化人脸识别方法和系统 | |
CN111523413B (zh) | 生成人脸图像的方法和装置 | |
CN111950596A (zh) | 一种用于神经网络的训练方法以及相关设备 | |
CN112434806A (zh) | 深度学习训练方法、装置、计算机设备及存储介质 | |
US11568232B2 (en) | Deep learning FPGA converter | |
CN110275963A (zh) | 用于输出信息的方法和装置 | |
CN106844685A (zh) | 用于识别网站的方法、装置及服务器 | |
CN111539903B (zh) | 训练人脸图像合成模型的方法和装置 | |
CN116049412B (zh) | 文本分类方法、模型训练方法、装置及电子设备 | |
CN112214766A (zh) | 一种检测挖矿木马的方法、装置、电子装置和存储介质 | |
CN112183102A (zh) | 基于注意力机制与图注意力网络的命名实体识别方法 | |
CN111428236A (zh) | 一种恶意软件的检测方法、装置、设备及可读介质 | |
WO2022142106A1 (zh) | 文本分析方法、装置、电子设备及可读存储介质 | |
CN112188311A (zh) | 用于确定新闻的视频素材的方法和装置 | |
CN113705276A (zh) | 模型构建方法、模型构建装置、计算机设备及介质 | |
CN112232070A (zh) | 自然语言处理模型构建方法、系统、电子设备及存储介质 | |
CN116484867A (zh) | 命名实体识别方法及装置、存储介质、计算机设备 | |
CN116841564B (zh) | 一种数据处理方法、装置、设备以及计算机可读存储介质 | |
CN112035622A (zh) | 一种自然语言处理的集成平台及方法 | |
CN112732920A (zh) | 基于bert的多特征融合实体情感分析方法及系统 | |
CN116956117A (zh) | 一种标签识别的方法、装置、设备、存储介质及程序产品 | |
CN116956102A (zh) | 分类模型的训练方法、装置、设备、存储介质及程序产品 | |
US11829852B1 (en) | System, method, and computer program product for predicting pin placement in an electronic design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |