CN115204263A - 一种模型的更新方法、装置及设备 - Google Patents
一种模型的更新方法、装置及设备 Download PDFInfo
- Publication number
- CN115204263A CN115204263A CN202210704675.9A CN202210704675A CN115204263A CN 115204263 A CN115204263 A CN 115204263A CN 202210704675 A CN202210704675 A CN 202210704675A CN 115204263 A CN115204263 A CN 115204263A
- Authority
- CN
- China
- Prior art keywords
- model
- sample
- preset
- preselected
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例公开了一种模型的更新方法、装置及设备,该方法应用于终端设备,包括:当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型。
Description
技术领域
本文件涉及计算机技术领域,尤其涉及一种模型的更新方法、装置及设备。
背景技术
随着终端技术和网络技术的不断发展,很多业务会通过模型进行业务处理,例如,可以通过生物识别模型对生物识别业务进行处理,或者,通过风险识别模型对某金融类业务进行风险识别处理等。
上述模型往往是针对某特定场景构建的模型,如果上述特定场景发生变化,则往往需要获取变化后的场景下的业务数据,并可以使用该业务数据构建和训练相应的模型,然后,将训练后的相应模型可以投入到变化后的场景下使用。但是,上述方式需要花费较多时间采集变化后的场景下的业务数据,并且,还需要构建和训练相应的模型,也需要花费较长时间,而且,训练后的模型也需要进行性能评估等处理,从而使得模型从构建到投入使用的上线应用周期较长,且需要耗费较多人力物力,无法在短时间内进行规模化。基于此,需要提供一种跨场景的情况下减小模型上线应用周期、资源消耗更低的模型应用方案。
发明内容
本说明书实施例的目的是提供一种跨场景的情况下减小模型上线应用周期、资源消耗更低的模型应用方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种模型的更新方法,应用于终端设备,所述方法包括:当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本。分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征。基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本。基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例提供的一种模型的更新装置,所述装置包括:数据获取模块,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本。特征提取模块,分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征。样本确定模块,基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本。模型更新模块,基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例提供的一种模型的更新设备,所述模型的更新设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本。分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征。基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本。基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例还提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本。分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征。基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本。基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本说明书一种模型的更新方法实施例;
图1B为本说明书一种目标模型的更新的页面示意图;
图2为本说明书另一种模型的更新方法实施例;
图3为本说明书又一种模型的更新方法实施例;
图4为本说明书一种模型的更新装置实施例;
图5为本说明书一种模型的更新设备实施例。
具体实施方式
本说明书实施例提供一种模型的更新方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1所示,本说明书实施例提供一种模型的更新方法,该方法的执行主体可以为终端设备,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为IoT设备(具体如智能手表、车载设备等),还可以是预先设置的具有某种功能的机具等。此外,该方法的执行主体也可以为服务器等设备,具体处理过程可以根据执行主体为终端设备的情况进行调整,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S102中,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从该业务数据中获取用于更新目标模型的预选模型训练样本。
其中,目标业务可以是任意业务,具体如风险识别或风险检测业务,该风险识别或风险检测业务可以是金融业务中的风险识别或风险检测业务,也可以是即时通讯应用的风险识别或风险检测业务,该目标业务也可以是生物识别业务,该生物识别业务可以是金融业务中的生物识别业务,也可以是即时通讯应用的生物识别业务等,生物识别可以是基于指纹信息的生物识别、基于掌纹信息的生物识别、基于面部信息的生物识别或基于虹膜信息的生物识别,具体可以根据实际情况设定,本说明书实施例对此不做限定。目标模型可以是为了处理目标业务而构建和训练的模型,例如,对于风险识别业务,目标模型可以是用于进行风险识别的模型,对于生物识别业务,目标模型可以是用于进行生物识别的模型等,目标模型的具体结构和功能可以根据实际情况设定,本说明书实施例对此不做限定。第一业务场景与第二业务场景可以不同,第一业务场景和第二业务场景可以是具有一定关联的业务场景,例如,第一业务场景和第二业务场景可以是生物识别的场景,但两个业务场景所注重的关键点不同,例如,第一业务场景在某年龄段(如0-12岁)的性能较强,而在其它年龄段的性能将具有一定程度的下降,第二业务场景在另一个年龄段(如60-80岁)的性能较强,而在其它年龄段的性能将具有一定程度的下降,且上述两个年龄段完全不同。在实际应用中,第一业务场景和第二业务场景也可以是不存在明显关联关系的业务场景,具体可以根据实际情况设定,本说明书实施例对此不做限定。业务数据可以包括目标业务中需要使用的数据,也可以包括目标业务中产生的数据,也可以只包括上述两种数据中的任一种数据,例如,对于目标业务为生物识别业务,相应的业务数据可以包括用于进行生物识别处理的用户图像(可以是用户的面部图像、指纹图像、虹膜图像、掌纹图像等),具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,随着终端技术和网络技术的不断发展,很多业务会通过模型进行业务处理,例如,可以通过生物识别模型对生物识别业务进行处理,或者,通过风险识别模型对某金融类业务进行风险识别处理等。上述模型往往是针对某特定场景构建的模型,如果上述特定场景发生变化,则往往需要获取变化后的场景下的业务数据,并可以使用该业务数据构建和训练相应的模型,然后,将训练后的相应模型可以投入到变化后的场景下使用,例如,以支付和核身等场景下,使用面部识别作为认证手段为例,生物检测(即检测当前进行生物检测的对象是否为真实的人物)作为面部识别机制中重要的一环,对于将用于支付场景的生物检测模型,若直接将其部署到用于核身场景时,由于数据域变化巨大,生物检测模型的性能也会急剧下降,为此,需要构建和训练在核身场景下的生物检测模型。但是,上述方式需要花费较多时间采集变化后的场景下的业务数据,并且,还需要构建和训练相应的模型,也需要花费较长时间,而且,训练后的模型也需要进行性能评估等处理,从而使得模型从构建到投入使用的上线应用周期较长,且需要耗费较多人力物力,无法在短时间内进行规模化。基于此,需要提供一种跨场景的情况下减小模型上线应用周期、资源消耗更低的模型应用方案。本说明书实施例提供一种可实现的技术方案,具体可以包括以下内容:
终端设备中可以预先设置有场景检测机制或者目标模型的更新机制,针对场景检测机制,终端设备可以定期或不定期触发该场景检测机制,以检测当前的业务场景是否发生变化,具体可以通过对业务数据进行分析确定,例如如果业务数据中出现之前没有出现过的数据特征,且该数据特征很可能会影响目标模型的最终输出结果,则可以确定当前的业务场景发生变化等。针对目标模型的更新机制,可以预先设置业务场景的变化的触发按键或触发链接等,当需要更改当前的业务场景时,可以点击上述触发按键或触发链接,此时,如图1B所示,终端设备可以显示相应的页面,该页面中可以设置有场景变化的信息输入框,用户可以在上述信息输入框中输入需要更改的场景信息,输入完成后,可以点击该页面中的确定按键,此时,终端设备可以对用户输入的信息进行分析,确定业务场景是否需要更改,如果确定需要更改,则可以确定当前的业务场景发生变化等,在实际应用中,还可以包括多种不同的确定方式,具体可以根据实际情况设定,本说明书实施例对此不做限定。
当确定需要用于处理目标业务的目标模型对应的业务场景由当前的第一业务场景转换为变化后的第二业务场景时,需要获取样本数据来更新目标模型,为了更够快速获取样本数据,可以为终端设备设置试运营阶段,试运营阶段可以设置较短的时长(或时间段),如24小时,该时长可以是由一个连续的时间段构成,也可以是由多个不同的时间段组合而成等,具体可以根据实际情况设定,具体地,可以为终端设备设置一定时间段的试运营阶段,在试运营阶段,可以使用目标模型(该目标模型可以不具备跨场景下,可快速适配新业务场景,并达到可用性能的能力(或称为该目标模型不具备冷启动能力等))对目标业务进行处理(具体如可以使用原有的进行面部识别的目标模型对用户进行面部识别处理),在基于目标模型处理目标业务的过程中,可以获取其中的业务数据,可以将获取的业务数据作为用于更新目标模型的预选模型训练样本,或者,可以预先设置业务数据的选取规则,使得业务数据中能够满足该选取规则中的条件的业务数据作为用于更新目标模型的预选模型训练样本,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S104中,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征。
其中,预设模态可以根据实际情况设定,不同的业务,预设模态也可以不同,例如,对于面部识别业务,可以通过面部图像进行面部识别处理,通常,面部图像可以包括RGB模态的图像、Depth模态的图像(深度模态的图像)和NIR模态的图像,基于此,预设模态可以包括RGB模态、深度模态和NIR模态等。此外,不同模态的数据,其对应的数据特征也可以不同,例如RGB模态的图像的特征与Depth模态的图像的特征可以不同等。
在实施中,可以根据实际情况,预先为不同模态的数据设置相应的特征提取算方法,例如,预设模态包括第一模态和第二模态,对于第一模态,可以使用与第一模态相匹配的特征提取算方法对预选模型训练样本进行特征提取,得到第一模态下预选模型训练样本对应的样本特征,对于第二模态,可以使用与第二模态相匹配的特征提取算方法对预选模型训练样本进行特征提取,得到第二模态下预选模型训练样本对应的样本特征,对于预设模态中包含的其它模态,也可以采用上述方式计算相应模态下预选模型训练样本对应的样本特征,从而得到不同预设模态下预选模型训练样本对应的样本特征。
需要说明的是,上述使用的是特征提取算法进行特征提取,在实际应用中,还可以通过特征提取模型进行特征提取,该特征提取模块可以通过设定的特征提取算法构建,并通过指定的训练样本对特征提取模型进行模型训练后得到,特征提取模型可以包括多种,可以是通过设定的特征提取算法构建相应的特征提取模型,或者,也可以使用某些业务模型中的指定网络层组成的部分进行特征提取等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S106中,基于不同预设模态下预选模型训练样本对应的样本特征,对该样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新目标模型的训练样本。
在实施中,考虑到不同模态的映射在对目标业务的攻击和进行业务处理的样本上会展示出不同的特点,从而可以作为进行业务处理的依据(例如,不同模态的映射在面部识别攻击和面部识别样本上会展示出不同的特点,从而可以作为面部识别的依据),基于此,可以基于不同预设模态下预选模型训练样本对应的样本特征,分别计算任意两个预设模态下预选模型训练样本对应的样本特征之间的映射关系,得到任意两个预设模态下预选模型训练样本对应的样本特征之间的映射关系。然后,可以获取某一个或多个预选模型训练样本的标签,具体可以通过人工或预先基于专家经验等信息设定的规则确定上述预选模型训练样本的标签,之后,可以结合任意两个预设模态下预选模型训练样本对应的样本特征之间的映射关系,将剩余的预选模型训练样本中的每个预选模型训练样本与上述具有标签的预选模型训练样本进行相似度计算,基于相似度的计算数值,可以为剩余的预选模型训练样本中的每个预选模型训练样本设置相应的标签,从而实现为预选模型训练样本进行打标处理,得到进行打标处理后的预选模型训练样本。可以将进行打标处理后的预选模型训练样本确定为用于更新目标模型的训练样本,或者,可以从进行打标处理后的预选模型训练样本中选取一定数量的预选模型训练样本,并将选取的预选模型训练样本确定为用于更新目标模型的训练样本,或者,可以基于进行打标处理后的预选模型训练样本进行数据扩充处理,得到一定数量的样本,并将得到的一定数量的样本确定为用于更新目标模型的训练样本等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S108中,基于上述训练样本和预设的第一损失函数,对目标模型进行模型训练,得到应用于第二业务场景的目标模型。
在实施中,可以根据目标模型的输入数据和输出数据设定应用于第二业务场景的目标模型的第一损失函数,然后,可以将上述训练样本输入到目标模型中,通过目标模型得到相应的输出数据,基于该输出数据和该训练样本的标签,通过第一损失函数计算相应的损失值,基于得到的损失值调整目标模型的模型参数,此时,如果目标模型未收敛,则继续将新的训练样本输入到目标模型中,通过目标模型得到相应的输出数据,基于该输出数据和该训练样本的标签,通过第一损失函数计算相应的损失值,基于得到的损失值调整目标模型的模型参数等处理,直到目标模型收敛,从而完成对目标模型的更新训练,得到应用于第二业务场景的目标模型。
本说明书实施例提供一种模型的更新方法,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型,这样,模型更新的整个过程由终端设备自动完成,从而大幅降低新的业务场景下模型更新和模型训练上线应用的周期,以及资源的消耗,同时,提出了基于多模态训练样本的无监督跨业务场景冷启动业务处理方式,即通过多模态训练样本的自监督信号(即多模态对应性)监督下进行目标模型的学习,达到有标签训练样本的学习效果,从而在终端设备侧可以完成从数据积累到模型训练更新的全部环节,从而避免了针对新场景的长周期准备工作,做到快速的新场景适配。
实施例二
如图2所示,本说明书实施例提供一种模型的更新方法,该方法的执行主体可以为终端设备,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为IoT设备(具体如智能手表、车载设备等),还可以是预先设置的具有某种功能的机具等。此外,该方法的执行主体也可以为服务器等设备,具体处理过程可以根据执行主体为终端设备的情况进行调整,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S202中,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,基于目标模型处理目标业务的过程中,获取第一预设时间段内目标业务的业务数据。
其中,第一预设时间段可以根据实际情况设定,例如从某一天的0点钟-24点钟,或某一天的0点钟-下一天的24点钟等,在实际应用中,还可以是包括多个子时间段,如第一预设时间段包括某一天的10点钟-18点钟、下一天的9点钟-22点钟等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
上述步骤S202的具体处理过程可以参见上述实施例一中的相关内容,在此不再赘述。
在步骤S204中,如果获取的第一预设时间段内目标业务的业务数据的数量超过预设数量阈值,则获取该业务数据中攻击概率大于预设概率阈值的第一业务数据,并获取该业务数据中攻击概率小于预设概率阈值的第二业务数据。
其中,预设数量阈值可以根据实际情况设定,具体如5000或8000等。预设概率阈值可以根据实际情况设定,具体如50%或60%等。
在实施中,获取到第一预设时间段内目标业务的业务数据后,可以对上述获取的业务数据的数量进行统计,如果获取的第一预设时间段内目标业务的业务数据的数量未超过预设数量阈值,可以继续下一个预设时间段的业务数据获取,直到获取的业务数据的数量超过预设数量阈值。当获取的第一预设时间段内目标业务的业务数据的数量超过预设数量阈值时,可以确定每个业务数据作为攻击数据对目标业务或目标模型进行攻击的攻击概率。可以从上述业务数据中选取攻击概率大于预设概率阈值的业务数据,可以将上述选取的业务数据作为第一业务数据。此外,还可以从上述业务数据中选取攻击概率小于预设概率阈值的业务数据,可以将上述选取的业务数据作为第二业务数据。
在步骤S206中,从第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和第一业务数据作为用于更新目标模型的预选模型训练样本。
其中,预设比例可以根据实际情况设定,例如10%、15%或20%等。
在实施中,对于选取攻击概率小于预设概率阈值的第二业务数据,可以以预设比例作为选取概率,从第二业务数据中选取预设比例的第二业务数据,如可以从第二业务数据中以10%的选取概率选取相应数量的第二业务数据。可以将获取的预设比例的第二业务数据和第一业务数据作为用于更新目标模型的预选模型训练样本。
在实际应用中,某些情况下,训练样本的数量可能需要达到一定的数量,这样才能保证训练后的目标模型达到所要求的性能,为此,上述步骤S206的处理还可以通过下述步骤A2~步骤A6的方式实现。
在步骤A2中,从第二业务数据中获取预设比例的第二业务数据,如果获取的预设比例的第二业务数据和第一业务数据的数量超过上述预设数量阈值,则将获取的预设比例的第二业务数据和第一业务数据作为用于更新目标模型的预选模型训练样本。
在实施中,以预设数量阈值为5000,预设比例为10%为例,可以以10%的选取概率从第二业务数据中选取第二业务数据,如果选取的10%的第二业务数据和第一业务数据的数量超过5000,则样本累积完成,可以将获取的预设比例的第二业务数据和第一业务数据作为用于更新目标模型的预选模型训练样本。
在步骤A4中,如果获取的预设比例的第二业务数据和第一业务数据的数量不超过预设数量阈值,则获取第二预设时间段内目标业务的业务数据,并获取第二预设时间段内的业务数据中攻击概率大于预设概率阈值的第三业务数据,并获取第二预设时间段内的业务数据中攻击概率小于预设概率阈值的第四业务数据。
其中,第二预设时间段可以与第一预设时间段不同,第二预设时间段对应的时长可以与第一预设时间段对应的时长相同,例如,第二预设时间段对应的时长和第一预设时间段对应的时长均为24小时或48小时等,第二预设时间段对应的时长也可以与第一预设时间段对应的时长不同,例如,第二预设时间段对应的时长为12小时,第一预设时间段对应的时长为24小时等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,如果获取的预设比例的第二业务数据和第一业务数据的数量不超过预设数量阈值,则可以继续下一阶段的业务数据采集,即获取第二预设时间段(如第一预设时间段之后的时长为12小时的时间段等)内目标业务的业务数据,并获取第二预设时间段内的业务数据中攻击概率大于预设概率阈值的第三业务数据,并获取第二预设时间段内的业务数据中攻击概率小于预设概率阈值的第四业务数据。
在步骤A6中,从第四业务数据中获取预设比例的第四业务数据,如果获取的预设比例的第二业务数据、第一业务数据、获取的预设比例的第四业务数据和第三业务数据的总数量超过预设数量阈值,则将获取的预设比例的第二业务数据、第一业务数据、获取的预设比例的第四业务数据和第三业务数据作为用于更新目标模型的预选模型训练样本。
此外,如果获取的预设比例的第二业务数据、第一业务数据、获取的预设比例的第四业务数据和第三业务数据的总数量未超过预设数量阈值,则可以重复执行如上述步骤A4和步骤A6的处理,直到获取的各种业务数据的总数量超过预设数量阈值,从而得到用于更新目标模型的预选模型训练样本。
通过上述方式获取到预选模型训练样本后,可以使用预选模型训练样本训练用于确定不同模态下样本特征之间的映射关系的映射器,具体可以参见下述步骤S208和步骤S210的处理。
在步骤S208中,从预选模型训练样本中选取第一数量的预选模型训练样本。
其中,第一数量可以根据实际情况设定,例如,预选模型训练样本为数量为5000,第一数量可以为1000或1500等。
在步骤S210中,使用第一数量的预选模型训练样本和预设的第二损失函数,对映射器进行训练,得到训练后的映射器,该映射器包括多个不同的子模型,每个子模型用于确定不同的两个模态下的样本特征之间的映射关系,第二损失函数是基于不同预设模态下样本特征之间的映射关系和不同预设模态下预选模型训练样本对应的样本特征确定。
在实施中,映射器可以包括多个不同的子模型,每个子模型用于确定不同的两个模态下的样本特征之间的映射关系,多个不同的子模型可以使用同一种预设算法构建,也可以使用不同的预设算法构建,例如,可以通过多层感知器MLP(Multilayer Perceptron)(具体如三层MLP)构架每个子模型等,如果包括2个模态(如第一模态和第二模态),则该映射器可以包括2个子模型,每个子模型可以由三层的MLP构建,其中的一个子模型可以用于将第一模态下的样本特征映射到第二模态下的样本特征,另一个子模型可以用于将第二模态下的样本特征映射到第一模态下的样本特征。第二损失函数Loss可以是
其中,F1(f1)表示将第一模态下的样本特征映射到第二模态下的样本特征,F2(f2)表示将第二模态下的样本特征映射到第一模态下的样本特征,f1表示第一模态下的样本特征,f2表示第二模态下的样本特征。
可以将上述第一数量的预选模型训练样本输入到映射器中,通过映射器得到相应的输出数据,基于该输出数据和该预选模型训练样本的标签,通过第二损失函数计算相应的损失值,基于得到的损失值调整映射器的参数,此时,如果映射器未收敛,则继续执行将新的预选模型训练样本输入到映射器中,通过映射器得到相应的输出数据,基于该输出数据和该预选模型训练样本的标签,通过第二损失函数计算相应的损失值,基于得到的损失值调整映射器的参数等处理,直到映射器收敛,从而完成对映射器的训练,得到训练后的映射器。
此外,还可以使用剩余的预选模型训练样本作为测试样本,并可以使用测试样本对训练后的映射器进行评估,如果评估结果为通过,则可以部署并使用该映射器,如果评估结果为未通过,则可以通过上述方式继续训练映射器,直到对训练后的映射器的评估通过为止。
在步骤S212中,将预选模型训练样本输入到目标模型中,从目标模型的倒数第二个网络层中获取倒数第二个网络层的输出数据,基于该输出数据确定不同预设模态下预选模型训练样本对应的样本特征。
在实施中,目标模型中倒数第一个网络层输出的特征通常是分类概率等,因此,可以将目标模型的倒数第二个网络层的输出数据作为特征,具体地,可以将预选模型训练样本输入到目标模型中,提取目标模型的倒数第二个网络层的输出数据,该输出数据即可以作为不同预设模态下预选模型训练样本对应的样本特征。
在实际应用中,如果预设模态包括第一模态和第二模态,则上述步骤S312的具体处理可以包括:基于第一模态和第二模态,对预选模型训练样本进行特征提取,得到第一模态下预选模型训练样本对应的第一样本特征和第二模态下预选模型训练样本对应的第二样本特征。
其中,第一样本特征和第二样本特征可以是具有一定数量的维度的特征,例如,第一样本特征和第二样本特征可以是128维特征,或者,第一样本特征和第二样本特征可以是64维特征等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,基于第一模态,可以将预选模型训练样本输入到目标模型中,提取目标模型的倒数第二个网络层输出的得到第一模态下预选模型训练样本对应的第一样本特征,基于第二模态,可以将预选模型训练样本输入到目标模型中,提取目标模型的倒数第二个网络层输出的得到第二模态下预选模型训练样本对应的第二样本特征。
在步骤S214中,将不同预设模态下预选模型训练样本对应的样本特征分别输入到预先训练的映射器中,通过映射器对该样本特征进行不同模态映射,得到不同模态下该样本特征之间的映射关系。
在实际应用中,如果预设模态包括第一模态和第二模态,第一模态下预选模型训练样本对应的第一样本特征和第二模态下预选模型训练样本对应的第二样本特征,则上述步骤S214的具体处理可以包括:基于第一样本特征和第二样本特征,对第一样本特征和第二样本特征进行不同模态映射,得到第一样本特征到第二样本特征的映射,以及第二样本特征到第一样本特征的映射。
在步骤S216中,基于对上述样本特征进行不同模态映射得到的不同模态下样本特征之间的映射关系,以及不同预设模态下预选模型训练样本对应的样本特征,确定预选模型训练样本对应的多模态对应性数值。
在实施中,可以通过下述公式
其中,dot(F1(f1),f2)表示F1(f1)与f2之间的余弦相似度,dot(F2(f2),f1)表示F2(f2)与f1之间的余弦相似度,simscore表示预选模型训练样本对应的多模态对应性数值。可以将对上述样本特征进行不同模态映射得到的不同模态下样本特征之间的映射关系,以及不同预设模态下预选模型训练样本对应的样本特征输入到上述公式中,得到预选模型训练样本对应的多模态对应性数值simscore。
需要说明的是,步骤S216中,可以是对全部预选模型训练样本进行多模态对应性数值的计算,也可以是对部分预选模型训练样本进行多模态对应性数值的计算,具体如,可以对预选模型训练样本中上述第一数量的预选模型训练样本之外剩余的预选模型训练样本进行多模态对应性数值的计算,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S218中,基于预选模型训练样本对应的多模态对应性数值、第一预设阈值和第二预设阈值,分别对小于第一预设阈值的多模态对应性数值对应的预选模型训练样本,以及大于第二预设阈值的多模态对应性数值对应的预选模型训练样本进行打标处理。
其中,第一预设阈值和第二预设阈值可以根据实际情况设定。
在实施中,可以选取小于第一预设阈值的多模态对应性数值对应的预选模型训练样本和大于第二预设阈值的多模态对应性数值对应的预选模型训练样本,对于大于第一预设阈值且小于第二预设阈值的多模态对应性数值对应的预选模型训练样本可以舍弃,只保留上述选取的预选模型训练样本,并为选取的预选模型训练样本进行打标处理,得到选取的预选模型训练样本的标签。
在步骤S220中,将进行打标处理后的预选模型训练样本作为正样本,将正样本中的数据使用另一个预选模型训练样本的对应模态的预选模型训练样本进行替换,得到的样本作为负样本。
上述步骤S220的处理可以增加训练样本的多样性,同时提升目标模型的性能。
在步骤S222中,将正样本和负样本确定为用于更新目标模型的训练样本。
在步骤S224中,如果用于更新目标模型的训练样本的获取时长不超过第一预设时长阈值,则将目标模型中的第一指定的网络层作为目标模型中待更新的网络层。
其中,第一预设时长阈值可以根据实际情况设定,例如,第一预设时长阈值可以为12小时、24小时等。第一指定的网络层可以根据实际情况设定,例如,第一指定的网络层可以是目标模型中的最后4个网络层(或者是目标模型中的倒数4个网络层)或最后5个网络层(或者是目标模型中的倒数5个网络层)等。
在实施中,可以根据用于更新目标模型的训练样本累积的速度来确定目标模型中待更新的网络层,具体地,如果用于更新目标模型的训练样本的获取时长不超过第一预设时长阈值,则将目标模型中的第一指定的网络层作为目标模型中待更新的网络层,其它网络层可以保持不变。
在步骤S226中,基于上述训练样本和预设的第一损失函数,对目标模型中待更新的网络层进行模型训练,得到应用于第二业务场景的目标模型。
其中,第一损失函数可以是二分类损失函数等。
在步骤S228中,如果用于更新目标模型的训练样本的获取时长超过第一预设时长阈值,且不超过第二预设时长阈值,则将目标模型中的第二指定的网络层作为目标模型中待更新的网络层,第二预设时长阈值大于第一预设时长阈值,第二指定的网络层的数量小于第一指定的网络层的数量。
其中,第二预设时长阈值可以根据实际情况设定,例如,第二预设时长阈值可以为24小时、48小时等。第二指定的网络层可以根据实际情况设定,例如,第二指定的网络层可以是目标模型中的最后3个网络层(或者是目标模型中的倒数3个网络层)或最后4个网络层(或者是目标模型中的倒数4个网络层)等。
在步骤S230中,基于上述训练样本和预设的第一损失函数,对目标模型中待更新的网络层进行模型训练,得到应用于第二业务场景的目标模型。
在步骤S232中,如果用于更新目标模型的训练样本的获取时长超过第二预设时长阈值,则将目标模型中的第三指定的网络层作为目标模型中待更新的网络层,第三指定的网络层的数量小于第二指定的网络层的数量。
其中,第三指定的网络层可以根据实际情况设定,例如,第三指定的网络层可以是目标模型中的最后2个网络层(或者是目标模型中的倒数2个网络层)或最后3个网络层(或者是目标模型中的倒数3个网络层)等。
在步骤S234中,基于上述训练样本和预设的第一损失函数,对目标模型中待更新的网络层进行模型训练,得到应用于第二业务场景的目标模型。
在实际应用中,通过上述方式可以得到应用于第二业务场景的目标模型,可以将应用于第二业务场景的目标模型部署于终端设备,在执行目标业务时,可以获取相应的业务数据,并可以将业务数据输入到目标模型中,得到相应的输出结果,例如,目标模型用于面部识别,目标模型可以由RGB模态的第一子模型和深度Depth模态的第二子模型构成,第一子模型和第二子模型的输出数据均为业务数据的攻击概率,可以将业务数据分别输入第一子模型和第二子模型,得到第一子模型输出的攻击概率和第二子模型输出的攻击概率,可以将第一子模型输出的攻击概率和第二子模型输出的攻击概率相加,得到攻击概率之和,可以基于该攻击概率之和和预设的阈值,确定该业务数据是否存在攻击风险,如果不存在,可以进行面部识别,如果存在,则可以拒绝进行面部识别处理。
本说明书实施例提供一种模型的更新方法,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型,这样,模型更新的整个过程由终端设备自动完成,从而大幅降低新的业务场景下模型更新和模型训练上线应用的周期,以及资源的消耗,同时,提出了基于多模态训练样本的无监督跨业务场景冷启动业务处理方式,即通过多模态训练样本的自监督信号(即多模态对应性)监督下进行目标模型的学习,达到有标签训练样本的学习效果,从而在终端设备侧可以完成从数据积累到模型训练更新的全部环节,从而避免了针对新场景的长周期准备工作,做到快速的新场景适配。
实施例三
本实施例将结合具体的应用场景,对本发明实施例提供的一种模型的更新方法进行详细的阐述,相应的应用场景为面部识别(如面部识别等)中的生物检测(即检测当前进行生物检测的对象是否为真实的人物)的应用场景,其中,目标模型是用于进行生物检测的模型(或进行面部识别的模型),业务数据包括用于进行面部识别的用户图像,目标业务为生物检测业务,目标模型可以为生物检测模型,预设模态包括RGB模态和深度Depth模态,预设比例为10%。
如图3所示,本说明书实施例提供一种模型的更新方法,该方法的执行主体可以为终端设备,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为IoT设备(具体如智能手表、车载设备等),还可以是预先设置的具有某种功能的机具等。此外,该方法的执行主体也可以为服务器等设备,具体处理过程可以根据执行主体为终端设备的情况进行调整,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S302中,当用于处理生物检测业务的生物检测模型对应的业务场景由第一业务场景转换为第二业务场景时,基于生物检测模型处理生物检测业务的过程中,获取第一预设时间段内生物检测业务的用户图像。
在步骤S304中,如果获取的第一预设时间段内生物检测业务的用户图像的数量超过预设数量阈值,则获取该用户图像中攻击概率大于预设概率阈值的第一用户图像,并获取该用户图像中攻击概率小于预设概率阈值的第二用户图像。
在步骤S306中,以10%的选取概率从第二用户图像中选取相应数量的第二用户图像,如果选取的10%的第二用户图像和第一用户图像的数量超过上述预设数量阈值,则将选取的10%的第二用户图像和第一用户图像作为用于更新生物检测模型的预选模型训练样本。
在步骤S308中,如果选取的10%的第二用户图像和第一用户图像的数量不超过预设数量阈值,则获取第二预设时间段内的用户图像,并获取第二预设时间段内的用户数据中攻击概率大于预设概率阈值的第三用户图像,并获取第二预设时间段内的用户图像中攻击概率小于预设概率阈值的第四用户图像。
在步骤S310中,以10%的选取概率从第四用户图像中选取相应数量的第四用户图像,如果选取的10%的第二用户图像、第一用户图像、选取的10%的第四用户图像和第三用户图像的总数量超过预设数量阈值,则将选取的10%的第二用户图像、第一用户图像、选取的10%的第四用户图像和第三用户图像作为用于更新生物检测模型的预选模型训练样本。
此外,如果选取的10%的第二用户图像、第一用户图像、选取的10%的第四用户图像和第三用户图像的总数量未超过预设数量阈值,则可以重复执行如上述步骤S308和步骤S310的处理,直到获取的各种用户图像的总数量超过预设数量阈值,从而得到用于更新生物检测模型的预选模型训练样本。
通过上述方式获取到预选模型训练样本后,可以使用预选模型训练样本训练用于确定不同模态下样本特征之间的映射关系的映射器,具体可以参见下述步骤S312和步骤S314的处理。
在步骤S312中,从预选模型训练样本中选取第一数量的预选模型训练样本。
在步骤S314中,使用第一数量的预选模型训练样本和预设的第二损失函数,对映射器进行训练,得到训练后的映射器,该映射器包括2个不同的子模型,每个子模型通过三层的MLP构建,其中一个子模型用于将RGB模态下的样本特征映射到Depth模态下的样本特征,第二损失函数是基于不同预设模态下样本特征之间的映射关系和不同预设模态下预选模型训练样本对应的样本特征确定。
此外,还可以使用剩余的预选模型训练样本作为测试样本,并可以使用测试样本对训练后的映射器进行评估,如果评估结果为通过,则可以部署并使用该映射器,如果评估结果为未通过,则可以通过上述方式继续训练映射器,直到对训练后的映射器的评估通过为止。
在步骤S316中,将预选模型训练样本输入到生物检测模型中,从生物检测模型的倒数第二个网络层中获取倒数第二个网络层的输出数据,基于该输出数据确定不同预设模态下预选模型训练样本对应的样本特征。
在步骤S318中,将不同预设模态下预选模型训练样本对应的样本特征分别输入到预先训练的映射器中,通过映射器对该样本特征进行不同模态映射,得到不同模态下该样本特征之间的映射关系。
在步骤S320中,基于对上述样本特征进行不同模态映射得到的不同模态下样本特征之间的映射关系,以及不同预设模态下预选模型训练样本对应的样本特征,确定预选模型训练样本中上述第一数量的预选模型训练样本之外剩余的预选模型训练样本对应的多模态对应性数值。
在步骤S322中,基于预选模型训练样本中上述第一数量的预选模型训练样本之外剩余的预选模型训练样本对应的多模态对应性数值、第一预设阈值和第二预设阈值,分别对小于第一预设阈值的多模态对应性数值对应的预选模型训练样本,以及大于第二预设阈值的多模态对应性数值对应的预选模型训练样本进行打标处理。
在步骤S324中,将进行打标处理后的预选模型训练样本作为正样本,将正样本中的数据使用另一个预选模型训练样本的对应模态的预选模型训练样本进行替换,得到的样本作为负样本,将正样本和负样本确定为用于更新生物检测模型的训练样本。
在步骤S326中,如果用于更新生物检测模型的训练样本的获取时长不超过第一预设时长阈值,则将生物检测模型中的倒数4个网络层作为生物检测模型中待更新的网络层。
在步骤S328中,基于上述训练样本和预设的二分类损失函数,对生物检测模型中待更新的网络层进行模型训练,得到应用于第二业务场景的生物检测模型。
在步骤S330中,如果用于更新生物检测模型的训练样本的获取时长超过第一预设时长阈值,且不超过第二预设时长阈值,则将生物检测模型中的倒数3个网络层作为生物检测模型中待更新的网络层。
在步骤S332中,基于上述训练样本和预设的二分类损失函数,对生物检测模型中待更新的网络层进行模型训练,得到应用于第二业务场景的生物检测模型。
在步骤S334中,如果用于更新生物检测模型的训练样本的获取时长超过第二预设时长阈值,则将生物检测模型中的倒数2个网络层作为生物检测模型中待更新的网络层,第三指定的网络层的数量小于第二指定的网络层的数量。
在步骤S336中,基于上述训练样本和预设的二分类损失函数,对生物检测模型中待更新的网络层进行模型训练,得到应用于第二业务场景的生物检测模型。
在实际应用中,通过上述方式可以得到应用于第二业务场景的生物检测模型后,可以将应用于第二业务场景的生物检测模型部署于终端设备,生物检测模型可以由RGB模态的第一子模型和深度Depth模态的第二子模型构成,第一子模型和第二子模型的输出数据均为用户图像的攻击概率,可以将用户图像分别输入第一子模型和第二子模型,得到第一子模型输出的攻击概率和第二子模型输出的攻击概率,可以将第一子模型输出的攻击概率和第二子模型输出的攻击概率相加,得到攻击概率之和,可以基于该攻击概率之和和预设的阈值,确定该用户图像是否存在攻击风险,如果不存在,可以进行面部识别,如果存在,则可以拒绝进行面部识别处理。
本说明书实施例提供一种模型的更新方法,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型,这样,模型更新的整个过程由终端设备自动完成,从而大幅降低新的业务场景下模型更新和模型训练上线应用的周期,以及资源的消耗,同时,提出了基于多模态训练样本的无监督跨业务场景冷启动业务处理方式,即通过多模态训练样本的自监督信号(即多模态对应性)监督下进行目标模型的学习,达到有标签训练样本的学习效果,从而在终端设备侧可以完成从数据积累到模型训练更新的全部环节,从而避免了针对新场景的长周期准备工作,做到快速的新场景适配。
实施例四
基于同样的思路,本说明书实施例还提供一种模型的更新装置,如图4所示。
该模型的更新装置包括:数据获取模块401、特征提取模块402、样本确定模块403和模型更新模块404,其中:
数据获取模块401,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
特征提取模块402,分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
样本确定模块403,基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
模型更新模块404,基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述预设模态包括第一模态和第二模态,所述特征提取模块402,基于所述第一模态和所述第二模态,对所述预选模型训练样本进行特征提取,得到所述第一模态下所述预选模型训练样本对应的第一样本特征和所述第二模态下所述预选模型训练样本对应的第二样本特征;
所述样本确定模块403,基于所述第一样本特征和所述第二样本特征,对所述第一样本特征和所述第二样本特征进行不同模态映射,得到所述第一样本特征到所述第二样本特征的映射,以及所述第二样本特征到所述第一样本特征的映射。
本说明书实施例中,所述数据获取模块401,包括:
数据获取单元,基于所述目标模型处理所述目标业务的过程中,获取第一预设时间段内所述目标业务的业务数据;
选取单元,如果获取的第一预设时间段内所述目标业务的业务数据的数量超过预设数量阈值,则获取所述业务数据中攻击概率大于预设概率阈值的第一业务数据,并获取所述业务数据中攻击概率小于预设概率阈值的第二业务数据;
预选单元,从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本。
本说明书实施例中,所述预选单元,从所述第二业务数据中获取预设比例的第二业务数据,如果获取的预设比例的第二业务数据和所述第一业务数据的数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本;如果获取的预设比例的第二业务数据和所述第一业务数据的数量不超过所述预设数量阈值,则获取第二预设时间段内所述目标业务的业务数据,并获取所述第二预设时间段内的业务数据中攻击概率大于预设概率阈值的第三业务数据,并获取所述第二预设时间段内的业务数据中攻击概率小于预设概率阈值的第四业务数据;从所述第四业务数据中获取预设比例的第四业务数据,如果获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据的总数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据作为用于更新所述目标模型的预选模型训练样本。
本说明书实施例中,所述特征提取模块402,将所述预选模型训练样本输入到所述目标模型中,从所述目标模型的倒数第二个网络层中获取所述倒数第二个网络层的输出数据,基于所述输出数据确定不同预设模态下所述预选模型训练样本对应的样本特征。
本说明书实施例中,所述样本确定模块403,将不同预设模态下所述预选模型训练样本对应的样本特征分别输入到预先训练的映射器中,通过所述映射器对所述样本特征进行不同模态映射,得到不同模态下所述样本特征之间的映射关系。
本说明书实施例中,所述装置还包括:
样本选取模块,从所述预选模型训练样本中选取第一数量的预选模型训练样本;
映射器训练模块,使用所述第一数量的预选模型训练样本和预设的第二损失函数,对所述映射器进行训练,得到训练后的映射器,所述映射器包括多个不同的子模型,每个子模型用于确定不同的两个模态下的样本特征之间的映射关系,所述第二损失函数是基于不同模态下所述样本特征之间的映射关系和不同预设模态下所述预选模型训练样本对应的样本特征确定。
本说明书实施例中,所述样本确定模块403,包括:
计算单元,基于对所述样本特征进行不同模态映射得到的不同模态下所述样本特征之间的映射关系,以及不同预设模态下所述预选模型训练样本对应的样本特征,确定所述预选模型训练样本对应的多模态对应性数值;
打标单元,基于所述预选模型训练样本对应的多模态对应性数值、第一预设阈值和第二预设阈值,分别对小于所述第一预设阈值的多模态对应性数值对应的预选模型训练样本,以及大于所述第二预设阈值的多模态对应性数值对应的预选模型训练样本进行打标处理。
本说明书实施例中,所述样本确定模块403,包括:
正负样本确定单元,将进行打标处理后的预选模型训练样本作为正样本,将所述正样本中的数据使用另一个预选模型训练样本的对应模态的预选模型训练样本进行替换,得到的样本作为负样本;
样本确定单元,将所述正样本和所述负样本确定为用于更新所述目标模型的训练样本。
本说明书实施例中,所述模型更新模块404,包括:
网络层确定单元,如果用于更新所述目标模型的训练样本的获取时长不超过第一预设时长阈值,则将所述目标模型中的第一指定的网络层作为所述目标模型中待更新的网络层;
模型更新单元,基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述装置还包括:
第一网络层确定模块,如果用于更新所述目标模型的训练样本的获取时长超过第一预设时长阈值,且不超过第二预设时长阈值,则将所述目标模型中的第二指定的网络层作为所述目标模型中待更新的网络层,所述第二预设时长阈值大于所述第一预设时长阈值,所述第二指定的网络层的数量小于所述第一指定的网络层的数量;
第一模型训练模块,基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述装置还包括:
第二网络层确定模块,如果用于更新所述目标模型的训练样本的获取时长超过第二预设时长阈值,则将所述目标模型中的第三指定的网络层作为所述目标模型中待更新的网络层,所述第三指定的网络层的数量小于所述第二指定的网络层的数量;
第二模型训练模块,基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述目标模型是用于进行生物识别的模型,所述业务数据包括用于进行生物识别的用户图像。
本说明书实施例提供一种模型的更新装置,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型,这样,模型更新的整个过程由终端设备自动完成,从而大幅降低新的业务场景下模型更新和模型训练上线应用的周期,以及资源的消耗,同时,提出了基于多模态训练样本的无监督跨业务场景冷启动业务处理方式,即通过多模态训练样本的自监督信号(即多模态对应性)监督下进行目标模型的学习,达到有标签训练样本的学习效果,从而在终端设备侧可以完成从数据积累到模型训练更新的全部环节,从而避免了针对新场景的长周期准备工作,做到快速的新场景适配。
实施例五
以上为本说明书实施例提供的模型的更新装置,基于同样的思路,本说明书实施例还提供一种模型的更新设备,如图5所示。
所述模型的更新设备可以为上述实施例提供终端设备等。
模型的更新设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对模型的更新设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在模型的更新设备上执行存储器502中的一系列计算机可执行指令。模型的更新设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506。
具体在本实施例中,模型的更新设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对模型的更新设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述预设模态包括第一模态和第二模态,所述分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征,包括:
基于所述第一模态和所述第二模态,对所述预选模型训练样本进行特征提取,得到所述第一模态下所述预选模型训练样本对应的第一样本特征和所述第二模态下所述预选模型训练样本对应的第二样本特征;
所述基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,包括:
基于所述第一样本特征和所述第二样本特征,对所述第一样本特征和所述第二样本特征进行不同模态映射,得到所述第一样本特征到所述第二样本特征的映射,以及所述第二样本特征到所述第一样本特征的映射。
本说明书实施例中,所述获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本,包括:
基于所述目标模型处理所述目标业务的过程中,获取第一预设时间段内所述目标业务的业务数据;
如果获取的第一预设时间段内所述目标业务的业务数据的数量超过预设数量阈值,则获取所述业务数据中攻击概率大于预设概率阈值的第一业务数据,并获取所述业务数据中攻击概率小于预设概率阈值的第二业务数据;
从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本。
本说明书实施例中,所述从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本,包括:
从所述第二业务数据中获取预设比例的第二业务数据,如果获取的预设比例的第二业务数据和所述第一业务数据的数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本;
如果获取的预设比例的第二业务数据和所述第一业务数据的数量不超过所述预设数量阈值,则获取第二预设时间段内所述目标业务的业务数据,并获取所述第二预设时间段内的业务数据中攻击概率大于预设概率阈值的第三业务数据,并获取所述第二预设时间段内的业务数据中攻击概率小于预设概率阈值的第四业务数据;
从所述第四业务数据中获取预设比例的第四业务数据,如果获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据的总数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据作为用于更新所述目标模型的预选模型训练样本。
本说明书实施例中,所述分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征,包括:
将所述预选模型训练样本输入到所述目标模型中,从所述目标模型的倒数第二个网络层中获取所述倒数第二个网络层的输出数据,基于所述输出数据确定不同预设模态下所述预选模型训练样本对应的样本特征。
本说明书实施例中,所述基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,包括:
将不同预设模态下所述预选模型训练样本对应的样本特征分别输入到预先训练的映射器中,通过所述映射器对所述样本特征进行不同模态映射,得到不同模态下所述样本特征之间的映射关系。
本说明书实施例中,还包括:
从所述预选模型训练样本中选取第一数量的预选模型训练样本;
使用所述第一数量的预选模型训练样本和预设的第二损失函数,对所述映射器进行训练,得到训练后的映射器,所述映射器包括多个不同的子模型,每个子模型用于确定不同的两个模态下的样本特征之间的映射关系,所述第二损失函数是基于不同模态下所述样本特征之间的映射关系和不同预设模态下所述预选模型训练样本对应的样本特征确定。
本说明书实施例中,所述为所述预选模型训练样本进行打标处理,包括:
基于对所述样本特征进行不同模态映射得到的不同模态下所述样本特征之间的映射关系,以及不同预设模态下所述预选模型训练样本对应的样本特征,确定所述预选模型训练样本对应的多模态对应性数值;
基于所述预选模型训练样本对应的多模态对应性数值、第一预设阈值和第二预设阈值,分别对小于所述第一预设阈值的多模态对应性数值对应的预选模型训练样本,以及大于所述第二预设阈值的多模态对应性数值对应的预选模型训练样本进行打标处理。
本说明书实施例中,所述基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本,包括:
将进行打标处理后的预选模型训练样本作为正样本,将所述正样本中的数据使用另一个预选模型训练样本的对应模态的预选模型训练样本进行替换,得到的样本作为负样本;
将所述正样本和所述负样本确定为用于更新所述目标模型的训练样本。
本说明书实施例中,所述基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型,包括:
如果用于更新所述目标模型的训练样本的获取时长不超过第一预设时长阈值,则将所述目标模型中的第一指定的网络层作为所述目标模型中待更新的网络层;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,还包括:
如果用于更新所述目标模型的训练样本的获取时长超过第一预设时长阈值,且不超过第二预设时长阈值,则将所述目标模型中的第二指定的网络层作为所述目标模型中待更新的网络层,所述第二预设时长阈值大于所述第一预设时长阈值,所述第二指定的网络层的数量小于所述第一指定的网络层的数量;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,还包括:
如果用于更新所述目标模型的训练样本的获取时长超过第二预设时长阈值,则将所述目标模型中的第三指定的网络层作为所述目标模型中待更新的网络层,所述第三指定的网络层的数量小于所述第二指定的网络层的数量;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述目标模型是用于进行生物识别的模型,所述业务数据包括用于进行生物识别的用户图像。
本说明书实施例提供一种模型的更新设备,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型,这样,模型更新的整个过程由终端设备自动完成,从而大幅降低新的业务场景下模型更新和模型训练上线应用的周期,以及资源的消耗,同时,提出了基于多模态训练样本的无监督跨业务场景冷启动业务处理方式,即通过多模态训练样本的自监督信号(即多模态对应性)监督下进行目标模型的学习,达到有标签训练样本的学习效果,从而在终端设备侧可以完成从数据积累到模型训练更新的全部环节,从而避免了针对新场景的长周期准备工作,做到快速的新场景适配。
实施例六
进一步地,基于上述图1A到图3所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述预设模态包括第一模态和第二模态,所述分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征,包括:
基于所述第一模态和所述第二模态,对所述预选模型训练样本进行特征提取,得到所述第一模态下所述预选模型训练样本对应的第一样本特征和所述第二模态下所述预选模型训练样本对应的第二样本特征;
所述基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,包括:
基于所述第一样本特征和所述第二样本特征,对所述第一样本特征和所述第二样本特征进行不同模态映射,得到所述第一样本特征到所述第二样本特征的映射,以及所述第二样本特征到所述第一样本特征的映射。
本说明书实施例中,所述获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本,包括:
基于所述目标模型处理所述目标业务的过程中,获取第一预设时间段内所述目标业务的业务数据;
如果获取的第一预设时间段内所述目标业务的业务数据的数量超过预设数量阈值,则获取所述业务数据中攻击概率大于预设概率阈值的第一业务数据,并获取所述业务数据中攻击概率小于预设概率阈值的第二业务数据;
从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本。
本说明书实施例中,所述从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本,包括:
从所述第二业务数据中获取预设比例的第二业务数据,如果获取的预设比例的第二业务数据和所述第一业务数据的数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本;
如果获取的预设比例的第二业务数据和所述第一业务数据的数量不超过所述预设数量阈值,则获取第二预设时间段内所述目标业务的业务数据,并获取所述第二预设时间段内的业务数据中攻击概率大于预设概率阈值的第三业务数据,并获取所述第二预设时间段内的业务数据中攻击概率小于预设概率阈值的第四业务数据;
从所述第四业务数据中获取预设比例的第四业务数据,如果获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据的总数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据作为用于更新所述目标模型的预选模型训练样本。
本说明书实施例中,所述分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征,包括:
将所述预选模型训练样本输入到所述目标模型中,从所述目标模型的倒数第二个网络层中获取所述倒数第二个网络层的输出数据,基于所述输出数据确定不同预设模态下所述预选模型训练样本对应的样本特征。
本说明书实施例中,所述基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,包括:
将不同预设模态下所述预选模型训练样本对应的样本特征分别输入到预先训练的映射器中,通过所述映射器对所述样本特征进行不同模态映射,得到不同模态下所述样本特征之间的映射关系。
本说明书实施例中,还包括:
从所述预选模型训练样本中选取第一数量的预选模型训练样本;
使用所述第一数量的预选模型训练样本和预设的第二损失函数,对所述映射器进行训练,得到训练后的映射器,所述映射器包括多个不同的子模型,每个子模型用于确定不同的两个模态下的样本特征之间的映射关系,所述第二损失函数是基于不同模态下所述样本特征之间的映射关系和不同预设模态下所述预选模型训练样本对应的样本特征确定。
本说明书实施例中,所述为所述预选模型训练样本进行打标处理,包括:
基于对所述样本特征进行不同模态映射得到的不同模态下所述样本特征之间的映射关系,以及不同预设模态下所述预选模型训练样本对应的样本特征,确定所述预选模型训练样本对应的多模态对应性数值;
基于所述预选模型训练样本对应的多模态对应性数值、第一预设阈值和第二预设阈值,分别对小于所述第一预设阈值的多模态对应性数值对应的预选模型训练样本,以及大于所述第二预设阈值的多模态对应性数值对应的预选模型训练样本进行打标处理。
本说明书实施例中,所述基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本,包括:
将进行打标处理后的预选模型训练样本作为正样本,将所述正样本中的数据使用另一个预选模型训练样本的对应模态的预选模型训练样本进行替换,得到的样本作为负样本;
将所述正样本和所述负样本确定为用于更新所述目标模型的训练样本。
本说明书实施例中,所述基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型,包括:
如果用于更新所述目标模型的训练样本的获取时长不超过第一预设时长阈值,则将所述目标模型中的第一指定的网络层作为所述目标模型中待更新的网络层;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,还包括:
如果用于更新所述目标模型的训练样本的获取时长超过第一预设时长阈值,且不超过第二预设时长阈值,则将所述目标模型中的第二指定的网络层作为所述目标模型中待更新的网络层,所述第二预设时长阈值大于所述第一预设时长阈值,所述第二指定的网络层的数量小于所述第一指定的网络层的数量;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,还包括:
如果用于更新所述目标模型的训练样本的获取时长超过第二预设时长阈值,则将所述目标模型中的第三指定的网络层作为所述目标模型中待更新的网络层,所述第三指定的网络层的数量小于所述第二指定的网络层的数量;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
本说明书实施例中,所述目标模型是用于进行生物识别的模型,所述业务数据包括用于进行生物识别的用户图像。
本说明书实施例提供一种存储介质,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于目标模型处理目标业务时的业务数据,并从业务数据中获取用于更新目标模型的预选模型训练样本,然后,分别对预选模型训练样本进行特征提取,得到不同预设模态下预选模型训练样本对应的样本特征,基于不同预设模态下预选模型训练样本对应的样本特征,对样本特征进行不同模态映射,并为预选模型训练样本进行打标处理,基于打标后的预选模型训练样本,确定训练样本,最终,基于训练样本和第一损失函数,对目标模型进行更新,得到应用于第二业务场景的目标模型,这样,模型更新的整个过程由终端设备自动完成,从而大幅降低新的业务场景下模型更新和模型训练上线应用的周期,以及资源的消耗,同时,提出了基于多模态训练样本的无监督跨业务场景冷启动业务处理方式,即通过多模态训练样本的自监督信号(即多模态对应性)监督下进行目标模型的学习,达到有标签训练样本的学习效果,从而在终端设备侧可以完成从数据积累到模型训练更新的全部环节,从而避免了针对新场景的长周期准备工作,做到快速的新场景适配。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (16)
1.一种模型的更新方法,应用于终端设备,所述方法包括:
当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
2.根据权利要求1所述的方法,所述预设模态包括第一模态和第二模态,所述分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征,包括:
基于所述第一模态和所述第二模态,对所述预选模型训练样本进行特征提取,得到所述第一模态下所述预选模型训练样本对应的第一样本特征和所述第二模态下所述预选模型训练样本对应的第二样本特征;
所述基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,包括:
基于所述第一样本特征和所述第二样本特征,对所述第一样本特征和所述第二样本特征进行不同模态映射,得到所述第一样本特征到所述第二样本特征的映射,以及所述第二样本特征到所述第一样本特征的映射。
3.根据权利要求2所述的方法,所述获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本,包括:
基于所述目标模型处理所述目标业务的过程中,获取第一预设时间段内所述目标业务的业务数据;
如果获取的第一预设时间段内所述目标业务的业务数据的数量超过预设数量阈值,则获取所述业务数据中攻击概率大于预设概率阈值的第一业务数据,并获取所述业务数据中攻击概率小于预设概率阈值的第二业务数据;
从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本。
4.根据权利要求3所述的方法,所述从所述第二业务数据中获取预设比例的第二业务数据,将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本,包括:
从所述第二业务数据中获取预设比例的第二业务数据,如果获取的预设比例的第二业务数据和所述第一业务数据的数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据和所述第一业务数据作为用于更新所述目标模型的预选模型训练样本;
如果获取的预设比例的第二业务数据和所述第一业务数据的数量不超过所述预设数量阈值,则获取第二预设时间段内所述目标业务的业务数据,并获取所述第二预设时间段内的业务数据中攻击概率大于预设概率阈值的第三业务数据,并获取所述第二预设时间段内的业务数据中攻击概率小于预设概率阈值的第四业务数据;
从所述第四业务数据中获取预设比例的第四业务数据,如果获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据的总数量超过所述预设数量阈值,则将获取的预设比例的第二业务数据、所述第一业务数据、获取的预设比例的第四业务数据和所述第三业务数据作为用于更新所述目标模型的预选模型训练样本。
5.根据权利要求4所述的方法,所述分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征,包括:
将所述预选模型训练样本输入到所述目标模型中,从所述目标模型的倒数第二个网络层中获取所述倒数第二个网络层的输出数据,基于所述输出数据确定不同预设模态下所述预选模型训练样本对应的样本特征。
6.根据权利要求1所述的方法,所述基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,包括:
将不同预设模态下所述预选模型训练样本对应的样本特征分别输入到预先训练的映射器中,通过所述映射器对所述样本特征进行不同模态映射,得到不同模态下所述样本特征之间的映射关系。
7.根据权利要求6所述的方法,所述方法还包括:
从所述预选模型训练样本中选取第一数量的预选模型训练样本;
使用所述第一数量的预选模型训练样本和预设的第二损失函数,对所述映射器进行训练,得到训练后的映射器,所述映射器包括多个不同的子模型,每个子模型用于确定不同的两个模态下的样本特征之间的映射关系,所述第二损失函数是基于不同模态下所述样本特征之间的映射关系和不同预设模态下所述预选模型训练样本对应的样本特征确定。
8.根据权利要求1所述的方法,所述为所述预选模型训练样本进行打标处理,包括:
基于对所述样本特征进行不同模态映射得到的不同模态下所述样本特征之间的映射关系,以及不同预设模态下所述预选模型训练样本对应的样本特征,确定所述预选模型训练样本对应的多模态对应性数值;
基于所述预选模型训练样本对应的多模态对应性数值、第一预设阈值和第二预设阈值,分别对小于所述第一预设阈值的多模态对应性数值对应的预选模型训练样本,以及大于所述第二预设阈值的多模态对应性数值对应的预选模型训练样本进行打标处理。
9.根据权利要求8所述的方法,所述基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本,包括:
将进行打标处理后的预选模型训练样本作为正样本,将所述正样本中的数据使用另一个预选模型训练样本的对应模态的预选模型训练样本进行替换,得到的样本作为负样本;
将所述正样本和所述负样本确定为用于更新所述目标模型的训练样本。
10.根据权利要求1所述的方法,所述基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型,包括:
如果用于更新所述目标模型的训练样本的获取时长不超过第一预设时长阈值,则将所述目标模型中的第一指定的网络层作为所述目标模型中待更新的网络层;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
11.根据权利要求10所述的方法,所述方法还包括:
如果用于更新所述目标模型的训练样本的获取时长超过第一预设时长阈值,且不超过第二预设时长阈值,则将所述目标模型中的第二指定的网络层作为所述目标模型中待更新的网络层,所述第二预设时长阈值大于所述第一预设时长阈值,所述第二指定的网络层的数量小于所述第一指定的网络层的数量;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
12.根据权利要求11所述的方法,所述方法还包括:
如果用于更新所述目标模型的训练样本的获取时长超过第二预设时长阈值,则将所述目标模型中的第三指定的网络层作为所述目标模型中待更新的网络层,所述第三指定的网络层的数量小于所述第二指定的网络层的数量;
基于所述训练样本和预设的第一损失函数,对所述目标模型中待更新的网络层进行模型训练,得到应用于所述第二业务场景的目标模型。
13.根据权利要求1所述的方法,所述目标模型是用于进行生物识别的模型,所述业务数据包括用于进行生物识别的用户图像。
14.一种模型的更新装置,所述装置包括:
数据获取模块,当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
特征提取模块,分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
样本确定模块,基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
模型更新模块,基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
15.一种模型的更新设备,所述模型的更新设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
16.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:
当用于处理目标业务的目标模型对应的业务场景由第一业务场景转换为第二业务场景时,获取基于所述目标模型处理所述目标业务时的业务数据,并从所述业务数据中获取用于更新所述目标模型的预选模型训练样本;
分别对所述预选模型训练样本进行特征提取,得到不同预设模态下所述预选模型训练样本对应的样本特征;
基于不同预设模态下所述预选模型训练样本对应的样本特征,对所述样本特征进行不同模态映射,并为所述预选模型训练样本进行打标处理,基于进行打标处理后的预选模型训练样本,确定用于更新所述目标模型的训练样本;
基于所述训练样本和预设的第一损失函数,对所述目标模型进行模型训练,得到应用于所述第二业务场景的目标模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210704675.9A CN115204263A (zh) | 2022-06-21 | 2022-06-21 | 一种模型的更新方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210704675.9A CN115204263A (zh) | 2022-06-21 | 2022-06-21 | 一种模型的更新方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204263A true CN115204263A (zh) | 2022-10-18 |
Family
ID=83575516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210704675.9A Pending CN115204263A (zh) | 2022-06-21 | 2022-06-21 | 一种模型的更新方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204263A (zh) |
-
2022
- 2022-06-21 CN CN202210704675.9A patent/CN115204263A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107358157B (zh) | 一种人脸活体检测方法、装置以及电子设备 | |
CN109284675B (zh) | 一种用户的识别方法、装置及设备 | |
CN111414946B (zh) | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 | |
CN112800468B (zh) | 一种基于隐私保护的数据处理方法、装置及设备 | |
CN113111804B (zh) | 一种人脸检测的方法、装置、电子设备及存储介质 | |
CN112308113A (zh) | 一种基于半监督的目标识别方法、设备及介质 | |
CN112241789A (zh) | 用于轻量化神经网络的结构化剪枝方法、装置、介质及设备 | |
CN111797870A (zh) | 算法模型的优化方法、装置、存储介质及电子设备 | |
CN115712866A (zh) | 数据处理方法、装置及设备 | |
CN111652286A (zh) | 一种基于图嵌入的物体识别方法、设备及介质 | |
CN110033092B (zh) | 数据标签生成、模型训练、事件识别方法和装置 | |
CN113326887B (zh) | 文本检测方法、装置、计算机设备 | |
CN113221717A (zh) | 一种基于隐私保护的模型构建方法、装置及设备 | |
CN108681490B (zh) | 针对rpc信息的向量处理方法、装置以及设备 | |
CN111753583A (zh) | 一种识别方法及装置 | |
CN115204263A (zh) | 一种模型的更新方法、装置及设备 | |
CN115204395A (zh) | 数据的处理方法、装置及设备 | |
CN115393914A (zh) | 多任务模型训练方法、装置、设备及存储介质 | |
CN111598092A (zh) | 图像中目标区域的确定方法、目标识别方法及装置 | |
CN113204664B (zh) | 一种图像聚类方法及装置 | |
CN112115952B (zh) | 一种基于全卷积神经网络的图像分类方法、设备及介质 | |
CN111563048B (zh) | 一种生物识别设备的测试方法、装置、设备及系统 | |
CN115423485B (zh) | 数据处理方法、装置及设备 | |
CN114662706B (zh) | 一种模型训练方法、装置及设备 | |
CN113673601B (zh) | 一种行为识别方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |