CN111401563A - 机器学习模型更新方法和装置 - Google Patents

机器学习模型更新方法和装置 Download PDF

Info

Publication number
CN111401563A
CN111401563A CN201811623950.4A CN201811623950A CN111401563A CN 111401563 A CN111401563 A CN 111401563A CN 201811623950 A CN201811623950 A CN 201811623950A CN 111401563 A CN111401563 A CN 111401563A
Authority
CN
China
Prior art keywords
target data
machine learning
learning model
judgment result
calibration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811623950.4A
Other languages
English (en)
Other versions
CN111401563B (zh
Inventor
杨威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201811623950.4A priority Critical patent/CN111401563B/zh
Publication of CN111401563A publication Critical patent/CN111401563A/zh
Application granted granted Critical
Publication of CN111401563B publication Critical patent/CN111401563B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了机器学习模型更新方法和装置,该方法包括:将目标数据输入到待更新的机器学习模型中进行分析,得到目标数据的判定结果及判定结果的置信度;比较判定结果的置信度与预设阈值的大小;在判定结果的置信度小于预设阈值时,输出目标数据,以使目标数据被标定;获取目标数据的标定结果;通过目标数据及目标数据的标定结果对机器学习模型进行训练,以更新机器学习模型。本申请实施例的机器学习模型更新方法实现了自动选取样本数据,减少了工作人员的负担,并且能够缩短机器学习模型的迭代时间周期,增加机器学习模型的更新效率。

Description

机器学习模型更新方法和装置
技术领域
本申请涉及机器学习技术领域,特别是涉及机器学习模型更新方法和装置。
背景技术
随着计算机技术的发展,机器学习算法被广泛应用于各个领域。特别是基于卷积神经网络的深度学习算法出现后,机器学习算法得到了快速发展。机器学习算法的训练过程一般可以总结为:获取样本数据,人工对样本数据进行标定;选择合适的机器学习模型,使用标定后的样本数据对机器学习模型进行训练,达到预期的训练精度后导出机器学习模型。
由于目前的机器学习模型都是针对具体场景构建的,面对复杂多样的用户前端数据,难免出现预测错误,因此需要对机器学习模型逐步更新,以提升预测的准确性。
相关技术中,会存储用户提交的前端数据,工作人员人工在前端数据中选取数据进行标定,用于训练更新机器学习模型,该方法可以起到提升预测准确率的作用,但是人工选取样本数据增加了工作人员的负担,增加了机器学习模型的迭代时间周期,导致更新效率低。
发明内容
本申请实施例的目的在于提供一种机器学习模型更新方法和装置,以实现自动选取样本数据,减少机器学习模型的迭代时间周期,提高更新效率。具体技术方案如下:
第一方面,本申请实施例提供了一种机器学习模型更新方法,所述方法包括:
将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果及所述判定结果的置信度;
比较所述判定结果的置信度与预设阈值的大小;
在所述判定结果的置信度小于所述预设阈值时,输出所述目标数据,以使所述目标数据被标定;
获取所述目标数据的标定结果;
通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
可选的,本申请实施例的机器学习模型更新方法还包括:
获取用户针对所述目标数据的判定结果的反馈信息;
在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定。
可选的,在所述输出所述目标数据之前,所述方法还包括:
检测所述目标数据是否被输出过;
所述输出所述目标数据,包括:
当所述目标数据未输出过时,输出所述目标数据。
可选的,所述在所述判定结果的置信度小于所述预设阈值时,输出所述目标数据,以使所述目标数据被标定,包括:
在所述判定结果的置信度小于所述预设阈值时,将所述目标数据输出到标定池中;
展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
第二方面,本申请实施例提供了一种机器学习模型更新方法,所述方法包括:
将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果;
向用户输出所述目标数据的判定结果;
获取所述用户针对所述目标数据的判定结果的反馈信息;
在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定;
获取所述目标数据的标定结果;
通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
可选的,所述在所述反馈信息表征所述判定结果错误时,输出所述目标数据,以使所述目标数据被标定,包括:
在所述反馈信息表征所述判定结果错误时,将所述目标数据输出到标定池中;
展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
第三方面,本申请实施例提供了一种机器学习模型更新装置,所述装置包括:
数据预测模块,用于将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果及所述判定结果的置信度;
阈值判定模块,用于比较所述判定结果的置信度与预设阈值的大小;
第一数据标定模块,用于在所述判定结果的置信度小于所述预设阈值时,输出所述目标数据,以使所述目标数据被标定;
第一结果获取模块,用于获取所述目标数据的标定结果;
第一模型更新模块,用于通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
可选的,本申请实施例的机器学习模型更新装置还包括:
反馈信息获取模块,用于获取用户针对所述目标数据的判定结果的反馈信息;
第二数据标定模块,用于在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定。
可选的,本申请实施例的机器学习模型更新装置还包括:
输出检测模块,用于检测所述目标数据是否被输出过;
所述第一数据标定模块,具体用于:在所述判定结果的置信度小于所述预设阈值、且所述目标数据未输出过时,输出所述目标数据,以使所述目标数据被标定;
所述第二数据标定模块,具体用于在所述反馈信息表征所述判定结果不准确、且所述目标数据未输出过时,输出所述目标数据,以使所述目标数据被标定。
可选的,所述第一数据标定模块,包括:
第一目标数据输出子模块,用于在所述判定结果的置信度小于所述预设阈值时,将所述目标数据输出到标定池中;
第一目标数据展示子模块,用于展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
第四方面,本申请实施例提供了一种机器学习模型更新装置,所述装置包括:
判定结果获取模块,用于将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果;
判定结果输出模块,用于向用户输出所述目标数据的判定结果;
反馈信息获取模块,用于获取所述用户针对所述目标数据的判定结果的反馈信息;
第三数据标定模块,用于在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定;
第二结果获取模块,用于获取所述目标数据的标定结果;
第二模型更新模块,用于通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
可选的,所述第三数据标定模块,包括:
第二目标数据输出子模块,用于在所述反馈信息表征所述判定结果错误时,将所述目标数据输出到标定池中;
第二目标数据展示子模块,用于展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
第五方面,本申请实施例提供了一种电子设备,包括处理器及存储器;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现上述第一方面任一所述机器学习模型更新方法或上述第二方面任一所述机器学习模型更新方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述机器学习模型更新方法或上述第二方面任一所述机器学习模型更新方法。
本申请实施例提供的机器学习模型更新方法和装置,将目标数据输入到待更新的机器学习模型中进行分析,得到目标数据的判定结果及判定结果的置信度;比较判定结果的置信度与预设阈值的大小;在判定结果的置信度小于预设阈值时,输出目标数据,以使目标数据被标定;获取目标数据的标定结果;通过目标数据及目标数据的标定结果对机器学习模型进行训练,以更新机器学习模型。在目标数据判定结果的置信度小于预设阈值时,输出目标数据进行标定,作为更新训练机器学习模型的样本数据,从而实现了自动选取样本数据,减少了工作人员的负担,并且选取的样本数据为机器学习模型预测成功率低的数据,采用机器学习模型预测成功率低的数据对机器学习模型进行训练,能够缩短机器学习模型的迭代时间周期,增加机器学习模型的更新效率。当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中机器学习模型在线推理预测平台的一种示意图;
图2为本申请实施例的机器学习模型更新方法的第一种示意图;
图3为本申请实施例的机器学习模型更新方法的第二种示意图;
图4为本申请实施例的机器学习模型在线推理预测平台的一种示意图;
图5为本申请实施例的机器学习模型更新方法的第三种示意图;
图6为本申请实施例的机器学习模型更新装置的第一种示意图;
图7为本申请实施例的机器学习模型更新装置的第二种示意图;
图8为本申请实施例的机器学习模型更新装置的第三种示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术中,机器学习模型在线推理预测平台可以如图1所示。用户提交需要训练的样本数据;人工对样本数据进行标定,生成样本标签;选择合适的算法,使用包含样本标签的样本数据进行机器学习模型训练,达到预期的训练精度后导出机器学习模型;将训练导出的机器学习模型更新到算法预测模块;用户提交需要分析的数据到算法预测模块进行分析,算法预测模型给出数据的判定结果反馈给用户。但是采用上述方法,机器学习模型更新周期太长,算法迭代慢,另外由于训练样本完全靠手工挑选也比较耗费人力资源。
有鉴于此,本申请实施例提供了一种机器学习模型更新方法,参见图2,该方法包括:
S201,将目标数据输入到待更新的机器学习模型中进行分析,得到上述目标数据的判定结果及上述判定结果的置信度。
本发明实施例中的机器学习模型更新方法可以通过更新系统实现,更新系统为任意能够实现本发明实施例的机器学习模型更新方法的系统。例如:
更新系统可以为一种电子设备,包括:处理器、存储器、通信接口和总线;处理器、存储器和通信接口通过总线连接并完成相互间的通信;存储器存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行本发明实施例的机器学习模型更新方法。
更新系统还可以为一种应用程序,用于在运行时执行本发明实施例的机器学习模型更新方法。
更新系统还可以为一种存储介质,用于存储可执行代码,可执行代码用于执行本发明实施例的机器学习模型更新方法。
机器学习模型可以为预先训练过的模型,预先训练机器学习模型的过程可以包括:获取样本数据,并对样本数据进行标定;选择初始机器学习模型,使用标定后的样本数据对初始机器学习模型进行训练,达到预期的训练精度后导出训练后的机器学习模型。具体的,机器学习模型可以为基于深度学习的神经网络等。
更新系统利用待更新的机器学习模型对目标数据进行分析,从而得到目标数据的判定结果及该判定结果的置信度。
S202,比较上述判定结果的置信度与预设阈值的大小。
更新系统判断目标数据判定结果的置信度与预设阈值的大小,其中,预设阈值可以按照实际情况进行设定,例如设定为0.5、0.55或0.6等。
S203,在上述判定结果的置信度小于上述预设阈值时,输出上述目标数据,以使上述目标数据被标定。
在目标数据判定结果的置信度小于预设阈值时,认为判定结果不准确,更新系统输出该目标数据,以使该目标数据被标定。在目标数据的判定结果的置信度不小于预设阈值时,认为判定结果准确,不对目标数据进行输出标定。
可选的,上述在上述判定结果的置信度小于上述预设阈值时,输出上述目标数据,以使上述目标数据被标定,包括:
步骤一,在上述判定结果的置信度小于上述预设阈值时,将上述目标数据输出到标定池中。
步骤二,展示上述标定池中的上述目标数据,以使工作人员标定上述目标数据。
在目标数据判定结果的置信度小于预设阈值时,更新系统将该目标数据输出到标定池中。更新系统展示标定池中的目标数据,可以为周期性的展示标定池中的数据;或在接收到工作人员输入的表征开始标定的指令后,展示标定池中的目标数据;或在标定池中数据量达到预设数量时,展示标定池中的数据。从而使工作人员人工标定目标数据。
S204,获取上述目标数据的标定结果。
更新系统获取目标数据的标定结果,该标定结果可以为标签。
S205,通过上述目标数据及上述目标数据的标定结果对上述机器学习模型进行训练,以更新上述机器学习模型。
更新系统利用目标数据及目标数据的标定结果对当前的机器学习模型进行训练,从而实现机器学习模型的更新。
在本申请实施例中,在目标数据判定结果的置信度小于预设阈值时,输出目标数据进行标定,作为更新训练机器学习模型的样本数据,从而实现了自动选取样本数据,减少了工作人员的负担,并且选取的样本数据为机器学习模型预测成功率低的数据,采用机器学习模型预测成功率低的数据对机器学习模型进行训练,能够缩短机器学习模型的迭代时间周期,增加机器学习模型的更新效率。
可选的,参见图3,本申请实施例的机器学习模型更新方法还包括:
S301,获取用户针对上述目标数据的判定结果的反馈信息。
更新系统向用户输出目标数据的判定结果,并获取用户针对目标数据判定结果的反馈信息。判定结果的反馈信息表征该判定结果是否准确。
S302,在上述反馈信息表征上述判定结果不准确时,输出上述目标数据,以使上述目标数据被标定。
在反馈信息表征目标数据的判定结果不准确时,更新系统输出目标数据,以使目标数据被标定。可选的,可以将目标数据输出到标定池中,并展示标定池中的目标数据,以使工作人员标定该目标数据。
为了防止同一目标数据被标定多次,可选的,在输出上述目标数据之前,上述方法还包括:检测上述目标数据是否被输出过;
相应的,输出上述目标数据,包括:在目标数据未输出过时,输出上述目标数据。
检测目标数据是否被输出过,是指检测目标数据是否已经用于标定输出,例如,检测是否已经向标定池中输出过目标数据。针对其它用途的输出(例如输出到数据库中进行存储等)则不判定为本实施方式中的输出。若未输出过目标数据,则输出目标数据;若已输出过目标数据,则不再输出目标数据,具体的可以根据目标数据的名称或统一资源定位符等确定目标数据是否已经输出过。可以减少同一目标数据被标定的次数,从而减少同一目标数据训练机器学习模型的次数,减少无效的训练,以节约训练资源。
具体的,本申请实施例的机器学习模型在线推理预测平台可以如图4所示,相比于现有技术,增加了预设阈值判断,比如设定预设阈值为0.5,如果目标数据某项属性判定结果的置信度小于0.5,则认为本次预测结果不可信,目标数据及判定结果自动提交到标定池进行标定,然后汇入训练样本池中,以对机器学习模型进行训练。增加用户反馈机制,用户可以对判定结果给出判断,比如某个物体识别为篮球,但用户认为不是篮球而是足球,可以给判定结果一个不准确的反馈,平台对于用户判断为不准确的目标数据及判定结果自动提交到标定池进行标定,然后汇入训练样本池,以对机器学习模型进行训练。
在本申请实施例中,通过比较判定结果的置信度与预设阈值,将现有机器学习模型预测不准确的数据作为新的样本数据,提升机器学习模型对此类样本的预测精度。提出了通过用户反馈的方法收集现有模型预测不准确的样本,自动加入样本库提升算法模型在这类样本的精度。这两种方法收集的样本数据均是现有模型预测较差的,通过这些样本的重新训练均可以提高模型更新的效果,且减少不必要的样本训练。
本申请实施例还提供了一种机器学习模型更新方法,参见图5,该方法包括:
S501,将目标数据输入到待更新的机器学习模型中进行分析,得到上述目标数据的判定结果。
本发明实施例中的机器学习模型更新方法可以通过更新系统实现,更新系统为任意能够实现本发明实施例的机器学习模型更新方法的系统。例如:
更新系统可以为一种电子设备,包括:处理器、存储器、通信接口和总线;处理器、存储器和通信接口通过总线连接并完成相互间的通信;存储器存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行本发明实施例的机器学习模型更新方法。
更新系统还可以为一种应用程序,用于在运行时执行本发明实施例的机器学习模型更新方法。
更新系统还可以为一种存储介质,用于存储可执行代码,可执行代码用于执行本发明实施例的机器学习模型更新方法。
机器学习模型可以为预先训练过的模型,预先训练机器学习模型的过程可以包括:获取样本数据,并对样本数据进行标定;选择初始机器学习模型,使用标定后的样本数据对初始机器学习模型进行训练,达到预期的训练精度后导出训练后的机器学习模型。具体的,机器学习模型可以为基于深度学习的神经网络等。
更新系统利用待更新的机器学习模型对目标数据进行分析,从而得到目标数据的判定结果。
S502,向用户输出上述目标数据的判定结果。
更新系统向用户输出目标数据的判定结果,以使用户输入目标数据的判定结果的反馈信息,该反馈信息表征目标数据的判定结果是否准确。
S503,获取上述用户针对上述目标数据的判定结果的反馈信息。
S504,在上述反馈信息表征上述判定结果不准确时,输出上述目标数据,以使上述目标数据被标定。
在目标数据判定结果的反馈信息表征目标数据判定结果不准确时,更新系统输出该目标数据,以使该目标数据被标定。在目标数据判定结果的反馈信息表征目标数据判定结果准确时,不对目标数据进行输出标定。
可选的,上述在上述反馈信息表征上述判定结果错误时,输出上述目标数据,以使上述目标数据被标定,包括:
步骤一,在上述反馈信息表征上述判定结果错误时,将上述目标数据输出到标定池中;
步骤二,展示上述标定池中的上述目标数据,以使工作人员标定上述目标数据。
在目标数据判定结果的反馈信息表征目标数据判定结果不准确时,更新系统将该目标数据输出到标定池中。更新系统展示标定池中的目标数据,可以为周期性的展示标定池中的数据;或在接收到工作人员输入的表征开始标定的指令后,展示标定池中的目标数据;或在标定池中数据量达到预设数量时,展示标定池中的数据。从而使工作人员人工标定目标数据。
S505,获取上述目标数据的标定结果。
更新系统获取目标数据的标定结果,该标定结果可以为标签。
S506,通过上述目标数据及上述目标数据的标定结果对上述机器学习模型进行训练,以更新上述机器学习模型。
更新系统利用目标数据及目标数据的标定结果对当前的机器学习模型进行训练,从而实现机器学习模型的更新。
在本申请实施例中,在用户返回的反馈信息表征目标数据的判定结果不准确时,输出目标数据进行标定,作为更新训练机器学习模型的样本数据,从而实现了自动选取样本数据,减少了工作人员的负担,并且选取的样本数据为机器学习模型预测成功率低的数据,采用机器学习模型预测成功率低的数据对机器学习模型进行训练,能够缩短机器学习模型的迭代时间周期,增加机器学习模型的更新效率。
本申请实施例还提供了一种机器学习模型更新装置,参见图6,该装置包括:
数据预测模块601,用于将目标数据输入到待更新的机器学习模型中进行分析,得到上述目标数据的判定结果及上述判定结果的置信度;
阈值判定模块602,用于比较上述判定结果的置信度与预设阈值的大小;
第一数据标定模块603,用于在上述判定结果的置信度小于上述预设阈值时,输出上述目标数据,以使上述目标数据被标定;
第一结果获取模块604,用于获取上述目标数据的标定结果;
第一模型更新模块605,用于通过上述目标数据及上述目标数据的标定结果对上述机器学习模型进行训练,以更新上述机器学习模型。
可选的,参见图7,本申请实施例的机器学习模型更新装置还包括:
反馈信息获取模块701,用于获取用户针对上述目标数据的判定结果的反馈信息;
第二数据标定模块702,用于在上述反馈信息表征上述判定结果不准确时,输出上述目标数据,以使上述目标数据被标定。
可选的,本申请实施例的机器学习模型更新装置还包括:
输出检测模块,用于检测上述目标数据是否被输出过;
上述第一数据标定模块,具体用于:在上述判定结果的置信度小于上述预设阈值、且上述目标数据未输出过时,输出上述目标数据,以使上述目标数据被标定;
上述第二数据标定模块,具体用于在上述反馈信息表征上述判定结果不准确、且上述目标数据未输出过时,输出上述目标数据,以使上述目标数据被标定。
可选的,上述第一数据标定模块603,包括:
第一目标数据输出子模块,用于在上述判定结果的置信度小于上述预设阈值时,将上述目标数据输出到标定池中;
第一目标数据展示子模块,用于展示上述标定池中的上述目标数据,以使工作人员标定上述目标数据。
本申请实施例还提供了一种机器学习模型更新装置,参见图8,上述装置包括:
判定结果获取模块801,用于将目标数据输入到待更新的机器学习模型中进行分析,得到上述目标数据的判定结果;
判定结果输出模块802,用于向用户输出上述目标数据的判定结果;
反馈信息获取模块803,用于获取上述用户针对上述目标数据的判定结果的反馈信息;
第三数据标定模块804,用于在上述反馈信息表征上述判定结果不准确时,输出上述目标数据,以使上述目标数据被标定;
第二结果获取模块805,用于获取上述目标数据的标定结果;
第二模型更新模块806,用于通过上述目标数据及上述目标数据的标定结果对上述机器学习模型进行训练,以更新上述机器学习模型。
可选的,上述第三数据标定模块804,包括:
第二目标数据输出子模块,用于在上述反馈信息表征上述判定结果错误时,将上述目标数据输出到标定池中;
第二目标数据展示子模块,用于展示上述标定池中的上述目标数据,以使工作人员标定上述目标数据。
本申请实施例还提供了一种电子设备,包括处理器及存储器;
上述存储器,用于存放计算机程序;
上述处理器,用于执行上述存储器上所存放的程序时,实现如下步骤:
将目标数据输入到待更新的机器学习模型中进行分析,得到上述目标数据的判定结果及上述判定结果的置信度;
比较上述判定结果的置信度与预设阈值的大小;
在上述判定结果的置信度小于上述预设阈值时,输出上述目标数据,以使上述目标数据被标定;
获取上述目标数据的标定结果;
通过上述目标数据及上述目标数据的标定结果对上述机器学习模型进行训练,以更新上述机器学习模型。
本申请实施例还提供了一种电子设备,包括处理器及存储器;
上述存储器,用于存放计算机程序;
上述处理器,用于执行上述存储器上所存放的程序时,实现如下步骤:
将目标数据输入到待更新的机器学习模型中进行分析,得到上述目标数据的判定结果;
向用户输出上述目标数据的判定结果;
获取上述用户针对上述目标数据的判定结果的反馈信息;
在上述反馈信息表征上述判定结果不准确时,输出上述目标数据,以使上述目标数据被标定;
获取上述目标数据的标定结果;
通过上述目标数据及上述目标数据的标定结果对上述机器学习模型进行训练,以更新上述机器学习模型。
可选的,上述处理器,用于执行上述存储器上所存放的程序时,还能够实现上述任一机器学习模型更新方法。
可选的,本申请实施例的电子设备,还包括通信接口和通信总线,其中,处理器、通信接口、存储器通过通信总线完成相互间的通信。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现任一机器学习模型更新方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及存储介质的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (12)

1.一种机器学习模型更新方法,其特征在于,所述方法包括:
将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果及所述判定结果的置信度;
比较所述判定结果的置信度与预设阈值的大小;
在所述判定结果的置信度小于所述预设阈值时,输出所述目标数据,以使所述目标数据被标定;
获取所述目标数据的标定结果;
通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户针对所述目标数据的判定结果的反馈信息;
在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定。
3.根据权利要求2所述的方法,其特征在于,在所述输出所述目标数据之前,所述方法还包括:
检测所述目标数据是否被输出过;
所述输出所述目标数据,包括:
当所述目标数据未输出过时,输出所述目标数据。
4.根据权利要求1所述的方法,其特征在于,所述在所述判定结果的置信度小于所述预设阈值时,输出所述目标数据,以使所述目标数据被标定,包括:
在所述判定结果的置信度小于所述预设阈值时,将所述目标数据输出到标定池中;
展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
5.一种机器学习模型更新方法,其特征在于,所述方法包括:
将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果;
向用户输出所述目标数据的判定结果;
获取所述用户针对所述目标数据的判定结果的反馈信息;
在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定;
获取所述目标数据的标定结果;
通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
6.根据权利要求5所述的方法,其特征在于,所述在所述反馈信息表征所述判定结果错误时,输出所述目标数据,以使所述目标数据被标定,包括:
在所述反馈信息表征所述判定结果错误时,将所述目标数据输出到标定池中;
展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
7.一种机器学习模型更新装置,其特征在于,所述装置包括:
数据预测模块,用于将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果及所述判定结果的置信度;
阈值判定模块,用于比较所述判定结果的置信度与预设阈值的大小;
第一数据标定模块,用于在所述判定结果的置信度小于所述预设阈值时,输出所述目标数据,以使所述目标数据被标定;
第一结果获取模块,用于获取所述目标数据的标定结果;
第一模型更新模块,用于通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
反馈信息获取模块,用于获取用户针对所述目标数据的判定结果的反馈信息;
第二数据标定模块,用于在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
输出检测模块,用于检测所述目标数据是否被输出过;
所述第一数据标定模块,具体用于:在所述判定结果的置信度小于所述预设阈值、且所述目标数据未输出过时,输出所述目标数据,以使所述目标数据被标定;
所述第二数据标定模块,具体用于在所述反馈信息表征所述判定结果不准确、且所述目标数据未输出过时,输出所述目标数据,以使所述目标数据被标定。
10.根据权利要求7所述的装置,其特征在于,所述第一数据标定模块,包括:
第一目标数据输出子模块,用于在所述判定结果的置信度小于所述预设阈值时,将所述目标数据输出到标定池中;
第一目标数据展示子模块,用于展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
11.一种机器学习模型更新装置,其特征在于,所述装置包括:
判定结果获取模块,用于将目标数据输入到待更新的机器学习模型中进行分析,得到所述目标数据的判定结果;
判定结果输出模块,用于向用户输出所述目标数据的判定结果;
反馈信息获取模块,用于获取所述用户针对所述目标数据的判定结果的反馈信息;
第三数据标定模块,用于在所述反馈信息表征所述判定结果不准确时,输出所述目标数据,以使所述目标数据被标定;
第二结果获取模块,用于获取所述目标数据的标定结果;
第二模型更新模块,用于通过所述目标数据及所述目标数据的标定结果对所述机器学习模型进行训练,以更新所述机器学习模型。
12.根据权利要求11所述的装置,其特征在于,所述第三数据标定模块,包括:
第二目标数据输出子模块,用于在所述反馈信息表征所述判定结果错误时,将所述目标数据输出到标定池中;
第二目标数据展示子模块,用于展示所述标定池中的所述目标数据,以使工作人员标定所述目标数据。
CN201811623950.4A 2018-12-28 2018-12-28 机器学习模型更新方法和装置 Active CN111401563B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811623950.4A CN111401563B (zh) 2018-12-28 2018-12-28 机器学习模型更新方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811623950.4A CN111401563B (zh) 2018-12-28 2018-12-28 机器学习模型更新方法和装置

Publications (2)

Publication Number Publication Date
CN111401563A true CN111401563A (zh) 2020-07-10
CN111401563B CN111401563B (zh) 2023-11-03

Family

ID=71428252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811623950.4A Active CN111401563B (zh) 2018-12-28 2018-12-28 机器学习模型更新方法和装置

Country Status (1)

Country Link
CN (1) CN111401563B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112164224A (zh) * 2020-09-29 2021-01-01 杭州锘崴信息科技有限公司 信息安全的交通信息处理系统、方法、设备及存储介质
WO2021159749A1 (zh) * 2020-09-04 2021-08-19 平安科技(深圳)有限公司 多分类模型自学习在线更新方法、系统及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140440A1 (en) * 2014-11-14 2016-05-19 Imageous, Inc. Real-time proactive machine intelligence system based on user audiovisual feedback
JPWO2014115362A1 (ja) * 2013-01-28 2017-01-26 日本電気株式会社 識別器学習装置及び識別器学習方法
CN106991072A (zh) * 2016-01-21 2017-07-28 杭州海康威视数字技术股份有限公司 在线自学习事件检测模型更新方法及装置
JP2017215898A (ja) * 2016-06-02 2017-12-07 株式会社マーズスピリット 機械学習システム
WO2017219548A1 (zh) * 2016-06-20 2017-12-28 乐视控股(北京)有限公司 用户属性预测方法及装置
CN107944259A (zh) * 2017-11-21 2018-04-20 广东欧珀移动通信有限公司 应用启动的管控方法、装置及存储介质和移动终端
CN108280462A (zh) * 2017-12-11 2018-07-13 北京三快在线科技有限公司 一种模型训练方法及装置,电子设备
CN108427992A (zh) * 2018-03-16 2018-08-21 济南飞象信息科技有限公司 一种基于边缘云计算的机器学习训练系统及方法
US20180285767A1 (en) * 2017-03-30 2018-10-04 Intel Corporation Cloud assisted machine learning
CN108875963A (zh) * 2018-06-28 2018-11-23 北京字节跳动网络技术有限公司 机器学习模型的优化方法、装置、终端设备和存储介质
CN108960232A (zh) * 2018-06-08 2018-12-07 Oppo广东移动通信有限公司 模型训练方法、装置、电子设备和计算机可读存储介质
CN108959236A (zh) * 2017-05-19 2018-12-07 百度在线网络技术(北京)有限公司 医学文献分类模型训练方法、医学文献分类方法及其装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014115362A1 (ja) * 2013-01-28 2017-01-26 日本電気株式会社 識別器学習装置及び識別器学習方法
US20160140440A1 (en) * 2014-11-14 2016-05-19 Imageous, Inc. Real-time proactive machine intelligence system based on user audiovisual feedback
CN106991072A (zh) * 2016-01-21 2017-07-28 杭州海康威视数字技术股份有限公司 在线自学习事件检测模型更新方法及装置
JP2017215898A (ja) * 2016-06-02 2017-12-07 株式会社マーズスピリット 機械学習システム
WO2017219548A1 (zh) * 2016-06-20 2017-12-28 乐视控股(北京)有限公司 用户属性预测方法及装置
US20180285767A1 (en) * 2017-03-30 2018-10-04 Intel Corporation Cloud assisted machine learning
CN108959236A (zh) * 2017-05-19 2018-12-07 百度在线网络技术(北京)有限公司 医学文献分类模型训练方法、医学文献分类方法及其装置
CN107944259A (zh) * 2017-11-21 2018-04-20 广东欧珀移动通信有限公司 应用启动的管控方法、装置及存储介质和移动终端
CN108280462A (zh) * 2017-12-11 2018-07-13 北京三快在线科技有限公司 一种模型训练方法及装置,电子设备
CN108427992A (zh) * 2018-03-16 2018-08-21 济南飞象信息科技有限公司 一种基于边缘云计算的机器学习训练系统及方法
CN108960232A (zh) * 2018-06-08 2018-12-07 Oppo广东移动通信有限公司 模型训练方法、装置、电子设备和计算机可读存储介质
CN108875963A (zh) * 2018-06-28 2018-11-23 北京字节跳动网络技术有限公司 机器学习模型的优化方法、装置、终端设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021159749A1 (zh) * 2020-09-04 2021-08-19 平安科技(深圳)有限公司 多分类模型自学习在线更新方法、系统及装置
CN112164224A (zh) * 2020-09-29 2021-01-01 杭州锘崴信息科技有限公司 信息安全的交通信息处理系统、方法、设备及存储介质

Also Published As

Publication number Publication date
CN111401563B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN112966712A (zh) 语言模型训练方法、装置、电子设备和计算机可读介质
CN109729395B (zh) 视频质量评估方法、装置、存储介质和计算机设备
CN103324620B (zh) 一种对标注结果进行纠偏的方法和装置
CN109284355B (zh) 一种批改试卷中口算题的方法及装置
CN110889463A (zh) 一种样本标注方法、装置、服务器及机器可读存储介质
CN108681541B (zh) 图片搜索方法、装置及计算机设备
CN106919551B (zh) 一种情感词极性的分析方法、装置及设备
IL280176B (en) Determining a request's category by a word vector representation of a natural language text string with a similarity value
CN111611797B (zh) 基于Albert模型的预测数据标注的方法、装置及设备
CN112861518B (zh) 文本纠错方法、装置和存储介质及电子装置
Fryzlewicz Narrowest significance pursuit: inference for multiple change-points in linear models
CN111324764A (zh) 一种图像检测方法、装置、电子设备及存储介质
CN111401563B (zh) 机器学习模型更新方法和装置
US20210192965A1 (en) Question correction method, device, electronic equipment and storage medium for oral calculation questions
CN111183437A (zh) 判别装置以及机器学习方法
CN112199500B (zh) 针对评论的情感倾向识别方法、装置及电子设备
CN110580217B (zh) 软件代码健康度的检测方法、处理方法、装置及电子设备
US11615294B2 (en) Method and apparatus based on position relation-based skip-gram model and storage medium
CN111161238A (zh) 图像质量评价方法及装置、电子设备、存储介质
CN106919706A (zh) 数据更新的方法及装置
CN116030801A (zh) 错误诊断和反馈
CN112069806B (zh) 简历筛选方法、装置、电子设备及存储介质
CN110262672A (zh) 建议候选列表生成方法及装置
CN110543634B (zh) 语料数据集的处理方法、装置、电子设备及存储介质
CN111832597B (zh) 一种车辆类型的判定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant