CN112183321A - 机器学习模型优化的方法、装置、计算机设备和存储介质 - Google Patents

机器学习模型优化的方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112183321A
CN112183321A CN202011032342.3A CN202011032342A CN112183321A CN 112183321 A CN112183321 A CN 112183321A CN 202011032342 A CN202011032342 A CN 202011032342A CN 112183321 A CN112183321 A CN 112183321A
Authority
CN
China
Prior art keywords
machine learning
learning model
picture
label
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011032342.3A
Other languages
English (en)
Inventor
李立赛
傅东生
马量
卢东占
彭宏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miracle Intelligent Network Co ltd
Original Assignee
Miracle Intelligent Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miracle Intelligent Network Co ltd filed Critical Miracle Intelligent Network Co ltd
Priority to CN202011032342.3A priority Critical patent/CN112183321A/zh
Publication of CN112183321A publication Critical patent/CN112183321A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种机器学习模型优化的方法、装置、计算机设备和存储介质。所述方法包括:获取至少两张第一图片;当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;根据所述第一图片和所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;当所述第二标签通过标注验证时,根据所述第二图片和所述第二标签对所述目标机器学习模型进行训练优化。采用本方法能够提高机器学习模型训练效率。

Description

机器学习模型优化的方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能机器学习技术领域,特别是涉及一种基于云边协同的机器学习模型优化的方法、装置、计算机设备和存储介质。
背景技术
机器学习模型能够对复杂场景图像中的目标进行识别,可以应用于各种识别场景中。在机器学习模型进行应用之前,通常需要对相应场景图像进行人工标注,然后利用标注后的场景图像作为训练样本对机器学习模型训练,然后利用训练后的机器学习模型进行目标识别。对于机器学习模型的训练,通常需要大量的图像样本进行训练,如此需要对大量的图像进行人工标注,从而会导致机器学习模型训练效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高机器学习模型训练效率的机器学习模型优化的方法、装置、计算机设备和存储介质。
一种机器学习模型优化的方法,所述方法包括:
获取至少两张第一图片;
当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;
根据所述第一图片和所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;
基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
当所述第二标签通过标注验证时,根据所述第二图片和所述第二标签对所述目标机器学习模型进行训练优化。
一种目标检测识别装置,所述装置包括:
获取模块,用于获取至少两张第一图片;
第一标注模块,用于当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;
训练模块,用于根据所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;
第二标注模块,用于基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
优化模块,用于当所述第二标签通过标注验证时,根据所述第二标签对所述目标机器学习模型进行训练优化。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取至少两张第一图片;
当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;
根据所述第一图片和所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;
基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
当所述第二标签通过标注验证时,根据所述第二图片和所述第二标签对所述目标机器学习模型进行训练优化。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取至少两张第一图片;
当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;
根据所述第一图片和所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;
基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
当所述第二标签通过标注验证时,根据所述第二图片和所述第二标签对所述目标机器学习模型进行训练优化。
上述机器学习模型优化的方法、装置、计算机设备和存储介质,获取至少两张第一图片;当模型库中的机器学习模型无法识别第一图片时,根据输入的标注指令对第一图片进行标注,得到第一标签;根据第一图片和第一标签对机器学习模型进行训练,得到目标机器学习模型;基于目标机器学习模型对获取的第二图片进行预标注,得到第二标签,从而可以避免大量人工标注方式,可以提高标注效率。此外,当第二标签通过标注验证时,根据第二图片和第二标签对目标机器学习模型进行训练优化,利用机器标注的图片进行训练优化,可以得到优化后的目标机器学习模型,从而有利于快速获得训练样本进行训练,从而可以提高机器学习模型训练效率,而且也有效提高目标机器学习模型的识别准确性。
附图说明
图1为一个实施例中机器学习模型优化的方法的应用环境图;
图2为一个实施例中机器学习模型优化的方法的流程示意图;
图3为一个实施例中对训练后的模型下发至服务器端设备的步骤的流程示意图;
图4为一个实施例中对训练后的模型下发至边缘端设备的步骤的流程示意图;
图5为一个实施例中对训练之后的机器学习模型进行验证的步骤的流程示意图;
图6为一个实施例中对训练之后的机器学习模型进行下发的流程示意图;
图7为一个实施例中对训练之后的机器学习模型进行模型转换、封装并下发的步骤的流程示意图;
图8为另一个实施例中机器学习模型优化的方法的流程示意图;
图9为一个实施例中机器学习模型优化系统的总体框架图;
图10为一个实施例中当被检测目标不可进行预检测时的机器学习模型优化方法的流程示意图;
图11为一个实施例中等被检测目标可进行预检测时的机器学习模型优化方法的流程示意图;
图12为一个实施例中一个机器学习模型优化闭环一的流程示意图;
图13为一个实施例中一个机器学习模型优化闭环二的流程示意图;
图14为一个实施例中一个机器学习模型优化闭环三的流程示意图;
图15为一个实施例中一种目标检测识别的装置的结构框图;
图16为另一个实施例中一种目标检测识别的装置的结构框图;
图17为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的机器学习模型优化的方法,可以应用于如图1所示的应用环境中。其中,服务器102、服务端设备104、边缘端设备106和摄像头108;服务器102、服务端设备104、边缘端设备106和摄像头108之间通过网络进行连接。摄像头108对场景目标进行拍照采集,然后将采集到的图片传递给服务器102,服务器102通过模型库中的机器学习模型进行识别,若机器学习模型不能识别该目标,则根据输入的标注指令对第一图片进行标注,得到第一标签;根据第一图片和第一标签对机器学习模型进行训练,得到目标机器学习模型;然后,可以将目标机器学习模型下发至服务端设备104、边缘端设备106;基于目标机器学习模型对获取的第二图片进行预标注,得到第二标签;当第二标签通过标注验证时,根据第二图片和第二标签对目标机器学习模型进行训练优化。
其中,边缘端设备106可以但不限于是路由器、路由交换机、集成接入设备(IAD)、多路复用器,以及各种城域网(MAN)和广域网(WAN)接入设备,此外,也可以包括终端和家电设备;终端可以是手机、笔记本电脑、平板电脑或其它可穿戴设备;服务器102、服务端设备104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种机器学习模型优化的方法,以该方法应用于图1中的服务器102为例进行说明,该机器学习模型优化方法具体包括如下步骤:
S202,获取至少两张第一图片。
其中,该第一图片是摄像头采集目标环境所得的图片,该图片中可以包含有人物、车辆和建筑物等。
在一个实施例中,服务器与摄像头建立通信连接,当摄像头拍摄目标场景得到至少两张第一图片时,将该第一图片发送至服务器,从而服务器获取到至少两张第一图片。
在一个实施例中,服务器在接收到输入的图片获取指令时,从本地图片库中获取至少两张第一图片。
S204,当模型库中的机器学习模型无法识别第一图片时,根据输入的标注指令对第一图片进行标注,得到第一标签。
其中,机器学习模型可以是用于对图片中的目标进行识别的网络模型,包括AlexNet、VGG19、ResNet_152、InceptionV4和DenseNet等网络模型。第一标签是指对第一图片中的目标进行标注之后得到的图片,即第一标签为对第一图片进行标注所得的标签。该目标可以是人物、车辆和建筑物等。
在一个实施例中,服务器根据第一图片中目标的位置和/或大小等信息对这些第一图片进行标注,得到对应的第一标签。
在一个实施例中,服务器可以根据输入的标注指令确定第一图片中目标的位置和/或大小等信息,然后根据第一图片中目标的位置和/或大小等信息对这些第一图片进行标注。
S206,根据第一图片和第一标签对机器学习模型进行训练,得到目标机器学习模型。
在一个实施例中,服务器将第一图片和第一标签输入至机器学习模型中,通过机器学习模型对第一图片进行特征提取,然后对提取的特征进行图像识别,得到识别结果。服务器计算该识别结果与第一标签之间的损失值,根据该损失值对机器学习模型中的模型参数进行调整,直至调整模型参数后的机器学习模型的识别结果与第一标签之间的损失值小于或等于损失阈值时,停止训练,得到目标机器学习模型。需要指出的是,目标机器学习模型可以是经过初步的训练所得的模型,该目标机器学习模型识别的准确率达到预设值即可,如准确率达到80%或其它值。
在一个实施例中,在计算出损失值之后,将该损失值在机器学习模型中进行反向传播,从而可以得到机器学习模型中各模型参数的梯度值,根据该梯度值对机器学习模型中各模型参数进行调整。
S208,基于目标机器学习模型对获取的第二图片进行预标注,得到第二标签。
其中,第二图片可以是在第一图片之后所采集的图片,例如,第一图片是指目标相对于机器来说是第一次获取,第二图片是指目标相对于机器来说是第二次获取。第一图片和第二图片可以是针对同一个目标的。预标注是指机器学习模型能够识别该第二图片,可以直接对获取的第二图片进行标注。
在一个实施例中,服务器通过目标机器学习模型对获取的第二图片进行识别,然后根据识别结果对第二图片进行预标注,得到第二标签。
S210,当第二标签通过标注验证时,根据第二图片和第二标签对目标机器学习模型进行训练优化。
其中,标注验证是指对S208中由机器学习模型识别后得到的第二标签进行验证。训练优化是指在机器学习模型已经能够识别出该第二图像中目标的前提下,以经过验证后的第二图片和第二标签作为训练样本对机器学习模型进行训练,使得训练得到的机器学习模型的鲁棒性更好。
在一个实施例中,当机器学习模型能够检测识别出第二图片时,将第二图片和目标标签一起形成新的训练样本,利用该训练样本对机器学习模型进行训练优化,得到鲁棒性更好的机器学习模型。其中,具体的训练过程可参考S206。
上述实施例中,获取至少两张第一图片;当模型库中的机器学习模型无法识别第一图片时,根据输入的标注指令对第一图片进行标注,得到第一标签;根据第一图片和第一标签对机器学习模型进行训练,得到目标机器学习模型;基于目标机器学习模型对获取的第二图片进行预标注,得到第二标签,从而可以避免大量人工标注方式,可以提高标注效率。此外,当第二标签通过标注验证时,根据第二图片和第二标签对目标机器学习模型进行训练优化,利用机器标注的图片进行训练优化,可以得到优化后的目标机器学习模型,从而有利于快速获得训练样本进行训练,从而可以提高机器学习模型训练效率,而且也有效提高目标机器学习模型的识别准确性。
在一个实施例中,如图3所示,S204具体可以包括:
S302,当模型库中的机器学习模型无法识别第一图片时,对第一图片进行去重处理。
其中,去重处理是指当系统对目标进行捕捉拍照时,会拍取多张,需要去掉重复的第一图片。
在一个实施例中,服务器接收输入的去重指令,根据该去重指令确定第一图片中存在重复的图片,然后从第一图片中去掉重复的图片。
S304,在去重处理后的第一图片中删除分辨率低于预设分辨率阈值的图片,得到目标图片。
其中,分辨率是指分辨率,又称解析度、解像度,可以细分为显示分辨率、图像分辨率、打印分辨率和扫描分辨率等。显示分辨率(屏幕分辨率)是屏幕图像的精密度,是指显示器所能显示的像素有多少。由于屏幕上的点、线和面都是由像素组成的,显示器可显示的像素越多,画面就越精细,同样的屏幕区域内能显示的信息也越多,所以分辨率是个非常重要的性能指标。可以把整个图像想象成是一个大型的棋盘,而分辨率的表示方式就是所有经线和纬线交叉点的数目。显示分辨率一定的情况下,显示屏越小图像越清晰,反之,显示屏大小固定时,显示分辨率越高图像越清晰。图像分辨率则是单位英寸中所包含的像素点数,其定义更趋近于分辨率本身的定义。
在一个实施例中,由S302中得到的第一图片,其分辨率有高有低,服务器根据预设的分辨率阈值,筛选出那些分辨率高于分辨率阈值的第一图片。
S306,根据输入的标注指令对目标图片进行标注。
在一个实施例中,在接收到输入的标注指令之后,根据S304中得到的位置、大小等信息对第一图片进行标注。
在一个实施例中,如图4所示,目标机器学习模型在对第二图片进行预标注之前,具体还包括如下步骤:
S402,对经过训练优化后的目标机器学习模型进行模型转换,得到边缘端的目标机器学习模型。
其中,模型转换是指在服务器端的模型经过训练之后,转换模型的格式,得到边缘端模型。
在一个实施例中,服务器利用模型转换工具转换服务器端模型为边缘端模型,例如,将服务器端模型对应的文件格式转换为边缘端模型对应的文件格式。
S404,对目标机器学习模型进行封装,并将封装后的目标机器学习模型下发到边缘端设备。
其中,封装是指对目标机器学习模型打包成文件。模型下发是指将模型发送到某个设备或保存到对应的模型库。
在一个实施例中,将训练后的目标机器学习模型进行封装,包括服务器端或边缘端的模型封装,得到服务端模型或边缘端模型,然后将服务器端模型下发至边缘端设备。
在一个实施例中,如图5所示,对训练之后的机器学习模型进行验证,具体步骤包括:
S502,获取测试图片和对应的图片标签。
其中,测试图片可以是摄像头采集目标环境所得的图片,或者关于其它环境的图片,该测试图片中可以包含有人物、车辆和建筑物等。对应的图片标签是指对测试图片进行标注所得的标签。
在一个实施例中,在一个实施例中,服务器与摄像头建立通信连接,当摄像头拍摄目标场景得到至少两张测试图片时,将该测试图片发送至服务器,从而服务器获取到至少两张测试图片。对应的,服务器根据输入的标注指令对测试图片进行标注,得到图片标签。
在一个实施例中,服务器在接收到输入的图片获取指令时,从本地图片库中获取至少两张测试图片。对应的,服务器根据输入的标注指令对测试图片进行标注,得到图片标签。
在另一个实施例中,服务器在接收到测试图片和标签的获取指令时,从样本库中获取测试图片和对应的图片标签。
S504,通过训练优化后的目标机器学习模型对测试图片进行目标识别,得到识别结果。
在一个实施例中,服务器将测试图片输入至机器学习模型中,通过机器学习模型对测试图片进行特征提取,然后对提取的特征进行图像识别,得到识别结果。
S506,当识别结果与图片标签一致时,对经过训练优化后的目标机器学习模型进行模型转换。
在一个实施例中,服务器判断识别结果与图片标签是否一致,若一致,则表示机器学习模型能对测试图片识别成功,对目标机器学习模型进行模型转换,已得到服务器端模型或边缘端模型。此外,当能够识别成功时,计算机器学习模型识别测试图片的识别时长,从而可以确定机器学习模型识别目标的快慢。
在一个实施例中,如图6所示,训练后的目标机器学习模型对获取的第二图片进行预标注之前,具体步骤还包括:
S602,将目标机器学习模型下发至模型库。
其中,模型库是指原先的机器学习模型库。
S604,获取第二图片,并根据第二图片从模型库中选取下发的目标机器学习模型。
在一个实施例中,服务器通过摄像头获取拍摄的第二目标图片,然后根据第二目标图片从机器学习模型库中选择相对应的机器学习模型。
S606,根据所选取的目标机器学习模型对第二图片进行预标注。
在一个实施例中,服务器将第二图片输入至目标机器学习模型中,通过目标机器学习模型对第二图片进行特征提取,然后对提取的特征进行图像识别,得到识别结果,根据识别结果对第二图片进行标注。
在一个实施例中,如图7所示,目标机器学习模型对获取的第二图片进行预标注之前,具体步骤还包括:
S702,对经过训练优化后的目标机器学习模型进行模型转换,得到服务端的目标机器学习模型。
S704,对目标机器学习模型进行封装,并将封装后的目标机器学习模型下发到服务端设备。
上述S702-S704可以参考上述实施例中S402-S404。
在一个实施例中,如图8所示,机器学习模型库中的模型能识别第一图片时,机器学习模型进行训练优化,具体步骤为:
S802,当模型库中的机器学习模型能识别第一图片时,对第一图片中的目标进行检测,得到检测结果。
在一个实施例中,若第一图片能够直接被模型库中的机器学习模型识别出来,服务器则利用模型库中的机器学习模型对第一图片中的目标进行检测,得到检测结果。其中,该检测结果可以包括目标的类型、位置和大小等信息。
在一个实施例中,在对第一图片中的目标进行检测之前,服务器对第一图片进行预处理,如对第一图片进行裁剪、图像增强等处理。
S804,根据检测结果对目标进行预标注,得到参考标签。
在一个实施例中,服务器根据检测结果中的关于目标的位置、大小等对第一图片中的目标进行预标注,然后将这些预标注信息写入xml文件中,得到第一图片的参考标签。
S806,对参考标签进行验证。
在一个实施例中,服务器接收输入的确认指令,根据该确认指令确定该参考标签是否通过验证。
S808,当验证通过时,根据第一图片和参考标签对机器学习模型进行训练,得到目标机器学习模型。
在一个实施例中,当系统对目标的参考标签验证合格后,即参考标签与第一图片中的目标一致,然后基于第一图片和参考标签对机器学习模型库中相应的模型进行训练优化,得到鲁棒性更好的目标机器学习模型。
图2-8为一个实施例中机器学习模型优化方法的流程示意图。应该理解的是,虽然图2-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
作为一个示例,如图9所示,图中的方案主要应用于以下两种场景:
1)新场景目标
当新的场景需识别某一目标(如自行车)时,处理情况分两种:①若现有库模型可以识别该目标,初步样本采集流程按照“目标可进行预检测”进行,如图9中的A分支。②若现有库模型不可以识别该目标,初步样本采集流程按照“目标不可进行预检测”进行,如图9中的B分支。
2)优化场景目标
模型库有识别目标的机器学习模型,并已转换到边缘端应用。现需对模型目标检测效果进行优化。优化闭环可分为三种:“模型优化闭环一”、“模型优化闭环二”、“模型优化闭环三”。作为一个示例,如图10所示,为当目标不可进行预检测时的应用方案的框图。
粗采图片:图片采集功能。
图片预处理:对“粗采图片”中得到的图片进行去重、去模糊等处理,即对图片进行清洗保留有效样本。
标注工具:当采集的图片达到一定量时(如:1000张),发出提醒标注人员可以对样本进行标注。“粗采图片”中只获取了图片文件,通过“标注工具”获取图片对应的标注文件。
图片管理:当新增的训练样本达到一定数量时(如:1000张),发出提醒模型可以进行训练。
训练数据分析:对训练样本、训练目标(宽、高、数量)等进行分析。
模型选择:选择符合当前场景的模型,如:识别目标都为小目标、识别目标都为大目标、识别目标大中小等存在等。
训练数据打包:训练样本与标注信息打包。
模型训练/评估:设置模型训练时间或迭代次数,对最终获得的模型进行评估。
模型转换:将训练所得的目标机器学习模型转换为服务器端模型转换或边缘端模型。
模型管理:对训练模型进行相关信息存储管理。
模型下发:
1)下发到服务器端:供服务器端设备进行目标识别,实现视频结构化业务。
2)下发到智盒端:供边缘端设备进行目标识别,实现视频结构化业务。
作为一个示例,如图11所示,为当目标可进行预检测时的应用方案的框图。
细采图片:图片识别采集功能,对检测到的目标图像进行原始图片和标注文件的保存。
标注工具:当采集的图片达到一定量时(如:1000张),发出提醒标注人员可以对样本进行标注。“摄像头管理”中获取了图片和标注文件,通过“标注工具”对标注信息进行检查修改。
图片管理:当新增的训练样本达到一定数量时(如:1000张),发出提醒模型可以进行训练。
作为一个示例,如图12所示,为模型优化闭环一的应用框图。
模型下发:模型下发到“摄像头管理”任务,供服务器端进行目标识别,采集样本。
标注工具:当采集的图片达到一定量时(如:1000张),发出提醒标注人员可以对样本进行标注。“摄像头管理”中获取了图片和标注文件,通过“标注工具”对标注信息进行检查修改。
图片管理:当新增的训练样本达到一定数量时(如:总样本数的15%),发出提醒模型可以进行优化训练。
迁移学习:在上一次模型的基础上进行模型优化。
作为一个示例,如图13所示,为模型优化闭环二的应用框图。
模型下发:模型下发到服务器端:供服务器端进行目标识别,实现视频结构化业务。返回识别错误和识别率低的样本。
作为一个示例,如图14所示,为模型优化闭环三的应用框图。
模型下发到智盒端:供边缘端进行目标识别,实现视频结构化业务。返回识别错误和识别率低的样本。
如图15所示,本发明实施例中提供了一种机器学习模型优化的方法的装置,该装置包括:获取模块1502、第一标注模块1504、训练模块1506、第二标注模块1508、优化模块1510;其中:
获取模块1502,用于获取至少两张第一图片;
第一标注模块1504,用于当模型库中的机器学习模型无法识别第一图片时,根据输入的标注指令对第一图片进行标注,得到第一标签;
训练模块1506,用于根据第一标签对机器学习模型进行训练,得到目标机器学习模型;
第二标注模块1508,用于基于目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
优化模块1510,用于当第二标签通过标注验证时,根据第二标签对目标机器学习模型进行训练优化。
在一个实施例中,如图16所示,该装置还包括:去重模块1512、删除模块1514;其中:
去重模块1512,用于当模型库中的机器学习模型无法识别第一图片时,对第一图片进行去重处理;
删除模块1514,用于在去重处理后的第一图片中删除分辨率低于预设分辨阈值的图片,得到目标图片;
在一个实施例中,第一标注模块1504,还用于根据输入的标注指令对目标图片进行标注。
在其中一个实施例中,该装置还包括:检测模块1516、验证模块1518;其中:
检测模块1516,用于当模型库中的机器学习模型能识别第一图片时,对第一图片中的目标进行检测,得到检测结果;
验证模块1518,用于对参考标签进行验证。
在一个实施例中,第二标注模块1508,还用于根据检测结果对目标进行预标注,得到参考标签。
在一个实施例中,训练模块1506,还用于当验证通过时,根据参考标签对机器学习模型进行训练,得到目标机器学习模型。
在其中一个实施例中,所述装置还包括:第一转换模块1520和第一封装模块1522;其中:
所述第一转换模块1520,用于对经过训练优化后的目标机器学习模型进行模型转换,得到边缘端的目标机器学习模型;
所述第一封装模块1522,用于对所述目标机器学习模型进行封装,并将封装后的目标机器学习模型下发到边缘端设备。
在其中一个实施例中,所述装置还包括:识别模块1524;其中:
所述获取模块1502,还用于获取测试图片和对应的标签;
所述识别模块1524,用于通过训练优化后的目标机器学习模型对所述测试图片进行目标识别,得到识别结果;
所述第一转换模块1520,还用于当所述识别结果与所述标签一致时,对经过训练优化后的目标机器学习模型进行模型转换。
在其中一个实施例中,所述装置还包括:第一下发模块1526;其中:
所述第一下发模块1526,用于将所述目标机器学习模型下发至所述模型库;
所述第二标注模块1508,还用于获取第二图片,并根据所述第二图片从所述模型库中选取下发的目标机器学习模型;根据所选取的目标机器学习模型对所述第二图片进行预标注。
在其中一个实施例中,所述装置还包括:第二转换模块1528和第二封装模块1530和第二下发模块1532;其中:
所述第二转换模块1528,用于对经过训练优化后的目标机器学习模型进行模型转换,得到服务端的目标机器学习模型;
所述第二封装模块1530,用于对所述目标机器学习模型进行封装;
所述第二下发模块1532,用于将封装后的目标机器学习模型下发到服务端设备。
关于一种目标检测识别的装置的具体限定可以参见上文中对于一种机器学习模型优化的方法的限定,在此不再赘述。上述一种场景目标识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储机器学习自训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种机器学习模型优化的方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种AI模型自优化方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种机器学习模型优化的方法,其特征在于,所述方法包括:
获取至少两张第一图片;
当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;
根据所述第一图片和所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;
基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
当所述第二标签通过标注验证时,根据所述第二图片和所述第二标签对所述目标机器学习模型进行训练优化。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当模型库中的机器学习模型无法识别所述第一图片时,对所述第一图片进行去重处理;
在去重处理后的第一图片中删除分辨率低于预设分辨阈值的图片,得到目标图片;
所述根据输入的标注指令对所述第一图片进行标注包括:
根据输入的标注指令对所述目标图片进行标注。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述目标机器学习模型对获取的第二图片进行预标注之前,所述方法还包括:
对经过训练优化后的目标机器学习模型进行模型转换,得到边缘端的目标机器学习模型;
对所述目标机器学习模型进行封装,并将封装后的目标机器学习模型下发到边缘端设备。
4.根据权利要求3所述的方法,其特征在于,所述对经过训练优化后的目标机器学习模型进行模型转换之前,所述方法还包括:
获取测试图片和对应的图片标签;
通过训练优化后的目标机器学习模型对所述测试图片进行目标识别,得到识别结果;
当所述识别结果与所述图片标签一致时,执行所述对经过训练优化后的目标机器学习模型进行模型转换的步骤。
5.根据权利要求1或2所述的方法,其特征在于,所述基于所述目标机器学习模型对获取的第二图片进行预标注之前,所述方法还包括:
将所述目标机器学习模型下发至所述模型库;
所述基于所述目标机器学习模型对获取的第二图片进行预标注包括:
获取第二图片,并根据所述第二图片从所述模型库中选取下发的目标机器学习模型;
根据所选取的目标机器学习模型对所述第二图片进行预标注。
6.根据权利要求1或2所述的方法,其特征在于,所述基于所述目标机器学习模型对获取的第二图片进行预标注之前,所述方法还包括:
对经过训练优化后的目标机器学习模型进行模型转换,得到服务端的目标机器学习模型;
对所述目标机器学习模型进行封装,并将封装后的目标机器学习模型下发到服务端设备。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当模型库中的机器学习模型能识别所述第一图片时,对所述第一图片中的目标进行检测,得到检测结果;
根据所述检测结果对所述目标进行预标注,得到参考标签;
对所述参考标签进行验证;
当验证通过时,根据所述第一图片和所述参考标签对所述机器学习模型进行训练,得到目标机器学习模型。
8.一种目标检测识别装置,其特征在于,所述装置包括:
获取模块,用于获取至少两张第一图片;
第一标注模块,用于当模型库中的机器学习模型无法识别所述第一图片时,根据输入的标注指令对所述第一图片进行标注,得到第一标签;
训练模块,用于根据所述第一标签对所述机器学习模型进行训练,得到目标机器学习模型;
第二标注模块,用于基于所述目标机器学习模型对获取的第二图片进行预标注,得到第二标签;
优化模块,用于当所述第二标签通过标注验证时,根据所述第二标签对所述目标机器学习模型进行训练优化。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011032342.3A 2020-09-27 2020-09-27 机器学习模型优化的方法、装置、计算机设备和存储介质 Pending CN112183321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011032342.3A CN112183321A (zh) 2020-09-27 2020-09-27 机器学习模型优化的方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011032342.3A CN112183321A (zh) 2020-09-27 2020-09-27 机器学习模型优化的方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112183321A true CN112183321A (zh) 2021-01-05

Family

ID=73944215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011032342.3A Pending CN112183321A (zh) 2020-09-27 2020-09-27 机器学习模型优化的方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112183321A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686045A (zh) * 2021-03-17 2021-04-20 北京世纪好未来教育科技有限公司 文本错误检测模型的评测方法及装置
CN114330592A (zh) * 2022-01-06 2022-04-12 北京百度网讯科技有限公司 模型生成方法、装置、电子设备及计算机存储介质
TWI789033B (zh) * 2021-09-29 2023-01-01 瑞昱半導體股份有限公司 物件偵測模型訓練裝置、方法及其非暫態電腦可讀取記錄媒體

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967491A (zh) * 2017-12-14 2018-04-27 北京木业邦科技有限公司 木板识别的机器再学习方法、装置、电子设备及存储介质
CN108764372A (zh) * 2018-06-08 2018-11-06 Oppo广东移动通信有限公司 数据集的构建方法和装置、移动终端、可读存储介质
US20190102700A1 (en) * 2017-09-29 2019-04-04 Oracle International Corporation Machine learning platform
CN109711545A (zh) * 2018-12-13 2019-05-03 北京旷视科技有限公司 网络模型的创建方法、装置、系统和计算机可读介质
CN110580290A (zh) * 2019-09-12 2019-12-17 北京小米智能科技有限公司 用于文本分类的训练集的优化方法及装置
CN110647937A (zh) * 2019-09-23 2020-01-03 北京百度网讯科技有限公司 标注模型训练方法及装置
US20200019882A1 (en) * 2016-12-15 2020-01-16 Schlumberger Technology Corporation Systems and Methods for Generating, Deploying, Discovering, and Managing Machine Learning Model Packages
CN110968695A (zh) * 2019-11-18 2020-04-07 罗彤 基于弱监督技术主动学习的智能标注方法、装置及平台
CN111079841A (zh) * 2019-12-17 2020-04-28 深圳奇迹智慧网络有限公司 目标识别的训练方法、装置、计算机设备和存储介质
CN111104479A (zh) * 2019-11-13 2020-05-05 中国建设银行股份有限公司 一种数据标注的方法及装置
CN111210024A (zh) * 2020-01-14 2020-05-29 深圳供电局有限公司 模型训练方法、装置、计算机设备和存储介质
CN111222648A (zh) * 2020-01-15 2020-06-02 深圳前海微众银行股份有限公司 半监督机器学习优化方法、装置、设备及存储介质
CN111275207A (zh) * 2020-02-10 2020-06-12 深圳前海微众银行股份有限公司 基于半监督的横向联邦学习优化方法、设备及存储介质
CN111292839A (zh) * 2020-05-13 2020-06-16 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质
CN111340054A (zh) * 2018-12-18 2020-06-26 北京嘀嘀无限科技发展有限公司 数据标注方法、装置及数据处理设备
CN111522942A (zh) * 2020-03-18 2020-08-11 大箴(杭州)科技有限公司 文本分类模型的训练方法、装置、存储介质及计算机设备
US20200265301A1 (en) * 2019-02-15 2020-08-20 Microsoft Technology Licensing, Llc Incremental training of machine learning tools
CN111582377A (zh) * 2020-05-09 2020-08-25 济南浪潮高新科技投资发展有限公司 一种基于模型压缩的边缘端目标检测方法及系统

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200019882A1 (en) * 2016-12-15 2020-01-16 Schlumberger Technology Corporation Systems and Methods for Generating, Deploying, Discovering, and Managing Machine Learning Model Packages
US20190102700A1 (en) * 2017-09-29 2019-04-04 Oracle International Corporation Machine learning platform
CN107967491A (zh) * 2017-12-14 2018-04-27 北京木业邦科技有限公司 木板识别的机器再学习方法、装置、电子设备及存储介质
CN108764372A (zh) * 2018-06-08 2018-11-06 Oppo广东移动通信有限公司 数据集的构建方法和装置、移动终端、可读存储介质
CN109711545A (zh) * 2018-12-13 2019-05-03 北京旷视科技有限公司 网络模型的创建方法、装置、系统和计算机可读介质
CN111340054A (zh) * 2018-12-18 2020-06-26 北京嘀嘀无限科技发展有限公司 数据标注方法、装置及数据处理设备
US20200265301A1 (en) * 2019-02-15 2020-08-20 Microsoft Technology Licensing, Llc Incremental training of machine learning tools
CN110580290A (zh) * 2019-09-12 2019-12-17 北京小米智能科技有限公司 用于文本分类的训练集的优化方法及装置
CN110647937A (zh) * 2019-09-23 2020-01-03 北京百度网讯科技有限公司 标注模型训练方法及装置
CN111104479A (zh) * 2019-11-13 2020-05-05 中国建设银行股份有限公司 一种数据标注的方法及装置
CN110968695A (zh) * 2019-11-18 2020-04-07 罗彤 基于弱监督技术主动学习的智能标注方法、装置及平台
CN111079841A (zh) * 2019-12-17 2020-04-28 深圳奇迹智慧网络有限公司 目标识别的训练方法、装置、计算机设备和存储介质
CN111210024A (zh) * 2020-01-14 2020-05-29 深圳供电局有限公司 模型训练方法、装置、计算机设备和存储介质
CN111222648A (zh) * 2020-01-15 2020-06-02 深圳前海微众银行股份有限公司 半监督机器学习优化方法、装置、设备及存储介质
CN111275207A (zh) * 2020-02-10 2020-06-12 深圳前海微众银行股份有限公司 基于半监督的横向联邦学习优化方法、设备及存储介质
CN111522942A (zh) * 2020-03-18 2020-08-11 大箴(杭州)科技有限公司 文本分类模型的训练方法、装置、存储介质及计算机设备
CN111582377A (zh) * 2020-05-09 2020-08-25 济南浪潮高新科技投资发展有限公司 一种基于模型压缩的边缘端目标检测方法及系统
CN111292839A (zh) * 2020-05-13 2020-06-16 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAOYU ZHANG 等: "SLAQ: quality-driven scheduling for distributed machine learning", 《SOCC \'17: PROCEEDINGS OF THE 2017 SYMPOSIUM ON CLOUD COMPUTING》, pages 390 - 404 *
佚名: "一份关于机器学习"模型再训练"的终极指南", pages 1 - 3, Retrieved from the Internet <URL:《https://www.51cto.com/article/608770.html》> *
张文龙 等: "云/边缘协同的轴承故障诊断方法", 《计算机集成制造系统》, vol. 26, no. 3, pages 589 - 599 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686045A (zh) * 2021-03-17 2021-04-20 北京世纪好未来教育科技有限公司 文本错误检测模型的评测方法及装置
TWI789033B (zh) * 2021-09-29 2023-01-01 瑞昱半導體股份有限公司 物件偵測模型訓練裝置、方法及其非暫態電腦可讀取記錄媒體
CN114330592A (zh) * 2022-01-06 2022-04-12 北京百度网讯科技有限公司 模型生成方法、装置、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN112232293B (zh) 图像处理模型训练、图像处理方法及相关设备
CN112183321A (zh) 机器学习模型优化的方法、装置、计算机设备和存储介质
CN110853033B (zh) 基于帧间相似度的视频检测方法和装置
CN107945198A (zh) 用于标注点云数据的方法和装置
CN109727275B (zh) 目标检测方法、装置、系统和计算机可读存储介质
CN111667001B (zh) 目标重识别方法、装置、计算机设备和存储介质
CN110781859A (zh) 图像标注方法、装置、计算机设备和存储介质
CN109285105A (zh) 水印检测方法、装置、计算机设备和存储介质
CN110942456B (zh) 篡改图像检测方法、装置、设备及存储介质
CN111666922A (zh) 视频匹配方法、装置、计算机设备和存储介质
CN110929589B (zh) 车辆特征识别的方法、设备、计算机设备和存储介质
CN109542373A (zh) 将低分辨率数据的特征应用到对应的高分辨率数据
CN112307989B (zh) 路面物体识别方法、装置、计算机设备和存储介质
CN112258507B (zh) 互联网数据中心的目标对象检测方法、装置和电子设备
CN110751149A (zh) 目标对象标注方法、装置、计算机设备和存储介质
CN113505781B (zh) 目标检测方法、装置、电子设备及可读存储介质
CN111814716A (zh) 印章去除方法、计算机设备和可读存储介质
CN112102235B (zh) 人体部位识别方法、计算机设备和存储介质
CN110298302B (zh) 一种人体目标检测方法及相关设备
CN114550051A (zh) 一种车损检测方法、装置、计算机设备及存储介质
US20110022806A1 (en) Method and system of numerical analysis for continuous data
CN109903308B (zh) 用于获取信息的方法及装置
US20210012511A1 (en) Visual search method, computer device, and storage medium
CN112784639A (zh) 路口检测、神经网络训练及智能行驶方法、装置和设备
CN112287905A (zh) 车辆损伤识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination