CN111275128A - 图像识别模型训练方法及系统和图像识别方法 - Google Patents

图像识别模型训练方法及系统和图像识别方法 Download PDF

Info

Publication number
CN111275128A
CN111275128A CN202010090927.4A CN202010090927A CN111275128A CN 111275128 A CN111275128 A CN 111275128A CN 202010090927 A CN202010090927 A CN 202010090927A CN 111275128 A CN111275128 A CN 111275128A
Authority
CN
China
Prior art keywords
image recognition
recognition model
yuv
training
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010090927.4A
Other languages
English (en)
Other versions
CN111275128B (zh
Inventor
朱禹萌
陆进
陈斌
宋晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010090927.4A priority Critical patent/CN111275128B/zh
Priority to PCT/CN2020/093033 priority patent/WO2021159633A1/zh
Publication of CN111275128A publication Critical patent/CN111275128A/zh
Application granted granted Critical
Publication of CN111275128B publication Critical patent/CN111275128B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种图像识别方法,包括:创建基于RGB数据格式的图像识别的训练集和验证集;利用训练集和验证集训练RGB图像识别模型;搭建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支;利用训练好的所述RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。本发明通过RGB图像识别模型蒸馏训练YUV图像识别模型的输入层和预测层,提高了YUV图像识别模型的训练效率,降低了YUV图像识别模型的训练成本。

Description

图像识别模型训练方法及系统和图像识别方法
技术领域
本发明实施例涉及计算机技术领域,尤其涉及图像识别模型训练方法及系统和图像识别方法。
背景技术
在图像识别领域,实际生产设备中图像使用的颜色空间根据其设备优势各有不同,比如视频传输设备为了节省带宽使用的YUV格式,对应的图像识别模型为YUV图像识别模型,或者带有红外探头的RGB+IR格式,对应的图像识别模型为RGB图像识别模型,RGB图像识别模型无法对YUV格式的图像进行识别,需要重新搭建一个YUV图像识别模型,再用YUV数据格式的训练数据对YUV图像识别模型进行训练,为提升YUV图像识别模型的准确度,需要对大量的训练数据进行人工标注,成本较高。
为了降低深度学习模型应用的门槛,利用知识蒸馏的方法将高计算能力、高精度的模型包含的先验知识用于教授小模型的深度学习网络,可以实现对网络模型的压缩提速。然而,传统的知识蒸馏方法只是为了缩小网络规模和计算需求,但是仍然局限在同样形式的训练数据上,例如RGB图像识别模型只能蒸馏得到结构更小的RGB图像识别模型,得不到YUV模型,给模型蒸馏带来了应用上的限制。
发明内容
有鉴于此,本发明实施例提供了一种图像识别模型训练方法、系统、计算机设备及计算机可读存储介质和图像识别方法,用于解决构建新的图像识别模型步骤繁琐且成本高的问题。
本发明实施例是通过下述技术方案来解决上述技术问题:
一种图像识别模型训练方法,包括:
创建基于RGB数据格式的图像识别的训练集和验证集;
利用所述训练集和所述验证集训练RGB图像识别模型,所述RGB图像识别模型用于训练YUV图像识别模型;
搭建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支;
利用训练好的所述RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。
进一步地,所述利用训练好的RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像包括:
根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数;
通过所述整体目标损失函数对所述待训练YUV图像识别模型的输入层和预测层进行训练,得到所述YUV图像识别模型。
进一步地,所述根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数包括:
获取所述RGB图像识别模型的软目标;
根据所述RGB图像识别模型的软目标,获取所述待训练YUV图像识别模型的整体目标损失函数。
进一步地,所述通过所述整体目标损失函数对所述待训练YUV图像识别模型的输入层和预测层进行训练,得到所述YUV图像识别模型包括:
最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整。
进一步地,所述最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整包括:
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第一学习率,进行初步训练;
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第二学习率,进行精细训练;
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第三学习率,得到所述YUV图像识别模型。
一种图像识别模型训练系统,其特征在于,包括:
训练集和验证集创建模块,用于创建基于RGB数据格式的图像识别的训练集和验证集;
RGB图像识别模型训练模块,用于利用所述训练集和所述验证集训练RGB图像识别模型,所述RGB图像识别模型用于训练YUV图像识别模型;
待训练YUV图像识别模型构建模块,用于构建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支;
YUV图像识别模型训练模块,用于利用训练好的RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。
为了实现上述目的,本发明实施例还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述图像识别模型训练方法的步骤。
为了实现上述目的,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上所述的图像识别模型训练方法的步骤。
本发明还提供一种图像识别方法,包括以下步骤:
获取YUV数据格式的待识别图像;
将所述YUV数据格式的待识别图像输入YUV图像识别模型,其中,所述YUV图像识别模型通过所述图像识别模型训练方法训练得到;
通过所述YUV图像识别模型输出所述YUV数据格式的待识别图像的识别结果。
进一步地,所述通过所述YUV图像识别模型输出所述YUV数据格式的待识别图像的识别结果包括:
接收所述YUV数据格式的待识别图像;
通过所述YUV图像识别模型的输入层对所述YUV数据格式的待识别图像的色度特征和亮度特征进行提取,经过识别后将图像识别结果通过所述YUV图像识别模型的输出层输出。
本发明提供的图像识别模型训练方法、系统、计算机设备及计算机可读存储介质和图像识别方法,通过RGB图像识别模型蒸馏训练YUV图像识别模型的输入层和预测层,提高了YUV图像识别模型的训练效率,降低了YUV图像识别模型的训练成本。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明实施例一之图像识别模型训练方法的步骤流程图;
图2为本发明实施例RGB图像识别模型输入层结构示意图;
图3为本发明实施例利用训练好的RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像的步骤流程图;
图4为本发明实施例根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数的步骤流程图;
图5为本发明实施例最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整的步骤流程图;
图6为本发明图像识别模型训练系统之实施例二的程序模块示意图;
图7为本发明图像识别模型训练系统计算机设备之实施例三的硬件结构示意图;
图8为本发明实施例图像识别方法的步骤流程图;
图9为本发明实施例通过所述YUV图像识别模型输出所述YUV数据格式的待识别图像的识别结果的步骤流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
实施例一
请参阅图1,示出了本发明实施例之图像识别模型训练方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述,具体如下:
如图1所示,一种图像识别模型训练方法,包括:
S100:创建基于RGB数据格式的图像识别的训练集和验证集;
具体的,在本实施例中,创建基于RGB数据格式的图像识别的训练集和验证集是指已经进行人工标注的RGB数据格式的图像,其中训练集用于训练RGB图像识别模型,验证集用于验证训练好的RGB图像识别模型的识别准确率。
S200:利用所述训练集和所述验证集训练RGB图像识别模型,所述RGB图像识别模型用于训练YUV图像识别模型;
所述RGB图像识别模型的网络结构可分为输入层与预测层,如图2所示:其中输入层为预训练分类模型ResNet50,特征提取层有5组卷积块,第一组conv1(第一向量卷积运算),卷积核为7x7,通道数为64,2倍降采样;第二组conv2(第二向量卷积运算),包含1层3x3的最大池化层以及3组残差模块,通道数扩大4倍;以此类推,每一组向量卷积运算都进行2倍降采样,通道数扩大2倍。
预测层是利用提取的图片特征进行标签预测,对于C类目标分类任务,预测层由C个通道的1x1卷积层和平均池化层组成。
S300:搭建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支。
其中,其中输入层用于提取待识别图片的图片特征,所述输入层包括亮度输入分支和色度输入分支,用于提取YUV图像的亮度特征和色度特征。预测层是利用提取的亮度特征和色度特征进行标签预测,以图像分类案例说明:图像识别模型的识别目标是将多个类别的图片准确分类。具体的,待识别图像中有N张图片,属于猫、狗、车、树木等C个类别;对于待识别图像中的任意一张图片,已知的正确标签为[y1,y2,…,yc,…,yC],其中yi(i≠c)=0,yc=1,c为该图片所属类别。输出层是用于输出图像的分类类别。
S400:利用训练好的所述RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。
蒸馏指的是将训练好的复杂模型中的预测能力迁移到一个结构更为简单的模型中,从而达到模型压缩的目的。复杂模型为被蒸馏模型,简单模型为蒸馏模型,在本实施例中,是将RGB图像识别模型的图像识别能力迁移到YUV图像识别模型上,其中,被蒸馏模型性能优良、准确率高,但是相对于蒸馏模型,被蒸馏模型的结构复杂、参数权重多、计算速度较慢。蒸馏模型是计算速度较快、适合部署到对实时性要求较高的单个神经网络,蒸馏模型相比于被蒸馏模型,具有更大的运算吞吐量、更简单的网络结构和更少的模型参数。
具体的,在本实施例中,所述RGB图像识别模型作为被蒸馏模型,其优势在于可以利用大的公开预训练网络和数量可观的RGB训练数据,得到精度较高的模型参数。
在一实施方式中,如图3所示,步骤S400进一步包括:
S401:根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数;
具体的,对于一张待分类图像,RGB图像识别模型预测出C个类别,类别c的目标损失函数为
Figure BDA0002383690860000071
则所述RGB图像识别模型的整体目标损失方程为
Figure BDA0002383690860000072
其中,yc是指RGB图像识别模型预测出的值,c是指RGB图像识别模型预测出的C个类别,记为[x1,x2,…,xc,…,xC],LC hard是指不加入温度参数T时,类别C的目标损失函数,Lhard是不加入温度参数T时,RGB图像识别模型的整体目标函数。
具体的,可以通过大量已知标签训练集的RGB图像学得使Lhard,即RGB图像识别模型损失函数值最小的模型参数,使所述RGB图像识别模型识别误差最小。
在一实施方式中,如图4所示,步骤S401进一步包括:
S4011:获取所述RGB图像识别模型的软目标;
具体的,软目标指的被蒸馏模型使用带有温度参数T的预测层损失函数的输出结果。通过加入温度参数T,错误分类再经过预测层后,错误输出会被放大,正确分类会被缩小,也就是说,通过加入温度参数T,人为的增加了训练难度,一旦将T重新设置为1,分类结果会非常接近RGB图像识别模型的分类结果。
软目标用公式表达为:
Figure BDA0002383690860000081
当T=1时,此时
Figure BDA0002383690860000082
此时得到所述RGB图像识别模型的硬目标,硬目标指的是将温度参数设为1,正常网络训练的目标。
其中,qc为软目标,c是指RGB图像识别模型预测出的C个类别,记为[x1,x2,…,xc,…,xC],T为温度参数。
S4012:根据所述RGB图像识别模型的软目标,获取所述待训练YUV图像识别模型的整体目标损失函数。
具体的,通过损失函数
Figure BDA0002383690860000083
Figure BDA0002383690860000084
得到YUV图像识别模型的第一目标损失函数为
Figure BDA0002383690860000085
其中第一目标损失函数与软目标对应,是包含蒸馏学习的温度参数的函数。
其中,ysoft为RGB图像识别模型在温度T的条件下,预测出的值。
YUV图像识别模型的第二目标损失函数为
Figure BDA0002383690860000086
其中第二目标损失函数与硬目标对应,是不包含蒸馏学习的温度参数的损失函数。
具体的,所述蒸馏模型的整体目标损失函数为L=L1+L2
因此,YUV图像识别模型的整体目标损失函数为:
Figure BDA0002383690860000091
其中,L1为第一目标损失函数,L2为第二目标损失函数,L为整体目标损失函数。
S402:通过所述整体目标损失函数对所述待训练YUV图像识别模型的输入层和预测层进行训练,得到所述YUV图像识别模型。
在一实施方式中,步骤S402进一步包括:
S4021:最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整。
具体的,深度学习模型包含大量的可学习参数,训练模型就是不断调整参数直到目标函数值最小的过程。学习率就是衡量调整参数的“步伐”的一个重要指标,即通过调整学习率是可以对模型的训练进度进行控制,具体的,学习率是对模型参数的变化情况进行控制,用公式表示为:更新后的参数=当前参数-学习率*损失函数的梯度。针对不同的模型,每一层的学习率,以及训练过程中每个阶段的学习率都有不同的选择策略。
在一实施方式中,如图5所示,步骤S4021进一步包括:
S4021A:调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第一学习率,进行初步训练;
在一实施方式中,调整亮度输入分支和预测层时,设置亮度输入分支和预测层的第一学习率为0.01,而此时色度输入分支不参与训练,第一学习率为0。
S4021B:调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第二学习率,进行精细训练;
具体的,完成第一步训练后,YUV图像识别模型已经可以识别目标,只是由于缺少色度信息,识别精度较低,此时,加入色度输入分支补充模型能力。亮度输入分支的特征提取已经在第一步中完成,因此需要固定亮度输入分支,即将亮度输入分支的第二学习率设置为0。训练色度输入分支与预测分支时,色度输入分支的第二学习率设为0.01,而由于预测层已经经过学习,不是随机初始化的参数,需要减小“步伐”,因此将预测层的第二学习率设为0.001。此时经过第一步的训练,色度输入分支与预测层学习的是残差损失,可以快速收敛,降低了学习难度和训练时间。
S4021C:调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第三学习率,得到所述YUV图像识别模型。
具体的,分布调参可以减小模型学习难度,但最后还是需要进行联合调整,得到整体最优解。将亮度输入分支、色度输入分支以及预测层的第三学习率都设为0.0005,小步伐地调整参数值,得到最佳模型参数,进而得到YUV图像识别模型。
本发明实施例提出了一种YUV图像识别模型构建方法,可以利用不同类型的数据格式进行迁移学习。相比于传统模型蒸馏,本发明针对输入数据格式的特性调整了模型的输入模块,增加了亮度分支与色度分支;同时,利用了RGB图像识别模型的高算力性能,通过加入“软目标”,学习不同类别之前分布差异;另外,调整了模型结构后,细化了YUV图像识别模型的训练过程,采用阶段式的训练步骤,先利用亮度分量完成预测目标,后利用色度分量学习残差部分,降低了迁移学习的难度,提升模型精度。本发明实施例还提供一种图像识别方法,可以直接用YUV图像识别模型对具有YUV的图像进行识别,不需要将YUV的图像转换为RGB的图像,再利用YUV图像识别模型识别,提高了YUV图像的识别效率。
实施例二
请继续参阅图6,示出了本发明图像识别模型训练系统的程序模块示意图。在本实施例中,图像识别模型训练系统20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述图像识别模型训练方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述图像识别模型训练系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
训练集和验证集创建模块200:用于创建基于RGB数据格式的图像识别的训练集和验证集;
RGB图像识别模型训练模块202:用于利用所述训练集和所述验证集训练RGB图像识别模型,所述RGB图像识别模型用于训练YUV图像识别模型;
待训练YUV图像识别模型构建模块204:用于构建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支;
YUV图像识别模型训练模块206:用于利用训练好的RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。
进一步地,所述YUV数据格式图像训练模块206还用于:
根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数;
通过所述整体目标损失函数对所述待训练YUV图像识别模型的输入层和预测层进行训练,得到所述YUV图像识别模型。
进一步地,所述YUV数据格式图像训练模块206还用于:
获取所述RGB图像识别模型的软目标;
根据所述RGB图像识别模型的软目标,获取所述待训练YUV图像识别模型的整体目标损失函数。
进一步地,所述YUV数据格式图像训练模块206还用于:
最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整。
进一步地,所述YUV数据格式图像训练模块206还用于:
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第一学习率,进行初步训练;
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第二学习率,进行精细训练;
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第三学习率,得到所述YUV图像识别模型。
实施例三
参阅图7,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图7所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及图像识别模型训练系统20。其中:
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如上述实施例所述的图像识别模型训练系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行图像识别模型训练系统20,以实现上述实施例的图像识别模型训练方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图7仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述图像识别模型训练系统20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。
例如,图6示出了所述实现图像识别模型训练系统20实施例二的程序模块示意图,该实施例中,所述基于图像识别模型训练系统20可以被划分为训练集和验证集创建模块200、RGB图像识别模型训练模块202、待训练YUV图像识别模型构建模块204和YUV图像识别模型训练模块206。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述图像识别模型训练系统20在所述计算机设备2中的执行过程。所述程序模块训练集和验证集创建模块200-YUV图像识别模型训练模块206的具体功能在上述实施例中已有详细描述,在此不再赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储图像识别模型训练系统20,被处理器执行时实现上述实施例的图像识别模型训练方法。
实施例五
参阅图8,示出了本发明实施例五之图像识别方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。具体如下。
S110:获取YUV数据格式的待识别图像;
S210:将所述YUV数据格式的待识别图像输入YUV图像识别模型;
S310:通过所述YUV图像识别模型输出所述YUV数据格式的待识别图像的识别结果。
在一实施方式中,请参阅图9,步骤S310进一步包括:
S311:接收所述YUV数据格式的待识别图像;
S312:通过所述YUV图像识别模型的输入层对所述YUV数据格式的待识别图像的色度特征和亮度特征进行提取,经过识别后将图像识别结果通过所述YUV图像识别模型的输出层输出。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种图像识别模型训练方法,其特征在于,包括:
创建基于RGB数据格式的图像识别的训练集和验证集;
利用所述训练集和所述验证集训练RGB图像识别模型,所述训练好的RGB图像识别模型用于训练YUV图像识别模型;
搭建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支;
利用训练好的所述RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。
2.根据权利要求1所述的图像识别模型训练方法,其特征在于,所述利用训练好的RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像包括:
根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数;
通过所述整体目标损失函数对所述待训练YUV图像识别模型的输入层和预测层进行训练,得到所述YUV图像识别模型。
3.根据权利要求2所述的图像识别模型训练方法,其特征在于,所述根据训练好的RGB图像识别模型,获取所述待训练YUV图像识别模型的整体目标损失函数包括:
获取所述RGB图像识别模型的软目标;
根据所述RGB图像识别模型的软目标,获取所述待训练YUV图像识别模型的整体目标损失函数。
4.根据权利要求2所述的图像识别模型训练方法,其特征在于,所述通过所述整体目标损失函数对所述待训练YUV图像识别模型的输入层和预测层进行训练,得到所述YUV图像识别模型包括:
最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整。
5.根据权利要求4所述的图像识别模型训练方法,其特征在于,所述最小化所述整体目标损失函数,以得到所述YUV图像识别模型,所述整体目标损失函数通过学习率调整包括:
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第一学习率,进行初步训练;
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第二学习率,进行精细训练;
调整所述亮度输入分支、所述色度输入分支与所述预测层的学习率为第三学习率,得到所述YUV图像识别模型。
6.一种图像识别模型训练系统,其特征在于,包括:
训练集和验证集创建模块,用于创建基于RGB数据格式的图像识别的训练集和验证集;
RGB图像识别模型训练模块,用于利用所述训练集和所述验证集训练RGB图像识别模型,所述RGB图像识别模型用于训练YUV图像识别模型;
待训练YUV图像识别模型构建模块,用于构建待训练YUV图像识别模型,所述待训练YUV图像识别模型包括输入层,预测层和输出层,所述输入层包括亮度输入分支和色度输入分支;
YUV图像识别模型训练模块,用于利用训练好的RGB图像识别模型使用蒸馏方法训练所述待训练YUV图像识别模型的亮度输入分支、色度输入分支和预测层,得到YUV图像识别模型,所述YUV图像识别模型用于识别YUV数据格式的图像。
7.一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的图像识别模型训练方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1至5中任一项所述的图像识别模型训练方法的步骤。
9.一种图像识别方法,其特征在于,包括以下步骤:
获取YUV数据格式的待识别图像;
将所述YUV数据格式的待识别图像输入YUV图像识别模型,其中,所述YUV图像识别模型通过所述权利要求1-5所述的图像识别模型训练方法训练得到;
通过所述YUV图像识别模型输出所述YUV数据格式的待识别图像的识别结果。
10.根据权利要求9所述的图像识别方法,其特征在于,所述通过所述YUV图像识别模型输出所述YUV数据格式的待识别图像的识别结果包括:
接收所述YUV数据格式的待识别图像;
通过所述YUV图像识别模型的输入层对所述YUV数据格式的待识别图像的色度特征和亮度特征进行提取,经过识别后将图像识别结果通过所述YUV图像识别模型的输出层输出。
CN202010090927.4A 2020-02-13 2020-02-13 图像识别模型训练方法及系统和图像识别方法 Active CN111275128B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010090927.4A CN111275128B (zh) 2020-02-13 2020-02-13 图像识别模型训练方法及系统和图像识别方法
PCT/CN2020/093033 WO2021159633A1 (zh) 2020-02-13 2020-05-28 图像识别模型训练方法及系统和图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010090927.4A CN111275128B (zh) 2020-02-13 2020-02-13 图像识别模型训练方法及系统和图像识别方法

Publications (2)

Publication Number Publication Date
CN111275128A true CN111275128A (zh) 2020-06-12
CN111275128B CN111275128B (zh) 2023-08-25

Family

ID=70999464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010090927.4A Active CN111275128B (zh) 2020-02-13 2020-02-13 图像识别模型训练方法及系统和图像识别方法

Country Status (2)

Country Link
CN (1) CN111275128B (zh)
WO (1) WO2021159633A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115661486A (zh) * 2022-12-29 2023-01-31 有米科技股份有限公司 图像特征的智能提取方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115150370B (zh) * 2022-07-05 2023-08-01 广东魅视科技股份有限公司 一种图像处理的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098221A1 (en) * 2012-10-09 2014-04-10 International Business Machines Corporation Appearance modeling for object re-identification using weighted brightness transfer functions
CN109815881A (zh) * 2019-01-18 2019-05-28 成都旷视金智科技有限公司 行为识别模型的训练方法、行为识别方法、装置及设备
US20190220746A1 (en) * 2017-08-29 2019-07-18 Boe Technology Group Co., Ltd. Image processing method, image processing device, and training method of neural network
CN110188776A (zh) * 2019-05-30 2019-08-30 京东方科技集团股份有限公司 图像处理方法及装置、神经网络的训练方法、存储介质
CN110503613A (zh) * 2019-08-13 2019-11-26 电子科技大学 基于级联空洞卷积神经网络的面向单幅图像去雨方法
CN110659665A (zh) * 2019-08-02 2020-01-07 深圳力维智联技术有限公司 一种异维特征的模型构建方法及图像识别方法、装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11270470B2 (en) * 2017-10-12 2022-03-08 Sony Group Corporation Color leaking suppression in anchor point cloud compression
CN110163237B (zh) * 2018-11-08 2023-03-14 腾讯科技(深圳)有限公司 模型训练及图像处理方法、装置、介质、电子设备
CN110189268A (zh) * 2019-05-23 2019-08-30 西安电子科技大学 基于gan网络的水下图像色彩校正方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098221A1 (en) * 2012-10-09 2014-04-10 International Business Machines Corporation Appearance modeling for object re-identification using weighted brightness transfer functions
US20190220746A1 (en) * 2017-08-29 2019-07-18 Boe Technology Group Co., Ltd. Image processing method, image processing device, and training method of neural network
CN109815881A (zh) * 2019-01-18 2019-05-28 成都旷视金智科技有限公司 行为识别模型的训练方法、行为识别方法、装置及设备
CN110188776A (zh) * 2019-05-30 2019-08-30 京东方科技集团股份有限公司 图像处理方法及装置、神经网络的训练方法、存储介质
CN110659665A (zh) * 2019-08-02 2020-01-07 深圳力维智联技术有限公司 一种异维特征的模型构建方法及图像识别方法、装置
CN110503613A (zh) * 2019-08-13 2019-11-26 电子科技大学 基于级联空洞卷积神经网络的面向单幅图像去雨方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115661486A (zh) * 2022-12-29 2023-01-31 有米科技股份有限公司 图像特征的智能提取方法及装置

Also Published As

Publication number Publication date
CN111275128B (zh) 2023-08-25
WO2021159633A1 (zh) 2021-08-19

Similar Documents

Publication Publication Date Title
CN109145759B (zh) 车辆属性识别方法、装置、服务器及存储介质
CN108229591B (zh) 神经网络自适应训练方法和装置、设备、程序和存储介质
CN111428581A (zh) 人脸遮挡检测方法及系统
CN112529026B (zh) 提供ai模型的方法、ai平台、计算设备及存储介质
CN111797893A (zh) 一种神经网络的训练方法、图像分类系统及相关设备
KR20200145827A (ko) 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체
CN111950723A (zh) 神经网络模型训练方法、图像处理方法、装置及终端设备
CN111339979B (zh) 基于特征提取的图像识别方法及图像识别装置
CN111935479B (zh) 一种目标图像确定方法、装置、计算机设备及存储介质
CN110659667A (zh) 图片分类模型训练方法、系统和计算机设备
CN111275128B (zh) 图像识别模型训练方法及系统和图像识别方法
US10733481B2 (en) Cloud device, terminal device, and method for classifying images
US20230021551A1 (en) Using training images and scaled training images to train an image segmentation model
US20220343507A1 (en) Process of Image
CN110874574A (zh) 行人重识别方法、装置、计算机设备及可读存储介质
CN112417947B (zh) 关键点检测模型的优化及面部关键点的检测方法及装置
CN113034514A (zh) 天空区域分割方法、装置、计算机设备和存储介质
CN112597984A (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN112969032A (zh) 光照模式识别方法、装置、计算机设备及存储介质
CN111428732B (zh) Yuv图像识别方法、系统和计算机设备
CN112347957A (zh) 行人重识别方法、装置、计算机设备及存储介质
CN114445716B (zh) 关键点检测方法、装置、计算机设备、介质及程序产品
CN113326832B (zh) 模型训练、图像处理方法、电子设备及存储介质
CN112258563A (zh) 图像对齐方法、装置、电子设备及存储介质
CN112434591B (zh) 车道线确定方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant