CN113065605B - 金银花识别模型的训练方法、装置、计算机设备及介质 - Google Patents

金银花识别模型的训练方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN113065605B
CN113065605B CN202110413863.1A CN202110413863A CN113065605B CN 113065605 B CN113065605 B CN 113065605B CN 202110413863 A CN202110413863 A CN 202110413863A CN 113065605 B CN113065605 B CN 113065605B
Authority
CN
China
Prior art keywords
honeysuckle
training
network module
samples
identification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110413863.1A
Other languages
English (en)
Other versions
CN113065605A (zh
Inventor
罗林锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202110413863.1A priority Critical patent/CN113065605B/zh
Publication of CN113065605A publication Critical patent/CN113065605A/zh
Application granted granted Critical
Publication of CN113065605B publication Critical patent/CN113065605B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能技术领域,公开了一种金银花识别模型的训练方法,包括:获取多个第一样本;以及基于深度学习模型构建金银花识别模型,金银花识别模型包括主网络模块,以及多个子网络模块;利用所有所述第一样本对所述主网络模块进行训练;利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块;检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成。本申请还涉及区块链技术。本申请还公开了一种金银花识别模型的训练装置、计算机设备以及计算机可读存储介质。本申请实现尽可能减少训练金银花识别模型所需的人工标注样本的数量的同时,提高了训练得到的金银花识别模型的准确率。

Description

金银花识别模型的训练方法、装置、计算机设备及介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种金银花识别模型的训练方法、金银花识别模型的训练装置、计算机设备以及计算机可读存储介质。
背景技术
目前,金银花药材等级通常分为12种,由于不同等级的金银花在制作、加工、售价等方面都不一样,因此需要通过识别金银花杂质的占比、大小、重量、干燥程度等,来区分各个等级的金银花药材。目前采用的方法大多都是人工区分金银花药材各个等级,人为识别主观性强,难以准确对金银花药材进行分级,而且效率低下。
而为了提高对金银花药材的识别效率,将机器学习应用至金银花识别的研究也随之展开,但目前提出的金银花识别模型,不仅因为金银花等级众多而需要使用大量人工标注的样本,而且准确率较低。
上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
发明内容
本申请的主要目的在于提供一种金银花识别模型的训练方法、金银花识别模型的训练装置、计算机设备以及计算机可读存储介质,旨在解决如何尽可能减少训练金银花识别模型所需的人工标注样本的数量的同时,也可以训练得到准确率高的金银花识别模型的问题。
为实现上述目的,本申请提供一种金银花识别模型的训练方法,包括以下步骤:
获取多个第一样本,其中,所述第一样本为标注有金银花类别和金银花等级的金银花图像,每个所述金银花类别包括多个所述金银花等级,且每个所述金银花等级对应的所述第一样本的数量有多个;以及,
基于深度学习模型构建金银花识别模型,所述金银花识别模型包括主网络模块,以及多个子网络模块;
利用所有所述第一样本对所述主网络模块进行训练,其中,所述主网络模块用于提取所述第一样本对应的第一图像特征,并基于所述第一图像特征训练所述主网络模块识别所述金银花图像对应的金银花类别的能力;
利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,其中,所述子网络模块用于提取所述第一样本对应的第二图像特征,以及将所述第二图像特征与所述第一图像特征进行融合,得到第三图像特征,并基于所述第三图像特征训练所述子网络模块识别所述金银花图像对应的金银花等级的能力;
检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成。
进一步地,所述利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块的步骤之前,还包括:
获取多个第二样本,所述第二样本为未标注的金银花图像;
利用训练后的所述主网络模块对多个所述第二样本进行分析,以预测多个所述第二样本对应的金银花类别和第一预测概率;
根据各个所述第二样本对应的所述金银花类别和所述第一预测概率,将各个所述第二样本标注为第三样本;
基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新。
进一步地,所述利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块的步骤之后,还包括:
根据各个所述第三样本对应的金银花类别,确定各个所述第三样本对应的所述子网络模块;
利用各个所述第三样本对应的所述子网络模块,预测各个所述第三样本对应的金银花等级和第二预测概率;
根据各个所述第三样本对应的所述金银花等级和所述第二预测概率,将各个所述第三样本标注为第四样本;
基于各个所述子网络模块对应的所述第四样本和所述第一样本,对各个所述子网络模块进行训练更新。
进一步地,所述利用所有所述第一样本对所述主网络模块进行训练的步骤包括:
将所有所述第一样本按预设比例划分为训练集、验证集和测试集;
利用所述训练集对所述主网络模块进行多次迭代训练;
利用所述验证集对多次迭代训练后的所述主网络模块进行优化;
利用所述测试集对优化后的所述主网络模块进行测试;
当检测到所述主网络模块通过所述测试时,判定所述主网络模块训练结束;
当检测到所述主网络模块未通过所述测试时,返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤。
进一步地,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
将训练完成的所述金银花识别模型对应的模型参数从浮点型转换为预设位数的整型,以对训练完成的所述金银花识别模型进行量化压缩;
将压缩后的所述金银花识别模型对应的调用过程编译为动态链接库;
根据所述动态链接库,生成压缩后的所述金银花识别模型对应的移动端应用。
进一步地,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
接收到目标图像时,利用训练完成的所述金银花识别模型预测所述目标图像对应的金银花类别和金银花等级,得到预测结果,并输出所述预测结果;
当检测到在输出所述预测结果后的预设时长之内,未接收到所述预测结果的否定响应时,根据所述目标图像和所述预测结果生成训练样本;
利用所述训练样本更新所述金银花识别模型。
进一步地,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
将训练完成的所述金银花识别模型存储至区块链网络。
为实现上述目的,本申请还提供一种金银花识别模型的训练装置,所述金银花识别模型的训练装置包括:
获取模块,用于获取多个第一样本,其中,所述第一样本为标注有金银花类别和金银花等级的金银花图像,每个所述金银花类别包括多个所述金银花等级,且每个所述金银花等级对应的所述第一样本的数量有多个;以及,
构建模块,用于基于深度学习模型构建金银花识别模型,所述金银花识别模型包括主网络模块,以及多个子网络模块;
第一训练模块,用于利用所有所述第一样本对所述主网络模块进行训练,其中,所述主网络模块用于提取所述第一样本对应的第一图像特征,并基于所述第一图像特征训练所述主网络模块识别所述金银花图像对应的金银花类别的能力;
第二训练模块,用于利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,其中,所述子网络模块用于提取所述第一样本对应的第二图像特征,以及将所述第二图像特征与所述第一图像特征进行融合,得到第三图像特征,并基于所述第三图像特征训练所述子网络模块识别所述金银花图像对应的金银花等级的能力;
检测模块,用于检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成。
为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括:
所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述金银花识别模型的训练方法的步骤。
为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述金银花识别模型的训练方法的步骤。
本申请提供的金银花识别模型的训练方法、金银花识别模型的训练装置、计算机设备以及计算机可读存储介质,通过分别训练金银花识别模型中用于识别金银花类别的主网络模块,以及用于识别各金银花类别下的金银花等级的子网络模块,并将主网络模块和子网络模块对应的特征提取结果进行特征融合,以优化子网络模块对应的模型参数,从而减少训练金银花识别模型所需的已标注的样本的数量的同时,还能得到准确率高的金银花识别模型。
附图说明
图1为本申请一实施例中金银花识别模型的训练方法步骤示意图;
图2为本申请一实施例的金银花识别模型的训练装置示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,在一实施例中,所述金银花识别模型的训练方法包括:
步骤S10、获取多个第一样本,其中,所述第一样本为标注有金银花类别和金银花等级的金银花图像,每个所述金银花类别包括多个所述金银花等级,且每个所述金银花等级对应的所述第一样本的数量有多个;以及,
步骤S20、基于深度学习模型构建金银花识别模型,所述金银花识别模型包括主网络模块,以及多个子网络模块;
步骤S30、利用所有所述第一样本对所述主网络模块进行训练,其中,所述主网络模块用于提取所述第一样本对应的第一图像特征,并基于所述第一图像特征训练所述主网络模块识别所述金银花图像对应的金银花类别的能力;
步骤S40、利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,其中,所述子网络模块用于提取所述第一样本对应的第二图像特征,以及将所述第二图像特征与所述第一图像特征进行融合,得到第三图像特征,并基于所述第三图像特征训练所述子网络模块识别所述金银花图像对应的金银花等级的能力;
步骤S50、检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成。
本实施例中,实施例终端可以是一种计算机设备,也可以是金银花识别模型的训练装置。
如步骤S10所述:负责模型训练的相关工程师预先采集多个金银花图像(或称金银花药材图像),并对各金银花图像进行标注;其中,工程师预先根据金银花药材中杂质的占比、大小、重量、金银花的干燥程度等来区分各个金银花等级(如根据金银花优劣程度划分有12个金银花等级),然后根据各金银花图像中呈现的金银花优劣程度,对金银花图像进行标注,以标注出各金银花图像对应的金银花等级。而且针对每个金银花等级,均需要标注有多个金银花图像(例如每个金银花等级,均需要标注出50个相应的金银花图像)。
进一步地,工程师还根据各金银花图像对应的金银花等级,将各金银花图像划分至其金银花等级所属的金银花类别,并标注出各金银花图像对应的金银花类别。其中,预先根据所有金银花等级的数量,划分出多个金银花类别,且每个金银花类别下都包括多个金银花等级,以总数为12个的金银花等级为例,将1-3级划分为第一类别,将4-6级划分为第二类别,将7-9级划分为第三类别,将10-12级划分为第四类别。这样,根据各金银花图像对应的金银花等级,可以得知各金银花图像对应的金银花类别。
然后,工程师再将各标注有金银花类别和金银花等级的金银花图像,作为第一样本输入到终端中。这样终端即可获取得到多个第一样本。
如步骤S20所述:终端预先基于人工智能和深度学习模型,构建待训练的金银花识别模型;其中,所述金银花识别模型包括主网络模块和多个子网络模块,且所述主网络模块和所述子网络模块都是基于深度学习模型构建的,都可以相当于一个独立的深度学习模型。
进一步地,所述子网络模块的数量,与所述金银花类别的数量相等,即预先定义金银花图像有多少各类别,即相应构建相等数量的子网络模块。
其中,所述主网络模块用于针对金银花图像对应的金银花类别作特征识别;所述子网络模块则用于针对金银花图像对应的金银花等级作特征识别。
可选的,所述深度学习模型可以是神经网络模块,也可以是半监督自训练模型,且所述半监督自训练模型可以是EfficientNet模型。
如步骤S30所述:当终端获取到多个第一样本时,则将所有第一样本输入到金银花识别模型中进行多次迭代训练。
在此过程中,首先会利用所有第一样本对金银花识别模型的主网络模块进行训练,由主网络模块提取各个第一样本中的金银花图像对应的第一图像特征,并建立各金银花图像对应的第一图像特征,与各金银花图像对应的金银花类别之间的第一关联关系,主网络模块再基于第一关联关系不断训练和迭代更新,以最终学习得到识别所述金银花图像对应的金银花类别的能力。
这样,终端即可得到经所有第一样本进行训练后的主网络模块。
其中,当主网络模块提取得到各个第一样本中的金银花图像对应的第一图像特征后,还会将各个第一样本对应的第一图像特征,分别与各个第一样本进行关联。
如步骤S40所述:终端预先为每个金银花类别,均分配一个子网络模块。在终端得到训练后的主网络模块后,则进一步根据各个第一样本中的金银花图像对应的金银花类别,确定各个第一样本对应的子网络模块。
然后,终端利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,即利用各个子网络模块对应的第一样本,来训练各个子网络模块。
其中,每个子网络模块得到各自对应的第一样本作为输入后,则提取其所输入的第一样本中的金银花图像对应的第二图像特征,并获取该第一样本对应的第一图像特征,然后将第一图像特征与第二图像特征进行特征融合处理,以生成第三图像特征。可选的,所述特征融合处理可以是通过执行concat操作完成,这样就可以将第一图像特征与第二图像特征进行矩阵特征拼接,得到第三图像特征。应当理解的是,同一份第一样本对应的第二图像特征与第一图像特征之间,第二图像特征比第一图像特征的精度更高(即第二图像特征对应的特征提取结果,比第一图像特征对应的特征提取结果更为细分)。
可选的,每个子网络模块还包括一个支持向量机(Support Vector Machine,SVM),支持向量机是一类按监督学习方式对数据进行分类的分类器。
可选的,子网络模块在得到其对应的第一样本的第三图像特征后,则利用每个第一样本对应的第三图像特征,以及每个第一样本中的金银花图像对应的金银花等级,共同训练该子网络模块对应的支持向量机,以训练支持向量机,对该子网络模块所属的金银花类别下的金银花图像进行分类的能力,且其分类结果即为该金银花类别下的各金银花等级。这样当支持向量机训练完成时,该支持向量机对应的子网络模块即可学习得到:识别该子网络模块所属的金银花类别下的金银花图像对应的金银花等级的能力。
需要说明的是,第一图像特征、第二图像特征和第三图像特征,均可以分别看做是一个数据集(即数据集内至少包括一个图像特征)。
可选的,在将第三图像特征输入到相应的支持向量机之前,还可以对第三图像特征进行PCA(Principal components analysis)降纬操作,以减少第三图像特征的维数,同时保持第三图像特征中的对方差贡献最大的特征,这样在利用三图像特征训练支持向量机时,可以进一步优化支持向量机的训练结果,得到准确率更高的支持向量机。
如步骤S50所述:可选的,终端针对同一批第一样本,可以循环执行步骤S30-S40,以不断训练和优化金银花识别模型中的主网络模块和子网络模块,直到终端检测到主网络模块对应的模型参数达到收敛,以及检测到所有子网络模块对应的模型参数达到收敛。
其中,当终端检测到主网络模块对应的模型参数达到收敛时,则判定主网络模块训练完成;当终端检测到子网络模块对应的模型参数达到收敛时,则判定子网络模块训练完成。
可选的,当终端检测到所述主网络模块训练完成,以及检测到所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成。
进一步地,当终端接收到待识别的目标图像(即待分级的金银花图像)时,则将目标图像输入到金银花识别模型中进行分析,并由金银花识别模型中的主网络模块识别得到目标图像对应的金银花类别后,根据目标图像对应的金银花类别,匹配对应的子网络模块,然后利用匹配得到的子网络模块中的支持向量机识别目标图像对应的金银花等级,以完成对目标图像进行自动分级过程。
当然,金银花识别模型输出的目标图像对应的分级结果,除了目标图像对应的金银花等级外,还可以包括目标图像对应的金银花类别。
这样,由于金银花等级众多,因此若直接训练可一次识别得到所有金银花等级的金银花识别模型时,不仅所需已标注的训练样本的数量众多,而且得到的模型识别效率慢且精度低;而本申请实施例在训练金银花识别模型的过程中,通过先将所有金银花等级划分至多个金银花类别,然后分别训练专用于识别金银花类别的主网络模块,以及用于识别各金银花类别下的金银花等级的子网络模块,从而降低了整体训练金银花识别模型的难度,也就能相应减少训练所需的已标注样本的数量,而且通过将主网络模块和子网络模块对应的特征提取结果进行特征融合,以优化子网络模块对应的模型参数,使得主网络模块提取得到的图像特征也能用于训练子网络模块,减少了训练子网络模块所需的已标注的样本数量,进而在整体训练过程上看也相应减少了训练金银花识别模型所需的已标注的样本数量,同时还能提高训练得到的子网络模块的精度,进而提高金银花识别模型识别金银花图像对应的金银花等级的准确率。
在一实施例中,通过分别训练金银花识别模型中用于识别金银花类别的主网络模块,以及用于识别各金银花类别下的金银花等级的子网络模块,并将主网络模块和子网络模块对应的特征提取结果进行特征融合,以优化子网络模块对应的模型参数,从而减少训练金银花识别模型所需的已标注的样本的数量的同时,还能得到准确率高的金银花识别模型。
在一实施例中,在上述实施例基础上,所述利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块的步骤之前,还包括:
步骤S60、获取多个第二样本,所述第二样本为未标注的金银花图像;
步骤S61、利用训练后的所述主网络模块对多个所述第二样本进行分析,以预测多个所述第二样本对应的金银花类别和第一预测概率;
步骤S62、根据各个所述第二样本对应的所述金银花类别和所述第一预测概率,将各个所述第二样本标注为第三样本;
步骤S63、基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新。
本实施例中,所述深度学习模型为半监督自训练模型。
可选的,工程师在收集并标注第一样本输入到终端时,还可以收集多个未标注的金银花图像,分别作为多个第二样本输入到终端中,这样终端即可获取得到多个第二样本。
可选的,第二样本的样本数可以大于或等于第一样本,如两者之间的比例可以是1:1。
可选的,当终端利用所有第一样本对主网络模块进行训练之后,则将多个第二样本输入到训练后的主网络模块中,以利用主网络模块对多个所述第二样本进行分析。
然后,主网络模块会基于之前利用多个第一样本学习得到的可识别金银花图像所属金银花类别的能力,依次对各个第二样本进行分析预测,得到各个第二样本对应的金银花图像的金银花类别,并相应输出预测各个第二样本对应的金银花等级的置信值,且各个第二样本对应的置信值即可作为各个第二样本对应的第一预测概率(即预测第二样本对应的金银花图像,属于其预测得到的金银花类别的概率)。这样,终端即可得到多个第二样本对应的金银花类别和第一预测概率。
进一步地,在终端得到所有第二样本对应的金银花类别和第一预测概率后,即根据各个第二样本对应的金银花类别和第一预测概率,对各个第二样本进行标注,从而在各个第二样本对应的金银花图像中,自动标注出相应的金银花类别和第一预测概率,进而将多个第二样本相应标注为多个第三样本。
可选的,当终端多个第三样本后,则将所有第三样本和所有第一样本合并为一个新的训练数据集,然后再利用该训练数据集,对之前只基于第一样本进行训练后的主网络模块进行训练更新,并使主网络模块在多次迭代更新后重新达到收敛,或者使主网络模块进行预设训练次数的迭代。其中,所述预设训练次数可以根据实际情况需要设置,如取值范围可为500次-2000次。
其中,主网络模块在基于训练数据集中的每个样本进行训练更新的过程中,会先检测每个样本属于第一样本,还是属于第三样本。
可选的,当主网络模块检测到当前使用的样本为第一样本时,则直接使用模型初始设定的损失(loss)权重(如1.0)作为该样本对应的损失权重,并基于该损失权重利用该样本进行训练。
可选的,当主网络模块检测到当前使用的样本为第三样本时,则会读取第三样本对应的第一预测概率,并根据读取到的第一预测概率,确定该第三样本对应的损失权重,并基于该损失权重利用该第三样本进行训练。
其中,主网络模块可以是将第三样本对应的第一预测概率,直接作为第三样本对应的损失权重;或者,主网络模块将第三样本对应的预测概率,与模型初始设定的损失权重进行相乘后,将得到的乘积作为第三样本对应的损失权重。
可选的,终端每执行完成一次所述基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新的步骤后,会将循环轮次累计加一,且循环轮次的初始值为0。
需要说明的是,所述循环轮次并非是指主网络模块内部进行迭代更新的次数,而是指所述基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新的步骤对应的执行次数。
而且在利用该训练数据集对主网络模块进行训练更新时,需要使主网络模块在多次迭代更新后重新达到收敛,或者使主网络模块进行预设训练次数的迭代,才会判定所述基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新的步骤执行完成一次。
可选的,当终端检测到所述基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新的步骤(即步骤S63)执行完成后,则进一步检测当前的所述循环轮次是否大于或等于预设次数。
其中,所述预设次数可以根据实际情况需要预先设置,其取值范围可选为3-5次,优选为3次。
或者,在终端检测所述循环轮次是否大于所述预设次数之前,将第一样本对应的数量定义为第一数量,以及将第二样本对应的数量定义为第二数量,终端先获取第一数量和第二数量,然后计算第一数量和第二数量的数量总和,得到总样本数量。终端预先建立有不同总样本数量对应的数值区间,与不同预设次数之间的关联关系,且数值区间对应的数值越大,其关联的预设次数越小。如当总样本数量为[1200,1500)时,则其关联的预设次数为5次;当总样本数量为[1500,1800)时,则其关联的预设次数为4次;当总样本数量为[1800,+∞)时,则其关联的预设次数为3次。当终端计算得到总样本数量后,则可以根据该总样本数量查询其所属的数值区间,并将查询得到的数值区间关联的预设次数。这样,根据总样本数量来来确定预设次数,这样当总样本数量较多时,可以减少模型训练的循环步骤(从而减少模型训练的总过程所需的总训练样本的数量),反之则增加模型训练的循环步骤,以提高训练金银花识别模型的效率,同时还可以训练模型所需的标注样本的数量适宜,以达到进一步减少所需标注样本的数量的目的。
可选的,当终端检测到所述循环轮次小于预设次数时,则判定主网络模块并未训练完成,并返回执行所述获取多个第一样本的步骤,再依次执行步骤S30、S60-S63,在现有的已学习得到的模型参数的基础上,对半监督自训练模型进行更进一步的训练,以提高模型的精度。
可选的,当终端检测到所述循环轮次大于或等于预设次数时,则判定所述主网络模块已经训练完成。这样训练得到的主网络模块,不仅所需使用的人工标注的样本少,可以节省大量人工标注的成本,而且模型精度更高。
在一实施例中,通过采用半监督自训练的方式,利用已标注的样本和未标注的样本联合进行模型训练,并实现在训练过程中自动对未标注的样本进行标注,以及为其分配适合的损坏权重,从而减少训练所需的已标注的样本的数量,且还能得到准确率高的主网络模块,进而得到准确率高的金银花识别模型。
在一实施例中,在上述实施例基础上,所述利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块的步骤之后,还包括:
步骤S70、根据各个所述第三样本对应的金银花类别,确定各个所述第三样本对应的所述子网络模块;
步骤S71、利用各个所述第三样本对应的所述子网络模块,预测各个所述第三样本对应的金银花等级和第二预测概率;
步骤S72、根据各个所述第三样本对应的所述金银花等级和所述第二预测概率,将各个所述第三样本标注为第四样本;
步骤S73、基于各个所述子网络模块对应的所述第四样本和所述第一样本,对各个所述子网络模块进行训练更新。
本实施例中,所述深度学习模型为半监督自训练模型。
可选的,当终端利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,得到各个训练后的子网络模块之后,以及当终端基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新之后(即步骤S40和步骤S63均执行之后),则终端根据各第三样本对应的金银花类别,确定各个第三样本对应的子网络模块,然后将各个第三样本输入到对应的子网络模块中进行分析。
然后,各个子网络模块会基于之前利用学习得到的可识别金银花图像所属金银花等级的能力,依次对输入到各个子网络模块中的第三样本进行分析预测,得到各个第三样本对应的金银花图像的金银花等级,并相应输出预测各个第三样本对应的金银花等级的置信值,且各个第三样本对应的置信值即可作为各个第三样本对应的第二预测概率(即预测第三样本对应的金银花图像,属于其预测得到的金银花等级的概率)。这样,终端即可得到多个第三样本对应的金银花等级和第二预测概率。
进一步地,在终端得到所有第三样本对应的金银花等级和第二预测概率后,即根据各个第三样本对应的金银花等级和第二预测概率,对各个第三样本进行标注,从而在各个第三样本对应的金银花图像中,自动标注出相应的金银花等级和第二预测概率,进而将多个第三样本相应标注为多个第四样本。
可选的,当终端得到多个第四样本后,则利用各个子网络模块对应的第一样本和第四样本,对各个子网络模块进行训练更新,并使子网络模块在多次迭代更新后重新达到收敛,或者使子网络模块进行预设训练次数的迭代。其中,所述预设训练次数可以根据实际情况需要设置,如取值范围可为500次-2000次。
其中,子网络模块在基于训练数据集中的每个样本进行训练更新的过程中,会先检测每个样本属于第一样本,还是属于第四样本。
可选的,当子网络模块检测到当前使用的样本为第一样本时,则直接使用模型初始设定的损失(loss)权重(如1.0)作为该样本对应的损失权重,并基于该损失权重利用该样本进行训练。
可选的,当子网络模块检测到当前使用的样本为第四样本时,则会读取第四样本对应的第二预测概率,并根据读取到的第二预测概率,确定该第四样本对应的损失权重,并基于该损失权重利用该第四样本进行训练。
其中,子网络模块可以是将第四样本对应的第二预测概率,直接作为第四样本对应的损失权重;或者,子网络模块将第四样本对应的第二预测概率,与模型初始设定的损失权重进行相乘后,将得到的乘积作为第四样本对应的损失权重。
需要说明的是,当利用第三样本对主网络模块进行训练更新时,主网络模块同样会提取第三样本对应的第一图像特征,并将提取得到的第一图像特征与第三样本关联,且当第三样本转换为第四样本时,第四样本依然关联有第一图像特征。而当利用四样本对子网络模块进行训练更新时,子网络模块同样会提取第四样本对应的第二图像特征,并将提取得到的第二图像特征与第四样本对应的第一图像特征进行融合,得到第三图像特征后,再基于第三图像特征对子网络模块进行训练优化。
这样,通过采用半监督自训练的方式,利用已标注的样本和未标注的样本联合进行模型训练,并实现在训练过程中自动对未标注的样本进行标注,以及为其分配适合的损坏权重,从而减少训练所需的已标注的样本的数量,且还能得到准确率高的子网络模块,进而得到准确率高的金银花识别模型。
在一实施例中,在上述实施例基础上,
所述利用所有所述第一样本对所述主网络模块进行训练的步骤包括:
步骤S31、将所有所述第一样本按预设比例划分为训练集、验证集和测试集;
步骤S32、利用所述训练集对所述主网络模块进行多次迭代训练;
步骤S33、利用所述验证集对多次迭代训练后的所述主网络模块进行优化;
步骤S34、利用所述测试集对优化后的所述主网络模块进行测试;
步骤S35、当检测到所述主网络模块通过所述测试时,判定所述主网络模块训练结束;以及,
步骤S36、当检测到所述主网络模块未通过所述测试时,返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤。
本实施例中,终端在利用所有第一样本训练主网络模块时,先将所有第一样本按预设比例划分为训练集、验证集和测试集,其中,所述预设比例可以是训练集:验证集:测试集=8:1:1。
而且,针对每个金银花类别的第一样本,都可按照8:1:1的预设比例,将同一等级的第一样本划分为训练集、验证集和测试集三个集合,然后再分别组合所有金银花类别对应的训练集作为同一训练集、组合所有金银花类别对应的验证集作为同一验证集、所有金银花类别对应的测试集作为同一测试集。
当终端将所有第一样本划分为训练集、验证集和测试集三个集合后,则先将训练集中的第一样本输入到主网络模块进行多次迭代训练,以尽可能地训练主网络模块的模型参数。
可选的,当终端检测到主网络模块迭代训练的次数达到预设训练次数时,再利用验证集中的第一样本优化主网络模块的模型参数。其中,验证集中的第一样本,可以是用于寻找主网络模块的最优的网络深度(number of hidden layers),或者决定反向传播算法的停止点或者在网络中选择隐藏层神经元的数量,从而达到对主网络模块的模型参数进行优化的目的。
总的来说,验证集用于调整并优化主网络模块的超参数,并可多次使用,以不断调参。需要说明的是,超参数是在开始学习过程之前,模型的设置值的参数,而不是通过训练得到的参数数据;通过对超参数进行优化,让模型选出一组最优超参数,以提高模型学习的性能和效果。
可选的,当终端利用验证集对主网络模块进行优化后,再进一步利用测试集中的第一样本测试主网络模块是否满足预设条件,以对主网络模块进行测试,从而验证主网络模块是否达到收敛。
其中,所述预设条件可以是预先设定的主网络模块对应的模型性能所需达到的目标值;如模型输出的最高置信值的分析结果,其对应的置信值不低于预设阈值(预设阈值的取值范围可以是80%-95%);如模型输出的分析结果与真实结果之间的误差不高于预设误差(如预设误差的取值范围可为1%-5%)。应当理解的是,用于测试主网络模块是否满足预设条件的分析结果,是主网络模块根据测试集中的第一样本分析得到的。
可选的,当终端检测到主网络模块不满足预设条件时,则判定所述主网络模块未通过所述测试时,返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤,通过再次执行步骤S32-S33,以再次对主网络模块进行优化。
可选的,当终端检测到返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤满足预设条件时,则判定返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤通过所述测试,因此此时终端即可判定所述主网络模块训练结束(即判定所述主网络模块达到收敛),并进入一下步骤执行所述S40。
这样,可以优化主网络模块的精度,以便于后续可以基于主网络模块得到准确率高的金银花识别模型。
在一实施例中,在上述实施例基础上,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
步骤S80、将训练完成的所述金银花识别模型对应的模型参数从浮点型转换为预设位数的整型,以对训练完成的所述金银花识别模型进行量化压缩;
步骤S81、将压缩后的所述金银花识别模型对应的调用过程编译为动态链接库;
步骤S82、根据所述动态链接库,生成压缩后的所述金银花识别模型对应的移动端应用。
本实施例中,当终端训练得到金银花识别模型后,则将训练完成的金银花识别模型对应的模型参数,从浮点型转换为预设位数的整型,以对所述金银花识别模型进行量化压缩。其中,所述预设位数可为8位。
可选的,以金银花识别模型原来对应的模型参数为32位的浮点型(即32位的浮点数)为例,将模型参数由32位的浮点型转换为8位的整型(即8位的整数),并在此基础上对所述金银花识别模型进行量化压缩,将训练完成的金银花识别模型转变为量化识别模型,即压缩后的金银花识别模型属于量化识别模型。
由于原金银花识别模型中的模型参数是浮点数类型,利用普通的压缩算法很难压缩模型的空间,对模型进行量化处理就是让32位的浮点数近似地用8位的整数存储和计算,量化后,模型占用存储空间会减小75%。其中,量化处理后可以使得模型占用存储空间减小,同时可以加快运算速度。
可选的,终端可以通过安装Bazel和下载tensorflow1.14源码来实现对金银花识别模型进行量化,以及模型压缩处理。
需要说明的是,Bazel是Google的一款可再生的代码构建工具,它主要是用于处理大规模数据构建问题、共享代码库问题和从源代码构建的软件的相关问题。
可选的,终端预先下载有tensorflow1.14的C++动态链接库,而工程师基于C++动态链接库预先在终端上编写有cmake项目工程构建文件。当终端将金银花识别模型进行量化压缩后,可以通过执行cmake项目工程构建文件,将压缩后的金银花识别模型对应的调用过程编译为动态链接库。
进一步地,当终端得到压缩后的金银花识别模型对应的动态链接库后,则根据所述动态链接库,生成压缩后的所述金银花识别模型对应的移动端应用。当然,在生成移动端应用的过程中,所使用的UI(User Interface)设计和应用架构,可以是相关工程师预先以应用模板的形式部署在终端的,终端执行将相应的动态链接库整合到应用模板中,即可生成压缩后的所述金银花识别模型对应的移动端应用(以下简称金银花识别APP(Application))。
可选的,终端在得到金银花识别APP后,可以将金银花识别APP上传到云端供各移动设备下载。当用户将压缩后的金银花识别APP下载并安装到移动设备后,则可以利用移动设备进行金银花图像的分级。
例如,用户可以取适量的金银花平铺于背景干净的桌布上,然后打开金银花识别APP调用移动设备的摄像头,现场拍摄金银花图像作为目标图像,当金银花识别APP得到目标图像后,就会自动对目标图像进行分析识别,从而识别出目标图像对应的金银花等级。
这样,通过将金银花识别模型进行量化压缩后,生成相应的移动端应用,从而方便用户将金银花识别模型部署到移动设备上,并方便用户随时随地都可以利用金银花识别模型对金银花图像进行分级,过程十分简单快捷,增加了金银花识别模型的可移植性,以及提高了用户使用金银花识别模型的灵活性。
在一实施例中,在上述实施例基础上,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
步骤S90、接收到目标图像时,利用训练完成的所述金银花识别模型预测所述目标图像对应的金银花类别和金银花等级,得到预测结果,并输出所述预测结果;
步骤S91、当检测到在输出所述预测结果后的预设时长之内,未接收到所述预测结果的否定响应时,根据所述目标图像和所述预测结果生成训练样本;
步骤S92、利用所述训练样本更新所述金银花识别模型。
本实施例中,当终端接收到待识别的目标图像(即待分级的金银花图像)时,则将目标图像输入到金银花识别模型中进行分析,并由金银花识别模型中的主网络模块识别得到目标图像对应的金银花类别后,根据目标图像对应的金银花类别,匹配对应的子网络模块,然后利用匹配得到的子网络模块识别目标图像对应的金银花等级,以完成对目标图像进行自动分级过程。
当然,金银花识别模型输出的目标图像对应的预测结果(或称分级结果),除了目标图像对应的金银花等级外,还可以包括目标图像对应的金银花类别。
可选的,当金银花识别模型识别得到目标图像对应的金银花等级和金银花类别后,可以将识别得到的金银花等级和金银花类别作为预测结果输出至终端。
进一步地,终端得到目标图像对应的预测结果后,可以将预测结果进行显示输出,或输出至与终端关联的关联设备中,以便于相关工作人员基于预测结果对该目标图像对应的金银花药材进行分级归类。
可选的,终端检测在输出预测结果之后的预设时长内,是否接收到预测结果对应的否定响应。其中,当相关工作人员发现预测结果有误时,可以通过关联设备或终端提供的控制面板向终端发送预测结果的否定响应;所述预设时长可以根据实际情况需要,如设置为1分钟、3分钟、5分钟等。
可选的,当终端在输出所述预测结果后的预设时长之内,接收到所述预测结果的否定响应时,则将当前金银花识别模型重新更新为未训练完成的金银花识别模型,并基于此返回执行步骤S10,在现有模型的基础上重新对金银花识别模型训练更新。
可选的,当终端在输出所述预测结果后的预设时长之内,未接收到所述预测结果的否定响应时,则根据所述目标图像和所述预测结果生成训练样本,即利用所述预测结果标注所述目标图像,得到所述金银花识别模型的训练样本。
进一步地,当终端检测到金银花识别模型处于空闲状态时,则可以利用新生成的训练样本对金银花识别模型进行训练更新,以优化金银花识别模型的模型参数。
这样,可以提高金银花识别模型识别金银花图像对应的金银花等级的准确率。
在一实施例中,在上述实施例基础上,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
步骤S100、将训练完成的所述金银花识别模型存储至区块链网络。
本实施例中,终端与区块链网络(Blockchain Network)建立有通信连接。区块链网络是通过共识的方式将新区块纳入区块链的一系列的节点的集合。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
可选的,当终端得到训练完成的金银花识别模型后,则可以将金银花识别模型上传至区块链网络进行存储。
这样,不仅可以提高金银花识别模型存储的安全性和节约本地存储空间,而且还可以方便各医院系统从区块链模块中获取金银花识别模型,以快速将金银花识别模型投入到实际应用中。各医院系统只需接入到任一区块链网络节点,即可获取得到同一金银花识别模型,十分方便高效。
而且当终端即为任一医院系统时,当任一医院系统本地的金银花识别模型有更新时,该医院系统即可将更新后的金银花识别模型(或者只上传更新部分的模型参数即可)同步更新到区块链网络中,使得金银花识别模型的性能可以得到更好的优化。
参照图2,本申请实施例中还提供一种金银花识别模型的训练装置10,包括:
获取模块11,用于获取多个第一样本,其中,所述第一样本为标注有金银花类别和金银花等级的金银花图像,每个所述金银花类别包括多个所述金银花等级,且每个所述金银花等级对应的所述第一样本的数量有多个;以及,
构建模块12,用于基于深度学习模型构建金银花识别模型,所述金银花识别模型包括主网络模块,以及多个子网络模块;
第一训练模块13,用于利用所有所述第一样本对所述主网络模块进行训练,其中,所述主网络模块用于提取所述第一样本对应的第一图像特征,并基于所述第一图像特征训练所述主网络模块识别所述金银花图像对应的金银花类别的能力;
第二训练模块14,用于利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,其中,所述子网络模块用于提取所述第一样本对应的第二图像特征,以及将所述第二图像特征与所述第一图像特征进行融合,得到第三图像特征,并基于所述第三图像特征训练所述子网络模块识别所述金银花图像对应的金银花等级的能力;
检测模块15,用于检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储金银花识别模型的训练方法的相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种金银花识别模型的训练方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
此外,本申请还提出一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的金银花识别模型的训练方法的步骤。可以理解的是,本实施例中的计算机可读存储介质可以是易失性可读存储介质,也可以为非易失性可读存储介质。
综上所述,为本申请实施例中提供的金银花识别模型的训练方法、金银花识别模型的训练装置、计算机设备和存储介质,通过分别训练金银花识别模型中用于识别金银花类别的主网络模块,以及用于识别各金银花类别下的金银花等级的子网络模块,并将主网络模块和子网络模块对应的特征提取结果进行特征融合,以优化子网络模块对应的模型参数,从而减少训练金银花识别模型所需的已标注的样本的数量的同时,还能得到准确率高的金银花识别模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (9)

1.一种金银花识别模型的训练方法,其特征在于,包括:
获取多个第一样本,其中,所述第一样本为标注有金银花类别和金银花等级的金银花图像,每个所述金银花类别包括多个所述金银花等级,且每个所述金银花等级对应的所述第一样本的数量有多个;以及,
基于深度学习模型构建金银花识别模型,所述金银花识别模型包括主网络模块,以及多个子网络模块;
利用所有所述第一样本对所述主网络模块进行训练,其中,所述主网络模块用于提取所述第一样本对应的第一图像特征,并基于所述第一图像特征训练所述主网络模块识别所述金银花图像对应的金银花类别的能力;
利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,其中,所述子网络模块用于提取所述第一样本对应的第二图像特征,以及将所述第二图像特征与所述第一图像特征进行融合,得到第三图像特征,并基于所述第三图像特征训练所述子网络模块识别所述金银花图像对应的金银花等级的能力;
检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成;
所述利用所有所述第一样本对所述主网络模块进行训练的步骤包括:
将所有所述第一样本按预设比例划分为训练集、验证集和测试集;
利用所述训练集对所述主网络模块进行多次迭代训练;
利用所述验证集对多次迭代训练后的所述主网络模块进行优化;
利用所述测试集对优化后的所述主网络模块进行测试;
当检测到所述主网络模块通过所述测试时,判定所述主网络模块训练结束;
当检测到所述主网络模块未通过所述测试时,返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤;
其中,所述验证集用于调整并优化所述主网络模块的超参数,并可多次使用,所述超参数是在开始学习过程之前,模型的设置值的参数。
2.如权利要求1所述的金银花识别模型的训练方法,其特征在于,所述利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块的步骤之前,还包括:
获取多个第二样本,所述第二样本为未标注的金银花图像;
利用训练后的所述主网络模块对多个所述第二样本进行分析,以预测多个所述第二样本对应的金银花类别和第一预测概率;
根据各个所述第二样本对应的所述金银花类别和所述第一预测概率,将各个所述第二样本标注为第三样本;
基于所有所述第三样本和所有所述第一样本,对训练后的所述主网络模块进行训练更新。
3.如权利要求2所述的金银花识别模型的训练方法,其特征在于,所述利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块的步骤之后,还包括:
根据各个所述第三样本对应的金银花类别,确定各个所述第三样本对应的所述子网络模块;
利用各个所述第三样本对应的所述子网络模块,预测各个所述第三样本对应的金银花等级和第二预测概率;
根据各个所述第三样本对应的所述金银花等级和所述第二预测概率,将各个所述第三样本标注为第四样本;
基于各个所述子网络模块对应的所述第四样本和所述第一样本,对各个所述子网络模块进行训练更新。
4.如权利要求1-3中任一项所述的金银花识别模型的训练方法,其特征在于,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
将训练完成的所述金银花识别模型对应的模型参数从浮点型转换为预设位数的整型,以对训练完成的所述金银花识别模型进行量化压缩;
将压缩后的所述金银花识别模型对应的调用过程编译为动态链接库;
根据所述动态链接库,生成压缩后的所述金银花识别模型对应的移动端应用。
5.如权利要求1-3中任一项所述的金银花识别模型的训练方法,其特征在于,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
接收到目标图像时,利用训练完成的所述金银花识别模型预测所述目标图像对应的金银花类别和金银花等级,得到预测结果,并输出所述预测结果;
当检测到在输出所述预测结果后的预设时长之内,未接收到所述预测结果的否定响应时,根据所述目标图像和所述预测结果生成训练样本;
利用所述训练样本更新所述金银花识别模型。
6.如权利要求1-3中任一项所述的金银花识别模型的训练方法,其特征在于,所述检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成的步骤之后,还包括:
将训练完成的所述金银花识别模型存储至区块链网络。
7.一种金银花识别模型的训练装置,其特征在于,包括:
获取模块,用于获取多个第一样本,其中,所述第一样本为标注有金银花类别和金银花等级的金银花图像,每个所述金银花类别包括多个所述金银花等级,且每个所述金银花等级对应的所述第一样本的数量有多个;以及,
构建模块,用于基于深度学习模型构建金银花识别模型,所述金银花识别模型包括主网络模块,以及多个子网络模块;
第一训练模块,用于利用所有所述第一样本对所述主网络模块进行训练,其中,所述主网络模块用于提取所述第一样本对应的第一图像特征,并基于所述第一图像特征训练所述主网络模块识别所述金银花图像对应的金银花类别的能力;
第二训练模块,用于利用各个所述金银花类别对应的所述第一样本,分别训练各个所述子网络模块,其中,所述子网络模块用于提取所述第一样本对应的第二图像特征,以及将所述第二图像特征与所述第一图像特征进行融合,得到第三图像特征,并基于所述第三图像特征训练所述子网络模块识别所述金银花图像对应的金银花等级的能力;
检测模块,用于检测到所述主网络模块和所有所述子网络模块均训练完成时,判定所述金银花识别模型训练完成;
所述第一训练模块用于利用所有所述第一样本对所述主网络模块进行训练,具体地,将所有所述第一样本按预设比例划分为训练集、验证集和测试集;利用所述训练集对所述主网络模块进行多次迭代训练;利用所述验证集对多次迭代训练后的所述主网络模块进行优化;利用所述测试集对优化后的所述主网络模块进行测试;当检测到所述主网络模块通过所述测试时,判定所述主网络模块训练结束;当检测到所述主网络模块未通过所述测试时,返回执行所述利用所述训练集对所述主网络模块进行多次迭代训练的步骤;其中,所述验证集用于调整并优化所述主网络模块的超参数,并可多次使用,所述超参数是在开始学习过程之前,模型的设置值的参数。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的金银花识别模型的训练方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的金银花识别模型的训练方法的步骤。
CN202110413863.1A 2021-04-16 2021-04-16 金银花识别模型的训练方法、装置、计算机设备及介质 Active CN113065605B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110413863.1A CN113065605B (zh) 2021-04-16 2021-04-16 金银花识别模型的训练方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110413863.1A CN113065605B (zh) 2021-04-16 2021-04-16 金银花识别模型的训练方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN113065605A CN113065605A (zh) 2021-07-02
CN113065605B true CN113065605B (zh) 2022-12-20

Family

ID=76567186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110413863.1A Active CN113065605B (zh) 2021-04-16 2021-04-16 金银花识别模型的训练方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN113065605B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766418A (zh) * 2017-09-08 2018-03-06 广州汪汪信息技术有限公司 一种基于融合模型的信用评估方法、电子设备和存储介质
CN108734708B (zh) * 2018-05-23 2021-02-19 平安科技(深圳)有限公司 胃癌识别方法、装置及存储介质
CN110457675B (zh) * 2019-06-26 2024-01-19 平安科技(深圳)有限公司 预测模型训练方法、装置、存储介质及计算机设备
CN110889463A (zh) * 2019-12-10 2020-03-17 北京奇艺世纪科技有限公司 一种样本标注方法、装置、服务器及机器可读存储介质
CN111860253A (zh) * 2020-07-10 2020-10-30 东莞正扬电子机械有限公司 一种驾驶场景的多任务属性识别方法、装置、介质及设备
CN112633276B (zh) * 2020-12-25 2024-06-21 北京百度网讯科技有限公司 训练方法、识别方法、装置、设备、介质

Also Published As

Publication number Publication date
CN113065605A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
WO2021139252A1 (zh) 运维故障根因识别方法、装置、计算机设备和存储介质
CN112527630A (zh) 测试用例生成方法、装置、计算机设备和存储介质
CN112329865A (zh) 基于自编码器的数据异常识别方法、装置和计算机设备
CN111950622B (zh) 基于人工智能的行为预测方法、装置、终端及存储介质
CN113221960B (zh) 一种高质量漏洞数据收集模型的构建方法及收集方法
CN111831908A (zh) 医疗领域知识图谱构建方法、装置、设备及存储介质
CN112132776A (zh) 基于联邦学习的视觉检测方法及系统、存储介质、设备
CN113918526A (zh) 日志处理方法、装置、计算机设备和存储介质
CN111897695A (zh) 获取kpi异常数据样本的方法、装置和计算机设备
CN111506710A (zh) 基于谣言预测模型的信息发送方法、装置和计算机设备
CN113327037A (zh) 基于模型的风险识别方法、装置、计算机设备和存储介质
CN118153016B (zh) 基于人工智能的鉴权系统
CN113986581A (zh) 数据聚合处理方法、装置、计算机设备和存储介质
CN113010420A (zh) 一种促进测试代码与产品代码协同演化的方法及终端设备
CN114978968A (zh) 微服务的异常检测方法、装置、计算机设备和存储介质
CN114817055A (zh) 基于接口的回归测试方法、装置、计算机设备和存储介质
CN117932381A (zh) 一种非侵入式需求侧资源软量测生成方法及装置
CN113065605B (zh) 金银花识别模型的训练方法、装置、计算机设备及介质
CN117078007A (zh) 一种融合尺度标签的多尺度风控系统及其方法
Ji et al. Dynamic Multi-Context Attention Networks for Citation Forecasting of Scientific Publications
CN113064997B (zh) 基于bert模型的意图分析方法、装置、设备及介质
CN115499164A (zh) 一种基于图神经网络的多特征融合区块链智能合约漏洞检测方法、装置、计算机及存储介质
CN115712855A (zh) 一种基于自学习的标签规则产生方法及装置
CN114238768A (zh) 资讯信息的推送方法、装置、计算机设备和存储介质
CN114021664A (zh) 一种基于区块链的意图识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant