CN114399683A - 一种基于改进yolov5的端到端半监督目标检测方法 - Google Patents

一种基于改进yolov5的端到端半监督目标检测方法 Download PDF

Info

Publication number
CN114399683A
CN114399683A CN202210053449.9A CN202210053449A CN114399683A CN 114399683 A CN114399683 A CN 114399683A CN 202210053449 A CN202210053449 A CN 202210053449A CN 114399683 A CN114399683 A CN 114399683A
Authority
CN
China
Prior art keywords
data
loss
model
enhanced
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210053449.9A
Other languages
English (en)
Other versions
CN114399683B (zh
Inventor
杨帆
况易田
胡建国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhenshi Intelligent Technology Co Ltd
Original Assignee
Nanjing Zhenshi Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhenshi Intelligent Technology Co Ltd filed Critical Nanjing Zhenshi Intelligent Technology Co Ltd
Priority to CN202210053449.9A priority Critical patent/CN114399683B/zh
Publication of CN114399683A publication Critical patent/CN114399683A/zh
Application granted granted Critical
Publication of CN114399683B publication Critical patent/CN114399683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于改进yolov5的端到端半监督目标检测方法,涉及目标检测技术领域,解决了现有目标检测较为复杂且伪标签限制模型精度提升的技术问题,其技术方案要点是对yolov5的数据加载部分进行修改,以支持在训练过程中同时加载标注数据和未标注数据;将使用ema算法更新的模型作为教师模型,使用动态阈值的方式,生成伪标签;对yolov5的损失进行了修改,分为监督损失和无监督损失,并使用难例挖掘策略对无监督损失部分进行优化。整个流程更加简单,伪标签在训练过程中能越来越精确,帮助检测器达到更好的性能,具有更快的推理速度,可以达到实时性要求。

Description

一种基于改进yolov5的端到端半监督目标检测方法
技术领域
本申请涉及目标检测技术领域,尤其涉及一种基于改进yolov5的端到端半监督目标检测方法。
背景技术
当前主流的半监督目标检测方法大多是多阶段的,多阶段指的是首先使用有标注数据训练一个初始的全监督模型,然后再通过该模型处理未标注数据,得到高置信度的结果作为未标注数据的伪标签,最后将有标注数据和带有伪标签的未标注数据输入给模型进行训练。整个过程比较复杂,并且伪标签是采用离线生成的方式,即在训练过程中不会更新。这样的模式存在的一个问题是,当训练的模型精度逐步提升,超过原本的模型,继续使用原来模型生成的伪标签会限制模型精度进一步提升;并且目前大多数半监督目标检测方法是基于Faster-RCNN的,它是一个two-stage目标检测方法,存在着检测速度比较慢的问题,不能满足实时性要求。
发明内容
本申请提供了一种基于改进yolov5的端到端半监督目标检测方法,其技术目的是使目标检测的流程更简单,且伪标签在训练过程中能越来越精确,使得检测器达到更好的性能。
本申请的上述技术目的是通过以下技术方案得以实现的:
一种基于改进yolov5的端到端半监督目标检测方法,包括:
S1:创建数据集,并对yolov5网络的学生模型和教师模型进行初始化;其中,所述数据集包括标注数据和未标注数据,将所述标注数据划分为训练集和测试集;
S2:yolov5网络对标注数据和未标注数据分别进行加载,然后对训练集中的标注数据进行强数据增强,得到第一增强标注数据;对所述未标注数据分别进行强数据增强和弱数据增强,分别得到第一增强未标注数据和第二增强未标注数据;
S3:将第一增强标注数据和第一增强未标注数据输入到所述学生模型进行训练,得到第一增强标注数据和第一增强未标注数据在学生模型上的输出;
S4:将第二增强未标注数据输入到教师模型进行推理,根据阈值T生成所述第二增强未标注数据的伪标签,并转化为第一增强未标注数据的伪标签;
S5:对带标签的所述第一增强标注数据和带伪标签的所述第一增强未标注数据分别计算损失,分别得到监督损失和无监督损失,计算所述监督损失和所述无监督损失的加权和,得到总损失;
S6:通过总损失对所述学生模型进行更新,得到更新后的学生模型;
S7:更新后的学生模型再通过ema算法对所述教师模型进行更新,得到更新后的教师模型;
S8:通过所述测试集对更新后的学生模型和教师模型进行测试,获取测试结果;
S9:重复步骤S3至步骤S8,选取测试结果最好的模型作为目标模型;
S10:通过所述目标模型对目标进行检测。
本申请的有益效果在于:本申请对yolov5的数据加载部分进行了修改,以支持在训练过程中同时加载标注数据和未标注数据;将使用ema算法更新的模型作为教师模型,使用动态阈值的方式,生成伪标签;对yolov5的损失进行了修改,分为监督损失和无监督损失,并使用难例挖掘策略对无监督损失部分进行优化。
本申请是一个端到端的过程,整个流程更加简单,伪标签在训练过程中能越来越精确,帮助检测器达到更好的性能。而且对比传统基于Faster-RCNN的半监督目标检测方法,使用yolov5具有更快的推理速度,可以达到实时性要求。
附图说明
图1为本申请所述方法的流程图;
图2为本申请所述方法的训练流程图。
具体实施方式
下面将结合附图对本申请技术方案进行详细说明。
图1为本申请所述方法的流程图,如图1所示,基于改进yolov5的端到端半监督目标检测方法包括:
S1:创建数据集,并对yolov5网络的学生模型和教师模型进行初始化;其中,所述数据集包括标注数据和未标注数据,将所述标注数据划分为训练集和测试集。
S2:yolov5网络对标注数据和未标注数据分别进行加载,然后对训练集中的标注数据进行强数据增强,得到第一增强标注数据;对所述未标注数据分别进行强数据增强和弱数据增强,分别得到第一增强未标注数据和第二增强未标注数据。
原始的yolov5模型只有一个dataloader(数据加载器)进行数据加载,输出数据增强后的图片和其对应的标注。本申请中增加一个dataloader负责对未标注数据进行加载,未标注数据加载后,分别对其进行弱数据增强和强数据增强,得到对应增强后的图片和对应的数据增强变换矩阵。其中弱数据增强是指图片缩放、左右翻转等对图像变化较小的增强方式,而强数据增强是指诸如图片旋转、平移、错切、颜色空间变换等对图像变化较大的增强方式,数据增强变换矩阵记录了图像由原图变换到增强后的图片的变换过程。修改完成之后,在训练过程中就可以创建两个dataloader对标注数据和未标注数据进行加载。
S3:将第一增强标注数据和第一增强未标注数据输入到所述学生模型进行训练,得到第一增强标注数据和第一增强未标注数据在学生模型上的输出。
S4:将第二增强未标注数据输入到教师模型进行推理,根据阈值T生成所述第二增强未标注数据的伪标签,并转化为第一增强未标注数据的伪标签。
具体地,本申请采用了一种分段函数的形式来动态设置阈值:
Figure BDA0003475323560000031
其中,T表示生成伪标签的阈值,Tmin表示设定的最小初始阈值,epoch表示当前训练的轮数,e1表示设定阈值开始变化的轮数,Tmax表示设定的最大阈值,t表示阈值每次更新的幅度。
S5:对带标签的所述第一增强标注数据和带伪标签的所述第一增强未标注数据分别计算损失,分别得到监督损失和无监督损失,计算所述监督损失和所述无监督损失的加权和,得到总损失。
具体地,对有标注数据和带有伪标注的未标注数据分别计算loss,得到对应的监督损失和无监督损失,最终损失是监督损失和无监督损失的加权和,具体如下:L=Ls+βLu,其中L为总损失,Ls表示监督损失,Lu表示无监督损失,β为超参数,用来控制无监督损失的权重。其中,监督损失依旧是按照yolov5原始对标注数据的处理进行计算;无监督损失的计算会进行优化,因为直接使用伪标签的话,会存在将一些需要检测的目标优化成背景的问题,所以对yolov5网络损失计算中的obj_loss(目标损失)进行优化。yolov5网络中的obj_loss分为前景obj_loss和背景obj_loss,总的obj_loss是两部分的和。对于背景obj_loss的计算,原始yolov5网络是会计算所有被分配为背景的anchors(框)的obj_loss,现在加入难例挖掘策略,只选出其中预测值与目标偏差最大的前n%数量的anchors(框)进行计算,n为训练过程中的超参数,在0到100之间。由于在yolov5网络中obj_loss是使用二元交叉熵损失计算的,所以对于目标为背景的情况,预测值与目标偏差的衡量方式是对预测值进行由大到小排序,预测值大的,偏差就大。
无监督损失包括cls_loss、box_loss和obj_loss,通过难例挖掘策略对obj_loss进行优化,包括:
Figure BDA0003475323560000032
其中,
Figure BDA0003475323560000033
表示未标注数据的obj_loss损失,lobj表示obj的损失函数,P表示伪标签集合,afg和abg_sel分别表示前景框和难例挖掘后的背景框,
Figure BDA0003475323560000034
Figure BDA0003475323560000035
分别表示afg和abg_sel的数量。
S6:通过总损失对所述学生模型进行更新,得到更新后的学生模型。
S7:更新后的学生模型再通过ema算法对所述教师模型进行更新,得到更新后的教师模型。
yolov5网络使用ema(指数移动平均)算法更新的模型作为教师模型使用动态阈值生成伪标签是指:将训练过程中优化的模型,也就是学生模型,使用ema算法更新的模型作为教师模型,给教师模型输入未标注数据进行弱数据增强后的图像,根据设定的阈值,生成伪标签,提供给学生模型进行训练。学生模型输入的是对应未标注数据进行强增强后的图像,将教师模型在弱数据增强的图像上生成的伪标签通过变换矩阵,可以得到在强数据增强的图像上对应的伪标签。生成伪标签的阈值设置很重要,如果设置太高,会导致训练初期没有伪标签生成,未标注数据都作为背景优化,会导致网络很难训练起来;如果设置太低,会导致大量误检被设置成伪标签,对网络训练也不利。
ema算法是指网络在训练过程中,对学生模型权重进行指数移动平均来得到教师模型,具体公式如下:WT=αWT+(1-α)WS,其中WT表示教师模型的权重,WS表示学生模型的权重,α是设定的超参数,在0到1之间。初始训练时教师模型与学生模型保持一致,然后在训练过程中每次迭代教师模型按照上述公式进行更新。
S8:通过所述测试集对更新后的学生模型和教师模型进行测试,获取测试结果。
S9:重复步骤S3至步骤S8,选取测试结果最好的模型作为目标模型。
S10:通过所述目标模型对目标进行检测。
为了更充分的理解本申请,以下通过具体实施例对本申请作详细阐述。首先对yolov5网络作出修改,给yolov5网络增加一个数据加载器,构造yolov5网络模型,然后初始化学生模型和教师模型。然后如图2所示,对训练集中的标注数据进行强数据增强,得到第一增强标注数据;对未标注数据分别进行强数据增强和弱数据增强,分别得到第一增强未标注数据和第二增强未标注数据。
将第一增强标注数据和第一增强未标注数据输入到初始化后的学生模型进行训练,得到第一增强标注数据和第一增强未标注数据在学生模型上的输出。将第二增强未标注数据输入到初始化后的教师模型进行推理,根据阈值生成第二增强未标注数据的伪标签,并转化为第一增强未标注数据的伪标签。
对带标签的第一增强标注数据和带伪标签的第一增强未标注数据分别计算损失,分别得到监督损失和无监督损失,计算监督损失和无监督损失的加权和,得到总损失。通过总损失对学生模型进行更新,得到更新后的学生模型,更新后的学生模型再通过ema算法对教师模型进行更新,得到更新后的教师模型。最后,通过测试集对更新后的学生模型和教师模型进行测试,获取第一测试结果。
依次类推,将第一增强标注数据和第一增强未标注数据输入到更新后的学生模型进行训练,得到第一增强标注数据和第一增强未标注数据在更新学生模型上的输出。将第二增强未标注数据输入到更新后的教师模型进行推理,根据阈值生成第二增强未标注数据的伪标签,并转化为第一增强未标注数据的伪标签。再分别计算监督损失和无监督损失,继续对学生模型和教师模型进行更新,依旧通过测试集对二次更新后的学生模型和教师模型进行测试,获取第二测试结果。
不断更新迭代,得到多个测试结果,选择测试结果最好的模型作为目标检测的模型,并完成目标检测的目的。
以上为本申请示范性实施例,本申请的保护范围由权利要求书及其等效物限定。

Claims (4)

1.一种基于改进yolov5的端到端半监督目标检测方法,其特征在于,包括:
S1:创建数据集,并对yolov5网络的学生模型和教师模型进行初始化;其中,所述数据集包括标注数据和未标注数据,将所述标注数据划分为训练集和测试集;
S2:yolov5网络对标注数据和未标注数据分别进行加载,然后对训练集中的标注数据进行强数据增强,得到第一增强标注数据;对所述未标注数据分别进行强数据增强和弱数据增强,分别得到第一增强未标注数据和第二增强未标注数据;
S3:将第一增强标注数据和第一增强未标注数据输入到所述学生模型进行训练,得到第一增强标注数据和第一增强未标注数据在学生模型上的输出;
S4:将第二增强未标注数据输入到教师模型进行推理,根据阈值T生成所述第二增强未标注数据的伪标签,并转化为第一增强未标注数据的伪标签;
S5:对带标签的所述第一增强标注数据和带伪标签的所述第一增强未标注数据分别计算损失,分别得到监督损失和无监督损失,计算所述监督损失和所述无监督损失的加权和,得到总损失;
S6:通过总损失对所述学生模型进行更新,得到更新后的学生模型;
S7:更新后的学生模型再通过ema算法对所述教师模型进行更新,得到更新后的教师模型;
S8:通过所述测试集对更新后的学生模型和教师模型进行测试,获取测试结果;
S9:重复步骤S3至步骤S8,选取测试结果最好的模型作为目标模型;
S10:通过所述目标模型对目标进行检测。
2.如权利要求1所述的目标检测方法,其特征在于,所述步骤S4中,阈值T的范围包括:
Figure FDA0003475323550000011
其中,T表示生成伪标签的阈值,Tmin表示设定的最小初始阈值,epoch表示当前训练的轮数,e1表示设定阈值开始变化的轮数,Tmax表示设定的最大阈值,t表示阈值每次更新的幅度。
3.如权利要求2所述的目标检测方法,其特征在于,所述步骤S7中,ema算法包括:
WT=αWT+(1-α)WS
其中,WT表示教师模型的权重,WS表示学生模型的权重,α是设定的超参数,且α∈(0,1)。
4.如权利要求3所述的目标检测方法,其特征在于,所述步骤S5中,所述无监督损失包括cls_loss、box_loss和obj_loss,通过难例挖掘策略对obj_loss进行优化,包括:
Figure FDA0003475323550000012
其中,obj表示目标,
Figure FDA0003475323550000013
表示未标注数据的目标损失,lobj表示目标的损失函数,P表示伪标签集合,afg和abg_sel分别表示被分配为前景的框和被分配为背景的难例挖掘的框,
Figure FDA0003475323550000021
Figure FDA0003475323550000022
分别表示afg和abg_sel的数量。
CN202210053449.9A 2022-01-18 2022-01-18 一种基于改进yolov5的端到端半监督目标检测方法 Active CN114399683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210053449.9A CN114399683B (zh) 2022-01-18 2022-01-18 一种基于改进yolov5的端到端半监督目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210053449.9A CN114399683B (zh) 2022-01-18 2022-01-18 一种基于改进yolov5的端到端半监督目标检测方法

Publications (2)

Publication Number Publication Date
CN114399683A true CN114399683A (zh) 2022-04-26
CN114399683B CN114399683B (zh) 2024-06-25

Family

ID=81231677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210053449.9A Active CN114399683B (zh) 2022-01-18 2022-01-18 一种基于改进yolov5的端到端半监督目标检测方法

Country Status (1)

Country Link
CN (1) CN114399683B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882325A (zh) * 2022-07-12 2022-08-09 之江实验室 基于二阶段物体检测器的半监督物检测及训练方法、装置
CN115018852A (zh) * 2022-08-10 2022-09-06 四川大学 一种基于半监督学习的腹部淋巴结检测方法及装置
CN115082800A (zh) * 2022-07-21 2022-09-20 阿里巴巴达摩院(杭州)科技有限公司 图像分割方法
CN116304033A (zh) * 2023-02-27 2023-06-23 中国司法大数据研究院有限公司 一种基于半监督、双层多分类的诉请识别方法
CN116630745A (zh) * 2023-05-25 2023-08-22 中国科学院微小卫星创新研究院 用于图像的端到端半监督目标检测方法、装置和可读介质
CN117553808A (zh) * 2024-01-12 2024-02-13 中国民用航空飞行学院 基于深度学习的机器人定位导航方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052818A (zh) * 2020-09-15 2020-12-08 浙江智慧视频安防创新中心有限公司 无监督域适应的行人检测方法、系统及存储介质
CN112163450A (zh) * 2020-08-24 2021-01-01 中国海洋大学 基于s3d学习算法的高频地波雷达船只目标检测方法
CN112990342A (zh) * 2021-04-08 2021-06-18 重庆大学 一种半监督sar目标识别方法
US20210216825A1 (en) * 2020-01-09 2021-07-15 International Business Machines Corporation Uncertainty guided semi-supervised neural network training for image classification
CN113537040A (zh) * 2021-07-13 2021-10-22 南京理工大学 一种基于半监督学习的时序行为检测方法及系统
US20210357680A1 (en) * 2020-03-16 2021-11-18 Sas Institute Inc. Machine learning classification system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210216825A1 (en) * 2020-01-09 2021-07-15 International Business Machines Corporation Uncertainty guided semi-supervised neural network training for image classification
US20210357680A1 (en) * 2020-03-16 2021-11-18 Sas Institute Inc. Machine learning classification system
CN112163450A (zh) * 2020-08-24 2021-01-01 中国海洋大学 基于s3d学习算法的高频地波雷达船只目标检测方法
CN112052818A (zh) * 2020-09-15 2020-12-08 浙江智慧视频安防创新中心有限公司 无监督域适应的行人检测方法、系统及存储介质
CN112990342A (zh) * 2021-04-08 2021-06-18 重庆大学 一种半监督sar目标识别方法
CN113537040A (zh) * 2021-07-13 2021-10-22 南京理工大学 一种基于半监督学习的时序行为检测方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882325A (zh) * 2022-07-12 2022-08-09 之江实验室 基于二阶段物体检测器的半监督物检测及训练方法、装置
CN114882325B (zh) * 2022-07-12 2022-12-02 之江实验室 基于二阶段物体检测器的半监督物检测及训练方法、装置
CN115082800A (zh) * 2022-07-21 2022-09-20 阿里巴巴达摩院(杭州)科技有限公司 图像分割方法
CN115082800B (zh) * 2022-07-21 2022-11-15 阿里巴巴达摩院(杭州)科技有限公司 图像分割方法
CN115018852A (zh) * 2022-08-10 2022-09-06 四川大学 一种基于半监督学习的腹部淋巴结检测方法及装置
CN116304033A (zh) * 2023-02-27 2023-06-23 中国司法大数据研究院有限公司 一种基于半监督、双层多分类的诉请识别方法
CN116304033B (zh) * 2023-02-27 2023-11-03 中国司法大数据研究院有限公司 一种基于半监督、双层多分类的诉请识别方法
CN116630745A (zh) * 2023-05-25 2023-08-22 中国科学院微小卫星创新研究院 用于图像的端到端半监督目标检测方法、装置和可读介质
CN116630745B (zh) * 2023-05-25 2024-01-30 中国科学院微小卫星创新研究院 用于图像的端到端半监督目标检测方法、装置和可读介质
CN117553808A (zh) * 2024-01-12 2024-02-13 中国民用航空飞行学院 基于深度学习的机器人定位导航方法、装置、设备及介质
CN117553808B (zh) * 2024-01-12 2024-04-16 中国民用航空飞行学院 基于深度学习的机器人定位导航方法、装置、设备及介质

Also Published As

Publication number Publication date
CN114399683B (zh) 2024-06-25

Similar Documents

Publication Publication Date Title
CN114399683A (zh) 一种基于改进yolov5的端到端半监督目标检测方法
Zheng et al. A full stage data augmentation method in deep convolutional neural network for natural image classification
CN111832501B (zh) 一种面向卫星在轨应用的遥感影像文本智能描述方法
WO2023024577A1 (zh) 面向边缘计算的重参数神经网络架构搜索方法
KR20210124111A (ko) 모델을 훈련하기 위한 방법, 장치, 기기, 매체 및 프로그램 제품
CN111242844B (zh) 图像处理方法、装置、服务器和存储介质
CN112668579A (zh) 基于自适应亲和力和类别分配的弱监督语义分割方法
CN112016332A (zh) 基于变分推理和多任务学习的多模态机器翻译方法
KR20220038907A (ko) 생성적 대립 신경망(gan) 기반의 데이터 예측 방법, 그리고 이를 구현하기 위한 장치
CN110458022B (zh) 一种基于域适应的可自主学习目标检测方法
Freytag et al. Labeling examples that matter: Relevance-based active learning with gaussian processes
CN111061889A (zh) 图片多标签的自动识别方法和装置
CN116933114B (zh) 一种基于cnn-lstm的直流微电网检测方法及装置
CN112861758A (zh) 一种基于弱监督学习视频分割的行为识别方法
Zheng et al. Design of a quantum convolutional neural network on quantum circuits
Yan et al. Acceleration and optimization of artificial intelligence CNN image recognition based on FPGA
CN117591662A (zh) 基于人工智能的数字化企业服务数据挖掘方法及系统
CN117036706A (zh) 一种基于多模态对话语言模型的图像分割方法和系统
Rao et al. Roads detection of aerial image with FCN-CRF model
CN116995669A (zh) 新能源发电量的预测方法及其装置
CN116468105A (zh) 一种自适应域外数据集的分类模型训练方法和装置
CN116805162A (zh) 基于自监督学习的Transformer模型训练方法
CN115861239A (zh) 一种基于元学习的小样本工业零件表面缺陷检测方法
Tabib et al. Categorization and selection of crowdsourced images towards 3d reconstruction of heritage sites
CN114036947A (zh) 一种半监督学习的小样本文本分类方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: China

Address after: 568 Longmian Avenue, Gaoxinyuan, Jiangning District, Nanjing City, Jiangsu Province

Applicant after: Xiaoshi Technology (Jiangsu) Co.,Ltd.

Address before: 568 Longmian Avenue, Gaoxinyuan, Jiangning District, Nanjing City, Jiangsu Province

Applicant before: NANJING ZHENSHI INTELLIGENT TECHNOLOGY Co.,Ltd.

Country or region before: China

GR01 Patent grant
GR01 Patent grant