CN115311630A - 区分阈值生成、目标识别模型训练、目标识别方法及装置 - Google Patents
区分阈值生成、目标识别模型训练、目标识别方法及装置 Download PDFInfo
- Publication number
- CN115311630A CN115311630A CN202210786573.6A CN202210786573A CN115311630A CN 115311630 A CN115311630 A CN 115311630A CN 202210786573 A CN202210786573 A CN 202210786573A CN 115311630 A CN115311630 A CN 115311630A
- Authority
- CN
- China
- Prior art keywords
- image data
- threshold
- image
- data set
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种区分阈值生成、目标识别模型训练、目标识别方法及装置,其中,区分阈值生成方法包括:获取多条图像数据集;将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度;分别确定将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果;根据识别结果确定各候选区分阈值对应的精确率;在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值。本发明提供的区分阈值生成方法,通过对图像数据集进行训练,确定最终区分阈值,通过生成的区分阈值,可以快速的对待识别对象进行识别,提高对目标车辆判断的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种区分阈值生成、目标识别模训练、目标识别方法及装置。
背景技术
随着文明城市、平安城市建设的进一步落实,努力创造安全、有序、畅通的交通环境已经成为各大城市交通管理部门的首要目标,而集中开展针对渣土车的一系列交通违法整治工作更成为现阶段交警工作的重中之重。
现有技术中,将目标车辆的图像信息输入到神经网络模型中,得到目标车辆的置信度,将目标车辆的置信度与区分阈值进行比较,当置信度小于区分阈值时,判定该目标车辆不是渣土车,当置信度大于区分阈值时,判定该目标车辆为渣土车,区分阈值通常是人为设定的,当区分阈值设置的较大,容易出现将渣土车误判为非渣土车的情况,当区分阈值设置的较小,容易出现将非渣土车误判为渣土车的情况,由此可见,如何设置合理的区分阈值是亟待解决的一个问题。
发明内容
有鉴于此,本发明实施例提供了一种区分阈值生成、目标识别模型训练、目标识别方法及装置,以解决在车辆识别时,错误率较高的问题。
第一方面,本发明提供了一种区分阈值生成方法,包括:获取多条图像数据集,所述图像数据集中含有待识别对象;将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度;分别将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果;根据所述识别结果确定各候选区分阈值对应的精确率;在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值。
可选的,根据所述识别结果确定候选区分阈值对应的精确率,包括:根据所述候选区分阈值对应的各图像数据集的识别结果,以及各图像数据集的真实值,计算所述候选区分阈值对应的将正类预测为正类的样本数量和将负类预测成正类的样本数量;根据所述将正类预测为正类的样本数量和将负类预测成正类的样本数量计算所述候选区分阈值对应的精确率。
第二方面,本发明提供了一种目标识别模型训练方法,包括:获取多条图像数据集;通过所述图像数据集对神经网络模型进行迭代训练,得到多个中间模型,一次迭代过程对应一个中间模型,所述中间模型对所述图像数据集进行计算得到图像数据集对应的置信度;将各中间模型对所述图像数据集进行计算得到的置信度与各中间模型对应的区分阈值进行比较,得到各中间模型对各所述图像数据集的识别结果,与中间模型对应的区分阈值通过如第一方面所述的区分阈值生成方法确定;根据各所述中间模型的识别结果确定各所述中间模型的召回率;将所述召回率最大的中间模型确定为目标识别模型。
第三方面,本发明提供了一种目标识别方法,包括:获取待识别,所述待识别图像中包含待识别对象;将所述待识别图像输入目标识别模型,得到所述待识别图像的图像置信度;将所述图像置信度与所述目标识别模型对应的区分阈值进行比较,得到所述待识别对象的识别结果,所述目标识别模型通过如第二方面所述的目标识别模型训练方法训练得到。
第四方面,本发明提供了一种区分阈值装置,包括:第一获取模块,用于获取多条图像数据集,所述图像数据集中含有待识别对象;置信度生成模块,用于将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度;获取结果模块,用于分别将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果;第一确定模块,用于根据所述识别结果确定各候选区分阈值对应的精确率;最终确定模块,用于在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值。
第五方面,本发明提供了一种目标识别模型训练装置,包括:第二获取模块,用于获取多条图像数据集;置信度计算模块,用于通过所述图像数据集对神经网络模型进行迭代训练,得到多个中间模型,一次迭代过程对应一个中间模型,所述中间模型对所述图像数据集进行计算得到图像数据集对应的置信度;第一比较模块,用于将各中间模型对所述图像数据集进行计算得到的置信度与各中间模型对应的区分阈值进行比较,得到各中间模型对各所述图像数据集的识别结果,与中间模型对应的区分阈值通过如第一方面所述的区分阈值生成方法确定。第二确定模块,用于根据各所述中间模型的识别结果确定各所述中间模型的召回率;第三确定模块,用于将所述召回率最大的中间模型确定为目标识别模型。
第六方面,本发明提供了一种目标识别装置,包括:第三获取模块,用于获取待识别,所述待识别图像中包含待识别对象;第四获取模块,用于将所述待识别图像输入目标识别模型,得到所述待识别图像的图像置信度;第二传输模块,用于将所述图像置信度与目标识别模型对应的区分阈值进行比较,得到所述待识别对象的识别结果,所述目标识别模型通过如第二方面所述的目标识别模型训练方法训练得到。
第七方面,本发明提供一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,从而执行如第一方面提供的区分阈值生成方法,或,如第二方面提供的目标识别模型训练方法,或,如第三方面提供的目标识别方法。
第八方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如第一方面提供的区分阈值生成方法,或,如第二方面提供的目标识别模型训练方法,或,如第三方面提供的目标识别方法。
本发明技术方案,具有如下优点:
本发明提供的区分阈值生成、目标识别模型训练、目标识别方法及装置,通过将大量的图像数据集送入至识别模型中,生成多个置信度,再通过多个置信度和精确率阈值确定该识别模型对应的区分阈值,通过实施本发明,对图像数据集进行训练,并生成多个区分阈值,在保证精确率的情况下,确定一个最为合适的最终区分阈值,通过最终区分阈值可以快速的对待识别对象进行识别,提高对目标车辆判断的准确性。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明实施例中区分阈值生成方法的一个具体示例的流程图;
图2为本发明实施例中目标识别模型训练方法的一个具体示例的流程图;
图3为本发明实施例中目标识别方法的一个具体示例的流程图;
图4为本发明实施例中区分阈值生成装置的一个具体示例的结构示意图;
图5为本发明实施例中目标识别模型训练装置的一个具体示例的结构示意图;
图6为本发明实施例中目标识别装置的一个具体示例的结构示意图;
图7为本发明实施例中计算机设备的一个具体示例的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
在日常的生活中,违规摄像头每天要拍摄数以万计的车辆,需要在这数以万计的图片中需要寻找到渣土车,数据量是十分巨大的,使用神经网络模型对图片进行判断,可以提高工作的效率,通过神经网络模型获取图片的置信度,然后将置信度与区分阈值进行比较,根据比较结果确定图片中的车辆是否为渣土车,但是区分阈值选择不合理时,容易产生误判。
为了提高自动判断渣土车的准确率,本实施例提供一种区分阈值生成方法,如图1所示,包括如下步骤:
步骤S1:获取多条图像数据集,图像数据集中含有待识别对象。
在一可选实施例中,图像数据集包括真实视频场景中采集的图像与公共数据集图像。
在一可选实施例中,通过摄像装置采集含有待识别物体的图像,然后继续数据增强,再将增强后的数据送入神经网络模型中进行迭代训练。
在一可选实施例中,采用多种数据增强方式(如mosaic增强、随机擦除、加入噪声等)进一步扩大数据集。
步骤S2:将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度。
在一可选实施例中,将各图像数据集输入到识别模型中,通过识别模型中的目标检测算法,计算各图像数据集相应的图像置信度。
在一可选实施例中,每次将图像数据集输入至识别模型中,都会得到各图像数据集对应的图像置信度。
步骤S3:分别将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果。
在一可选实施例中,依次将各图像置信度作为候选区分阈值,再将各图像置信度与各候选区分阈值进行比较,获取各图像置信度与各候选区分阈值的比较结果,根据比较结果确定待识别对象的识别结果。
在一可选实施例中,识别结果包括待识别对象为目标对象和待识别对象不是目标对象,其中,目标对象为渣土车。
在一可选实施例中,当图像置信度大于或等于区分阈值时,则认为该图像中的待识别对象为目标对象,当图像置信度小于区分阈值时,则认为该图像中的待识别对象不是目标对象。
步骤S4:根据识别结果确定各候选区分阈值对应的精确率。
在一可选实施例中,图像数据集通过识别模型生成的图像置信度,经过与区分阈值对比后生成的识别结果,通过对识别结果进行分析生成多个精确率,每一个候选区分阈值对应一个精确率。
步骤S5:在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值。
在一可选实施例中,精确率阈值根据实际情况设定,示例性地,可以设定精确率阈值为0.98、0.95等。
示例性地,当图像数据集对应的各候选区分阈值对应的精确率为0.982、0.971、0.996、0.979时,设定的精确率阈值为0.980,则选取精确率为0.982对应的图像置信度作为图像数据集的区分阈值。
在具体应用场景中,精确率与召回率成反比,精确率越高,则召回率越低,所以在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值,可以在保证精确率的大小的同时,获取最大召回率。
本发明提供的区分阈值生成方法,通过将大量的图像数据集送入至识别模型中,生成多个置信度,再通过多个置信度和精确率阈值确定该识别模型对应的区分阈值,通过实施本发明,对图像数据集进行训练,并生成多个区分阈值,在保证精确率的情况下,确定最终区分阈值,通过最终区分阈值可以快速的对待识别对象进行识别,提高对目标车辆判断的准确性。
在一可选实施例中,根据识别结果确定候选区分阈值对应的精确率的步骤,具体包括:
首先,根据候选区分阈值对应的各图像数据集的识别结果,以及各图像数据集的真实值,计算候选区分阈值对应的将正类预测为正类的样本数量(TP),和将负类预测成正类的样本数量(FP)。
示例性地,当图像数据中的待识别对象为目标对象时,该图像的图像置信度经过与区分阈值的比较,识别结果为图像中的待识别对象为目标对象,则认为该图像数据识别结果为正类预测为正类,即TP值加1。
当该图像数据为包含待识别对象时,该图像经过与区分阈值的比较,识别结果为图像中的待识别对象不是目标对象,则认为该图像数据识别结果为负类预测为正类,即FP值加1。
最后,根据将正类预测为正类的样本数量和将负类预测成正类的样本数量计算候选区分阈值对应的精确。
在一可选实施例中,通过如下公式计算精确率:
本实施例提供一种目标识别模型训练方法,如图2所示,目标识别模型训练方法包括:
S21:获取多条图像数据集。
S22:通过图像数据集对神经网络模型进行迭代训练,得到多个中间模型,一次迭代过程对应一个中间模型,中间模型对图像数据集进行计算得到图像数据集对应的置信度。
在一可选实施例中,图像数据集通过不同的中间模型,生成各中间模型对应的置信度。
S23:将各中间模型对图像数据集进行计算得到的置信度与各中间模型对应的区分阈值进行比较,得到各中间模型对各图像数据集的识别结果,与中间模型对应的区分阈值通过上述实施例中提供的区分阈值生成方法确定。
S24:根据各中间模型的识别结果确定各中间模型的召回率。
在一可选实施例中,当该图像数据为含待识别对象时,该图像的图像置信度经过与区分阈值的比较,识别结果为图像中的识别对象不是目标对象,则认为该图像数据识别结果为将正类预测为负类,即FN值加1。
S25:将召回率最大的中间模型确定为目标识别模型。
在一可选实施例中,将召回率最大的中间模型所对应的区分阈值作为实际应用中的区分阈值。
本实施例提供一种目标识别方法,如图3所示,目标识别方法包括:
S31:获取待识别,所述待识别图像中包含待识别对象。
S32:将所述待识别图像输入目标识别模型,得到所述待识别图像的图像置信度。
在一可选实施例中,按照预设时间,对图像获取装置进行抽帧,获得对应帧所对应的待识别图像,再将待识别图像通过预设数据集的目标检测算法对待识别图像进行特征标注,将特征标注后的图像通过预设算法生成相对应的置信度。
在一可选实施例中,预设数据集包括但不限于COCO数据集。
在一可选实施例中,依据COCO数据集的目标检测检测出经过特征标注后的待识别物体的图片,将特征标注后的待识别物体的图片送入目标检测算法(retinaNet)。
在一可选实施例中,特征标注包括但不限于标注待识别图像的上部、侧部、后部、苫盖等部位。
示例性地,当目标物体为渣土车时,特征标注具体包括:渣土车箱体上部:渣土车箱体上部会有一个凸起,这个凸起高于车头,高于存储的渣土,也高于后面的箱体,这个凸起一般用于存贮渣土车的盖帘;渣土车箱体侧部:渣土车箱体侧部有的会有瓦楞凹凸不平的栅格,有的侧部只有平面,有的侧部会带有梯子;渣土车箱体后部:渣土车箱体后部和侧部差不多,用来方便检测车尾;渣土车苫盖部位:未苫盖部分需要进行额外标注。
在一可选实施例中,当特征标注满足预设组合条件时,则初步判定为目标物体,将初步判定为目标物体的图像送入目标识别模型中,获取待识别图像的置信度。
在一可选实施例中,目标检测算法包括但不限于目标检测算法(retinaNet)、目标检测算法(freeAnchor),目标检测算法(Single Shot MultiBox Detector,SSD)算法。
在一可选实施例中,通过目标检测算法(retinaNet)检测模型,可直接得到待识别对象在待识别图像中的矩形框。
S33:将所述图像置信度与所述目标识别模型对应的区分阈值进行比较,得到所述待识别对象的识别结果,目标识别模型通过如上述实施例中提供的目标识别模型训练方法训练得到。
在一可选实施例中,将待识别图像的置信度与目标识别模型中得到的区分阈值进行比较,当待识别图像的置信度,大于或等于,区分阈值时,则判定待识别图像包含目标物体。
通过本发明提供的目标识别方法,对网络进行实例化,优化了模型大小及检测速度,在深度学习芯片上,完成一个待识别物体的检测时间为0.16秒,相比传统的检测,准确度以及速度都得到大幅的提升。
本实施例提供一种区分阈值生成装置,如图4所示,包括:
第一获取模块41,用于获取多条图像数据集,图像数据集中含有待识别对象,详细内容上述实施例中步骤S1的描述,在此不再赘述。
置信度生成模块42,用于将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度,详细内容上述实施例中步骤S2的描述,在此不再赘述。
获取结果模块43,用于分别将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果,详细内容上述实施例中步骤S3的描述,在此不再赘述。
第一确定模块44,用于根据识别结果确定各候选区分阈值对应的精确率,详细内容上述实施例中步骤S4的描述,在此不再赘述。
最终确定模块45,用于在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值,详细内容上述实施例中步骤S5的描述,在此不再赘述。
本实施例提供一种目标识别模型训练装置,如图5所示,包括:
第二获取模块,用于获取多条图像数据集,详细内容上述实施例中步骤S21的描述,在此不再赘述。
置信度计算模块,用于通过图像数据集对神经网络模型进行迭代训练,得到多个中间模型,一次迭代过程对应一个中间模型,中间模型对图像数据集进行计算得到图像数据集对应的置信度,详细内容上述实施例中步骤S22的描述,在此不再赘述。
第一比较模块,用于将各中间模型对图像数据集进行计算得到的置信度与各中间模型对应的区分阈值进行比较,得到各中间模型对各图像数据集的识别结果,与中间模型对应的区分阈值通过如区分阈值生成方法确定,详细内容上述实施例中步骤S23的描述,在此不再赘述。
第二确定模块,用于根据各中间模型的识别结果确定各中间模型的召回率,详细内容上述实施例中步骤S24的描述,在此不再赘述。
第三确定模块,用于将召回率最大的中间模型确定为目标识别模型,详细内容上述实施例中步骤S25的描述,在此不再赘述。
本实施例提供一种目标识别装置,如图6所示,包括:
第三获取模块,用于获取待识别,待识别图像中包含待识别对象,详细内容上述实施例中步骤S31的描述,在此不再赘述。
第四获取模块,用于将待识别图像输入目标识别模型,得到待识别图像的图像置信度,详细内容上述实施例中步骤S32的描述,在此不再赘述。
第二比较模块,用于将所述图像置信度与目标识别模型对应的区分阈值进行比较,得到所述待识别对象的识别结果,所述目标识别模型通过如目标识别模型训练方法训练得到,详细内容上述实施例中步骤S33的描述,在此不再赘述。
本发明实施例提供一种计算机设备,如图7所示,包括:至少一个处理器71,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口72,存储器74,至少一个通信总线73。其中,通信总线73用于实现这些件之间的连接通信。其中,通信接口72可以包括显示屏(Display)、键盘(Keyboard),可选通信接口72还可以包括标准的有线接口、无线接口。
存储器74可以是高速RAM存储器(Ramdom Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器74可选的还可以是至少一个位于远离前述处理器71的存储装置。其中处理器71可以执行上述实施例中提供中的区分阈值生成方法。存储器74中存储一组程序代码,且处理器71调用存储器74中存储的程序代码,以用于执行上述实施例中提供的区分阈值生成方法、目标识别模型训练、目标识别方法及装置。其中,通信总线73可以是外设部件互连标(peripheralcomponent interconnect,简称PCI)总线或扩展工业标准结构(extendedindustry standard architecture,简称EISA)总线等。通信总线73可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条线表示,但并不表仅有一根总线或一种类型的总线。其中,存储器74可以包括易失性存储(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固降硬盘(英文:solid-state drive,缩写:SSD);存储器74还可以包括上述种类的存储器的组合。其中,处理器71可以是中央处理器(英文:central processingunit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。其中,处理器71还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。
上述PLD可以是复杂可编程逻辑器件(英文:complex programmablelogicdevice,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gatearray,缩写:FPGA),通用阵列逻辑(英文:generic array logic,缩写:GAL)或其任意组合。
本发明实施例提供一种计算机可读存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的区分阈值生成方法、目标识别模型训练、目标识别方法及装置。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive,缩写:HDD)或固降硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种区分阈值生成方法,其特征在于,包括如下步骤:
获取多条图像数据集,所述图像数据集中含有待识别对象;
将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度;
分别将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果;
根据所述识别结果确定各候选区分阈值对应的精确率;
在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值。
2.根据权利要求1所述的区分阈值生成方法,其特征在于,根据所述识别结果确定候选区分阈值对应的精确率,包括:
根据所述候选区分阈值对应的各图像数据集的识别结果,以及各图像数据集的真实值,计算所述候选区分阈值对应的将正类预测为正类的样本数量和将负类预测成正类的样本数量;
根据所述将正类预测为正类的样本数量和将负类预测成正类的样本数量计算所述候选区分阈值对应的精确率。
4.一种目标识别模型训练方法,其特征在于,包括:
获取多条图像数据集;
通过所述图像数据集对神经网络模型进行迭代训练,得到多个中间模型,一次迭代过程对应一个中间模型,所述中间模型对所述图像数据集进行计算得到图像数据集对应的置信度;
将各中间模型对所述图像数据集进行计算得到的置信度与各中间模型对应的区分阈值进行比较,得到各中间模型对各所述图像数据集的识别结果,与中间模型对应的区分阈值通过如权利要求1-3中任一项所述的区分阈值生成方法确定;
根据各所述中间模型的识别结果确定各所述中间模型的召回率;
将所述召回率最大的中间模型确定为目标识别模型。
5.一种目标识别方法,其特征在于,包括:
获取待识别,所述待识别图像中包含待识别对象;
将所述待识别图像输入目标识别模型,得到所述待识别图像的图像置信度;
将所述图像置信度与所述目标识别模型对应的区分阈值进行比较,得到所述待识别对象的识别结果,所述目标识别模型通过如权利要求4所述的目标识别模型训练方法训练得到。
6.一种区分阈值生成装置,其特征在于,包括:
第一获取模块,用于获取多条图像数据集,所述图像数据集中含有待识别对象;
置信度生成模块,用于将各图像数据集分别输入至识别模型中,得到各图像数据集对应的图像置信度;
获取结果模块,用于分别将各图像置信度作为候选区分阈值时,获取各图像数据集中待识别对象的识别结果;
第一确定模块,用于根据所述识别结果确定各候选区分阈值对应的精确率;
最终确定模块,用于在大于精确率阈值的精确率中,选择与精确率阈值相差最小的精确率所对应的候选区分阈值确定为最终区分阈值。
7.一种目标识别模型训练装置,其特征在于,包括:
第二获取模块,用于获取多条图像数据集;
置信度计算模块,用于通过所述图像数据集对神经网络模型进行迭代训练,得到多个中间模型,一次迭代过程对应一个中间模型,所述中间模型对所述图像数据集进行计算得到图像数据集对应的置信度;
第一比较模块,用于将各中间模型对所述图像数据集进行计算得到的置信度与各中间模型对应的区分阈值进行比较,得到各中间模型对各所述图像数据集的识别结果,与中间模型对应的区分阈值通过如权利要求1-3中任一项所述的区分阈值生成方法确定;
第二确定模块,用于根据各所述中间模型的识别结果确定各所述中间模型的召回率;
第三确定模块,用于将所述召回率最大的中间模型确定为目标识别模型。
8.一种目标识别装置,其特征在于,包括:
第三获取模块,用于获取待识别,所述待识别图像中包含待识别对象;
第四获取模块,用于将所述待识别图像输入目标识别模型,得到所述待识别图像的图像置信度;
第二比较模块,用于将所述图像置信度与目标识别模型对应的区分阈值进行比较,得到所述待识别对象的识别结果,所述目标识别模型通过如权利要求4所述的目标识别模型训练方法训练得到。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,从而执行如权利要求1-3中任一项所述的区分阈值生成方法,或,如权利要求4所述的目标识别模型训练方法,或,如权利要求5所述的目标识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-3中任一项所述的区分阈值生成方法,或,如权利要求4所述的目标识别模型训练方法,或,如权利要求5所述的目标识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210786573.6A CN115311630A (zh) | 2022-07-04 | 2022-07-04 | 区分阈值生成、目标识别模型训练、目标识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210786573.6A CN115311630A (zh) | 2022-07-04 | 2022-07-04 | 区分阈值生成、目标识别模型训练、目标识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115311630A true CN115311630A (zh) | 2022-11-08 |
Family
ID=83856755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210786573.6A Pending CN115311630A (zh) | 2022-07-04 | 2022-07-04 | 区分阈值生成、目标识别模型训练、目标识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115311630A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116327232A (zh) * | 2023-03-27 | 2023-06-27 | 北京朗视仪器股份有限公司 | 一种头颅摄影装置参数校准方法、装置及设备 |
-
2022
- 2022-07-04 CN CN202210786573.6A patent/CN115311630A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116327232A (zh) * | 2023-03-27 | 2023-06-27 | 北京朗视仪器股份有限公司 | 一种头颅摄影装置参数校准方法、装置及设备 |
CN116327232B (zh) * | 2023-03-27 | 2023-09-22 | 北京朗视仪器股份有限公司 | 一种头颅摄影装置参数校准方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11475660B2 (en) | Method and system for facilitating recognition of vehicle parts based on a neural network | |
CN109657716B (zh) | 一种基于深度学习的车辆外观损伤识别方法 | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US11455805B2 (en) | Method and apparatus for detecting parking space usage condition, electronic device, and storage medium | |
WO2018166116A1 (zh) | 车损识别方法、电子装置及计算机可读存储介质 | |
CN108805016B (zh) | 一种头肩区域检测方法及装置 | |
CN110706261A (zh) | 车辆违章检测方法、装置、计算机设备和存储介质 | |
CN112329881B (zh) | 车牌识别模型训练方法、车牌识别方法及装置 | |
CN110826429A (zh) | 一种基于景区视频的旅游突发事件自动监测的方法及系统 | |
CN113033604A (zh) | 一种基于SF-YOLOv4网络模型的车辆检测方法、系统及存储介质 | |
CN111222409A (zh) | 车辆品牌的标注方法、装置及系统 | |
CN116311214B (zh) | 车牌识别方法和装置 | |
CN110674680A (zh) | 活体识别的方法、装置、存储介质 | |
CN115311630A (zh) | 区分阈值生成、目标识别模型训练、目标识别方法及装置 | |
CN110598758A (zh) | 训练建模方法、车辆收费方法、管理系统及存储介质 | |
CN112966687A (zh) | 图像分割模型训练方法、装置及通信设备 | |
CN111126478B (zh) | 卷积神经网络训练方法、装置和电子系统 | |
CN112784494A (zh) | 假阳性识别模型的训练方法、目标识别方法及装置 | |
KR102008630B1 (ko) | 이미지 인식률 증대 장치 및 방법 | |
CN112990350B (zh) | 目标检测网络训练方法及基于目标检测网络煤矸识别方法 | |
CN110942073A (zh) | 一种集装箱拖车编号识别方法、装置和计算机设备 | |
CN114724128A (zh) | 一种车牌识别方法、装置、设备和介质 | |
CN115374439A (zh) | 一种恶意代码检测方法、装置及计算机设备 | |
CN113569829A (zh) | 集装箱编码数据识别方法及系统 | |
US20200160500A1 (en) | Prediction device, prediction method, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |