CN113673532B - 基于量化模型的目标检测方法及装置 - Google Patents
基于量化模型的目标检测方法及装置 Download PDFInfo
- Publication number
- CN113673532B CN113673532B CN202111223976.1A CN202111223976A CN113673532B CN 113673532 B CN113673532 B CN 113673532B CN 202111223976 A CN202111223976 A CN 202111223976A CN 113673532 B CN113673532 B CN 113673532B
- Authority
- CN
- China
- Prior art keywords
- model
- quantization
- optimization function
- deviation value
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种基于量化模型的目标检测方法及装置,上述方法包括:获取目标模型和所述目标模型对应的测试数据集;通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。采用上述技术手段,解决现有技术中,量化后的模型的检测结果,存在较大的误差的问题。
Description
技术领域
本公开涉及人工智能领域,尤其涉及一种基于量化模型的目标检测方法及装置。
背景技术
为了使得模型应用于各种场景,往往对模型进行量化。模型量化有如下优势:量化后的模型只需要更少的存储开销和带宽需求,即使用更少的比特数存储数据,有效减少应用对存储资源的依赖;量化后的模型可以减少模型运行的功耗;量化后的模型具有更快的计算速度。但是现有技术中,量化后的模型相比于未量化的模型存在更大的误差,即量化后的模型的检测结果的误差会增大。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:量化后的模型的检测结果,存在较大的误差的问题。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开的实施例提供了一种基于量化模型的目标检测方法及装置,以至少解决现有技术中,量化后的模型的检测结果,存在较大的误差的问题。
本公开的目的是通过以下技术方案实现的:
第一方面,本公开的实施例提供了一种基于量化模型的目标检测方法,包括:获取目标模型和所述目标模型对应的测试数据集;通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。
在一个示例性实施例中,所述统计所述检测结果的偏差值,包括:对所述检测结果建立第一平面直角坐标系,其中,所述检测结果,包括:目标对象和所述目标对象对应的预测框;通过所述第一平面直角坐标系统计所述检测结果的偏差值;其中,所述偏差值,包括:所述目标对象的位置与所述目标对象对应的预测框的位置的第一偏差值;和/或所述目标对象的大小与所述目标对象对应的预测框的大小的第二偏差值。
在一个示例性实施例中,所述通过曲线拟合方法对所述偏差值进行处理,得到优化函数,包括:以x轴为所述检测结果的坐标,以y轴为所述检测结果的第一偏差值,建立第二平面直角坐标系,其中,所述偏差值包括所述第一偏差值;在所述第二平面直角坐标系上,将所述坐标和所述第一偏差值组成的离散点数据拟合为第一平滑曲线;通过所述第一平滑曲线确定第一优化函数,其中,所述优化函数包括所述第一优化函数。
在一个示例性实施例中,所述通过曲线拟合方法对所述偏差值进行处理,得到优化函数,包括:以x轴为所述检测结果的坐标,以y轴为所述检测结果的第二偏差值,建立第三平面直角坐标系,其中,所述偏差值包括所述第二偏差值;在所述第三平面直角坐标系上,将所述坐标和所述第二偏差值组成的离散点数据拟合为第二平滑曲线;通过所述第二平滑曲线确定第二优化函数,其中,所述优化函数包括所述第二优化函数。
在一个示例性实施例中,所述通过所述优化函数优化所述量化模型,包括:通过第一优化函数优化所述量化模型对应的第一模型数据,其中,所述优化函数,包括:所述第一优化函数和第二优化函数;和/或通过所述第二优化函数优化所述量化模型对应的第一模型数据。
在一个示例性实施例中,所述通过训练后量化方法对所述目标模型进行量化操作,得到量化模型,包括:获取所述目标模型对应的第二模型数据;确定所述第二模型数据对应的模型量化缩放因子和模型量化零点;根据所述第二模型数据、所述模型量化缩放因子和所述模型量化零点,通过四舍五入函数计算模型量化中间量;根据所述模型量化中间量,通过模型量化分段函数计算所述量化模型对应的第一模型数据;根据所述第一模型数据确定所述量化模型。
在一个示例性实施例中,包括:通过如下公式确定所述第二模型数据对应的模型量化缩放因子S和模型量化零点Z:
其中,rmax为所述第二模型数据中的最大值,rmin为所述第二模型数据中的最小值,n为所述量化模型对应的第一模型数据的比特数,所述比特数在通过所述训练后量化方法对所述目标模型进行所述量化操作的过程中确定。
在一个示例性实施例中,所述根据所述第二模型数据、所述模型量化缩放因子和所述模型量化零点,通过四舍五入函数计算模型量化中间量,包括:
其中,xint为所述模型量化中间量,x为所述第二模型数据,round为所述四舍五入函数,Z为所述模型量化零点,S为所述模型量化缩放因子。
在一个示例性实施例中,所述根据所述模型量化中间量,通过模型量化分段函数计算所述量化模型对应的第一模型数据,包括:
其中,xQ为所述第一模型数据,xint为所述模型量化中间量,clamp为所述模型量化分段函数,n为所述量化模型对应的第一模型数据的比特数,所述比特数在通过所述训练后量化方法对所述目标模型进行所述量化操作的过程中确定;
其中,
第二方面,本公开的实施例提供了一种基于量化模型的目标检测装置,包括:获取模块,用于获取目标模型和所述目标模型对应的测试数据集;量化模块,用于通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;统计模块,用于将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;优化模块,用于通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。
第三方面,本公开的实施例提供了一种电子设备。上述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现如上所述的基于量化模型的目标检测方法或图像处理的方法。
第四方面,本公开的实施例提供了一种计算机可读存储介质。上述计算机可读存储介质上存储有计算机程序,上述计算机程序被处理器执行时实现如上所述的基于量化模型的目标检测方法或图像处理的方法。
本公开实施例提供的上述技术方案与现有技术相比至少具有如下优点的部分或全部:获取目标模型和所述目标模型对应的测试数据集;通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。因为,本公开实施例通过曲线拟合方法对量化模型的检测结果的偏差值进行处理,得到优化函数,并通过优化函数优化量化模型,因此,采用上述技术手段,可以解决现有技术中,量化后的模型的检测结果,存在较大的误差的问题,进而通过优化量化后的模型,提高量化后的模型检测的准确率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出了本公开实施例一种基于量化模型的目标检测方法的计算机终端的硬件结构框图;
图2示意性示出了本公开实施例的一种基于量化模型的目标检测方法的流程图;
图3示意性示出了本公开实施例的一种基于量化模型的目标检测装置的结构框图;
图4示意性示出了本公开实施例提供的一种电子设备的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本公开。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本公开实施例所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1示意性示出了本公开实施例的一种基于量化模型的目标检测方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器(MicroprocessorUnit,简称是MPU)或可编程逻辑器件(Programmable logic device,简称是PLD)等处理装置和用于存储数据的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本公开实施例中的基于量化模型的目标检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本公开实施例中提供了一种基于量化模型的目标检测方法,图2示意性示出了本公开实施例的一种基于量化模型的目标检测方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取目标模型和所述目标模型对应的测试数据集;
步骤S204,通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;
步骤S206,将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;
步骤S208,通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。
通过本公开,获取目标模型和所述目标模型对应的测试数据集;通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。因为,本公开实施例通过曲线拟合方法对量化模型的检测结果的偏差值进行处理,得到优化函数,并通过优化函数优化量化模型,因此,采用上述技术手段,可以解决现有技术中,量化后的模型的检测结果,存在较大的误差的问题,进而通过优化量化后的模型,提高量化后的模型检测的准确率。
在步骤S206中,统计所述检测结果的偏差值,包括:对所述检测结果建立第一平面直角坐标系,其中,所述检测结果,包括:目标对象和所述目标对象对应的预测框;通过所述第一平面直角坐标系统计所述检测结果的偏差值;其中,所述偏差值,包括:所述目标对象的位置与所述目标对象对应的预测框的位置的第一偏差值;和/或所述目标对象的大小与所述目标对象对应的预测框的大小的第二偏差值。
所述测试数据集包括多个用于测试的图片,所述量化模型输出的检测结果也是图片,只是,检测结果的图片相比于用于测试的图片,检测结果的图片有所述目标对象对应的预测框。目标对象是用于测试的图片中需要检测的对象。对所述检测结果建立第一平面直角坐标系,可以是以检测结果的图片的一个长边和一个宽边分别为x轴和y轴,建立第一平面直角坐标系。通过所述第一平面直角坐标系统计所述检测结果的偏差值,可以是在所述第一平面直角坐标系上,将所述目标对象的位置与所述目标对象对应的预测框的位置的距离作为第一偏差值;也可以是在所述第一平面直角坐标系上,所述目标对象的面积与所述目标对象对应的预测框的面积的差值作为第二偏差值。所述目标对象的大小是同于所述目标对象的面积的,所述目标对象对应的预测框的大小也是同于所述目标对象对应的预测框的面积。
在步骤S208中,通过曲线拟合方法对所述偏差值进行处理,得到优化函数,包括:以x轴为所述检测结果的坐标,以y轴为所述检测结果的第一偏差值,建立第二平面直角坐标系,其中,所述偏差值包括所述第一偏差值;在所述第二平面直角坐标系上,将所述坐标和所述第一偏差值组成的离散点数据拟合为第一平滑曲线;通过所述第一平滑曲线确定第一优化函数,其中,所述优化函数包括所述第一优化函数。
曲线拟合方法是数据处理中经常用到的数值方法,其本质是使用某一个模型(或者称为方程或方程组),将一系列离散的数据拟合成平滑的曲线或曲面,求解出平滑的曲线或曲面对应函数的参数,从而得到离散点组所表示的坐标与函数值之间的关系。
以x轴为所述检测结果的坐标,比如x轴标为0-640,640为所述检测结果的图片的尺寸。以y轴为所述检测结果的第一偏差值,比如第一偏差值的大小为200,那么y轴可以标为0-200,或者0-300等,其中,y轴可以是以20为一格等。上述数字只需要单位一致就可以,所以上述数字后没有接单位。将所述坐标和所述第一偏差值组成的离散点数据,可以是x轴一个坐标点和x轴该坐标点对应的y轴的一个偏差值组成一个离散点,该离散点的离散点数据就是x轴该坐标点和x轴该坐标点对应的y轴的该偏差值。通过所述第一平滑曲线确定所述第一优化函数,也就是确定所述第一平滑曲线对应的所述第一优化函数。
在步骤S208中,通过曲线拟合方法对所述偏差值进行处理,得到优化函数,包括:以x轴为所述检测结果的坐标,以y轴为所述检测结果的第二偏差值,建立第三平面直角坐标系,其中,所述偏差值包括所述第二偏差值;在所述第三平面直角坐标系上,将所述坐标和所述第二偏差值组成的离散点数据拟合为第二平滑曲线;通过所述第二平滑曲线确定第二优化函数,其中,所述优化函数包括所述第二优化函数。
以x轴为所述检测结果的坐标,比如x轴标为0-640,640为所述检测结果的图片的尺寸。以y轴为所述检测结果的第二偏差值,比如第二偏差值的大小为500,那么y轴可以标为0-500,或者0-600等,其中,y轴可以是以50为一格等。上述数字只需要单位一致就可以,所以上述数字后没有接单位。将所述坐标和所述第二偏差值组成的离散点数据,可以是x轴一个坐标点和x轴该坐标点对应的y轴的一个偏差值组成一个离散点,该离散点的离散点数据就是x轴该坐标点和x轴该坐标点对应的y轴的该偏差值。通过所述第二平滑曲线确定所述第二优化函数,也就是确定所述第二平滑曲线对应的所述第二优化函数。
在步骤S208中,通过所述优化函数优化所述量化模型,包括:通过第一优化函数优化所述量化模型对应的第一模型数据,其中,所述优化函数,包括:所述第一优化函数和第二优化函数;和/或通过所述第二优化函数优化所述量化模型对应的第一模型数据。
通过所述第一优化函数和/或所述第二优化函数优化所述量化模型对应的第一模型数据,也就是通过所述第一优化函数和/或通过第二优化函数优化所述量化模型。因为所述第一优化函数和所述第二优化函数是通过量化模型输出的所述检测结果的偏差值确定的,所以通过所述第一优化函数和/或所述第二优化函数优化所述量化模型对应的第一模型数据,可以解决现有技术中,量化模型的检测结果,存在较大的误差的问题。
在步骤S204中,通过训练后量化方法对所述目标模型进行量化操作,得到量化模型,包括:获取所述目标模型对应的第二模型数据;确定所述第二模型数据对应的模型量化缩放因子和模型量化零点;根据所述第二模型数据、所述模型量化缩放因子和所述模型量化零点,通过四舍五入函数计算模型量化中间量;根据所述模型量化中间量,通过模型量化分段函数计算所述量化模型对应的第一模型数据;根据所述第一模型数据确定所述量化模型。
本公开实施例中的训练后量化方法可以是PTQ(post-training quantization)后训练量化,PTQ是对预训练后的网络选择合适的量化操作和校准操作,以实现量化损失的最小化,PTQ量化过程不需要训练,通常不直接更新权重原始数值而是选用合适的量化参数。所述目标模型是需要量化的模型,所述量化模型是对所述目标模型量化后的模型。
在步骤S204中,包括:通过如下公式确定所述第二模型数据对应的模型量化缩放因子S和模型量化零点Z:
其中,rmax为所述第二模型数据中的最大值,rmin为所述第二模型数据中的最小值,n为所述量化模型对应的第一模型数据的比特数,所述比特数在通过所述训练后量化方法对所述目标模型进行所述量化操作的过程中确定。
通过调整所述比特数,可以调整最终得到的量化模型的大小。
在步骤S204中,根据所述第二模型数据、所述模型量化缩放因子和所述模型量化零点,通过四舍五入函数计算模型量化中间量,包括:
其中,xint为所述模型量化中间量,x为所述第二模型数据,round为所述四舍五入函数,Z为所述模型量化零点,S为所述模型量化缩放因子。
在步骤S204中,根据所述模型量化中间量,通过模型量化分段函数计算所述量化模型对应的第一模型数据,包括:
其中,xQ为所述第一模型数据,xint为所述模型量化中间量,clamp为所述模型量化分段函数,n为所述量化模型对应的第一模型数据的比特数,所述比特数在通过所述训练后量化方法对所述目标模型进行所述量化操作的过程中确定;
其中,
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random AccessMemory,简称为RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,组件服务端,或者网络设备等)执行本公开各个实施例的方法。
在本实施例中还提供了一种基于量化模型的目标检测装置,该基于量化模型的目标检测装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3示意性示出了本公开可选实施例的一种基于量化模型的目标检测装置的结构框图,如图3所示,该装置包括:
获取模块302,用于获取目标模型和所述目标模型对应的测试数据集;
量化模块304,用于通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;
统计模块306,用于将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;
优化模块308,用于通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。
通过本公开,获取目标模型和所述目标模型对应的测试数据集;通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。因为,本公开实施例通过曲线拟合方法对量化模型的检测结果的偏差值进行处理,得到优化函数,并通过优化函数优化量化模型,因此,采用上述技术手段,可以解决现有技术中,量化后的模型的检测结果,存在较大的误差的问题,进而通过优化量化后的模型,提高量化后的模型检测的准确率。
可选地,统计模块306还用于对所述检测结果建立第一平面直角坐标系,其中,所述检测结果,包括:目标对象和所述目标对象对应的预测框;通过所述第一平面直角坐标系统计所述检测结果的偏差值;其中,所述偏差值,包括:所述目标对象的位置与所述目标对象对应的预测框的位置的第一偏差值;和/或所述目标对象的大小与所述目标对象对应的预测框的大小的第二偏差值。
所述测试数据集包括多个用于测试的图片,所述量化模型输出的检测结果也是图片,只是,检测结果的图片相比于用于测试的图片,检测结果的图片有所述目标对象对应的预测框。目标对象是用于测试的图片中需要检测的对象。对所述检测结果建立第一平面直角坐标系,可以是以检测结果的图片的一个长边和一个宽边分别为x轴和y轴,建立第一平面直角坐标系。通过所述第一平面直角坐标系统计所述检测结果的偏差值,可以是在所述第一平面直角坐标系上,将所述目标对象的位置与所述目标对象对应的预测框的位置的距离作为第一偏差值;也可以是在所述第一平面直角坐标系上,所述目标对象的面积与所述目标对象对应的预测框的面积的差值作为第二偏差值。所述目标对象的大小是同于所述目标对象的面积的,所述目标对象对应的预测框的大小也是同于所述目标对象对应的预测框的面积。
可选地,优化模块308还用于以x轴为所述检测结果的坐标,以y轴为所述检测结果的第一偏差值,建立第二平面直角坐标系,其中,所述偏差值包括所述第一偏差值;在所述第二平面直角坐标系上,将所述坐标和所述第一偏差值组成的离散点数据拟合为第一平滑曲线;通过所述第一平滑曲线确定第一优化函数,其中,所述优化函数包括所述第一优化函数。
曲线拟合方法是数据处理中经常用到的数值方法,其本质是使用某一个模型(或者称为方程或方程组),将一系列离散的数据拟合成平滑的曲线或曲面,求解出平滑的曲线或曲面对应函数的参数,从而得到离散点组所表示的坐标与函数值之间的关系。
以x轴为所述检测结果的坐标,比如x轴标为0-640,640为所述检测结果的图片的尺寸。以y轴为所述检测结果的第一偏差值,比如第一偏差值的大小为200,那么y轴可以标为0-200,或者0-300等,其中,y轴可以是以20为一格等。上述数字只需要单位一致就可以,所以上述数字后没有接单位。将所述坐标和所述第一偏差值组成的离散点数据,可以是x轴一个坐标点和x轴该坐标点对应的y轴的一个偏差值组成一个离散点,该离散点的离散点数据就是x轴该坐标点和x轴该坐标点对应的y轴的该偏差值。通过所述第一平滑曲线确定所述第一优化函数,也就是确定所述第一平滑曲线对应的所述第一优化函数。
可选地,优化模块308还用于以x轴为所述检测结果的坐标,以y轴为所述检测结果的第二偏差值,建立第三平面直角坐标系,其中,所述偏差值包括所述第二偏差值;在所述第三平面直角坐标系上,将所述坐标和所述第二偏差值组成的离散点数据拟合为第二平滑曲线;通过所述第二平滑曲线确定第二优化函数,其中,所述优化函数包括所述第二优化函数。
以x轴为所述检测结果的坐标,比如x轴标为0-640,640为所述检测结果的图片的尺寸。以y轴为所述检测结果的第二偏差值,比如第二偏差值的大小为500,那么y轴可以标为0-500,或者0-600等,其中,y轴可以是以50为一格等。上述数字只需要单位一致就可以,所以上述数字后没有接单位。将所述坐标和所述第二偏差值组成的离散点数据,可以是x轴一个坐标点和x轴该坐标点对应的y轴的一个偏差值组成一个离散点,该离散点的离散点数据就是x轴该坐标点和x轴该坐标点对应的y轴的该偏差值。通过所述第二平滑曲线确定所述第二优化函数,也就是确定所述第二平滑曲线对应的所述第二优化函数。
可选地,优化模块308还用于通过第一优化函数优化所述量化模型对应的第一模型数据,其中,所述优化函数,包括:所述第一优化函数和第二优化函数;和/或通过所述第二优化函数优化所述量化模型对应的第一模型数据。
通过所述第一优化函数和/或所述第二优化函数优化所述量化模型对应的第一模型数据,也就是通过所述第一优化函数和/或通过第二优化函数优化所述量化模型。因为所述第一优化函数和所述第二优化函数是通过量化模型输出的所述检测结果的偏差值确定的,所以通过所述第一优化函数和/或所述第二优化函数优化所述量化模型对应的第一模型数据,可以解决现有技术中,量化模型的检测结果,存在较大的误差的问题。
可选地,量化模块304还用于获取所述目标模型对应的第二模型数据;确定所述第二模型数据对应的模型量化缩放因子和模型量化零点;根据所述第二模型数据、所述模型量化缩放因子和所述模型量化零点,通过四舍五入函数计算模型量化中间量;根据所述模型量化中间量,通过模型量化分段函数计算所述量化模型对应的第一模型数据;根据所述第一模型数据确定所述量化模型。
本公开实施例中的训练后量化方法可以是PTQ(post-training quantization)后训练量化,PTQ是对预训练后的网络选择合适的量化操作和校准操作,以实现量化损失的最小化,PTQ量化过程不需要训练,通常不直接更新权重原始数值而是选用合适的量化参数。所述目标模型是需要量化的模型,所述量化模型是对所述目标模型量化后的模型。
可选地,量化模块304还用于通过如下公式确定所述第二模型数据对应的模型量化缩放因子S和模型量化零点Z:
其中,rmax为所述第二模型数据中的最大值,rmin为所述第二模型数据中的最小值,n为所述量化模型对应的第一模型数据的比特数,所述比特数在通过所述训练后量化方法对所述目标模型进行所述量化操作的过程中确定。
通过调整所述比特数,可以调整最终得到的量化模型的大小。
可选地,量化模块304还用于根据如下公式计算模型量化中间量:
其中,xint为所述模型量化中间量,x为所述第二模型数据,round为所述四舍五入函数,Z为所述模型量化零点,S为所述模型量化缩放因子。
可选地,量化模块304还用于根据如下公式计算所述量化模型对应的第一模型数据:
其中,xQ为所述第一模型数据,xint为所述模型量化中间量,clamp为所述模型量化分段函数,n为所述量化模型对应的第一模型数据的比特数,所述比特数在通过所述训练后量化方法对所述目标模型进行所述量化操作的过程中确定;
其中,
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本公开的实施例提供了一种电子设备。
图4示意性示出了本公开实施例提供的一种电子设备的结构框图。
参照图4所示,本公开实施例提供的电子设备400包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401、通信接口402和存储器403通过通信总线404完成相互间的通信;存储器403,用于存放计算机程序;处理器401,用于执行存储器上所存放的程序时,实现上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该输入输出设备与上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标模型和所述目标模型对应的测试数据集;
S2,通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;
S3,将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;
S4,通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。
本公开的实施例还提供了一种计算机可读存储介质。上述计算机可读存储介质上存储有计算机程序,上述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标模型和所述目标模型对应的测试数据集;
S2,通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;
S3,将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;
S4,通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本公开的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本公开不限制于任何特定的硬件和软件结合。
以上所述仅为本公开的优选实施例而已,并不用于限制于本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (11)
1.一种基于量化模型的目标检测方法,其特征在于,包括:
获取目标模型和所述目标模型对应的测试数据集;
通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;
将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;
通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型;
利用优化后的所述量化模型对图像进行目标检测;
其中,所述通过所述优化函数优化所述量化模型,包括:通过所述优化函数优化所述量化模型对应的第一模型数据中目标对象对应的预测框数据,所述第一模型数据包括所述量化模型本身的参数。
2.根据权利要求1所述的方法,其特征在于,所述统计所述检测结果的偏差值,包括:
对所述检测结果建立第一平面直角坐标系,其中,所述检测结果,包括:目标对象和所述目标对象对应的预测框;
通过所述第一平面直角坐标系统计所述检测结果的偏差值;
其中,所述偏差值,包括:所述目标对象的位置与所述目标对象对应的预测框的位置的第一偏差值;和/或
所述目标对象的大小与所述目标对象对应的预测框的大小的第二偏差值。
3.根据权利要求2所述的方法,其特征在于,所述通过曲线拟合方法对所述偏差值进行处理,得到优化函数,包括:
以x轴为所述检测结果的坐标,以y轴为所述检测结果的第一偏差值,建立第二平面直角坐标系,其中,所述偏差值包括所述第一偏差值;
在所述第二平面直角坐标系上,将所述坐标和所述第一偏差值组成的离散点数据拟合为第一平滑曲线;
通过所述第一平滑曲线确定第一优化函数,其中,所述优化函数包括所述第一优化函数。
4.根据权利要求3所述的方法,其特征在于,所述通过所述优化函数优化所述量化模型,包括:
通过所述第一优化函数优化所述量化模型对应的第一模型数据中目标对象对应的预测框的位置。
5.根据权利要求2所述的方法,其特征在于,所述通过曲线拟合方法对所述偏差值进行处理,得到优化函数,包括:
以x轴为所述检测结果的坐标,以y轴为所述检测结果的第二偏差值,建立第三平面直角坐标系,其中,所述偏差值包括所述第二偏差值;
在所述第三平面直角坐标系上,将所述坐标和所述第二偏差值组成的离散点数据拟合为第二平滑曲线;
通过所述第二平滑曲线确定第二优化函数,其中,所述优化函数包括所述第二优化函数。
6.根据权利要求5所述的方法,其特征在于,所述通过所述优化函数优化所述量化模型,包括:
通过所述第二优化函数优化所述量化模型对应的第一模型数据中目标对象对应的预测框的大小。
7.根据权利要求1所述的方法,其特征在于,所述通过训练后量化方法对所述目标模型进行量化操作,得到量化模型,包括:
获取所述目标模型对应的第二模型数据;所述第二模型数据包括所述目标模型本身的参数;
确定所述第二模型数据对应的模型量化缩放因子和模型量化零点;
根据所述第二模型数据、所述模型量化缩放因子和所述模型量化零点,通过四舍五入函数计算模型量化中间量;
根据所述模型量化中间量,通过模型量化分段函数计算所述量化模型对应的第一模型数据;
根据所述第一模型数据确定所述量化模型。
11.一种基于量化模型的目标检测装置,其特征在于,包括:
获取模块,用于获取目标模型和所述目标模型对应的测试数据集;
量化模块,用于通过训练后量化方法对所述目标模型进行量化操作,得到量化模型;
统计模块,用于将所述测试数据集输入所述量化模型,输出检测结果,并统计所述检测结果的偏差值;
优化模块,用于通过曲线拟合方法对所述偏差值进行处理,得到优化函数,并通过所述优化函数优化所述量化模型;以及
利用优化后的所述量化模型对图像进行目标检测的模块;
其中,所述通过所述优化函数优化所述量化模型,包括:通过所述优化函数优化所述量化模型对应的第一模型数据中目标对象对应的预测框数据,所述第一模型数据包括所述量化模型本身的参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111223976.1A CN113673532B (zh) | 2021-10-21 | 2021-10-21 | 基于量化模型的目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111223976.1A CN113673532B (zh) | 2021-10-21 | 2021-10-21 | 基于量化模型的目标检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113673532A CN113673532A (zh) | 2021-11-19 |
CN113673532B true CN113673532B (zh) | 2022-04-22 |
Family
ID=78550663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111223976.1A Active CN113673532B (zh) | 2021-10-21 | 2021-10-21 | 基于量化模型的目标检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113673532B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115759238B (zh) * | 2023-01-04 | 2023-08-11 | 北京科技大学 | 一种量化模型的生成方法及装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096647A (zh) * | 2019-05-10 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 优化量化模型的方法、装置、电子设备及计算机存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030018457A1 (en) * | 2001-03-13 | 2003-01-23 | Lett Gregory Scott | Biological modeling utilizing image data |
CN107358347A (zh) * | 2017-07-05 | 2017-11-17 | 西安电子科技大学 | 基于工业大数据的装备集群健康状态评估方法 |
CN111462238B (zh) * | 2020-04-03 | 2023-04-07 | 清华大学 | 姿态估计优化方法、装置及存储介质 |
CN111783961A (zh) * | 2020-07-10 | 2020-10-16 | 中国科学院自动化研究所 | 基于激活定点拟合的卷积神经网络训练后量化方法及系统 |
CN111860841B (zh) * | 2020-07-28 | 2023-11-14 | Oppo广东移动通信有限公司 | 量化模型的优化方法、装置、终端及存储介质 |
CN112766492A (zh) * | 2021-01-18 | 2021-05-07 | Oppo广东移动通信有限公司 | 模型处理方法、装置、电子设备及存储介质 |
CN112906294A (zh) * | 2021-01-28 | 2021-06-04 | 三星(中国)半导体有限公司 | 用于深度学习模型的量化方法和量化装置 |
CN112950291B (zh) * | 2021-03-31 | 2023-07-21 | 北京奇艺世纪科技有限公司 | 模型的偏差优化方法、装置、设备及计算机可读介质 |
CN113469345A (zh) * | 2021-07-28 | 2021-10-01 | 浙江大华技术股份有限公司 | 量化模型的优化方法和装置、存储介质及电子装置 |
-
2021
- 2021-10-21 CN CN202111223976.1A patent/CN113673532B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096647A (zh) * | 2019-05-10 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 优化量化模型的方法、装置、电子设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113673532A (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008952B (zh) | 一种目标识别方法及设备 | |
CN110929865B (zh) | 网络量化方法、业务处理方法及相关产品 | |
CN111950225B (zh) | 一种芯片布局方法、装置、存储介质和电子设备 | |
CN109272457B (zh) | 一种图像掩膜生成方法、装置及服务器 | |
CN113065639B (zh) | 算子融合方法、系统、设备及存储介质 | |
CN112925637A (zh) | 用于一边缘运算网络的负载平衡装置及方法 | |
CN110020616B (zh) | 一种目标识别方法及设备 | |
CN108885787B (zh) | 训练图像修复模型的方法、图像修复方法、装置、介质及设备 | |
CN110598839A (zh) | 卷积神经网络系统和卷积神经网络量化的方法 | |
CN115249315B (zh) | 面向异构计算设备的深度学习图像分类方法及装置 | |
CN110826685A (zh) | 神经网络卷积计算的方法和装置 | |
CN113673532B (zh) | 基于量化模型的目标检测方法及装置 | |
CN113469345A (zh) | 量化模型的优化方法和装置、存储介质及电子装置 | |
CN111461302B (zh) | 一种基于卷积神经网络的数据处理方法、设备及存储介质 | |
CN115952832A (zh) | 自适应模型量化方法及装置、存储介质及电子装置 | |
CN108596328A (zh) | 一种定点化方法及装置、计算机设备 | |
CN109190757B (zh) | 任务处理方法、装置、设备及计算机可读存储介质 | |
CN116992946A (zh) | 模型压缩方法、装置、存储介质和程序产品 | |
CN111865697A (zh) | 配用电系统边缘计算终端的计算负荷表征方法及装置 | |
CN115797267A (zh) | 图像质量评估方法、系统、电子设备和存储介质 | |
CN114422438B (zh) | 电力通信网络的链路调节方法及装置 | |
CN113469324B (zh) | 模型动态量化方法、装置、电子设备和计算机可读介质 | |
CN115496181A (zh) | 深度学习模型的芯片适配方法、装置、芯片及介质 | |
CN110647805B (zh) | 一种网纹图像识别方法、装置及终端设备 | |
CN113283879A (zh) | 一种施工量的确定方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |