CN109598304B - 分类模型校准方法、装置、设备及可读介质 - Google Patents

分类模型校准方法、装置、设备及可读介质 Download PDF

Info

Publication number
CN109598304B
CN109598304B CN201811474525.3A CN201811474525A CN109598304B CN 109598304 B CN109598304 B CN 109598304B CN 201811474525 A CN201811474525 A CN 201811474525A CN 109598304 B CN109598304 B CN 109598304B
Authority
CN
China
Prior art keywords
image
region
value
probabilistic forecasting
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811474525.3A
Other languages
English (en)
Other versions
CN109598304A (zh
Inventor
胡耀全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201811474525.3A priority Critical patent/CN109598304B/zh
Publication of CN109598304A publication Critical patent/CN109598304A/zh
Application granted granted Critical
Publication of CN109598304B publication Critical patent/CN109598304B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例公开了一种分类模型校准方法、装置、设备及可读介质。其中,方法包括:获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值。本公开实施例能够校准概率预测值,使得目标对象之间的接触边上锯齿被淡化,使接触边变得平滑。

Description

分类模型校准方法、装置、设备及可读介质
技术领域
本公开实施例涉及计算机视觉技术,尤其涉及一种分类模型校准方法、装置、设备及可读介质。
背景技术
随着计算机视觉技术的发展,通过分类模型能够从显示有至少两个目标对象的图像中划分出各个目标对象。
目前,为了提高分类模型的置信度,往往会使分类模型对某一类别的概率预测值远远大于对其它类别的概率预测值。图1示出了分类模型softmax的函数图像,该函数的特征值越大,斜率越大,概率预测值也就越大。可见,分类模型对特征值大的概率预测值远远大于对特征值小的概率预测值,也就是,对某一类别的概率预测值远远大于对其它类别的概率预测值。这会导致不同类别的目标对象在同一类别下的概率预测值相差较大,显然这有利于进行分类。但是采用某一类别的概率预测值提取目标对象时,差别较大的概率预测值会导致目标对象之间的接触边出现明显的锯齿,不够平滑,尤其是概率预测值出现错误时,锯齿现象将更加明显。
发明内容
本公开实施例提供一种分类模型校准方法、装置、设备及可读介质,以平滑目标对象之间的接触边。
第一方面,本公开实施例提供了一种分类模型校准方法,包括:
获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;
采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,所述概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度。
第二方面,本公开实施例还提供了一种分类模型校准装置,包括:
获取模块,用于获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;
校准模块,用于采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,所述概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理装置实现任一实施例所述的分类模型校准方法。
第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现任一实施例所述的分类模型校准方法。
本公开实施例中,通过获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值,以及采用校准因子对各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,从而得到类别间变化幅度较小的概率校准值,使得不同类别的目标对象在同一类别下的概率预测值相差较小,在通过根据各图像区域属于各类别的概率校准值,提取属于各类别的目标对象时,无论概率预测值正确与否,均能够使得目标对象之间的接触边上锯齿被淡化,使接触边变得平滑。
附图说明
图1是现有技术中的softmax函数图像;
图2是本公开实施例一提供的一种分类模型校准方法的流程图;
图3是本公开实施例二提供的一种分类模型校准方法的流程图;
图4是本公开实施例三提供的一种分类模型校准方法的流程图;
图5是本公开实施例四提供的一种分类模型校准装置的结构示意图;
图6是本公开实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
实施例一
图2是本公开实施例一提供的一种分类模型校准方法的流程图,本实施例可适用于对分类模型输出的概率预测值进行校准的情况,该方法可以由分类模型校准装置来执行,该装置可以由硬件和/或软件构成,并集成在电子设备中。结合图2,本公开实施例提供的方法具体包括如下操作:
S110、获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值。
本实施例中,至少两个相邻图像区域分别包括一目标对象,目标对象可以是人、物、背景、前景等,不同图像区域包括的目标对象属于不同类别。可选地,将显示有至少两个目标对象的图像输入至图像识别模型中,得到至少两个目标对象所在的图像区域,进而提取各图像区域的特征。
可选地,分类模型包括softmax,分类模型通过对各图像区域的特征进行分类,从而实现对图像区域的分类,得到各图像区域属于各类别的概率预测值。例如,分类模型输出6个类别的概率预测值,分别为0.05、0.05、0.1、0.1、0.1、0.6,类别号分别是1-6。
S120、采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值。
可选地,概率预测值的类别与校准因子的对应关系可以为一对一或者多对一,校准因子的数量为至少一个。
本实施例通过对各类别的概率预测值进行一一校准,将较大的概率预测值变小,将较小的概率预测值变大,得到概率校准值,使得概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度,概率校准值分布更加集中。接着上述示例,将概率预测值0.6校准为0.5,将概率预测值0.05校准为0.1,则各类别的概率校准值分别为0.1、0.1、0.1、0.1、0.1、0.5。至少存在,概率校准值的1号与6号类别间的变化幅度:0.4小于概率预测值1号与6号类别间的变化幅度:0.55。
可选地,接着,根据各图像区域属于各类别的概率校准值,提取各图像区域中属于各类别的目标对象。
可选地,将各类别的概率校准值分别乘以对应图像区域内各像素的像素值,以提取各图像区域中属于各类别的目标对象。
假设,图像中显示目标对象:猫和背景,猫显示在图像中的图像区域1,背景显示在图像中的图像区域2。分类模型输出类别包括猫和背景。对图像区域进行分类后,得到图像区域1的概率预测值0.9,0.1;图像区域2的概率预测值0.1,0.9。通过校准因子对各类别的概率预测值进行校准后,得到图像区域1的概率校准值0.8,0.2;图像区域2的概率校准值0.2,0.8。接着,将图像区域1和2中猫类别的概率校准值分别乘以对应图像区域内各像素点的像素值,从而提取出猫类别的目标对象。因为图像区域1和2中猫类别的概率校准值分别为0.8和0.2,较校准前的0.9和0.1差距要小,则概率校准值乘以像素值后,猫和背景之间的像素值差较小,在视觉效果上,猫与背景的接触边变得平滑,锯齿被淡化。同理,将图像区域1和2中背景类别的概率校准值分别乘以对应图像区域内各像素点的像素值,从而提取出背景类别的目标对象,进一步减小猫和背景之间的像素值差,使接触边更为平滑。
本公开实施例中,通过获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值,以及采用校准因子对各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,从而得到类别间变化幅度较小的概率校准值,使得不同类别的目标对象在同一类别下的概率预测值相差较小,在根据各图像区域属于各类别的概率校准值,提取属于各类别的目标对象时,无论概率预测值正确与否,均能够使得使得目标对象之间的接触边上锯齿被淡化,使接触边变得平滑。
实施例二
图3是本公开实施例二提供的一种分类模型校准方法的流程图,本实施例对上述实施例的各可选实施方式进一步优化,为了提高校准效率,且不影响预测类别结果,对概率预测值进行分组校准。结合图3,本实施例提供的方法具体包括以下操作:
S210、获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值。
下面,以各图像区域中的第一图像区域为例,详细说明分组过程以及目标对象的提取过程。其中,第一图像区域是各图像区域中的任一图像区域。
S220、对于各图像区域中的第一图像区域,将第一图像区域属于各类别的概率预测值划分为至少两组。
在一可选实施方式中,将第一图像区域属于各类别的概率预测值之差在预设范围内的概率预测值划分至一组。在上述示例中,将类别号1、2的概率预测值划分至第1组,将类别号3、4和5的概率预测值划分至第2组,将类别号6的概率预测值划分至第3组。
当然,也可以采用其他分组方式,例如,将第一图像区域属于各类别的各类别的概率预测值平均划分为至少两组,在上述示例中,可以将类别号1、2的概率预测值划分至第1组,将类别号3、4的概率预测值划分至第2组,将类别号5、6的概率预测值划分至第3组。
S230、将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值。
一组概率预测值对应一个校准因子,即同一组内的概率预测值进行同等程度的校准。通过将第一图像区域属于各类别的概率预测值之差在预设范围内的概率预测值划分至一组,并进行同等程度的校准,能够保证概率校准值之间的大小关系基本不变,即最大的概率预测值校准后依然是最大的概率校准值,最小的概率预测值校准后依然是最小的概率校准值,尽量不影响预测类别结果。
可选地,接着,根据第一图像区域属于各类别的概率校准值,提取第一图像区域中属于各类别的目标对象。
本实施例中,通过将各类别的概率预测值划分为至少两组,将各组概率预测值乘以对应的校准因子,得到各图像区域属于各类别的概率校准值,从而以组为单位,批量对概率预测值进行校准,提高校准效率;而且,各组对应有校准因子,保证概率预测值进行不同程度的校准,提高校准准确性。进一步,通过将概率预测值之差在预设范围内的概率预测值划分至一组,尽量不影响预测类别结果。
实施例三
图4是本公开实施例三提供的一种分类模型校准方法的流程图。本实施例对上述各实施例的各可选实施方式进一步优化,本实施例提供了校准因子的计算公式,以及概率校准值的计算公式。结合图4,本实施例提供的方法具体包括以下操作:
S310、获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值。
S320、将第一图像区域属于各类别的概率预测值划分为至少两组。
分组方式详见实施例二的相关描述,此处不再赘述。
S330、根据公式求解T;
其中,i是组号,N是分组总数,Pi是第一图像区域对应的第i组中各概率预测值之和,λi是第i组概率预测值的权值,T是待求解的参数。在大多数情况下,各类别的概率预测值之和为1,相应地,各类别的概率校准值之和也应为1。
其中,权值表示概率预测值的校准程度,可选地,权值可以进行自定义,各组概率预测值的权值可以相同,也可以不同。
可选地,为了提高校准的准确性,通过学习得到各组概率预测值的权值。可选地,在根据公式求解T之前,还包括:获取包括至少两个相邻图像区域的训练样本;获取分类模型对每个训练样本中至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率训练值;按照概率预测值的分组方式,将各图像区域属于各类别的概率训练值分别划分为至少两组;根据各图像区域对应的各组中的概率训练值,得到各图像区域对应的各组概率预测值的权值。可选地,将各图像区域对应的各组中的概率训练值相加,得到各组概率训练值的和;对各组概率训练值的和进行归一化,得到各图像区域对应的各组概率预测值的权值。
在一示例中,训练样本为100张图像,对每张图像中两个相邻图像区域进行分类后,得到两个图像区域属于6个类别的概率训练值,按照概率预测值的分组方式,以第一图像区域为例,将第一图像区域属于1、2类别的概率训练值划分至第1组,属于3、4、5类别的概率训练值划分至第2组,属于6类别的概率训练值划分至第3组,得到各组中多个样本的概率训练值。将多个样本的概率训练值相加,分别得到各组概率训练值的和,例如为20、30、50。将20、30和50归一化,得到各组概率预测值的权值0.2、0.3和0.5。
接着上述示例,6个概率预测值分别为0.05、0.05、0.1、0.1、0.1、0.6,类别号分别是1-6,将0.05、0.05划分至第1组中,将0.1、0.1、0.1划分至第2组中,将0.6划分至第3组中。则,P1=0.1,P2=0.3,P3=0.6。经过学习得到权值λ1=0.2,λ2=0.3,λ3=0.5。
将上述参数带入公式解得T=2.7。
S331、计算各组概率预测值对应的校准因子λi×T。
经计算,各组概率预测值对应的校准因子依次为0.54、0.81、1.35。
S340、根据公式计算第一图像区域属于类别y的概率校准值p′y
其中,y是类别号,py是第一图像区域属于类别y的概率预测值。经计算得到,概率校准值依次为0.093、0.093、0.123、0.123、0.123、0.44。
可选地,接着,根据第一图像区域属于各类别的概率校准值,提取第一图像区域中属于各类别的目标对象。
本实施例中,通过根据公式求解T,并计算各组概率预测值对应的校准因子λi×T,从而不改变预测类别结果,且令概率校准值之和为1,保证了概率校准值的合理性和有效性。
实施例四
图5是本公开实施例四提供的一种分类模型校准装置的结构示意图,包括:获取模块41和校准模块42。
获取模块41,用于获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;
校准模块42,用于采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度。
本实施例中,通过获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值,以及采用校准因子对各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,从而得到类别间变化幅度较小的概率校准值,使得不同类别的目标对象在同一类别下的概率预测值相差较小,在通过根据各图像区域属于各类别的概率校准值,提取属于各类别的目标对象时,无论概率预测值正确与否,均能够使得使得目标对象之间的接触边上锯齿被淡化,使接触边变得平滑。
可选地,该装置还包括提取模块,用于根据各图像区域属于各类别的概率校准值,提取各图像区域中属于各类别的目标对象。
可选地,对于各图像区域中的第一图像区域,校准模块42包括划分单元和运算单元。其中,划分单元用于将第一图像区域属于各类别的概率预测值划分为至少两组。运算单元用于将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值。
可选地,划分单元具体用于:将第一图像区域属于各类别的概率预测值之差在预设范围内的概率预测值划分至一组。
可选地,该装置还包括校准因子计算模块,用于在将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值之前,根据公式求解T;计算各组概率预测值对应的校准因子λi×T;其中,i是组号,N是分组总数,Pi是第一图像区域对应的第i组中各概率预测值之和,λi是第i组概率预测值的权值,T是待求解的参数。
可选地,运算单元具体用于:根据公式计算第一图像区域属于类别y的概率校准值p′y;其中,y是类别号,py是第一图像区域属于类别y的概率预测值。
可选地,该装置还包括:训练样本获取模块,用于获取包括至少两个相邻图像区域的训练样本;概率训练值获取模块,用于获取分类模型对每个训练样本中至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率训练值;概率训练值划分模块,用于按照概率预测值的分组方式,将各图像区域属于各类别的概率训练值分别划分为至少两组;权值计算模块,用于根据各图像区域对应的各组中的概率训练值,得到各图像区域对应的各组概率预测值的权值。
可选地,权值计算模块具体用于:将各图像区域对应的各组中的概率训练值相加,得到各组概率训练值的和;对各组概率训练值的和进行归一化,得到各图像区域对应的各组概率预测值的权值。
本公开实施例所提供的分类模型校准装置可执行本公开任意实施例所提供的分类模型校准方法,具备执行方法相应的功能模块和有益效果。
实施例五
下面参考图6,其示出了适于用来实现本公开实施例的电子设备500的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,或者各种形式的服务器,如独立服务器或者服务器集群。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储装置(ROM)502中的程序或者从存储装置505加载到随机访问存储装置(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行可操作控件的显示方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置505被安装,或者从ROM502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储装置(RAM)、只读存储装置(ROM)、可擦式可编程只读存储装置(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储装置(CD-ROM)、光存储装置件、磁存储装置件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该处理装置执行时,使得该电子设备:获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取概率预测值的模块”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种分类模型校准方法,其特征在于,包括:
获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;
采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,所述概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度。
2.根据权利要求1所述的方法,其特征在于,对于各图像区域中的第一图像区域,采用校准因子对第一图像区域属于各类别的概率预测值进行校准,得到第一图像区域属于各类别的概率校准值,包括:
将第一图像区域属于各类别的概率预测值划分为至少两组;
将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值。
3.根据权利要求2所述的方法,其特征在于,所述将第一图像区域属于各类别的概率预测值划分为至少两组,包括:
将第一图像区域属于各类别的概率预测值之差在预设范围内的概率预测值划分至一组。
4.根据权利要求2所述的方法,其特征在于,在将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值之前,还包括:
根据公式求解T;
计算各组概率预测值对应的校准因子λi×T;
其中,i是组号,N是分组总数,Pi是第一图像区域对应的第i组中各概率预测值之和,λi是第i组概率预测值的权值,T是待求解的参数。
5.根据权利要求4所述的方法,其特征在于,所述将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值,包括:
根据公式计算第一图像区域属于类别y的概率校准值p′y
其中,y是类别号,py是第一图像区域属于类别y的概率预测值。
6.根据权利要求4所述的方法,其特征在于,在根据公式求解T之前,还包括:
获取包括至少两个相邻图像区域的训练样本;
获取分类模型对每个训练样本中至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率训练值;
按照概率预测值的分组方式,将各图像区域属于各类别的概率训练值分别划分为至少两组;
根据各图像区域对应的各组中的概率训练值,得到各图像区域对应的各组概率预测值的权值。
7.根据权利要求6所述的方法,其特征在于,所述根据各图像区域对应的各组中的概率训练值,得到各图像区域对应的各组概率预测值的权值,包括:
将各图像区域对应的各组中的概率训练值相加,得到各组概率训练值的和;
对各组概率训练值的和进行归一化,得到各图像区域对应的各组概率预测值的权值。
8.一种分类模型校准装置,其特征在于,包括:
获取模块,用于获取分类模型对至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率预测值;
校准模块,用于采用校准因子对各图像区域属于各类别的概率预测值进行校准,得到各图像区域属于各类别的概率校准值,所述概率校准值的至少两个类别间的变化幅度小于概率预测值相应类别间的变化幅度。
9.根据权利要求8所述的装置,其特征在于,对于各图像区域中的第一图像区域,校准模块包括:
划分单元,用于将第一图像区域属于各类别的概率预测值划分为至少两组;
运算单元,用于将各组概率预测值乘以对应的校准因子,得到第一图像区域属于各类别的概率校准值。
10.根据权利要求9所述的装置,其特征在于,所述划分单元具体用于:
将第一图像区域属于各类别的概率预测值之差在预设范围内的概率预测值划分至一组。
11.根据权利要求9所述的装置,其特征在于,还包括:校准因子计算模块,用于:
根据公式求解T;
计算各组概率预测值对应的校准因子λi×T;
其中,i是组号,N是分组总数,Pi是第一图像区域对应的第i组中各概率预测值之和,λi是第i组概率预测值的权值,T是待求解的参数。
12.根据权利要求11所述的装置,其特征在于,所述运算单元具体用于:
根据公式计算第一图像区域属于类别y的概率校准值p′y
其中,y是类别号,py是第一图像区域属于类别y的概率预测值。
13.根据权利要求11所述的装置,其特征在于,还包括:
训练样本获取模块,用于获取包括至少两个相邻图像区域的训练样本;
概率训练值获取模块,用于获取分类模型对每个训练样本中至少两个相邻图像区域进行分类后,得到的各图像区域属于各类别的概率训练值;
概率训练值划分模块,用于按照概率预测值的分组方式,将各图像区域属于各类别的概率训练值分别划分为至少两组;
权值计算模块,用于根据各图像区域对应的各组中的概率训练值,得到各图像区域对应的各组概率预测值的权值。
14.根据权利要求13所述的装置,其特征在于,所述权值计算模块具体用于:
将各图像区域对应的各组中的概率训练值相加,得到各组概率训练值的和;
对各组概率训练值的和进行归一化,得到各图像区域对应的各组概率预测值的权值。
15.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理装置实现如权利要求1-7中任一所述的分类模型校准方法。
16.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-7中任一所述的分类模型校准方法。
CN201811474525.3A 2018-12-04 2018-12-04 分类模型校准方法、装置、设备及可读介质 Active CN109598304B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811474525.3A CN109598304B (zh) 2018-12-04 2018-12-04 分类模型校准方法、装置、设备及可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811474525.3A CN109598304B (zh) 2018-12-04 2018-12-04 分类模型校准方法、装置、设备及可读介质

Publications (2)

Publication Number Publication Date
CN109598304A CN109598304A (zh) 2019-04-09
CN109598304B true CN109598304B (zh) 2019-11-08

Family

ID=65960927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811474525.3A Active CN109598304B (zh) 2018-12-04 2018-12-04 分类模型校准方法、装置、设备及可读介质

Country Status (1)

Country Link
CN (1) CN109598304B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110650379B (zh) * 2019-09-26 2022-04-01 北京达佳互联信息技术有限公司 视频摘要生成方法、装置、电子设备及存储介质
CN112070744B (zh) * 2020-09-08 2022-11-22 济南博观智能科技有限公司 一种人脸识别的方法、系统、设备及可读存储介质
CN112070034A (zh) * 2020-09-10 2020-12-11 北京字节跳动网络技术有限公司 图像识别方法、装置、电子设备和计算机可读介质
CN112182214B (zh) * 2020-09-27 2024-03-19 中国建设银行股份有限公司 一种数据分类方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609645A (zh) * 2017-09-21 2018-01-19 百度在线网络技术(北京)有限公司 用于训练卷积神经网络的方法和装置
CN107679547A (zh) * 2017-08-24 2018-02-09 阿里巴巴集团控股有限公司 一种针对二分类模型的数据处理方法、装置以及电子设备
CN108009638A (zh) * 2017-11-23 2018-05-08 深圳市深网视界科技有限公司 一种神经网络模型的训练方法、电子设备及存储介质
CN108156519A (zh) * 2017-12-25 2018-06-12 深圳Tcl新技术有限公司 图像分类方法、电视设备及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100478993C (zh) * 2007-07-13 2009-04-15 天津大学 根据边缘和亮度特征进行自适应调整的图像增强方法
CN106339674B (zh) * 2016-08-17 2019-08-20 中国地质大学(武汉) 基于边缘保持与图割模型的高光谱影像分类方法
CN108133222B (zh) * 2016-12-01 2021-11-02 富士通株式会社 为数据库确定卷积神经网络cnn模型的装置和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679547A (zh) * 2017-08-24 2018-02-09 阿里巴巴集团控股有限公司 一种针对二分类模型的数据处理方法、装置以及电子设备
CN107609645A (zh) * 2017-09-21 2018-01-19 百度在线网络技术(北京)有限公司 用于训练卷积神经网络的方法和装置
CN108009638A (zh) * 2017-11-23 2018-05-08 深圳市深网视界科技有限公司 一种神经网络模型的训练方法、电子设备及存储介质
CN108156519A (zh) * 2017-12-25 2018-06-12 深圳Tcl新技术有限公司 图像分类方法、电视设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN109598304A (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
CN109598304B (zh) 分类模型校准方法、装置、设备及可读介质
CN111476309B (zh) 图像处理方法、模型训练方法、装置、设备及可读介质
CN110399848A (zh) 视频封面生成方法、装置及电子设备
CN111967467B (zh) 图像目标检测方法、装置、电子设备和计算机可读介质
CN110704751A (zh) 数据处理方法、装置、电子设备及存储介质
CN109947989A (zh) 用于处理视频的方法和装置
CN110413812A (zh) 神经网络模型的训练方法、装置、电子设备及存储介质
CN110278447A (zh) 基于连续特征的视频推送方法、装置及电子设备
CN109961032A (zh) 用于生成分类模型的方法和装置
EP4113376A1 (en) Image classification model training method and apparatus, computer device, and storage medium
CN110059623A (zh) 用于生成信息的方法和装置
CN109062560A (zh) 用于生成信息的方法和装置
CN110069997B (zh) 场景分类方法、装置及电子设备
CN108182240A (zh) 兴趣点新增率预测模型训练及预测方法、装置及存储介质
CN110135903A (zh) 广告位排位方法、系统、介质和电子设备
CN110008926A (zh) 用于识别年龄的方法和装置
CN111915689B (zh) 用于生成目标函数的方法、装置、电子设备和计算机可读介质
CN109165077A (zh) 一种网页处理方法、装置、电子设备及存储介质
CN108959636A (zh) 数据处理方法、装置、系统、计算机可读介质
CN113723712B (zh) 风电功率预测方法、系统、设备及介质
CN110300329A (zh) 基于离散特征的视频推送方法、装置及电子设备
US20230281983A1 (en) Image recognition method and apparatus, electronic device, and computer-readable medium
CN110348367A (zh) 视频分类方法、视频处理方法、装置、移动终端及介质
CN109635821A (zh) 图像区域的特征提取方法、装置、设备及可读介质
CN110046670A (zh) 特征向量降维方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant