CN112184802B - 标定框的调整方法、装置及存储介质 - Google Patents
标定框的调整方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112184802B CN112184802B CN201910605853.0A CN201910605853A CN112184802B CN 112184802 B CN112184802 B CN 112184802B CN 201910605853 A CN201910605853 A CN 201910605853A CN 112184802 B CN112184802 B CN 112184802B
- Authority
- CN
- China
- Prior art keywords
- calibration frame
- objects
- current calibration
- pixel
- adjusting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000010586 diagram Methods 0.000 claims description 8
- 238000013499 data model Methods 0.000 abstract description 18
- 238000012545 processing Methods 0.000 abstract description 11
- 238000012549 training Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 235000013361 beverage Nutrition 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G06T3/04—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Abstract
本申请公开了一种标定框的调整方法、装置及存储介质,属于图像处理领域。所述方法包括:获取样本图像的掩码图和当前标定框的位置信息;根据所述当前标定框的位置信息和所述掩码图中所述当前标定框所标定的目标对象的位置信息,对所述当前标定框的一个或多个边的位置进行调整。本申请按照当前标定框的位置信息和目标对象的位置信息,对当前标定框的一个或多个边的位置进行调整,这样可以减少当前标定框内的干扰信息,进而保证数据模型训练的准确度。
Description
技术领域
本申请涉及图像处理领域,特别涉及一种标定框的调整方法、装置及存储介质。
背景技术
目前,基本都是通过数据模型对图像中的对象进行识别,比如,通过数据模型对图像中的人脸、人体、物体等进行识别。其中,数据模型是通过样本数据进行训练得到,该样本数据可以从样本图像中的标定框内提取得到。也即是,为了进行数据模型的训练,可以通过标定框对样本图像中的对象进行标定,之后,可以提取标定框内的对象的特征,将提取的特征作为样本数据进行数据模型的训练。
相关技术主要是通过人工在样本图像中添加标定框,以对样本图像中的对象进行标定。但是,人工添加的标定框良莠不齐,也即是,有的标定框内可能包括的干扰信息比较多,而有的标定框内可能包括的干扰信息比较少。当标定框内包括的干扰信息较多时,对数据模型的训练过程可能会造成干扰,进而降低数据模型的准确度。
发明内容
本申请提供了一种标定框的调整方法、装置及存储介质,可以解决相关技术的数据模型的准确度不高的问题。所述技术方案如下:
一方面,提供了一种标定框的调整方法,所述方法包括:
获取样本图像的掩码图和当前标定框的位置信息;
根据所述当前标定框的位置信息和所述掩码图中所述当前标定框所标定的目标对象的位置信息,对所述当前标定框的一个或多个边的位置进行调整。
可选地,所述根据所述当前标定框的位置信息和所述掩码图中所述当前标定框所标定的目标对象的位置信息,对所述当前标定框的一个或多个边的位置进行调整,包括:
根据所述当前标定框的位置信息,确定所述掩码图中所述当前标定框所标定的目标对象的像素值;
确定所述掩码图中的背景的像素值;
根据所述目标对象的像素值以及所述背景的像素值,对所述当前标定框的一个或多个边的位置进行调整。
可选地,所述根据所述目标对象的像素值以及所述背景的像素值,对所述当前标定框的一个或多个边的位置进行调整,包括:
根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框内其他对象的像素占比,以及所述当前标定框的底边上所述其他对象的像素占比,所述其他对象为所述掩码图中除所述目标对象之外且不属于背景的对象;
如果所述当前标定框内所述其他对象的像素占比不小于第一阈值,和/或,所述当前标定框的底边上所述其他对象的像素占比不小于第二阈值,则对所述当前标定框的底边的位置进行调整。
可选地,所述对所述当前标定框的底边的位置进行调整,包括:
将所述当前标定框的底边朝向所述当前标定框的顶边方向移动,直至所述当前标定框内所述其他对象的像素占比小于所述第一阈值且所述当前标定框的底边上所述其他对象的像素占比小于所述第二阈值为止。
可选地,所述对所述当前标定框的底边的位置进行调整之前,还包括:
如果所述目标对象的类型为第一类型,则执行对所述当前标定框的底边的位置进行调整的步骤。
可选地,所述对所述当前标定框的底边的位置进行调整之后,还包括:
如果所述目标对象的类型为第二类型,则根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框的第一侧边上所述其他对象的像素占比以及第二侧边上所述其他对象的像素占比;
根据所述第一侧边上所述其他对象的像素占比和所述第二侧边上所述其他对象的像素占比,对所述第一侧边和/或所述第二侧边的位置进行调整。
可选地,所述根据所述第一侧边上所述其他对象的像素占比和所述第二侧边上所述其他对象的像素占比,对所述第一侧边和/或所述第二侧边的位置进行调整,包括:
如果所述第一侧边上所述其他对象的像素占比不小于第三阈值且所述第二侧边上所述其他对象的像素占比小于第四阈值,则对所述第一侧边的位置进行调整;
如果所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第二侧边的位置进行调整;
如果所述第一侧边上所述其他对象的像素占比不小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第一侧边和所述第二侧边的位置均进行调整。
可选地,所述对所述第一侧边和所述第二侧边的位置均进行调整,包括:
将所述第一侧边朝向所述第二侧边的方向进行移动,将所述第二侧边朝向所述第一侧边的方向进行移动,直至所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比小于所述第四阈值,或者所述第一侧边和所述第二侧边的移动距离之和大于第一距离阈值为止。
另一方面,提供了一种标定框的调整装置,所述装置包括:
获取模块,用于获取样本图像的掩码图和当前标定框的位置信息;
调整模块,用于根据所述当前标定框的位置信息和所述掩码图中所述当前标定框所标定的目标对象的位置信息,对所述当前标定框的一个或多个边的位置进行调整。
可选地,所述调整模块包括:
第一确定子模块,用于根据所述当前标定框的位置信息,确定所述掩码图中所述当前标定框所标定的目标对象的像素值;
第二确定子模块,用于确定所述掩码图中的背景的像素值;
调整子模块,用于根据所述目标对象的像素值以及所述背景的像素值,对所述当前标定框的一个或多个边的位置进行调整。
可选地,所述调整子模块包括:
第一确定单元,用于根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框内其他对象的像素占比,以及所述当前标定框的底边上所述其他对象的像素占比,所述其他对象为所述掩码图中除所述目标对象之外且不属于背景的对象;
第一调整单元,用于如果所述当前标定框内所述其他对象的像素占比不小于第一阈值,和/或,所述当前标定框的底边上所述其他对象的像素占比不小于第二阈值,则对所述当前标定框的底边的位置进行调整。
可选地,所述第一调整单元主要用于:
将所述当前标定框的底边朝向所述当前标定框的顶边方向移动,直至所述当前标定框内所述其他对象的像素占比小于所述第一阈值且所述当前标定框的底边上所述其他对象的像素占比小于所述第二阈值为止。
可选地,所述调整子模块还包括:
触发单元,用于如果所述目标对象的类型为第一类型,则触发所述调整模块对所述当前标定框的底边的位置进行调整。
可选地,所述调整子模块还包括:
第二确定单元,用于如果所述目标对象的类型为第二类型,则根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框的第一侧边上所述其他对象的像素占比以及第二侧边上所述其他对象的像素占比;
第二调整单元,用于根据所述第一侧边上所述其他对象的像素占比和所述第二侧边上所述其他对象的像素占比,对所述第一侧边和/或所述第二侧边的位置进行调整。
可选地,所述第二调整单元主要用于:
第一调整子单元,用于如果所述第一侧边上所述其他对象的像素占比不小于第三阈值且所述第二侧边上所述其他对象的像素占比小于第四阈值,则对所述第一侧边的位置进行调整;
第二调整子单元,用于如果所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第二侧边的位置进行调整;
第三调整子单元,用于如果所述第一侧边上所述其他对象的像素占比不小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第一侧边和所述第二侧边的位置均进行调整。
可选地,所述第三调整子单元主要用于:
将所述第一侧边朝向所述第二侧边的方向进行移动,将所述第二侧边朝向所述第一侧边的方向进行移动,直至所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比小于所述第四阈值,或者所述第一侧边和所述第二侧边的移动距离之和大于第一距离阈值为止。
另一方面,提供了一种标定框的调整装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述所述的任一项标定框的调整方法的步骤。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述所述的任一项标定框的调整方法。
另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的任一项标定框的调整方法。
本申请提供的技术方案至少可以带来以下有益效果:
在本申请中,可以根据当前标定框的位置信息和掩码图中当前标定框所标定的目标对象的位置信息,自动对当前标定框的一个或多个边的位置进行调整。无需通过人工进行调整,这样,不仅可以减少当前标定框内的干扰信息,进而保证数据模型训练的准确度,而且还可以减少人工的操作,提高了标定框调整的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种标定框的调整方法的流程图;
图2是本申请实施例提供的一种实施环境的示意图;
图3是本申请实施例提供的第一种标定框的调整装置的结构示意图;
图4是本申请实施例提供的第二种标定框的调整装置的结构示意图;
图5是本申请实施例提供的第三种标定框调整装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例提供的方法进行详细的解释说明之前,先对本申请实施例涉及的应用场景进行介绍。
在一些场景中,当需要确定冰箱中的各类饮品的数量时,可以通过数据模型对冰箱中的各类饮品进行识别,然后实时更新各类饮品的数量。这样,就需要事先从样本图像中,通过标定框对需要识别的各类饮品进行标定,然后提取标定框所标定的饮品的特征,进而通过提取的特征进行数据模型的训练。其中,通过标定框对样本图像中需要识别的各类饮品进行标定的过程中,需要对标定框进行调整,以保证标定框内的干扰信息较少,从而保证数据模型的训练准确度。
在另一些场景中,当需要确定监控区域内的可疑人员时,可以通过数据模型对监控画面内的人脸图像进行识别,以确定监控区域内是否出现可疑人员。当通过人脸检测确定监控区域出现可疑人员时,可以进行异常报警。这样,就需要事先从样本图像中,通过标定框对人脸图像进行标定,然后提取标定框所标定的人脸图像的特征,进而通过提取的特征进行数据模型的训练。其中,通过标定框对样本图像中的人脸图像进行标定的过程中,需要对标定框进行调整,以保证标定框内的干扰信息较少,从而保证数据模型的训练准确度。
需要说明的是,上述仅是本申请实施例涉及的应用场景的一种示例,本申请实施例还可以应用到其他的场景中,在此不再一一赘述。
请参考图1,图1是根据一示例性实施例示出的一种标定框的调整方法的流程图,该方法应用于标定框调整装置中,该标定框调整装置可以为计算机、掌上电脑等。该方法包括如下步骤:
步骤101:获取样本图像的掩码图和当前标定框的位置信息。
在一些实施例中,请参考图2,标定框调整装置201可以与存储设备202进行通信,且存储设备202中可以存储有样本图像的掩码图以及样本图像中各个标定框的位置信息。这样,标定框调整装置201可以从存储设备202中获取样本图像的掩码图以及当前标定框的位置信息。
在另一些实施例中,标定框调整装置中可以存储有样本图像的掩码图以及样本图像中各个标定框的位置信息。这样,标定框调整装置可以从本地获取样本图像的掩码图以及当前标定框的位置信息。
需要说明的一点是,样本图像的掩码图是指将样本图像中同一个物体的像素点设置为同一像素值,不同物体的像素点设置为不同的像素值后得到的图像。示例性地,假设样本图像中包括3个物体,分别为物体1、物体2和物体3,物体1的像素点的像素值可以设置为120,物体2的像素点的像素值可以设置为210,物体3的像素点的像素值可以设置为20,样本图像的背景的像素点的像素值可以设置为0。
需要说明的另一点是,样本图像中的各个标定框可以为人工进行添加的,也可以为标定框调整装置或者其他设备进行添加的,本申请实施例对此不作限定。另外,当前标定框可以为样本图像中添加的任一标定框,本申请实施例以当前标定框为例,对标定框的调整过程进行详细描述,关于其他标定框,也可以采用本申请实施例提供的方法进行调整。
在一些实施例中,样本图像中的标定框可以为多边形,这样,当前标定框的位置信息可以为当前标定框的多个顶点的坐标。作为一种示例,样本图像中的标定框可以为四边形,这样,当前标定框的位置信息可以为当前标定框的四个顶点的坐标。
在获取到样本图像的掩码图和当前标定框的位置信息之后,可以根据当前标定框的位置信息和掩码图中当前标定框所标定的目标对象的位置信息,对当前标定框的一个或多个边的位置进行调整。在一些实施例中,可以根据当前标定框的位置信息和掩码图中当前标定框所标定的目标对象的位置信息,按照下述步骤102-104的方法,对当前标定框的一个或多个边的位置进行调整。
步骤102:根据当前标定框的位置信息,确定掩码图中当前标定框所标定的目标对象的像素值,确定掩码图中的背景的像素值。
基于上述描述,掩码图中同一物体的像素点的像素值相同,不同物体的像素点的像素值不同,且一个标定框用于标定一个物体。另外,标定框调整装置中存储有标定框的位置信息与标定框所标定的对象的像素值之间的对应关系,且标定框调整装置中还存储有背景的像素值。因此,可以根据当前标定框的位置信息,从上述对应关系中获取当前标定框所标定的目标对象的像素值,并从本地获取掩码图中的背景的像素值。
通过上述步骤101-102确定目标对象的像素值和背景的像素值之后,可以按照下述步骤103-104,根据目标对象的像素值以背景的像素值,对当前标定框的一个或多个边的位置进行调整。
步骤103:根据目标对象的像素值以及背景的像素值,确定当前标定框内其他对象的像素占比,以及当前标定框的底边上其他对象的像素占比,其他对象为掩码图中除目标对象之外且不属于背景的对象。
在一些实施例中,通过当前标定框对目标对象进行标定的过程中,当前标定框内可能还包括其他对象的信息,也即是,当前标定框内除了包括目标对象之前,可能还包括其他对象等干扰信息,因此,为了减少当前标定框内的干扰信息,可以根据目标对象的像素值以及背景的像素值,确定当前标定框内其他对象的像素占比,以及当前标定框的底边上其他对象的像素占比。
作为一种示例,根据目标对象的像素值以及背景的像素值,确定当前标定框内其他对象的像素占比的操作可以为:统计当前标定框内的像素点的总数量,根据目标对象的像素值以及背景的像素值,统计当前标定框内目标对象的像素点的数量以及背景的像素点的数量。将当前标定框内目标对象的像素点的数量以及背景的像素点的数量进行加和,得到第一数量,将当前标定框内的像素点的总数量减去第一数量,得到当前标定框其他对象的像素点的数量。将当前标定框内其他对象的像素点的数量除以当前标定框内的像素点的总数量,得到当前标定框内的其他对象的像素占比。
同理,根据目标对象的像素值以及背景的像素值,确定当前标定框的底边上其他对象的像素占比的操作可以为:统计当前标定框的底边上像素点的总数量,根据目标对象的像素值以及背景的像素值,统计当前标定框的底边上目标对象的像素点的数量以及背景的像素点的数量。将当前标定框的底边上目标对象的像素点的数量以及背景的像素点的数量进行加和,得到第二数量,将当前标定框的底边上像素点的总数量减去第二数量,得到当前标定框的底边上其他对象的像素点的数量。将当前标定框的底边上其他对象的像素点的数量除以当前标定框的底边上像素点的总数量,得到当前标定框的底边上其他对象的像素占比。
步骤104:如果当前标定框内其他对象的像素占比不小于第一阈值,和/或,当前标定框的底边上其他对象的像素占比不小于第二阈值,则对当前标定框的底边的位置进行调整。
如果当前标定框内其他对象的像素占比不小于第一阈值,和/或,当前标定框的底边上其他对象的像素占比不小于第二阈值,则表明当前标定框内的其他对象的像素占比较大,也即是,当前标定框内的干扰信息较多,因此,可以对当前标定框的底边的位置进行调整。如果当前标定框内其他对象的像素占比小于第一阈值,且当前标定框的底边上其他对象的像素占比小于第二阈值,则表明当前标定框内的其他对象的像素占比较小,也即是,当前标定框内的干扰信息较少,因此,可以不对当前标定框的底边的位置进行调整。
需要说明的是,第一阈值和第二阈值可以根据使用需求进行设置,且第一阈值可以与第二阈值相同或者不同,本申请实施例对此不作限定。
在一些实施例中,对当前标定框的底边的位置进行调整的操作可以为:将当前标定框的底边朝向当前标定框的顶边方向移动,直至当前标定框内其他对象的像素占比小于第一阈值且当前标定框的底边上其他对象的像素占比小于第二阈值为止。也即是,对当前标定框的底边的位置进行移动的过程中,还可以确定底边移动后的当前标定框内其他对象的像素占比,以及底边移动后的当前标定框的底边上其他对象的像素占比。一旦当前标定框内其他对象的像素占比小于第一阈值,且当前标定框的底边上其他对象的像素占比小于第二阈值,则停止对当前标定框的底边进行移动。通过这样的调整方式,可以保证当前标定框的底边位置的调整准确度。
上述对当前标定框的底边的位置进行调整的过程是一种示例,实际应用中,还可以根据不同的需求进行不同的调整。比如,在另一些实施例中,对当前标定框的底边的位置进行调整的操作可以为:将当前标定框的底边朝向当前标定框的顶边方向移动第二距离阈值。也即是,如果当前标定框内其他对象的像素占比不小于第一阈值,和/或,当前标定框的底边上其他对象的像素占比不小于第二阈值,那么就可以将当前标定框的底边朝向当前标定框的顶边方向移动第二距离阈值。通过这样的调整方式,可以提高标定框的底边位置的调整效率。其中,第二距离阈值可以按照需求进行设置,本申请实施例对此不作限定。
值得注意的是,对象的顶部通常不容易被遮挡,对象的底部容易被遮挡,比如,饮品瓶的瓶顶通常不容易被遮挡,饮品瓶的瓶身或者瓶底容易被遮挡。人体的头顶通常不容易被遮挡,人体的腿部或者脚部容易被遮挡。因此,标定框的顶部通常为对象的顶部对应的边,标定框的底边通常为对象的底部对应的边。由于对象的顶部通常不容易被遮挡,对象的中间部位或者底部容易被遮挡,因此,通过标定框对对象进行标定之后,标定框的顶边的位置通常比较准确,标定框的底边的位置不够准确。所以可以按照上述方法对标定框的底边进行调整,从而保证当前标定框内的干扰信息较少。
在某些情况下,标定框可以完全外接所标定的对象的外轮廓,在另一些情况下,标定框不能完全外接所标定的对象的外轮廓。对于标定框可以完全外接的对象,标定框的侧边的位置通常也比较准确,对于标定框不能完全外接的对象,标定框的侧边的位置不够准确。而且,通常情况下,标定框能否完全外接所标定的对象的外轮廓,取决于标定框所标定的对象的类型。因此,在一些实施例中,对当前标定框的底边的位置进行调整之前,还可以确定目标对象的类型。如果目标对象的类型为第一类型,则执行对当前标定框的底边的位置进行调整的步骤。在另一些实施例中,如果目标对象的类型为第二类型,则根据目标对象的像素值以及背景的像素值,确定当前标定框的第一侧边上其他对象的像素占比以及第二侧边上其他对象的像素占比。根据第一侧边上其他对象的像素占比和第二侧边上其他对象的像素占比,对第一侧边和/或第二侧边的位置进行调整。
也即是,第一类型用于指示对象的外轮廓能够被标定框完全外接,第二类型用于指示对象的外轮廓不能被标定框完全外接。
需要说明的是,根据目标对象的像素值以及背景的像素值,确定当前标定框的第一侧边上其他对象的像素占比以及第二侧边上其他对象的像素占比的操作与上述确定底边上的其他对象的像素占比的操作类似,本申请实施例对此不再展开描述。
其中,根据第一侧边上其他对象的像素占比和第二侧边上其他对象的像素占比,对第一侧边和/或第二侧边的位置进行调整的操作可以为:如果第一侧边上其他对象的像素占比不小于第三阈值且第二侧边上其他对象的像素占比小于第四阈值,则对第一侧边的位置进行调整。如果第一侧边上其他对象的像素占比小于第三阈值且第二侧边上其他对象的像素占比不小于第四阈值,则对第二侧边的位置进行调整。如果第一侧边上其他对象的像素占比不小于第三阈值且第二侧边上其他对象的像素占比不小于第四阈值,则对第一侧边和第二侧边的位置均进行调整。
如果第一侧边上其他对象的像素占比不小于第三阈值,则表明当前标定框内靠近第一侧边部分的其他对象的像素占比较大,也即是,当前标定框内靠近第一侧边部分的干扰信息较多,因此,需要对第一侧边的位置进行调整。如果第二侧边上其他对象的像素占比不小于第四阈值,则表明当前标定框内靠近第二侧边部分的其他对象的像素占比较小,也即是,当前标定框内靠近第二侧边部分的干扰信息较多,因此,需要对第二侧边的位置进行调整。如果第一侧边上其他对象的像素占比小于第三阈值,且第二侧边上其他像素的像素占比小于第四阈值,则表明当前标定框内靠近第一侧边部分的其他对象的像素占比,以及当前标定框内靠近第二侧边部分的其他对象的像素占比都比较小,此时,可以对不当前标定框的第一侧边和第二侧边的位置进行调整。
在一些实施例中,对第一侧边的位置进行调整的操作可以为:将第一侧边朝向第二侧边的方向进行移动,直至第一侧边上其他对象的像素占比小于第三阈值,或者第一侧边的移动距离大于第三距离阈值为止。也即是,对第一侧边的位置进行移动的过程中,还可以确定移动后的第一侧边上其他对象的像素占比,以及第一侧边的移动距离。一旦移动后的第一侧边上其他对象的像素占比小于第三阈值,或者,第一侧边的移动距离大于第三距离阈值,则停止对当前标定框的第一侧边进行移动。
上述对当前标定框的第一侧边的位置进行调整的过程是一种示例,实际应用中,还可以根据不同的需求进行不同的调整。比如,在另一些实施例中,对第一侧边的位置进行调整的操作可以为:将第一侧边朝向第二侧边的方向移动第三距离阈值。也即是,如果当前标定框的第一侧边上其他对象的像素占比不小于第三阈值,那么就可以将当前标定框的第一侧边朝向当前标定框的第二侧边的方向移动第三距离阈值。其中,第三距离阈值可以按照需求进行设置,本申请实施例对此不作限定。
在一些实施例中,对第二侧边的位置进行调整的操作可以为:将第二侧边朝向第一侧边的方向进行移动,直至第二侧边上其他对象的像素占比小于第四阈值,或者第二侧边的移动距离大于第四距离阈值为止。也即是,对第二侧边的位置进行移动的过程中,还可以确定移动后的第二侧边上其他对象的像素占比,以及第二侧边的移动距离。一旦移动后的第二侧边上其他对象的像素占比小于第四阈值,或者,第二侧边的移动距离大于第四距离阈值,则停止对当前标定框的第二侧边进行移动。
上述对当前标定框的第二侧边的位置进行调整的过程是一种示例,实际应用中,还可以根据不同的需求进行不同的调整。比如,在另一些实施例中,对第二侧边的位置进行调整的操作可以为:将第二侧边朝向第一侧边的方向移动第四距离阈值。也即是,如果当前标定框的第二侧边上其他对象的像素占比不小于第四阈值,那么就可以将当前标定框的第二侧边朝向当前标定框的第一侧边的方向移动第四距离阈值。其中,第四距离阈值可以按照需求进行设置,本申请实施例对此不作限定。
在一些实施例中,对第一侧边和第二侧边的位置均进行调整的操作可以为:将第一侧边朝向第二侧边的方向进行移动,将第二侧边朝向第一侧边的方向进行移动,直至第一侧边上其他对象的像素占比小于第三阈值且第二侧边上其他对象的像素占比小于第四阈值,或者第一侧边和第二侧边的移动距离之和大于第一距离阈值为止。也即是,对第一侧边和第二侧边的位置进行移动的过程中,还可以确定移动后的第一侧边上其他对象的像素占比、移动后的第二侧边上其他对象的像素占比,以及第一侧边和第二侧边的移动距离之和。一旦移动后的第一侧边上其他对象的像素占比小于第三阈值,则停止对第一侧边进行移动。以及,一旦移动后的第二侧边上其他对象的像素占比小于第四阈值,则停止对当前标定框的第二侧边进行移动,或者,第一侧边或者第二侧边还未停止移动的情况下,第一侧边和第二侧边的移动距离之和大于第一距离阈值,那么也停止对第一侧边和第二侧边进行移动。
上述对当前标定框的第一侧边和第二侧边的位置进行调整的过程是一种示例,实际应用中,还可以根据不同的需求进行不同的调整。比如,在另一些实施例中,对第一侧边和第二侧边的位置均进行调整的操作可以为:将第一侧边朝向第二侧边的方向移动第三距离阈值,将第二侧边朝向第一侧边的方向移动第四距离阈值。也即是,如果当前标定框的第一侧边上其他对象的像素占比不小于第三阈值,那么就可以将当前标定框的第一侧边朝向第二侧边的方向移动第三距离阈值。如果当前标定框的第二侧边上其他对象的像素占比不小于第四阈值,那么就可以将当前标定框的第二侧边朝向当前标定框的第一侧边的方向移动第四距离阈值。
需要说明的是,第三距离阈值与第四距离阈值之和可以与第一距离阈值相等,第三距离阈值可以与第四距离阈值相等,第三距离阈值也可以与第四距离阈值不相等,本申请实施例对此不作限定。
需要说明的另一点是,上述步骤102-104是对当前标定框的一个或多个边的位置进行调整的一种实现方式。在另一些实施例中,还可以通过其他的方式进行调整。示例性地,对于当前标定框中的任意一个边,根据这个边的位置信息和目标对象的位置信息,确定这个边与目标对象的边界之间的最小距离,如果该最小距离小于距离阈值,则不调整当前标定框中的这个边的位置。如果该最小距离大于或等于距离阈值,则调整当前标定框中的这个边的位置,直至这个边与目标对象的边界之间的最小距离小于距离阈值为止。关于当前标定框中的其他边,也可以按照上述这个方法来调整。
其中,距离阈值可以根据需求事先设置,本申请实施例对此不做限定。
在本申请实施例中,可以确定当前标定框内其他对象的像素占比,以及当前标定框的底边上其他对象的像素占比。如果当前标定框内其他对象的像素占比小于第一阈值,且当前标定框的底边上其他对象的像素占比小于第二阈值,则对当前标定框的底边的位置进行调整。也即是,可以按照其他对象的像素占比来调整当前标定框的底边的位置。由于其他对象为掩码图中除当前标定框所标定的目标对象之外且不属于背景的对象,也即是,其他对象为当前标定框的干扰信息,因此,按照其他对象的像素占比调整当前标定框,可以减少当前标定框内的干扰信息,进而保证数据模型训练的准确度,而且还可以减少人工的操作,提高了标定框调整的效率。
图3是本申请实施例提供的一种标定框的调整装置的结构示意图,该标定框的调整装置可以由软件、硬件或者两者的结合来完成上述标定框的调整方法。参见图3,该装置包括:获取模块301和调整模块302。
获取模块301,用于获取样本图像的掩码图和当前标定框的位置信息;
调整模块302,用于根据当前标定框的位置信息和掩码图中当前标定框所标定的目标对象的位置信息,对当前标定框的一个或多个边的位置进行调整。
可选地,参见图4,调整模块302包括:
第一确定子模块3021,用于根据当前标定框的位置信息,确定掩码图中当前标定框所标定的目标对象的像素值;
第二确定子模块3022,用于确定掩码图中的背景的像素值;
调整子模块3023,用于根据目标对象的像素值以及背景的像素值,对当前标定框的一个或多个边的位置进行调整。
可选地,调整子模块3023包括:
第一确定单元,用于根据目标对象的像素值以及背景的像素值,确定当前标定框内其他对象的像素占比,以及当前标定框的底边上其他对象的像素占比,其他对象为掩码图中除目标对象之外且不属于背景的对象;
第一调整单元,用于如果当前标定框内其他对象的像素占比不小于第一阈值,和/或,当前标定框的底边上其他对象的像素占比不小于第二阈值,则对当前标定框的底边的位置进行调整。
可选地,第一调整单元主要用于:
将当前标定框的底边朝向当前标定框的顶边方向移动,直至当前标定框内其他对象的像素占比小于第一阈值且当前标定框的底边上其他对象的像素占比小于第二阈值为止。
可选地,调整子模块3023还包括:
触发单元,用于如果目标对象的类型为第一类型,则触发调整模块对当前标定框的底边的位置进行调整。
可选地,调整子模块3023还包括:
第二确定单元,用于如果目标对象的类型为第二类型,则根据目标对象的像素值以及背景的像素值,确定当前标定框的第一侧边上其他对象的像素占比以及第二侧边上其他对象的像素占比;
第二调整单元,用于根据第一侧边上其他对象的像素占比和第二侧边上其他对象的像素占比,对第一侧边和/或第二侧边的位置进行调整。
可选地,第二调整单元主要用于:
第一调整子单元,用于如果第一侧边上其他对象的像素占比不小于第三阈值且第二侧边上其他对象的像素占比小于第四阈值,则对第一侧边的位置进行调整;
第二调整子单元,用于如果第一侧边上其他对象的像素占比小于第三阈值且第二侧边上其他对象的像素占比不小于第四阈值,则对第二侧边的位置进行调整;
第三调整子单元,用于如果第一侧边上其他对象的像素占比不小于第三阈值且第二侧边上其他对象的像素占比不小于第四阈值,则对第一侧边和第二侧边的位置均进行调整。
可选地,第三调整子单元主要用于:
将第一侧边朝向第二侧边的方向进行移动,将第二侧边朝向第一侧边的方向进行移动,直至第一侧边上其他对象的像素占比小于第三阈值且第二侧边上其他对象的像素占比小于第四阈值,或者第一侧边和第二侧边的移动距离之和大于第一距离阈值为止。
在本申请实施例中,可以根据当前标定框的位置信息和掩码图中当前标定框所标定的目标对象的位置信息,自动对当前标定框的一个或多个边的位置进行调整。无需通过人工进行调整,这样,不仅可以减少当前标定框内的干扰信息,进而保证数据模型训练的准确度,而且还可以减少人工的操作,提高了标定框调整的效率。
需要说明的是:上述实施例提供的标定框的调整装置在进行标定框的调整时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的标定框的调整装置与标定框的调整方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5示出了本申请一个示例性实施例提供的标定框调整装置500的结构框图。该标定框调整装置500可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。标定框调整装置500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,标定框调整装置500包括有:处理器501和存储器502。
处理器501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器501可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的标定框的调整方法。
在一些实施例中,标定框调整装置500还可选包括有:外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地,外围设备包括:射频电路504、触摸显示屏505、摄像头506、音频电路507、定位组件508和电源509中的至少一种。
外围设备接口503可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中,处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上;在一些其他实施例中,处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路504还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏505用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时,显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时,显示屏505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏505可以为一个,设置标定框调整装置500的前面板;在另一些实施例中,显示屏505可以为至少两个,分别设置在标定框调整装置500的不同表面或呈折叠设计;在再一些实施例中,显示屏505可以是柔性显示屏,设置在标定框调整装置500的弯曲表面上或折叠面上。甚至,显示屏505还可以设置成非矩形的不规则图形,也即异形屏。显示屏505可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件506用于采集图像或视频。可选地,摄像头组件506包括前置摄像头和后置摄像头。通常,前置摄像头设置在标定框调整装置的前面板,后置摄像头设置在标定框调整装置的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器501进行处理,或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在标定框调整装置500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路507还可以包括耳机插孔。
定位组件508用于定位标定框调整装置500的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。定位组件508可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源509用于为标定框调整装置500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,标定框调整装置500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于:加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器515、光学传感器515以及接近传感器516。
加速度传感器511可以检测以标定框调整装置500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号,控制触摸显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器512可以检测标定框调整装置500的机体方向及转动角度,陀螺仪传感器512可以与加速度传感器511协同采集用户对标定框调整装置500的3D动作。处理器501根据陀螺仪传感器512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器513可以设置在标定框调整装置500的侧边框和/或触摸显示屏505的下层。当压力传感器513设置在标定框调整装置500的侧边框时,可以检测用户对标定框调整装置500的握持信号,由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在触摸显示屏505的下层时,由处理器501根据用户对触摸显示屏505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器514用于采集用户的指纹,由处理器501根据指纹传感器514采集到的指纹识别用户的身份,或者,由指纹传感器514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置标定框调整装置500的正面、背面或侧面。当标定框调整装置500上设置有物理按键或厂商Logo时,指纹传感器514可以与物理按键或厂商Logo集成在一起。
光学传感器515用于采集环境光强度。在一个实施例中,处理器501可以根据光学传感器515采集的环境光强度,控制触摸显示屏505的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏505的显示亮度;当环境光强度较低时,调低触摸显示屏505的显示亮度。在另一个实施例中,处理器501还可以根据光学传感器515采集的环境光强度,动态调整摄像头组件506的拍摄参数。
接近传感器516,也称距离传感器,通常设置在标定框调整装置500的前面板。接近传感器516用于采集用户与标定框调整装置500的正面之间的距离。在一个实施例中,当接近传感器516检测到用户与标定框调整装置500的正面之间的距离逐渐变小时,由处理器501控制触摸显示屏505从亮屏状态切换为息屏状态;当接近传感器516检测到用户与标定框调整装置500的正面之间的距离逐渐变大时,由处理器501控制触摸显示屏505从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图5中示出的结构并不构成对标定框调整装置500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由标定框调整装置中的处理器执行以完成上述实施例中的标定框的调整方法。例如,所述计算机可读存储介质可以是ROM(read-only memory,只读存储器)、RAM(randomaccess memory,随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory,只读光盘)、磁带、软盘和光数据存储设备等。
值得注意的是,本申请提到的计算机可读存储介质可以为非易失性存储介质,换句话说,是非瞬时性存储介质。
应当理解的是,实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。所述计算机指令可以存储在上述计算机可读存储介质中。
以上所述为本申请提供的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种标定框的调整方法,其特征在于,所述方法包括:
获取样本图像的掩码图和当前标定框的位置信息;
根据所述当前标定框的位置信息,确定所述掩码图中所述当前标定框所标定的目标对象的像素值;
确定所述掩码图中的背景的像素值;
根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框内其他对象的像素占比,以及所述当前标定框的底边上所述其他对象的像素占比,所述其他对象为所述掩码图中除所述目标对象之外且不属于背景的对象;
如果所述当前标定框内所述其他对象的像素占比不小于第一阈值,和/或,所述当前标定框的底边上所述其他对象的像素占比不小于第二阈值,则对所述当前标定框的底边的位置进行调整。
2.如权利要求1所述的方法,其特征在于,所述对所述当前标定框的底边的位置进行调整,包括:
将所述当前标定框的底边朝向所述当前标定框的顶边方向移动,直至所述当前标定框内所述其他对象的像素占比小于所述第一阈值且所述当前标定框的底边上所述其他对象的像素占比小于所述第二阈值为止。
3.如权利要求1所述的方法,其特征在于,所述对所述当前标定框的底边的位置进行调整之前,还包括:
如果所述目标对象的类型为第一类型,则执行对所述当前标定框的底边的位置进行调整的步骤。
4.如权利要求1所述的方法,其特征在于,所述对所述当前标定框的底边的位置进行调整之后,还包括:
如果所述目标对象的类型为第二类型,则根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框的第一侧边上所述其他对象的像素占比以及第二侧边上所述其他对象的像素占比;
根据所述第一侧边上所述其他对象的像素占比和所述第二侧边上所述其他对象的像素占比,对所述第一侧边和/或所述第二侧边的位置进行调整。
5.如权利要求4所述的方法,其特征在于,所述根据所述第一侧边上所述其他对象的像素占比和所述第二侧边上所述其他对象的像素占比,对所述第一侧边和/或所述第二侧边的位置进行调整,包括:
如果所述第一侧边上所述其他对象的像素占比不小于第三阈值且所述第二侧边上所述其他对象的像素占比小于第四阈值,则对所述第一侧边的位置进行调整;
如果所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第二侧边的位置进行调整;
如果所述第一侧边上所述其他对象的像素占比不小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第一侧边和所述第二侧边的位置均进行调整。
6.如权利要求5所述的方法,其特征在于,所述对所述第一侧边和所述第二侧边的位置均进行调整,包括:
将所述第一侧边朝向所述第二侧边的方向进行移动,将所述第二侧边朝向所述第一侧边的方向进行移动,直至所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比小于所述第四阈值,或者所述第一侧边和所述第二侧边的移动距离之和大于第一距离阈值为止。
7.一种标定框的调整装置,其特征在于,所述装置包括:
获取模块,用于获取样本图像的掩码图和当前标定框的位置信息;
调整模块包括第一确定子模块、第二确定子模块和调整子模块,所述调整子模块包括第一确定单元和第一调整单元,
所述第一确定子模块,用于根据所述当前标定框的位置信息,确定所述掩码图中所述当前标定框所标定的目标对象的像素值;
所述第二确定子模块,用于确定所述掩码图中的背景的像素值;
所述第一确定单元,用于根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框内其他对象的像素占比,以及所述当前标定框的底边上所述其他对象的像素占比,所述其他对象为所述掩码图中除所述目标对象之外且不属于背景的对象;
所述第一调整单元,用于如果所述当前标定框内所述其他对象的像素占比不小于第一阈值,和/或,所述当前标定框的底边上所述其他对象的像素占比不小于第二阈值,则对所述当前标定框的底边的位置进行调整。
8.如权利要求7所述的装置,其特征在于,所述第一调整单元主要用于:
将所述当前标定框的底边朝向所述当前标定框的顶边方向移动,直至所述当前标定框内所述其他对象的像素占比小于所述第一阈值且所述当前标定框的底边上所述其他对象的像素占比小于所述第二阈值为止。
9.如权利要求7所述的装置,其特征在于,所述调整子模块还包括:
触发单元,用于如果所述目标对象的类型为第一类型,则触发所述调整模块对所述当前标定框的底边的位置进行调整。
10.如权利要求7所述的装置,其特征在于,所述调整子模块还包括:
第二确定单元,用于如果所述目标对象的类型为第二类型,则根据所述目标对象的像素值以及所述背景的像素值,确定所述当前标定框的第一侧边上所述其他对象的像素占比以及第二侧边上所述其他对象的像素占比;
第二调整单元,用于根据所述第一侧边上所述其他对象的像素占比和所述第二侧边上所述其他对象的像素占比,对所述第一侧边和/或所述第二侧边的位置进行调整。
11.如权利要求10所述的装置,其特征在于,所述第二调整单元主要用于:
第一调整子单元,用于如果所述第一侧边上所述其他对象的像素占比不小于第三阈值且所述第二侧边上所述其他对象的像素占比小于第四阈值,则对所述第一侧边的位置进行调整;
第二调整子单元,用于如果所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第二侧边的位置进行调整;
第三调整子单元,用于如果所述第一侧边上所述其他对象的像素占比不小于所述第三阈值且所述第二侧边上所述其他对象的像素占比不小于所述第四阈值,则对所述第一侧边和所述第二侧边的位置均进行调整。
12.如权利要求11所述的装置,其特征在于,所述第三调整子单元主要用于:
将所述第一侧边朝向所述第二侧边的方向进行移动,将所述第二侧边朝向所述第一侧边的方向进行移动,直至所述第一侧边上所述其他对象的像素占比小于所述第三阈值且所述第二侧边上所述其他对象的像素占比小于所述第四阈值,或者所述第一侧边和所述第二侧边的移动距离之和大于第一距离阈值为止。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如权利要求1-6任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910605853.0A CN112184802B (zh) | 2019-07-05 | 2019-07-05 | 标定框的调整方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910605853.0A CN112184802B (zh) | 2019-07-05 | 2019-07-05 | 标定框的调整方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112184802A CN112184802A (zh) | 2021-01-05 |
CN112184802B true CN112184802B (zh) | 2023-10-20 |
Family
ID=73914705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910605853.0A Active CN112184802B (zh) | 2019-07-05 | 2019-07-05 | 标定框的调整方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112184802B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115701873A (zh) * | 2021-07-19 | 2023-02-14 | 北京字跳网络技术有限公司 | 一种图像匹配方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846345A (zh) * | 2017-01-04 | 2017-06-13 | 努比亚技术有限公司 | 一种实现交互式图像分割的方法、装置及终端 |
CN108830277A (zh) * | 2018-04-20 | 2018-11-16 | 平安科技(深圳)有限公司 | 语义分割模型的训练方法、装置、计算机设备和存储介质 |
CN108921854A (zh) * | 2018-05-22 | 2018-11-30 | 复旦大学 | 一种消化道内镜图像不规则病变区域标注方法及系统 |
CN109190537A (zh) * | 2018-08-23 | 2019-01-11 | 浙江工商大学 | 一种基于掩码感知深度强化学习的多人物姿态估计方法 |
CN109359208A (zh) * | 2018-09-13 | 2019-02-19 | 郑津 | 一种精准无损标注图像实例的分布式方法及系统 |
CN109592063A (zh) * | 2018-11-13 | 2019-04-09 | 张积洪 | 一种基于图像识别的廊桥自动对接和调整系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9043674B2 (en) * | 2012-12-26 | 2015-05-26 | Intel Corporation | Error detection and correction apparatus and method |
US10322510B2 (en) * | 2017-03-03 | 2019-06-18 | Futurewei Technologies, Inc. | Fine-grained object recognition in robotic systems |
-
2019
- 2019-07-05 CN CN201910605853.0A patent/CN112184802B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846345A (zh) * | 2017-01-04 | 2017-06-13 | 努比亚技术有限公司 | 一种实现交互式图像分割的方法、装置及终端 |
CN108830277A (zh) * | 2018-04-20 | 2018-11-16 | 平安科技(深圳)有限公司 | 语义分割模型的训练方法、装置、计算机设备和存储介质 |
CN108921854A (zh) * | 2018-05-22 | 2018-11-30 | 复旦大学 | 一种消化道内镜图像不规则病变区域标注方法及系统 |
CN109190537A (zh) * | 2018-08-23 | 2019-01-11 | 浙江工商大学 | 一种基于掩码感知深度强化学习的多人物姿态估计方法 |
CN109359208A (zh) * | 2018-09-13 | 2019-02-19 | 郑津 | 一种精准无损标注图像实例的分布式方法及系统 |
CN109592063A (zh) * | 2018-11-13 | 2019-04-09 | 张积洪 | 一种基于图像识别的廊桥自动对接和调整系统 |
Non-Patent Citations (1)
Title |
---|
基于深度卷积神经网络的弱监督图像语义分割;郑宝玉;王雨;吴锦雯;周全;;南京邮电大学学报(自然科学版)(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112184802A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110502954B (zh) | 视频分析的方法和装置 | |
CN109558837B (zh) | 人脸关键点检测方法、装置及存储介质 | |
CN109886208B (zh) | 物体检测的方法、装置、计算机设备及存储介质 | |
CN111127509B (zh) | 目标跟踪方法、装置和计算机可读存储介质 | |
CN110839128B (zh) | 拍照行为检测方法、装置及存储介质 | |
CN108363982B (zh) | 确定对象数量的方法及装置 | |
CN111754386B (zh) | 图像区域屏蔽方法、装置、设备及存储介质 | |
CN112565806B (zh) | 虚拟礼物赠送方法、装置、计算机设备及介质 | |
CN111565309B (zh) | 显示设备及其畸变参数确定方法、装置、系统及存储介质 | |
CN112308103B (zh) | 生成训练样本的方法和装置 | |
CN109977570B (zh) | 车身噪声确定方法、装置及存储介质 | |
CN109754439B (zh) | 标定方法、装置、电子设备及介质 | |
CN111931712B (zh) | 人脸识别方法、装置、抓拍机及系统 | |
CN111860064B (zh) | 基于视频的目标检测方法、装置、设备及存储介质 | |
CN112184802B (zh) | 标定框的调整方法、装置及存储介质 | |
CN115798417A (zh) | 背光亮度的确定方法、装置、设备及计算机可读存储介质 | |
CN112241987B (zh) | 确定防区的系统、方法、装置及存储介质 | |
CN114384466A (zh) | 声源方向确定方法、装置、电子设备及存储介质 | |
CN111179628B (zh) | 自动驾驶车辆的定位方法、装置、电子设备及存储介质 | |
CN111723615B (zh) | 对检测物图像进行检测物匹配判定的方法和装置 | |
CN111488895B (zh) | 对抗数据生成方法、装置、设备及存储介质 | |
CN111860030A (zh) | 行为检测方法、装置、设备及存储介质 | |
CN112000337B (zh) | 调整车辆标识的方法、装置、电子设备及可读存储介质 | |
CN113129221B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN110660031B (zh) | 图像锐化方法及装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |