CN112860602B - 对感兴趣区域数据的存储操作进行控制的方法和装置 - Google Patents

对感兴趣区域数据的存储操作进行控制的方法和装置 Download PDF

Info

Publication number
CN112860602B
CN112860602B CN201911100818.XA CN201911100818A CN112860602B CN 112860602 B CN112860602 B CN 112860602B CN 201911100818 A CN201911100818 A CN 201911100818A CN 112860602 B CN112860602 B CN 112860602B
Authority
CN
China
Prior art keywords
interest
region
current
data
probability factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911100818.XA
Other languages
English (en)
Other versions
CN112860602A (zh
Inventor
李晓森
谭洪贺
白鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN201911100818.XA priority Critical patent/CN112860602B/zh
Publication of CN112860602A publication Critical patent/CN112860602A/zh
Application granted granted Critical
Publication of CN112860602B publication Critical patent/CN112860602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种对感兴趣区域数据的存储操作进行控制的方法和装置。该方法可以包括:获得当前帧图像的当前感兴趣区域;根据至少一个概率因子确定是否保留当前感兴趣区域;以及在确定保留当前感兴趣区域的情况下存储当前感兴趣区域的数据。由此,能够采用预定容量的存储器存储预定数量的感兴趣区域数据,并且确保所存储的数据的随机性。

Description

对感兴趣区域数据的存储操作进行控制的方法和装置
技术领域
本公开总体上涉及图像处理和目标检测的技术领域,并且具体地涉及一种对感兴趣区域数据的存储操作进行控制的方法和装置。
背景技术
在目标检测过程中,可以采用计算机视觉方法或神经网络方法等处理输入的图像或图像帧序列,并生成感兴趣区域数据(或者称为包围盒数据),然后基于所获得的感兴趣区域数据执行后续处理。
所生成的感兴趣区域数据的数量往往非常大,例如可以是在数十万的量级,而且数量不定,难以事先预测大致的范围。受成本、装置尺寸等诸多方面的影响,在诸如人工智能芯片这样的提供图像处理或目标检测功能的装置中,高速存储器资源通常十分有限,使得后续处理的处理效率和存储效率受到限制。
发明内容
根据本公开的一个方面,提供了一种对感兴趣区域数据的存储操作进行控制的方法,该方法可以包括:获得当前帧图像的当前感兴趣区域;根据至少一个概率因子确定是否保留所述当前感兴趣区域;以及在确定保留所述当前感兴趣区域的情况下存储所述当前感兴趣区域的数据。
根据本公开的另一个方面,还提供了一种对感兴趣区域数据的存储操作进行控制的装置,该装置可以包括:数据获得模块,被配置为获得当前帧图像的当前感兴趣区域;存储判断模块,被配置为根据至少一个概率因子确定是否保留所述当前感兴趣区域;以及存储控制模块,被配置为在确定保留所述当前感兴趣区域的情况下存储所述当前感兴趣区域的数据。
根据本公开的另一个方面,还提供了一种电子设备,该电子设备可以包括处理器和用于存储所述处理器可执行的指令的存储器,其中,所述处理器可以用于从所述存储器中读取所述指令,并执行所述指令以实现上述方法。
根据本公开的另一个方面,还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,并且所述计算机程序可以用于执行上述方法。
在根据本公开的实施例的方案中,对于所获得的每个感兴趣区域,根据至少一个概率因子确定是否保留该感兴趣区域,并且在确定保留该感兴趣区域的情况下存储该感兴趣区域的数据,从而实现基于概率因子对感兴趣区域数据进行过滤。由此,不仅能够有效地控制最终存储到存储器中的感兴趣区域的数据数量,而且能够有效地确保最终存储的数据的随机性。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出根据本公开的实施例的示例方法。
图2示出根据本公开的实施例的示例方法的执行过程的示例。
图3示出根据本公开的实施例的示例方法的步骤的示例。
图4示出根据本公开的实施例的示例方法的执行过程的示例。
图5示出根据本公开的实施例的示例方法的执行过程的示例。
图6示出根据本公开的实施例的示例方法的执行过程的示例。
图7示出根据本公开的实施例的示例装置。
图8示出根据本公开的实施例的示例电子设备。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
概述
如前文所述,由于硬件成本、装置尺寸等诸多方面的影响,在诸如人工智能芯片这样的提供图像处理或目标检测功能的装置中,高速存储器资源通常十分有限,使得在诸如感兴趣区域数据排序、非极大值抑制等针对所生成的感兴趣区域的后续处理中,对于数量巨大且数量不定的感兴趣区域数据的处理和存储效率不高。
示例性方法
图1示出根据本公开实施例的示例方法100。该示例方法100可以应用于具有图像识别或目标检测功能的电子设备,对感兴趣区域数据的存储操作进行控制,并确保最终存储的预定数量的感兴趣区域的数据的随机性。
如图1所示,该示例方法100可以包括:步骤110,获得当前帧图像的当前感兴趣区域;步骤120,根据至少一个概率因子,确定是否保留该当前感兴趣区域;以及步骤130,在根据概率因子确定保留该当前感兴趣区域的情况下,存储该当前感兴趣区域的数据。
在一个或多个实施例中,当前帧图像可以与例如人工智能领域中的“张量数据”或“特征数据”具有相同或相似的含义。例如,当前帧图像可以是能够通过人眼在视觉上辨别或观看的彩色或单色的图像、图片或视频帧,也可以是无法通过人眼在视觉上辨别或观看的抽象数据。例如,当前帧图像可以是输入的彩色图像、输入的灰度图像、输入视频的某一帧的图像等,也可以是神经网络的某一层的中间结果等。另外,当前帧图像可以包括一个或多个通道,并且每个通道可以携带关于该当前帧图像的一个或多个方面的特征。例如,当前帧图像可以包括分别表征红、黄、蓝等不同颜色的色彩信息通道,也可以包括表征灰度信息的灰度信息通道,还可以包括表征诸如锐度信息、边缘信息等其他特征信息的一个或多个其他通道。本公开不局限于当前帧图像的类型、形式、内容等。
在一个或多个实施例中,感兴趣区域可以是在图像(例如,当前帧图像)中用方框、圆、椭圆、不规则多边形等适当方式勾勒或标注出的需要处理的区域。相应地,感兴趣区域的数据可以包括例如表示该感兴趣区域在当前帧图像中的位置信息的数据(例如,一个或多个关键点的坐标数据等)、置信度、分类等一种或多种适当的数据。本公开不局限于感兴趣区域的数据的形式、内容、格式等。
在一个或多个实施例中,一个或多个概率因子可以取决于与当前感兴趣区域有关的一种或多种历史统计信息。例如,这样的一种或多种历史统计信息可以包括但不局限于在获得当前感兴趣区域之时或之前的一帧或多帧图像的感兴趣区域的数量、一帧或多帧图像的感兴趣区域的稀疏度、已存储的感兴趣区域数据的数量等。另外,根据不同的历史统计信息确定的概率因子与保留该当前感兴趣区域的概率可以具有不同的相关性。
在一个或多个实施例中,所存储的感兴趣区域的数据可以是该感兴趣区域的完整数据,也可以是该感兴趣区域的数据中的一个或多个数据项,例如类别、该感兴趣区域在当前帧图像中的位置信息(例如,一个或多个特征点的坐标数据)、置信度等,本公开对此不做限制。
另外,如图1所示,取决于实际生成的感兴趣区域的数量(例如,可以是数万、数十万、甚至更多),示例方法100中的步骤110、120和130可以重复执行一次或多次。例如,示例方法100可以在已经存储了预定数量的感兴趣区域的数据的情况下停止。例如,在用于存储用于后续处理的预定数量的片上高速存储器的容量用尽,或者计数器的计数值达到预定数量的情况下,示例方法100可以停止。另外,也可以将示例方法100应用于实际生成的每个感兴趣区域。例如,在已经存储了预定数量的感兴趣区域的数据并且确定要保留当前感兴趣区域的情况下,示例方法100可以继续,并且可以在步骤130中,使用当前感兴趣区域的数据替换已经存储的一个指定的感兴趣区域的数据,或者随机地替换已经存储的一个感兴趣区域的数据。
在示例方法100中,对于每个当前帧图像的每个当前感兴趣区域,根据一个或多个概率因子确定是否保留该当前感兴趣区域,从而在获取感兴趣区域数据的同时对感兴趣区域进行过滤,并从实际可能生成(或已生成)的数万个、数十万个、甚至更多的感兴趣区域数据中,保留预定数量(例如,可以是数千)的感兴趣区域数据,而不需要额外的处理和存储开销。而且,如上所述,所使用的一个或多个概率因子可以取决于与当前感兴趣区域相关的一种或多种历史统计信息,使得概率因子能够动态地调整。由此,最终保留下来的预定数量的感兴趣区域数据能够具备良好的随机性,并能够确保后续处理的精度不变或者降低的程度在可接受的范围内。
应当理解,示例方法100中的步骤110、120和130的执行方式和执行次序不局限于图1的示例。例如,针对实际生成的每帧图像的每个感兴趣区域,也可以采用并行或流水线的方式执行示例方法100中的步骤110、120和130。例如,步骤120也可以在步骤110之前或者与步骤110并行地执行。
下面结合示例描述示例方法100的更多细节。
根据不同的实施例,在步骤110中,可以使用任何适当的手段获得当前帧图像的感兴趣区域。例如,针对当前帧图像,可以通过例如Matlab、OpenCV等机器视觉软件的算子和函数,或者通过例如基于人工智能(例如,人工神经网络)等其他任何适当的目标检测方法或模型,确定当前帧图像的一个或多个感兴趣区域。另外,也可以每次从所确定的一个或多个感兴趣区域中选择(例如,按照指定次序选择或者随机地选择)一个感兴趣区域作为当前感兴趣区域,也可以每次接收一个感兴趣区域或者从缓存器或存储器中每次读取一个感兴趣区域作为当前感兴趣区域。本公开不局限于当前帧图像的当前感兴趣区域的获得方式。
在一个实施例中,还可以设置一个或多个阈值条件,并且可以在步骤110中执行“阈值过滤”。例如,如果当前帧图像的一个感兴趣区域的一个或多个指标满足所设置的一个或多个阈值条件,则可以将该感兴趣区域作为当前感兴趣区域,否则可以将该感兴趣区域丢弃,并继续获取下一个感兴趣区域。例如,可以设置置信度阈值。然后,在步骤110中,如果所获取的感兴趣区域的置信度大于或等于该置信度阈值,则可以将该感兴趣区域作为当前帧图像的当前感兴趣区域,否则可以将该感兴趣区域丢弃。在另外的实施例中,上述的“阈值过滤”也可以独立于步骤110或示例方法100,例如可以在步骤110或示例方法100之前执行。
然后,对于每帧图像的每个当前感兴趣区域,可以在示例方法100的步骤120中,根据至少一个概率因子,确定是否保留该当前感兴趣区域。如前文所述,在步骤120中所考虑的一个或多个概率因子可以取决于与当前感兴趣区域有关的一种或多种历史统计信息。
在一个实施例中,在步骤120中考虑的一个或多个概率因子可以取决于与当前帧图像之前的一个或多个先前帧图像的感兴趣区域的数量相关的统计量。例如,可以根据与当前帧图像之前的一个或多个先前帧图像的感兴趣区域的数量相关的统计量,确定第一概率因子,该第一概率因子可以指示或者用于预测感兴趣区域的剩余数量。
例如,可以按照时间次序对图像序列中的各帧图像进行编号,以下记为第1帧、第2帧、……、第n帧(n为任意自然数)。
然后,在通过示例方法100处理第1帧的每个感兴趣区域时,可以在步骤110或120或130之前、之中或之后,对第1帧的感兴趣区域进行计数,例如可以对第1帧的满足预定的阈值条件的感兴趣区域进行计数。然后,在通过示例方法100处理第2帧时,可以根据关于第1帧的计数值确定第一概率因子的值。类似地,在通过示例方法100处理第2帧的每个感兴趣区域时,可以对第2帧的感兴趣区域进行计数,并且可以在随后通过示例方法100处理第3帧时,根据关于第1帧的计数值和关于第2帧的计数值中的至少一个确定或更新第一概率因子的值。进一步地,在通过示例方法100处理第i帧(i为小于或等于n的任意自然数)时,可以根据关于在第i帧之前的至少一个先前帧的计数值确定或更新第一概率因子的值。
例如,对于第i帧,可以保留并考虑前k个先前帧的计数值,即,第i-1帧的计数值Ni-1、……、第i-k帧的计数值Ni-k,其中,k为小于i的任意自然数。例如,可以计算平均值N’=(Σi-1≤j≤i-kNj)/k,作为第一概率因子的当前值。
较小的N’值可以意味着剩余(尚未处理或尚未生成)的感兴趣区域的数量可能越少,因此可以对当前的第i帧的各个感兴趣区域执行相对宽松的处理,使得当前的第i帧的各个感兴趣区域可以具有更高的保留概率;反之,较大的N’值可以意味着剩余(尚未处理或尚未生成)的感兴趣区域的数量可能越多,因此可以对当前的第i帧的各个感兴趣区域执行相对严格的处理,使得当前的第i帧的各个感兴趣区域可以具有更低的保留概率。
在该实施例中,根据与当前帧图像之前的一个或多个先前帧图像的感兴趣区域的数量相关的统计信息,确定第一概率因子,并在步骤120中使用包括第一概率因子的至少一个概率因子,从而将当前感兴趣区域的保留概率与先前帧图像的感兴趣区域的情况以及针对当前帧图像之后的未来帧图像的感兴趣区域的预测情况动态地关联在一起,这使得最终随机保留下来的预定数量的感兴趣区域数据能够更好适应于基于感兴趣区域的后续处理,并且能够确保后续处理的精度不变或者降低的程度在可接受的范围内。
在另外的示例中,还可以根据一个或多个先前帧图像的感兴趣区域的稀疏度(例如,可以用1/N’表示)确定第一概率因子的值。在这样的情况下,第一概率因子的值与感兴趣区域的保留概率反相关。
在另外的示例中,还可以根据一个或多个先前帧图像的感兴趣区域的统计数量的加权平均确定第一概率因子的值。
在另外的示例中,在确定第一概率因子时,还可以考虑当前的第i帧的已处理过的感兴趣区域的数量。例如,可以根据平均值(Σi≤j≤i-kNj)/(k+1)确定第一概率因子的值,其中,Ni对应于第i帧的在当前感兴趣区域之前已处理过的感兴趣区域的统计数量。
另外,上述的k个先前帧图像可以是图像序列中的连续的k个先前帧图像,也可以是图像序列中的不连续的k个先前帧图像。
进一步地,或者替代地,在另外的实施例中,在步骤120中考虑的一个或多个概率因子还可以取决于当前帧图像中的预定图像区域相关联的已存储的感兴趣区域的统计量,其中,预定图像区域包括所述当前感兴趣区域的至少一部分。例如,可以确定包括当前感兴趣区域的至少一部分的图像区域,然后可以根据与该图像区域相关联的已存储的感兴趣区域的统计量确定第二概率因子,该第二概率因子可以指示或者用于预测指定图像区域的感兴趣区域的密度或重叠程度。
如图2所示,可以将图像序列200中的各帧图像210、220中的每一个划分成一个或多个图像区域220、230、240和250。在通过示例方法100处理先前帧图像210的感兴趣区域时,通过步骤130保留并存储了先前帧图像210的感兴趣区域221、222、223、226的数据,其中,感兴趣区域221、222和223与图像区域220相关联,感兴趣区域226与图像区域240相关联。然后,在通过示例方法100处理当前帧图像260的当前感兴趣区域225时,已经通过步骤130保留并存储了当前帧图像260的感兴趣区域224和227的数据,其中,感兴趣区域224与图像区域220相关联,感兴趣区域227与图像区域250相关联。
例如,对于每帧图像的每个感兴趣区域,可以根据该感兴趣区域的位置信息确定该感兴趣区域的大部分或者该感兴趣区域的中心点位于哪个图像区域,并且相应地确定该感兴趣区域与哪个图像区域相关联。例如,在图2的示例中,先前帧图像210的感兴趣区域223的中心点位于图像区域220,则可以将感兴趣区域223确定为与图像区域220相关联;类似地,当前帧图像260的当前感兴趣区域225的中心点位于图像区域220,则可以将当前感兴趣区域225确定为与图像区域220相关联;诸如此类。
在该实施例中,可以针对图像区域220、230、240和250中的每一个,设置对应的计数器,分别用于统计与对应的图像区域相关联的已存储的感兴趣区域的数量。例如,在图2的示例中,如果各计数器从先前帧图像210开始计数,则在处理完先前帧图像210的各感兴趣区域之后,与图像区域220、230、240和250相对应的计数器的计数值可以分别为3、0、1、0。然后,在开始处理当前帧图像260的当前感兴趣区域225之前,与图像区域220、230、240和250相对应的计数器的计数值可以分别为4、0、1、1。
当前帧图像260的当前感兴趣区域225与图像区域220相关联,因此在步骤120中,可以根据与图像区域220相对应的计数器的计数值L=4,确定或更新第二概率因子的值。
较大的L值可以意味着在预定图像区域的感兴趣区域重合的概率较大,因此可以对当前感兴趣区域执行相对严格的处理,即设置更低的保留概率;反之,较小的L值可以意味着在预定图像区域的感兴趣区域重合的概率较小,因此可以对当前感兴趣区域执行相对宽松的处理,即设置更高的保留概率。
在该实施例中,根据与当前感兴趣区域所在图像区域的已存储的感兴趣区域的密度相关联的统计量,确定第二概率因子,并且在步骤120中使用包括第二概率因子的至少一个概率因子。第二概率因子使得最终随机保留下来的预定数量的感兴趣区域的分布更均匀,从而能够确保后续处理的精度不变或者降低的程度在可接受的范围内。
在另外的示例中,与各个图像区域相对应的计数器也可以只对当前帧图像的已存储的感兴趣区域的数量进行统计,并由此确定或更新第二概率因子的值。
在另外的示例中,与各个图像区域相对应的计数器也可以只对当前帧图像之前的一个或多个先前帧图像的已存储的感兴趣区域的数量进行统计,并由此确定或更新第二概率因子的值。
另外,各个图像区域的划分方式,包括图像区域的数量、各图像区域的形状、各图像区域的大小等,也不局限于图2的示例。
进一步地,或者替代地,在另外的实施例中,在步骤120中考虑的一个或多个概率因子还可以取决于当前帧图像的当前感兴趣区域的置信度。例如,可以根据当前感兴趣区域的置信度或者能够指示当前感兴趣区域的有效程度的其他适当的得分或指标S,确定第三概率因子。
较大的S值可以意味着当前感兴趣区域的置信度较高,对于后续处理来说相对更准确或更有用,因此可以使当前感兴趣区域具有更高的保留概率;反之,较小的S值可以意味着当前感兴趣区域的置信度较低,因此可以使当前感兴趣区域具有更低的保留概率。
例如,在当前感兴趣区域的置信度低于指定阈值时,可以直接丢弃当前感兴趣区域。在该情况下,可以在步骤120中融合前述的“阈值过滤”,从而简化处理过程。
进一步地,或者替代地,在另外的实施例中,在步骤120中考虑的一个或多个概率因子还可以取决于用于感兴趣区域数据的存储器的容量或者最终要保留的感兴趣区域的最大数量,还可以取决于用于感兴趣区域数据的存储器的剩余容量或者最终要保留的感兴趣区域的剩余数量。例如,可以根据用于感兴趣区域数据的存储器的容量或者最终要保留的感兴趣区域的最大数量M1确定第四概率因子,并且还可以根据用于感兴趣区域数据的存储器的剩余容量或者最终要保留的感兴趣区域的剩余数量M2确定第五概率因子。
较大的M1值或者较小的M2值,可以意味着允许对当前感兴趣区域执行相对宽松的处理,从而可以对当前感兴趣区域设置更高的保留概率;反之,较小的M1值或者较大的M2值,可以意味着允许对当前感兴趣区域执行相对严格的处理,从而可以对当前感兴趣区域设置更低的保留概率。
通过在步骤120中使用第四概率因子和第五概率因子,允许综合所有的感兴趣区域的情况考虑用于确定感兴趣区域的保留概率,使得最终随机保留下来的预定数量的感兴趣区域的分布更均匀,从而能够确保后续处理的精度不变或者降低的程度在可接受的范围内。
在另外的实施例中,还可以根据与当前感兴趣区域有关的一种或多种历史统计信息,确定另外的一个或多个概率因子。
另外,根据不同的实施例,可以在步骤120中,可以考虑一种概率因子,也可以考虑多种概率因子的组合。在考虑多种概率因子的组合的情况下,可以通过诸如乘法函数、乘加函数、指数函数、高斯函数等任何适当的方式或者通过组合这些方式而获得的更复杂的方式,根据多种概率因子确定感兴趣区域的保留概率。本公开不局限于将各种概率因子组合在一起的方式。
例如,对于当前帧图像的当前感兴趣区域,可以根据一个或多个先前帧图像的感兴趣区域的稀疏度(例如前述的1/N’)确定上述第一概率因子的值,根据最终要保留的感兴趣区域的最大数量M1确定上述第四概率因子的值。
进一步地,可以将感兴趣区域的置信度范围[0,1]划分成多个子区间,例如[[0,T),[T,T+δ1),[T+δ1,T+δ12),…,[T+Σ1≤s<rδs,1]],其中,T为置信度阈值,各个δs为用于划分各个子区间的步长,s和r为用作索引的自然数。然后,可以针对各个子区间分配上述第三概率因子的各个值。例如,对应于子区间[0,T),第三概率因子的值可以为0(即,“丢弃”);对应于子区间[T,T+δ1),第三概率因子的值可以为p1;对应于子区间[T+δ1,T+δ12),第三概率因子的值可以为p2;诸如此类,例如对应于子区间[T+Σ1≤s<rδs,1],第三概率因子的值可以为1(即,“一定保留”),其中,0<p1<p2<…<1。例如,p1=0.6,p2=0.7,等等。
然后,可以通过乘法函数将第一概率因子、第三概率因子和第四概率因子结合,例如p*M1/N’,其中,p为与当前感兴趣区域的置信度所在的子区域相对应的值,并且M1/N’可以确定最终保留的M1个感兴趣区域相对于已处理过的N’个感兴趣区域的比例。例如,如果M1/N’=0.5,并且p=p2=0.7,则根据第一概率因子、第三概率因子和第四概率因子确定的保留概率可以为P=p*M1/N’=0.7*0.5=0.42。
然后,在步骤120中,例如,可以使用诸如反馈移位寄存器这样的伪随机发生器生成在预定数值范围内的随机数。例如,可以生成[0,100]范围内的随机数R,并且如果R<100*P,则可以确定保留当前感兴趣区域的数据,否则,可以丢弃当前感兴趣区域。
然而,受限于伪随机发生器的硬件实现,例如,即使采用16级的反馈移位寄存器,在连续处理超过一定数量(例如,4000)的感兴趣区域之后,所生成的伪随机数可能出现全0的状态。
在一个实施例中,如图3所示,在步骤120中,可以执行:
步骤310,针对在步骤120中所考虑的一个或多个概率因子,可以确定一个或多个序列,其中,每个序列可以与一个概率因子或者多个概率因子的结合相对应,并且每个序列可以包括指示“保留”的数据项和/或指示“丢弃”的数据项,其中指示保留的数据项的数量比例可以取决于对应的概率因子的值或者对应的概率因子的结合的值;
步骤320,确定各个序列在指定位置处的数据项;以及
步骤330,如果在各个序列在指定位置处的数据项中,存在指定比例以上(例如,超过50%、60%、70%、80%、90%,或者为100%)的指示“保留”的数据项,则确定保留所述当前感兴趣区域。
继续上面的根据第一概率因子、第三概率因子和第四概率因子确定的保留概率的示例。
如图4所示,对于第一概率因子和第四概率因子的结合M1/N’,可以设置对应的序列410,其中,“1”表示指示“保留”的数据项,“0”表示指示“丢弃”的数据项,并且“1”数据项在序列410中的数量比例可以取决于M1/N’的值。例如,如果M1/N’=0.5,并且序列410中的50%的数据项为“1”数据项。各个“1”数据项在序列410中的位置可以任意配置。例如,在图4的示例中,在序列410中,各“1”数据项和各“0”数据项规律地交替配置。
类似地,对于第三概率因子p,可以设置对应的序列420。同样,在序列420中,“1”数据项的数量比例可以取决于p的值。例如,如果p=0.7,并且序列420中的70%的数据项为“1”数据项。同样,各个“1”数据项在序列410中的位置也可以任意配置。
例如,对于图2中的当前帧图像260的当前感兴趣区域225,如果此时的M1/N’=0.5,并且根据当前感兴趣区域225的置信度确定的第三概率因子p的值为0.7,则在步骤320中,按照图4中的箭头和粗线框所示,可以确定序列410在当前的指定位置处的数据项为“0”并且序列420在当前的指定位置处的数据项为“1”。如果在步骤330中要求的指定比例为100%,则可以确定在序列410和420中的当前指定位置处的数据项中,仅有50%的数据项为“1”(即,指示“保留”),从而可以将当前感兴趣区域225丢弃(即,“不保留”)。
然后,可以调整指定位置,以便用于下一次的判断。例如,如图5所示,可以将图4中的箭头和粗线框向右移一位。在另外的示例中,调整指定位置的步长可以为2、3或者其他数值。在另外的示例中,调整指定位置的步长可以是可变的。在另外的示例中,各个序列中的指定位置可以相互独立地调整,例如,针对序列410的指定位置按照步长1来调整,而针对序列420的指定位置按照步长2来调整。另外,各个序列可以是循环序列,使得指定位置的调整可以循环进行。
例如,继续图2和图5的示例,如图6所示,在丢弃感兴趣区域225之后,可以应用示例方法100继续处理当前帧图像260的感兴趣区域610。假设根据当前感兴趣区域610的置信度确定的第三概率因子p的值仍然为0.7,则在步骤320中,按照图5中的箭头和粗线框所示,可以确定序列410在当前的指定位置处的数据项为“1”并且序列420在当前的指定位置处的数据项为“1”,即,在步骤330中要求的指定比例成为100%。于是,在步骤330中,可以确定保留当前感兴趣区域610。
在该实施例中,针对各个概率因子或概率因子的结合设置对应的序列,并且通过序列的移位来拟合随机过程。由此,可以不必依赖于随机发生器,从而能够避免由于随机发生器的硬件限制而出现全0伪随机数的情况。
示例性装置
图7示出根据本公开的实施例的示例装置700。该示例装置700可以包括数据获得模块710、存储判断模块720和存储控制模块730,其中,数据获得模块710可以被配置为获得当前帧图像的当前感兴趣区域(例如,被配置为执行示例方法100的步骤110),存储判断模块720可以被配置为根据至少一个概率因子确定是否保留所述当前感兴趣区域(例如,被配置为执行示例方法100的步骤120),并且存储控制模块730可以被配置为在确定保留所述当前感兴趣区域的情况下存储所述当前感兴趣区域的数据(例如,被配置为执行示例方法100的步骤130)。
在一个实施例中,所述至少一个概率因子取决于与所述当前帧图像之前的至少一个先前帧图像的感兴趣区域的数量相关的统计量。
在一个实施例中,所述至少一个概率因子取决于与所述当前帧图像中的预定图像区域相关联的已存储的感兴趣区域的统计量,所述预定图像区域包括所述当前感兴趣区域的至少一部分。
在一个实施例中,所述至少一个概率因子取决于所述当前感兴趣区域的置信度。
在一个实施例中,所述至少一个概率因子取决于用于感兴趣区域数据的存储器的容量。
在一个实施例中,所述至少一个概率因子取决于已存储的感兴趣区域的数量。
在一个实施例中,存储判断模块720还可以包括一个或多个子模块。例如,一个子模块可以被配置为确定与所述至少一个概率因子相对应的至少一个序列,每个序列中的指示保留的数据项的数量比例取决于对应的概率因子。例如,一个子模块可以被配置为确定所述至少一个序列中的指定位置处的至少一个数据项。例如,一个子模块可以被配置为在所述至少一个数据项包括预定比例以上的指示保留的数据项的情况下,确定保留所述当前感兴趣区域。
根据不同的实施例,示例装置700还可以包括其他的一个或多个电路、元件和接口等,例如至少一个输入/输出接口等。如图7所示,示例装置700还可以与被控制的存储器740耦接在一起。在一个实施例中,被控制的存储器740也可以是示例装置700的一部分。
根据不同的实施例,示例装置700中的各个电路、部件、元件和接口等(包括上述的数据获得模块710、存储判断模块720和存储控制模块730等)可以通过任何适当的方式连接或耦接在一起,例如,可以通过总线、交叉开关、有线或无线的电路或者其他电子的、磁性的、光学的或电磁的方式连接或耦接在一起。
示例性电子设备
图8示出根据本公开的实施例的示例电子设备800。如图8所示,示例电子设备800可以包括一个或多个处理器810以及用于存储处理器810可执行的指令的存储器820。
处理器810可以是中央处理单元或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以被配置为从存储器820中读取并执行指令,以实现根据本公开的实施例的方法(例如示例方法100)的步骤。
存储器820可以存储用于执行根据本公开的实施例的方法(例如示例方法100)的一个或多个计算机程序产品,并且可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器和/或高速缓冲存储器等。非易失性存储器例如可以包括只读存储器、硬盘、闪速存储器等。
示例电子设备800中的处理器810可以读取例如在存储器820中存储的一个或多个计算机程序指令并运行,以实现上文所述的本公开的各个实施例的方法(例如示例方法100)以及/或者其他期望的功能。
如图8所示,在一些实施例中,示例电子设备800还可以包括输入装置830和输出装置840,其中,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。根据不同的实施例,输入设备830可以包括例如键盘、鼠标、相机、麦克风等,并且输出装置840可以并且可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等以便向外部输出各种信息。
为了简化,图8中仅示出了示例电子设备800中的一些示例性部件,而省略了诸如总线、输入/输出接口等的其他组件。除此之外,示例电子设备800还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的声源定位方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的声源定位方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器、只读存储器、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (9)

1.一种对感兴趣区域数据的存储操作进行控制的方法,包括:
获得当前帧图像的当前感兴趣区域;
根据至少一个概率因子确定是否保留所述当前感兴趣区域,其中,所述至少一个概率因子取决于与所述当前帧图像之前的至少一个先前帧图像的感兴趣区域的数量相关的统计量;以及
在确定保留所述当前感兴趣区域的情况下存储所述当前感兴趣区域的数据。
2.根据权利要求1所述的方法,其中,所述至少一个概率因子还取决于与所述当前帧图像中的预定图像区域相关联的已存储的感兴趣区域的统计量,所述预定图像区域包括所述当前感兴趣区域的至少一部分。
3.根据权利要求1所述的方法,其中,所述至少一个概率因子还取决于所述当前感兴趣区域的置信度。
4.根据权利要求1所述的方法,其中,所述至少一个概率因子还取决于用于感兴趣区域数据的存储器的容量。
5.根据权利要求1所述的方法,其中,所述至少一个概率因子还取决于已存储的感兴趣区域的数量。
6.根据权利要求1至5中的任一项所述的方法,其中,根据至少一个概率因子确定是否保留所述当前感兴趣区域包括:
确定与所述至少一个概率因子相对应的至少一个序列,每个序列中的指示保留的数据项的数量比例取决于对应的概率因子;
确定所述至少一个序列中的指定位置处的至少一个数据项;以及
在所述至少一个数据项包括预定比例以上的指示保留的数据项的情况下,确定保留所述当前感兴趣区域。
7.一种对感兴趣区域数据的存储操作进行控制的装置,包括:
数据获得模块,被配置为获得当前帧图像的当前感兴趣区域;
存储判断模块,被配置为根据至少一个概率因子确定是否保留所述当前感兴趣区域,其中,所述至少一个概率因子取决于与所述当前帧图像之前的至少一个先前帧图像的感兴趣区域的数量相关的统计量;以及
存储控制模块,被配置为在确定保留所述当前感兴趣区域的情况下存储所述当前感兴趣区域的数据。
8.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行根据权利要求1至6中的任一项所述的方法。
9.一种电子设备,包括:
处理器;以及
用于存储所述处理器可执行的指令的存储器;
所述处理器,用于从所述存储器中读取所述指令,并执行所述指令以实现根据权利要求1至6中的任一项所述的方法。
CN201911100818.XA 2019-11-12 2019-11-12 对感兴趣区域数据的存储操作进行控制的方法和装置 Active CN112860602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911100818.XA CN112860602B (zh) 2019-11-12 2019-11-12 对感兴趣区域数据的存储操作进行控制的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911100818.XA CN112860602B (zh) 2019-11-12 2019-11-12 对感兴趣区域数据的存储操作进行控制的方法和装置

Publications (2)

Publication Number Publication Date
CN112860602A CN112860602A (zh) 2021-05-28
CN112860602B true CN112860602B (zh) 2024-05-03

Family

ID=75984319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911100818.XA Active CN112860602B (zh) 2019-11-12 2019-11-12 对感兴趣区域数据的存储操作进行控制的方法和装置

Country Status (1)

Country Link
CN (1) CN112860602B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427310A (zh) * 2013-09-04 2015-03-18 杭州海康威视数字技术股份有限公司 图像存储方法及其装置
CN107369145A (zh) * 2017-06-16 2017-11-21 广东欧珀移动通信有限公司 图像处理方法、装置及终端设备
CN108960213A (zh) * 2018-08-16 2018-12-07 Oppo广东移动通信有限公司 目标跟踪方法、装置、存储介质及终端
CN109727187A (zh) * 2019-01-03 2019-05-07 北京地平线机器人技术研发有限公司 用于调整多个感兴趣区域数据的存储位置的方法和装置
CN110428359A (zh) * 2019-08-09 2019-11-08 南京地平线机器人技术有限公司 用于处理感兴趣区域数据的装置和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2372165A (en) * 2001-02-10 2002-08-14 Hewlett Packard Co A method of selectively storing images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427310A (zh) * 2013-09-04 2015-03-18 杭州海康威视数字技术股份有限公司 图像存储方法及其装置
CN107369145A (zh) * 2017-06-16 2017-11-21 广东欧珀移动通信有限公司 图像处理方法、装置及终端设备
CN108960213A (zh) * 2018-08-16 2018-12-07 Oppo广东移动通信有限公司 目标跟踪方法、装置、存储介质及终端
CN109727187A (zh) * 2019-01-03 2019-05-07 北京地平线机器人技术研发有限公司 用于调整多个感兴趣区域数据的存储位置的方法和装置
CN110428359A (zh) * 2019-08-09 2019-11-08 南京地平线机器人技术有限公司 用于处理感兴趣区域数据的装置和方法

Also Published As

Publication number Publication date
CN112860602A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN109325954B (zh) 图像分割方法、装置及电子设备
US11055516B2 (en) Behavior prediction method, behavior prediction system, and non-transitory recording medium
CN110378235B (zh) 一种模糊人脸图像识别方法、装置及终端设备
KR101640998B1 (ko) 화상 처리 장치 및 화상 처리 방법
KR20200145827A (ko) 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체
CN111598065B (zh) 深度图像获取方法及活体识别方法、设备、电路和介质
CN110555334B (zh) 人脸特征确定方法、装置、存储介质及电子设备
CN107272899B (zh) 一种基于动态手势的vr交互方法、装置及电子设备
CN113239875B (zh) 人脸特征的获取方法、系统、装置及计算机可读存储介质
CN112182269B (zh) 图像分类模型的训练、图像分类方法、装置、设备及介质
CN109819176A (zh) 一种拍摄方法、系统、装置、电子设备及存储介质
CN109286758A (zh) 一种高动态范围图像的生成方法、移动终端及存储介质
CN109005367A (zh) 一种高动态范围图像的生成方法、移动终端及存储介质
CN110637306A (zh) 基于先前的简化图执行的条件性图执行
CN110784644A (zh) 图像处理方法及装置
CN109040579A (zh) 一种拍摄控制方法、终端及计算机可读介质
CN112489142A (zh) 一种颜色识别方法、装置、设备及存储介质
JP2022523661A (ja) 拡大画像の取得およびストレージ
CN111783812A (zh) 违禁图像识别方法、装置和计算机可读存储介质
CN109740442B (zh) 定位方法、装置、存储介质及电子设备
CN112860602B (zh) 对感兴趣区域数据的存储操作进行控制的方法和装置
WO2016129049A1 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記憶媒体
CN109190495B (zh) 性别识别方法、装置及电子设备
EP3709666A1 (en) Method for fitting target object in video frame, system, and device
US11687782B2 (en) Systems and methods for recognition of user-provided images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant