CN108737821B - 基于多通道浅层特征的视频兴趣区域快速预选方法及系统 - Google Patents

基于多通道浅层特征的视频兴趣区域快速预选方法及系统 Download PDF

Info

Publication number
CN108737821B
CN108737821B CN201810379570.4A CN201810379570A CN108737821B CN 108737821 B CN108737821 B CN 108737821B CN 201810379570 A CN201810379570 A CN 201810379570A CN 108737821 B CN108737821 B CN 108737821B
Authority
CN
China
Prior art keywords
value
channel data
pixel
color
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810379570.4A
Other languages
English (en)
Other versions
CN108737821A (zh
Inventor
王常勇
周瑾
张华亮
韩久琦
柯昂
徐葛森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Pharmacology and Toxicology of AMMS
Original Assignee
Institute of Pharmacology and Toxicology of AMMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Pharmacology and Toxicology of AMMS filed Critical Institute of Pharmacology and Toxicology of AMMS
Priority to CN201810379570.4A priority Critical patent/CN108737821B/zh
Publication of CN108737821A publication Critical patent/CN108737821A/zh
Application granted granted Critical
Publication of CN108737821B publication Critical patent/CN108737821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多通道浅层特征的视频兴趣区域快速预选方法,包括:读取视频数据流,并将视频数据流分解为RGB源尺寸图像;对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。本发明的视频兴趣区域快速预选方法能够满足目标识别区域的筛选功能,同时可以明显加速视频数据的处理速度。

Description

基于多通道浅层特征的视频兴趣区域快速预选方法及系统
技术领域
本发明属于图像处理技术领域,特别涉及一种基于多通道浅层特征的视频兴趣区域快速预选方法及系统。
背景技术
随着光学、电子技术的不断发展,基于视频图像的技术方案在工业设计、家庭娱乐、交通监控等领域得到广泛应用。高性能的计算机处理器芯片、专用的GPU加速器、更高效的图像处理算法、强大的云计算平台使得图像内容检索、分析性能得到进一步的提升。
视频显著区域提取是计算机图像智能识别、内容分析的重要步骤。计算机视频采集原始数据流具有体积大、冗余内容多、有效数据量小等特点,需要采用一定的预处理技术多兴趣目标范围进行快速甄别,区分背景区域,缩小检索的视野范围,为后继的目标识别算法进行初步的区域筛选,目前准确率较高的智能识别技术算法较复杂,处理时间较长,开发快速的显著区域提取技术有利于提高识别系统整体的实时性,减少处理时间,降低系统的整体功耗。
目前已有多种基于软件算法的计算机视觉处理算法进行视频、图像中目标的提取、识别、跟踪,有基于像素点迁移的,这些软件算法已经广泛应用于人脸识别、车牌识别等领域,但是这些算法通常流程复杂,需要高性能的CPU和GPU配置的硬件平台支持,算法实时性较差,同时这些算法对图片中目标的条件有限制,需要目标物理位置、势态角度、运行速度以及拍摄曝光强度等在可处理的范围内,通用的软件算法不满足高分辨率、大广角、实时性强、可便携的视频图像设备处理要求。
FPGA(Field-Programmable Gate Array),现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的技术。与专用集成电路(ASIC)相比,它是可编程的半定制电路,解决了定制电路的灵活性不足缺点,又克服了之前可编程器件门电路数有限的问题。与基于工作站、服务器的图像处理方法相比,采用FPGA设计实现的图像处理算法可以显著提升系统性能,更有利于实现便携式的处理模块,同时系统灵活,算法升级便捷。
201410675063.7介绍了一种视频显著图提取方法,其根据解码得到的解码视频中的每帧解码帧中的每个子块的运动矢量和每个子块中的每个像素点的DCT系数,分别获得解码视频中的每帧解码帧的运动显著图和纹理显著图;然后根据解码视频中的每帧解码帧的纹理显著图。但是该算法实现复杂,所有图像数据处理均匀,实时性差。还有一种现有技术的显著区域确定算法,其首先通过对二维视频在时域上、在水平方向及在垂直方向进行采样,分别得到X-Y截面图像、X-T截面图像和Y-T截面图像,然后通过对X-T截面图像和Y-T截面图像进行低秩矩阵分解提取出X-Y截面图像的运动显著区域。但是该算法复杂,所有图像数据处理均匀,实时性差。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种基于多通道浅层特征的视频兴趣区域快速预选方法及系统,从而克服现有技术的所有图像数据处理均匀、实时性差的缺点。
本发明提供了一种基于多通道浅层特征的视频兴趣区域快速预选方法,其特征在于,视频兴趣区域快速预选方法包括:读取视频数据流,并将视频数据流分解为RGB源尺寸图像;对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。
优选地,上述技术方案中,如果第一差值小于预定门限,则继续执行以下步骤:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;以及将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。
优选地,上述技术方案中,视频兴趣区域快速预选方法还包括:基于合一化的帧信息计算像素密度显著值;基于帧的RGBY颜色空间的表征计算颜色显著值;基于帧的RGBY颜色空间的表征计算像素方位显著值;以及基于像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果。
优选地,上述技术方案中,视频兴趣区域快速预选方法还包括:基于合一化的帧信息计算像素密度显著值包括:构建输入在n x n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;基于帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;基于帧的RGBY颜色空间的表征计算像素方位显著值包括:构建输入在n x n空间划分下的方位显著表征;以及将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。
本发明还提供了一种基于多通道浅层特征的视频兴趣区域快速预选系统,包括:视频信息读入模块,其用于读取视频数据流,并将视频数据流分解为RGB源尺寸图像;RGB源尺寸图像处理模块,其用于对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;判别值获得模块,其用于基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及快速判别模块,其用于将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。
优选地,上述技术方案中,视频兴趣区域快速预选系统还包括:用于如果第一差值小于预定门限,则继续执行以下步骤的模块:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。
优选地,上述技术方案中,视频兴趣区域快速预选系统还包括:像素密度显著值计算模块,其用于基于合一化的帧信息计算像素密度显著值;颜色显著值计算模块,其用于基于帧的RGBY颜色空间的表征计算颜色显著值;像素方位显著值计算模块,其用于基于帧的RGBY颜色空间的表征计算像素方位显著值;用于基于像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果的模块。
优选地,上述技术方案中,基于合一化的帧信息计算像素密度显著值包括:构建输入在n x n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;基于帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;基于帧的RGBY颜色空间的表征计算像素方位显著值包括:构建输入在n xn空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。
优选地,上述技术方案中,视频信息读入模块能够将多种格式、任意分辨率大小、多种色彩制式的视频统一以RGB三通道、双精度编码的数据读入系统中。
与现有技术相比,本发明具有如下有益效果:
本发明通过硬件FPGA加速器的方式实现视频显著区的提取功能。该方案可以将基于软件提取显著区域的算法采用硬件实现,满足目标识别区域的筛选功能,在实现算法功能的同时可以明显加速视频数据的处理速度,该方案应用场景丰富,可以满足大部分便携式设备的物理尺寸要求,对视频流图像显著区域的预处理方案可以很好地辅助实现大视野广角图像监控系统的在线实时处理功能,硬件化的系统方案有利于降低系统的平台成本,对部署识别设备系统的小型化有重要的意义。
附图说明
图1是本发明的视频兴趣区域快速预选方法流程图。
具体实施方式
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
图1是本发明的方法流程图,本发明的基于多通道浅层特征的视频兴趣区域快速预选方法包括:步骤101:读取视频数据流,并将视频数据流分解为RGB源尺寸图像;步骤102:对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;步骤103:基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及步骤104:将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。
在一个实施例中,本发明的方法还包括:如果第一差值小于预定门限,则继续执行以下步骤:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。视频兴趣区域快速预选方法还包括:基于合一化的帧信息计算像素密度显著值;基于帧的RGBY颜色空间的表征计算颜色显著值;基于帧的RGBY颜色空间的表征计算像素方位显著值;以及基于像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果。
视频兴趣区域快速预选方法还包括:基于合一化的帧信息计算像素密度显著值包括:构建输入在n x n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;基于帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;基于帧的RGBY颜色空间的表征计算像素方位显著值:构建输入在n x n空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。
本发明的基于多通道浅层特征的视频兴趣区域快速预选系统,包括:视频信息读入模块、RGB源尺寸图像处理模块、判别值获得模块、快速判别模块。其中,视频信息读入模块用于读取视频数据流,并将视频数据流分解为RGB源尺寸图像。RGB源尺寸图像处理模块用于对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据。判别值获得模块用于基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值。快速判别模块用于将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。
上述方案中,本发明的视频兴趣区域快速预选系统还包括:用于如果第一差值小于预定门限,则继续执行以下步骤的模块:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。
视频兴趣区域快速预选系统还包括:像素密度显著值计算模块,其用于基于合一化的帧信息计算像素密度显著值;颜色显著值计算模块,其用于基于帧的RGBY颜色空间的表征计算颜色显著值;像素方位显著值计算模块,其用于基于帧的RGBY颜色空间的表征计算像素方位显著值;用于基于像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果的模块。其中,基于合一化的帧信息计算像素密度显著值包括:构建输入在n x n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;基于帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;基于帧的RGBY颜色空间的表征计算像素方位显著值:构建输入在n x n空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。视频信息读入模块能够将多种格式、任意分辨率大小、多种色彩制式的视频统一以RGB三通道、双精度编码的数据读入系统中。视频信息读入模块不仅可以运行在Windows、Linux、Unix及其它计算机操作系统中,还可以运行在其它非计算机平台和操作系统下。
根据本发明的另一实施例,本发明的系统硬件部分由FPGA芯片、PCB开发板;其中开发板上包含FPGA芯片接口,HDMI总线输入、HDMI总线输出、SD卡控制器、电源电路、SPI总线接口等部分组成。FPGA系统中包括参数初始化模块,图像提取模块,帧信息模块,帧变换模块,快速采样计算模块,旁路辨别模块,像素密度值计算模块,HUE颜色显著区计算,像素位移计算模块和图像输入输出控制模块,缓冲区存储模块,SPI总线控制模块,系统控制模块组成。
系统通过HDMI总线输入实时的图像数据。通过SD卡读入系统的初始参数信息,预取结束后的原始图像。系统将显著区域的图像区域位置标号采用输出总线与后继判别设备相连,与输入的实时图像共同输出到后继处理模块。
本发明的处理流程包括:
流程111:系统通过HDMI接口连接输入摄像头的视频流,SD卡插入PCB板的卡槽中,系统接入外接电源或内置的电池。
流程112:FPGA中
Figure BDA0001640746820000081
信号为底保持一段时间,FPGA的参数初始化模块从SD卡为各模块预取初始化参数包括结果评估加权阈值,输入图像尺寸大小、速度信息、芯片频率设置、系统标识等信息。
流程113:FPGA芯片从外接的HDMI接口中读取数据流,解析数据流格式,分解还原出原来RGB源尺寸图像。
流程114:对大尺寸的RGB图像进行图像剪切,划分为64X 64的像素点的小图像块,标记逻辑位置,对与边界值无法满足尺寸的图像块,省略处理,不进入下面的处理流程,最后该图像片段的评估结果复制左边或上边相连接的完整图像块评估结果。
流程115:FPGA中对读取到的小图像块进行复制处理。
流程116:对步骤115中的小图像块并行进入下面帧变换模块中4个并行处理模块(步骤117-120)。
流程117:帧通道处理模块将输入数据流中的RGB颜色进行混合,对各个像素点的三路颜色先相加再除以三以求平均值,生成新的图像,保存在RAM单元中。
流程118:判断清空信号Clear是否有效,如果有效,则清空对应的RAM单元内容,否则提取数据流中的红色单通道数据,按照数据格式,以乒乓的方式保存在RAM中。
流程119:判断清空信号Clear是否有效,如果有效,则清空对应的RAM单元内容,否则提取数据流中的绿色单通道数据,按照数据格式,以乒乓的方式保存在RAM中。
流程120:判断清空信号Clear是否有效,如果有效,则清空对应的RAM单元内容,否则提取数据流中的蓝色单通道数据,按照数据格式,以乒乓的方式保存在RAM中。
流程121:并行步骤117-120结束后,信号分别进入流程122、流程124、流程125、流程126。
流程122:模块连接的旁路判别模块分别从流程117,118,119,120生成的RAM中,按照(0.25,0.25),(0.25,0.5),(0.25,0.75),(0.5,0.25),(0.5,0.5),(0.5,0.75),(0.75,0.25),(0.75,0.5),(0.75,0.75),百分比的位置取一个传输数据长度的单元内容。每个位置取前面的4个数值对该内容进行平均求和。求和结束后,值保存在SUM_RES单元数组中。该值与SUM_RES_1进行比较,当差值绝对值超过预定的阈值后,FAST_JUDGE信号有效。转到流程123。
流程123:判别模块中,FAST_JUDGE信号与HUE_JUDGE信号,DENSE_VALID信号,MOVE_VALID信号采用与的方式组成PREDICT_VALID信号,当FAST_JUDGE模块有效时,该图像大概率为视频显著区,该图像块对应大图像位置的FLAG数组中的标志位置位。由于采样信号求像素点均值的方式具有计算简单的特点,所以该判别方法速度快,当,FAST_JUDGE信号有效时,其他的判别方式电路复位,提前结束判断流程,进行下一个图像块的判别,进而加速预判断流程。
流程124:帧过滤模块首先将输入的视频帧中的分离的RGB通道像素点与各自对应阈值的像素点进行比较。对于低于阈值的像素点数值更新为0,其他区域采用进行倒数查找表计算。
流程125:将其低于一个阈值的像素点置0,其他像素取倒数,生成当前帧的尺度矩阵。然后,将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息。之后,通过非线性映射函数,将RGB映射为RGBY空间,获得帧在RGBY颜色空间的表征。最后,将它们与合一化的帧信息共同作为帧信息的两种描述输出。
流程126:合一化的帧数据结果输入像素密度显著值计算模块,构建输入在n x n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布。
流程127:多通道的帧描述数据进入HUE颜色显著值计算模块,将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布。
流程128:合一化的帧数据结果输入到像素方位显著值计算模块,构建输入在n xn空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。
流程129:在获取多通道的预选结果之后,本系统通过加权组合的方式将这些预选结果进行再二次判决,进行输出。本示例中,各通道的权值保存在指定的寄存器中。
流程130:综合判断结果(predict_result)与该子图片的标识信号(pic_id),输出使能信号(result_valid),一同输出到图片识别的复杂卷积神经处理模块中。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (9)

1.一种基于多通道浅层特征的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法包括:
读取视频数据流,并将所述视频数据流分解为RGB源尺寸图像;
对所述RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;
基于所述三路颜色通道数据的平均值、所述红色单通道数据、所述绿色单通道数据或所述蓝色单通道数据,得到第一判别值;以及
将所述第一判别值与第一存储值进行比较,得到第一差值,如果所述第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对所述图像块进行其它判别,
其中,所述基于所述三路颜色通道数据的平均值、所述红色单通道数据、所述绿色单通道数据或所述蓝色单通道数据,得到第一判别值包括:
从存储所述三路颜色通道数据的平均值的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值,其中,x代表像素宽度、y代表像素高度;
从存储所述红色单通道数据的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值;
从存储所述绿色单通道数据的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值;或
从存储所述蓝色单通道数据的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值。
2.根据权利要求1所述的视频兴趣区域快速预选方法,其特征在于,如果所述第一差值小于预定门限,则继续执行以下步骤:
将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;
将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;
通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;以及
将帧的RGBY颜色空间的表征与所述归一化后的R、G、B三通道帧信息共同作为帧信息的两种描述输出。
3.根据权利要求2所述的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法还包括:
基于所述归一化后的R、G、B三通道帧信息计算像素密度显著值;
基于所述帧的RGBY颜色空间的表征计算颜色显著值;
基于所述帧的RGBY颜色空间的表征计算像素方位显著值;以及
基于所述像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果。
4.根据权利要求3所述的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法还包括:
所述基于所述归一化后的R、G、B三通道帧信息计算像素密度显著值包括:构建输入在nx n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;
所述基于所述帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;
所述基于所述帧的RGBY颜色空间的表征计算像素方位显著值包括:构建输入在n x n空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。
5.一种基于多通道浅层特征的视频兴趣区域快速预选系统,其特征在于,所述视频兴趣区域快速预选系统包括:
视频信息读入模块,其用于读取视频数据流,并将所述视频数据流分解为RGB源尺寸图像;
RGB源尺寸图像处理模块,其用于对所述RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;
判别值获得模块,其用于基于所述三路颜色通道数据的平均值、所述红色单通道数据、所述绿色单通道数据或所述蓝色单通道数据,得到第一判别值;以及
快速判别模块,其用于将所述第一判别值与第一存储值进行比较,得到第一差值,如果所述第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对所述图像块进行其它判别,
其中,所述判别值获得模块基于所述三路颜色通道数据的平均值、所述红色单通道数据、所述绿色单通道数据或所述蓝色单通道数据,得到第一判别值包括:
从存储所述三路颜色通道数据的平均值的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值,其中,x代表像素宽度、y代表像素高度;
从存储所述红色单通道数据的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值;
从存储所述绿色单通道数据的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值;或
从存储所述蓝色单通道数据的RAM中按照(0.25x,0.25y)、(0.25x,0.5y)、(0.25x,0.75y)、(0.5x,0.25y)、(0.5x,0.5y)、(0.5x,0.75y)、(0.75x,0.25y)、(0.75x,0.5y)、(0.75x,0.75y)的位置分别取一个传输数据长度的单元内容,每个位置取前面的4个数值对该内容进行平均求和从而得到所述第一判别值。
6.根据权利要求5所述的视频兴趣区域快速预选系统,其特征在于,所述视频兴趣区域快速预选系统还包括:
用于如果所述第一差值小于预定门限,则继续执行以下步骤的模块:
将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;
将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;
通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;以及
将帧的RGBY颜色空间的表征与所述归一化后的R、G、B三通道帧信息共同作为帧信息的两种描述输出。
7.根据权利要求6所述的视频兴趣区域快速预选系统,其特征在于,所述视频兴趣区域快速预选系统还包括:
像素密度显著值计算模块,其用于基于所述归一化后的R、G、B三通道帧信息计算像素密度显著值;
颜色显著值计算模块,其用于基于所述帧的RGBY颜色空间的表征计算颜色显著值;
像素方位显著值计算模块,其用于基于所述帧的RGBY颜色空间的表征计算像素方位显著值;以及
用于基于所述像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果的模块。
8.根据权利要求7所述的视频兴趣区域快速预选系统,其特征在于,
所述基于所述归一化后的R、G、B三通道帧信息计算像素密度显著值包括:构建输入在nx n空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到归一化后的R、G、B三通道帧信息的像素密度值分布;
所述基于所述帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;
所述基于所述帧的RGBY颜色空间的表征计算像素方位显著值:构建输入在n x n空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。
9.根据权利要求5所述的多通道浅层特征的视频兴趣区域快速预选系统,其特征在于,所述视频信息读入模块能够将多种格式、任意分辨率大小、多种色彩制式的视频统一以RGB三通道、双精度编码的数据读入系统中。
CN201810379570.4A 2018-04-25 2018-04-25 基于多通道浅层特征的视频兴趣区域快速预选方法及系统 Active CN108737821B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810379570.4A CN108737821B (zh) 2018-04-25 2018-04-25 基于多通道浅层特征的视频兴趣区域快速预选方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810379570.4A CN108737821B (zh) 2018-04-25 2018-04-25 基于多通道浅层特征的视频兴趣区域快速预选方法及系统

Publications (2)

Publication Number Publication Date
CN108737821A CN108737821A (zh) 2018-11-02
CN108737821B true CN108737821B (zh) 2020-09-04

Family

ID=63939821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810379570.4A Active CN108737821B (zh) 2018-04-25 2018-04-25 基于多通道浅层特征的视频兴趣区域快速预选方法及系统

Country Status (1)

Country Link
CN (1) CN108737821B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113096022B (zh) * 2019-12-23 2022-12-30 RealMe重庆移动通信有限公司 图像虚化处理方法、装置、存储介质与电子设备
CN112104818B (zh) * 2020-08-28 2022-07-01 稿定(厦门)科技有限公司 Rgb通道分离方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129693A (zh) * 2011-03-15 2011-07-20 清华大学 基于色彩直方图和全局对比度的图像视觉显著性计算方法
CN102496157A (zh) * 2011-11-22 2012-06-13 上海电力学院 基于高斯多尺度变换及颜色复杂度的图像检测方法
CN103996185A (zh) * 2014-04-29 2014-08-20 重庆大学 一种基于注意力td-bu机制的图像分割方法
CN104091326A (zh) * 2014-06-16 2014-10-08 小米科技有限责任公司 图标分割方法和装置
CN104408446A (zh) * 2014-12-19 2015-03-11 中国人民解放军国防科学技术大学 一种基于图像显著性的无人机自主着陆目标检测方法
CN104463855A (zh) * 2014-11-25 2015-03-25 武汉科技大学 一种基于频域和空域结合的显著区域检测方法
CN106295587A (zh) * 2016-08-16 2017-01-04 块互动(北京)科技有限公司 一种视频感兴趣区域快速标定方法与装置
CN106599891A (zh) * 2016-10-18 2017-04-26 华中科技大学 一种基于尺度相位谱显著性的遥感图像兴趣区快速提取方法
CN107239760A (zh) * 2017-06-05 2017-10-10 中国人民解放军军事医学科学院基础医学研究所 一种视频数据处理方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10033918B2 (en) * 2016-03-29 2018-07-24 Sony Corporation Method and system for image processing to detect salient objects in image

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129693A (zh) * 2011-03-15 2011-07-20 清华大学 基于色彩直方图和全局对比度的图像视觉显著性计算方法
CN102496157A (zh) * 2011-11-22 2012-06-13 上海电力学院 基于高斯多尺度变换及颜色复杂度的图像检测方法
CN103996185A (zh) * 2014-04-29 2014-08-20 重庆大学 一种基于注意力td-bu机制的图像分割方法
CN104091326A (zh) * 2014-06-16 2014-10-08 小米科技有限责任公司 图标分割方法和装置
CN104463855A (zh) * 2014-11-25 2015-03-25 武汉科技大学 一种基于频域和空域结合的显著区域检测方法
CN104408446A (zh) * 2014-12-19 2015-03-11 中国人民解放军国防科学技术大学 一种基于图像显著性的无人机自主着陆目标检测方法
CN106295587A (zh) * 2016-08-16 2017-01-04 块互动(北京)科技有限公司 一种视频感兴趣区域快速标定方法与装置
CN106599891A (zh) * 2016-10-18 2017-04-26 华中科技大学 一种基于尺度相位谱显著性的遥感图像兴趣区快速提取方法
CN107239760A (zh) * 2017-06-05 2017-10-10 中国人民解放军军事医学科学院基础医学研究所 一种视频数据处理方法及系统

Also Published As

Publication number Publication date
CN108737821A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN112528878B (zh) 检测车道线的方法、装置、终端设备及可读存储介质
CN108805023B (zh) 一种图像检测方法、装置、计算机设备及存储介质
CN111311482B (zh) 背景虚化方法、装置、终端设备及存储介质
CN110176024B (zh) 在视频中对目标进行检测的方法、装置、设备和存储介质
CN111127358B (zh) 图像处理方法、装置及存储介质
CN112233076B (zh) 基于红色圆标靶图像处理的结构振动位移测量方法及装置
CN108737821B (zh) 基于多通道浅层特征的视频兴趣区域快速预选方法及系统
CN112703532A (zh) 图像处理方法、装置、设备及存储介质
CN114782911B (zh) 图像处理的方法、装置、设备、介质、芯片及车辆
CN111383254A (zh) 一种深度信息获取方法、系统及终端设备
JP2023065515A (ja) 勾配方向ヒストグラムの演算のためのハードウェアアクセレレータ
CN112884795A (zh) 一种基于多特征显著性融合的输电线路巡检前景与背景分割方法
CN111027564A (zh) 基于深度学习一体化的低照度成像车牌识别方法及装置
CN106778822B (zh) 基于漏斗变换的图像直线检测方法
CN112528994A (zh) 一种自由角度车牌检测方法、车牌识别方法和识别系统
CN112115737B (zh) 一种车辆朝向的确定方法、装置及车载终端
CN111539975A (zh) 一种运动目标的检测方法、装置、设备及存储介质
CN110765875A (zh) 交通目标的边界检测方法、设备及装置
CN112785651A (zh) 用于确定相对位姿参数的方法和装置
CN114463685B (zh) 行为识别方法、装置、电子设备及存储介质
CN112669346B (zh) 一种路面突发状况确定方法及装置
CN114387327A (zh) 基于深度学习视差预测的合成孔径聚焦成像方法
Jatmiko et al. Study and performance evaluation binary robust invariant scalable keypoints (BRISK) for underwater image stitching
CN113936134A (zh) 一种目标检测方法及装置
CN110148089B (zh) 一种图像处理方法、装置及设备、计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant