CN115512405A - 一种背景图像处理方法、装置、电子设备及存储介质 - Google Patents
一种背景图像处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115512405A CN115512405A CN202210983412.6A CN202210983412A CN115512405A CN 115512405 A CN115512405 A CN 115512405A CN 202210983412 A CN202210983412 A CN 202210983412A CN 115512405 A CN115512405 A CN 115512405A
- Authority
- CN
- China
- Prior art keywords
- background
- image
- frequency domain
- map
- background image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/40—Spoof detection, e.g. liveness detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Medical Informatics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种背景图像处理方法、装置、电子设备及存储介质,所述方法包括:获得待识别图像对应的背景图像;将背景图像进行转换,获得表征频域特征的背景频域图;将背景频域图转换为背景时域图;将背景时域图和背景频域图进行通道叠加,获得叠加背景图像。通过将背景图像转换得到背景频域图,充分利用背景图像频域特征,将背景图像的频域特征与时域特征进行叠加,通过叠加背景图像多维度信息,使背景图像的识别在数据源头得到提升,进而提升背景识别的准确率。
Description
技术领域
本申请涉及图像处理领域,具体而言,涉及一种背景图像处理方法、装置、电子设备及存储介质。
背景技术
在一些业务场景中,需要对图像的背景进行识别,以判断用户办理业务的场景,避免用户被欺诈。在图像相似背景的识别之前,通常需要先提取背景区域的图像,然后对背景区域的图像直接进行特征提取并识别,背景图像的中的信息较为单一,因此识别方法效果较差,识别的错误率较高。
发明内容
本发明实施例的目的在于一种背景图像处理方法、装置、电子设备及存储介质,通过将背景图像转换得到背景频域图,充分利用背景图像频域特征,将背景图像的频域特征与时域特征进行叠加,通过叠加背景图像多维度信息,对背景图像进行有效处理,使背景图像的识别在数据源头得到提升,进而提升背景识别的准确率。
第一方面,本申请实施例提供了一种背景图像处理方法,包括:获得待识别图像对应的背景图像;将背景图像进行转换,获得表征频域特征的背景频域图;将背景频域图转换为背景时域图;将背景时域图和背景频域图进行通道叠加,获得叠加背景图像。
在上述的实现过程中,通过将背景图像进行转换,获取表征频域特征的背景频域图,将背景时域图和背景频域图进行通道叠加,获得叠加背景图像,叠加图像同时具有频域特征和时域特征,对背景图像进行有效处理,使背景图像的识别在数据源头得到提升,进而提高背景识别的准确率。
可选地,在本申请实施例中,在将背景图片进行转换,获得表征频域特征的背景频域图之后,在将背景频域图转换为背景时域图之前,方法还包括:对背景频域图中的低频信息进行过滤,获得过滤频域图;将背景频域图转换为背景时域图,包括:将过滤频域图转换为背景时域图。
在上述的实现过程中,对背景频域图中的低频信息进行过滤,实现对环境光以及普通干扰进行过滤,去掉了背景图像中的低频干扰,获得效果更好的高频特征频域图,提高背景识别的准确率。
可选地,在本申请实施例中,对背景频域图中的低频信息进行过滤,获得过滤频域图,包括:通过高通滤波器对背景频域图中的低频信息进行过滤,高通滤波器的公式为:Y(n)=αX(n)+(1-α)Y(n-1);其中:α为滤波系数;X(n)为本次采样值;Y(n-1)为前一次滤波输出值;Y(n)为本次滤波输出值。
在上述的实现过程中,通过高通滤波器对背景频域图中的低频信息进行过滤,其中,高通滤波法采用本次采样值与前一次滤波输出值进行加权,得到有效的本次滤波输出值,使得输出对输入有反馈左右,提高高通滤波器过滤背景图像中的低频干扰的可靠性。
可选地,在本申请实施例中,将背景时域图和背景频域图进行通道叠加,获得叠加背景图像包括:将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,获得叠加背景图像。
在上述的实现过程中,通过将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,获得叠加背景图像,关注到背景图像的频域特征和时域特征,扩充了背景识别的输入维度,使背景图像的识别在数据源头得到提升,提高背景识别的召回率。
可选地,在本申请实施例中,在将背景时域图和背景频域图进行通道叠加,获得叠加背景图像之后,方法还包括:利用特征提取模型对叠加背景图进行特征提取,获得特征数据;特征提取模块包括多个卷积层,特征数据包括每一卷积层对应的子特征数据;将每一卷积层对应的子特征数据进行叠加,获得背景特征图。
在上述的实现过程中,利用特征提取模型对叠加背景图进行特征提取,获得特征数据,对特征提取模型中的每一卷积层对应的子特征数据都进行抽取,并将子特征数据进行叠加获得背景特征图,增大特征输入,进而提升特征提取模型的特征提取的准确率。
可选地,在本申请实施例中,在将每一卷积层对应的子特征数据进行叠加,获得背景特征图之后,方法还包括:获得参考背景特征图;计算参考背景特征图和背景特征图的相似度,获得相似度数据;根据相似度数据和预设的阈值,获得识别结果。
在上述的实现过程中,计算参考背景特征图和背景特征图的相似度,根据预设的阈值,获得识别结果,以判断待识别背景图像是否和参考背景为同一背景。
可选地,在本申请实施例中,获得待识别图像对应的背景图像,包括:获得待识别图像;待识别图像包括前景图像特征和背景图像特征;将待识别图像输入预设的分割模型,前景图像特征和背景图像特征进行分离,获得背景图像;其中,分割模型是采用学习率衰减组合重启动学习率机制进行训练的。
在上述的实现过程中,通过分割模型将待识别图像,将前景图像特征和背景图像特征进行分离,获得背景图像,剔除前景图像特征对背景识别的干扰。分割模型是采用学习率衰减组合重启动学习率机制进行训练的,提高分割模型的精准度。
第二方面,本申请实施例还提供了一种背景图像处理装置,包括:获取模块,用于获得待识别图像对应的背景图像;频域转换模块,用于将背景图片进行转换,获得表征频域特征的背景频域图;时域转换模块,用于将背景频域图转换为背景时域图;叠加模块,用于将背景时域图和背景频域图进行通道叠加,获得叠加背景图像。
可选地,在本申请实施例中,背景图像处理装置,还包括:过滤模块,用于对背景频域图中的低频信息进行过滤,获得过滤频域图;时域转换模块还用于将过滤频域图转换为背景时域图。
可选地,在本申请实施例中,背景图像处理装置,过滤模块,具体用于通过高通滤波器对背景频域图中的低频信息进行过滤,高通滤波器的公式为:Y(n)=αX(n)+(1-α)Y(n-1);其中:α为滤波系数;X(n)为本次采样值;Y(n-1)为前一次滤波输出值;Y(n)为本次滤波输出值。
可选地,在本申请实施例中,背景图像处理装置,叠加模块,具体用于将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,获得叠加背景图像。
可选地,在本申请实施例中,背景图像处理装置,还包括:特征提取模块,用于利用特征提取模型对叠加背景图进行特征提取,获得特征数据;特征提取模块包括多个卷积层,特征数据包括每一卷积层对应的子特征数据;将每一卷积层对应的子特征数据进行叠加,获得背景特征图。
可选地,在本申请实施例中,背景图像处理装置,还包括:结果识别模块,用于获得参考背景特征图;计算参考背景特征图和背景特征图的相似度,获得相似度数据;根据相似度数据和预设的阈值,获得识别结果。
可选地,在本申请实施例中,背景图像处理装置,获取模块,具体用于获得待识别图像;待识别图像包括前景图像特征和背景图像特征;将待识别图像输入预设的分割模型,前景图像特征和背景图像特征进行分离,获得背景图像;其中,分割模型是采用学习率衰减组合重启动学习率机制进行训练的。
第三方面,本申请实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上面描述的方法。
采用本申请提供一种背景图像处理方法、装置、电子设备及存储介质,将背景时域图和背景频域图进行通道叠加,获得叠加背景图像,使背景图像的识别在数据源头得到提升,进而提高背景识别的准确率。通过高通滤波器对背景频域图中的低频信息进行过滤,提高高通滤波器过滤背景图像中的低频干扰的可靠性。提取特征时,将子特征数据进行叠加获得背景特征图,增大特征输入,进而提升特征提取模型的特征提取的准确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种背景图像处理方法的流程示意图;
图2为本申请实施例提供的图像频域转换策略示意图;
图3为本申请实施例提供的特征提取模型结构示意图;
图4为本申请实施例提供的前后背景分割模型输出示意图;
图5为本申请实施例提供的一种背景图像处理装置的结构示意图;
图6为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
在本申请实施例的描述中,技术术语“第一”、“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本申请实施例的描述中,“多个”的含义是两个及以上,除非另有明确具体的限定。
请参见图1示出的本申请实施例提供的一种背景图像处理方法的流程示意图。本申请实施例提供的背景图像处理方法可以应用于电子设备,该电子设备可以包括终端以及服务器;其中终端具体可以为智能手机、平板电脑、计算机、个人数字助理(PersonalDigital Assitant,PDA)等;服务器具体可以为应用服务器,也可以为Web服务器。
步骤S110:获得待识别图像对应的背景图像。
上述步骤S110的实施方式包括:待识别图像可以为用户在办理业务时通过电子设备采集获得的人脸识别图像,待识别图像包括人像图像和背景图像,背景图像为待识别图像中除人像图像以外的图像。获得背景图像的方式包括抠图和分割前后背景方法等。为了防止不法分子将用户骗去某些场所进行业务办理,因此需要对待识别图像中的背景图像进行识别,判断用户所处的环境是否为特定的场景。
步骤S120:将背景图片进行转换,获得表征频域特征的背景频域图。
上述步骤S120的实施方式包括:将背景图片进行傅里叶变换,获得表征频域特征的背景频域图。具体例如,采用傅里叶变换对获取的背景图片的频谱移频到原点,使得背景图片的频率分布以原点为圆心,对称分布;经过傅里叶变换之后,获得背景图片的频率分布,除圆心亮点外,还存在对称分布的亮点集合,该亮点集合为干扰噪生产生的,及周期性规律的干扰信号。傅里叶变换为:
其中,ω为频率,t为时间,f(t)为t的周期函数,F(ω)为f(t)的像函数,f(t)为F(ω)的像原函数。
从背景频域图的图像频率分布中可以看到背景图片的频域特征,频率特征指的是灰度值的变化频率;频域特征包括高频信息、中频信息和低频信息。低频信息就是指灰度值变化频率慢的信息,即连续而相近的亮度,这些信息形成了图像的基本灰度等级。中频信息灰度变化相比低频信息较快,而图像中物体的边缘处就是这种灰度变化较快的区域,所以是主要的边缘结构。高频信息灰度变化相比中频信息较快,通常对应图像里的边缘和细节等。
步骤S130:将背景频域图转换为背景时域图。
上述步骤S130的实施方式包括:将背景频域图通过傅里叶逆变换,转换为背景时域图。其中,傅立叶逆变换公式为:
其中,ω为频率,t为时间,F(ω)为f(t)的像函数,f(t)为F(ω)的像原函数。
步骤S140:将背景时域图和背景频域图进行通道叠加,获得叠加背景图像。
上述步骤S140的实施方式包括:将背景时域图中的通道信息和背景频域图中的通道信息进行叠加,获得叠加背景图像,叠加方式可以为顺序叠加,也可以为其他方式。
在上述的实现过程中,通过将背景图像进行转换,获取表征频域特征的背景频域图,将背景时域图和背景频域图进行通道叠加,获得叠加背景图像,叠加图像同时具有频域特征和时域特征,使背景图像的识别在数据源头得到提升,进而提高背景识别的准确率。
可选的,在本申请实施例中,在将背景图片进行转换,获得表征频域特征的背景频域图之后,在将背景频域图转换为背景时域图之前,方法还包括:对背景频域图中的低频信息进行过滤,获得过滤频域图;将背景频域图转换为背景时域图,包括:将过滤频域图转换为背景时域图。
上述步骤的实施方式例如:获得表征频域特征的背景频域图,背景图片的频域特征包括高频信息和低频信息,其中低频信息包括干扰噪音,以及周期性规律的干扰信号。对背景频域图中的低频信息进行过滤,获得过滤频域图,将过滤频域图转换为背景时域图。
在上述的实现过程中,对背景频域图中的低频信息进行过滤,实现对环境光以及普通干扰进行过滤,去掉了背景图像中的低频干扰,获得效果更好的高频特征频域图,提高背景识别的准确率。
可选地,在本申请实施例中,对背景频域图中的低频信息进行过滤,获得过滤频域图,包括:通过高通滤波器对背景频域图中的低频信息进行过滤,高通滤波器的公式为:Y(n)=αX(n)+(1-α)Y(n-1);其中:α为滤波系数;X(n)为本次采样值;Y(n-1)为前一次滤波输出值;Y(n)为本次滤波输出值;n为第n次。
上述步骤的实施方式例如:通过高通滤波器对背景频域图中的低频信息进行过滤。高通滤波器,又称低截止滤波器、低阻滤波器,允许高于某一截频的频率通过,而大大衰减较低频率的一种滤波器。高通滤波器去掉了信号中不必要的低频成分或者低频干扰。通过高通滤波器对背景频域图中的频域信息进行处理,将低频信息进行过滤。
其中,高通滤波器的公式为:Y(n)=αX(n)+(1-α)Y(n-1);其中:α为滤波系数;X(n)为本次采样值;Y(n-1)为前一次滤波输出值;Y(n)为本次滤波输出值。通过本次采样值于前一次滤波输出值进行加权,得到本次滤波输出值,使得本次滤波输出值的输出对下一次滤波输出值有反馈作用。
在一些优选实施例中,设定一阶高通滤波器参数时,采用多项式核函数中支持向量机(support vector machines,SVM)训练滤波系数。多项式核函数可以实现将低维的输入空间映射到高维的特征空间,SVM是一种二分类模型,将实例的特征向量映射为空间中的一些点,实现通过SVM得到滤波系数。
在上述的实现过程中,通过高通滤波器对背景频域图中的低频信息进行过滤,其中,高通滤波法采用本次采样值与前一次滤波输出值进行加权,得到有效的本次滤波输出值,输出对输入有反馈左右,提高高通滤波器过滤背景图像中的低频干扰的可靠性。
可选地,在本申请实施例中,将背景时域图和背景频域图进行通道叠加,获得叠加背景图像包括:将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,获得叠加背景图像。
上述步骤的实施方式例如:RGB是最常用于显示器的色彩空间,R(red)是红色通道,G(green)是绿色通道,B(blue)是蓝色通道。这三种颜色以不同的量进行叠加,就可以显示出五彩缤纷的色彩。将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,具体例如,若背景时域图的通道顺序为红色通道、绿色通道以及蓝色通道,即RGB,背景频域图的通道记为F,通过顺序叠加,叠加之后获得叠加背景图像,叠加背景图像的通道顺序则为RGBF。叠加背景图片可以看作是四层二维数组的叠加,每一层二维数组都是一个通道,叠加背景图片共有RGB以及背景频域图的通道F四层。根据叠加背景图像RGBF的每一通道的数值,可确定像素点的颜色。
在上述的实现过程中,通过将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,获得叠加背景图像,关注到背景图像的频域特征和时域特征,扩充了背景识别的输入维度,使背景图像的识别在数据源头得到提升,提高背景识别的召回率。
请参见图2示出的本申请提出的图像频域转换策略示意图。
在一些优选实施例中,获得人脸RGB图像,人脸RGB图像包括人脸部分和背景部分。将人脸RGB图像进行傅里叶变换,获得表征频域特征的频域图像,将获得的频域图像进行高通滤波,对背景频域图中的低频信息进行过滤,获得过滤频域图,过滤频域图的通道为F,其中,高通滤波采用多项式核函数中SVM训练滤波系数。再将过滤频域图经过傅里叶逆变换,转换为新的人脸RGB图像的时域图。将新的人脸RGB图像的时域图和过滤频域图进行得加,获得叠加频域的图像RGBF,即完成了图像频域转换,获得效果更好的叠加频域图。
可选地,在本申请实施例中,在将背景时域图和背景频域图进行通道叠加,获得叠加背景图像之后,方法还包括:利用特征提取模型对叠加背景图进行特征提取,获得特征数据;特征提取模块包括多个卷积层,特征数据包括每一卷积层对应的子特征数据;将每一卷积层对应的子特征数据进行叠加,获得背景特征图。
上述步骤的实施方式例如:将叠加背景图输入特征提取模块,利用特征提取模型对叠加背景图进行特征提取,特征提取模块包括多个卷积层,获得每一卷积层输出的对应的子特征数据,子特征数据可以理解为特征提取模块的中间结果,将每一卷积层对应的子特征数据进行叠加,获得背景特征图。其中,特征提取模型可以为Densenet169,也可以为其他可以进特征提取的模型。
请参见图3为本申请实施例提出的特征提取模型结构示意图。
上述步骤具体例如,特征提取模型使用Densenet169,如图3所示,Densenet169具有denseblock1、dense block2、dense block3以及dense block4四层;将叠加背景图输入Densenet169,获得每一层对应的子特征数据,分别为256、512、1024以及1024;将每一层对应的子特征数据进行叠加,获得背景特征图,背景特征图为2816维度。
在上述的实现过程中,利用特征提取模型对叠加背景图进行特征提取,获得特征数据,对特征提取模型中的每一卷积层对应的子特征数据都进行抽取,并将子特征数据进行叠加获得背景特征图,增大特征输入,进而提升特征提取模型的特征提取的准确率。
可选地,在本申请实施例中,在将每一卷积层对应的子特征数据进行叠加,获得背景特征图之后,方法还包括:获得参考背景特征图;计算参考背景特征图和背景特征图的相似度,获得相似度数据;根据相似度数据和预设的阈值,获得识别结果。
上述步骤的实施方式例如:获得背景特征图之后,获得参考背景特征图,参考背景特征图由对应的参考背景图处理得到,参考背景图可以是特定的场景的背景图;特征图包括特征向量。计算参考背景特征图和背景特征图的相似度,具体例如,相似度可以采用参考背景特征图与背景特征图之间的余弦相似度进行确定,余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。可以理解的,相似度也可以通过参考背景特征图与背景特征图之间的欧式距离或者曼哈顿距离进行确定。
根据相似度数据和预设的阈值,获得识别结果。具体例如,若相似度数据不小于预设的阈值,识别结果可以为与参考背景图为同一图像;若相似度数据小于预设的阈值则识别结果为与参考背景图不是同一图像。其中,阈值根据实际需求进行预设,阈值可以为0.95、0.9以及0.85等。
在上述的实现过程中,计算参考背景特征图和背景特征图的相似度,根据预设的阈值,获得识别结果,以判断待识别背景图像是否和参考背景为同一背景图像。
请参见图4示出的本申请实施例提供的前后背景分割模型输出示意图。
可选地,在本申请实施例中,获得待识别图像对应的背景图像,包括:获得待识别图像;待识别图像包括前景图像特征和背景图像特征;将待识别图像输入预设的分割模型,前景图像特征和背景图像特征进行分离,获得背景图像;其中,分割模型是采用学习率衰减组合重启动学习率机制进行训练的。
上述步骤的实施方式例如:获得待识别图像;如图4所示,待识别图像包括前景图像特征和背景图像特征,其中,前景图像可以为人脸图像。将待识别图像输入预设的分割模型,分割模型待识别图像进行检测,实现人脸部分和背景图像的分割,将人脸部分的图像的RGB三通道像素值置为0,从而获得背景图像,剔除前景图像,防止前景图像对于背景图像识别的干扰。其中,分割模型可以为Tansfomer模型。
分割模型是采用学习率衰减组合重启动学习率机制进行训练的,具体例如,利用目标识别数据集上预训练过模型作为baseline(基线)模型,基于人工标注的包含人脸的带标记的人像分割样本和自动合成的包含背景图像的背景分割样本,采用学习率衰减组合重启动学习率机制对模型进行训练。具体例如,模型训练的学习率初始设置为0.0001,设定1000step的时候衰减到0,衰减函数为y=-10-8*X+10-4,其中X为step;重启策略设定为每9000步重启一次,每次重启的学习率为0.0001。
在上述的实现过程中,通过分割模型将待识别图像,将前景图像特征和背景图像特征进行分离,获得背景图像,防止前景图像特征对背景识别的干扰。分割模型是采用学习率衰减组合重启动学习率机制进行训练的,提高分割模型的精准度。
请参见图5示出的本申请实施例提供的一种背景图像处理装置的结构示意图;本申请实施例提供了一种背景图像处理装置200,包括:
获取模块210,用于获得待识别图像对应的背景图像;
频域转换模块220,用于将背景图片进行转换,获得表征频域特征的背景频域图;
时域转换模块230,用于将背景频域图转换为背景时域图;
叠加模块240,用于将背景时域图和背景频域图进行通道叠加,获得叠加背景图像。
可选地,在本申请实施例中,背景图像处理装置,还包括:过滤模块,用于对背景频域图中的低频信息进行过滤,获得过滤频域图;时域转换模块230还用于将过滤频域图转换为背景时域图。
可选地,在本申请实施例中,背景图像处理装置,过滤模块,具体用于通过高通滤波器对背景频域图中的低频信息进行过滤,高通滤波器的公式为:Y(n)=αX(n)+(1-α)Y(n-1);其中:α为滤波系数;X(n)为本次采样值;Y(n-1)为前一次滤波输出值;Y(n)为本次滤波输出值。
可选地,在本申请实施例中,背景图像处理装置,叠加模块240,具体用于将背景时域图的RGB通道和背景频域图的通道进行顺序叠加,获得叠加背景图像。
可选地,在本申请实施例中,背景图像处理装置,还包括:特征提取模块,用于利用特征提取模型对叠加背景图进行特征提取,获得特征数据;特征提取模块包括多个卷积层,特征数据包括每一卷积层对应的子特征数据;将每一卷积层对应的子特征数据进行叠加,获得背景特征图。
可选地,在本申请实施例中,背景图像处理装置,还包括:结果识别模块,用于获得参考背景特征图;计算参考背景特征图和背景特征图的相似度,获得相似度数据;根据相似度数据和预设的阈值,获得识别结果。
可选地,在本申请实施例中,背景图像处理装置,获取模块210,具体用于获得待识别图像;待识别图像包括前景图像特征和背景图像特征;将待识别图像输入预设的分割模型,前景图像特征和背景图像特征进行分离,获得背景图像;其中,分割模型是采用学习率衰减组合重启动学习率机制进行训练的。
应理解的是,该装置与上述的背景图像处理方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。
请参见图6示出的本申请实施例提供的电子设备的结构示意图。本申请实施例提供的一种电子设备300,包括:处理器310和存储器320,存储器320存储有处理器310可执行的机器可读指令,机器可读指令被处理器310执行时执行如上的方法。
本申请实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上的方法。
其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-OnlyMemory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。
Claims (10)
1.一种背景图像处理方法,其特征在于,包括:
获得待识别图像对应的背景图像;
将所述背景图像进行转换,获得表征频域特征的背景频域图;
将所述背景频域图转换为背景时域图;
将所述背景时域图和所述背景频域图进行通道叠加,获得叠加背景图像。
2.根据权利要求1所述的方法,其特征在于,在所述将所述背景图像进行转换,获得表征频域特征的背景频域图之后,在所述将所述背景频域图转换为背景时域图之前,所述方法还包括:对所述背景频域图中的低频信息进行过滤,获得过滤频域图;
所述将所述背景频域图转换为背景时域图,包括:将所述过滤频域图转换为所述背景时域图。
3.根据权利要求2所述的方法,其特征在于,所述对所述背景频域图中的低频信息进行过滤,获得过滤频域图,包括:
通过高通滤波器对所述背景频域图中的低频信息进行过滤,所述高通滤波器的公式为:Y(n)=αX(n)+(1-α)Y(n-1);
其中:α为滤波系数;X(n)为本次采样值;Y(n-1)为前一次滤波输出值;Y(n)为本次滤波输出值。
4.根据权利要求1所述的方法,其特征在于,所述将所述背景时域图和所述背景频域图进行通道叠加,获得叠加背景图像包括:
将所述背景时域图的RGB通道和所述背景频域图的通道进行顺序叠加,获得叠加背景图像。
5.根据权利要求1所述的方法,其特征在于,在所述将所述背景时域图和所述背景频域图进行通道叠加,获得叠加背景图像之后,所述方法还包括:
利用特征提取模型对所述叠加背景图进行特征提取,获得特征数据;所述特征提取模块包括多个卷积层,所述特征数据包括每一所述卷积层对应的子特征数据;
将每一所述卷积层对应的子特征数据进行叠加,获得背景特征图。
6.根据权利要求5所述的方法,其特征在于,在所述将每一所述卷积层对应的子特征数据进行叠加,获得背景特征图之后,所述方法还包括:
获得参考背景特征图;
计算所述参考背景特征图和所述背景特征图的相似度,获得相似度数据;
根据所述相似度数据和预设的阈值,获得识别结果。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述获得待识别图像对应的背景图像,包括:
获得所述待识别图像;所述待识别图像包括前景图像特征和背景图像特征;
将所述待识别图像输入预设的分割模型,所述前景图像特征和所述背景图像特征进行分离,获得所述背景图像;其中,所述分割模型是采用学习率衰减组合重启动学习率机制进行训练的。
8.一种背景图像处理装置,其特征在于,包括:
获取模块,用于获得待识别图像对应的背景图像;
频域转换模块,用于将所述背景图像进行转换,获得表征频域特征的背景频域图;
时域转换模块,用于将所述背景频域图转换为背景时域图;
叠加模块,用于将所述背景时域图和所述背景频域图进行通道叠加,获得叠加背景图像。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210983412.6A CN115512405A (zh) | 2022-08-16 | 2022-08-16 | 一种背景图像处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210983412.6A CN115512405A (zh) | 2022-08-16 | 2022-08-16 | 一种背景图像处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115512405A true CN115512405A (zh) | 2022-12-23 |
Family
ID=84502185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210983412.6A Pending CN115512405A (zh) | 2022-08-16 | 2022-08-16 | 一种背景图像处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115512405A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612501A (zh) * | 2023-07-18 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 对象识别方法、装置、电子设备和计算机可读存储介质 |
-
2022
- 2022-08-16 CN CN202210983412.6A patent/CN115512405A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612501A (zh) * | 2023-07-18 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 对象识别方法、装置、电子设备和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106934397B (zh) | 图像处理方法、装置及电子设备 | |
CN110008817B (zh) | 模型训练、图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN108764039B (zh) | 神经网络、遥感影像的建筑物提取方法、介质及计算设备 | |
CN108389224B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112602088B (zh) | 提高弱光图像的质量的方法、系统和计算机可读介质 | |
CN111127307A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
US11308628B2 (en) | Patch-based image matting using deep learning | |
CN110599455A (zh) | 显示屏缺陷检测网络模型、方法、装置、电子设备及存储介质 | |
CN116012232A (zh) | 图像处理方法、装置及存储介质、电子设备 | |
CN115512405A (zh) | 一种背景图像处理方法、装置、电子设备及存储介质 | |
CN117253054B (zh) | 一种光场显著性检测方法及其相关设备 | |
CN114549373A (zh) | Hdr图像生成方法、装置、电子设备及可读存储介质 | |
CN110570376B (zh) | 一种图像去雨方法、装置、设备和计算机可读存储介质 | |
CN117408886A (zh) | 气体图像增强方法、装置、电子装置和存储介质 | |
CN106778822B (zh) | 基于漏斗变换的图像直线检测方法 | |
CN116309494B (zh) | 一种电子地图中兴趣点信息确定方法、装置、设备及介质 | |
CN111369557A (zh) | 图像处理方法、装置、计算设备和存储介质 | |
CN112052863B (zh) | 一种图像检测方法及装置、计算机存储介质、电子设备 | |
CN113628148B (zh) | 红外图像降噪方法和装置 | |
CN111754412A (zh) | 构建数据对的方法、装置及终端设备 | |
CN109102495A (zh) | 目标图像确定方法和系统、计算机设备、计算机存储介质 | |
CN112634126A (zh) | 人像减龄处理方法、训练方法、装置、设备及存储介质 | |
CN112990213A (zh) | 一种基于深度学习的数字万用表字符识别系统和方法 | |
CN117911908B (zh) | 一种无人机航拍图像的增强处理方法及系统 | |
Lee et al. | Image quality assessment of tone mapped images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |