CN115359075B - 基于云计算的软件开发应用数据处理方法 - Google Patents

基于云计算的软件开发应用数据处理方法 Download PDF

Info

Publication number
CN115359075B
CN115359075B CN202211298878.9A CN202211298878A CN115359075B CN 115359075 B CN115359075 B CN 115359075B CN 202211298878 A CN202211298878 A CN 202211298878A CN 115359075 B CN115359075 B CN 115359075B
Authority
CN
China
Prior art keywords
superpixel
blocks
super
block
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211298878.9A
Other languages
English (en)
Other versions
CN115359075A (zh
Inventor
吴律
李全德
刘圣银
方胤中
方琳
徐琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiujiang Ganbang Information Technology Co ltd
Jinan Huozi Information Technology Co ltd
Original Assignee
Jiujiang Ganbang Information Technology Co ltd
Jinan Huozi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiujiang Ganbang Information Technology Co ltd, Jinan Huozi Information Technology Co ltd filed Critical Jiujiang Ganbang Information Technology Co ltd
Priority to CN202211298878.9A priority Critical patent/CN115359075B/zh
Publication of CN115359075A publication Critical patent/CN115359075A/zh
Application granted granted Critical
Publication of CN115359075B publication Critical patent/CN115359075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/54Extraction of image or video features relating to texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明涉及数据处理领域,具体涉及基于云计算的软件开发应用数据处理方法。包括:获得每个图像超像素块,对所有超像素块进行聚类获得超像素块集合,以及每个超像素块集合的所有参考像素块,根据参考像素块的无用信息获得同一个图像上超像素块之间的融合程度,根据融合程度对图像上的超像素块融合获得图像上新的超像素块,通过对新的超像素块不断融合获得图像上最终超像素块,根据所有图像上的最终超像素块对图像进行预处理和压缩存储。本发明剔除更多的冗余无用信息,使得图像中只包含少量的有用信息,使得对预处理后的图像进行压缩时这些有用信息可以被高压缩率压缩,即节省了存储空间又不损失太多有用信息。

Description

基于云计算的软件开发应用数据处理方法
技术领域
本发明涉及数据处理领域,具体涉及一种基于云计算的软件开发应用数据处理方法。
背景技术
由于图像数据能够带来极佳的视觉享受,很多软件在开发或应用时都需要对图像数据进行处理和展示,例如交友软件中好友发送的照片,聊天记录中的图片、软件UI中加载的图像、用户收集的相册等都涉及到图像数据的处理,其中将图像上传云端进行永久存储是软件开发和应用时的一项重要的数据处理任务,能够保证软件所需的图像数据不会丢失,同时在存储时为了节省存储空间往往需要对图像数据进行压缩。
现有的图像压缩算法,例如基于图像金字塔的压缩算法,基于稀疏分解的图像压缩算法等对图像的压缩率取决于图像中的信息含量;当图像中包含的信息量较大时,例如大量的图像中存在噪声或大量无规律纹理时,这些多而且不重要,就算剔除掉也对图像的信息影响不大,但是这些无用的信息会使图像的压缩结果的压缩率不会太大,不够节约存储空间;当图像中包含的信息量越小,例如图像中特征单一或纹理之间具有一定相似性时,则可以在图像压缩时图像的压缩结果的压缩率可以相对较大,节省存储空间。
本发明需要一种数据预处理方法,令图像中无用的信息剔除掉,使得图像只包含少量的有用信息,从而使得图像能够被高压缩率压缩的同时不损失重要信息。
发明内容
本发明提供基于云计算的软件开发应用数据处理方法,以解决现有的问题。
本发明的基于云计算的软件开发应用数据处理方法采用如下技术方案:
本发明提供一种基于云计算的软件开发应用数据处理方法,该方法包括:
S1:获取软件开发应用过程的所有图像,对每个图像进行分割获得每个图像的所有超像素块;
S2:对每个图像的所有超像素块进行融合操作,获得每个图像上新的所有超像素块,包括:
获取每个超像素块的表征向量,利用所有图像的超像素块的表征向量进行聚类获得所有超像素块集合;获取每个超像素块集合中每个超像素块的无用信息,根据每个超像素块的无用信息获得每个超像素块集合的所有参考像素块,所述每个参考像素块对应一个无用信息;
获取每个超像素块集合的权重,分别从任意两个超像素块集合中获得一组第一超像素块与第二超像素块,根据任意两个超像素块集合中所有参考像素块的无用信息、第一超像素块的无用信息以及第二超像素块的无用信息获得第一超像素块的第一指标和第二超像素块的第二指标,利用任意两个超像素块集合的权重对第一超像素块的第一指标和第二超像素块的第二指标进行加权求和,获得第一超像素块与第二超像素块的融合程度;
对每个图像上融合程度最大的一组第一超像素块与第二超像素块进行融合,融合后每个图像上得到新的所有超像素块;
S3:重复执行对每个图像的新的所有超像素块进行融合操作预设次数后,将最终得到的每个图像上新的所有超像素块记为每个图像的所有最终超像素块,利用每个图像的所有最终超像素块对图像进行预处理压缩存储。
优选的,所述获取每个超像素块的表征向量的步骤包括:
获取每个超像素块RGB三通道的每个通道,获取每个超像素块在每个通道上的灰度共生矩阵,将三个通道得到的三个灰度共生矩阵分别展平为向量,将得到的三个向量拼接成一个向量,记为每个超像素块的表征向量。
优选的,所述利用所有图像的超像素块的表征向量进行聚类获得所有超像素块集合的步骤包括:
首先对所有图像的所有超像素块的表征向量进行均值漂移聚类,获得所有第一类别;
对于同一个第一类别中的所有超像素块,将属于同一个图像上的超像素块划分成不同集合中,将属于不同图像上的超像素块划分成相同集合中,进而将第一类别中的所有超像素块划分为若干集合;同理将所有第一类别划分为多个集合,将所述每个集合记为每个超像素块集合。
优选的,所述获取每个超像素块集合中每个超像素块的无用信息的步骤包括:
将每个超像素块集合所有超像素块的所有表征向量输入到PCA算法中,获得若干数量个单位向量,以及每个单位向量的特征值,获取预设数量个特征值最小的单位向量,记为无用特征,将所述每个超像素块的无用信息在所有无用特征上的投影构成的向量记为每个超像素块的无用信息。
优选的,所述根据每个超像素块的无用信息获得每个超像素块集合的所有参考像素块的步骤包括:
对每个超像素块集合所有超像素块的无用信息进行均值漂移聚类,获得所有第二类别,将所有第二类别中的所有超像素块记为每个超像素块集合的所有参考像素块。
优选的,所述每个超像素块集合的权重的获取步骤为:
在每个超像素块集合的所有参考像素块的所有无用信息中,获取任意两个无用信息的余弦相似度,所有无用信息中得到的所有余弦相似度之和作为每个超像素块集合的权重。
优选的,所述分别从任意两个超像素块集合中获得一组第一超像素块与第二超像素块的步骤为:
分别将任意两个超像素块集合记为第一集合、第二集合;将满足:属于同一图像上的且相邻的,同时分别属于第一集合、第二集合的两个超像素块记为第一超像素块和第二超像素块。
优选的,所述根据任意两个超像素块集合中所有参考像素块的无用信息、第一超像素块的无用信息以及第二超像素块的无用信息获得第一超像素块的第一指标和第二超像素块的第二指标的步骤包括:
对于将任意两个超像素块集合对应的第一集合、第二集合,分别获取第一超像素块的无用信息与第二集合所有参考像素块的无用信息的第一余弦相似度,将得到的所有第一余弦相似度的均值记为第一超像素块的第一指标;分别获取第二超像素块的无用信息与第一集合所有参考像素块的无用信息的第二余弦相似度,将得到的所有第二余弦相似度的均值记为第二超像素块的第二指标。
优选的,所述利用每个图像的所有最终超像素块对图像进行压缩存储的步骤为:
获取每个图像上每个最终超像素块的表征向量,利用所有图像的所有最终超像素块的表征向量进行聚类获得每个超像素块集合SQ,所述每个超像素块集合SQ包含多个最终超像素块,将每个图像展平为一维向量,同时让每个超像素块集合SQ中的最终超像素块包含的像素分布在一维向量的同一维度区域;
利用PCA降维预处理方法对所有图像的所述一维向量进行预处理,并对预处理结果进行压缩存储。
本发明的有益效果是:本发明通过提取超像素块的无用信息获得超像素块之间的融合程度,进而对超像素块进行不断融合成新的超像素块,充分提取了不同超像素块集合所包含无用信息的分布特征,使得任意两个超像素块计算的融合程度更具有区分性,可以更准确的区分出哪个超像素块该与哪个超像素块优先融合,保证融合得到的超像素块对应的纹理区域具有尽可能多的冗余信息,保证对图像进行预处理时可以剔除更多的冗余无用信息,使得图像中只包含少量的有用信息,使得对预处理后的图像进行压缩时这些有用信息可以被高压缩率压缩,即节省了存储空间又不损失太多有用信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于云计算的软件开发应用数据处理方法的实施例总体步骤的流程图;
图2为图像一维向量中的超像素块包含的像素进行重新排列和拼接过程示意图;
图3为不同图像的一维向量被重新配列和拼接后的结果的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种基于云计算的软件开发应用数据处理方法的实施例,如图1,该方法包括:
S001、获取软件开发应用所需的图像数据。
在软件开发过程中,搭建云端服务器平台,软件开发测试或上线应用过程中用户使用的图像数据均被上传到云端服务器平台上,云端服务器具有云计算节点,云计算节点获得每秒用户上传的所有图像,本发明需要对这些图像进行预处理和压缩存储。
本发明中这些图像均为大小一致的RGB图像,如果图像大小不一样那么本发明只获得其中大小一样的图像进行处理,本发明以图像大小为1024×1024为例进行叙述。
步骤S002、对每个图像进行分割获得每个图像上的所有超像素块,对所有图像上的所有超像素块进行聚类,获得多个超像素块集合。
首先需要说明的是,本发明需要对所有的图像进行预处理,然后对预处理的结果进行压缩存储;其中常用图像预处理方法有PCA算法,PCA算法是一种数据降维方法,该算法可以将图像中冗余的、无用的特征剔除掉,保留图像少量的、有用的信息;在对大量图像使用PCA算法处理时需要将每个二维的图像数据展平为一维向量,然后对所有图像对应的所有一维向量进行PCA预处理;其中将图像展平为一维向量是一种常用方法:按从上到下从左到右的顺序将图像的像素值排列构成一维向量。
但是存在一个问题:某些图像上的某些纹理区域之间具有一定相似性,甚至一模一样,那么这些纹理区域必然是存在一些冗余无用的信息的,那么越期望对这些纹理区域进行PCA预处理可以剔除掉其中的冗余信息,将少量的有用信息保留下来;然后而这些纹理区域处于不同图像上的不同位置处,当将这些图像分别展平为一维向量时,不同图像上的纹理区域会分布在一维向量的不同维度上,例如某些纹理区域处于一个图像的左上角,那么这个图像展平为一维向量后这个纹理区域在一维向量的左侧,如果某些纹理区域处于一个图像的右下角,那么这个图像展平为一维向量后这个纹理区域在一维向量的右侧,这导致对图像进行PCA算法预处理时无法提取到这些纹理区域包含的少量的、有用的信息,进而导致对这些图像的预处理结果进行压缩时没有较高的压缩率。
基于上述分析,本发明将每个图像分割成不同的纹理区域,然后获取分别属于不同图像上的若干纹理区域,保证这些若干纹理区域可以通过PCA算法剔除掉其中的冗余信息只提取出一些少量的、有用的、重要的信息;然后在对每个图像展平成一维向量时,让这些若干纹理区域处于同一维度上,那么即可保证对所有图像进行PCA预处理后的记过具有高压缩率。
(1)那么首先需要对每个图像进行分割,具体方法为:
对每个图像进行超像素分割,获得每个图像上所有超像素块,本实施例使用的超像素分割算法为SLIC。每个超像素块可视为一个纹理区域。
(2)根据图像上的超像素块获得每个超像素块集合,具体方法:
对于每个图像上的每个超像素块,该超像素块具有三个通道,获得该超像素块的每个通道的灰度共生矩阵,三个通道获得三个灰度共生矩阵,将这三个灰度共生那个矩阵分别展平并拼接成一个向量,该向量记为该超像素块的表征向量,用于表征超像素块的纹理分布特征。
获取所有图像上所有超像素块的表征向量,对这些表征向量进行均值漂移聚类获得多个第一类别,同一个第一类别中的表征向量之间是近似的,由于每个表征向量对应一个超像素块,因此每一个第一类别也可以看成是一些纹理特征相近的超像素块构成的集合;
对于同一个第一类别中的所有超像素块,将属于同一个图像上的超像素块划分成不同集合中,将属于不同图像上的超像素块划分成相同集合中,从而将第一类别中的所有超像素块划分为若干集合;同理将所有第一类别划分为多个集合,每个集合中的超像素块分别来自于不同像上且纹理分布相近。这里得到的每个集合记为每个超像素块集合,每个超像素块集合中的超像素块的纹理存在有一些冗余无用信息。
至此获得了每个超像素块集合,在将所有图像展平为一维向量时,只需让同一超像素块集合的超像素块在一维向量处于同一维度即可。例如让某个超像素块集合中的超像素块同时处于一维向量的前100个维度中,另外一个超像素块集合中的超像素块同时处于一维向量的后100个维度中即可。从而保证具有用于信息的超像素块可以经过PCA预处理后保留较少的有用信息,剔除较多的冗余无用信息。
但是至此依然存在一个问题:首先上述使用的超像素分割算法获得的每个超像素块只是某个完整纹理区域的一部分,例如一些图像上分别具有一张相同的人脸,本发明需要得到的是人脸区域构成的超像素块,而上述的超像素分割算法得到的每个超像素块可能只是包含人脸上的鼻子区域或脸颊区域等局部区域,而不是一个完整的人脸区域,因此上述获得的每个超像素块集合中的超像素块不是本发明所期望获得的结果,依然会导致无法到达完备准确的剔除冗余无用特征以及保留有用特征的目的,从而导致不能得到较高的把压缩率。
因此需要在上述超像素分割结果的基础上,对得到的超像素块进行融合,使得每个超像素块集合中的超像素块包含的是一个完整的纹理区域,且这些纹理区域可以通过PCA算法剔除尽可能多的冗余无用信息,保留一些少量的、有用的信息。这里说的是尽可能多的冗余无用信息是指某种或某些冗余信息多,而不是有很多种不同的冗余信息。
步骤S003、对每个超像素块集合中的超像素块进行处理,获得每个超像素块集合的无用信息。
对于同一个超像素块集合中所有超像素块的表征向量S,将这些表征向量S作为PCA算法的输入数据,根据PCA算法原理可知,该算法会得到N个单位向量
Figure 987704DEST_PATH_IMAGE001
,N等于表征向量的维度,/>
Figure 389866DEST_PATH_IMAGE002
表示其中的第n个单位向量,这些单位向量满足:这些表征向量S在每个单位向量上的投影的方差取极大值,并且每个单位向量对应一个特征值,第n个单位向量/>
Figure 527587DEST_PATH_IMAGE002
对应的特征值记为/>
Figure 255371DEST_PATH_IMAGE003
。当单位向量/>
Figure 947384DEST_PATH_IMAGE002
对应的特征值/>
Figure 418816DEST_PATH_IMAGE003
越大说明单位向量/>
Figure 411043DEST_PATH_IMAGE002
代表一种有用的重要特征,当单位向量/>
Figure 44150DEST_PATH_IMAGE002
对应的特征值/>
Figure 754617DEST_PATH_IMAGE003
越小说明单位向量/>
Figure 764161DEST_PATH_IMAGE002
代表一种无用的冗余特征;此处是根据PCA算法原理得到的,本发明不再赘述其具体过程以及逻辑含义。
本发明为了保留少量重要特征,因此将特征值最大的
Figure 345315DEST_PATH_IMAGE004
个单位向量记为重要特征,分别记为/>
Figure 680482DEST_PATH_IMAGE005
,剩余的/>
Figure 612665DEST_PATH_IMAGE006
个单位向量记为无用特征, 分别记为/>
Figure 425901DEST_PATH_IMAGE007
;其中N1和N2可以实际情况人为指定,保证两者之和等于N即可。
对于这些表征向量S中的第i个表征向量
Figure 392720DEST_PATH_IMAGE008
,其在重要特征上的映射结果为/>
Figure 93261DEST_PATH_IMAGE009
;其在无用特征上的映射结果为
Figure 43899DEST_PATH_IMAGE010
; />
Figure 395246DEST_PATH_IMAGE011
表示/>
Figure 216572DEST_PATH_IMAGE008
与/>
Figure 362382DEST_PATH_IMAGE012
的内积,由于/>
Figure 269158DEST_PATH_IMAGE012
是单位向量,因此
Figure 158617DEST_PATH_IMAGE011
还表示/>
Figure 834449DEST_PATH_IMAGE008
在/>
Figure 682319DEST_PATH_IMAGE012
上的投影,同理/>
Figure 76391DEST_PATH_IMAGE013
表示相同含义。
即向量
Figure 769541DEST_PATH_IMAGE014
表示第i个表征向量/>
Figure 299879DEST_PATH_IMAGE008
对应的超像素块中含有的重要信息,/>
Figure 53072DEST_PATH_IMAGE015
表征含有的无用信息。至此获得了每个超像素块集合中每个超像素块的重要信息和无用信息。
S004、根据所有每个超像素块的无用信息对每个图像上的所有超像素块进行融合,获得每个图像上新的所有超像素块。
对于每个超像素集合中所有超像素块S1,根据这些超像素块S1的无用信息进行均值漂移聚类,获得所有第二类别,每个第二类别中包含多个超像素块。需要说明的是由于采用的是均值漂移聚类算法,因此所有超像素块S1中有些超像素块是不会被分类到第二类别中的。
具体来说,每个第二类别中的超像素块具有近似一致的无用信息,或者说每个第二类别中的包含的无用信息大量集中出现;而不属于第二类别的超像素块,其无用信息是随机或偶尔出现的;本发明在后续融合超像素块时期望的是将具有大量无用信息的超像素块进行融合,从而才能保证融合后的超像素块也包含大量集中出现的无用信息,进而可以保证能够保留少量的有用信息,那么自然对拥有少量的且有用的信息进行存储时才能得到高的压缩率,
将第二类别中的每个超像素块记为参考像素块,从而每个超像素集合中得到多个参考像素块。
对于任意两个超像素集合,分别记为第一集合、第二集合;对于一个图像,该图像上有两个超像素块,分别记为第一超像素块、第二超像素块,第一超像素块、第二超像素块满足:分别属于第一集合与第二集合,且这两个超像素块是不相邻的时,这两个超像素块需要进行融合;这两个超像素块的融合程度P为:
Figure 668861DEST_PATH_IMAGE016
其中
Figure 165701DEST_PATH_IMAGE017
的获取方法为:对于第一集合的所有参考像素块s1,/>
Figure 816125DEST_PATH_IMAGE018
其中
Figure 737289DEST_PATH_IMAGE019
表示所有参考像素块s1任意两个不同的参考像素块x和y,/>
Figure 105954DEST_PATH_IMAGE020
表示参考像素块x和y对应的无用信息的余弦相似度;获取所有参考像素块s1中任意两个无用信息的余弦相似度,这里得到的所有余弦相似度之和就是/>
Figure 140906DEST_PATH_IMAGE021
,该值越大说明第一集合所包含的无用信息越多越集中。
其中
Figure 380257DEST_PATH_IMAGE022
的获取方法为:对于第二集合的所有参考像素块s2,/>
Figure 475252DEST_PATH_IMAGE023
其中
Figure 800054DEST_PATH_IMAGE024
表示所有参考像素块s2任意两个不同的参考像素块f和g,/>
Figure 638697DEST_PATH_IMAGE025
表示参考像素块f和g对应的无用信息的余弦相似度;获取所有参考像素块s2中任意两个无用信息的余弦相似度,这里得到的所有余弦相似度之和就是/>
Figure 263714DEST_PATH_IMAGE026
,该值越大说明第二集合所包含的无用信息越多越集中。
Figure 529610DEST_PATH_IMAGE017
、/>
Figure 341708DEST_PATH_IMAGE022
分别视为两个超像素集合的权重。
D1表示第一像素块的无用信息与第二集合的所有参考像素块的无用信息与余弦相似度的均值,D1越大说明第一像素块的无用信息越和第二集合的所有参考像素块的无用信息相似;同理,D2表示第二像素块的无用信息与第一集合的所有参考像素块的无用信息与余弦相似度的均值,D2越大说明第二像素块的无用信息越和第一集合的所有参考像素块的无用信息相似。
Figure 718463DEST_PATH_IMAGE027
表示以/>
Figure 197986DEST_PATH_IMAGE017
和/>
Figure 634783DEST_PATH_IMAGE022
为权重对D1和D2进行加权求和,表示当第一集合中的无用信息愈多越集中时说明第一集合中的无用信息更具有参考价值或被剔除的价值,此时更应该关注第一集合中的第一像素块与第二集合中超像素块无用信息的近似情况,或者当第二集合中的无用信息愈多越集中时说明第二集合中的无用信息更具有参考价值或被剔除的价值,此时更应该关注第二集合中的第二像素块与第一集合中超像素块无用信息的近似情况;在这样计算P充分提取了不同超像素块集合所包含无用信息的分布特征,使得任意两个超像素块计算的融合程度P更具有区分性,后续可以更准确的区分出哪个超像素块该与哪个超像素块优先融合,保证融合得到的超像素块具有尽可能多的冗余信息。
其中
Figure 199757DEST_PATH_IMAGE028
是归一化系数。
总之P越大说明两个超像素块越应该融合。至此在一个图像上获得了哪两个超像素块需要融合以及融合程度。
在一个图像上,对于需要融合的所有超像素块,获取融合程度最大的两个超像素块,将这两个超像素块合并为一个超像素块,那么每个图像得到了所有的新的超像素块。
步骤S005、利用所有图像得到的新的超像素块对图像进行预处理以及压缩存储。
(1)重读依次执行:步骤S002中的(2)、步骤S003和步骤S004预设数量次,本发明以预设数量等于5为例进行叙述,该值越大最终的压缩效果越好,但是付出的计算量也越大,综合考虑来说不建议取太大值。重复执行过程中灰度每个图像上的超像素块进行不断地融合,得到新地超像素块。
完成重复执行后每个图像上最终分割得到多个超像素块,这些超像素块就是每个图像的最终分割结果,记为每个图像上所有的最终超像素块。
然后重新利用步骤S002中(2)所述的方法根据所有图像的最终超像素块重新获得每个超像素块集合SQ。
(2)然后将每个图像分别展平为一维向量,图像上每个像素在一维向量上对应一个维度,一维向量的维度就等于图像的大小。
获取同一超像素块集合SQ中的每个超像素块,每个超像素块中包含的像素分布在一维向量的不同维度上,现需要在一维向量上将超像素块内的像素所在的维度重新排列和拼接,让维度连续分布,如图2所示,然后让同一超像素块集合所有超像素块包含的像素对应的维度在一维向量的同一维度区域即可,例如让包含的像素左侧对齐进行排列,如图3所示。
进而所有图像中每个图像均对应一个一维向量,这些图像上相似的纹理区域分布在一维向量的同一维度区间,相比常规的将图像展成一维向量的方法来说,本发明获得的一维向量能够使得这些一维向量进行PCA降维预处理后,去除更多的冗余信息,同时保证有用信息不损失,由于冗余信息去除的多,有用信息相对较少,因此PCA降维预处理后的数据可以被高压缩率的压缩存储。
PCA降维预处理是常用的数据处理方法,具体为:将所有图像的所有一维向量所述PCA算法,获得输出结果即为所有图像的预处理结果。
然后对所有预处理结果采用现有的压缩算法进行压缩处理,例如本发明采用K-SVD稀疏分解的算法进行压缩,可以获得较高的压缩率,同时不损毁数据的重要信息。
需要补充说明的是:当需要将压缩后的图像读取出来时,需要对压缩结果进行解压缩,获得预处理结果,因为压缩方法是现有技术公开的,因此解压缩方法也是已知的。由于预处理结果是通过PCA方法对图像的一维向量进行处理获得的,因此可以利用PCA算法的逆向过程反推出来图像的一维向量,只不过是这里反推出来的一维向量是有数据损失的,损失的就是冗余数据。最后根据反推出来的一维向量将图像还原出来即可,还原方法就是步骤S005中(2)的逆过程,本发明不再赘述和改进。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于云计算的软件开发应用数据处理方法,其特征在于,该方法包括:
S1:获取软件开发应用过程的所有图像,对每个图像进行分割获得每个图像的所有超像素块;
S2:对每个图像的所有超像素块进行融合操作,获得每个图像上新的所有超像素块,包括:
获取每个超像素块的表征向量,利用所有图像的超像素块的表征向量进行聚类获得所有超像素块集合;获取每个超像素块集合中每个超像素块的无用信息,根据每个超像素块的无用信息获得每个超像素块集合的所有参考像素块,所述每个参考像素块对应一个无用信息;
获取每个超像素块集合的权重,分别从任意两个超像素块集合中获得一组第一超像素块与第二超像素块,根据任意两个超像素块集合中所有参考像素块的无用信息、第一超像素块的无用信息以及第二超像素块的无用信息获得第一超像素块的第一指标和第二超像素块的第二指标,利用任意两个超像素块集合的权重对第一超像素块的第一指标和第二超像素块的第二指标进行加权求和,获得第一超像素块与第二超像素块的融合程度;
对每个图像上融合程度最大的一组第一超像素块与第二超像素块进行融合,融合后每个图像上得到新的所有超像素块;
S3:重复执行对每个图像的新的所有超像素块进行融合操作预设次数后,将最终得到的每个图像上新的所有超像素块记为每个图像的所有最终超像素块,利用每个图像的所有最终超像素块对图像进行预处理压缩存储;
其中,所述根据任意两个超像素块集合中所有参考像素块的无用信息、第一超像素块的无用信息以及第二超像素块的无用信息获得第一超像素块的第一指标和第二超像素块的第二指标的步骤包括:
对于将任意两个超像素块集合对应的第一集合、第二集合,分别获取第一超像素块的无用信息与第二集合所有参考像素块的无用信息的第一余弦相似度,将得到的所有第一余弦相似度的均值记为第一超像素块的第一指标;分别获取第二超像素块的无用信息与第一集合所有参考像素块的无用信息的第二余弦相似度,将得到的所有第二余弦相似度的均值记为第二超像素块的第二指标;
所述利用每个图像的所有最终超像素块对图像进行压缩存储的步骤为:
获取每个图像上每个最终超像素块的表征向量,利用所有图像的所有最终超像素块的表征向量进行聚类获得每个超像素块集合SQ,所述每个超像素块集合SQ包含多个最终超像素块,将每个图像展平为一维向量,同时让每个超像素块集合SQ中的最终超像素块包含的像素分布在一维向量的同一维度区域;
利用PCA降维预处理方法对所有图像的所述一维向量进行预处理,并对预处理结果进行压缩存储。
2.根据权利要求1所述的基于云计算的软件开发应用数据处理方法,其特征在于,所述获取每个超像素块的表征向量的步骤包括:
获取每个超像素块RGB三通道的每个通道,获取每个超像素块在每个通道上的灰度共生矩阵,将三个通道得到的三个灰度共生矩阵分别展平为向量,将得到的三个向量拼接成一个向量,记为每个超像素块的表征向量。
3.根据权利要求1所述的基于云计算的软件开发应用数据处理方法,其特征在于,所述利用所有图像的超像素块的表征向量进行聚类获得所有超像素块集合的步骤包括:
首先对所有图像的所有超像素块的表征向量进行均值漂移聚类,获得所有第一类别;
对于同一个第一类别中的所有超像素块,将属于同一个图像上的超像素块划分成不同集合中,将属于不同图像上的超像素块划分成相同集合中,进而将第一类别中的所有超像素块划分为若干集合;同理将所有第一类别划分为多个集合,将每个集合记为每个超像素块集合。
4.根据权利要求1所述的基于云计算的软件开发应用数据处理方法,其特征在于,所述获取每个超像素块集合中每个超像素块的无用信息的步骤包括:
将每个超像素块集合所有超像素块的所有表征向量输入到PCA算法中,获得若干数量个单位向量,以及每个单位向量的特征值,获取预设数量个特征值最小的单位向量,记为无用特征,将所述每个超像素块的无用信息在所有无用特征上的投影构成的向量记为每个超像素块的无用信息。
5.根据权利要求1所述的基于云计算的软件开发应用数据处理方法,其特征在于,所述根据每个超像素块的无用信息获得每个超像素块集合的所有参考像素块的步骤包括:
对每个超像素块集合所有超像素块的无用信息进行均值漂移聚类,获得所有第二类别,将所有第二类别中的所有超像素块记为每个超像素块集合的所有参考像素块。
6.根据权利要求1所述的基于云计算的软件开发应用数据处理方法,其特征在于,所述每个超像素块集合的权重的获取步骤为:
在每个超像素块集合的所有参考像素块的所有无用信息中,获取任意两个无用信息的余弦相似度,所有无用信息中得到的所有余弦相似度之和作为每个超像素块集合的权重。
7.根据权利要求1所述的基于云计算的软件开发应用数据处理方法,其特征在于,所述分别从任意两个超像素块集合中获得一组第一超像素块与第二超像素块的步骤为:
分别将任意两个超像素块集合记为第一集合、第二集合;将满足:属于同一图像上的且相邻的,同时分别属于第一集合、第二集合的两个超像素块记为第一超像素块和第二超像素块。
CN202211298878.9A 2022-10-24 2022-10-24 基于云计算的软件开发应用数据处理方法 Active CN115359075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211298878.9A CN115359075B (zh) 2022-10-24 2022-10-24 基于云计算的软件开发应用数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211298878.9A CN115359075B (zh) 2022-10-24 2022-10-24 基于云计算的软件开发应用数据处理方法

Publications (2)

Publication Number Publication Date
CN115359075A CN115359075A (zh) 2022-11-18
CN115359075B true CN115359075B (zh) 2023-03-24

Family

ID=84007701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211298878.9A Active CN115359075B (zh) 2022-10-24 2022-10-24 基于云计算的软件开发应用数据处理方法

Country Status (1)

Country Link
CN (1) CN115359075B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115883841B (zh) * 2023-03-03 2023-05-26 济南霍兹信息科技有限公司 一种基于霍夫曼编码的计算机信息存储系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557784A (zh) * 2016-11-23 2017-04-05 上海航天控制技术研究所 基于压缩感知的快速目标识别方法和系统
CN115035058A (zh) * 2022-06-02 2022-09-09 中国人民解放军国防科技大学 一种自编码网络医学图像异常检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103578119B (zh) * 2013-10-31 2017-02-15 苏州大学 基于超像素的Codebook动态场景中目标检测方法
ITUB20153912A1 (it) * 2015-09-25 2017-03-25 Sisvel Tech S R L Metodi e apparati per codificare e decodificare immagini digitali mediante superpixel
US11176412B2 (en) * 2016-11-02 2021-11-16 Ventana Medical Systems, Inc. Systems and methods for encoding image features of high-resolution digital images of biological specimens
US20180174294A1 (en) * 2016-12-16 2018-06-21 General Electric Company Multi-Layer Color Display In Synthetic 2D Images
CN114693816B (zh) * 2022-04-02 2023-04-28 陕西合友网络科技有限公司 一种智能化图像大数据存储方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557784A (zh) * 2016-11-23 2017-04-05 上海航天控制技术研究所 基于压缩感知的快速目标识别方法和系统
CN115035058A (zh) * 2022-06-02 2022-09-09 中国人民解放军国防科技大学 一种自编码网络医学图像异常检测方法

Also Published As

Publication number Publication date
CN115359075A (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
CN110782399B (zh) 一种基于多任务cnn的图像去模糊方法
US10728553B2 (en) Visual quality preserving quantization parameter prediction with deep neural network
WO2022022154A1 (zh) 脸部图像处理方法、装置、设备及存储介质
Chang et al. Automatic triage for a photo series
CN110148085A (zh) 人脸图像超分辨率重建方法及计算机可读取的存储介质
CN109801221A (zh) 生成对抗网络的训练方法、图像处理方法、装置和存储介质
CN115359075B (zh) 基于云计算的软件开发应用数据处理方法
CN110648278B (zh) 一种图像的超分辨率处理方法、系统及设备
CN114693816B (zh) 一种智能化图像大数据存储方法
US20090148041A1 (en) Systems and methods for unsupervised local boundary or region refinement of figure masks using over and under segmentation of regions
CN111062854A (zh) 检测水印的方法、装置、终端及存储介质
CN107333136A (zh) 图像编码方法和装置
Mancas et al. A rarity-based visual attention map-application to texture description
CN111080746A (zh) 图像处理方法、装置、电子设备和存储介质
CN112085017A (zh) 基于显著性检测和Grabcut算法的茶叶嫩芽图像分割方法
CN110691246A (zh) 视频编码方法、装置及电子设备
CN107423297A (zh) 图片的筛选方法及装置
CN109191381B (zh) 一种标定焦点处理图像的方法及系统
CN110796650A (zh) 图像质量的评估方法及装置、电子设备、存储介质
CN110659679A (zh) 一种基于自适应滤波与耦合性编码的图像来源鉴别方法
CN112330687B (zh) 基于ai技术肾脏病理图像分割模型、方法及系统
CN115205613A (zh) 一种图像识别方法、装置、电子设备及存储介质
CN114494890A (zh) 一种模型训练方法、商品图像管理方法及装置
CN114494302A (zh) 图像处理方法、装置、设备及存储介质
CN113721859A (zh) 一种基于人工智能的图像重复数据删除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant