CN117319662B - 一种人体目标识别的图像压缩、解压方法和系统 - Google Patents
一种人体目标识别的图像压缩、解压方法和系统 Download PDFInfo
- Publication number
- CN117319662B CN117319662B CN202311595222.8A CN202311595222A CN117319662B CN 117319662 B CN117319662 B CN 117319662B CN 202311595222 A CN202311595222 A CN 202311595222A CN 117319662 B CN117319662 B CN 117319662B
- Authority
- CN
- China
- Prior art keywords
- image
- grid image
- main grid
- human body
- video frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006835 compression Effects 0.000 title claims abstract description 82
- 238000007906 compression Methods 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000006837 decompression Effects 0.000 title claims abstract description 29
- 238000013507 mapping Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000003709 image segmentation Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提供了一种人体目标识别的图像压缩、解压方法和系统,所述方法包括:获取视频帧图像信息,采用人体目标识别模型识别所述视频帧中的人体图像,根据所述视频帧中的人体图像按照矩形进行分割,得到包含选定目标人体图像的主网格图像;获取所述主网格图像在所述视频帧的位置信息和边界信息,延伸所述主网格图像边界将所述视频帧分割为主网格图像和次网格图像;分别对所述主网格图像进行无损压缩,对次网格图像进行有损压缩,将压缩后主网格图像、次网格图像标记和后组装成压缩包传输给接收端;接收端获取压缩包数据,将所述压缩包分别对主网格图像和次网格图像进行解压,拼接后得到完整的视频帧图像。
Description
技术领域
本发明涉及图像压缩技术领域,特别涉及一种人体目标识别的图像压缩、解压方法和系统。
背景技术
目前随着短视频等行业的高速发展,图像视频数据的爆发式增长,对图像视频数据的压缩传输方式也带来了较大的挑战。现有技术中,压缩方式被分为无损压缩和有损压缩,其中无损压缩是利用数据的统计冗余进行压缩,使得压缩前后的数据并不失真,然而无损压缩通常存在压缩率上限的问题,因此无损压缩后文件还是比较大,使得高清晰度的视频图像需要的传输带宽较大。而现有的有损压缩则在原数据基础上进行整体的有损处理,虽然有损压缩的压缩包体积更小,但因此也带来了压缩后高清晰度视频、图像解压的失真问题。目前短视频、直播销售等行业主要以人体目标的为传输对象,需要对人体目标的动作图像进行更高清晰度的展示,可以更清晰凸显主播的形象。
发明内容
本发明其中一个发明目的在于提供一种人体目标识别的图像压缩、解压方法和系统,所述方法和系统利用人体目标识别算法识别图像、视频中的人体目标,并将该人体目标采用区域划分算法进行划分,将被识别的人体目标图像区域进行高清晰度的无损压缩,对剩余非人体目标图像区域进行更高压缩比的有损压缩,进一步将有损压缩和无损压进行压缩包重组,将重组的压缩包进行传输后分别进行有损和无损解压,因此可以实现人体目标的高清晰度无损解压,同时也降低了高清晰度视频图像对传输带宽的要求,利用人体目标识别算法识别的人体图像的矩形网格按照预设的网格分割算法自动进行网格分割,整体上提高了视频、图像人体网格内显示的清晰度,同时降低高清晰度视频传输的带宽压力。
本发明另一个发明目的在于提供一种人体目标识别的图像压缩、解压方法和系统,所述方法和系统对识别的人体目标区域图像后,按照预设的图像分割规则将人体目标区域的矩形区域分割出来,并将非人体目标区域的矩形按照人体目标边界所在位置分割成固定块数区域的图像,并对不同的区域图像采用对应的有损压缩和无损压缩分别进行压缩,并对不同区域图像进行标记,得到分割图像标记组,同时记录被分割图像的位置参数,将所述被压缩的分割图像、分割图像标记和分割图位置参数打包到压缩包中进行数据传输,在数据接收端根据所述分割图像标记和分割图位置参数分别对不同分割图像按照不同解压方式还原,并进行拼接得到凸显人体目标的图像,因此可以实现简单、高效、低带宽要求的图像视频传输。
本发明另一个发明目的在于提供一种人体目标识别的图像压缩、解压方法和系统,所述方法和系统在基于人体识别模型识别对应人体目标区域后,当识别的人体目标为多个时,同时对主要的人体目标进行主网格分割,对次要人体目标按照主网格边界位置进行边界延伸分割成固定个数的次要网格,对主网格内图像进行高清晰度的无损压缩,对次要网格内图像进行高倍率有损压缩,从而可以避免受到其它非主要人体图像的干扰。
为了实现至少一个上述发明目的,本发明进一步提供一种人体目标识别的图像压缩、解压方法,所述方法包括:
在发送端截取视频帧图像信息,采用人体目标识别模型识别所述视频帧中的人体图像,根据所述视频帧中的人体图像按照矩形进行分割,得到包含选定目标人体图像的主网格图像;
获取所述主网格图像在所述视频帧的位置信息和边界信息,延伸所述主网格图像边界将所述视频帧分割为主网格图像和次网格图像;
分别对所述主网格图像进行无损压缩,对次网格图像进行有损压缩,将压缩后主网格图像标记、次网格图像标记,网格边界信息和映射信息组装成压缩包传输给接收端;
接收端获取压缩包数据,将所述压缩包分别对主网格图像和次网格图像进行解压,拼接后得到完整的视频帧图像。
根据本发明其中一个较佳实施例,所述人体目标识别模型包括YOLO模型,根据所述YOLO模型识别所述目标人体图像,获取所述YOLO模型识别目标图像所对应的矩形主网格,并获取所述矩阵主网格图像在被识别的视频帧中位置数据,根据所述主网格图像的边界信息获取对应的次网格图像。
根据本发明另一个较佳实施例,所述次网格图像分割方法包括:获取所述矩形主网格图像的四条边界位置数据,判断所述主网格四条边界是否在所述对应图像帧边界,若所述主网格四条边界均不在所述图像帧边界,将所述四条边界线和其中两个相对的边界的延长线作为对视频帧图像的切割线,所述延长线延长到所述视频帧图像的边缘,使得所述主网格图像的四条边界和对应的延长线将所述视频帧图像分割裁剪为一个主网格图像和四个次网格图像。
根据本发明另一个较佳实施例,所述次网格图像分割方法包括:根据所述主网格图像的边界信息,若当前主网格图像至少一个边界在对应的视频帧的边界上,则将不在对应视频帧边缘的主网格边界和所述不在视频帧边缘的主网格边界的延长线作为切割线对所述视频帧进行切割,得到一个主网格图像和至少一个次网格图像。
根据本发明另一个较佳实施例,在获取所述主网格图像和次网格图像后,分别对所述主网格图像和次网格图像进行标记,分别对标记后的主网格图像进行无损压缩,对次网格图像进行高压缩倍率的有损压缩,其中对所述次网格图像的压缩方法包括:采用高倍率的JPG图像有损压缩模式压缩算法对所述次网格图像进行压缩,将所述次网格图像的长和宽压缩至原图的四分之一,得到次网格压缩图像文件。
根据本发明另一个较佳实施例,所述主网格图像标记和次网格图像标记和边界位置信息获取方法包括:在每一视频帧中按照像素点位置排列建立平面直角坐标系,选定坐标系原点,按照像素点排列每个像素点均为一个坐标点,根据所述YOLO模型识别所述目标人体图像对应的主网格图像边界所在的像素点位置得到所述主网格图像边界信息,并根据分割后次网格图像边界所在的像素点位置得到对应次网格图像边界信息,根据所述主网格图像和次网格图像中心点像素坐标作为对应的图像标记,并建立对应网格和边界映射关系。
根据本发明另一个较佳实施例,将所述分割后压缩后的主网格图像、次网格图像、网格图像标记信息、对应网格边界信息和对应网格边界映射信息组装成压缩包传输到接收终端,所述接收终端则根据所述根据所述网格标记信息提取所述主网格图像和次网格图像,分别对所述主网格图像和次网格图像进行对应解压后,根据对应网格边界信息和边界映射关系进行拼接,将和所述主网格图像存在重合或相邻边界的次网格图像边界拼接得到完整的图像信息。
根据本发明另一个较佳实施例,所述主网格解压方法包括:获取待解压的主网格图像包括颜色、纹理特征,将上述颜色、纹理特征进行上采样,采用邻近插值法对所述待解压的主网格图像进行超分辨率解压,得到解压后的主网格图像。
为了实现至少一个上述发明目的,本发明进一步提供一种人体目标识别的图像压缩、解压系统,所述系统执行上述一种人体目标识别的图像压缩、解压方法。
本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述一种人体目标识别的图像压缩、解压方法。
附图说明
图1显示的是本发明一种人体目标识别的图像压缩、解压方法流程示意图。
图2显示的是本发明中网格图像分割一个较佳实施例示意图。
图3显示的是本发明中网格图像分割另一个较佳实施例示意图。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
请结合图1-图3,本发明公开了一种人体目标识别的图像压缩解压方法和系统,其中所述方法主要包括如下步骤:首先需要获取对应的短视频的视频流图像,在短视频发送端截取所述视频流,从所述视频流中提取视频帧图像,将提取到的所述视频帧图像采用人体目标识别模型识别对应的人体图像,确定所述人体图像在所述视频帧中的位置,根据所述人体图像在所述视频帧中的位置对所述视频帧进行网格分割,将所述视频帧分割为主网格图像和至少一个次网格图像,将所述主网格图像和次网格图像分割后,分别对主网格图像和次网格图像采用无损压缩和高倍率有损压缩得到不同的压缩网格图像,并分别对不同压缩网格图像进行标记。进一步对压缩后的网格图像和对应标记打包成视频帧压缩包进行数据传输到接收端,接收端在接收端对应视频帧压缩包后,获取对应压缩的网格图像,在接收端根据对应网格图像按照标记分别采用不同的方式解压,同时对解压的主网格图像和次网格图像按照预设的拼接策略进行拼接得到对应完整的解压图像,从而可以实现低带宽占据、高传输效率且凸显目标人体清晰度的解析视频,可以更好地适用于短视频主播、销售等需要提高清晰度人体图像的场景。另外本发明针对所述主网格图像所采用的是基于人体目标识别的网格分割法,并非是基于单纯的人体目标和背景图像的分割,因此当短视频主播在拿到相关商品在身边进行解析时,所述商品位于被识别的所述主网格区域内,该商品同样可以被无损压缩和解压,从而使得短视频主播更好地介绍和展示商品信息,使得商品本身在讲解过程中可以和人体目标一样被更清晰展示,提高视频传输效率、降低短视频延迟的同时,提高短视频讲解效果。
具体而言,本发明中所述人体目标识别模型优选采用训练好的YOLO模型对所述视频流中的每帧图像进行人体目标识别,需要说明的是YOLO模型为现有的目标检测模型,本发明并未对所述YOLO模型进行改进,因此本发明仅介绍YOLO模型的基本实现原理,并不对YOLO模型训练和检测细节做赘述。举例来说:所述YOLO模型在获取到每一帧图像后,进一步对每一帧图像分割成多个小矩形框bounding box,所述YOLO模型对所述小矩形框boundingbox内是否存在目标人体图像进行类别概率计算,上述概率计算方式通过多层神经网络对所述小矩形框bounding box像素概率计算实现,设置并更新对应网络层的权重可以实现对应类别概率计算。其中所述目标人体存在于对应小矩形框bounding box的概率为目标人体在所述小矩形框内的置信度值,针对所述目标人体的设置置信度值,设置矩形预测边框,计算所述预测边框的置信度值,当所述预测边框满足置信度条件后即可识别出所述目标人体位置和范围,其中所述矩形的预测边框在所述视频帧中的范围图像为本发明中的矩形主网格图像,即本发明只要利用所述YOLO模型的预测边框对目标人体检测即可同时得到目标人体位置,以及对目标人体所对应的矩形预测边框进行初始的主网格图像的边界确定,当所述YOLO模型识别对应目标人体进行定位跟踪,将被定位跟踪的目标人体矩形预测框网格作为主网格,不再定位跟踪其它目标人体,从而实现目标人体锁定。
当利用所述YOLO模型得到目标人体的预测框后,进一步获取所述预测边框的中心点和边界在所述视频帧中的位置信息。本发明中针对所述每一视频帧建立二维平面直角坐标系,为了更好的描述本发明的技术效果,本发明优选在视频帧的左下角的第一个像素点作为所述二维平面直角坐标系的原点,每个像素点的横坐标和纵坐标排布作为所述二维平面直角坐标系的1的增量值,比如设定目标像素点f分别在x轴和y轴上和原点相距3个像素点和4个像素点,其中本发明中的相距含义包当前目标像素点f所占的像素距离,因此所述目标像素点f在对应图像帧中的坐标值为f=(3,4)。当获取所述YOLO模型得到目标人体的预测边框的主网格图像后,进一步计算所述主网格图像的中心点在对应图像帧中的位置信息fa=(X0,Y0),并计算所述主网格图像的四个边界在对应图像帧中的位置信息,其中,定义Fa区域为包含了目标人体的主网格图像区域,定义Fa1、Fa2、Fa3、Fa4分别为所述主网格图像Fa的四个边界,请参考图2被识别的所述主网格图像结构,其中四个边界位置信息分别为Fa1(X,Y)=(X=XL,YU≥Y≥YD);Fa2(X,Y)=(XR≥X≥XL,Y=YU);Fa3(X,Y)=(X=XR,YU≥Y≥YD);Fa4(X,Y)=(XR≥X≥XL,Y=YD)。上述四个边界在视频帧中的位置构成本发明中所述的主网格图像边框。
进一步的,本发明在上述主网格四个边界Fa1、Fa2、Fa3、Fa4的基础上,进一步按照视频帧图像的长宽比以及所述主网格四个边界所在的视频帧位置将对应边界进行延伸得到边界延长线,所述边界延长线和对应边界本身作为所述视频帧本身的图像切割线,从而将所述视频帧图像切割成不同的次网格图像。请继续参考图2,从图2中可以得到所述主网格图像为居中图像,所述主网格图像的任意一个边界均不和所述视频帧的边界重合,从图2显示的图像可知所述视频帧的像素长宽比为Xm/Ym,且Xm>Ym,因此根据所述视频帧像素长宽比Xm/Ym>1,则在所述视频帧发送端自动选择边界Fa1(X,Y)=(X=XL,YU≥Y≥YD)和边界Fa3(X,Y)=(X=XR,YU≥Y≥YD)进行延伸得到延长线。其中所述Fa1(X,Y)=(X=XL,YU≥Y≥YD)的两端分别延长到视频帧的边界得到对应的延长线Fd1(X,Y)=(X=XL,YD>Y≥0)和Fc1(X,Y)=(X=XL,Ym>Y>YU)。所述Fa3(X,Y)=(X=XR,YU≥Y≥YD)的两端分别延长到视频帧的边界得到延长线Fd3(X,Y)=(X=XR,YD>Y≥0)和Fc3(X,Y)=(X=XR,Ym>Y>YU)。在本发明另一些可行实施方式中,当所述视频帧像素长宽比Xm/Ym<1,则自动选定Fa2(X,Y)=(XR≥X≥XL,Y=YU)和边界Fa4(X,Y)=(XR≥X≥XL,Y=YD)进行延长得到对应的延长线。
上述延长线Fd1、Fc1、Fd3、Fc3以及对应所述主网格四个边界Fa1、Fa2、Fa3、Fa4构成所述视频帧的切割线,通过上述切割线对所述视频帧切割后,得到如图2所示的主网格图像Fa和四个次网格图像Fb、Fc、Fd和FE。其中根据所述主网格图像的四个边界和对应延长切割线,记录下所述四个次网格图像Fb、Fc、Fd和FE的边界信息,其中本发明中所述四个次网格图像Fb、Fc、Fd和FE边界信息中和对应切割线或对应主网格边界相同的边界可以被记录为相同的边界映射关系,即如图2所示,所述主网格图像Fa的边界Fa1、次网格图像Fc边界Fc1、所述次网格图像Fd的边界Fd1构成的切割线边界和对应的次网格图像Fb的边界Fb3构建映射关系,即Fb3=[Fa1,Fc1,Fd1],其中上述映射关系仅为对应网格图像边界所在像素点坐标的映射关系,而非实际等值关系。实际像素点的坐标值在X轴或Y轴上数值相差1。请继续参考图2,本发明进一步根据切割线在视频帧上的位置,建立如下边界映射关系:Fa4=Fd2;Fa2=Fc4;FE1=[Fa3,Fc3,Fd3]。需要说明的是,上述边界映射关系可以在所述主网格图像和次网格图像被无损压缩和有损压缩后得到的压缩图像进行。
请参考图3,在本发明另一些较佳实施例中,所述主网格图像通过所述YOLO模型等人体目标识别模型识别的预测边框的至少一个边缘在对应视频边界后,则将不在视频边界的至少一个主网格图像边界进行直线延伸,使得对应边界延伸到对应视频帧边界上。在图3中,所述主网格Fa的两个边界Fa3和Fa4分别在所述视频帧的边缘,因此针对图3中的实施例,本发明对所述主网格Fa的另外两个边界Fa1和Fa2进行延伸对所述视频帧进行分割,得到图3中的次网格图像Fb,Fc和Fd。并分别获取所述次网格图像对应的边界信息,进一步将获取的所述主网格图像和次网格图像按照图像边界信息建立边界映射关系,其中所述图3中的边界映射关系包括Fa1=Fc3;Fa2=Fd4;Fb3=Fd1;Fb4=Fc2。
值得一提的是,本发明在利用所述YOLO模型得到目标人体的预测框,并分割得到包含所述目标人体的主网格图像和至少一个次网格图像后,获取所述主网格图像的中心像素点坐标和次网格图像中心像素点坐标作为对应网格图像标记信息,并分别按照上述边界映射关系计算方法获取单一视频帧中所有网格之间的边界映射关系。
所述被分割的主网格图像可以采用包括但不仅限于RAR压缩算法、JPG图像无损压缩模式等无损压缩方式进行压缩,而对于所述次网格图像,本发明可以采用包括但不仅限于MP4、JPEG 有损模式等有损压缩方式得到更高压缩比的所述次网格图像。由于上述举例的压缩算法为现有技术,本发明并未对压缩算法本身进行改进,因此本发明对如何实现有损压缩和无损压缩不再赘述。在通过对所述主网格图像和次网格图像分别进行对应的无损压缩和和有损压缩后,进一步对压缩后的不同主网格图像Fa和对应的次网格图像、网格标记信息、边界信息、对应的边界映射关系打包压缩成ZIP格式压缩包传输到接收端,接收端在接收到上述ZIP格式压缩包后解析得到对应的边界映射关系。进一步对所述主网格图像和次网格图像分别解压后,按照上述的边界映射关系进行图像拼接,将相同映射的边界拼接在同一个边界中,从而得到完整的视频帧图像。
需要说明的是,本发明中基于边界映射的图像拼接仅记录了边界像素信息,在借助所述YOLO模型时,无需对人体特征像素进行特征提取再重新构建图像,仅以边界分割的方式实现数据传输,从而大幅降低数据处理量,仅对原图进行分割处理和少量映射数据即可,因此整体的数据传输量也大幅减少。
在本发明另一个较佳实施例中,本发明针对无损压缩后主网格图像在接收端进行超分辨率解压,本发明中可以采用插值法对压缩主网格图像进行解压,得到清晰度更高的解压图像,超分辨率解压方式为现有技术,本发明对此不再详细赘述。
本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线段的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线段、电线段、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明,本发明的目的已经完整并有效地实现,本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。
Claims (8)
1.一种人体目标识别的图像压缩、解压方法,其特征在于,所述方法包括:
在发送端截取视频帧图像信息,采用人体目标识别模型识别所述视频帧中的人体图像,根据所述视频帧中的人体图像按照矩形进行分割,得到包含选定目标人体图像的主网格图像;
获取所述主网格图像在所述视频帧的位置信息和边界信息,延伸所述主网格图像边界将所述视频帧分割为主网格图像和次网格图像;
分别对所述主网格图像进行无损压缩,对次网格图像进行有损压缩,将压缩后主网格图像标记、次网格图像标记,网格边界信息和网格边界映射信息组装成压缩包传输给接收端;
接收端获取压缩包数据,将所述压缩包分别对主网格图像和次网格图像进行解压,拼接后得到完整的视频帧图像;
所述次网格图像分割方法包括:获取所述矩形主网格图像的四条边界位置数据,判断所述主网格四条边界是否在所述视频帧图像边界,若所述主网格四条边界均不在所述视频帧图像边界,将所述四条边界线和其中两个相对的边界的延长线作为对视频帧图像的切割线,所述延长线延长到所述视频帧图像的边缘,使得所述主网格图像的四条边界和对应的延长线将所述视频帧图像分割裁剪为一个主网格图像和四个次网格图像;
所述次网格图像分割方法包括:根据所述主网格图像的边界信息,若当前主网格图像至少一个边界在对应的视频帧的边界上,则将不在对应视频帧图像边缘的主网格边界和所述不在对应视频帧图像边缘的主网格边界的延长线作为切割线对所述视频帧图像进行切割,得到一个主网格图像和至少一个次网格图像。
2.根据权利要求1所述的一种人体目标识别的图像压缩、解压方法,其特征在于,所述人体目标识别模型包括YOLO模型,根据所述YOLO模型识别所述目标人体图像,获取所述YOLO模型识别目标图像所对应的矩形主网格,并获取所述矩形主网格图像在被识别的视频帧中位置数据,根据所述主网格图像的边界信息获取对应的次网格图像。
3.根据权利要求2所述的一种人体目标识别的图像压缩、解压方法,其特征在于,在获取所述主网格图像和次网格图像后,分别对所述主网格图像和次网格图像进行标记,分别对标记后的主网格图像进行无损压缩,对次网格图像进行高压缩倍率的有损压缩,其中对所述次网格图像的压缩方法包括:采用高倍率的JPG图像有损压缩模式压缩算法对所述次网格图像进行压缩,将所述次网格图像的长和宽压缩至原图的四分之一,得到次网格压缩图像文件。
4.根据权利要求3所述的一种人体目标识别的图像压缩、解压方法,其特征在于,所述主网格图像标记和次网格图像标记和边界位置信息获取方法包括:在每一视频帧中按照像素点位置排列建立平面直角坐标系,选定坐标系原点,按照像素点排列每个像素点均为一个坐标点,根据所述YOLO模型识别所述目标人体图像对应的主网格图像边界所在的像素点位置得到所述主网格图像边界信息,并根据分割后次网格图像边界所在的像素点位置得到对应次网格图像边界信息,根据所述主网格图像和次网格图像中心点像素坐标作为对应的图像标记,并建立对应网格边界映射关系。
5.根据权利要求4所述的一种人体目标识别的图像压缩、解压方法,其特征在于,将所述分割后压缩后的主网格图像、次网格图像、网格图像标记信息、对应网格边界信息和对应网格边界映射信息组装成压缩包传输到接收终端,所述接收终端则根据所述根据所述网格标记信息提取所述主网格图像和次网格图像,分别对所述主网格图像和次网格图像进行对应解压后,根据对应网格边界信息和网格边界映射关系进行拼接,将和所述主网格图像存在重合或相邻边界的次网格图像边界拼接得到完整的图像信息。
6.根据权利要求1所述的一种人体目标识别的图像压缩、解压方法,其特征在于,所述主网格解压方法包括:获取待解压的主网格图像包括颜色、纹理特征,将上述颜色、纹理特征进行上采样,采用邻近插值法对所述待解压的主网格图像进行超分辨率解压,得到解压后的主网格图像。
7.一种人体目标识别的图像压缩、解压系统,其特征在于,所述系统执行上述权利要求1-6中任意一项所述的一种人体目标识别的图像压缩、解压方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述权利要求1-6中任意一项所述的一种人体目标识别的图像压缩、解压方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311595222.8A CN117319662B (zh) | 2023-11-28 | 2023-11-28 | 一种人体目标识别的图像压缩、解压方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311595222.8A CN117319662B (zh) | 2023-11-28 | 2023-11-28 | 一种人体目标识别的图像压缩、解压方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117319662A CN117319662A (zh) | 2023-12-29 |
CN117319662B true CN117319662B (zh) | 2024-02-27 |
Family
ID=89286867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311595222.8A Active CN117319662B (zh) | 2023-11-28 | 2023-11-28 | 一种人体目标识别的图像压缩、解压方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117319662B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117853345A (zh) * | 2024-03-07 | 2024-04-09 | 吉林大学 | 一种用于中医舌诊舌像成像的图像优化方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101316366A (zh) * | 2008-07-21 | 2008-12-03 | 北京中星微电子有限公司 | 图像编/解码方法和图像编/解码装置 |
JP2013235108A (ja) * | 2012-05-08 | 2013-11-21 | Softbank Mobile Corp | 情報端末装置 |
CN109816745A (zh) * | 2018-12-24 | 2019-05-28 | 深圳云天励飞技术有限公司 | 人体热力图展示方法及相关产品 |
CN113297900A (zh) * | 2021-04-02 | 2021-08-24 | 中国地质大学(武汉) | 基于yolo的视频流安全帽识别方法、装置、设备及存储介质 |
CN116883897A (zh) * | 2023-07-10 | 2023-10-13 | 国网浙江省电力有限公司平湖市供电公司 | 一种低分辨率目标识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5076744B2 (ja) * | 2007-08-30 | 2012-11-21 | セイコーエプソン株式会社 | 画像処理装置 |
US20090303550A1 (en) * | 2008-06-05 | 2009-12-10 | Kabushiki Kaisha Toshiba | Image processing apparatus and image processing method |
US10694170B2 (en) * | 2018-03-05 | 2020-06-23 | Valve Corporation | Controlling image display via real-time compression in peripheral image regions |
US10713997B2 (en) * | 2018-03-23 | 2020-07-14 | Valve Corporation | Controlling image display via mapping of pixel values to pixels |
-
2023
- 2023-11-28 CN CN202311595222.8A patent/CN117319662B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101316366A (zh) * | 2008-07-21 | 2008-12-03 | 北京中星微电子有限公司 | 图像编/解码方法和图像编/解码装置 |
JP2013235108A (ja) * | 2012-05-08 | 2013-11-21 | Softbank Mobile Corp | 情報端末装置 |
CN109816745A (zh) * | 2018-12-24 | 2019-05-28 | 深圳云天励飞技术有限公司 | 人体热力图展示方法及相关产品 |
CN113297900A (zh) * | 2021-04-02 | 2021-08-24 | 中国地质大学(武汉) | 基于yolo的视频流安全帽识别方法、装置、设备及存储介质 |
CN116883897A (zh) * | 2023-07-10 | 2023-10-13 | 国网浙江省电力有限公司平湖市供电公司 | 一种低分辨率目标识别方法 |
Non-Patent Citations (2)
Title |
---|
Image Compression by 2D Motif Basis;Alessia Amelio;2011 Data Compression Conference;全文 * |
一种结合多种图像分割算法的实例分割方案;詹琦梁;陈胜勇;胡海根;李小薪;周乾伟;;小型微型计算机系统(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117319662A (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117319662B (zh) | 一种人体目标识别的图像压缩、解压方法和系统 | |
CN108353208B (zh) | 优化媒体指纹保持以提高系统资源利用率 | |
US8180165B2 (en) | Accelerated screen codec | |
US10970824B2 (en) | Method and apparatus for removing turbid objects in an image | |
EP3543910B1 (en) | Cloud detection in aerial imagery | |
CN113515655A (zh) | 一种基于图像分类的故障识别方法及装置 | |
CN104145477A (zh) | 调整颜色的方法及系统 | |
CN114429637A (zh) | 一种文档分类方法、装置、设备及存储介质 | |
CN112348056A (zh) | 点云数据分类方法、装置、设备及可读存储介质 | |
CN110188815B (zh) | 一种特征点采样方法、装置、设备及存储介质 | |
CN114648709A (zh) | 一种确定图像差异信息的方法与设备 | |
CN112468792B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN115984672B (zh) | 基于深度学习的高清图像内小目标的检测方法和装置 | |
US10096116B2 (en) | Method and apparatus for segmentation of 3D image data | |
CN115861922B (zh) | 一种稀疏烟火检测方法、装置、计算机设备及存储介质 | |
CN110807430A (zh) | 一种实况全景交通标志图片预处理方法 | |
CN116310875A (zh) | 卫星遥感影像的目标检测方法及装置 | |
CN116188808A (zh) | 图像特征提取方法和系统、存储介质及电子设备 | |
CN116052090A (zh) | 图像质量评估方法、模型训练方法、装置、设备及介质 | |
CN111723614A (zh) | 交通信号灯识别方法及装置 | |
CN112102338A (zh) | 基于深度学习的影像样本数据的获取方法及装置 | |
CN110647898B (zh) | 图像处理方法、装置、电子设备及计算机存储介质 | |
KR101758869B1 (ko) | 멀티미디어 콘텐츠 분류장치 및 이를 이용한 분류방법 | |
CN112434698A (zh) | 字符识别方法、装置、电子设备及存储介质 | |
CN117395424B (zh) | 一种用于视频无线传输监控系统的视频优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |