CN116347104B - 基于高效判别分析的帧内图像编码方法、装置及存储介质 - Google Patents

基于高效判别分析的帧内图像编码方法、装置及存储介质 Download PDF

Info

Publication number
CN116347104B
CN116347104B CN202310575966.7A CN202310575966A CN116347104B CN 116347104 B CN116347104 B CN 116347104B CN 202310575966 A CN202310575966 A CN 202310575966A CN 116347104 B CN116347104 B CN 116347104B
Authority
CN
China
Prior art keywords
coding
projection matrix
frame
intra
solving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310575966.7A
Other languages
English (en)
Other versions
CN116347104A (zh
Inventor
蒋先涛
张丽媛
柳云夏
郭咏梅
郭咏阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Kangda Kaineng Medical Technology Co ltd
Original Assignee
Ningbo Kangda Kaineng Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Kangda Kaineng Medical Technology Co ltd filed Critical Ningbo Kangda Kaineng Medical Technology Co ltd
Priority to CN202310575966.7A priority Critical patent/CN116347104B/zh
Publication of CN116347104A publication Critical patent/CN116347104A/zh
Application granted granted Critical
Publication of CN116347104B publication Critical patent/CN116347104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于高效判别分析的帧内图像编码方法、装置及存储介质,涉及图像处理技术领域,包括步骤:特征向量选择;以各编码块的特征向量为输入量,进行基于最大类分离目标下各划分模式分类间的投影矩阵求解式构建;求解优化;获取当前图像组中的帧内编码帧,并提取帧内编码帧各编码深度下各编码块的特征向量;根据提取出的各特征向量补齐求解优化后投影矩阵求解式的各项参数;根据补齐后的投影矩阵求解式,以目标帧间图像当前编码深度下编码块的特征向量为输入量进行划分模式判定。本发明在分类判定的时候判定标准更符合当前图像组的情况,在保证同类足够接近的同时保证不同类映射距离足够远,从而提高了分类划分准确率。

Description

基于高效判别分析的帧内图像编码方法、装置及存储介质
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于高效判别分析的帧内图像编码方法、装置及存储介质。
背景技术
目前主流视频压缩标准普遍采用基于预测差分编码理论为基础的混合编码框架。该框架以香农信息论为理论基础,以像素和图像块为基本处理单元,对图像单元进行预测、变换、量化、环路滤波以及熵编码等过程,有效地去除视频中的各种冗余信息。VVC拥有优异的压缩性能,同时也具有较高的复杂度。在降低高效视频编码的计算复杂度优化算法中,帧内快速编码通过减少图片内空间冗余实现视频编码,前人方法利用了时空相关性来降低VVC的计算复杂度,但是没有考虑到视频图像局部内容与编码单元尺寸之间的关联性。
发明内容
为了降低VVC编码过程中的计算复杂度,并将编码深度与局部内容关联起来提高编码质量,本发明提出了一种基于高效判别分析的帧内图像编码方法,包括步骤:
S1:以预测残差为包裹式特征选择的特征子集评价标准,基于F-Score获取当前图像组编码块划分判定的特征向量;
S2:以各编码块的特征向量为输入量,进行基于最大类分离目标下各划分模式分类间的投影矩阵求解式构建;
S3:通过凸优化约束对投影矩阵求解式进行求解优化;
S4:获取当前图像组中的帧内编码帧,并提取帧内编码帧各编码深度下各编码块的特征向量;
S5:根据提取出的各特征向量补齐求解优化后投影矩阵求解式的各项参数;
S6:根据补齐后的投影矩阵求解式,以目标帧间图像当前编码深度下编码块的特征向量为输入量进行划分模式判定;
S7:根据判定的划分模式进行编码块划分,并在到达最大编码深度前返回S6步骤。
进一步地,所述S2步骤中,通过线性判别分析来构建最大类分离目标下各划分模式分类间的投影方向求解式。
进一步地,所述投影矩阵求解式表示为如下公式:
式中,为类间离散度矩阵,K为划分模式分类的总量,k为取值范围1至K的常数,为第k类划分模式对应各编码块特征向量的集合,/>为第k类划分模式对应各编码块特征向量的平均向量,/>为所有划分模式对应各编码块特征向量的平均向量,/>为第k类划分模式对应各编码块特征向量的协方差矩阵,/>为各类划分模式协方差矩阵的总和,W为投影矩阵,/>表示为求最大的W,/>为W的比率,T为矩阵转置操作。
进一步地,所述S3步骤中,求解优化后的投影矩阵表示为如下公式:
式中,为拉格朗日乘子,/>为修正常量。
进一步地,若为非奇异矩阵,则求解优化后的投影矩阵表示为如下公式:
式中,为拉格朗日乘子,/>为修正常量。
进一步地,所述S6步骤中,划分模式判定的具体方式为:
根据补齐后的投影矩阵求解式获得投影矩阵W,并提取投影矩阵W中特征值最大的类别作为判定的划分模式。
还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于高效判别分析的帧内图像编码方法的步骤。
还包括一种处理数据的装置,其特征在于,包括:
储存器,其上存储有计算机程序;
处理器,用于执行所述储存器中的计算机程序,以实现一种基于高效判别分析的帧内图像编码方法的步骤。
与现有技术相比,本发明至少含有以下有益效果:
(1)本发明所述的一种基于高效判别分析的帧内图像编码方法、装置及存储介质,通过对当前画面组进行包裹式特征选择下的特征向量选择,使得后续基于特征向量进行构建的分类判定模型,在分类判定的时候其判定标准能够更符合当前图像组的情况;
(2)通过线性判别分析以及凸优化获得使不同类之间的距离最大的投影矩阵,并从中选取特征值最大的类别作为当前编码块的划分模式,使得分类结果能在保证同类足够接近的同时保证不同类映射距离足够远,从而提高了分类划分准确率。
附图说明
图1为一种基于高效判别分析的帧内图像编码方法的步骤图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
实施例一
在VVC编码标准中,采用了一共六种划分结构,分别为不划分、四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分、垂直三叉树划分,多类型树划分结构大大增加了VVC编码的计算复杂度,使VVC不适应实时处理的应用场景。为此,针对VVC中编码块划分计算复杂度太高的问题,如图1所示,本发明提出了一种基于高效判别分析的帧内图像编码方法,包括步骤:
S1:以预测残差为包裹式特征选择的特征子集评价标准,基于F-Score获取当前图像组编码块划分判定的特征向量;
S2:以各编码块的特征向量为输入量,进行基于最大类分离目标下各划分模式分类间的投影矩阵求解式构建;
S3:通过凸优化约束对投影矩阵求解式进行求解优化;
S4:获取当前图像组中的帧内编码帧,并提取帧内编码帧各编码深度下各编码块的特征向量;
S5:根据提取出的各特征向量补齐求解优化后投影矩阵求解式的各项参数;
S6:根据补齐后的投影矩阵求解式,以目标帧间图像当前编码深度下编码块的特征向量为输入量进行划分模式判定;
S7:根据判定的划分模式进行编码块划分,并在到达最大编码深度前返回S6步骤。
在帧内编码的过程中,通常对划分模式具有影响的因素有预测残差先关特征、CU编码深度、CU纹理复杂度和率失真函数等,但考虑到不同的图像运动趋势和图像色深变化,并不是所有因素都会对划分模式产生影响,若是在实际划分模式判定过程中将所有因素都考虑进去,势必会提高运算成本。因此,如何选取适当的影响因素作为划分模式的判定依据就成为了影响编码效率的一大因素。在这里,本发明考虑到同一画面组中的帧间图像往往具有相似的划分模式分类趋势。因此,如果能够提取到当前画面组帧内编码帧中与划分模式判定相关性最高的若干个特征向量,就能够极大程度上代表同一画面组中后续帧间图像在帧内编码中所依赖的特征向量。
基于此,本发明选用基于F-Score的包裹式特征选择(Wrapper)方法选择CU划分的最重要的三个特征(实际数量可以根据编码质量和编码效率需求自行选择,本实施例仅以三个为例)作为CU划分的特征向量。具体来说,就是采用直接把最终将要使用的模型的性能作为特征子集的评价标准,并在F-Score打分标准下进行评分,提取出其中分值最大的三个特征作为CU划分的特征向量。
在提取到合适的特征向量后,在划分模式判定过程中我们想要实现不同类之间的最大类分离,从概念上将,来自同一分类的所有投影都应该保持接近,而不同分类应该映射到一些相距较远的区域。为了同时满足这两个目标,本发明选用基于线性判别分析作为实施工具。其中,投影的概念解释如下,也即是找到一个方向,使得数据在这些投影方向上的方差最大,通过计算原始数据在这些正交基上投影的方差,方差越大,就说明在对应正交基上包含了更过的信息量,而这个方向就是主成分(最大概率的划分模式)。
首先,根据当前已知的量,也即是帧内编码帧,按照划分模式分类依次提取出其在各编码深度下各编码块的特征向量,并计算各分类特征向量的均值向量和样本协方差矩阵,公式表达如下:
式中,k为取值范围1至K的常数,K为划分模式分类的总量(在VVC编码标准中K取值为6),为第k类划分模式对应各编码块特征向量的集合,/>为第k类划分模式对应各编码块特征向量的平均向量,/>为所有划分模式对应各编码块特征向量的平均向量,/>为第k类划分模式对应各编码块特征向量的协方差矩阵,/>为/>中第i个编码块对应的特征向量。
根据获得的均值向量和样本协方差矩阵,基于线性判别分析最大化以下比率来导出投影方向W:
其中,为W的比率,分子用于衡量不同类之间的分离,即类间离散度矩阵/>,它通过所有类的均值向量计算:
分母用来衡量来自同一类的所有投影与所谓的类内离散度矩阵的接近程度,其定义为所有编码块特征向量的协方差矩阵的综合:
然而,考虑到这样获得的线性判定分析得到的只是局部最优解,因此,本发明在此基础上对其进行了凸优化改进,将最大化比率问题转换为带有约束的凸优化问题:
求得该优化问题的解为全局最优投影矩阵:,/>为拉格朗日乘子,/>为修正常量。而若是/>为非奇异矩阵,则/>
根据最终求解优化后的投影矩阵表达式,利用帧内编码帧中的已知量补齐以及/>,即可在对后续同一图像组中的目标帧间图像进行帧内编码时,通过带入当前编码深度下编码块的特征向量为输入量进行划分模式判定,并在到达最大编码深度前重复此操作,即可实现高效准确的帧内编码。当然,获得的W是一组划分模式矩阵,它的每一列向量为/>的前K-1个较大特征值相应的特征向量,还并不是最终判定的划分模式。在这里,我们是根据补齐后的投影矩阵求解式获得的投影矩阵W,提取投影矩阵W中特征值最大的类别作为最终判定的划分模式。
还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现一种基于高效判别分析的帧内图像编码方法的步骤。
还包括一种处理数据的装置,其特征在于,包括:
储存器,其上存储有计算机程序;
处理器,用于执行所述储存器中的计算机程序,以实现一种基于高效判别分析的帧内图像编码方法的步骤。
综上所述,本发明所述的一种基于高效判别分析的帧内图像编码方法、装置及存储介质,通过对当前画面组进行包裹式特征选择下的特征向量选择,使得后续基于特征向量进行构建的分类判定模型,在分类判定的时候其判定标准能够更符合当前图像组的情况。
通过线性判别分析以及凸优化获得使不同类之间的距离最大的投影矩阵,并从中选取特征值最大的类别作为当前编码块的划分模式,使得分类结果能在保证同类足够接近的同时保证不同类映射距离足够远,从而提高了分类划分准确率。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

Claims (6)

1.一种基于高效判别分析的帧内图像编码方法,其特征在于,包括步骤:
S1:以预测残差为包裹式特征选择的特征子集评价标准,基于F-Score获取当前图像组编码块划分判定的特征向量;
S2:以各编码块的特征向量为输入量,进行基于最大类分离目标下各划分模式分类间的投影矩阵求解式构建;
S3:通过凸优化约束对投影矩阵求解式进行求解优化;
S4:获取当前图像组中的帧内编码帧,并提取帧内编码帧各编码深度下各编码块的特征向量;
S5:根据提取出的各特征向量补齐求解优化后投影矩阵求解式的各项参数;
S6:根据补齐后的投影矩阵求解式,以目标帧间图像当前编码深度下编码块的特征向量为输入量进行划分模式判定;
S7:根据判定的划分模式进行编码块划分,并在到达最大编码深度前返回S6步骤;
所述S2步骤中,通过线性判别分析来构建最大类分离目标下各划分模式分类间的投影方向求解式;
所述投影矩阵求解式表示为如下公式:
式中,为类间离散度矩阵,K为划分模式分类的总量,k为取值范围1至K的常数,/>为第k类划分模式对应各编码块特征向量的集合,/>为第k类划分模式对应各编码块特征向量的平均向量,/>为所有划分模式对应各编码块特征向量的平均向量,/>为第k类划分模式对应各编码块特征向量的协方差矩阵,/>为各类划分模式协方差矩阵的总和,W为投影矩阵,/>表示为求最大的W,/>为W的比率,T为矩阵转置操作,/>为/>中第i个编码块对应的特征向量。
2.如权利要求1所述的一种基于高效判别分析的帧内图像编码方法,其特征在于,所述S3步骤中,求解优化后的投影矩阵表示为如下公式:
式中,为拉格朗日乘子,/>为修正常量。
3.如权利要求1所述的一种基于高效判别分析的帧内图像编码方法,其特征在于,若为非奇异矩阵,则求解优化后的投影矩阵表示为如下公式:
式中,为拉格朗日乘子,/>为修正常量。
4.如权利要求1所述的一种基于高效判别分析的帧内图像编码方法,其特征在于,所述S6步骤中,划分模式判定的具体方式为:
根据补齐后的投影矩阵求解式获得投影矩阵W,并提取投影矩阵W中特征值最大的类别作为判定的划分模式。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至4中任一项所述编码方法的步骤。
6.一种处理数据的装置,其特征在于,包括:
储存器,其上存储有计算机程序;
处理器,用于执行所述储存器中的计算机程序,以实现权利要求1至4中任一项所述编码方法的步骤。
CN202310575966.7A 2023-05-22 2023-05-22 基于高效判别分析的帧内图像编码方法、装置及存储介质 Active CN116347104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310575966.7A CN116347104B (zh) 2023-05-22 2023-05-22 基于高效判别分析的帧内图像编码方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310575966.7A CN116347104B (zh) 2023-05-22 2023-05-22 基于高效判别分析的帧内图像编码方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN116347104A CN116347104A (zh) 2023-06-27
CN116347104B true CN116347104B (zh) 2023-10-17

Family

ID=86893259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310575966.7A Active CN116347104B (zh) 2023-05-22 2023-05-22 基于高效判别分析的帧内图像编码方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116347104B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021897A (zh) * 2006-12-27 2007-08-22 中山大学 一种基于块内相关性的二维线性鉴别分析人脸识别方法
JP2009140513A (ja) * 2002-07-16 2009-06-25 Nec Corp パターン特徴抽出方法及びその装置
CN103413551A (zh) * 2013-07-16 2013-11-27 清华大学 基于稀疏降维的说话人识别方法
CN105975965A (zh) * 2016-07-18 2016-09-28 江苏大学 一种人脸图像识别的双向鉴别特征提取方法
CN111783704A (zh) * 2020-07-07 2020-10-16 中电万维信息技术有限责任公司 一种基于粒子群优化径向基的人脸识别系统
CN113887661A (zh) * 2021-10-25 2022-01-04 济南大学 一种基于表示学习重构残差分析的图像集分类方法及系统
WO2022178978A1 (zh) * 2021-02-26 2022-09-01 西北工业大学 一种基于最大化比率和线性判别分析的数据降维方法
CN115955574A (zh) * 2023-03-10 2023-04-11 宁波康达凯能医疗科技有限公司 一种基于权重网络的帧内图像编码方法、装置及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4292837B2 (ja) * 2002-07-16 2009-07-08 日本電気株式会社 パターン特徴抽出方法及びその装置
EP1743281A2 (en) * 2004-04-14 2007-01-17 Imperial Innovations Limited Estimation of within-class matrix in image classification
US7561737B2 (en) * 2004-09-22 2009-07-14 Microsoft Corporation Mathematical expression recognition
US8478005B2 (en) * 2011-04-11 2013-07-02 King Fahd University Of Petroleum And Minerals Method of performing facial recognition using genetically modified fuzzy linear discriminant analysis

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009140513A (ja) * 2002-07-16 2009-06-25 Nec Corp パターン特徴抽出方法及びその装置
CN101021897A (zh) * 2006-12-27 2007-08-22 中山大学 一种基于块内相关性的二维线性鉴别分析人脸识别方法
CN103413551A (zh) * 2013-07-16 2013-11-27 清华大学 基于稀疏降维的说话人识别方法
CN105975965A (zh) * 2016-07-18 2016-09-28 江苏大学 一种人脸图像识别的双向鉴别特征提取方法
CN111783704A (zh) * 2020-07-07 2020-10-16 中电万维信息技术有限责任公司 一种基于粒子群优化径向基的人脸识别系统
WO2022178978A1 (zh) * 2021-02-26 2022-09-01 西北工业大学 一种基于最大化比率和线性判别分析的数据降维方法
CN113887661A (zh) * 2021-10-25 2022-01-04 济南大学 一种基于表示学习重构残差分析的图像集分类方法及系统
CN115955574A (zh) * 2023-03-10 2023-04-11 宁波康达凯能医疗科技有限公司 一种基于权重网络的帧内图像编码方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Makoto Sakai.feature transformation based on discriminant analysis preserving local structure for speech recognition.《2009 IEEE International Conference on Acoustics,speech and signal processing》.2009,全文. *
基于改进的双向二维线性判别分析的人脸识别;叶延亮;徐正光;;计算机工程与应用(第31期);全文 *

Also Published As

Publication number Publication date
CN116347104A (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN102970529B (zh) 一种基于对象的多视点视频分形编码压缩与解压缩方法
CN114079779B (zh) 图像处理方法、智能终端及存储介质
TW202147842A (zh) 點雲品質評估方法、編碼器、解碼器及儲存媒介
CN115118977B (zh) 针对360度视频的帧内预测编码方法、系统及介质
CN107944497A (zh) 基于主成分分析的图像块相似性度量方法
CN113824961B (zh) 一种可适用于vvc编码标准的帧间图像编码方法与系统
CN112001950A (zh) 一种基于目标检测与特征提取结合模型的多目标跟踪算法
CN111050183B (zh) 一种帧内预测方法、编码器及存储介质
CN115618051A (zh) 一种基于互联网的智慧校园监控视频存储方法
CN116347104B (zh) 基于高效判别分析的帧内图像编码方法、装置及存储介质
CN106791876A (zh) 一种基于3d‑hevc的深度图快速帧内预测方法
CN109741358A (zh) 基于自适应超图学习的超像素分割方法
CN115955574A (zh) 一种基于权重网络的帧内图像编码方法、装置及存储介质
CN111741313A (zh) 基于图像熵k均值聚类的3d-hevc快速cu分割方法
CN113453016B (zh) 一种用于图像流文件压缩的运动矢量自选择方法
CN111246218B (zh) 基于jnd模型的cu分割预测和模式决策纹理编码方法
CN104994365B (zh) 一种获取非关键帧深度图像的方法以及2d视频立体化方法
CN111178163A (zh) 基于立方体投影格式的立体全景图像显著区域预测方法
CN115190318B (zh) 一种基于内容相关性的视频编码方法与系统
Wang et al. Fast algorithm for intra prediction mode of 360 degree panoramic video based on VVC
CN116634150B (zh) 基于频繁模式分类的帧间图像编码方法、装置及存储介质
CN113489896B (zh) 一种能够鲁棒预测全局运动估计的视频稳像方法
Cai et al. Image-guided depth propagation using superpixel matching and adaptive autoregressive model
CN117177004B (zh) 内容帧的提取方法、装置、设备及存储介质
US20240193819A1 (en) Learning-based point cloud compression via tearing transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant