CN115147500B - 图像特征的传输方法、装置和系统 - Google Patents

图像特征的传输方法、装置和系统 Download PDF

Info

Publication number
CN115147500B
CN115147500B CN202110339533.2A CN202110339533A CN115147500B CN 115147500 B CN115147500 B CN 115147500B CN 202110339533 A CN202110339533 A CN 202110339533A CN 115147500 B CN115147500 B CN 115147500B
Authority
CN
China
Prior art keywords
matrix
feature
characterization
correlation
matrices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110339533.2A
Other languages
English (en)
Other versions
CN115147500A (zh
Inventor
王慧芬
张园
杨明川
贺征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202110339533.2A priority Critical patent/CN115147500B/zh
Priority to EP21934526.1A priority patent/EP4300425A4/en
Priority to US18/284,494 priority patent/US20240169713A1/en
Priority to JP2023560607A priority patent/JP2024511675A/ja
Priority to PCT/CN2021/127900 priority patent/WO2022205890A1/zh
Publication of CN115147500A publication Critical patent/CN115147500A/zh
Application granted granted Critical
Publication of CN115147500B publication Critical patent/CN115147500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开涉及一种图像特征的传输方法、装置和系统,涉及通信技术领域。该传输方法包括:利用机器学习模型,提取待处理图像对于各通道的特征矩阵;根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵;确定各表征矩阵与各被表征矩阵的对应关系;将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。

Description

图像特征的传输方法、装置和系统
技术领域
本公开涉及通信技术领域,特别涉及一种图像特征的传输方法、图像特征的传输装置、图像特征的传输系统和非易失性计算机可读存储介质。
背景技术
随着机器学习应用的增长,车联网、视频监控、智慧城市等领域已经采用了许多的智能平台。这些平台与大量的传感器之间产生了海量的数据通信。
在相关技术中,通过面向人类视觉的编码方法对通信中的数据进行编码。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:编码压缩率低,在通信数据量增长的情况下,难以保证通信质量。
鉴于此,本公开提出了一种图像特征的传输技术方案,能够提高编码压缩率,从而保证通信质量。
根据本公开的一些实施例,提供了一种图像特征的传输方法,包括:利用机器学习模型,提取待处理图像对于各通道的特征矩阵;根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵;确定各表征矩阵与各被表征矩阵的对应关系;将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
在一些实施例中,根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:根据各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度;在相关程度大于第一阈值的情况下,将相应的两个特征矩阵确定为一个关联矩阵对。
在一些实施例中,根据各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度包括:计算各特征矩阵之间的方差齐性概率,作为相关程度。
在一些实施例中,确定各表征矩阵与各被表征矩阵的对应关系包括:在同一个被表征矩阵具有多个表征矩阵的情况下,将多个表征矩阵中信息量最大的表征矩阵,确定为与该被表征矩阵具有对应关系的表征矩阵。
在一些实施例中,根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:在候选特征矩阵中,选取一个特征矩阵作为当前对象,候选特征矩阵为从未被选取为当前对象的特征矩阵;计算当前对象与所有候选特征矩阵的相关程度;选取下一个当前对象计算相关程度,直到仅剩一个候选特征矩阵。
在一些实施例中,根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:对各特征矩阵中的特征值进行归一化处理;计算归一化处理后的各特征矩阵的相关程度。
在一些实施例中,该传输方法还包括:计算各特征矩阵的信息量;判断各特征矩阵的信息量是否小于第二阈值;根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:计算信息量小于第二阈值的各特征矩阵之间的相关程度;根据相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
在一些实施例中,将具有对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端包括:对具有对应关系的各表征矩阵进行量化处理;对量化处理结果、对应关系、各被表征矩阵中的最大特征值和最小特征值进行编码后,传输给译码端。
在一些实施例中,该传输方法还包括:在译码端进行译码处理和反量化处理,获取对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值。
在一些实施例中,该传输方法还包括:在译码端根据表征矩阵中的最大特征值、最小特征值,以及与该表征矩阵具有对应关系的被表征矩阵中的最大特征值、最小特征值,获取该被表征矩阵。
根据本公开的另一些实施例,提供一种图像特征的传输装置,包括:提取单元,用于利用机器学习模型,提取待处理图像对于各通道的特征矩阵;确定单元,用于根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对,根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵,确定各表征矩阵与各被表征矩阵的对应关系;传输单元,用于将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
在一些实施例中,确定单元根据各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度,在相关程度大于第一阈值的情况下,将相应的两个特征矩阵确定为一个关联矩阵对。
在一些实施例中,确定单元计算各特征矩阵之间的方差齐性概率,作为相关程度。
在一些实施例中,确定单元在同一个被表征矩阵具有多个表征矩阵的情况下,将多个表征矩阵中信息量最大的表征矩阵,确定为与该被表征矩阵具有对应关系的表征矩阵。
在一些实施例中,确定单元在候选特征矩阵中,选取一个特征矩阵作为当前对象,候选特征矩阵为从未被选取为当前对象的特征矩阵,计算当前对象与所有候选特征矩阵的相关程度,选取下一个当前对象计算相关程度,直到仅剩一个候选特征矩阵。
在一些实施例中,确定单元对各特征矩阵中的特征值进行归一化处理,计算归一化处理后的各特征矩阵的相关程度。
在一些实施例中,确定单元计算各特征矩阵的信息量,判断各特征矩阵的信息量是否小于第二阈值,计算信息量小于第二阈值的各特征矩阵之间的相关程度,根据相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
在一些实施例中,传输单元对具有对应关系的各表征矩阵进行量化处理,对量化处理结果、对应关系、各被表征矩阵中的最大特征值和最小特征值进行编码后,传输给译码端。
在一些实施例中,该传输装置还包括:获取单元,用于在译码端进行译码处理和反量化处理,获取对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值。
在一些实施例中,获取单元在译码端根据表征矩阵中的最大特征值、最小特征值,以及与该表征矩阵具有对应关系的被表征矩阵中的最大特征值、最小特征值,获取该被表征矩阵。
根据本公开的又一些实施例,提供一种图像特征的传输系统,包括:编码端,用于利用机器学习模型,提取待处理图像对于各通道的特征矩阵,根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对,根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵,确定各表征矩阵与各被表征矩阵的对应关系,将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端;译码端,用于进行译码处理和反量化处理,获取对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值。
根据本公开的又一些实施例,提供一种图像特征的传输装置,包括:存储器;和耦接至存储器的处理器,处理器被配置为基于存储在存储器装置中的指令,执行上述任一个实施例中的图像特征的传输方法。
根据本公开的再一些实施例,提供一种非易失性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的图像特征的传输方法。
在上述实施例中,根据机器学习模型的各通道特征矩阵的相关性,消除待传输信息中的冗余信息,从而提高编码压缩率,保证通信质量。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开:
图1示出本公开的图像特征的传输方法的一些实施例的流程图;
图2示出本公开的图像特征的传输方法的另一些实施例的流程图;
图3示出本公开的图像特征的传输方法的又一些实施例的流程图;
图4示出本公开的图像特征的传输装置的一些实施例的框图;
图5示出本公开的图像特征的传输装置的另一些实施例的框图;
图6示出本公开的图像特征的传输装置的又一些实施例的框图;
图7示出本公开的图像特征的传输系统的一些实施例的框图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
如前所述,数据量的增长直接导致先前面向人类视觉的编码方法效率低下,在延时和规模上也难以满足现实。因此,需要面向智能机器的特征编码方法。
编码压缩的前提是冗余,编码压缩的目的是去除冗余,从而达到压缩的目的。因此,本公开在神经网络冗余特征的基础上,提高特征编码的压缩率。
例如,卷积神经网络中的通道有三种:最初输入的图片样本的通道取决于图片类型(如RGB红绿蓝通道);卷积操作完成后输出的out_channels,取决于卷积核的数量。此时的out_channels也会作为下一次卷积时的卷积核的in_channels;卷积核中的in_channels,就是上一次卷积的out_channels。
也就是说,同一通道特征是由上一层所有输出通道与具有相同层数的卷积核进行卷积操作后叠加的结果。神经网络会在训练过程中自主学习到各卷积核的权重值,通过不同的卷积核权重值提取关注信息。因此,卷积神经网络的中间层特征图必然存在大量非关注信息,也就是特征冗余信息。feature map(特征图)中的冗余是卷积神经网络的重要特点。
从仿生物学角度来说,相关大脑方面的研究表明生物神经元的信息编码通常是比较分散及稀疏的。通常情况下,大脑中在同一时间大概只有1%~4%的神经元处于活跃状态。使用线性修正以及正则化(regularization)可以对机器神经网络中神经元的活跃度(即输出为正值)进行调试。
相比之下,逻辑函数在输入为0时达到1/2,即已经是半饱和的稳定状态,不够符合实际生物学对模拟神经网络的期望。一般情况下,在一个使用修正线性单元(即线性整流)的神经网络中大概有50%的神经元处于激活态。
本公开从神经网络浅层中间层的通道特征分布特性出发,提出通过通道相关性,对具有相关性的通道进行线性缩放表征,减少编码数据,提高特征编码压缩率。
在一些实施例中,可以通过leneve方差齐性检测方法来分析通道相关性。方差齐性是t检验和方差分析的前提条件,F检验、Bartlett卡方检验对资料正态性要求苛刻,Leven检验可用于任意分布资料,是一种较为稳健的方差齐性检验方法。例如,可以通过下面的实施例实现。
图1示出本公开的图像特征的传输方法的一些实施例的流程图。
如图1所示,在步骤110中,利用机器学习模型,提取待处理图像对于各通道的特征矩阵。
在一些实施例中,利用Cascade R-CNN(Regions with Convolutional NeuralNetwork,区域卷积神经网络)ResNet101(Residual Network,残差网络)处理大小为4864×3648×3的RGB(Red Green Blue,红绿蓝)待处理图像。
例如,可以将Cascade R-CNN ResNet101的第一个池化层后的中间层特征包含的特征层输出作为待编码对象。中间层可以为一个64×200×272的层,64为通道数量(即包含的特征层数量),200×272为各特征层输出的特征矩阵的大小。也就是说,中间层输出的特征信息包含N个特征矩阵,对应N个通道。
在步骤120中,根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
在一些实施例中,对各特征矩阵中的特征值进行归一化处理;计算归一化处理后的各特征矩阵的相关程度。例如,对需要进行相关性分析的各通道的特征矩阵Fi分别进行最大值最小值归一化处理,得到各通道的归一化特征矩阵Fi′:
i=0,1,2,...,N-1(例如,N=46),Fi′(l,m)为矩阵Fi′的l行m列元素,Fi(l,m)为矩阵Fi的l行m列元素,Fimin为由Fi中最小元素,Fimax为由Fi中最大元素。
在一些实施例中,计算各特征矩阵的信息量;判断各特征矩阵的信息量是否小于第二阈值;计算信息量小于第二阈值的各特征矩阵之间的相关程度;根据相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
例如,计算归一化后的特征矩阵中所有特征值的均值作为其信息量,在信息量小于第二阈值(可以是小于1的正数,如0.4)的情况下,计算相关程度;在信息量大于或等于第二阈值(可以是小于1的正数,如0.4)的情况下,说明该特征矩阵信息量较大,不做压缩处理,量化、编码后传输给译码端。
在一些实施例中,根据各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度。例如,计算各特征矩阵之间的方差齐性概率,作为相关程度。
在一些实施例中,在候选特征矩阵中,选取一个特征矩阵作为当前对象,候选特征矩阵为从未被选取为当前对象的特征矩阵;计算当前对象与所有候选特征矩阵的相关程度;选取下一个当前对象计算相关程度,直到仅剩一个候选特征矩阵。
例如,i为当前序号,初始值设置为0。计算归一化后的特征矩阵Fi′和各剩余特征矩阵Fk′(k从未被设置为当前序号)之间的方差齐性概率Pik,k=i+1,i+2,...,N-1。可以利用leneve方差齐性检测方法获取Pik
在一些实施例中,在相关程度大于第一阈值的情况下,将相应的两个特征矩阵确定为一个关联矩阵对。
例如,将Pik大于第一阈值(是小于1的正数,如0.05)的Fk′与Fi′绑定为矩阵对,将其通道序号绑定后记录为:(i,k1)、(i,k2)、...、(i,km)。m为通道序号大于i的通道中与通道i满足Pik大于第一阈值条件的通道数量。将当前序号i加1,重复上述步骤直到号i大于N-1。
例如,可以的到如表1所示的各矩阵对:
表1
在步骤130中,根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵。
在一些实施例中,获取矩阵对中归一化前的特征值之和较大的通道序号,作为表征通道(表征矩阵),获取归一化前的特征值之和较小的通道序号作为相应的被表征通道(被表征矩阵)。
例如,以矩阵对中被表征通道的通道序号作为键值,以表征通道的通道序号为数值,将矩阵对存储为键值对;利用键值,将同一被表征通道对应的多个表征通道进行聚集,获取表2中的表征关系字典:
表2
在步骤140中,确定各表征矩阵与各被表征矩阵的对应关系。
在一些实施例中,在同一个被表征矩阵具有多个表征矩阵的情况下,将多个表征矩阵中信息量最大的表征矩阵,确定为与该被表征矩阵具有对应关系的表征矩阵。
例如,表2中的矩阵对6、7、8的被表征矩阵均对应多个表征矩阵。对同一被表征通道Ck对应的多个表征通道Ckn对应的特征矩阵Fkn,分别求归一化前的特征值之和,将和最大的表征通道作为与Ck具有对应关系的表征通道CV
{Ck:CV}
可以将对应关系记录为映射关系列表:
表3
通道对序号 被表征通道序号 表征通道序号
1 33 0
2 2 44
3 6 40
4 10 57
5 45 44
6 16 52
7 24 1
8 58 57
9 59 1
10 28 26
11 61 26
12 30 52
在步骤150中,将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
在一些实施例中,对具有对应关系的各表征矩阵进行量化处理;对量化处理结果、对应关系、各被表征矩阵中的最大特征值和最小特征值进行编码后,传输给译码端。
例如,对表3中的7个表征通道对应的表征矩阵Fj量化为Fj’j为0、1、26、40、44、52、57。量化可以为均匀量化(Uniform quantization)等量化方法。可以对线性缩放信息和各Fj’进行编码,形成二进制流。线性缩放信息包括映射关系列表、各被表征矩阵的最大值、最小值等。
在一些实施例中,译码端可以根据图2中的实施例实现本公开的技术方案。
图2示出本公开的图像特征的传输方法的另一些实施例的流程图。
如图2所示,在步骤210中,在译码端进行译码处理和反量化处理,获取对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值。
在步骤220中,在译码端根据表征矩阵中的最大特征值、最小特征值,以及与该表征矩阵具有对应关系的被表征矩阵中的最大特征值、最小特征值,获取该被表征矩阵。
在一些实施例中,对二进制流进行反编码,得到线性缩放信息和各Fj’;对Fj’进行反量化,得到表征通道的特征矩阵Fj;利用表征通道的特征矩阵Fj,对相应的被表征通道的特征矩阵FV进行线性表征:
max()、min()表示提取矩阵各元素中的最大值和最小值。求解上述公式得到被表征矩阵FV
上述实施例中,从卷积神经网络中间层通道特征分布特性出发,通过leneve方差齐性检测方法分析通道相关性,对具有相关性的通道进行线性缩放表征。从而,减少编码数据,提高特征编码压缩率。
图3示出本公开的图像特征的传输方法的又一些实施例的流程图。
如图3所示,在步骤310中,对需要进行相关性分析的各通道的特征矩阵Fi分别进行最大值最小值归一化处理,得到各通道的归一化特征矩阵Fi′:
i=0,1,2,...,N-1(例如,N=46),Fi′(l,m)为矩阵Fi′的l行m列元素,Fi(l,m)为矩阵Fi的l行m列元素,Fimin为由Fi中最小元素,Fimax为由Fi中最大元素。
在步骤320中,将通道索引i作为当前序号,初始值设置为0。
在步骤330中,判断通道i的特征矩阵中特征值的均值是否大于阈值。在不大于的情况下,执行步骤340;在大于的情况下,执行步骤360。
在步骤340中,计算归一化后的特征矩阵Fi′和各剩余特征矩阵Fk′(k从未被设置为当前序号)之间的方差齐性概率Pik,k=i+1,i+2,...,N-1。
在步骤350中,记录与通道i的方差齐性leneve概率Pik大于阈值的通道对:(i,k1)、(i,k2)、…、(i,km)。m为通道序号大于i的通道中与通道i满足Pik大于第一阈值条件的通道数量。
在步骤360中,将作为当前序号的通道索引i加1。
在步骤370中,判断i是否小于N-1。在小于的情况下,返回步骤330,重复步骤330~360直到i大于N-1;在不小于的情况下,执行步骤380。
在步骤380中,获取矩阵对中归一化前的特征值之和较大的通道序号,作为表征通道(表征矩阵),获取归一化前的特征值之和较小的通道序号作为相应的被表征通道(被表征矩阵)。
在步骤390中,以矩阵对中被表征通道Ck的通道序号作为键值,以表征通道Ckn的通道序号为数值,将矩阵对存储为键值对;利用键值,将同一被表征通道对应的多个表征通道进行聚集,获取表征关系字典:
{ck:∪ckn}
n为与通道k对应的表征通道个数。
在步骤395中,对同一被表征通道Ck对应的多个表征通道Ckn对应的特征矩阵Fkn,分别求归一化前的特征值之和;将和最大的表征通道作为与Ck具有对应关系的唯一表征通道CV
{Ck:CV}
可以将对应关系记录为映射关系列表。
图4示出本公开的图像特征的传输装置的一些实施例的框图。
如图4所示,图像特征的传输装置4包括提取单元41、确定单元42、传输单元43。
提取单元41利用机器学习模型,提取待处理图像对于各通道的特征矩阵。
确定单元42根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵,确定各表征矩阵与各被表征矩阵的对应关系。
在一些实施例中,确定单元42根据各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度;在相关程度大于第一阈值的情况下,将相应的两个特征矩阵确定为一个关联矩阵对。
在一些实施例中,确定单元42计算各特征矩阵之间的方差齐性概率,作为相关程度。
在一些实施例中,确定单元42在同一个被表征矩阵具有多个表征矩阵的情况下,将多个表征矩阵中信息量最大的表征矩阵,确定为与该被表征矩阵具有对应关系的表征矩阵。
在一些实施例中,确定单元42在候选特征矩阵中,选取一个特征矩阵作为当前对象,候选特征矩阵为从未被选取为当前对象的特征矩阵。确定单元42计算当前对象与所有候选特征矩阵的相关程度,选取下一个当前对象计算相关程度,直到仅剩一个候选特征矩阵。
在一些实施例中,确定单元42对各特征矩阵中的特征值进行归一化处理,计算归一化处理后的各特征矩阵的相关程度。
在一些实施例中,确定单元42计算各特征矩阵的信息量,判断各特征矩阵的信息量是否小于第二阈值;计算信息量小于第二阈值的各特征矩阵之间的相关程度;根据相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
传输单元43将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
在一些实施例中,传输单元43对具有对应关系的各表征矩阵进行量化处理,对量化处理结果、对应关系、各被表征矩阵中的最大特征值和最小特征值进行编码后,传输给译码端。
在一些实施例中,传输装置4还包括:获取单元44,用于在译码端进行译码处理和反量化处理,获取对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值。
在一些实施例中,获取单元44在译码端根据表征矩阵中的最大特征值、最小特征值,以及与该表征矩阵具有对应关系的被表征矩阵中的最大特征值、最小特征值,获取该被表征矩阵。
图5示出本公开的图像特征的传输装置的另一些实施例的框图。
如图5所示,该实施例的图像特征的传输装置5包括:存储器51以及耦接至该存储器51的处理器52,处理器52被配置为基于存储在存储器51中的指令,执行本公开中任意一个实施例中的图像特征的传输方法。
其中,存储器51例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序Boot Loader、数据库以及其他程序等。
图6示出本公开的图像特征的传输装置的又一些实施例的框图。
如图6所示,该实施例的图像特征的传输装置6包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行前述任意一个实施例中的图像特征的传输方法。
存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序Boot Loader以及其他程序等。
图像特征的传输装置6还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630、640、650以及存储器610和处理器620之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏、麦克、音箱等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为SD卡、U盘等外置存储设备提供连接接口。
图7示出本公开的图像特征的传输系统的一些实施例的框图。
如图7所示,图像特征的传输系统7包括编码端71、译码端72。
编码端71利用机器学习模型,提取待处理图像对于各通道的特征矩阵;根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵,确定各表征矩阵与各被表征矩阵的对应关系;将各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
译码端72进行译码处理和反量化处理,获取对应关系的各表征矩阵、对应关系、各被表征矩阵中的最大特征值和最小特征值。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质包括但不限于磁盘存储器、CD-ROM、光学存储器等上实施的计算机程序产品的形式。
至此,已经详细描述了根据本公开的图像特征的传输方法、图像特征的传输装置、图像特征的传输系统和非易失性计算机可读存储介质。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。

Claims (23)

1.一种图像特征的传输方法,包括:
利用机器学习模型,提取待处理图像对于各通道的特征矩阵;
根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对;
根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵;
确定各表征矩阵与各被表征矩阵的对应关系;
将各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
2.根据权利要求1所述的传输方法,其中,所述根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:
根据所述各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度;
在所述相关程度大于第一阈值的情况下,将相应的两个特征矩阵确定为一个关联矩阵对。
3.根据权利要求2所述的传输方法,其中,所述根据所述各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度包括:
计算各特征矩阵之间的方差齐性概率,作为所述相关程度。
4.根据权利要求1所述的传输方法,其中,所述确定各表征矩阵与各被表征矩阵的对应关系包括:
在同一个被表征矩阵具有多个表征矩阵的情况下,将所述多个表征矩阵中信息量最大的表征矩阵,确定为与该被表征矩阵具有对应关系的表征矩阵。
5.根据权利要求1所述的传输方法,其中,所述根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:
在候选特征矩阵中,选取一个特征矩阵作为当前对象,所述候选特征矩阵为从未被选取为当前对象的特征矩阵;
计算所述当前对象与所有候选特征矩阵的相关程度;
选取下一个当前对象计算相关程度,直到仅剩一个候选特征矩阵。
6.根据权利要求1所述的传输方法,其中,所述根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:
对所述各特征矩阵中的特征值进行归一化处理;
计算归一化处理后的各特征矩阵的相关程度。
7.根据权利要求1所述的传输方法,还包括:
计算所述各特征矩阵的信息量;
判断所述各特征矩阵的信息量是否小于第二阈值;
其中,所述根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对包括:
计算信息量小于第二阈值的各特征矩阵之间的相关程度;
根据所述相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
8.根据权利要求1所述的传输方法,其中,所述将具有所述对应关系的各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端包括:
对具有所述对应关系的各表征矩阵进行量化处理;
对量化处理结果、所述对应关系、各被表征矩阵中的最大特征值和最小特征值进行编码后,传输给译码端。
9.根据权利要求1-8任一项所述的传输方法,还包括:
在所述译码端进行译码处理和反量化处理,获取所述对应关系的各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值。
10.根据权利要求9所述的传输方法,还包括:
在所述译码端根据表征矩阵中的最大特征值、最小特征值,以及与该表征矩阵具有对应关系的被表征矩阵中的最大特征值、最小特征值,获取该被表征矩阵。
11.一种图像特征的传输装置,包括:
提取单元,用于利用机器学习模型,提取待处理图像对于各通道的特征矩阵;
确定单元,用于根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对,根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵,确定各表征矩阵与各被表征矩阵的对应关系;
传输单元,用于将各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端。
12.根据权利要求11所述的传输装置,其中,
所述确定单元根据所述各特征矩阵中特征值的分布情况,计算各特征矩阵之间的相关程度,在所述相关程度大于第一阈值的情况下,将相应的两个特征矩阵确定为一个关联矩阵对。
13.根据权利要求12所述的传输装置,其中,
所述确定单元计算各特征矩阵之间的方差齐性概率,作为所述相关程度。
14.根据权利要求11所述的传输装置,其中,
所述确定单元在同一个被表征矩阵具有多个表征矩阵的情况下,将所述多个表征矩阵中信息量最大的表征矩阵,确定为与该被表征矩阵具有对应关系的表征矩阵。
15.根据权利要求11所述的传输装置,其中,
所述确定单元在候选特征矩阵中,选取一个特征矩阵作为当前对象,所述候选特征矩阵为从未被选取为当前对象的特征矩阵,计算所述当前对象与所有候选特征矩阵的相关程度,选取下一个当前对象计算相关程度,直到仅剩一个候选特征矩阵。
16.根据权利要求11所述的传输装置,其中,
所述确定单元对所述各特征矩阵中的特征值进行归一化处理,计算归一化处理后的各特征矩阵的相关程度。
17.根据权利要求11所述的传输装置,其中,
所述确定单元计算所述各特征矩阵的信息量,判断所述各特征矩阵的信息量是否小于第二阈值,计算信息量小于第二阈值的各特征矩阵之间的相关程度,根据所述相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对。
18.根据权利要求11所述的传输装置,其中,
所述传输单元对具有所述对应关系的各表征矩阵进行量化处理,对量化处理结果、所述对应关系、各被表征矩阵中的最大特征值和最小特征值进行编码后,传输给译码端。
19.根据权利要求11-18任一项所述的传输装置,还包括:
获取单元,用于在所述译码端进行译码处理和反量化处理,获取所述对应关系的各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值。
20.根据权利要求19所述的传输装置,其中,
所述获取单元在所述译码端根据表征矩阵中的最大特征值、最小特征值,以及与该表征矩阵具有对应关系的被表征矩阵中的最大特征值、最小特征值,获取该被表征矩阵。
21.一种图像特征的传输系统,包括:
编码端,用于利用机器学习模型,提取待处理图像对于各通道的特征矩阵,根据各特征矩阵之间的相关程度与第一阈值的比较结果,确定一个或多个关联矩阵对,根据信息量大小,在各关联矩阵对的两个特征矩阵中确定表征矩阵和被表征矩阵,确定各表征矩阵与各被表征矩阵的对应关系,将各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值进行量化处理和编码处理后,传输给译码端;
译码端,用于进行译码处理和反量化处理,获取所述对应关系的各表征矩阵、所述对应关系、各被表征矩阵中的最大特征值和最小特征值。
22.一种图像特征的传输装置,包括:
存储器;和
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求1-10任一项所述的图像特征的传输方法。
23.一种非易失性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-10任一项所述的图像特征的传输方法。
CN202110339533.2A 2021-03-30 2021-03-30 图像特征的传输方法、装置和系统 Active CN115147500B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202110339533.2A CN115147500B (zh) 2021-03-30 2021-03-30 图像特征的传输方法、装置和系统
EP21934526.1A EP4300425A4 (en) 2021-03-30 2021-11-01 METHOD, DEVICE AND SYSTEM FOR TRANSMITTING IMAGE FEATURES
US18/284,494 US20240169713A1 (en) 2021-03-30 2021-11-01 Image feature transmission method, device and system
JP2023560607A JP2024511675A (ja) 2021-03-30 2021-11-01 画像特徴を送信する方法、装置、及びシステム
PCT/CN2021/127900 WO2022205890A1 (zh) 2021-03-30 2021-11-01 图像特征的传输方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110339533.2A CN115147500B (zh) 2021-03-30 2021-03-30 图像特征的传输方法、装置和系统

Publications (2)

Publication Number Publication Date
CN115147500A CN115147500A (zh) 2022-10-04
CN115147500B true CN115147500B (zh) 2024-06-28

Family

ID=83403904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110339533.2A Active CN115147500B (zh) 2021-03-30 2021-03-30 图像特征的传输方法、装置和系统

Country Status (5)

Country Link
US (1) US20240169713A1 (zh)
EP (1) EP4300425A4 (zh)
JP (1) JP2024511675A (zh)
CN (1) CN115147500B (zh)
WO (1) WO2022205890A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507153A (zh) * 2017-09-21 2017-12-22 百度在线网络技术(北京)有限公司 图像去噪方法和装置
CN110348462A (zh) * 2019-07-09 2019-10-18 北京金山数字娱乐科技有限公司 一种图像特征确定、视觉问答方法、装置、设备及介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170076754A1 (en) * 2015-09-11 2017-03-16 Evergig Music S.A.S.U. Systems and methods for matching two or more digital multimedia files
US10218976B2 (en) * 2016-03-02 2019-02-26 MatrixView, Inc. Quantization matrices for compression of video
US10839543B2 (en) * 2019-02-26 2020-11-17 Baidu Usa Llc Systems and methods for depth estimation using convolutional spatial propagation networks
CN109948700B (zh) * 2019-03-19 2020-07-24 北京字节跳动网络技术有限公司 用于生成特征图的方法和装置
CN112307243B (zh) * 2019-07-23 2023-11-03 北京京东振世信息技术有限公司 用于检索图像的方法和装置
CN111444957B (zh) * 2020-03-25 2023-11-07 腾讯科技(深圳)有限公司 图像数据处理方法、装置、计算机设备和存储介质
CN111787323B (zh) * 2020-05-23 2021-09-03 清华大学 一种基于对抗学习的可变比特率生成式压缩方法
CN111950699A (zh) * 2020-07-03 2020-11-17 清华大学深圳国际研究生院 一种基于特征空间相关性的神经网络正则化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507153A (zh) * 2017-09-21 2017-12-22 百度在线网络技术(北京)有限公司 图像去噪方法和装置
CN110348462A (zh) * 2019-07-09 2019-10-18 北京金山数字娱乐科技有限公司 一种图像特征确定、视觉问答方法、装置、设备及介质

Also Published As

Publication number Publication date
EP4300425A1 (en) 2024-01-03
US20240169713A1 (en) 2024-05-23
CN115147500A (zh) 2022-10-04
EP4300425A4 (en) 2024-08-07
WO2022205890A1 (zh) 2022-10-06
JP2024511675A (ja) 2024-03-14

Similar Documents

Publication Publication Date Title
Manap et al. Non-distortion-specific no-reference image quality assessment: A survey
CN111641832A (zh) 编码方法、解码方法、装置、电子设备及存储介质
CN110870310A (zh) 图像编码方法和装置
WO2021135715A1 (zh) 一种图像压缩方法及装置
WO2022028197A1 (zh) 一种图像处理方法及其设备
CN112966626A (zh) 人脸识别方法和装置
CN112016450A (zh) 机器学习模型的训练方法、装置和电子设备
CN114077885A (zh) 基于张量分解的模型压缩方法、装置和服务器
CN116095321A (zh) 显著性区域图像编解码方法、系统、设备及存储介质
JP2024511103A (ja) 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN114677535A (zh) 域适应图像分类网络的训练方法、图像分类方法及装置
CN113256744B (zh) 一种图像编码、解码方法及系统
CN115147500B (zh) 图像特征的传输方法、装置和系统
CN116485743A (zh) 一种无参考图像质量评价方法、系统、电子设备及存储介质
CN115457638A (zh) 模型训练方法、数据检索方法、装置、设备及存储介质
CN113554719B (zh) 一种图像编码方法、解码方法、存储介质及终端设备
CN116778539A (zh) 基于注意力机制的人脸图像超分辨率网络模型及处理方法
CN113313056A (zh) 基于紧致3d卷积的唇语识别方法、系统、设备及存储介质
WO2022205893A1 (zh) 图像特征的传输方法、装置和系统
Xu et al. Rank learning on training set selection and image quality assessment
CN107240138B (zh) 基于样本二叉树字典学习的全色遥感图像压缩方法
CN113096202B (zh) 图像压缩方法及装置、电子设备及计算机可读存储介质
CN117974833B (zh) 图像生成方法、装置、设备、可读存储介质及程序产品
CN112149470B (zh) 一种行人重识别方法和装置
CN116612122B (zh) 图像显著性区域的检测方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant