CN113747155A - 特征量化方法和装置、编码器、通信系统 - Google Patents

特征量化方法和装置、编码器、通信系统 Download PDF

Info

Publication number
CN113747155A
CN113747155A CN202111037377.0A CN202111037377A CN113747155A CN 113747155 A CN113747155 A CN 113747155A CN 202111037377 A CN202111037377 A CN 202111037377A CN 113747155 A CN113747155 A CN 113747155A
Authority
CN
China
Prior art keywords
feature
characteristic
floating
floating point
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111037377.0A
Other languages
English (en)
Other versions
CN113747155B (zh
Inventor
王立传
王慧芬
王泽琨
王翰铭
贺征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202111037377.0A priority Critical patent/CN113747155B/zh
Publication of CN113747155A publication Critical patent/CN113747155A/zh
Application granted granted Critical
Publication of CN113747155B publication Critical patent/CN113747155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供一种特征量化方法和装置、编码器、通信系统。特征量化方法包括:从特征提取网络模型获取第一浮点特征,其中特征提取网络模型从输入图像中提取出第一浮点特征;将第一浮点特征进行特征量化处理,以得到具有预设比特长度的第二特征;将第二特征发送给编码装置,以便编码装置对第二特征进行编码以得到比特流。

Description

特征量化方法和装置、编码器、通信系统
技术领域
本公开涉及编码领域,特别涉及一种特征量化方法和装置、编码器、通信系统。
背景技术
传统的视频压缩编码面向人类视觉,多用于娱乐用途,注重信号保真度、高帧率等,无法匹配面向智能分析任务的机器视觉对于高准确性、低延迟和抽象语义的应用需求。面向人类视觉和面向机器视觉的视频压缩编码在应用场景、评估机制、信息处理和信息使用上存在较大差异。2019年7月,瑞典哥德堡第128次MPEG会议期间成立了VCM(VideoCoding for Machines,机器视觉编码)标准组,旨在研究适合机器视觉和人机混合视觉场景以智能应用为目标的压缩编码技术。
例如,典型应用场景为:利用特征抽取网络提取输入图像的特征后,需要对特征进行压缩/解压缩处理,并将处理后的特征输入任务网络进行处理,以得到输出结果。
发明内容
发明人注意到,在相关技术中,为了降低特征数据的传输量,需要对特征抽取网络所抽取的特征进行压缩/解压缩,但该操作容易导致后续任务网络的性能损失。
为此,本公开提供一种特征量化方案,能够有效减小性能损失。
根据本公开实施例的第一方面,提供一种特征量化方法,由特征量化装置执行,包括:从特征提取网络模型获取第一浮点特征,其中特征提取网络模型从输入图像中提取出第一浮点特征;将第一浮点特征进行特征量化处理,以得到具有预设比特长度的第二特征;将第二特征发送给编码装置,以便编码装置对第二特征进行编码以得到比特流。
在一些实施例中,将第一浮点特征进行特征量化处理包括:将第一浮点特征转换为整形特征BM;根据整形特征BM计算对应的直方图H,其中Hi是整形特征BM的第i个通道BM,i的直方图,i为通道号,1≤i≤c,c为通道总数;根据直方图H倒求累计直方图P,其中Pi,j=Pi,i+1+Hi,j,Hi,j是直方图H的第i个通道中的第j个子项,Pi,j是累计直方图P的第i个通道中的第j个子项;根据累计直方图P进行截断处理,其中若Pi,j大于预设门限,则更新第一浮点特征在第i个通道中的最大值fmax,i;根据预设参数和第一浮点特征在第i个通道中的最大值fmax,i对第一浮点特征在第i个通道中的特征值F32_1,i进行量化处理,以得到第二特征。
在一些实施例中,利用公式
Figure BDA0003247752410000021
将第一浮点特征F32_1转换为整形特征BM,其中A为预设参数,int为整形转换函数,round为四舍五入函数,fmax_1为第一浮点特征的最大值。
在一些实施例中,利用公式
Figure BDA0003247752410000022
更新第一浮点特征在第i个通道中的最大值fmax,i,其中B为预设参数,float为浮点数转换函数。
在一些实施例中,利用公式
Figure BDA0003247752410000023
计算第二特征在第i个通道中的特征值F8_1,i,其中C为预设参数,max为取最大值函数,F32_1,i为第一浮点特征在第i个通道中的特征值。
在一些实施例中,将所述第一浮点特征进行特征量化处理包括:将所述第一浮点特征转换为整形特征BM;根据所述整形特征BM计算对应的直方图H;根据所述直方图H倒求累计直方图P,其中Pj=Pj+1+Hj,Hj是直方图H的第j个子项,Pj是累计直方图P的第j个子项;根据累计直方图P进行截断处理,其中若Pj大于预设门限,则更新第一浮点特征的最大值fmax;根据预设参数和第一浮点特征的最大值fmax对所述第一浮点特征的特征值F32_1进行量化处理,以得到所述第二特征。
在一些实施例中,利用公式
Figure BDA0003247752410000031
将所述第一浮点特征F32_1转换为整形特征BM,其中A为预设参数,int为整形转换函数,round为四舍五入函数,fmax_1为第一浮点特征的最大值。
在一些实施例中,利用公式
Figure BDA0003247752410000032
更新第一浮点特征的最大值fmax,其中B为预设参数,float为浮点数转换函数。
在一些实施例中,利用公式
Figure BDA0003247752410000033
计算所述第二特征的特征值F8_1,其中C为预设参数,max为取最大值函数,F32_1为第一浮点特征的特征值。
在一些实施例中,参数A为1023,参数B为1023,参数C为255。
在一些实施例中,预设比特长度为8。
根据本公开实施例的第二方面,提供一种特征量化装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。
根据本公开实施例的第三方面,提供一种编码器,包括:如上述任一实施例涉及的特征量化装置;特征提取网络模型,被配置为从输入图像中提取出第一浮点特征,并将第一浮点特征发送给特征量化装置;编码装置,被配置为对特征量化装置发送的第二特征进行编码以得到比特流。
根据本公开实施例的第四方面,提供一种通信系统,包括:如上述任一实施例涉及的编码器;解码器,包括:解码装置,被配置为将编码器发送的比特流进行解码以得到具有预设比特长度的第三特征;特征反量化装置,被配置为对第三特征进行特征反量化处理,以获得第二浮点特征;任务网络模型模块,被配置为对第二浮点特征进行处理,以得到解码结果。
在一些实施例中,特征反量化装置利用公式
Figure BDA0003247752410000041
计算第二浮点特征在第i个通道的特征值F32_2,i,其中F8_2,i为第三特征在第i个通道的特征值,fmax,i为第三特征在第i个通道中的最大值,D为预设参数,i为通道号,1≤i≤c,c为通道总数。
在一些实施例中,特征反量化装置利用公式
Figure BDA0003247752410000042
计算第二浮点特征的特征值F32_2,其中F8_2为第三特征的特征值,fmax为第三特征的最大值,D为预设参数。
在一些实施例中,参数D为255。
根据本公开实施例的第五方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上述任一实施例涉及的方法。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开一个实施例的特征量化方法的流程示意图;
图2为本公开另一个实施例的特征量化方法的流程示意图;
图3为本公开又一个实施例的特征量化方法的流程示意图;
图4为本公开一个实施例的特征量化装置的结构示意图;
图5为本公开一个实施例的编码器的结构示意图;
图6为本公开一个实施例的通信系统的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为本公开一个实施例的特征量化方法的流程示意图。在一些实施例中,下列的特征量化方法由特征量化装置执行。
在步骤101,从特征提取网络模型获取第一浮点特征。
特征提取网络模型从输入图像中提取出第一浮点特征。
在步骤102,将第一浮点特征进行特征量化处理,以得到具有预设比特长度的第二特征。
例如,预设比特长度为8。
在一些实施例中,将第一浮点特征进行特征量化处理如图2所示。
在步骤201,将第一浮点特征F32_1转换为整形特征BM
例如,将第一浮点特征F32_1定标,并映射到M个区间bin以得到整形特征BM。例如M为1024。
在一些实施例中,利用公式(1)将第一浮点特征F32_1转换为整形特征BM
Figure BDA0003247752410000061
其中,A为预设参数,例如A为1023。fmax_1为第一浮点特征的最大值,即fmax_1=max(F32_1)。int为整形转换函数,round为四舍五入函数。
在步骤202,根据整形特征BM计算对应的直方图H。
在一些实施例中,利用公式(2)计算直方图H。
Hi=hist(BM,i) (2)
其中,Hi是整形特征BM的第i个通道BM,i的直方图,i为通道号,1≤i≤c,c为通道总数。
在步骤203,根据直方图H倒求累计直方图P。
在一些实施例中,利用公式(3)计算累计直方图P。
Pi,j=Pi,j+1+Hi,j (3)
其中,Hi,j是直方图H的第i个通道中的第j个子项,Pi,j是累计直方图P的第i个通道中的第j个子项。
在步骤204,根据累计直方图P进行截断处理。
若Pi,j大于预设门限,则更新第一浮点特征在第i个通道中的最大值fmax,i
在一些实施例中,利用公式(4)更新第一浮点特征在第i个通道中的最大值fmax,i
Figure BDA0003247752410000071
其中,B为预设参数,例如B为1023。float为浮点数转换函数。
在步骤205,根据预设参数和第一浮点特征在第i个通道中的最大值fmax,i对第一浮点特征在第i个通道中的特征值F32_1,i进行量化处理,以得到第二特征。
在一些实施例中,利用公式(5)计算第二特征在第i个通道中的特征值F8_1,i
Figure BDA0003247752410000072
其中,C为预设参数,例如C为255。max为取最大值函数,F32_1,i为第一浮点特征在第i个通道中的特征值。
在另一些实施例中,将第一浮点特征进行特征量化处理如图3所示。
在步骤301,将第一浮点特征转换为整形特征BM
在一些实施例中,利用公式(6)将第一浮点特征F32_1转换为整形特征BM
Figure BDA0003247752410000073
其中,A为预设参数,例如A为1023。int为整形转换函数,round为四舍五入函数,fmax_1为第一浮点特征的最大值。
在步骤302,根据整形特征BM计算对应的直方图H。
在一些实施例中,利用公式(7)计算直方图H。
H=hist(BM) (7)
在步骤303,根据直方图H倒求累计直方图P。
在一些实施例中,利用公式(7)计算累计直方图P。
Pj=Pj+1+Hj (8)
Hj是直方图H的第j个子项,Pj是累计直方图P的第j个子项。
在步骤304,根据累计直方图P进行截断处理。
若Pj大于预设门限,则更新第一浮点特征的最大值fmax
在一些实施例中,利用公式(9)更新第一浮点特征的最大值fmax,i
Figure BDA0003247752410000081
其中,B为预设参数,例如B为1023。float为浮点数转换函数。
在步骤305,根据预设参数和第一浮点特征的最大值fmax对所述第一浮点特征的特征值F32_1进行量化处理,以得到所述第二特征。
在一些实施例中,利用公式(10)计算第二特征的特征值F8_1
Figure BDA0003247752410000082
其中,C为预设参数,,例如C为255。max为取最大值函数,F32_1为第一浮点特征的特征值。
返回图1。在步骤103,将第二特征发送给编码装置,以便编码装置对第二特征进行编码以得到比特流。
这里需要说明的是,现有的量化方案未考虑异常的特征响应值对精度的影响。若采取完全均匀量化的方式,异常的特征响应值会导致数据范围过大,量化精度差,从而会对后续处理的性能影响较大。此外,现有的量化方案未考虑特征数据的分布范围,假设数据分布从负无穷到正无穷,若采用完全均匀量化的方式,则会造成没有整数的特征值反量化回去对应浮点的特征值0.0,对后续处理的性能影响较大。
为解决这一问题,本公开对特征提取网络提取的特征进行无符号量化,确保整数特征值0对应浮点特征值0.0,消除了对后续处理的性能影响。此外分通道截断特征的最大相应值,使得每个通道的有效数据范围尽可能小,使得量化精度误差最小。此外仅通过直方图和阈值进行简单计算,更适合编解码场景。
图4为本公开一个实施例的特征量化装置的结构示意图。如图4所示,特征量化装置包括存储器41和处理器42。
存储器41用于存储指令,处理器42耦合到存储器41,处理器42被配置为基于存储器存储的指令执行实现如图1-图3中任一实施例涉及的方法。
如图4所示,该特征量化装置还包括通信接口43,用于与其它设备进行信息交互。同时,该特征量化装置还包括总线44,处理器42、通信接口43、以及存储器41通过总线44完成相互间的通信。
存储器41可以包含高速RAM存储器,也可还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。存储器41也可以是存储器阵列。存储器41还可能被分块,并且块可按一定的规则组合成虚拟卷。
此外处理器42可以是一个中央处理器CPU,或者可以是专用集成电路ASIC,或是被配置成实施本公开实施例的一个或多个集成电路。
本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图1-图3中任一实施例涉及的方法。
图5为本公开一个实施例的编码器的结构示意图。如图5所示,编码器包括特征提取网络模型51、特征量化装置52和编码装置53。特征量化装置52为图4中任一实施例涉及的特征量化装置。
特征提取网络模型51被配置为从输入图像中提取出第一浮点特征,并将第一浮点特征发送给特征量化装置52。
编码装置53被配置为对特征量化装置52发送的第二特征进行编码以得到比特流,以便将比特流发送给解码器。
图6为本公开一个实施例的通信系统的结构示意图。如图6所示,通信系统包括编码器61和解码器62。编码器61中包括图5中所示的特征提取网络模型51、特征量化装置52和编码装置53。解码器62包括解码装置621、特征反量化装置622和任务网络模型模块623。
解码装置621被配置为将编码器发送的比特流进行解码以得到具有预设比特长度的第三特征F8_2
在一些实施例中,预设比特长度为8。
特征反量化装置622被配置为对第三特征F8_2进行特征反量化处理,以获得第二浮点特征F32_2
在一些实施例中,特征反量化装置622利用公式(11)计算第二浮点特征在第i个通道的特征值F32_2,i
Figure BDA0003247752410000101
其中,F8_2,i为第三特征在第i个通道的特征值,fmax,i为第三特征在第i个通道中的最大值。D为预设参数,例如D为255。i为通道号,1≤i≤c,c为通道总数。
在另一实施例中,特征反量化装置622利用公式(12)计算第二浮点特征的特征值F32_2
Figure BDA0003247752410000102
其中F8_2为第三特征的特征值,fmax为第三特征的最大值,D为预设参数,例如D为255。
任务网络模型模块623被配置为对第二浮点特征进行处理,以得到解码结果。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。

Claims (18)

1.一种特征量化方法,由特征量化装置执行,包括:
从特征提取网络模型获取第一浮点特征,其中所述特征提取网络模型从输入图像中提取出所述第一浮点特征;
将所述第一浮点特征进行特征量化处理,以得到具有预设比特长度的第二特征;
将所述第二特征发送给编码装置,以便所述编码装置对所述第二特征进行编码以得到比特流。
2.根据权利要求1所述的方法,其中,将所述第一浮点特征进行特征量化处理包括:
将所述第一浮点特征转换为整形特征BM
根据所述整形特征BM计算对应的直方图H,其中Hi是整形特征BM的第i个通道BM,i的直方图,i为通道号,1≤i≤c,c为通道总数;
根据所述直方图H倒求累计直方图P,其中Pi,j=Pi,j+1+Hi,j,Hi,j是直方图H的第i个通道中的第j个子项,Pi,j是累计直方图P的第i个通道中的第j个子项;
根据累计直方图P进行截断处理,其中若Pi,j大于预设门限,则更新第一浮点特征在第i个通道中的最大值fmax,i
根据预设参数和第一浮点特征在第i个通道中的最大值fmax,i对所述第一浮点特征在第i个通道中的特征值F32_1,i进行量化处理,以得到所述第二特征。
3.根据权利要求2所述的方法,其中,利用公式
Figure FDA0003247752400000011
将所述第一浮点特征F32_1转换为整形特征BM,其中A为预设参数,int为整形转换函数,round为四舍五入函数,fmax_1为第一浮点特征的最大值。
4.根据权利要求3所述的方法,其中,利用公式
Figure FDA0003247752400000021
更新第一浮点特征在第i个通道中的最大值fmax,i,其中B为预设参数,float为浮点数转换函数。
5.根据权利要求4所述的方法,其中,
利用公式
Figure FDA0003247752400000022
计算所述第二特征在第i个通道中的特征值F8_1,i,其中C为预设参数,max为取最大值函数,F32_1,i为第一浮点特征在第i个通道中的特征值。
6.根据权利要求1所述的方法,其中,将所述第一浮点特征进行特征量化处理包括:
将所述第一浮点特征转换为整形特征BM
根据所述整形特征BM计算对应的直方图H;
根据所述直方图H倒求累计直方图P,其中Pj=Pj+1+hj,Hj是直方图H的第j个子项,Pj是累计直方图P的第j个子项;
根据累计直方图P进行截断处理,其中若Pj大于预设门限,则更新第一浮点特征的最大值fmax
根据预设参数和第一浮点特征的最大值fmax对所述第一浮点特征的特征值F32_1进行量化处理,以得到所述第二特征。
7.根据权利要求6所述的方法,其中,利用公式
Figure FDA0003247752400000023
将所述第一浮点特征F32_1转换为整形特征BM,其中A为预设参数,int为整形转换函数,round为四舍五入函数,fmax_1为第一浮点特征的最大值。
8.根据权利要求7所述的方法,其中,利用公式
Figure FDA0003247752400000031
更新第一浮点特征的最大值fmax,其中B为预设参数,float为浮点数转换函数。
9.根据权利要求8所述的方法,其中,
利用公式
Figure FDA0003247752400000032
计算所述第二特征的特征值F8_1,其中C为预设参数,max为取最大值函数,F32_1为第一浮点特征的特征值。
10.根据权利要求5或9所述的方法,其中,
参数A为1023,参数B为1023,参数C为255。
11.根据权利要求1所述的方法,其中,所述预设比特长度为8。
12.一种特征量化装置,包括:
存储器,被配置为存储指令;
处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如权利要求1-11中任一项所述的方法。
13.一种编码器,包括:
如权利要求12所述的特征量化装置;
特征提取网络模型,被配置为从输入图像中提取出第一浮点特征,并将所述第一浮点特征发送给所述特征量化装置;
编码装置,被配置为对所述特征量化装置发送的第二特征进行编码以得到比特流。
14.一种通信系统,包括:
如权利要求13所述的编码器;
解码器,包括:
解码装置,被配置为将编码器发送的比特流进行解码以得到具有预设比特长度的第三特征;
特征反量化装置,被配置为对所述第三特征进行特征反量化处理,以获得第二浮点特征;
任务网络模型模块,被配置为对所述第二浮点特征进行处理,以得到解码结果。
15.根据权利要求14所述的系统,其中,
所述特征反量化装置利用公式
Figure FDA0003247752400000041
计算第二浮点特征在第i个通道的特征值F32_2,i,其中F8_2,i为第三特征在第i个通道的特征值,fmax,i为第三特征在第i个通道中的最大值,D为预设参数,i为通道号,1≤i≤c,c为通道总数。
16.根据权利要求14所述的系统,其中,
所述特征反量化装置利用公式
Figure FDA0003247752400000042
计算第二浮点特征的特征值F32_2,其中F8_2为第三特征的特征值,fmax为第三特征的最大值,D为预设参数。
17.根据权利要求15或16所述的系统,其中,参数D为255。
18.一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如权利要求1-11中任一项所述的方法。
CN202111037377.0A 2021-09-06 2021-09-06 特征量化方法和装置、编码器、通信系统 Active CN113747155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111037377.0A CN113747155B (zh) 2021-09-06 2021-09-06 特征量化方法和装置、编码器、通信系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111037377.0A CN113747155B (zh) 2021-09-06 2021-09-06 特征量化方法和装置、编码器、通信系统

Publications (2)

Publication Number Publication Date
CN113747155A true CN113747155A (zh) 2021-12-03
CN113747155B CN113747155B (zh) 2022-08-19

Family

ID=78735876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111037377.0A Active CN113747155B (zh) 2021-09-06 2021-09-06 特征量化方法和装置、编码器、通信系统

Country Status (1)

Country Link
CN (1) CN113747155B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1799200A (zh) * 2003-09-02 2006-07-05 日本电信电话株式会社 浮点信号可逆编码方法、解码方法、其设备、程序及其记录介质
US20120076401A1 (en) * 2010-09-27 2012-03-29 Xerox Corporation Image classification employing image vectors compressed using vector quantization
CN110059810A (zh) * 2017-11-03 2019-07-26 畅想科技有限公司 深度神经网络硬件实现的基于直方图的每层数据格式选择
EP3554074A1 (en) * 2018-04-13 2019-10-16 Thomson Licensing Methods and apparatus for depth encoding and decoding
CN110929838A (zh) * 2018-09-19 2020-03-27 杭州海康威视数字技术股份有限公司 神经网络中位宽定点化方法、装置、终端和存储介质
WO2020072842A1 (en) * 2018-10-05 2020-04-09 Interdigital Vc Holdings, Inc. Methods and apparatus for depth encoding and decoding
CN111345040A (zh) * 2017-11-13 2020-06-26 交互数字Vc控股公司 用于在视频编码和解码中生成量化矩阵的方法和装置
CN111614358A (zh) * 2020-04-30 2020-09-01 北京的卢深视科技有限公司 基于分通道量化的特征提取方法、系统、设备及存储介质
CN111860405A (zh) * 2020-07-28 2020-10-30 Oppo广东移动通信有限公司 图像识别模型的量化方法、装置、计算机设备及存储介质
CN111950716A (zh) * 2020-08-25 2020-11-17 云知声智能科技股份有限公司 一种优化int8的量化方法及系统
CN112381205A (zh) * 2020-09-29 2021-02-19 北京清微智能科技有限公司 一种神经网络低比特量化方法
CN112766484A (zh) * 2020-12-30 2021-05-07 上海熠知电子科技有限公司 浮点神经网络模型量化系统和方法
CN113163203A (zh) * 2021-04-29 2021-07-23 上海大学 深度学习特征压缩和解压缩方法、系统及终端

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101494460A (zh) * 2003-09-02 2009-07-29 日本电信电话株式会社 浮点信号的编码方法、解码方法及其编码器、解码器
CN1799200A (zh) * 2003-09-02 2006-07-05 日本电信电话株式会社 浮点信号可逆编码方法、解码方法、其设备、程序及其记录介质
US20120076401A1 (en) * 2010-09-27 2012-03-29 Xerox Corporation Image classification employing image vectors compressed using vector quantization
CN110059810A (zh) * 2017-11-03 2019-07-26 畅想科技有限公司 深度神经网络硬件实现的基于直方图的每层数据格式选择
CN111345040A (zh) * 2017-11-13 2020-06-26 交互数字Vc控股公司 用于在视频编码和解码中生成量化矩阵的方法和装置
EP3554074A1 (en) * 2018-04-13 2019-10-16 Thomson Licensing Methods and apparatus for depth encoding and decoding
CN110929838A (zh) * 2018-09-19 2020-03-27 杭州海康威视数字技术股份有限公司 神经网络中位宽定点化方法、装置、终端和存储介质
WO2020072842A1 (en) * 2018-10-05 2020-04-09 Interdigital Vc Holdings, Inc. Methods and apparatus for depth encoding and decoding
CN111614358A (zh) * 2020-04-30 2020-09-01 北京的卢深视科技有限公司 基于分通道量化的特征提取方法、系统、设备及存储介质
CN111860405A (zh) * 2020-07-28 2020-10-30 Oppo广东移动通信有限公司 图像识别模型的量化方法、装置、计算机设备及存储介质
CN111950716A (zh) * 2020-08-25 2020-11-17 云知声智能科技股份有限公司 一种优化int8的量化方法及系统
CN112381205A (zh) * 2020-09-29 2021-02-19 北京清微智能科技有限公司 一种神经网络低比特量化方法
CN112766484A (zh) * 2020-12-30 2021-05-07 上海熠知电子科技有限公司 浮点神经网络模型量化系统和方法
CN113163203A (zh) * 2021-04-29 2021-07-23 上海大学 深度学习特征压缩和解压缩方法、系统及终端

Also Published As

Publication number Publication date
CN113747155B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN111818346B (zh) 图像编码方法和装置、图像解码方法和装置
JP6792011B2 (ja) Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
CN101968781B (zh) 在音频编码过程中根据mdct数据进行视窗类型判定的方法
CN116506073B (zh) 一种工业计算机平台数据快速传输方法及系统
CN107454412A (zh) 一种视频图像的处理方法、装置及系统
CN112565777B (zh) 基于深度学习模型视频数据传输方法、系统、介质及设备
CN110753225A (zh) 一种视频压缩方法、装置及终端设备
CN113747155B (zh) 特征量化方法和装置、编码器、通信系统
US20050075888A1 (en) Fast codebook selection method in audio encoding
CN114900714B (zh) 一种基于神经网络的视频生成方法及相关装置
CN113256744A (zh) 一种图像编码、解码方法及系统
WO2022183335A1 (zh) 图像编解码方法、编码器、解码器及存储介质
CN115908594A (zh) 图像特征压缩、解压方法、装置、存储介质及电子设备
CN113554719B (zh) 一种图像编码方法、解码方法、存储介质及终端设备
Mukherjee et al. Lossy image compression using SVD coding, compressive autoencoders, and prediction error-vector quantization
WO2023169303A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序产品
Ma et al. HM-PCGC: A Human-Machine Balanced Point Cloud Geometry Compression Scheme
EP4224852A1 (en) Video encoding and decoding methods, encoder, decoder, and storage medium
Moon et al. Local Non-linear Quantization for Neural Network Compression in MPEG-NNR
US8422560B2 (en) Method and apparatus for encoding/decoding media signal
CN101777366B (zh) 一种基于rle原理的行程压缩方法和装置
Dobrovolný et al. Asymmetric image compression for embedded devices based on singular value decomposition
Salih Adaptive speech compression based on AMBTC
CN114022575A (zh) 基于单目深度估计的深度图压缩方法、装置、设备及介质
CN114979639A (zh) 深度学习特征量化方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant