CN116418997A - 特征数据压缩方法、装置、系统、电子设备及存储介质 - Google Patents

特征数据压缩方法、装置、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN116418997A
CN116418997A CN202111624085.7A CN202111624085A CN116418997A CN 116418997 A CN116418997 A CN 116418997A CN 202111624085 A CN202111624085 A CN 202111624085A CN 116418997 A CN116418997 A CN 116418997A
Authority
CN
China
Prior art keywords
data
binary
feature
binarized
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111624085.7A
Other languages
English (en)
Inventor
王立传
张园
杨明川
茅心悦
王泽坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202111624085.7A priority Critical patent/CN116418997A/zh
Publication of CN116418997A publication Critical patent/CN116418997A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/24Testing correct operation
    • H04L1/245Testing correct operation by using the properties of transmission codes
    • H04L1/246Testing correct operation by using the properties of transmission codes two-level transmission codes, e.g. binary
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本公开提供了一种特征数据压缩方法、装置、系统、电子设备及存储介质,涉及数据处理技术领域。该方法包括:将图像或视频数据输入到二值化特征提取网络,输出图像或视频数据的二值化特征数据;对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。本公开直接从图像或视频数据中提取出二值化的特征数据,无需在二进制算术编码时对特征数据进行量化处理,可简化数据压缩时的编码流程,减少编码计算量和数据量。

Description

特征数据压缩方法、装置、系统、电子设备及存储介质
技术领域
本公开涉及数据处理技术领域,尤其涉及一种特征数据压缩方法、装置、系统、电子设备及存储介质。
背景技术
众所周知,卷积神经网络可用于图像或视频数据的特征提取,利用卷积神经网络提取出的特征数据往往具有数据量十分大的特点,为了降低特征数据的传输量,通常需要对特征数据进行压缩处理。传统利用卷积神经网络进行特征提取的方案,特征提取网络直接输出的数据在压缩编码时往往需要进行量化处理,存在计算量和数据量均比较大的不足。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种特征数据压缩方法、装置、系统、电子设备及存储介质,至少在一定程度上克服相关技术中特征提取网络直接输出的特征数据在压缩编码时存在计算量和数据量较大的技术问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供了一种特征数据压缩方法,该方法包括:将图像或视频数据输入到二值化特征提取网络,输出所述图像或视频数据的二值化特征数据;对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
在一些实施例中,在将图像或视频数据输入到二值化特征提取网络,输出所述图像或视频数据的二值化特征数据之前,所述方法包括:对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到所述二值化特征提取网络;或为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到所述二值化特征提取网络。
在一些实施例中,所述对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据包括:对二值化特征数据直接进行逐符号二进制算术编码。
在一些实施例中,所述对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据包括:对二值化特征数据进行分块处理,得到多个分块数据;判断分块数据内的二进制符号是否相同;若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
在一些实施例中,在对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据之后,所述方法还包括:对压缩后的特征数据进行分块二进制算术解码,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量;利用解压后的二值化特征数据,执行后续任务。
根据本公开的另一个方面,还提供了一种特征数据压缩装置,该装置包括:二值化特征数据提取模块,用于将图像或视频数据输入到二值化特征提取网络,输出所述图像或视频数据的二值化特征数据;二进制算术编码模块,用于对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
在一些实施例中,所述二值化特征数据提取模块还用于:对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到所述二值化特征提取网络;或为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到所述二值化特征提取网络。
在一些实施例中,所述二进制算术编码模块还用于:对二值化特征数据直接进行逐符号二进制算术编码。
在一些实施例中,所述二进制算术编码模块还用于:对二值化特征数据进行分块处理,得到多个分块数据;判断分块数据内的二进制符号是否相同;若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
在一些实施例中,所述装置还包括:二进制算术解码模块,用于对压缩后的特征数据进行分块二进制算术解码,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量;任务执行模块,用于利用解压后的二值化特征数据,执行后续任务。
根据本公开的另一个方面,还提供了一种特征数据压缩系统,该系统包括:编码器和解码器;编码器,用于对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据,其中,所述二值化特征提取网络用于从图像或视频数据中提取二值化特征数据;解码器,用于对压缩后的特征数据进行二进制算术解码。
根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述特征数据压缩方法。
根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的特征数据压缩方法。
本公开的实施例所提供的特征数据压缩方法、装置、系统、电子设备及存储介质,将图像或视频数据输入到二值化特征提取网络,直接输出二值化特征数据,进而对二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。可见,本公开实施例直接从图像或视频数据中提取出二值化的特征数据,无需在二进制算术编码时对特征数据进行量化处理,可简化数据压缩时的编码流程,减少编码计算量和数据量。
进一步地,对压缩后的特征数据进行基于上下文自适应的二进制算术解码,得到二值化特征数据,直接用于后续任务的执行,更加灵活。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出相关技术中一种对特征数据进行压缩传输的流程图;
图2示出本公开实施例中一种对特征数据进行压缩传输的流程图;
图3示出相关技术中一种二进制算术编解码流程图;
图4示出本公开实施例中一种二进制算术编解码流程图;
图5示出本公开实施例中一种特征数据压缩方法流程图;
图6示出本公开实施例中一种对特征数据进行解压缩的流程图;
图7示出本公开实施例中一种特征数据压缩装置示意图;
图8示出本公开实施例中一种特征数据压缩系统示意图;
图9示出本公开实施例中一种电子设备的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
为便于理解,在介绍本公开实施例之前,首先对本公开实施例中涉及到的几个名词进行解释如下:
压缩:以某种技术手段,减少数据尺寸。
解压缩:将减少数据尺寸后的数据通过某种技术手段恢复成原始尺寸。
编码:压缩的一种具体技术手段。
解码:解压缩的一种具体手段。
熵编码:无损编码的一种方式,把指定的数据(语法元素)转换为bit流的过程,可以通过该bit流完全恢复原始数据。
算术编码:是指将一串符号编码成一个算术数字的过程。
算术解码:是指将一个算术数字还原成一串符号的过程。
二进制算术编解码:0/1二进制串符号的算术编解码过程。
二值化:是指将数据(语法元素)转换为对应的二进制符号串的过程,是基于上下文的二进制算术编码的必不可少的过程。
上下文建模:算术编码或解码的过程依赖于符号出现的概率。一般以ctxId表达概率模型的序号,每个序号对应一个概率分布。编码或解码特定二进制符号时,需明确该符号所属的概率模型。特定的二进制符号和对应的概率模型之间的关系确定称之为上下文建模。
一元码:1的个数表示数值,0表示编码结束。如表1所示。
表1
Figure BDA0003439189790000051
Figure BDA0003439189790000061
截断一元码:和一元码类似,但存在最大已知值,如表2所示,max=8的截断一元码为例,小于8的情况以0结束,8本身以1结束,解码端相对应,连续读出8个1,解码结束。
表2
数值 截断一元码
0 0
1 10
2 110
3 1110
4 11110
5 111110
6 1111110
7 11111110
8 11111111
下面,结合附图对本公开实施例进行详细说明。
图1示出了相关技术中一种对特征数据进行压缩传输的流程,如图1所示,将图片(图像)或视频数据输入到特征提取网络后,输出浮点型32bit特征数据(标记为F32_1),将特征提取网络输出的浮点型32bit特征数据,输入到特征量化模块,输出量化后的8bit特征数据(标记为F8_1);利用编码器对8bit特征数据进行编码后,输出Bit流;解码器接收到Bit流后,对Bit流进行解码,得到8bit特征数据(标记为F8_2),执行反量化处理,得到浮点型32bit特征数据(标记为F32_2),输入到后续任务网络。
对图1所示的特征数据压缩传输方案进行分析,可以看出该方案存在如下问题:①对8bit特征数据进行二值化处理后的符号串会很长,没有利用二进制算术编码;②输入到后续任务网络的数据为浮点型特征数据,灵活性较差。
图2示出了本公开实施例中一种对特征数据进行压缩传输的流程,如图2所示,将图片(图像)或视频数据输入到特征提取网络后,直接输出二值化特征数据(标记为B1_1),将特征提取网络直接输出的二值化特征数据输入到编码器进行二进制算术编码,形成Bit流;解码器接收到Bit流后,对Bit流进行二进制算术解码,得到二值化特征数据(标记为B1_2),使得连接解码器的后续任务网络直接接收二值化特征数据。
图3示出了相关技术中提供的二进制算术编解码流程,图4示出了本公开实施例中一种二进制算术编解码流程,由图3和图4可以看出,传统二进制算术编解码方案在进行二值化编解码之前必须对特征数据进行二值化处理,而本公开实施例中提供的二进制算术编码方案,在对特征数据进行二进制算术编码时,可省去对特征数据进行量化处理的过程,这是因为本公开实施例中使用的特征提取网络能够直接输出二值化特征数据。
在上述发明构思下,本公开实施例中提供了一种特征数据压缩方法,该方法可以由任意具备计算处理能力的电子设备执行。该电子设备可以是终端设备,也可以是服务器。其中,终端设备可以包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、增强现实设备、虚拟现实设备等;服务器可以是提供各种服务的服务器,例如对用户利用终端设备所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
可选地,终端设备中安装的应用程序的客户端是相同的,或基于不同操作系统的同一类型应用程序的客户端。基于终端平台的不同,该应用程序的客户端的具体形态也可以不同,比如,该应用程序客户端可以是手机客户端、PC客户端等。
可选地,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本公开在此不做限制。
图5示出本公开实施例中一种特征数据压缩方法流程图,如图5所示,本公开实施例中提供的特征数据压缩方法包括如下步骤:
S502,将图像或视频数据输入到二值化特征提取网络,输出图像或视频数据的二值化特征数据。
需要说明的是,上述图像或视频数据可以是直接采集的数据,也可以是从外部导入的数据。上述二值化特征提取网络是指能够直接输出二值化特征数据的特征提取网络。相关技术中基于卷积神经网络实现的特征提取网络,输出的特征数据非二值化数据,因而,对特征提取网络输出的特征数据进行二进制算数编码时往往要进行二值化处理,本公开实施例中对常规的特征提取网络进行改进,使得改进后的特征提取网络(即二值化特征提取网络)能够直接输出二值化特征数据,可省去二值化处理过程。
在具体实施时,可以通过机器学习,对卷积神经网络进行训练,得到一个能够从图像或视频数据提取特征数据的特征提取网络,然后对该特征提取网络进行改进,得到本公开实施例中的二值化特征提取网络。
在一些实施例中,在将图像或视频数据输入到二值化特征提取网络,输出图像或视频数据的二值化特征数据之前,本公开实施例中提供的特征数据压缩方法可以通过如下任意一种方式构建能够直接从图像或视频数据中提取出二值化特征数据的二值化特征提取网络:
方式1:对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到二值化特征提取网络。
方式2:为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到二值化特征提取网络。例如,当输出值大于或等于阈值,则输出1;当输出值小于阈值,则输出0。
在具体实施时,上述方式1可通过如下公式(1)对对特征提取网络输出层前至少一层参数权重或激活函数进行二值化,使得输出特征数据只有两种数值1或0:
Figure BDA0003439189790000081
其中,W表示权重矩阵。
上述方式2可通过如下公式(2)对特征提取网络输出的数据进行二值化处理:
Figure BDA0003439189790000091
需要说明的是,卷积神经网络由数个甚至数百个卷积运算层堆叠连接,以二维平面卷积计算为基础,对图像进行特征提取,得到特征数据。在机器视觉领域中,以卷积神经网络为特征提取器的网络架构有着优秀的准确率和很高的计算效率。本公开实施例中,对卷积神经网络进行改进,可使得改进后的二值化特征提取网络拥有卷积神经网络进行特征提取的优点。
S504,对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
需要说明的是,传统对特征数据进行量化的方案,压缩效率不高;虽然基于上下文自适应的二进制算术编码方案能够获得较高的压缩效率,但二进制算术编码的实现包括三个关键部分:一是数据二值化;二是上下文建模;三是算术编解码,其中,数据二值化可通过一元码或截断一元码等方式实现。若对现有卷积神经网络提取出的特征数据进行进制算术编码,需要对数据进行二值化处理,而本公开实施例中的二值化特征提取网络,可直接输出二值化特征数据,省去了对二值化处理过程,能够大大简化特征数据压缩时的编码流程,减少编码的计算量和数据量。
由上可知,本公开的实施例所提供的特征数据压缩方法,将图像或视频数据输入到二值化特征提取网络,直接输出二值化特征数据,进而对二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。可见,本公开实施例直接从图像或视频数据中提取出二值化的特征数据,无需在二进制算术编码时对特征数据进行量化处理,可简化数据压缩时的编码流程,减少编码计算量和数据量。
在一些实施例中,可以将原始二值化特征数据映射为二进制符号串,例如:原始二值化特征的取值“-1(低概率)、1(高概率)”可映射为“0,1”;原始二值化特征的取值“-1.0(低概率)、1.0(高概率)”可映射为“0,1”;原始二值化特征的取值“0(低高率)、1(高概率)可不作映射。
在一些实施例中,在上述S504中,可对二值化特征数据直接进行逐符号二进制算术编码。
编码方式1:
对整个二值化符号串直接进行二进制算术编码;
编码方式2:
①对二值化符号串进行分块,每块大小为N,N为正整数预设值;
②判断分块内是否所有符号相同,编码该判断标志位,若全相同,先编码0,否则,编码1;
③若分块内是否所有符号全相同,编码该符号,结束,否则逐次编码该符号串结束。
在一些实施例中,若采用分块编码,则在上述S504可通过如下步骤来实现:对二值化特征数据进行分块处理,得到多个分块数据;判断分块数据内的二进制符号是否相同;若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
针对上述编码方式2,列举一个例子,当某个分块为“00000000”时,编码结果为“00”(第一个0代表分块内二进制符号相同,第二个0表示分块内二进制符号全为0);当某个分块为“11111111”时,编码结果为“01”(第一个0代表分块内二进制符号相同,第二个1表示分块内二进制符号全为1);当某个分块为“01100110”时,编码结果为“101100110”(第一个1代表分块内二进制符号不相同,则后面的01100110表示分块内的二进制符号串)。
可以看出,对于一个长度为N的二进制符号串,编码方式1需编码串长为N,而采用上述编码方式2相对于编码方式1的编码效率如下:
在全相等情况下,可减少N-2个待编码串;
在不全相等情况下,仅增加1个待编码串;
可见,在特征串局部全相同情况下,本公开实施例,可大幅减少待编码串,而不全相等下仅增加一个待编码串,在真实的特征串分布中,局部全相等的情况总是存在的,且特征本身为二值特征,两项结合,可以获得极高的压缩比。
在一些实施例中,如图6所示,在对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据之后,本公开实施例中提供的特征数据压缩方法还包括如下步骤:
S602,对压缩后的特征数据进行基于上下文自适应的二进制算术编码,得到解压后的二值化特征数据;
S604,利用解压后的二值化特征数据,执行后续任务。
当上述S504采用分块编码的情况下,上述S602在进行二进制算术解码的过程中,也需要进行分块的二进制算术解码,对每个分块先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量。
本公开实施例中提供的特征数据压缩方案,能够实现但不限于如下技术效果:①特征直接二值化,二进制算术编码流程可无二值化,均大大简化编码流程,减少编码计算量和数据量;②对二进制符号串再进行分块,并判断块内符号的分布,和直接编码方式相比,相同情况下编码效果为2/N,不同情况下为(1+N)/N,可大大提高加速比;③仅约束特征提取网络输出二值化特征数据,使得后续任务网络接收到的是二值化特征数据。其二值化存在方式可为浮点,也可为定点,例如,8bit、16bit、32bit等任意形式,非常灵活。
下面列举两个例子说明浮点和定点两种形式的二值化特征数据。
示例一:
编码端:
第1步:设计输出浮点特征数据的特征提取网络,该网络输出的特征数据为1.0或0.0等,为全二值化网络,即全部的权重和激活函数均为二值化,利用该网络提取特征得到B2_1
第2步:对B2_1进行基于上下文自适应二进制算术编码,具体流程为将1.0转换为1,将0.0转换为0;
第3步:对二进制符号串分块,块大小N为32;
第4步:逐块编码,每块内逐符号进行编码。
解码端:
第1步:对每个分块进行逐符号解码,得到B2_2
第2步:设计后续任务网络,其权重不为0,为全整形网络,该网络接收定点二值输入0或1,继续执行后续任务。
示例二:
编码端:
第1步:设计输出定点特征数据的特征提取网络,长度为8bit,但特征仅能为0或1;在网络的最后一层判断是否大于阈值3.0,若大于或等于3.0,则输出1,否则输出0,得到B2_1
第2步:逐符号编码整个B2_1
解码端:
第1步:逐符号解码得到整个B2_2
第2步:设计后续任务网络,该网络也是全二值网络,该网络接收定点二值输入0或1,继续执行后续任务。
基于同一发明构思,本公开实施例中还提供了一种特征数据压缩装置,如下面的实施例所述。由于该装置实施例解决问题的原理与上述方法实施例相似,因此该装置实施例的实施可以参见上述方法实施例的实施,重复之处不再赘述。
图7示出本公开实施例中一种特征数据压缩装置示意图,如图7所示,该装置包括:二值化特征数据提取模块71和二进制算术编码模块72。
其中,二值化特征数据提取模块71,用于将图像或视频数据输入到二值化特征提取网络,输出图像或视频数据的二值化特征数据;二进制算术编码模块72,用于对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
此处需要说明的是,上述二值化特征数据提取模块71和二进制算术编码模块72对应于方法实施例中的S502~S504,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
由上可知,本公开的实施例所提供的特征数据压缩装置,通过二值化特征数据提取模块71将图像或视频数据输入到二值化特征提取网络,直接输出二值化特征数据,进而通过二进制算术编码模块72对二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。可见,本公开实施例直接从图像或视频数据中提取出二值化的特征数据,无需在二进制算术编码时对特征数据进行量化处理,可简化数据压缩时的编码流程,减少编码计算量和数据量。
在一些实施例中,上述二值化特征数据提取模块71还用于:对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到二值化特征提取网络;或为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到二值化特征提取网络。
在一些实施例中,上述二进制算术编码模块72还用于:对二值化特征数据直接进行逐符号二进制算术编码。
在一些实施例中,上述二进制算术编码模块还用于:对二值化特征数据进行分块处理,得到多个分块数据;判断分块数据内的二进制符号是否相同;若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
在一些实施例中,本公开实施例中提供的特征数据压缩装置还包括:二进制算术解码模块73和任务执行模块74。
其中,二进制算术解码模块73,用于对压缩后的特征数据进行分块二进制算术解码,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量;任务执行模块74,用于利用解压后的二值化特征数据,执行后续任务。
此处需要说明的是,上述二进制算术解码模块73和任务执行模块74对应于方法实施例中的S602~S604,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
基于同一发明构思,本公开实施例中还提供了一种特征数据压缩系统,如下面的实施例所述。由于该系统实施例解决问题的原理与上述方法实施例相似,因此该系统实施例的实施可以参见上述方法实施例的实施,重复之处不再赘述。
图8示出本公开实施例中一种特征数据压缩系统示意图,如图8所示,该系统包括:编码器81和解码器82。
其中,编码器81,用于对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据,其中,二值化特征提取网络用于从图像或视频数据中提取二值化特征数据;解码器82,用于对压缩后的特征数据进行二进制算术解码。
需要说明的是,本公开实施例中的编码器81和解码器82,可以部署于一台设备上,也可以部署于不同的设备上。编码器81和解码器82之间的通信可以是有线通信,也可以是无线通信。
由上可知,本公开的实施例所提供的特征数据压缩系统,在将图像或视频数据输入到二值化特征提取网络,直接输出二值化特征数据后,利用编码器对二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据;利用解码器对压缩后的特征数据进行基于上下文自适应的二进制算术解码,得到解压后的二值化特征数据,以用于执行后续任务。可见,本公开实施例直接从图像或视频数据中提取出二值化的特征数据,无需在二进制算术编码时对特征数据进行量化处理,可简化数据压缩时的编码流程,减少编码计算量和数据量。进一步地,对压缩后的特征数据进行基于上下文自适应的二进制算术解码,得到二值化特征数据,直接用于后续任务的执行,更加灵活。
在一些实施例中,本公开实施例中一种特征数据压缩系统还可以包括:特征提取模块,用于:对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到二值化特征提取网络;或为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到二值化特征提取网络。
在一些实施例中,上述编码器81还用于:对二值化特征数据直接进行逐符号二进制算术编码。
在一些实施例中,上述编码器81还用于:对二值化特征数据进行分块处理,得到多个分块数据;判断分块数据内的二进制符号是否相同;若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
在一些实施例中,上述解码器82还用于:在对压缩后的特征数据进行分块二进制算术解码的过程中,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量。
在一些实施例中,本公开实施例中一种特征数据压缩系统还可以包括:任务执行模块,用于:利用解压后的二值化特征数据,执行后续任务。
本公开实施例中,编码器81与特征提取模块连接,解码器82与任务执行模块连接。针对不同的应用场景,任务执行模块可以用于执行不同的任务。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图9来描述根据本公开的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元910执行,使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元910可以执行上述方法实施例的如下步骤:将图像或视频数据输入到二值化特征提取网络,输出图像或视频数据的二值化特征数据;对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
在一些实施例中,处理单元910还可以执行上述方法实施例的如下步骤:对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到二值化特征提取网络;或为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到二值化特征提取网络。
在一些实施例中,处理单元910还可以执行上述方法实施例的如下步骤:对二值化特征数据直接进行逐符号二进制算术编码。
在一些实施例中,处理单元910还可以执行上述方法实施例的如下步骤:对二值化特征数据进行分块处理,得到多个分块数据;判断分块数据内的二进制符号是否相同;若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
在一些实施例中,处理单元910还可以执行上述方法实施例的如下步骤:在对压缩后的特征数据进行分块二进制算术解码的过程中,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量;利用解压后的二值化特征数据,执行后续任务。
存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(ROM)9203。
存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备900也可以与一个或多个外部设备940(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备900交互的设备通信,和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且,电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器960通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质可以是可读信号介质或者可读存储介质。其上存储有能够实现本公开上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
本公开中的计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可选地,计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
在具体实施时,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (10)

1.一种特征数据压缩方法,其特征在于,包括:
将图像或视频数据输入到二值化特征提取网络,输出所述图像或视频数据的二值化特征数据;
对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
2.根据权利要求1所述的特征数据压缩方法,其特征在于,在将图像或视频数据输入到二值化特征提取网络,输出所述图像或视频数据的二值化特征数据之前,所述方法包括:
对卷积神经网络输出层前至少一层参数权重或激活函数进行二值化,得到所述二值化特征提取网络;或
为卷积神经网络的输出层设定一个对特征数据进行二值化的阈值,得到所述二值化特征提取网络。
3.根据权利要求1所述的特征数据压缩方法,其特征在于,所述对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据包括:
对二值化特征数据直接进行逐符号二进制算术编码。
4.根据权利要求1所述的特征数据压缩方法,其特征在于,所述对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据包括:
对二值化特征数据进行分块处理,得到多个分块数据;
判断分块数据内的二进制符号是否相同;
若分块数据内的二进制符号相同,则将分块数据预编码为0以及该二进制符号得到预编码符号串,并对预编码符号串进行二进制算术编码;
若分块数据内的二进制符号不相同,则将分块数据预编码为1以及该分块数据内的二进制符号串得到预编码符号串,并对预编码符号串进行二进制算术编码。
5.根据权利要求4所述的特征数据压缩方法,其特征在于,在对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据之后,所述方法还包括:
对压缩后的特征数据进行分块二进制算术解码,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于分块数据内二进制符号的数量;
利用解压后的二值化特征数据,执行后续任务。
6.一种特征数据压缩装置,其特征在于,包括:
二值化特征数据提取模块,用于将图像或视频数据输入到二值化特征提取网络,输出所述图像或视频数据的二值化特征数据;
二进制算术编码模块,用于对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据。
7.根据权利要求6所述的特征数据压缩装置,其特征在于,所述装置还包括:
二进制算术解码模块,用于对压缩后的特征数据进行分块二进制算术解码,每块内先解码出一位二进制符号,若解码出的二进制符号为0,则再解码出一个二进制符号;若解码出的二进制符号为1,则再解码出N个二进制符号,其中,N的取值等于编码前分块数据内二进制符号的数量;
任务执行模块,用于利用解压后的二值化特征数据,执行后续任务。
8.一种特征数据压缩系统,其特征在于,包括:编码器和解码器;
编码器,用于对二值化特征提取网络输出的二值化特征数据进行基于上下文自适应的二进制算术编码,得到压缩后的特征数据,其中,所述二值化特征提取网络用于从图像或视频数据中提取二值化特征数据;
解码器,用于对压缩后的特征数据进行二进制算术解码。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~5中任意一项所述特征数据压缩方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~5中任意一项所述的特征数据压缩方法。
CN202111624085.7A 2021-12-28 2021-12-28 特征数据压缩方法、装置、系统、电子设备及存储介质 Pending CN116418997A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111624085.7A CN116418997A (zh) 2021-12-28 2021-12-28 特征数据压缩方法、装置、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111624085.7A CN116418997A (zh) 2021-12-28 2021-12-28 特征数据压缩方法、装置、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116418997A true CN116418997A (zh) 2023-07-11

Family

ID=87058043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111624085.7A Pending CN116418997A (zh) 2021-12-28 2021-12-28 特征数据压缩方法、装置、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116418997A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807926A (zh) * 2010-01-21 2010-08-18 上海电力学院 低功耗soc测试数据压缩编码方法
CN105740916A (zh) * 2016-03-15 2016-07-06 北京陌上花科技有限公司 图像特征编码方法及装置
CN106941610A (zh) * 2017-04-25 2017-07-11 西安电子科技大学 基于改进方块编码的二值roi掩模编码方法
CN107239793A (zh) * 2017-05-17 2017-10-10 清华大学 多量化深度二值特征学习方法及装置
CN113345521A (zh) * 2021-05-31 2021-09-03 天津大学 一种采用大片段dna存储的编码与恢复方法
CN113762279A (zh) * 2021-01-18 2021-12-07 北京沃东天骏信息技术有限公司 目标图像识别方法、模型训练方法、装置、设备和介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807926A (zh) * 2010-01-21 2010-08-18 上海电力学院 低功耗soc测试数据压缩编码方法
CN105740916A (zh) * 2016-03-15 2016-07-06 北京陌上花科技有限公司 图像特征编码方法及装置
CN106941610A (zh) * 2017-04-25 2017-07-11 西安电子科技大学 基于改进方块编码的二值roi掩模编码方法
CN107239793A (zh) * 2017-05-17 2017-10-10 清华大学 多量化深度二值特征学习方法及装置
CN113762279A (zh) * 2021-01-18 2021-12-07 北京沃东天骏信息技术有限公司 目标图像识别方法、模型训练方法、装置、设备和介质
CN113345521A (zh) * 2021-05-31 2021-09-03 天津大学 一种采用大片段dna存储的编码与恢复方法

Similar Documents

Publication Publication Date Title
US9787321B1 (en) Point cloud data compression using a space-filling curve
CN107395209B (zh) 数据压缩方法、数据解压缩方法及其设备
US9454552B2 (en) Entropy coding and decoding using polar codes
US20110181448A1 (en) Lossless compression
US11538197B2 (en) Channel-wise autoregressive entropy models for image compression
US10666289B1 (en) Data compression using dictionary encoding
CN104125475B (zh) 一种多维量子数据压缩、解压缩方法及装置
US9966971B2 (en) Character conversion
CN114337678A (zh) 数据压缩方法、装置、设备及存储介质
US20140015698A1 (en) System and method for fixed rate entropy coded scalar quantization
CN114614829A (zh) 卫星数据帧的处理方法、装置、电子设备和可读存储介质
US8473428B2 (en) Generation and use of specific probability tables for arithmetic coding in data compression systems
US20100321218A1 (en) Lossless content encoding
CN116156072B (zh) 隐写图像生成方法、隐写信息提取方法及相关装置
CN117201797A (zh) 遥感影像数据的处理方法、装置、设备与存储介质
CN116566397A (zh) 编码、解码方法、编码器、解码器、电子设备及存储介质
CN109474826B (zh) 图片压缩方法、装置、电子设备及存储介质
CN116668691A (zh) 一种图片压缩传输方法、装置及终端设备
WO2023159820A1 (zh) 图像压缩方法、图像解压缩方法及装置
CN116418997A (zh) 特征数据压缩方法、装置、系统、电子设备及存储介质
US20230085142A1 (en) Efficient update of cumulative distribution functions for image compression
CN104113394B (zh) 通信调制信号的压缩及解压方法
CN111049836A (zh) 数据处理方法、电子设备及计算机可读存储介质
CN116567239A (zh) 编解码方法、装置、编解码器、设备及介质
CN115769581A (zh) 用于符号编码的动态方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination