CN109544651B - 用于图像对比的数据压缩方法、图像对比方法及装置 - Google Patents

用于图像对比的数据压缩方法、图像对比方法及装置 Download PDF

Info

Publication number
CN109544651B
CN109544651B CN201811385075.0A CN201811385075A CN109544651B CN 109544651 B CN109544651 B CN 109544651B CN 201811385075 A CN201811385075 A CN 201811385075A CN 109544651 B CN109544651 B CN 109544651B
Authority
CN
China
Prior art keywords
characteristic values
data compression
stored
image
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811385075.0A
Other languages
English (en)
Other versions
CN109544651A (zh
Inventor
董淳光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Mozhi Safety Technology Co Ltd
Original Assignee
Shenzhen Mozhi Safety Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Mozhi Safety Technology Co Ltd filed Critical Shenzhen Mozhi Safety Technology Co Ltd
Priority to CN201811385075.0A priority Critical patent/CN109544651B/zh
Publication of CN109544651A publication Critical patent/CN109544651A/zh
Application granted granted Critical
Publication of CN109544651B publication Critical patent/CN109544651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本发明涉及一种用于图像对比的数据压缩方法、图像对比方法及装置。数据压缩方法,其包括以下步骤:划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值;排序步骤,将上一步保留的特征值从大至小排序,保留前N个特征值;存储步骤,将上一步得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。通过将特征值划分、筛选后,将特征值和初始位置压缩存储在整型变量中,整个数据量得到极大减少,处理速度得到提高,对存储要求降低,同时也不会影响对比精度,能够适应整个互联网海量的图片对比处理。

Description

用于图像对比的数据压缩方法、图像对比方法及装置
技术领域
本发明涉及图像对比技术及数据处理技术,尤其涉及一种用于图像对比的数据压缩方法、图像对比方法及装置。
背景技术
图像对比技术先已经有非常广泛的应用。目前图片比对的需求通常是:比对两张图是否相同、或部分相同,并且需要在互联网上做海量图片比对。如此大规模图像比对,在比对算法上有比较高的要求。既要确保比对准确性,也要保证机器能扛住。机器能否扛住,其中一个指标是内存、速度这一矛盾问题。对海量图片,如果将特征存储在磁盘中,读取一个特征假设0.01秒,那么100万个图就需要1万秒。互联网上图片远不止100万这个数量级。因此需要考虑减少数据存储量和处理量。
一般比对算法都会用到使用视觉词袋技术,最早出现在神经语言程序学(NLP)和信息检索(IR)领域。该技术忽略掉文本的语法和语序,用一组无序的单词(words)来表达一段文字或一个文档。近年来,视觉词袋模型被广泛应用于计算机视觉中。与应用于文本的视觉词袋模型类比,图像的特征(feature)被当作单词(Word),把图像“文字化”之后,有助于大规模的图像检索。视觉词袋技术中,每一张图需要128个浮点类型(float/double)作为特征值,特征值表示的是每个样本图片到字典库的“距离”,取值范围是[0,1]。特征值大部分都是很小的小数,趋近于0,只有几个数据是零点几,或零点零几,所以要用浮点数表示,因此128个浮点数最少需要512字节(实际上加上辅助数据会远超这个数)。100万图片需要488.28MB内存,1000万张图需要4882.8MB内存,1亿张图需要48.828GB内存。这样庞大的数据量对处理速度和存储容量都提出了非常高的要求,有待改进。
发明内容
本发明的目的在于为克服现有技术中数据量庞大的缺陷,而提供一种用于图像对比的数据压缩方法、图像对比方法及装置。
为实现上述目的,本发明采用以下技术方案:用于图像对比的数据压缩方法,其包括以下步骤:
划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值;
排序步骤,将上一步保留的特征值从大至小排序,保留前N个特征值;
存储步骤,将上一步得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。
本发明与现有技术相比的有益效果是:通过将特征值划分、筛选后,将特征值和初始位置压缩存储在整型变量中,整个数据量得到极大减少,处理速度得到提高,对存储要求降低,同时也不会影响对比精度,能够适应整个互联网海量的图片对比处理。
其中一方面,存储步骤中,将Y个整型变量拆分成X份单元存储位,单元存储位存储一个特征值及其初始位置的比特位数等于32×Y/X。
其中一方面,单元存储位分成两部分,一部分存储特征值所处的初始位置,另一部分存储特征值乘上固定倍率取整。固定倍率为65536。
其中一方面,Y=1,X=1或者Y=3,X=2。
本发明还公开了一种图像对比方法,其包括了以上的数据压缩方法以及还原步骤;还原步骤中,将单元存储位存储的特征值除以固定倍率得到原先特征值的近似值,同时提取单元存储位存储的特征值初始位置。
本发明还公开了一种电子设备,包括:处理器;以及存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时实现以上的数据压缩方法和图像对比方法。
本发明还公开了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以上的数据压缩方法和图像对比方法。
附图说明
图1为本发明数据压缩方法的流程图。
具体实施方式
为了更充分理解本发明的技术内容,下面结合具体实施例对本发明的技术方案作进一步介绍和说明。
本发明数据压缩方法的流程图如图1所示。数据压缩方法可用于图像对比中的词袋技术的特征值的压缩处理。词袋技术的特征值通常为128个浮点数,通过本发明的数据压缩方法减少数据量,提高处理速度。
本发明数据压缩方法包括以下步骤:划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值;排序步骤,将上一步保留的特征值从大至小排序,保留前N个特征值;存储步骤,将上一步得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。
存储步骤中,将Y个整型变量拆分成X份单元存储位,单元存储位存储一个特征值及其初始位置的比特位数等于32×Y/X。单元存储位分成两部分,一部分存储特征值所处的初始位置,另一部分存储特征值乘上固定倍率取整。固定倍率为65536。
本发明还公开了一种图像对比方法,其包括了以上的数据压缩方法以及还原步骤;还原步骤中,将单元存储位存储的特征值除以固定倍率得到原先特征值的近似值,同时提取单元存储位存储的特征值初始位置。
实施例一
通过视觉词袋技术获取图像的128个特征值,随后对128个特征值进行处理。
首先进行划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值。在实施例一中,采用阈值为0.00001,将原先128个特征值数据中,大于0.00001的特征值保留,小于等于0.00001的特征值都删除。阈值的选取根据实际情况确定,譬如许多特征值特别小,则将阈值设置成相对较大。
然后进行排序步骤,将划分步骤保留下来的特征值从大至小排序,保留前N个特征值。譬如划分步骤保留下来28个,那么从大到小排序了之后,保留前面14个特征值,减少了特征值的数量。
最后进行存储步骤,将排序步骤得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。譬如将保留下来的14个特征值通过整型变量(INT)存储。要注意的是,初始位置是指特征值在最初128个特征值中所处的位置。
在实施例一中,用1个整型变量存放1个特征值及其初始位置。也即是,将1个整型变量作为1份单元存储位,单元存储位存储一个特征值及其初始位置的比特位数等于32×1/1=32bit。单元存储位分成两部分,32比特位可以等分成相同的两半,前16bit存储特征值所处的初始位置,后16bit存储特征值乘上固定倍率,或者相互调换亦可。在其他实施例中,32比特位可以不是均等划分。特征值是浮点数,可用float类型存储,需要4字节。实施例一中若要用16个比特位存储,16个比特位表示整数最多是65536,那么就将固定倍率定位65536,可将原先特征值乘上65536,然后取整。这样原先大于等于1/65536的特征值浮点数乘以65535后都可以表示成整数,该整数就可以存放在16比特位空间中,而小于1/65536的将被当成0。
实施例一中的图像对比方法包括了实施例一的数据压缩方法以及还原步骤。还原步骤中,将单元存储位存储的特征值除以固定倍率65536得到原先特征值的近似值,同时提取单元存储位存储的特征值初始位置。最后便可以根据还原所得数据获得最初词袋特征,从而可以进行图像对比。
实施例二
通过视觉词袋技术获取图像的128个特征值,随后对128个特征值进行处理。
首先进行划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值。在实施例二中,采用阈值为0.0001,将原先128个特征值数据中,大于0.0001的特征值保留,小于等于0.0001的特征值都删除。阈值的选取根据实际情况确定,譬如许多特征值特别小,则将阈值设置成相对较大。
然后进行排序步骤,将划分步骤保留下来的特征值从大至小排序,保留前N个特征值。譬如划分步骤保留下来30个,那么从大到小排序了之后,保留前面12个特征值,减少了特征值的数量。
最后进行存储步骤,将排序步骤得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。譬如将保留下来的12个特征值通过整型变量(INT)存储。要注意的是,初始位置是指特征值在最初128个特征值中所处的位置。
在实施例二中,用3个整型变量存放2个特征值及其初始位置。也即是,将3个整型变量等分成2份单元存储位,3个整型变量有96bit,因此单元存储位有32×3/2=48bit,足够用于存储一个特征值及其初始位置。单元存储位分成两部分,48比特位可以分成32bit和16bit,前32bit存储特征值所处的初始位置,后16bit存储特征值乘上固定倍率,或者其他实施例中相互调换亦可。特征值是浮点数,可用float类型存储,需要4字节。实施例二中若要用16个比特位存储,16个比特位表示整数最多是65536,那么就将固定倍率定位65536,可将原先特征值乘上65536,然后取整。这样原先大于等于1/65536的特征值浮点数乘以65535后都可以表示成整数,该整数就可以存放在16比特位空间中,而小于1/65536的将被当成0。
实施例二中的图像对比方法包括了实施例一的数据压缩方法。
本发明的方法通过将特征值划分、筛选后,将特征值和初始位置压缩存储在整型变量中,整个数据量得到极大减少,处理速度得到提高,对存储要求降低,同时也不会影响对比精度,能够适应整个互联网海量的图片对比处理。
实施例三为一种电子设备,其包括:处理器;以及存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时实现实施例一或者二的数据压缩方法和图像对比方法。
实施例四为一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现实施例一或者二的数据压缩方法和图像对比方法。
以上陈述仅以实施例来进一步说明本发明的技术内容,以便于读者更容易理解,但不代表本发明的实施方式仅限于此,任何依本发明所做的技术延伸或再创造,均受本发明的保护。

Claims (8)

1.用于图像对比的数据压缩方法,其特征在于,所述数据压缩方法用于图像对比中的词袋技术获取图像的128个特征值的压缩处理,其包括以下步骤:
划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值;
排序步骤,将上一步保留的特征值从大至小排序,保留前N个特征值;
存储步骤,将上一步得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储;
所述存储步骤中,将Y个整型变量拆分成X份单元存储位,单元存储位存储一个特征值及其初始位置的比特位数等于32×Y/X;
所述单元存储位分成两部分,一部分存储特征值所处的初始位置,另一部分存储特征值乘上固定倍率取整;
所述初始位置是指特征值在最初128个特征值中所处的位置。
2.如权利要求1所述的用于图像对比的数据压缩方法,其特征在于,所述固定倍率为65536。
3.如权利要求1或2所述的用于图像对比的数据压缩方法,其特征在于,Y=1,X=1。
4.如权利要求1或2任一所述的用于图像对比的数据压缩方法,其特征在于,Y=3,X=2。
5.一种图像对比方法,其特征在于,其包括权利要求1-4任一所述的数据压缩方法。
6.一种图像对比方法,其特征在于,其包括权利要求1或2所述的数据压缩方法以及还原步骤;所述还原步骤中,将单元存储位存储的特征值除以固定倍率得到原先特征值的近似值,同时提取单元存储位存储的特征值初始位置。
7.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据权利要求1至6中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至6中任一项所述方法。
CN201811385075.0A 2018-11-20 2018-11-20 用于图像对比的数据压缩方法、图像对比方法及装置 Active CN109544651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811385075.0A CN109544651B (zh) 2018-11-20 2018-11-20 用于图像对比的数据压缩方法、图像对比方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811385075.0A CN109544651B (zh) 2018-11-20 2018-11-20 用于图像对比的数据压缩方法、图像对比方法及装置

Publications (2)

Publication Number Publication Date
CN109544651A CN109544651A (zh) 2019-03-29
CN109544651B true CN109544651B (zh) 2020-03-24

Family

ID=65848502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811385075.0A Active CN109544651B (zh) 2018-11-20 2018-11-20 用于图像对比的数据压缩方法、图像对比方法及装置

Country Status (1)

Country Link
CN (1) CN109544651B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814008B (zh) * 2019-04-11 2023-10-10 杭州海康威视数字技术股份有限公司 数据处理方法、装置、电子设备及存储介质
CN112255942A (zh) * 2020-10-14 2021-01-22 江苏新安电器股份有限公司 一种测试设备数据传输方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102692459A (zh) * 2011-03-22 2012-09-26 Pii有限公司 数据压缩的方法及设备
CN104375990A (zh) * 2013-08-12 2015-02-25 北京拓尔思信息技术股份有限公司 基于sift特征的海量图像实时检索方法
CN106354735A (zh) * 2015-07-22 2017-01-25 杭州海康威视数字技术股份有限公司 一种图像中目标的检索方法和装置
CN107742313A (zh) * 2017-09-26 2018-02-27 华勤通讯技术有限公司 一种应用于矢量空间的数据压缩方法及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104144343B (zh) * 2014-07-11 2017-06-30 东北大学 一种数字图像压缩加密联合编码方法
CN107026999A (zh) * 2016-08-04 2017-08-08 成都小娱网络科技有限公司 一种用于超高清视频处理系统的片外缓存压缩方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102692459A (zh) * 2011-03-22 2012-09-26 Pii有限公司 数据压缩的方法及设备
CN104375990A (zh) * 2013-08-12 2015-02-25 北京拓尔思信息技术股份有限公司 基于sift特征的海量图像实时检索方法
CN106354735A (zh) * 2015-07-22 2017-01-25 杭州海康威视数字技术股份有限公司 一种图像中目标的检索方法和装置
CN107742313A (zh) * 2017-09-26 2018-02-27 华勤通讯技术有限公司 一种应用于矢量空间的数据压缩方法及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A compressed frame buffer to reduce display power consumption in mobile systems;Shim,N Chang,M Pedram;《Proceedings of the2004Asia and South Pacific Design Automation Conference. Piscataway: IEEE Press》;20040130;第818-823页 *
改进视觉词袋模型的快速图象检索方法;张桢伟 等;《计算机系统应用》;20161231;第25卷(第12期);第1468-1477页 *
词袋特征压缩算法比较研究;杨赛 等;《中国图象图形学报》;20131130;第18卷(第11期);第126-131页 *

Also Published As

Publication number Publication date
CN109544651A (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
Jégou et al. On the burstiness of visual elements
CN111382867B (zh) 神经网络压缩的方法、数据处理的方法及相关装置
US10311099B2 (en) Method and system for 3D model database retrieval
CN111680678B (zh) 目标区域识别方法、装置、设备及可读存储介质
CN111401099B (zh) 文本识别方法、装置以及存储介质
CN114549913B (zh) 一种语义分割方法、装置、计算机设备和存储介质
WO2022057406A1 (zh) 一种基于神经网络的自然语言处理方法和电子设备
CN111428805B (zh) 显著性物体的检测方法、模型、存储介质及电子设备
CN109544651B (zh) 用于图像对比的数据压缩方法、图像对比方法及装置
CN107357895B (zh) 一种基于词袋模型的文本表示的处理方法
US20190080226A1 (en) Method of designing neural network system
CN111488732B (zh) 一种变形关键词检测方法、系统及相关设备
US20200202514A1 (en) Image analyzing method and electrical device
CN110134852B (zh) 一种文档的去重方法、设备及可读介质
CN112990172B (zh) 一种文本识别方法、字符识别方法及装置
Xu et al. Multi‐pyramid image spatial structure based on coarse‐to‐fine pyramid and scale space
CN112632280B (zh) 文本分类方法、装置、终端设备及存储介质
CN110619349A (zh) 植物图像分类方法及装置
CN111932438B (zh) 图像风格迁移方法、设备及存储装置
CN111091001B (zh) 一种词语的词向量的生成方法、装置及设备
CN113298892A (zh) 一种图像编码方法和设备,及存储介质
CN112257689A (zh) 人脸识别模型的训练和识别方法、存储介质及相关设备
CN117113174A (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN107220317B (zh) 基于人工智能的匹配度评估方法、装置、设备及存储介质
CN111488400A (zh) 数据分类方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant