CN116610646B - 数据压缩方法、装置、设备及计算机可读存储介质 - Google Patents
数据压缩方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN116610646B CN116610646B CN202310893344.9A CN202310893344A CN116610646B CN 116610646 B CN116610646 B CN 116610646B CN 202310893344 A CN202310893344 A CN 202310893344A CN 116610646 B CN116610646 B CN 116610646B
- Authority
- CN
- China
- Prior art keywords
- data
- voice
- level
- voice data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000013144 data compression Methods 0.000 title claims abstract description 38
- 238000004891 communication Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 5
- 238000007906 compression Methods 0.000 description 19
- 230000006835 compression Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013502 data validation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请实施例涉及数据压缩技术领域,公开了一种数据压缩方法,该方法包括:获取数据;对数据进行语义分析,以确定数据中满足预定条件的数据;清除至少部分满足预定条件的数据中的至少部分内容,得到压缩后的数据。通过上述方式,本申请实施例实现了能够在完整保留重要数据的基础上,得到数据量较小的压缩数据。
Description
技术领域
本申请实施例涉及数据压缩技术领域,具体涉及一种数据压缩方法、装置、设备及计算机可读存储介质。
背景技术
随着时代的发展,各种数据的数据量越来越大,为了能够节省数据存储和传输时所需要的时间以及内存,目前市面上会对数据根据不同的压缩算法进行压缩,得到数据压缩包以方便存储和传输。不同的压缩算法具有不同的作用,对于用户而言,如果采用有损压缩算法生成数据压缩包,容易造成重要数据的损失,而对于采用无损压缩算法所生成的数据压缩包,虽然完整地保存了重要数据,但压缩后的数据量依然较大,还是会占用较多的存储空间。因此,如何在完整保留重要数据的基础上对数据进行压缩,以得到数据量小的压缩数据成为了需要解决的问题。
发明内容
鉴于上述问题,本申请实施例提供了一种数据压缩方法、装置、设备及计算机可读存储介质,能够在完整保留重要数据的基础上,得到数据量较小的压缩数据。
根据本申请实施例的一个方面,提供了一种数据压缩方法,所述方法包括:
获取数据;
对所述数据进行语义分析,以确定所述数据中满足预定条件的数据;
清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据。
在一种可选的方式中,所述获取数据包括:
获取图像数据;
所述对所述数据进行语义分析,以确定所述数据中满足预定条件的数据,包括:
对所述图像数据进行语义分析,以将所述图像数据中满足第一预定条件的目标区域框出;
所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,包括:
清除至少部分所述目标区域中的至少部分图像内容,得到压缩后的图像数据。
在一种可选的方式中,所述对所述图像数据进行语义分析,以将所述图像数据中满足第一预定条件的目标区域框出,包括:
对所述图像数据进行语义分析,通过边界框框出其中满足所述第一预定条件的多个目标区域,其中,多个边界框具有不同的语义属性;
根据语义属性为与其对应的边界框分配等级标识;
所述清除至少部分所述目标区域中的至少部分图像内容,得到压缩后的图像数据,包括:
针对最低等级标识,清除与其对应的边界框内的图像内容;
针对最高等级标识,保留与其对应的边界框内的图像内容,得到所述压缩后的图像数据。
在一种可选的方式中,所述获取数据,包括:
获取混合多种声音的语音数据;
所述对所述数据进行语义分析,以确定所述数据中满足预定条件的数据,包括:
对所述混合多种声音的语音数据进行语义分析得到多条具有不同声纹的语音数据,从所述多条具有不同声纹的语音数据中确定满足第二预定条件的语音数据;
所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,包括:
清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据。
在一种可选的方式中,所述清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据之前,所述方法还包括:
根据声纹的语义属性为于其对应的语音数据分配等级标识;
所述清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据,包括:
针对最低等级标识,清除与其对应的语音数据的语音内容;
针对最高等级标识,保留与其对应的语音数据的语音内容,得到所述压缩后的语音数据。
在一种可选的方式中,所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,包括:
针对第一等级标识,采用均匀降采样以清除至少部分所述满足预定条件的数据中的至少部分内容,其中,所述第一等级标识的等级值介于所述最低等级标识与所述最高等级标识之间。
在一种可选的方式中,所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,包括:
针对第二等级标识,采用均匀降采样以清除与其对应的边界框内的部分图像内容,其中,所述第二等级标识的等级值介于所述第一等级标识与所述最高等级标识之间,对所述第二等级标识进行均匀降采样的采样率高于对所述第一等级标识进行均匀降采样的采样率。
根据本申请实施例的另一方面,提供了一种数据压缩装置,包括:
数据获取模块,用于获取数据;
数据确认模块,用于对所述数据进行语义分析,以确定所述数据中满足预定条件的数据;
数据清除模块,用于清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据。
根据本申请实施例的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述任一实施例所述的数据压缩方法的操作。
根据本申请实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令在运行时执行上述任一实施例所述的数据压缩方法的操作。
本申请实施例通过清除至少部分满足预定条件的数据中的至少部分内容,得到压缩后的数据,实现了数据量的减小,对于重要程度高的数据,对其不进行处理,即完全保留重要程度高的数据,以实现对原始数据的压缩的同时,完整地保留了重要数据。
上述说明仅是本申请实施例技术方案的概述,为了能够更清楚了解本申请实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的第一种数据压缩方法的流程示意图;
图2示出了本申请实施例提供的第二种数据压缩方法的流程示意图;
图3示出了本申请实施例提供的第三种数据压缩方法的流程示意图;
图4示出了本申请实施例提供的第四种数据压缩方法的流程示意图;
图5示出了本申请实施例提供的第五种数据压缩方法的流程示意图;
图6示出了本申请实施例提供的数据压缩装置的结构示意图;
图7示出了本申请实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。
发明人注意到,现有技术中一般采用无损压缩和有损压缩对数据进行压缩,但二者均存在弊端,例如,通过损压缩算法压缩数据生成数据压缩包,容易造成数据中重要数据的损失,而通过无损压缩算法压缩数据生成数据压缩包,虽然完整地保存了重要数据,但不重要数据也相应完整保存,数据压缩包的数据量较大,失去原本压缩的意义。因此,如何实现在完整保留重要数据的基础上对数据进行压缩得到数据量小的数据压缩包成为了需要解决的问题。
发明人经过深入研究,发明了一种数据压缩算法,通过对获取的数据进行语义分析,以确定数据中满足预定条件的数据,从而区分数据中的重要数据和不重要数据。然后通过清除至少部分满足预定条件的数据中的至少部分内容,将不重要数据的至少部分内容进行清除,将重要数据保留,以实现对原始数据的压缩的同时,完整地保留了重要数据。
图1示出了本申请实施例提供的第一种数据压缩方法的流程图,该方法由计算设备执行。该计算设备可以是包括一个或多个处理器的计算设备,该处理器可能是中央处理器CPU,或者是ASIC(Application Specific Integrated Circuit,特定集成电路),或者是被配置成实施本申请实施例的一个或多个集成电路,在此不做限定。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC,在此不做限定。根据本申请实施例的第一方面,如图1所示,该方法包括如下步骤:
步骤110:获取数据。
数据可以是图像数据、语音数据或文本数据等类型的数据。根据数据的类型不同,后续针对类型不同的数据所采用的的压缩方法不同。
步骤120:对数据进行语义分析,以确定数据中满足预定条件的数据。
由于数据的类型不同或者应用场景不同,预定条件随着用户的需求发生改变,使得针对数据进行语义分析后得到的语义分析结果也不同。具体地,若数据为图像数据,图像中包括多个颜色的物体,其中用户需要对红色的物体和黑色的物体进行处理,用户预设的预定条件为红色的物体和黑色的物体,对图像数据进行语义分析后可以确定该图像数据中红色的物体和黑色的物体的图像数据。若数据为语音数据,预定条件可以是语音的类型,比如人声和雨声,对语音数据进行语义分析后可以确定该语音数据中的人声和雨声的语音数据。
步骤130:清除至少部分满足预定条件的数据中的至少部分内容,得到压缩后的数据。
无论是图像数据、语音数据还是其他类型的数据中,都会存在对于用户而言重要程度高或低的数据,对于重要程度较低的数据,清除其中的至少部分数据,也可以全部清除,以实现数据量的减小,对于重要程度高的数据,对其不进行处理,即完全保留重要程度高的数据,以实现对原始数据的压缩的同时,完整地保留了重要数据。
图2示出了本申请实施例提供的第二种数据压缩方法的流程图,在一些实施例中,如图2所示,步骤110包括步骤a01:获取图像数据。
图像数据中包括至少一个目标,每个目标均具有至少一种语义,语义的类型并不唯一,例如,目标可以为穿黑衣服的人,目标的语义可以是人,也可以是黑衣服,目标的语义具体根据预定条件决定。
步骤120包括步骤a02:对图像数据进行语义分析,以将图像数据中满足第一预定条件的目标区域框出。
对图像数据进行语义分析,得到图像数据中的每个目标的语义,语义分析的结果根据预设的第一预定条件决定,第一预定条件根据用户的需求设置,例如对于图像中目标为穿黑衣服的人,用户只需要知道目标为人即可,不需要知道目标为穿黑衣服的人,那么根据第一预定条件对目标进行识别得到目标的语义为人的结果,并且对该目标于图像中的区域用边界框框出。
步骤130包括步骤a03:清除至少部分目标区域中的至少部分图像内容,得到压缩后的图像数据。
当图像数据中仅包括一个目标时,若该目标为用户认为是不重要的目标时,将清除该目标于图像中的目标区域的所有图像数据,或者若该目标为用户认为是重要程度较低的目标时,将清除该目标于图像中的目标区域的部分图像数据,保留该目标区域中剩余的图像数据以方便后续向用户展示该图像时,用户可以获取该目标区域的图像内容。
当图像数据中包括多个目标时,针对每个目标判断其对于用户的重要程度,若目标的重要程度高,将完全保留该目标于图像中的目标区域的图像数据,若目标的重要程度低,将清除该目标于图像中的目标区域的部分图像数据,若目标完全不重要,将清除该目标于图像中的目标区域的所有图像数据。
图3示出了本申请实施例提供的第三种数据压缩方法的流程图,在一些实施例中,如图3所示,步骤a02包括以下步骤:
步骤b01:对图像数据进行语义分析,通过边界框框出其中满足第一预定条件的多个目标区域,其中,多个边界框具有不同的语义属性。
边界框可以是矩形、圆形或是其他形状的边界框,图像中包括多个目标,针对每个目标均需要通过边界框框出,每个边界框均具有语义属性,通过给边界框标记语义属性以表明边界框于图像中框出的目标区域的图像数据的语义。
例如,图像中可包括人、楼房和道路等其他目标,需要将人、楼房和道路都用边界框框出,每个边界框均具有语义属性。图像也可以包括多个人,生成与人数对应的边界框以用边界框框出每个人。例如,图像中存在五个人,根据第一预定条件对图像进行语义识别,将会在图像中生成五个边界框,每个边界框对应一个人。
步骤b02:根据语义属性为与其对应的边界框分配等级标识。
由于用户的需求不同,在不同的应用场景中,根据边界框的语义属性给边界框分配不同的等级标识。例如,在城市道路交通中,若用户想要知道一个城市的道路交通,对于用户而言,道路旁边的楼房以及行人就不重要,图像中最重要的图像内容就是城市道路的布局,因此为楼房和行人分配最低等级标识,为道路分配最高等级标识,以供后续对具有不同语义属性的目标进行不同的处理。
步骤a03包括以下步骤:
步骤b03:针对最低等级标识,清除与其对应的边界框内的图像内容;
步骤b04:针对最高等级标识,保留与其对应的边界框内的图像内容,得到压缩后的图像数据。
对于用户而言,具有最低等级标识的边界框内的图像内容为不重要的目标,因此,将具有最低等级标识的边界框内的图像内容全部清除仅保留边界框,通过保留边界框,虽然图像中该区域的图像内容已经清除,但可以根据边界框的语义属性可以确定图像中该区域清除前的图像内容。例如,在城市道路交通中,若用户想要知道一个城市的道路交通,对于用户而言,道路旁边的楼房以及行人就不重要,将框出楼房和行人的边界框内的楼房和行人清除,仅保留边界框,用边界框替代完整的图像内容,用户可以通过保留的边界框的语义(楼房、行人)知晓该图片于该图像区域的图像内容为楼房或行人。
步骤b03和步骤b04可以是同时进行,也可以是先后分别进行,根据实际需要设置即可。
在一些实施例中,步骤130还包括:针对第一等级标识,采用均匀降采样以清除至少部分满足预定条件的数据中的至少部分内容,其中,第一等级标识的等级值介于最低等级标识与最高等级标识之间。
在一些应用场景中,存在一些用户认为重要程度较低的目标,根据用户预设的预定条件可以筛选出用户认为重要程度较低的目标。针对这些目标,通过均匀降采样清除至少部分满足预定条件的数据中的至少部分内容,保留了重要程度较低的目标的图像内容,但又对其进行了一定程度上的压缩,减小了图像的数据量。例如,一些城市的道路交通较为复杂,道路的构建和周边的建筑息息相关,对于用户而言,想要获取道路的情况,仅保留建筑的边界框明显是不够的,至少需要保留建筑的外形结构。针对上述情况,为图像中边界框的建筑分配第一等级标识,根据第一等级标识,采用均匀降采样清除边界框内的建筑图像内容,具体地将建筑图像内容划分为多个小格,每个小格中具有部分建筑图像内容的像素,对于每个小格,仅保留一个像素点,删除其余像素点,以实现对边界框内的建筑图像内容的部分清除。
在一些实施例中,步骤130还包括:针对第二等级标识,采用均匀降采样以清除与其对应的边界框内的部分图像内容,其中,第二等级标识的等级值介于第一等级标识与最高等级标识之间,对第二等级标识进行均匀降采样的采样率高于对第一等级标识进行均匀降采样的采样率。
在为重要程度较低的目标分配第一等级标识的基础上,用户认为图像中存在有目标,其重要程度高于分配了第一等级标识的目标,但又低于分配了最高等级标识的目标。根据用户预设的预定条件筛选出该目标,针对该目标,通过均匀降采样清除至少部分满足预定条件的数据中的至少部分内容,清除的部分内容少于分配了第一等级标识的目标,保留了更多的该目标的图像内容,但又对其进行了一定程度上的压缩,减小了图像的数据量。根据第二等级标识,采用均匀降采样清除边界框内的图像内容,将图像内容划分为多个小格,但在边界框大小相同的情况下,针对第二等级标识的图像内容所划分的小格的数量多于针对具有第一等级标识的图像内容所划分的小格的数量,小格的数量越多,保留的像素点越多,图像内容越清晰。
在一些实施例中,针对第一等级标识和第二等级标识所采用的不同的图像内容的划分的小格的数量,可以根据贪心算法和遗传算法进行选取,具体的选取过程为现有技术,在此不做赘述。例如在边界框框出的像素范围为360×240的图像区域内,通过贪心算法和遗传算法,针对第一等级标识,需要将该边界框框出的图像区域划分为1000个小格,而针对第二等级标识,需要将该边界框框出的图像区域划分为3000个小格。划分的小格的数量也可以为其他数量,根据实际需要设置。
在一些实施例中,除了第一等级标识、第二等级标识、最低等级标识和最高等级标识,还存在其他等级标识用于体现目标的重要程度,针对其他等级标识的图像区域所划分的小格的数量,根据实际需要设置。
在一些实施例中,除了应用于城市交通的图像数据中,还可以应用于机器人智能感知领域,由于机器人的计算处理能力有限,其采集的图像数据进行识别后,可以对图像数据进行处理,以将机器人的移动路径、移动路径上的障碍物、目标物以及其他物体进行分级压缩,例如为移动路径和目标物分配最高等级标识,以保证机器人的路线移动以及更准确地抓取目标物,对障碍物分配第一等级标识,仅保留障碍物的形状特征,以让机器人在移动时可以绕过障碍物,将其他不相关物体分配最低等级标识,将其他物体全部清除,通过上述方式对图像数据进行压缩,可以减小机器人的计算量。
此外,还可以应用于AR技术领域,AR技术领域需要对周围的环境进行图像识别,但是环境中存在大量不重要的物体,为这部分物体分配最低等级标识以全部清除可以减小计算量。
或者也可以应用于网络带宽较小的场景,仅给重要数据分配最高等级标识,其余数据均分配最低等级标识,以传递重要数据。本方法不止局限于上述提到的情形,还可以适用于其他需要进行对数据进行分级压缩的应用场景。
通过上述步骤,在保留用户需要的重要数据的基础上,对其他不重要或次重要的数据进行压缩,从而得到数据量小的图像数据,实现对图像数据的压缩处理,方便了用户传输或存储图像数据。
图4示出了本申请实施例提供的第四种数据压缩方法的流程图,在一些实施例中,如图4所示,步骤110包括步骤c01:获取混合多种声音的语音数据。
语音数据中混合有多种声音,例如不同人的声音、雨声和雷声等声音,每种声音均具有一种语义,语义的属性和声音的类型直接相关。
步骤120包括步骤c02:对混合多种声音的语音数据进行语义分析得到多条具有不同声纹的语音数据,从多条具有不同声纹的语音数据中确定满足第二预定条件的语音数据。
每条语音数据的声纹均不相同,根据声纹可以将混合多种声音的语音数据分为多条不同的语音数据,例如可以将不同类型的声音区分(人声、雷声、雨声),也可以将不同人说的话进行区分(说话人A的声音、说话人B的声音)。第二预定条件为根据声纹为每条语音数据赋予语义,例如,分析完混合多种声音的语音数据后,将其中说话人A说的话的语音数据赋予说话人A的语义,将其中环境音中的雷声的语音数据赋予雷声的语义。
步骤130包括步骤c03:清除至少部分满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据。
图5示出了本申请实施例提供的第五种数据压缩方法的流程图,在一些实施例中,如图5所示,在一些实施例中,在步骤c03之前,该方法还包括步骤d01:根据声纹的语义属性为于其对应的语音数据分配等级标识。
由于用户的需求不同,在不同的应用场景中,根据声纹的语义属性给予该声纹对应的语音数据分配不同的等级标识。例如,在一场露天演讲中,获取了完整的演讲录音,其中有演讲者的声音、观众的声音、环境音和杂音等声音。根据用户认为的声音的重要程度为每个声音分配等级标识,以供后续对语音数据进行压缩。
步骤c03包括以下步骤:
步骤d02:对最低等级标识,清除与其对应的语音数据的语音内容;
步骤d03:针对最高等级标识,保留与其对应的语音数据的语音内容,得到压缩后的语音数据。
对于用户而言,在演讲环境下,演讲者的声音为用户认为最重要的声音,因此为演讲者的声音分配最高等级标识,以完整保留演讲者的声音,为观众的声音、环境音以及杂音分配最低等级标识,以清除观众的声音、环境音以及杂音。
步骤d02和步骤d03可以是同时进行,也可以是先后进行,根据实际需要设置即可。
在一些实施例中,步骤130还包括:针对第一等级标识,采用均匀降采样以清除至少部分满足预定条件的数据中的至少部分内容,其中,第一等级标识的等级值介于最低等级标识与最高等级标识之间。
为了保证演讲的真实性,用户可能需要适当保留观众的声音,因此分配第一等级标识给具有观众的声音的语义的语音数据,对该语音数据进行降码率处理,减小该语音数据的数据量,从而减小混合多种声音的语音数据的数据量。
本申请方案除了应用于演讲场景外,还可以应用于声音监测领域,为待监测声音分配最高等级标识,以保留完整的声音进行监测。或者还可以应用于其他需要保留重要声音数据的应用场景,根据实际需要设置。
通过上述步骤,在保留用户需要的重要语音数据的基础上,对其他不重要的语音数据进行压缩,从而得到数据量小的混合多种声音的语音数据,实现对混合多种声音的语音数据的压缩处理,方便了用户传输或存储语音数据。
除了对图像数据和语音数据进行数据压缩外,还可以对文本数据进行压缩,或者也可以对其他类型的数据进行压缩,根据实际需要设置。
通过步骤110至步骤130,实现了在保留用户需要的重要数据的基础上,对其他不重要的数据进行压缩处理,从而得到数据量小的压缩数据,实现对数据的压缩处理,方便了用户的传输或存储。
图6示出了本申请实施例提供的数据压缩装置200的结构示意图。如图2所示,该装置包括:
数据获取模块201,用于获取数据;
数据确认模块202,用于对数据进行语义分析,以确定数据中满足预定条件的数据;
数据清除模块203,用于清除至少部分满足预定条件的数据中的至少部分内容,得到压缩后的数据。
在一些实施例中,数据获取模块201用于获取图像数据。数据确认模块202用于对图像数据进行语义分析,以将图像数据中满足第一预定条件的目标区域框出。数据清除模块203用于清除至少部分目标区域中的至少部分图像内容,得到压缩后的图像数据。
在一些实施例中,数据确认模块202用于对图像数据进行语义分析,通过边界框框出其中满足第一预定条件的多个目标区域,其中,多个边界框具有不同的语义属性,并根据语义属性为与其对应的边界框分配等级标识。数据清除模块203用于针对最低等级标识,清除与其对应的边界框内的图像内容,针对最高等级标识,保留与其对应的边界框内的图像内容,得到压缩后的图像数据。
在一些实施例中,数据获取模块201用于获取混合多种声音的语音数据。数据确认模块202用于对混合多种声音的语音数据进行语义分析得到多条具有不同声纹的语音数据,从多条具有不同声纹的语音数据中确定满足第二预定条件的语音数据。数据清除模块203用于清除至少部分满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据。
在一些实施例中,该装置还包括:语音数据等级标识分配模块,用于根据声纹的语义属性为于其对应的语音数据分配等级标识。
数据清除模块203用于针对最低等级标识,清除与其对应的语音数据的语音内容,针对最高等级标识,保留与其对应的语音数据的语音内容,得到压缩后的语音数据。
在一些实施例中,数据清除模块203用于针对第一等级标识,采用均匀降采样以清除至少部分满足预定条件的数据中的至少部分内容,其中,第一等级标识的等级值介于最低等级标识与最高等级标识之间。
在一些实施例中,数据清除模块203用于针对第二等级标识,采用均匀降采样以清除与其对应的边界框内的部分图像内容,其中,第二等级标识的等级值介于第一等级标识与最高等级标识之间,对第二等级标识进行均匀降采样的采样率高于对第一等级标识进行均匀降采样的采样率。
图7示出了本申请实施例提供的计算设备的结构示意图,本申请具体实施例并不对计算设备的具体实现做限定。
如图7所示,该计算设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述用于数据压缩方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机可执行指令。
处理器302可能是中央处理器CPU,或者是特定集成电路(Application SpecificIntegrated Circuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存储程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
本申请实施例提供了一种计算机可读存储介质,存储介质存储有可执行指令,该可执行指令在计算设备上运行时,使得计算设备执行上述任意方法实施例中的数据压缩方法。
Claims (6)
1.一种数据压缩方法,其特征在于,所述方法包括:
获取数据及第一预定条件,其中,所述第一预定条件根据用户的需求设置;
对所述数据进行语义分析,以确定所述数据中满足预定条件的数据;
清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据;
其中,所述获取数据,包括:
获取图像数据;
所述对所述数据进行语义分析,以确定所述数据中满足预定条件的数据,包括:
对所述图像数据进行语义分析,通过边界框框出其中满足所述第一预定条件的多个目标区域,其中,多个边界框具有不同的语义属性;
根据语义属性为与其对应的边界框分配等级标识,其中,在不同的应用场景中,根据语义属性为与其对应的边界框分配不同的等级标识;
所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,包括:
针对最低等级标识,清除与其对应的边界框内的图像内容,且保留与其对应的边界框;
针对最高等级标识,保留与其对应的边界框内的图像内容,得到所述压缩后的图像数据;
所述获取数据,还包括:
获取混合多种声音的语音数据;
所述对所述数据进行语义分析,以确定所述数据中满足预定条件的数据,还包括:
对所述混合多种声音的语音数据进行语义分析得到多条具有不同声纹的语音数据,从所述多条具有不同声纹的语音数据中确定满足第二预定条件的语音数据;
所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,还包括:
清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据;
所述清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据之前,所述方法还包括:
根据声纹的语义属性为于其对应的语音数据分配等级标识;
所述清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据,包括:
针对最低等级标识,清除与其对应的语音数据的语音内容;
针对最高等级标识,保留与其对应的语音数据的语音内容,得到所述压缩后的语音数据。
2. 根据权利要求1所述的数据压缩方法,其特征在于, 所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,还包括:
针对第一等级标识,采用均匀降采样以清除至少部分所述满足预定条件的数据中的至少部分内容,其中,所述第一等级标识的等级值介于所述最低等级标识与所述最高等级标识之间。
3.根据权利要求2所述的数据压缩方法,其特征在于,所述清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,还包括:
针对第二等级标识,采用均匀降采样以清除与其对应的边界框内的部分图像内容,其中,所述第二等级标识的等级值介于所述第一等级标识与所述最高等级标识之间,对所述第二等级标识进行均匀降采样的采样率高于对所述第一等级标识进行均匀降采样的采样率。
4.一种数据压缩装置,其特征在于,所述装置包括:
数据获取模块,用于获取数据及第一预定条件,其中,所述第一预定条件根据用户的需求设置,还用于获取图像数据和获取混合多种声音的语音数据;
数据确认模块,用于对所述数据进行语义分析,以确定所述数据中满足预定条件的数据,还用于对所述图像数据进行语义分析,通过边界框框出其中满足所述第一预定条件的多个目标区域,其中,多个边界框具有不同的语义属性,并根据语义属性为与其对应的边界框分配等级标识,其中,在不同的应用场景中,根据语义属性为与其对应的边界框分配不同的等级标识,还用于对所述混合多种声音的语音数据进行语义分析得到多条具有不同声纹的语音数据,从所述多条具有不同声纹的语音数据中确定满足第二预定条件的语音数据;
数据清除模块,用于清除至少部分所述满足预定条件的数据中的至少部分内容,得到压缩后的数据,还用于针对最低等级标识,清除与其对应的边界框内的图像内容,且保留与其对应的边界框,针对最高等级标识,保留与其对应的边界框内的图像内容,得到所述压缩后的图像数据,还用于清除至少部分所述满足第二预定条件的语音数据的至少部分语音内容,得到压缩后的语音数据,并用于根据声纹的语义属性为于其对应的语音数据分配等级标识,针对最低等级标识,清除与其对应的语音数据的语音内容,针对最高等级标识,保留与其对应的语音数据的语音内容,得到所述压缩后的语音数据。
5.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-3中任一项所述的数据压缩方法的操作。
6.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在运行时执行如权利要求1-3中任一项所述的数据压缩方法的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310893344.9A CN116610646B (zh) | 2023-07-20 | 2023-07-20 | 数据压缩方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310893344.9A CN116610646B (zh) | 2023-07-20 | 2023-07-20 | 数据压缩方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116610646A CN116610646A (zh) | 2023-08-18 |
CN116610646B true CN116610646B (zh) | 2024-04-02 |
Family
ID=87684030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310893344.9A Active CN116610646B (zh) | 2023-07-20 | 2023-07-20 | 数据压缩方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116610646B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145277A (zh) * | 2019-12-31 | 2020-05-12 | 山东浪潮人工智能研究院有限公司 | 一种深度语义感知与bpg压缩工具的图像压缩方法 |
CN112650842A (zh) * | 2020-12-22 | 2021-04-13 | 平安普惠企业管理有限公司 | 基于人机交互的客服机器人意图识别方法及相关设备 |
CN112839223A (zh) * | 2020-12-23 | 2021-05-25 | 深圳酷派技术有限公司 | 图像压缩方法、装置、存储介质及电子设备 |
CN113771859A (zh) * | 2021-08-31 | 2021-12-10 | 智新控制系统有限公司 | 智能行车干预方法、装置、设备及计算机可读存储介质 |
CN114586359A (zh) * | 2020-09-30 | 2022-06-03 | 华为技术有限公司 | 一种图像处理方法及装置 |
CN115249276A (zh) * | 2022-08-04 | 2022-10-28 | 中国电信股份有限公司 | 图像压缩方法、装置、电子设备及存储介质 |
CN116127106A (zh) * | 2023-01-07 | 2023-05-16 | 北京师范大学 | 基于区块链的互联网图像大数据智能存储方法与系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170069306A1 (en) * | 2015-09-04 | 2017-03-09 | Foundation of the Idiap Research Institute (IDIAP) | Signal processing method and apparatus based on structured sparsity of phonological features |
-
2023
- 2023-07-20 CN CN202310893344.9A patent/CN116610646B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145277A (zh) * | 2019-12-31 | 2020-05-12 | 山东浪潮人工智能研究院有限公司 | 一种深度语义感知与bpg压缩工具的图像压缩方法 |
CN114586359A (zh) * | 2020-09-30 | 2022-06-03 | 华为技术有限公司 | 一种图像处理方法及装置 |
CN112650842A (zh) * | 2020-12-22 | 2021-04-13 | 平安普惠企业管理有限公司 | 基于人机交互的客服机器人意图识别方法及相关设备 |
CN112839223A (zh) * | 2020-12-23 | 2021-05-25 | 深圳酷派技术有限公司 | 图像压缩方法、装置、存储介质及电子设备 |
CN113771859A (zh) * | 2021-08-31 | 2021-12-10 | 智新控制系统有限公司 | 智能行车干预方法、装置、设备及计算机可读存储介质 |
CN115249276A (zh) * | 2022-08-04 | 2022-10-28 | 中国电信股份有限公司 | 图像压缩方法、装置、电子设备及存储介质 |
CN116127106A (zh) * | 2023-01-07 | 2023-05-16 | 北京师范大学 | 基于区块链的互联网图像大数据智能存储方法与系统 |
Non-Patent Citations (1)
Title |
---|
利用MPEG图像压缩技术传输和控制小卫星图像;Lefevre D K, Heiberger M, 孙永明;空间电子技术;19960229(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116610646A (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950723B (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
CN107222795B (zh) | 一种多特征融合的视频摘要生成方法 | |
CN105915953A (zh) | 直播视频鉴别的方法、装置和系统 | |
US10810462B2 (en) | Object detection with adaptive channel features | |
CN110807757A (zh) | 基于人工智能的图像质量评估方法、装置及计算机设备 | |
CN114679607B (zh) | 一种视频帧率控制方法、装置、电子设备及存储介质 | |
CN106060544B (zh) | 一种图像编码方法、相关设备及系统 | |
CN110677718B (zh) | 一种视频识别方法和装置 | |
CN106027854A (zh) | 一种应用于相机中适于fpga实现的联合滤波降噪方法 | |
CN116610646B (zh) | 数据压缩方法、装置、设备及计算机可读存储介质 | |
CN110913118A (zh) | 视频处理方法、装置及存储介质 | |
CN111861204A (zh) | 基于智能平台的课程移动学习评价系统及方法 | |
CN115687696A (zh) | 一种用于客户端的流媒体视频播放方法及相关装置 | |
CN114513681A (zh) | 一种视频处理系统、方法、装置、电子设备和存储介质 | |
CN115150767A (zh) | 一种基于边缘计算的无线传感网络数据传输方法 | |
CN112036517B (zh) | 图像缺陷分类方法、装置及电子设备 | |
CN110490084B (zh) | 目标物体的检测方法、装置、网络设备及存储介质 | |
CN114299415A (zh) | 一种视频切分方法、装置、电子设备以及存储介质 | |
CN109784226B (zh) | 人脸抓拍方法及相关装置 | |
JPH10171822A (ja) | メディア適応型情報共有装置 | |
CN112671845A (zh) | 数据处理方法、装置、电子设备、存储介质及云端系统 | |
CN112001842A (zh) | 图片生成方法、装置、电子设备及计算机可读存储介质 | |
CN113259680B (zh) | 视频流解码方法、装置、计算机设备和存储介质 | |
CN117834724B (zh) | 一种基于大数据分析的视频学习资源管理系统 | |
CN115278290B (zh) | 一种基于边缘节点的虚拟现实视频缓存方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |