CN112379891A - 一种数据处理方法和装置 - Google Patents

一种数据处理方法和装置 Download PDF

Info

Publication number
CN112379891A
CN112379891A CN202011075347.4A CN202011075347A CN112379891A CN 112379891 A CN112379891 A CN 112379891A CN 202011075347 A CN202011075347 A CN 202011075347A CN 112379891 A CN112379891 A CN 112379891A
Authority
CN
China
Prior art keywords
resource
target
information
identification information
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011075347.4A
Other languages
English (en)
Other versions
CN112379891B (zh
Inventor
黄洪彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Boguan Information Technology Co Ltd
Original Assignee
Guangzhou Boguan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Boguan Information Technology Co Ltd filed Critical Guangzhou Boguan Information Technology Co Ltd
Priority to CN202011075347.4A priority Critical patent/CN112379891B/zh
Publication of CN112379891A publication Critical patent/CN112379891A/zh
Application granted granted Critical
Publication of CN112379891B publication Critical patent/CN112379891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据处理方法和装置,所述方法包括:获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。本发明实施例可以实现快速识别出目标资源中的冗余资源。

Description

一种数据处理方法和装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据处理方法和一种数据处理装置。
背景技术
在软件开发过程中,经常会需要迭代已有的软件资源;在资源迭代过程中不可避免的会导致资源数量越来越多,客户端越来越大。但是被迭代后的资源,一般是不需要继续存在于更新后的客户端中。
现有对迭代后的资源的删除方式是,通过人工地方式在客户端对应的工程中查找其是否被引用。对名称有指定格式后缀的资源,还去要根据其前缀再进行全局查找才能确定是否能够被删除,而且需要人工地逐个筛选资源,使得删除工程中迭代后的无用资源的效率较低。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据处理方法和相应的一种数据处理装置。
为了解决上述问题,本发明实施例公开了一种数据处理方法,包括:
获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;
根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。
可选地,所述方法还包括:
若所述冗余资源为静态资源,确定所述冗余资源为待删除资源;
响应于删除操作,删除所述待删除资源。
可选地,所述方法还包括:
根据所述冗余资源生成待筛选冗余资源列表;所述待筛选冗余资源列表包含所述冗余资源的标识信息。
可选地,在所述根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源之前,所述方法包括:
根据所述标识信息判断所述目标资源是否为静态资源。
可选地,所述根据所述标识信息判断所述目标资源是否为静态资源的步骤,包括:
判断所述标识信息是否包含特征后缀信息;
若是,则确定所述目标资源为动态资源;
若否,则确定所述目标资源为静态资源;
其中,所述动态资源为由多个静态资源组成的数据。
可选地,若目标资源为动态资源,所述根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源的步骤,包括:
提取所述目标资源的标识信息中除特征后缀信息以外的前缀信息;
判断是否存在与所述前缀信息匹配的资源引用信息;
若否,则确定所述目标资源为冗余资源。
可选地,所述特征文件具有类型信息;所述判断是否存在与所述前缀信息匹配的资源引用信息的步骤,包括:
采用所述前缀信息构建与所述类型信息对应的第一正则表达式;
调用预设函数依据所述第一正则表达式遍历与其类型信息对应的特征文件的资源引用信息;
接收所述预设函数返回的第一布尔值;
若所述第一布尔值为第一预设值,则确定存在与所述前缀信息匹配的资源引用信息;
若所述第一布尔值为第二预设值,则确定不存在与所述前缀信息匹配的资源引用信息。
可选地,若所述目标资源为静态资源,所述根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源据的步骤,包括:
判断是否存在与所述目标资源的标识信息匹配的资源引用信息;
若否,则确定所述目标资源为冗余资源。
可选地,所述特征文件具有类型信息;所述判断是否存在与所述目标资源的标识信息匹配的资源引用信息的步骤,包括:
采用所述目标资源的标识信息构建与所述类型信息对应的第二正则表达式;
调用预设函数依据所述第二正则表达式遍历与其类型信息对应的特征文件的资源引用信息;
接收所述预设函数返回的获取第二布尔值;
若所述第二布尔值为第一预设值,则确定存在与所述标识信息匹配的资源引用信息;
若所述第二布尔值为第二预设值,则确定不存在与所述标识信息匹配的资源引用信息。
本发明实施例还公开了一种数据处理装置,包括:
获取模块,用于获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;
识别模块,用于根据所述目标目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。
本发明实施例还公开了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的数据处理方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,在获取指定目录下的目标资源和特征文件后,由于目标资源包括标识信息,特征文件包含资源引用信息,而资源引用信息为特征文件包引用的目标资源的标识信息,则可以通过目标资源的标识信息和资源引用信息,判断任一目标资源是否为特征文件引用的目标资源,如果不是,则确定该目标资源为冗余资源,从而实现对目标资源进行快速识别,确定出目标资源中的冗余资源。
附图说明
图1是本发明的一种数据处理方法实施例的步骤流程图;
图2是本发明的一种数据处理方法流程示意图;
图3是本发明的一种数据处理装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;
目标资源可以是指定目录下的资源数据,该指定目录可以与指定的客户端对应,即获取与客户端对应的资源数据;该指定目录也可以为指定的工程文件夹及其子文件夹。
目标资源可以为图片、视频、音频等资源文件中的一种或多种。
具体的,可以先确定需要获取的目标资源的资源格式,并从指定目录中遍历筛选与资源格式匹配的目标资源。其中,以图像资源为例,可以先确定图像资源的资源格式包括JPG、PNG、JPEG、BMP、TIF、PSD等,然后遍历指定目录所包含的数据,筛选出格式为上述资源格式的目标资源。特征文件为引用目标资源的文件,特征文件中记载其引用的目标资源的标识信息,即资源引用信息。
步骤102,根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。
可以根据目标资源的标识信息和资源引用信息的匹配情况,识别出目标资源资源中的冗余资源,其中,冗余资源为没有被任一特征文件引用的目标资源。
在本发明实施例中,在获取指定目录下的目标资源和特征文件后,由于目标资源包括标识信息,特征文件包含资源引用信息,而资源引用信息为特征文件包引用的目标资源的标识信息,则可以通过目标资源的标识信息和资源引用信息,判断任一目标资源是否为特征文件引用的目标资源,如果不是,则确定该目标资源为冗余资源,从而实现对目标资源进行快速识别,确定出目标资源中的冗余资源。
在本发明的一种可选实施例中,本发明实施例还可以包括:
若所述冗余资源为静态资源,确定所述冗余资源为待删除资源;响应于删除操作,删除所述待删除资源。
目标资源可以划分为静态资源与动态资源,其中,静态资源可以为独立的数据文件(例如:单独的图像文件),动态资源可以为由多个静态资源集合的数据(例如:包含有多个静态资源的文件夹)。
当冗余资源为静态资源时,则确定为该冗余资源为待删除的目标资源,即待删除资源。
可以对待删除资源增加待删除标签,并将待删除资源向用户展示,用户可以对待删除资源进行人工确认后,进行删除操作。具体的,可以响应于用户的删除操作,删除一个或多个与删除操作对应的待删除资源。
在一示例中,可以若所述冗余资源为静态资源,直接删除冗余资源,从而提高对冗余资源的处理效率。
在本发明的一种可选实施例中,本发明实施例还可以包括:根据所述冗余资源生成待筛选冗余资源列表;所述待筛选冗余资源列表包含所述冗余资源的标识信息。
为避免直接删除目标资源可能使得特征文件引用的目标资源丢失,以及对其他数据造成较大影响,则可以生成待筛选冗余资源列表,在待筛选冗余资源列表中包含有识别出的冗余资源的标识信息,用户可以针对待筛选冗余资源列表中对应的一个或多个目标资源进行相应操作。
例如:删除目标资源文件,或者先在待筛选冗余资源列表确定出需要删除的目标资源,并将需要删除的目标资源进行相应删除操作。
在本发明的一种可选实施例中,在步骤102之前,本发明实施例还可以包括:
根据所述标识信息判断所述目标资源是否为静态资源;
静态资源和动态资源的标识信息具有差异,例如:静态资源的标识信息可以由英文字符组成,动态资源的标识信息可以由英文、符号、数字组成。可以通过识别标识信息中包含的字符,确定相应的目标资源为静态资源或者为动态资源。
在一种具体实现中,本发明实施例可以应用于客户端,实现快速删除客户端中冗余的静态资源,以及,导出待筛选冗余列表供用户选择需要删除的非静态资源,从而减少快速、准确地删除客户端中不必要的目标资源,减少客户端占用的存储空间,以及可以缩小客户端的安装包大小。
在本发明的一种可选实施例中,所述依据所述标识信息判断所述目标资源是否为静态资源的步骤,包括:判断所述标识信息是否包含特征后缀信息;若是,则确定所述目标资源为动态资源;若否,则确定所述目标资源为静态资源;其中,所述动态资源为由多个静态资源组成的数据。
静态资源的标识信息一般为预先设置的具有实意的字符(例如:正确的英文单词),动态资源的标识信息可以为具有实意的字符基础上增加特征字符即特征后缀信息(例如:数字)。
当目标资源的标识信息中包含有特征后缀信息时,该目标资源为动态资源,当目标资源的标识信息中不包含特征后缀信息时,该目标资源为静态资源。
例如:静态资源的标识信息可以为“Hoben”,而动态资源的标识信息可以为“Hoben2”,即特征后缀信息为“2”。
在一示例中,当标识信息为“Hoben_2”时,其特征后缀信息为“2”。
在判断目标资源为动态资源或者为静态资源后,按照相应的方式执行步骤102。
在本发明的一种可选实施例中,若目标资源为动态资源,所述步骤102包括:提取所述目标资源的标识信息中除特征后缀信息以外的前缀信息;判断是否存在与所述前缀信息匹配的资源引用信息;若否,则确定所述目标资源为冗余资源。
由于在特征文件的资源引用信息中,在先可以通过字符串拼接的方法得到资源引用信息从而引用该资源(例如:在引用标识信息为“Hoben_2”时候,在实际中的资源引用信息可以是通过字符串拼接方式的得到的“UIImageimageNamed:@"Hoben_%ld",2”),所以如果直接使用动态资源的标识信息去识别待筛选冗余数据可能会发生错误,则先提取动态资源的标识信息中除特征后缀信息以外的部分为前缀信息,按照前缀信息识别出动态资源中的待筛选冗余数据。
例如:一动态资源的标识信息为“Hoben_2”,特征文件的资源引用信息为是由字符串拼接方法得到“UIImageimageNamed:@"Hoben_%ld",2”,如果按照动态资源的标识信息(即“Hoben_2”)进行识别待筛选冗余数据,可能会发生误判的情况,则可以提取前缀信息后,进而识别相应的目标资源是否为冗余资源。
在本发明的一种可选实施例中,所述特征文件具有类型信息;所述判断是否存在与所述前缀信息匹配的资源引用信息的步骤,包括:采用所述前缀信息构建与所述类型信息对应的第一正则表达式;调用预设函数依据所述第一正则表达式遍历与其类型信息对应的特征文件的资源引用信息;接收所述预设函数返回的第一布尔值;若所述第一布尔值为第一预设值,则确定存在与所述前缀信息匹配的资源引用信息;若所述第一布尔值为第二预设值,则确定不存在与所述前缀信息匹配的资源引用信息。
针对不同类型的特征文件,可以构建不同格式的第一正则表达式。例如:类型为“.h”、“.m”、“.mm”的引用资源信息的格式为@“xxx”,则对应的正则表达式为@“(.*?)”;类型为“.xib”、“.storyboard”的资源引用信用信息的格式为image name=“xxx”,对应的正则表达式为image name=“(.+?)”;类型为“.swift”的引用格式为“xxx”,对应正则表达式为“(.*?)”。
例如:目标资源的标识信息为“Hoben_2”,确定其前缀信息为“Hoben_”,针对类型为“.xib”、“.storyboard”的特征文件构建对应的第一正则表达式为“image name=“Hoben_””。通过调用指定函数依据第一正则表达式遍历该类型信息对应的特征文件的资源引用信息,当存在某一特征文件的资源引用信息为“UIImageimageNamed:@"Hoben_%ld",2”时,指定函数返回的第一布尔值为第一预设值。若不存在与正则表达式匹配的资源引用信息,则返回的第一布尔值为第二预设值。通过接收指定函数返回的第一布尔值,确定是否存在与前缀信息匹配的资源引用信息。
指定函数可以依据实际使用的计算机语言确定,不同的计算机语言具有与正则表达式对应的函数,本发明实施例对指定函数的具体函数方法不作限定。在本发明的一种可选实施例中,若所述目标资源为静态资源,所述步骤102包括:判断是否存在与所述标识信息匹配的资源引用信息;若否,则确定所述目标资源为冗余资源。
可以通过静态资源的标识信息与资源引用信息进行匹配,判断相应的目标资源是否为目标冗余数据,当不存在与标识信息匹配的资源引用信息时,则确定该静态资源没有被特征文件所引用,则该静态资源为需要删除的目标冗余数据。
在本发明的一种可选实施例中,所述特征文件具有类型信息;所述判断是否存在与所述标识信息匹配的资源引用信息的步骤,包括:调用预设函数依据所述第一正则表达式遍历与其类型信息对应的特征文件的资源引用信息;接收所述预设函数返回的第二布尔值;若所述第二布尔值为第一预设值,则确定存在与所述标识信息匹配的资源引用信息;若所述第二布尔值为第二预设值,则确定不存在与所述标识信息匹配的资源引用信息。
针对不同类型的特征文件,可以构建不同格式的第二正则表达式。通过运行指定函数,指定函数采用第二正则表达式并获取第二正则表达式返回的值,确定是否存在与静态资源的标识信息匹配的资源引用信息。若第二布尔值为真即第一预设值,则确定存在与所述静态资源的标识信息匹配的资源引用信息;若第一布尔值为假即第二预设值,则确定不存在与静态资源的标识信息匹配的资源引用信息。
例如:目标资源的标识信息为“Hoben”,针对类型为“.xib”、“.storyboard”的特征文件构建对应的第二正则表达式为“image name=“Hoben””。通过调用指定函数依据第二正则表达式遍历该类型信息对应的特征文件的资源引用信息,当存在某一特征文件的资源引用信息为“UIImageimageNamed:@"Hoben”时,指定函数返回的第二布尔值为第一预设值。若不存在与第二正则表达式匹配的资源引用信息时,则返回的第二布尔值为第二预设值。通过接收指定函数返回的第二布尔值,可以确定是否存在与静态资源的标识信息匹配的资源引用信息。
在一应用示例中,可以基于基于Objective-C语言(计算机)生成可执行上述步骤的虚拟工具,虚拟工具可以快速识别指定目录下的冗余资源。
在一实际应用中,若冗余资源为静态资源,则直接删除冗余资源;若冗余资源为动态资源,则根据冗余资源的标识信息生成待筛选冗余资源列表。
发明实施例可以适用于不同系统,包括但不限于iOS系统、安卓系统、Windows系统等。以下以iOS系统为例,对本发明实施例作进一步说明。
参照图2,示出了本发明的一种数据处理方法流程示意图,该方法可以包括如下步骤:
步骤201,找出所有的图片资源:基于NSPipe(iOS系统提供端的用于检索文件的库),先设置好所有图片资源的后缀名(资源格式),根据后缀名去遍历整个工程文件夹,如果文件夹内后缀为图片资源,则视为图片资源,放入数组储存管理;
步骤202,判断是否为静态资源文件:动态文件,即文件名中有一些有意义的后缀(最常见的为数字后缀),在实际工程引用中,可以通过字符串拼接的方法引用该资源,因此不能简单地用整个资源的名字全局搜索判断是否被引用,需要我们忽略数字后缀,因此需要通过判断是否有数字去判断是否为静态资源文件
步骤203,验证资源是否有被引用:对于iOS工程来说,潜在会用到图片资源的文件类型有:.h、.m、.mm、.xib、.storyboard、.swift,不同后缀的文件运用文件的格式可能不一样,所以对于不同格式的文件,采用不同的正则表达式去验证该文件是否有引用资源文件,如果正则表达式有匹配则视为用到了该资源文件,该资源标记为“被引用”,遍历完所有工程文件后,未被标记为“被引用”的图片资源则视为无用的资源。
步骤204,删除无用的静态资源文件:遍历无用静态资源数组,执行命令行删除。
步骤205,导出删除掉的静态资源文件列表:遍历无用的静态资源数组,执行命令行导出;
步骤206,取前缀,验证资源是否有被引用:如图片资源为”Hoben_2”,实际工程中的引用可能为:[UIImage imageNamed:@"Hoben_%ld",2],取前缀”Hoben_”去判断该图片是否被引用,如果没有引用则加入疑似无用动态文件数组;
步骤207,导出无用动态资源文件列表:根据步骤206生成的疑似无用动态文件数组生成相应文件列表,让使用者自行判断是否删除对应动态资源。
以上仅为对本发明实施例适用在iOS系统的示例说明,本领域技术人员可以理解的是,如需将本发明实施例适应其他系统,则需根据适用的系统所对应的语言构建相应的资源检索、资源检查、资源删除等逻辑,以执行本发明实施例中的上述一个或多个步骤。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种数据处理装置实施例的结构框图,具体可以包括如下模块:
获取模块301,用于获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;
识别模块302,用于根据所述目标目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。
在本发明的一种可选实施例中,所述装置还包括:
待删除资源模块,用于若所述冗余资源为静态资源,确定所述冗余资源为待删除资源;
删除模块,用于响应于删除操作,删除所述待删除资源。
在本发明的一种可选实施例中,所述装置还包括:
列表生成模块,用于根据所述冗余资源生成待筛选冗余资源列表;所述待筛选冗余资源列表包含所述冗余资源的标识信息。
在本发明的一种可选实施例中,所述装置包括:
资源判断模块,用于根据所述标识信息判断所述目标资源是否为静态资源。
在本发明的一种可选实施例中,所述资源判断模块包括:
特征后缀子模块,用于判断所述标识信息是否包含特征后缀信息;
动态资源子模块,用于若是,则确定所述目标资源为动态资源;
静态资源子模块,用于若否,则确定所述目标资源为静态资源;
其中,所述动态资源为由多个静态资源组成的数据。
在本发明的一种可选实施例中,所述识别模块302包括:
前缀提取子模块,用于提取所述目标资源的标识信息中除特征后缀信息以外的前缀信息;
前缀匹配子模块,用于判断是否存在与所述前缀信息匹配的资源引用信息;
第一冗余资源子模块,用于若否,则确定所述目标资源为冗余资源。
在本发明的一种可选实施例中,所述特征文件具有类型信息;所述前缀匹配子模块包括:
第一正则表达式单元,用于采用所述前缀信息构建与所述类型信息对应的第一正则表达式;
第一函数单元,用于调用预设函数依据所述第一正则表达式遍历与其类型信息对应的特征文件的资源引用信息;
第一布尔值接收单元,用于接收所述预设函数返回的第一布尔值;
第一布尔值单元,用于采用所述第一正则表达式获取第一布尔值;
第一前缀识别单元,用于若所述第一布尔值为第一预设值,则确定存在与所述前缀信息匹配的资源引用信息;
第二前缀识别单元,用于若所述第一布尔值为第二预设值,则确定不存在与所述前缀信息匹配的资源引用信息。
在本发明的一种可选实施例中,所述识别模块302包括:
标识信息判断子模块,用于判断是否存在与所述目标资源的标识信息匹配的资源引用信息;
第二冗余资源子模块,用于若否,则确定所述目标资源为冗余资源。
在本发明的一种可选实施例中,所述特征文件具有类型信息;所述标识信息判断子模块可以包括:
第二正则式单元,用于采用所述目标资源的标识信息构建与所述类型信息对应的第二正则表达式;
第二函数单元,用于调用预设函数依据所述第二正则表达式遍历与其类型信息对应的特征文件的资源引用信息;
第二布尔值接收单元,用于接收所述预设函数返回的获取第二布尔值;
第一标识信息识别单元,用于若所述第二布尔值为第一预设值,则确定存在与所述标识信息匹配的资源引用信息;
第二标识信息识别单元,用于若所述第二布尔值为第二预设值,则确定不存在与所述标识信息匹配的资源引用信息。其中,识别模块302用于在确定目标资源为动态资源时,调用前缀提取子模块、前缀匹配子模块、第一冗余资源子模块;在确定目标资源为静态资源时,调用标识信息判断子模块、第二冗余资源子模块。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还公开了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的数据处理方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据处理方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种数据处理方法和数据处理装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种数据处理方法,其特征在于,包括:
获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;
根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述冗余资源为静态资源,确定所述冗余资源为待删除资源;
响应于删除操作,删除所述待删除资源。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述冗余资源生成待筛选冗余资源列表;所述待筛选冗余资源列表包含所述冗余资源的标识信息。
4.根据权利要求1所述的方法,其特征在于,在所述根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源之前,所述方法包括:
根据所述标识信息判断所述目标资源是否为静态资源。
5.根据权利要求4所述的方法,其特征在于,所述根据所述标识信息判断所述目标资源是否为静态资源的步骤,包括:
判断所述标识信息是否包含特征后缀信息;
若是,则确定所述目标资源为动态资源;
若否,则确定所述目标资源为静态资源;
其中,所述动态资源为由多个静态资源组成的数据。
6.根据权利要求5所述的方法,其特征在于,若目标资源为动态资源,所述根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源的步骤,包括:
提取所述目标资源的标识信息中除特征后缀信息以外的前缀信息;
判断是否存在与所述前缀信息匹配的资源引用信息;
若否,则确定所述目标资源为冗余资源。
7.根据权利要求6所述的方法,其特征在于,所述特征文件具有类型信息;所述判断是否存在与所述前缀信息匹配的资源引用信息的步骤,包括:
采用所述前缀信息构建与所述类型信息对应的第一正则表达式;
调用预设函数依据所述第一正则表达式遍历与其类型信息对应的特征文件的资源引用信息;
接收所述预设函数返回的第一布尔值;
若所述第一布尔值为第一预设值,则确定存在与所述前缀信息匹配的资源引用信息;
若所述第一布尔值为第二预设值,则确定不存在与所述前缀信息匹配的资源引用信息。
8.根据权利要求5所述的方法,其特征在于,若所述目标资源为静态资源,所述根据所述目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源据的步骤,包括:
判断是否存在与所述目标资源的标识信息匹配的资源引用信息;
若否,则确定所述目标资源为冗余资源。
9.根据权利要求8所述的方法,其特征在于,所述特征文件具有类型信息;所述判断是否存在与所述目标资源的标识信息匹配的资源引用信息的步骤,包括:
采用所述目标资源的标识信息构建与所述类型信息对应的第二正则表达式;
调用预设函数依据所述第二正则表达式遍历与其类型信息对应的特征文件的资源引用信息;
接收所述预设函数返回的获取第二布尔值;
若所述第二布尔值为第一预设值,则确定存在与所述标识信息匹配的资源引用信息;
若所述第二布尔值为第二预设值,则确定不存在与所述标识信息匹配的资源引用信息。
10.一种数据处理装置,其特征在于,包括:
获取模块,用于获取目标资源,以及特征文件;所述目标资源包括标识信息;所述特征文件包含资源引用信息;所述资源引用信息包含所述特征文件引用的目标资源的标识信息;
识别模块,用于根据所述目标目标资源的标识信息和所述资源引用信息识别所述目标资源中的冗余资源。
11.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至9中任一项所述的数据处理方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的数据处理方法的步骤。
CN202011075347.4A 2020-10-09 2020-10-09 一种数据处理方法和装置 Active CN112379891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011075347.4A CN112379891B (zh) 2020-10-09 2020-10-09 一种数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011075347.4A CN112379891B (zh) 2020-10-09 2020-10-09 一种数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN112379891A true CN112379891A (zh) 2021-02-19
CN112379891B CN112379891B (zh) 2023-12-29

Family

ID=74581190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011075347.4A Active CN112379891B (zh) 2020-10-09 2020-10-09 一种数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN112379891B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110016178A1 (en) * 2009-07-15 2011-01-20 Red Hat, Inc. Client Side Culling of Dynamic Resources
US20140074817A1 (en) * 2012-09-07 2014-03-13 Splunk Inc. Data model for machine data for semantic search
CN105205080A (zh) * 2014-06-26 2015-12-30 阿里巴巴集团控股有限公司 冗余文件清理方法、装置和系统
CN108089893A (zh) * 2017-12-14 2018-05-29 网易(杭州)网络有限公司 冗余资源的确定方法、装置、终端设备与存储介质
CN108762979A (zh) * 2018-04-17 2018-11-06 厦门市美亚柏科信息股份有限公司 一种基于匹配树的终端信息备份方法及备份设备
CN109344277A (zh) * 2018-08-31 2019-02-15 网易传媒科技(北京)有限公司 图片处理方法、装置、介质和计算设备
CN109799970A (zh) * 2018-12-06 2019-05-24 珠海西山居移动游戏科技有限公司 一种资源引用关系生成方法及系统
CN110059214A (zh) * 2019-04-01 2019-07-26 北京奇艺世纪科技有限公司 一种图像资源处理方法及装置
CN110147237A (zh) * 2019-05-20 2019-08-20 深圳市腾讯网域计算机网络有限公司 一种冗余资源去除方法和装置
CN110413282A (zh) * 2019-08-01 2019-11-05 腾讯科技(深圳)有限公司 一种冗余资源处理方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110016178A1 (en) * 2009-07-15 2011-01-20 Red Hat, Inc. Client Side Culling of Dynamic Resources
US20140074817A1 (en) * 2012-09-07 2014-03-13 Splunk Inc. Data model for machine data for semantic search
CN105205080A (zh) * 2014-06-26 2015-12-30 阿里巴巴集团控股有限公司 冗余文件清理方法、装置和系统
CN108089893A (zh) * 2017-12-14 2018-05-29 网易(杭州)网络有限公司 冗余资源的确定方法、装置、终端设备与存储介质
CN108762979A (zh) * 2018-04-17 2018-11-06 厦门市美亚柏科信息股份有限公司 一种基于匹配树的终端信息备份方法及备份设备
CN109344277A (zh) * 2018-08-31 2019-02-15 网易传媒科技(北京)有限公司 图片处理方法、装置、介质和计算设备
CN109799970A (zh) * 2018-12-06 2019-05-24 珠海西山居移动游戏科技有限公司 一种资源引用关系生成方法及系统
CN110059214A (zh) * 2019-04-01 2019-07-26 北京奇艺世纪科技有限公司 一种图像资源处理方法及装置
CN110147237A (zh) * 2019-05-20 2019-08-20 深圳市腾讯网域计算机网络有限公司 一种冗余资源去除方法和装置
CN110413282A (zh) * 2019-08-01 2019-11-05 腾讯科技(深圳)有限公司 一种冗余资源处理方法、装置、设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MAN XU 等: "New approach to eliminate structural redundancy in case resource pools using α mutual information", 《JOURNAL OF SYSTEMS ENGINEERING AND ELECTRONICS》, vol. 24, no. 4, pages 625 *
QQ18334373TAIKONGYI: "apk清除冗余资源", Retrieved from the Internet <URL:《https://blog.csdn.net/QQ18334373taikongyi/article/details/51105819》> *
吴林谦: "面向文件类型的网内冗余数据删除方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 5, pages 139 - 7 *
李晓翔 等: "基于可用资源的冗余资源测量、分布和作用研究", 《管理评论》, vol. 26, no. 9, pages 22 - 33 *

Also Published As

Publication number Publication date
CN112379891B (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
US10540325B2 (en) Method and device for identifying junk picture files
CN109241003B (zh) 文件管理方法和装置
CN110019067B (zh) 一种日志分析方法及系统
CN104994404A (zh) 一种为视频获取关键词的方法及装置
CN110059214B (zh) 一种图像资源处理方法及装置
CN114398315A (zh) 一种数据存储方法、系统、存储介质及电子设备
CN112579623A (zh) 存储数据的方法、装置、存储介质及设备
CN104090924B (zh) 一种隐私数据的清理方法和装置
CN112364618A (zh) 报告文件生成方法、装置、电子设备和存储介质
US20120192046A1 (en) Generation of a source complex document to facilitate content access in complex document creation
CN112379891A (zh) 一种数据处理方法和装置
CN110019295B (zh) 数据库检索方法、装置、系统以及存储介质
CN113722278A (zh) 一种基于pdf文件的知识元抽取方法、设备及介质
CN112527757B (zh) 基于大规模芯片测试结果的快速检索方法
CN108132971B (zh) 数据库碎片文件的分析方法和装置
CN111651531A (zh) 数据导入方法、装置、设备及计算机存储介质
CN111581933A (zh) 一种管理网页中表格的方法和装置
CN109582850B (zh) 一种网页爬取的方法、装置、存储介质及电子设备
CN110489125B (zh) 文件管理方法和计算机存储介质
CN112579763A (zh) 一种文书的推送方法及装置
CN110275863A (zh) 文件移动方法、装置及存储介质
CN114900713B (zh) 一种视频剪辑处理方法及系统
CN113515579B (zh) 一种界峰数据的筛查方法及装置
CN110727897B (zh) 支持多终端操作的地质调查信息服务快速发布方法及系统
CN116303296B (zh) 一种数据存储方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant