CN103631589A - 应用识别方法与装置 - Google Patents

应用识别方法与装置 Download PDF

Info

Publication number
CN103631589A
CN103631589A CN201310607827.4A CN201310607827A CN103631589A CN 103631589 A CN103631589 A CN 103631589A CN 201310607827 A CN201310607827 A CN 201310607827A CN 103631589 A CN103631589 A CN 103631589A
Authority
CN
China
Prior art keywords
application
condition code
fixed byte
binary data
data area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310607827.4A
Other languages
English (en)
Other versions
CN103631589B (zh
Inventor
康涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310607827.4A priority Critical patent/CN103631589B/zh
Publication of CN103631589A publication Critical patent/CN103631589A/zh
Priority to PCT/CN2014/090046 priority patent/WO2015067145A1/zh
Application granted granted Critical
Publication of CN103631589B publication Critical patent/CN103631589B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors

Abstract

本发明实施例提供一种应用识别方法与装置。本发明的应用识别方法,包括:确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。本发明能够识别虚拟化系统上运行的应用,从而使得虚拟化系统能够基于应用进行性能优化,提高性能。

Description

应用识别方法与装置
技术领域
本发明实施例涉及通信技术,尤其涉及一种应用识别方法与装置。
背景技术
随着虚拟化系统的广泛使用,虚拟化系统的自管理、自优化变得十分重要。
在现有技术中,虚拟化系统先基于输入/输出判断数据为热点数据或冷数据,再根据判断结果进行自管理、自优化。当归属与该虚拟化系统的区域内的部分数据的输入/输出频率相对比较高的时候,该数据为活跃度高的“热点数据”,当归属与该虚拟化系统的区域内的部分数据的输入/输出频率比较低的数据,该数据为活跃度低的“冷数据”,接着,虚拟化系统通过数据迁移将活跃度高的“热点数据”迁移至具有更高性能的存储介质(例如,固态硬盘(Solid State Disk,简称SSD)),将活跃度低的“冷数据”迁移至具有更高容量且更低容量成本的存储介质(如串行高级技术附件(SerialAdvanced Technology Attachment,简称SATA)硬盘),从而达到自管理和自由化的效果。
然而,虚拟化系统不能识别“热点数据”所基于的应用,有可能该些热点数据仅仅是一些影视、歌曲文件,虽然读写频繁,但并不影响虚拟化系统的效率和使用,若将该些热点数据迁移到高性能的存储介质中,则占用了高性能介质的存储空间,从而影响虚拟化系统中其它应用的正常使用,导致虚拟化系统性能低下。
发明内容
本发明实施例提供一种应用识别方法与装置,能够识别虚拟化系统上运行的应用,从而使得虚拟化系统能够基于应用进行性能优化,提高性能。
第一方面,本发明提供一种应用识别方法,包括:
确定是否获取到虚拟化系统上运行的应用的文件扩展名;
若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;
若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
结合第一方面,在第一方面的第一种可能的实现方式中,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,包括:
获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,包括:
确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,若确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,还包括:
根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
结合第一方面、第一方面的第一种至第三种任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,还包括:
获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
第二方面,一种应用识别装置,包括:
判断模块,用于确定是否获取到虚拟化系统上运行的应用的文件扩展名;
确定模块,用于在所述判断模块判断为是时,根据所述文件扩展名识别应用,确定所述应用的应用类型;
处理模块,用于在所述判断模块判定为否时,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
结合第二方面,在第二方面的第一种可能的实现方式中,所述处理模块包括:
匹配单元,用于获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
确定单元,用于根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述确定单元具体用于:
确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述处理模块还用于:在确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
结合第二方面、第二方面的第一种至第三种任一种可能的实现方式,在第二方面的第四种可能的实现方式中,还包括:建库模块,用于在所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,
获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
本发明实施例提供的应用识别方法与装置,该方法通过确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型,通过本发明可以识别虚拟化系统上运行的应用,从而使得虚拟化系统能够给予应用进行性能优化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明应用识别方法实施例一的流程图;
图2为新建文本文档.txt示意图;
图3为本发明新建文本文档.zip示意图;
图4为压缩源文件数据区的示意图;
图5为压缩源文件目录区的示意图;
图6为压缩源文件目录结束标志示意图;
图7为本发明应用识别装置实施例一的结构示意图;
图8为本发明应用识别装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明应用识别方法实施例一的流程图,
如图1所示,本实施例的方法可以包括:
步骤101、确定是否获取到虚拟化系统上运行的应用的文件扩展名,若是,执行步骤102,若否,执行步骤103;
步骤102、根据所述文件扩展名识别应用,确定所述应用的应用类型;
步骤103、获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
在具体实现过程中,虚拟化系统上可以运行各种应用。但是,在虚拟机场景下,是无法对虚拟化系统上运行的应用的文件扩展名进行识别。因此,首先确定是否可以获取到虚拟化系统上运行的应用的文件扩展名。
若是,执行步骤102。在步骤102中,根据文件扩展名识别应用,确定应用的应用类型。具体地,每一种应用都有它特有的文件扩展名,通过判断文件扩展名,可以确定到当前存储被哪些应用所使用,从而完成对应用的识别和在存储设备上的资源调配工作。表一列出了根据文件扩展名识别应用、确定应用的应用类型的示意。
表一
文件扩展名 类型
zip Zip格式压缩文件
mp3,rmvb,avi,mkv 音频、视频文件
chk,ebp Exchange
如表一所示,对存储设备上的文件进行遍历检测之后,把Exchange应用使用的文件扩展名为chk和ebp的文件迁移到高性能层,保证了Exchange的运行效率,然后把音频、视频、压缩、文本文件迁移到了容量层,节省了高性能层的容量占用,从而实现了对应用的识别并完成了对存储资源的调配工作。
若否,执行步骤103,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
在步骤103之前,获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
具体地,预设匹配规则中包括了二进制数据区的特征码与特征码库中的特征码的具体的匹配规则。在特征码库中,标准应用的应用类型、预设匹配规则以及二进制数据区的特征码具有对应关系。当二进制数据区的特征码与特征码库中的特征码匹配时,根据该对应关系,可以确定应用的应用类型。然后使得虚拟化系统根据各应用的应用类型,基于应用进行性能优化,提高性能。
在具体实现过程中,当应用对应地二进制数据区包括第一二进制数据区和第二二进制数据区时,步骤103包括:获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
可选地,可通过如下方式确定所述第二固定字节对应的特征码:确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码。
本领域技术人员可以理解,在具体实现过程中,一个应用可能包括不仅两个二进制数据区,还可能包括多个二进制数据区。当一个应用包括多个二进制数据区时,若确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,还包括:
根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
本发明实施例提供的应用识别方法,通过确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型,通过本发明可以识别虚拟化系统上运行的应用,从而使得虚拟化系统能够给予应用进行性能优化。
下面采用具体的实施例,对本发明提供的应用识别方法进行详细说明。
首先,对特征码库的建立进行详细说明。以zip文件形式为例,对于未压缩的文件:新建文本文档.txt具体可如图2所示,图2为新建文本文档.txt示意图。进行压缩后,文件名称:新建文本文档.zip,具体可如图3所示,图3为本发明新建文本文档.zip示意图。
一般情况下,一个zip文件由三个二进制数据区组成:压缩源文件数据区、压缩源文件目录区以及压缩源文件目录结束标志。其中,图4为压缩源文件数据区的示意图;图5为压缩源文件目录区的示意图;图6为压缩源文件目录结束标志示意图。
在图4中,黑色框体内的二进制数据代表了压缩源文件数据区。各二进制
数据代表的具体含义如表一所示。
表一
Figure BDA0000410981410000091
根据固定字节获取标准应用的二进制数据区的特征码为:504B0304;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则的方式具体如下:
偏移位置18,长度4字节,抽取压缩后的大小:19
偏移位置26,长度2字节,抽取文件名的长度:16
偏移位置28,长度2字节,抽取扩展区的长度:0
总采集长度:19+16+0=35;
二进制数据区的数据块长度:总采集长度加上偏移量30,二进制数据区的数据块长度为65。对应地,0到65字节处为压缩源文件数据区的数据块。
对应的预设匹配规则,在存储数据检测过程中,在匹配到特征库中的特征码50 4B 03 04时,启动预设匹配规则,
在偏移位置18,采集压缩后的大小;
在偏移位置26处,采集文件名长度;
在偏移位置28处,采集扩展名长度。
可选地,zip文件还可包括与数据描述区对应的二进制数据区。其中,数据描述区用于标识该文件压缩结束,该结构只有在相应的header中通用标记字段的第3位设为1时才会出现,紧接在压缩文件源数据后。本实施例由于通用标记字段为:00 00所以无此数据描述区。
在图5中,黑色框体内的二进制数据代表了压缩源文件目录区。各二进制数据代表的具体含义如表二所示。
根据固定字节获取标准应用的二进制数据区的特征码为:50 4B 01 02;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则的方式具体如下:
偏移位置28,长度2字节,抽取文件名长度:16;
偏移位置30,长度2字节,抽取扩展区长度:0;
偏移位置32,长度2字节,抽取文件注释长度:0;
总采集长度:16+0+0=16。
二进制数据区的数据块长度:总采集长度加上偏移量46,二进制数据区的数据块长度为62。对应地,65(65为压缩源文件数据区的偏移位置)到127字节处为压缩源文件目录区的数据块。
对应的预设匹配规则,在存储数据检测过程中,在匹配到特征库中的特征码50 4B 01 02时,启动预设匹配规则,
向后在偏移位置28处,采集压缩后的大小;
在偏移位置30处,采集扩展区长度;
在偏移位置32处,采集文件注释长度。
表二
在图6中,黑色框体内的二进制数据代表了压缩源文件目录结束标志。各二进制数据代表的具体含义如表三所示。
表三
Figure BDA0000410981410000121
根据固定字节获取标准应用的二进制数据区的特征码为:50 4B 05 06;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则的方式具体如下:
偏移位置20,长度2字节,抽取文件名长度:4;总采集长度:4。
二进制数据区的数据块长度:总采集长度加上偏移量22,二进制数据区的数据块长度为26。对应地,127(127为压缩源文件数据区+压缩源文件目录区的偏移位置)到153字节处为压缩源文件结束目录区的数据块。
对应的预设匹配规则,在存储数据检测过程中,在匹配到特征库中的特征码50 4B 05 06时,启动预设匹配规则,
向后在偏移位置20处,采集压缩后的大小。
综上可知,基于zip文件的特征码和预设匹配规则如下:
压缩源文件数据区特征码:50 4B 03 04;
压缩源文件数据描述区特征码:50 4B 07 08;
压缩源文件目录区特征码:50 4B 01 02;
压缩源文件目录结束标志区特征码:50 4B 05 06;
压缩源文件数据区:
当匹配到特征码:50 4B 03 04的时候立刻启动预设匹配规则,如下:
1、向后在偏移位置18,采集压缩后的大小M
2、在偏移位置26处,采集文件名长度N
3、在偏移位置28处,采集扩展名长度X
总采集长度:M+N+X,再加上偏移量30之后,从K(K为上几次匹配到的数据区总大小)到30+M+N+X字节处为压缩源文件数据区的数据块。
压缩源文件数据描述区:
当匹配到特征码:50 4B 03 04的时候立刻启动预设匹配规则,如下:
直接向后偏移16字节,进入下一块区域的检测。
压缩源文件目录区:
当匹配到特征码:50 4B 01 02的时候立刻启动预设匹配规则,如下:
1、向后在偏移位置28,采集压缩后的大小E
2、在偏移位置30处,采集扩展区长度F
3、在偏移位置32处,采集文件注释长度G
总采集长度:E+F+G,再加上偏移量46之后等于46+E+F+G,从K(K为上几次匹配到的数据区总大小)到46+E+F+G字节处为压缩源文件目录区的数据块。
压缩源文件目录结束标志区:
当匹配到特征码:50 4B 05 06的时候立刻启动预设匹配规则,如下:
1、向后在偏移位置20,采集压缩后的大小Y
总采集长度:Y,再加上偏移量22之后等于22+Y,从K(K为上几次匹配到的数据区总大小)到22+Y字节处为压缩源文件目录结束区的数据块。
在具体匹配过程中,当采集到压缩源文件数据区特征码:50 4B 03 04时,将该特征码与特征码库中的特征码进行匹配,若匹配成功,则继续进行匹配,若匹配失败,则重新进行匹配过程。
在该特征码匹配成功后,根据预设匹配规则确定压缩源文件数据区的数据块长度30+M+N+X,在经过该长度后,得到特征码,确定该特征码是否与特征码库中的特征码匹配,若匹配,则启动预设匹配规则,准备下一个特征码的匹配过程,若匹配失败,则重新进行匹配过程。当所有二进制数据区的特征码均与特征码库中的特征码匹配成功时,则根据标准应用的应用类型、预设匹配规则以及二进制数据区的特征码具有对应关系,确定应用的应用类型。
图7为本发明应用识别装置实施例一的结构示意图。如图7所示,本发明实施例提供的应用识别装置70包括判断模块701,确定模块702和处理模块703。
其中,判断模块701,用于确定是否获取到虚拟化系统上运行的应用的文件扩展名;
确定模块702,用于在所述判断模块判断为是时,根据所述文件扩展名识别应用,确定所述应用的应用类型;
处理模块703,用于在所述判断模块判定为否时,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
本实施例提供的应用识别装置,可执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图8为本发明应用识别装置实施例二的结构示意图。本实施例在图7实施例的基础上实现,具体如下:
可选地,所述处理模块703包括:
匹配单元7031,用于获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
确定单元7032,用于根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
可选地,所述确定单元7032具体用于:确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
可选地,所述处理模块703还用于:在确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
可选地,还包括:建库模块704,用于在所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
本实施例提供的应用识别装置,可执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种应用识别方法,其特征在于,包括:
确定是否获取到虚拟化系统上运行的应用的文件扩展名;
若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;
若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
2.根据权利要求1所述的方法,其特征在于,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,包括:
获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,包括:
确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码。
4.根据权利要求3所述的方法,其特征在于,若确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,还包括:
根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,还包括:
获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
6.一种应用识别装置,其特征在于,包括:
判断模块,用于确定是否获取到虚拟化系统上运行的应用的文件扩展名;
确定模块,用于在所述判断模块判断为是时,根据所述文件扩展名识别应用,确定所述应用的应用类型;
处理模块,用于在所述判断模块判定为否时,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
7.根据权利要求6所述的装置,其特征在于,所述处理模块包括:
匹配单元,用于获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
确定单元,用于根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
8.根据权利要求7所述的装置,其特征在于,所述确定单元具体用于:
确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
9.根据权利要求8所述的装置,其特征在于,所述处理模块还用于:在确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
10.根据权利要求6至9任一项所述的装置,其特征在于,还包括:建库模块,用于在所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,
获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
CN201310607827.4A 2013-11-08 2013-11-08 应用识别方法与装置 Active CN103631589B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310607827.4A CN103631589B (zh) 2013-11-08 2013-11-08 应用识别方法与装置
PCT/CN2014/090046 WO2015067145A1 (zh) 2013-11-08 2014-10-31 应用识别方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310607827.4A CN103631589B (zh) 2013-11-08 2013-11-08 应用识别方法与装置

Publications (2)

Publication Number Publication Date
CN103631589A true CN103631589A (zh) 2014-03-12
CN103631589B CN103631589B (zh) 2017-02-01

Family

ID=50212687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310607827.4A Active CN103631589B (zh) 2013-11-08 2013-11-08 应用识别方法与装置

Country Status (2)

Country Link
CN (1) CN103631589B (zh)
WO (1) WO2015067145A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873860A (zh) * 2014-03-18 2014-06-18 深信服网络科技(深圳)有限公司 文件传输方法及装置
WO2015067145A1 (zh) * 2013-11-08 2015-05-14 华为技术有限公司 应用识别方法与装置
CN105095330A (zh) * 2014-12-01 2015-11-25 哈尔滨安天科技股份有限公司 一种基于压缩包内容的文件格式识别方法及系统
CN105573893A (zh) * 2015-12-25 2016-05-11 珠海国芯云科技有限公司 一种软件监控方法和装置
CN106095768A (zh) * 2016-04-29 2016-11-09 乐视控股(北京)有限公司 终端及基于终端的应用推送方法
CN108153676A (zh) * 2017-12-26 2018-06-12 广东欧珀移动通信有限公司 调试管理方法、装置、存储介质及终端设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6460044B1 (en) * 1999-02-02 2002-10-01 Jinbo Wang Intelligent method for computer file compression
US20090013408A1 (en) * 2007-07-06 2009-01-08 Messagelabs Limited Detection of exploits in files
CN102571767A (zh) * 2011-12-24 2012-07-11 成都市华为赛门铁克科技有限公司 文件类型识别方法及文件类型识别装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631589B (zh) * 2013-11-08 2017-02-01 华为技术有限公司 应用识别方法与装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6460044B1 (en) * 1999-02-02 2002-10-01 Jinbo Wang Intelligent method for computer file compression
US20090013408A1 (en) * 2007-07-06 2009-01-08 Messagelabs Limited Detection of exploits in files
CN102571767A (zh) * 2011-12-24 2012-07-11 成都市华为赛门铁克科技有限公司 文件类型识别方法及文件类型识别装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015067145A1 (zh) * 2013-11-08 2015-05-14 华为技术有限公司 应用识别方法与装置
CN103873860A (zh) * 2014-03-18 2014-06-18 深信服网络科技(深圳)有限公司 文件传输方法及装置
CN103873860B (zh) * 2014-03-18 2017-12-22 深信服网络科技(深圳)有限公司 文件传输方法及装置
CN105095330A (zh) * 2014-12-01 2015-11-25 哈尔滨安天科技股份有限公司 一种基于压缩包内容的文件格式识别方法及系统
CN105095330B (zh) * 2014-12-01 2019-05-07 哈尔滨安天科技股份有限公司 一种基于压缩包内容的文件格式识别方法及系统
CN105573893A (zh) * 2015-12-25 2016-05-11 珠海国芯云科技有限公司 一种软件监控方法和装置
CN105573893B (zh) * 2015-12-25 2018-03-02 珠海国芯云科技有限公司 一种软件监控方法和装置
CN106095768A (zh) * 2016-04-29 2016-11-09 乐视控股(北京)有限公司 终端及基于终端的应用推送方法
CN108153676A (zh) * 2017-12-26 2018-06-12 广东欧珀移动通信有限公司 调试管理方法、装置、存储介质及终端设备
CN108153676B (zh) * 2017-12-26 2021-08-20 Oppo广东移动通信有限公司 调试管理方法、装置、存储介质及终端设备

Also Published As

Publication number Publication date
WO2015067145A1 (zh) 2015-05-14
CN103631589B (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN103631589A (zh) 应用识别方法与装置
CN103699585A (zh) 文件的元数据存储以及文件恢复的方法、装置和系统
US10248598B2 (en) Intelligent storage device signal transmission method for backing up data on intelligent storage module based on system type of electronic device
CN103744875B (zh) 基于文件系统的数据快速迁移方法及系统
CN110569147B (zh) 一种基于索引的删除文件恢复方法、终端设备及存储介质
CN103605588A (zh) 一种虚拟机磁盘备份方法
CN112256656B (zh) 事务回滚方法及装置、数据库、系统、计算机存储介质
CN102999433A (zh) 一种虚拟磁盘的冗余数据删除方法及系统
CN103514210A (zh) 小文件处理方法及装置
CN103092726A (zh) 注册表删除数据的恢复方法和装置
CN104778252A (zh) 索引的存储方法和装置
CN104681050A (zh) 一种提取磁盘视频数据的方法和装置
CN102253938B (zh) 一种文件写入、恢复方法和装置
CN104572492A (zh) 一种烧录数据到fat32分区的方法和装置
Zhang et al. Recovering SQLite data from fragmented flash pages
CN111176901B (zh) 一种hdfs删除文件恢复方法、终端设备及存储介质
CN106649131B (zh) 一种固态硬盘及其逻辑地址范围冲突监控方法、系统
CN107148612A (zh) 一种扩展用户分区的方法和装置
US20170139783A1 (en) Method and apparatus for recovery of file system using metadata and data cluster
CN104915376A (zh) 一种云存储中文件的归档压缩方法
CN103678041A (zh) 一种增量备份方法及系统
CN104408097A (zh) 一种基于字符段热更新的混合索引方法及系统
CN105389232A (zh) Ext文件系统有效数据分析方法
CN104699688A (zh) 一种搜索文件的方法和电子设备
CN104615948A (zh) 一种自动识别文件完整性与恢复的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant