WO2015067145A1 - 应用识别方法与装置 - Google Patents
应用识别方法与装置 Download PDFInfo
- Publication number
- WO2015067145A1 WO2015067145A1 PCT/CN2014/090046 CN2014090046W WO2015067145A1 WO 2015067145 A1 WO2015067145 A1 WO 2015067145A1 CN 2014090046 W CN2014090046 W CN 2014090046W WO 2015067145 A1 WO2015067145 A1 WO 2015067145A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- feature code
- determining
- application
- fixed byte
- binary data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
Definitions
- Embodiments of the present invention relate to communication technologies, and in particular, to an application identification method and apparatus.
- the virtualization system first determines whether the data is hot data or cold data based on the input/output, and then performs self-management and self-optimization according to the judgment result.
- the input/output frequency of the partial data in the area of the virtualized system is relatively high, the data is "hot spot data" with high activity, when part of the data belongs to the area of the virtualized system.
- Data with low input/output frequency which is "cold data” with low activity.
- the virtualization system migrates highly active "hotspot data” to a storage medium with higher performance through data migration (for example, Solid State Disk (SSD), which migrates "cold data” with low activity to storage media with higher capacity and lower capacity (such as Serial Advanced Technology Attachment (SATA) ) Hard drive) to achieve self-management and liberalization.
- SSD Solid State Disk
- SATA Serial Advanced Technology Attachment
- the virtualization system cannot identify the application on which the "hotspot data" is based. It is possible that the hotspot data is only some movies and song files. Although the reading and writing is frequent, it does not affect the efficiency and use of the virtualization system.
- the migration of hot data to high-performance storage media occupies the storage space of high-performance media, which affects the normal use of other applications in the virtualized system, resulting in poor performance of the virtualized system.
- the embodiment of the invention provides an application identification method and device, which can identify an application running on a virtualization system, thereby enabling the virtualization system to perform performance optimization based on the application and improve performance.
- the present invention provides an application identification method, including:
- the matching result of the feature code and the feature code in the signature database includes:
- the method further includes:
- the acquiring the running on the virtualized system Determining a feature code of the binary data area of the application, determining a matching result of the feature code of the binary data area of the application and the feature code in the feature code library, identifying an application according to the matching result, and determining the application type of the application, further including :
- an application identification device includes:
- a determining module configured to determine whether to obtain a file extension of an application running on the virtualization system
- a determining module configured to determine, according to the file extension identification application, an application type of the application when the determining module determines to be YES;
- a processing module configured to acquire a feature code of a binary data area of the application running on the virtualization system, and determine a feature code and a feature code base of the binary data area of the application when the determining module determines to be no
- the matching result of the feature code in the identification result is identified according to the matching result, and the application type of the application is determined.
- the processing module includes:
- a matching unit configured to acquire a first binary number of the application running on the virtualization system Determining, according to the first fixed byte, a feature code corresponding to the first fixed byte, and determining a feature code corresponding to the first fixed byte and the feature code, according to the first fixed byte corresponding to the area
- the signatures in the library match;
- a determining unit configured to acquire, according to the feature code corresponding to the first fixed byte and a preset matching rule, a second fixed byte corresponding to the second binary data area of the application running on the virtualization system Determining, according to the second fixed byte, a feature code corresponding to the second fixed byte, and determining a matching result of the feature code corresponding to the second fixed byte and the feature code in the feature code library.
- the determining unit is specifically configured to:
- the processing module is further configured to: determine a feature code and a feature corresponding to the second fixed byte After the matching of the feature code in the code library, the determining the matching result of the feature code corresponding to the second fixed byte and the feature code in the feature code library, determining the second preset according to the preset matching rule Determining an amount of the offset, determining a data block length of the second binary data region according to the second preset offset position amount and a fixed byte length of the second binary data region;
- the first to the third possible implementation manners of the second aspect in a fourth possible implementation manner of the second aspect, Obtain a feature code of the binary data area of the application running on the virtualization system, determining a matching result of a feature code of the binary data area of the application and a feature code in the feature code library, identifying an application according to the matching result, determining the location Before describing the application type of the application,
- An application identification method and device provided by an embodiment of the present invention, the method determining whether to obtain a file extension of an application running on a virtualization system; if yes, identifying an application according to the file extension, and determining an application type of the application; If not, acquiring a feature code of the binary data area of the application running on the virtualization system, determining a matching result of the feature code of the binary data area of the application and the feature code in the feature code library, and identifying according to the matching result
- the application determines the application type of the application, and the application running on the virtualization system can be identified by the invention, so that the virtualization system can optimize the performance of the application.
- Embodiment 1 is a flowchart of Embodiment 1 of an application identification method according to the present invention.
- Figure 2 is a schematic diagram of a new text document.txt
- FIG. 3 is a schematic diagram of a new text document.zip of the present invention.
- FIG. 4 is a schematic diagram of a compressed source file data area
- Figure 5 is a schematic diagram of a compressed source file directory area
- Figure 6 is a schematic diagram of the end mark of the compressed source file directory
- FIG. 7 is a schematic structural diagram of Embodiment 1 of an application identification device according to the present invention.
- FIG. 8 is a schematic structural diagram of Embodiment 2 of an application identification device according to the present invention.
- Embodiment 1 is a flowchart of Embodiment 1 of an application identification method according to the present invention.
- the method in this embodiment may include:
- Step 101 determining whether to obtain the file extension of the application running on the virtualization system, and if so, executing step 102, if not, executing step 103;
- Step 102 Identify an application according to the file extension, and determine an application type of the application.
- Step 103 Obtain a feature code of a binary data area of the application running on the virtualization system, determine a matching result of a feature code of the binary data area of the application and a feature code in the feature code library, and identify according to the matching result.
- An application that determines an application type of the application.
- step 102 the application is identified based on the file extension to determine the application type of the application. Specifically, each application has its own file extension. By judging the file extension, it can be determined which applications are used by the current storage, thereby completing the identification of the application and the resource allocation work on the storage device. Table 1 shows an illustration of identifying an application based on a file extension and determining the application type of the application.
- the files with the file extensions of the Exchange application named chk and ebp are migrated to the high-performance layer to ensure the efficiency of the Exchange, and then the audio, video, The compression and text files are migrated to the capacity layer, which saves the capacity occupation of the high-performance layer, thereby realizing the identification of the application and completing the allocation of the storage resources. Work.
- step 103 acquiring a feature code of the binary data area of the application running on the virtualization system, and determining a matching result of the feature code of the binary data area of the application and the feature code in the feature code library, Identifying an application based on the matching result, determining an application type of the application.
- step 103 acquiring a feature code of a binary data area of each standard application
- the preset matching rule includes a specific matching rule of the feature code of the binary data area and the feature code in the feature code library.
- the application type of the standard application, the preset matching rule, and the signature of the binary data area have a corresponding relationship.
- the application type of the application can be determined according to the correspondence. Then, the virtualization system optimizes performance based on the application according to the application type of each application to improve performance.
- step 103 when the application corresponding binary data area includes the first binary data area and the second binary data area, step 103 includes: acquiring the first application of the application running on the virtualization system a first fixed byte corresponding to the binary data area, determining a feature code corresponding to the first fixed byte according to the first fixed byte, and determining a feature code corresponding to the first fixed byte Character code matching in the feature code library;
- the feature code corresponding to the second fixed byte is determined by determining a location of the feature code corresponding to the first fixed byte, and determining a first preset offset according to the preset matching rule. Transmitting a position amount, determining a data block length of the first binary data area according to the first preset offset position amount and a fixed byte length of the first binary data area; Determining a position of the feature code corresponding to the second fixed byte, and selecting a feature code corresponding to the second fixed byte, a location of the feature code corresponding to the fixed byte and a length of the first binary data block a location, determining a signature corresponding to the second fixed byte.
- an application may include not only two binary data areas but also multiple binary data areas. Determining a signature corresponding to the second fixed byte if determining that the signature corresponding to the second fixed byte matches the signature in the signature database when an application includes a plurality of binary data regions After matching the signatures in the signature database, the method further includes:
- the application identification method determines whether the file extension of the application running on the virtualization system is obtained, and if so, identifies the application according to the file extension, and determines the application type of the application; a feature code of the binary data area of the application running on the virtualization system, determining a matching result of a feature code of the binary data area of the application and a feature code in the feature code library, identifying an application according to the matching result, determining the location
- the application running on the virtualization system can be identified by the present invention, so that the virtualization system can optimize the performance of the application.
- FIG. 3 is a schematic diagram of a new text document.zip of the present invention.
- a zip file consists of three binary data areas: a compressed source file data area, a compressed source file directory area, and a compressed source file directory end flag.
- 4 is a schematic diagram of a compressed source file data area
- FIG. 5 is a schematic diagram of a compressed source file directory area
- FIG. 6 is a schematic diagram of a compressed source file directory end flag.
- the binary data in the black box represents the compressed source file data area.
- the specific meanings of each binary data are shown in Table 1.
- the signature of the binary data area of the standard application according to the fixed byte is: 50 4B 03 04;
- Offset position 28 length 2 bytes, length of the extracted extent: 0
- Block length of the binary data area total acquisition length plus offset 30, binary data area
- the data block length is 65.
- 0 to 65 bytes are the data blocks of the compressed source file data area.
- the zip file may further include a binary data area corresponding to the data description area.
- the data description area is used to identify the end of compression of the file. The structure only appears when the third bit of the general tag field in the corresponding header is set to 1, immediately after compressing the file source data. In this embodiment, since the general tag field is: 00 00, there is no such data description area.
- the binary data in the black box represents the compressed source file directory area.
- the specific meanings of each binary data are shown in Table 2.
- the feature code of the binary data area of the standard application according to the fixed byte is: 50 4B 01 02;
- Offset position 32 length 2 bytes, extract file comment length: 0;
- the data block length of the binary data area is 62.
- 65 is the offset position of the compressed source file data area
- 127 bytes is the data block of the compressed source file directory area.
- the binary data in the black box represents the compressed source file directory end flag.
- the specific meanings of each binary data representation are shown in Table 3.
- the signature of the binary data area of the standard application according to the fixed byte is: 50 4B 05 06;
- Offset position 20 length 2 bytes, extracted file name length: 4; total acquisition length: 4.
- the data block length of the binary data area is the total acquisition length plus the offset 22, and the data block length of the binary data area is 26.
- 127 127 is the compressed source file data area + offset position of the compressed source file directory area
- 153 bytes is the data block of the compressed source file end directory area.
- the signature code and preset matching rules based on the zip file are as follows:
- Compressed source file data area feature code 50 4B 03 04;
- Compressed source file data description area feature code 50 4B 07 08;
- Compressed source file directory area feature code 50 4B 01 02;
- Compressed source file directory end mark area feature code 50 4B 05 06;
- Total acquisition length M+N+X, plus offset 30, from K (K is the total size of the data area matched to the last few times) to 30+M+N+X bytes as the compressed source file The data block of the data area.
- the preset matching rule is started as follows:
- E+F+G plus offset 46 is equal to 46+E+F+G, from K (K is the total size of the data area matched to the last few times) to 46+E+F+
- the G byte is the data block of the compressed source file directory area.
- the preset matching rule is started as follows:
- the total acquisition length: Y, plus the offset 22 is equal to 22 + Y, from K (K is the total size of the data area matched to the last few times) to 22 + Y bytes at the end of the compressed source file directory data block.
- the feature code is matched with the feature code in the feature code library, and if the matching is successful, the matching is continued, if the matching fails. , then re-match the process.
- the data block length 30+M+N+X of the compressed source file data area is determined according to the preset matching rule. After the length is passed, the feature code is obtained, and whether the feature code and the feature code base are determined. The feature codes in the match are matched. If they match, the preset matching rule is started, and the matching process of the next feature code is prepared. If the matching fails, the matching process is performed again.
- the application types of the applications are determined according to the application types of the standard application, the preset matching rules, and the signatures of the binary data regions.
- FIG. 7 is a schematic structural diagram of Embodiment 1 of an application identification device according to the present invention.
- the application identification device 70 provided by the embodiment includes a determination module 701, a determination module 702 and a processing module 703.
- the determining module 701 is configured to determine whether a file extension of an application running on the virtualization system is obtained.
- the determining module 702 is configured to determine, according to the file extension identification application, an application type of the application when the determining module determines to be YES;
- the processing module 703 is configured to: when the determining module determines to be no, acquire a feature code of the binary data area of the application running on the virtualization system, and determine a feature code and a feature code of the binary data area of the application.
- the matching result of the feature code in the library identifies the application according to the matching result, and determines the application type of the application.
- the application identification device provided in this embodiment can perform the technical solution of the foregoing method embodiment, and the implementation principle and the technical effect are similar, and the details are not described herein again.
- FIG. 8 is a schematic structural diagram of Embodiment 2 of an application identification device according to the present invention. This embodiment is implemented on the basis of the embodiment of FIG. 7, and the details are as follows:
- processing module 703 includes:
- the matching unit 7031 is configured to acquire a first fixed byte corresponding to the first binary data area of the application running on the virtualization system, and determine the first fixed word according to the first fixed byte Corresponding feature code, and determining that the feature code corresponding to the first fixed byte matches the feature code in the feature code library;
- a determining unit 7032 configured to acquire, according to the feature code corresponding to the first fixed byte and a preset matching rule, a second fixed word corresponding to the second binary data area of the application running on the virtualization system And determining, according to the second fixed byte, a feature code corresponding to the second fixed byte, and determining a matching result of the feature code corresponding to the second fixed byte and the feature code in the feature code library.
- the determining unit 7032 is specifically configured to: determine a location of the feature code corresponding to the first fixed byte, and determine, according to the preset matching rule, a first preset offset location quantity, according to the Determining a data block length of the first binary data area by a preset offset position amount and a fixed byte length of the first binary data area;
- the processing module 703 is further configured to: determine, according to the matching between the feature code corresponding to the second fixed byte and the feature code in the feature code library, where the determining the second fixed byte corresponds to After the matching result of the feature code and the feature code in the feature code library, determining, according to the preset matching rule, a second preset offset position amount, according to the second preset offset position amount and the second second a fixed byte length of the hexadecimal data area, determining a data block length of the second binary data area;
- the method further includes: a library building module 704, configured to obtain a feature code of the binary data area of the application running on the virtualization system, and determine a feature code and a feature of the binary data area of the application.
- a library building module 704 configured to obtain a feature code of the binary data area of the application running on the virtualization system, and determine a feature code and a feature of the binary data area of the application.
- the application identification device provided in this embodiment can perform the technical solution of the foregoing method embodiment, and the implementation principle and the technical effect are similar, and the details are not described herein again.
- the aforementioned program can be stored in a computer readable storage medium.
- the program when executed, performs the steps including the foregoing method embodiments; and the foregoing storage medium includes various media that can store program codes, such as a ROM, a RAM, a magnetic disk, or an optical disk.
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种应用识别方法与装置。本发明的应用识别方法,包括:确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。本发明能够识别虚拟化系统上运行的应用,从而使得虚拟化系统能够基于应用进行性能优化,提高性能。
Description
本申请要求于2013年11月8日提交中国专利局、申请号为201310607827.4、发明名称为“一种应用识别方法与装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本发明实施例涉及通信技术,尤其涉及一种应用识别方法与装置。
随着虚拟化系统的广泛使用,虚拟化系统的自管理、自优化变得十分重要。
在现有技术中,虚拟化系统先基于输入/输出判断数据为热点数据或冷数据,再根据判断结果进行自管理、自优化。当归属与该虚拟化系统的区域内的部分数据的输入/输出频率相对比较高的时候,该数据为活跃度高的“热点数据”,当归属与该虚拟化系统的区域内的部分数据的输入/输出频率比较低的数据,该数据为活跃度低的“冷数据”,接着,虚拟化系统通过数据迁移将活跃度高的“热点数据”迁移至具有更高性能的存储介质(例如,固态硬盘(Solid State Disk,简称SSD)),将活跃度低的“冷数据”迁移至具有更高容量且更低容量成本的存储介质(如串行高级技术附件(Serial Advanced Technology Attachment,简称SATA)硬盘),从而达到自管理和自由化的效果。
然而,虚拟化系统不能识别“热点数据”所基于的应用,有可能该些热点数据仅仅是一些影视、歌曲文件,虽然读写频繁,但并不影响虚拟化系统的效率和使用,若将该些热点数据迁移到高性能的存储介质中,则占用了高性能介质的存储空间,从而影响虚拟化系统中其它应用的正常使用,导致虚拟化系统性能低下。
发明内容
本发明实施例提供一种应用识别方法与装置,能够识别虚拟化系统上运行的应用,从而使得虚拟化系统能够基于应用进行性能优化,提高性能。
第一方面,本发明提供一种应用识别方法,包括:
确定是否获取到虚拟化系统上运行的应用的文件扩展名;
若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;
若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
结合第一方面,在第一方面的第一种可能的实现方式中,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,包括:
获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,包括:
确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,若确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,还包括:
根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
结合第一方面、第一方面的第一种至第三种任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,还包括:
获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
第二方面,一种应用识别装置,包括:
判断模块,用于确定是否获取到虚拟化系统上运行的应用的文件扩展名;
确定模块,用于在所述判断模块判断为是时,根据所述文件扩展名识别应用,确定所述应用的应用类型;
处理模块,用于在所述判断模块判定为否时,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
结合第二方面,在第二方面的第一种可能的实现方式中,所述处理模块包括:
匹配单元,用于获取所述虚拟化系统上运行的所述应用的第一二进制数
据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
确定单元,用于根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述确定单元具体用于:
确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述处理模块还用于:在确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
结合第二方面、第二方面的第一种至第三种任一种可能的实现方式,在第二方面的第四种可能的实现方式中,还包括:建库模块,用于在所述获取
所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,
获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
本发明实施例提供的应用识别方法与装置,该方法通过确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型,通过本发明可以识别虚拟化系统上运行的应用,从而使得虚拟化系统能够给予应用进行性能优化。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明应用识别方法实施例一的流程图;
图2为新建文本文档.txt示意图;
图3为本发明新建文本文档.zip示意图;
图4为压缩源文件数据区的示意图;
图5为压缩源文件目录区的示意图;
图6为压缩源文件目录结束标志示意图;
图7为本发明应用识别装置实施例一的结构示意图;
图8为本发明应用识别装置实施例二的结构示意图。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明应用识别方法实施例一的流程图,
如图1所示,本实施例的方法可以包括:
步骤101、确定是否获取到虚拟化系统上运行的应用的文件扩展名,若是,执行步骤102,若否,执行步骤103;
步骤102、根据所述文件扩展名识别应用,确定所述应用的应用类型;
步骤103、获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
在具体实现过程中,虚拟化系统上可以运行各种应用。但是,在虚拟机场景下,是无法对虚拟化系统上运行的应用的文件扩展名进行识别。因此,首先确定是否可以获取到虚拟化系统上运行的应用的文件扩展名。
若是,执行步骤102。在步骤102中,根据文件扩展名识别应用,确定应用的应用类型。具体地,每一种应用都有它特有的文件扩展名,通过判断文件扩展名,可以确定到当前存储被哪些应用所使用,从而完成对应用的识别和在存储设备上的资源调配工作。表一列出了根据文件扩展名识别应用、确定应用的应用类型的示意。
表一
文件扩展名 | 类型 |
zip | Zip格式压缩文件 |
mp3,rmvb,avi,mkv | 音频、视频文件 |
chk,ebp | Exchange |
如表一所示,对存储设备上的文件进行遍历检测之后,把Exchange应用使用的文件扩展名为chk和ebp的文件迁移到高性能层,保证了Exchange的运行效率,然后把音频、视频、压缩、文本文件迁移到了容量层,节省了高性能层的容量占用,从而实现了对应用的识别并完成了对存储资源的调配工
作。
若否,执行步骤103,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
在步骤103之前,获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
具体地,预设匹配规则中包括了二进制数据区的特征码与特征码库中的特征码的具体的匹配规则。在特征码库中,标准应用的应用类型、预设匹配规则以及二进制数据区的特征码具有对应关系。当二进制数据区的特征码与特征码库中的特征码匹配时,根据该对应关系,可以确定应用的应用类型。然后使得虚拟化系统根据各应用的应用类型,基于应用进行性能优化,提高性能。
在具体实现过程中,当应用对应地二进制数据区包括第一二进制数据区和第二二进制数据区时,步骤103包括:获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
可选地,可通过如下方式确定所述第二固定字节对应的特征码:确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码。
本领域技术人员可以理解,在具体实现过程中,一个应用可能包括不仅两个二进制数据区,还可能包括多个二进制数据区。当一个应用包括多个二进制数据区时,若确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,还包括:
根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
本发明实施例提供的应用识别方法,通过确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型,通过本发明可以识别虚拟化系统上运行的应用,从而使得虚拟化系统能够给予应用进行性能优化。
下面采用具体的实施例,对本发明提供的应用识别方法进行详细说明。
首先,对特征码库的建立进行详细说明。以zip文件形式为例,对于未压缩的文件:新建文本文档.txt具体可如图2所示,图2为新建文本文档.txt示意图。进行压缩后,文件名称:新建文本文档.zip,具体可如图3所示,图3为本发明新建文本文档.zip示意图。
一般情况下,一个zip文件由三个二进制数据区组成:压缩源文件数据区、压缩源文件目录区以及压缩源文件目录结束标志。其中,图4为压缩源文件数据区的示意图;图5为压缩源文件目录区的示意图;图6为压缩源文件目录结束标志示意图。
在图4中,黑色框体内的二进制数据代表了压缩源文件数据区。各二进制数据代表的具体含义如表一所示。
表一
根据固定字节获取标准应用的二进制数据区的特征码为:50 4B 03 04;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则的方式具体如下:
偏移位置18,长度4字节,抽取压缩后的大小:19
偏移位置26,长度2字节,抽取文件名的长度:16
偏移位置28,长度2字节,抽取扩展区的长度:0
总采集长度:19+16+0=35;
二进制数据区的数据块长度:总采集长度加上偏移量30,二进制数据区
的数据块长度为65。对应地,0到65字节处为压缩源文件数据区的数据块。
对应的预设匹配规则,在存储数据检测过程中,在匹配到特征库中的特征码50 4B 03 04时,启动预设匹配规则,
在偏移位置18,采集压缩后的大小;
在偏移位置26处,采集文件名长度;
在偏移位置28处,采集扩展名长度。
可选地,zip文件还可包括与数据描述区对应的二进制数据区。其中,数据描述区用于标识该文件压缩结束,该结构只有在相应的header中通用标记字段的第3位设为1时才会出现,紧接在压缩文件源数据后。本实施例由于通用标记字段为:00 00所以无此数据描述区。
在图5中,黑色框体内的二进制数据代表了压缩源文件目录区。各二进制数据代表的具体含义如表二所示。
根据固定字节获取标准应用的二进制数据区的特征码为:50 4B 01 02;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则的方式具体如下:
偏移位置28,长度2字节,抽取文件名长度:16;
偏移位置30,长度2字节,抽取扩展区长度:0;
偏移位置32,长度2字节,抽取文件注释长度:0;
总采集长度:16+0+0=16。
二进制数据区的数据块长度:总采集长度加上偏移量46,二进制数据区的数据块长度为62。对应地,65(65为压缩源文件数据区的偏移位置)到127字节处为压缩源文件目录区的数据块。
对应的预设匹配规则,在存储数据检测过程中,在匹配到特征库中的特征码50 4B 01 02时,启动预设匹配规则,
向后在偏移位置28处,采集压缩后的大小;
在偏移位置30处,采集扩展区长度;
在偏移位置32处,采集文件注释长度。
表二
在图6中,黑色框体内的二进制数据代表了压缩源文件目录结束标志。各二进制数据代表的具体含义如表三所示。
表三
根据固定字节获取标准应用的二进制数据区的特征码为:50 4B 05 06;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则的方式具体如下:
偏移位置20,长度2字节,抽取文件名长度:4;总采集长度:4。
二进制数据区的数据块长度:总采集长度加上偏移量22,二进制数据区的数据块长度为26。对应地,127(127为压缩源文件数据区+压缩源文件目录区的偏移位置)到153字节处为压缩源文件结束目录区的数据块。
对应的预设匹配规则,在存储数据检测过程中,在匹配到特征库中的特征码50 4B 05 06时,启动预设匹配规则,
向后在偏移位置20处,采集压缩后的大小。
综上可知,基于zip文件的特征码和预设匹配规则如下:
压缩源文件数据区特征码:50 4B 03 04;
压缩源文件数据描述区特征码:50 4B 07 08;
压缩源文件目录区特征码:50 4B 01 02;
压缩源文件目录结束标志区特征码:50 4B 05 06;
压缩源文件数据区:
当匹配到特征码:50 4B 03 04的时候立刻启动预设匹配规则,如下:
1、向后在偏移位置18,采集压缩后的大小M
2、在偏移位置26处,采集文件名长度N
3、在偏移位置28处,采集扩展名长度X
总采集长度:M+N+X,再加上偏移量30之后,从K(K为上几次匹配到的数据区总大小)到30+M+N+X字节处为压缩源文件数据区的数据块。
压缩源文件数据描述区:
当匹配到特征码:50 4B 03 04的时候立刻启动预设匹配规则,如下:
直接向后偏移16字节,进入下一块区域的检测。
压缩源文件目录区:
当匹配到特征码:50 4B 01 02的时候立刻启动预设匹配规则,如下:
1、向后在偏移位置28,采集压缩后的大小E
2、在偏移位置30处,采集扩展区长度F
3、在偏移位置32处,采集文件注释长度G
总采集长度:E+F+G,再加上偏移量46之后等于46+E+F+G,从K(K为上几次匹配到的数据区总大小)到46+E+F+G字节处为压缩源文件目录区的数据块。
压缩源文件目录结束标志区:
当匹配到特征码:50 4B 05 06的时候立刻启动预设匹配规则,如下:
1、向后在偏移位置20,采集压缩后的大小Y
总采集长度:Y,再加上偏移量22之后等于22+Y,从K(K为上几次匹配到的数据区总大小)到22+Y字节处为压缩源文件目录结束区的数据块。
在具体匹配过程中,当采集到压缩源文件数据区特征码:50 4B 03 04时,将该特征码与特征码库中的特征码进行匹配,若匹配成功,则继续进行匹配,若匹配失败,则重新进行匹配过程。
在该特征码匹配成功后,根据预设匹配规则确定压缩源文件数据区的数据块长度30+M+N+X,在经过该长度后,得到特征码,确定该特征码是否与特征码库中的特征码匹配,若匹配,则启动预设匹配规则,准备下一个特征码的匹配过程,若匹配失败,则重新进行匹配过程。当所有二进制数据区的特征码均与特征码库中的特征码匹配成功时,则根据标准应用的应用类型、预设匹配规则以及二进制数据区的特征码具有对应关系,确定应用的应用类型。
图7为本发明应用识别装置实施例一的结构示意图。如图7所示,本发明
实施例提供的应用识别装置70包括判断模块701,确定模块702和处理模块703。
其中,判断模块701,用于确定是否获取到虚拟化系统上运行的应用的文件扩展名;
确定模块702,用于在所述判断模块判断为是时,根据所述文件扩展名识别应用,确定所述应用的应用类型;
处理模块703,用于在所述判断模块判定为否时,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
本实施例提供的应用识别装置,可执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图8为本发明应用识别装置实施例二的结构示意图。本实施例在图7实施例的基础上实现,具体如下:
可选地,所述处理模块703包括:
匹配单元7031,用于获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;
确定单元7032,用于根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
可选地,所述确定单元7032具体用于:确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;
根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码,并确定所述
第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
可选地,所述处理模块703还用于:在确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;
根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
可选地,还包括:建库模块704,用于在所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,获取各标准应用的二进制数据区的特征码;
获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;
将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
本实施例提供的应用识别装置,可执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并
不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
- 一种应用识别方法,其特征在于,包括:确定是否获取到虚拟化系统上运行的应用的文件扩展名;若是,根据所述文件扩展名识别应用,确定所述应用的应用类型;若否,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
- 根据权利要求1所述的方法,其特征在于,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,包括:获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的特征码匹配;根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
- 根据权利要求2所述的方法,其特征在于,所述根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,包括:确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码。
- 根据权利要求3所述的方法,其特征在于,若确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,还包括:根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
- 根据权利要求1至4任一项所述的方法,其特征在于,所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,还包括:获取各标准应用的二进制数据区的特征码;获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
- 一种应用识别装置,其特征在于,包括:判断模块,用于确定是否获取到虚拟化系统上运行的应用的文件扩展名;确定模块,用于在所述判断模块判断为是时,根据所述文件扩展名识别应用,确定所述应用的应用类型;处理模块,用于在所述判断模块判定为否时,获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型。
- 根据权利要求6所述的装置,其特征在于,所述处理模块包括:匹配单元,用于获取所述虚拟化系统上运行的所述应用的第一二进制数据区对应的第一固定字节,根据所述第一固定字节,确定所述第一固定字节对应的特征码,并确定所述第一固定字节对应的特征码与所述特征码库中的 特征码匹配;确定单元,用于根据所述第一固定字节对应的特征码和预设匹配规则,获取所述虚拟化系统上运行的所述应用的第二二进制数据区对应的第二固定字节,根据所述第二固定字节,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
- 根据权利要求7所述的装置,其特征在于,所述确定单元具体用于:确定所述第一固定字节对应的特征码的位置,根据所述预设匹配规则,确定第一预设偏移位置量,根据所述第一预设偏移位置量和所述第一二进制数据区的固定字节长度,确定所述第一二进制数据区的数据块长度;根据所述第一固定字节对应的特征码的位置以及所述第一二进制数据块的长度,确定所述第二固定字节对应的特征码的位置,根据所述第二固定字节对应的特征码的位置,确定所述第二固定字节对应的特征码,并确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果。
- 根据权利要求8所述的装置,其特征在于,所述处理模块还用于:在确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配,则所述确定所述第二固定字节对应的特征码与特征码库中的特征码的匹配结果之后,根据所述预设匹配规则,确定第二预设偏移位置量,根据所述第二预设偏移位置量和所述第二二进制数据区的固定字节长度,确定所述第二二进制数据区的数据块长度;根据所述第二固定字节对应的特征码的位置以及所述第二二进制数据区的数据块长度,获取所述虚拟化系统上运行的所述应用的第三二进制数据区对应的第三固定字节,根据所述第三固定字节,确定所述第三固定字节对应的特征码,并确定所述第三固定字节对应的特征码与所述特征码库中的特征码的匹配结果,直至确定所述虚拟化系统上运行的所述应用的所有二进制数据区的固定字节对应的特征码与所述特征库中的特征码的匹配结果。
- 根据权利要求6至9任一项所述的装置,其特征在于,还包括:建库模块,用于在所述获取所述虚拟化系统上运行的所述应用的二进制数据区的特征码,确定所述应用的二进制数据区的特征码与特征码库中的特征码的匹配结果,根据匹配结果识别应用,确定所述应用的应用类型之前,获取各标准应用的二进制数据区的特征码;获取各所述标准应用的二进制数据区的预设偏移位置量,根据所述预设偏移位置量确定各所述标准应用的所述预设匹配规则;将各所述标准应用的二进制数据区的特征码和所述预设匹配规则保存到所述特征码库中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310607827.4A CN103631589B (zh) | 2013-11-08 | 2013-11-08 | 应用识别方法与装置 |
CN201310607827.4 | 2013-11-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2015067145A1 true WO2015067145A1 (zh) | 2015-05-14 |
Family
ID=50212687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2014/090046 WO2015067145A1 (zh) | 2013-11-08 | 2014-10-31 | 应用识别方法与装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103631589B (zh) |
WO (1) | WO2015067145A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631589B (zh) * | 2013-11-08 | 2017-02-01 | 华为技术有限公司 | 应用识别方法与装置 |
CN103873860B (zh) * | 2014-03-18 | 2017-12-22 | 深信服网络科技(深圳)有限公司 | 文件传输方法及装置 |
CN105095330B (zh) * | 2014-12-01 | 2019-05-07 | 哈尔滨安天科技股份有限公司 | 一种基于压缩包内容的文件格式识别方法及系统 |
CN105573893B (zh) * | 2015-12-25 | 2018-03-02 | 珠海国芯云科技有限公司 | 一种软件监控方法和装置 |
CN106095768A (zh) * | 2016-04-29 | 2016-11-09 | 乐视控股(北京)有限公司 | 终端及基于终端的应用推送方法 |
CN108153676B (zh) * | 2017-12-26 | 2021-08-20 | Oppo广东移动通信有限公司 | 调试管理方法、装置、存储介质及终端设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090013408A1 (en) * | 2007-07-06 | 2009-01-08 | Messagelabs Limited | Detection of exploits in files |
CN102571767A (zh) * | 2011-12-24 | 2012-07-11 | 成都市华为赛门铁克科技有限公司 | 文件类型识别方法及文件类型识别装置 |
CN103631589A (zh) * | 2013-11-08 | 2014-03-12 | 华为技术有限公司 | 应用识别方法与装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6460044B1 (en) * | 1999-02-02 | 2002-10-01 | Jinbo Wang | Intelligent method for computer file compression |
-
2013
- 2013-11-08 CN CN201310607827.4A patent/CN103631589B/zh active Active
-
2014
- 2014-10-31 WO PCT/CN2014/090046 patent/WO2015067145A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090013408A1 (en) * | 2007-07-06 | 2009-01-08 | Messagelabs Limited | Detection of exploits in files |
CN102571767A (zh) * | 2011-12-24 | 2012-07-11 | 成都市华为赛门铁克科技有限公司 | 文件类型识别方法及文件类型识别装置 |
CN103631589A (zh) * | 2013-11-08 | 2014-03-12 | 华为技术有限公司 | 应用识别方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103631589A (zh) | 2014-03-12 |
CN103631589B (zh) | 2017-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015067145A1 (zh) | 应用识别方法与装置 | |
KR102007070B1 (ko) | 메모리 관리 시의 중복 제거를 위해서 기준 세트로 기준 블록을 취합하는 기법 | |
US10216740B2 (en) | System and method for fast parallel data processing in distributed storage systems | |
Lu et al. | Frequency based chunking for data de-duplication | |
EP3376393B1 (en) | Data storage method and apparatus | |
WO2016041401A1 (zh) | 向缓存中写入数据的方法及装置 | |
CN102323958A (zh) | 重复数据删除方法 | |
Xu et al. | A lightweight virtual machine image deduplication backup approach in cloud environment | |
KR20160016744A (ko) | 플래시 메모리 장치에 데이터를 기록하는 방법, 플래시 메모리 장치, 및 저장 시스템 | |
CN106980680B (zh) | 数据存储方法及存储设备 | |
WO2017097106A1 (zh) | 一种文件差量的传输方法以及装置 | |
KR101484882B1 (ko) | 포렌식 데이터 복원 방법 및 시스템 | |
US11593312B2 (en) | File layer to block layer communication for selective data reduction | |
KR20210126773A (ko) | 파티셔닝 방법 및 그 장치 | |
CN104484132A (zh) | 数据缩减的方法及装置 | |
WO2021082926A1 (zh) | 一种数据压缩的方法及装置 | |
CN105515586A (zh) | 一种快速差量压缩方法 | |
US11513739B2 (en) | File layer to block layer communication for block organization in storage | |
CN108846039B (zh) | 数据流向确定方法及装置 | |
CN112714163B (zh) | 数据传输方法、装置、电子设备和介质 | |
CN111352769A (zh) | 恢复数据库的方法、恢复服务器及计算机可读存储介质 | |
CN112380174B (zh) | 含删除文件的xfs文件系统解析方法、终端设备及存储介质 | |
US10242025B2 (en) | Efficient differential techniques for metafiles | |
US10049115B1 (en) | Systems and methods for performing incremental database backups | |
CN102760212A (zh) | 一种基于存储镜像克隆机制虚拟桌面恶意代码检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14860281 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 14860281 Country of ref document: EP Kind code of ref document: A1 |