KR20080043204A - File format analysis system and method for unknown file format to use software security testing - Google Patents

File format analysis system and method for unknown file format to use software security testing Download PDF

Info

Publication number
KR20080043204A
KR20080043204A KR1020070045914A KR20070045914A KR20080043204A KR 20080043204 A KR20080043204 A KR 20080043204A KR 1020070045914 A KR1020070045914 A KR 1020070045914A KR 20070045914 A KR20070045914 A KR 20070045914A KR 20080043204 A KR20080043204 A KR 20080043204A
Authority
KR
South Korea
Prior art keywords
file
data
unknown
file format
function
Prior art date
Application number
KR1020070045914A
Other languages
Korean (ko)
Other versions
KR100924519B1 (en
Inventor
최영한
김형천
홍순좌
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US11/850,921 priority Critical patent/US20080115016A1/en
Publication of KR20080043204A publication Critical patent/KR20080043204A/en
Application granted granted Critical
Publication of KR100924519B1 publication Critical patent/KR100924519B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/28Error detection; Error correction; Monitoring by checking the correct order of processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

A system and a method for analyzing an unknown file format to test security of software are provided to reduce error processing owing to format mismatch by extracting/converting a field position and a data type of the unknown file format into a value for a fault operation to increase code coverage for the unknown file format. A file scanner(104) parses function parameters of a loaded file by monitoring a target program(103) loading an unknown file(101) to a memory. A file analyzer(106) extracts a field position and a data type of an unknown file format by receiving parsing information from the file scanner. The file scanner is a debugger for tracing a function when the unknown file is loaded on the memory, and the file analyzer extracts the field position and the data type of the unknown file format by comparing the function parameter with the loaded file.

Description

소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템 및 방법{FILE FORMAT ANALYSIS SYSTEM AND METHOD FOR UNKNOWN FILE FORMAT TO USE SOFTWARE SECURITY TESTING}FILE FORMAT ANALYSIS SYSTEM AND METHOD FOR UNKNOWN FILE FORMAT TO USE SOFTWARE SECURITY TESTING}

도 1은 본 발명의 알려지지 않은 파일 포맷에 대해 필드 위치와 데이터 타입을 자동으로 분석하는 시스템의 구성도,1 is a block diagram of a system for automatically analyzing field positions and data types for unknown file formats of the present invention;

도 2는 함수 파라미터로 전달되는 데이터들을 3가지로 분류하기 위한 스택의 구조,2 is a structure of a stack for classifying three types of data delivered as function parameters,

도 3은 함수 파라미터를 통해 파일의 데이터 필드를 추출하는 메커니즘을 나타낸 구성도이다.3 is a block diagram illustrating a mechanism for extracting a data field of a file through a function parameter.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

104 : 파일 스캐너 106 : 파일 분석기104: File Scanner 106: File Analyzer

본 발명은 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포 맷 분석 시스템 및 방법에 관한 것으로, 더욱 상세하게는 소프트웨어 테스팅 중 결함 삽입(fault injection) 기법을 이용할 때 알려지지 않은 파일 포맷에 대해 필드 위치를 추출해 코드 커버리지(Code Coverage)를 향상시키는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템 및 방법에 관한 것이다.The present invention relates to an unknown file format analysis system and method for performing software security testing, and more particularly, to extract field positions for unknown file formats when using fault injection techniques during software testing. An unknown file format analysis system and method for performing software security testing that improves code coverage.

여기서, 코드 커버리지는 컴파일된 코드에 얼마나 많은 부분에 대하여 테스팅을 수행하는 지에 대한 정도를 나타낸다.Here, code coverage refers to how much of the compiled code is tested.

IT 분야에 급속한 기술발전으로 인해 이에 따르는 소프트웨어의 기술 역시 발전되어야만 한다. 이와 같이, 소프트웨어는 컴퓨터 분야 및 통신 분야에 중요한 요소로서 자리하고 있다. 이로 인해, 소프트웨어의 신뢰성은 시스템 운용의 신뢰성과 직결되어 이에 대한 품질관리가 요구되고 있다. 소프트웨어의 품질관리는 그 대표적인 예로서, 소프트웨어 테스팅 기법을 가장 많이 사용하고 있다.Due to the rapid development of technology in the IT field, the technology of the software must be developed accordingly. As such, software has emerged as an important element in the computer and communication fields. For this reason, the reliability of the software is directly related to the reliability of the system operation, and quality control for this is required. Software quality control is a representative example, and software testing techniques are used the most.

최근 소프트웨어의 특성상 신뢰도의 요구가 다양하게 증가함에 따라 테스팅 비용 및 시간이 많이 증가하는 현실에 있다. 이로 인해, 소프트웨어 테스팅 시간 및 비용을 줄이기 위해서는 자동화가 이루어져야 한다. 테스트의 자동화는 이미 진행되고 있으며, 하나의 예로서, 소스 코드 분석 결과를 바탕으로 테스트 스크립트, 테스트 데이터, 테스트 드라이버를 자동으로 생성하여 테스트 초기 과정을 편의성을 크게 향상시킴으로써 테스트 시간 및 비용을 절감하는 방안이 제시되고 있다. 이와 같이, 테스트 케이스의 생성으로부터 테스트 수행 및 분석에 이르기까지 소프트웨어 테스팅을 위한 전반적인 자동화가 실현되고 있다.Recently, as the demand for reliability increases variously due to the nature of the software, the testing cost and time increase much. Because of this, automation must be done to reduce software testing time and costs. Test automation is already underway, and as an example, it automatically generates test scripts, test data, and test drivers based on source code analysis results, greatly reducing test time and costs by greatly improving the initial testing process. The solution is being presented. As such, overall automation for software testing, from test case creation to test execution and analysis, is being realized.

한편, 소프트웨어 테스팅 기법 중의 하나인 파일을 이용한 결함 삽입 기법은, 파일 포맷을 고려하지 않고 임의적으로 결함을 삽입하기 때문에 시스템 내의 자체 에러 처리 메커니즘에 의해 에러로 처리되는 경우가 많아 실제적으로 대상 소프트웨어의 결함을 유도하는 비율이 높지 않은 문제점이 존재하였다. 그리고 파일 포맷이 공개되어 있더라도 파일 포맷을 고려하여 결함 삽입 기법을 사용하기 위해 많은 시간이 요구되었다.On the other hand, the defect insertion method using a file, which is one of the software testing techniques, often inserts a defect without considering the file format, so it is often treated as an error by its own error handling mechanism in the system. There was a problem that the ratio that induces is not high. And even if the file format is open, much time is required to use the defect insertion method in consideration of the file format.

따라서, 본 발명은 상기한 종래 기술의 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 파일을 이용한 소프트웨어 결함 검출 방법 중 알려지지 않은 파일 포맷에 대한 코드 커버리지를 높이기 위해 알려지지 않은 파일 포맷의 필드 위치와 데이터 타입을 추출하여 결함 연산을 위한 값으로 변경함으로써 포맷 불일치로 인한 에러 처리 과정을 줄이는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템 및 방법을 제공하는데 있다.Accordingly, the present invention has been made to solve the above-mentioned problems of the prior art, and an object of the present invention is to provide a field position of an unknown file format in order to increase code coverage of an unknown file format in a software defect detection method using a file. An object of the present invention is to provide an unknown file format analysis system and method for performing software security testing to reduce error handling due to format mismatch by extracting a data type and changing the value to a value for a defect operation.

상기와 같은 목적을 달성하기 위한 본 발명의 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템은, 메모리로 알려지지 않은 파일을 로드하는 프로그램을 감시하여 상기 로드된 파일의 함수 파라미터를 파싱하는 파일 스캐너와, 상기 파일 스캐너로부터 파싱된 정보를 전달받아 상기 알려지지 않 은 파일 포맷의 필드 위치와 데이터 타입을 추출하는 파일 분석기를 포함하여 이루어진 것을 특징으로 한다.An unknown file format analysis system for performing the software security testing of the present invention for achieving the above object, a file scanner for monitoring a program that loads an unknown file into the memory to parse the function parameters of the loaded file And a file analyzer that receives the parsed information from the file scanner and extracts a field position and a data type of the unknown file format.

이때, 상기 파일 스캐너는 알려지지 않은 파일이 메모리에 로드될 때 함수를 추적하는 디버거를 의미하며, 상기 파일 분석기는 상기 함수 파라미터와 로드된 파일을 비교하여 파일 포맷의 필드 위치와 데이터 타입을 추출하는 모듈을 의미한다.In this case, the file scanner refers to a debugger that tracks a function when an unknown file is loaded into a memory, and the file analyzer compares the function parameter and the loaded file to extract a field position and a data type of a file format. Means.

한편, 본 발명의 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법은, (a) 파일 스캐너에서 메모리로 알려지지 않은 파일을 로드하는 해당 프로그램의 동작을 감시하는 단계와, (b) 상기 로드된 파일의 함수 파라미터를 파싱하는 단계와, (c) 상기 파싱된 정보를 파일 분석부에서 수신하여 알려지지 않은 파일 포맷의 필드 위치와 데이터 타입을 추출하는 단계와, 그리고 (d) 상기 추출된 필드 위치와 데이터 타입을 고려하여 결함 연산을 위한 값으로 변경하는 단계를 포함하여 이루어진 것을 특징으로 한다.On the other hand, unknown file format analysis method for performing the software security testing of the present invention, (a) monitoring the operation of the program to load the unknown file into the memory in the file scanner, (b) the loaded Parsing a function parameter of a file, (c) receiving the parsed information from a file analyzer to extract field positions and data types of unknown file formats, and (d) extracting the field positions and And changing the value to a value for a defect operation in consideration of the data type.

이때, 상기 (b) 단계는, 스택에서의 파일 데이터 사용에 대응하여 수(number) 타입과 스트링(string) 타입으로 구분 추출하여 파일 포맷에 따라 파싱이 이루어질 수 있다.In this case, in the step (b), parsing may be performed according to a file format by extracting and dividing into a number type and a string type corresponding to the use of the file data in the stack.

또한, 상기 (c) 단계는, 함수를 호출할 때 파라미터 검사를 수행하는 단계와, 해당 함수의 파라미터 수에 대응하여 케이스별로 분석을 수행하는 단계와, 그리고 상기 케이스별 분석 결과를 저장하는 단계를 포함하여 이루어질 수 있다.In addition, the step (c) includes performing a parameter check when calling a function, performing a case-by-case analysis corresponding to the number of parameters of the function, and storing the case-by-case analysis result. It can be made, including.

이하, 본 발명의 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파 일 포맷 분석 시스템 및 방법에 대하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, an unknown file format analysis system and method for performing software security testing of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 알려지지 않은 파일 포맷에 대해 필드 위치와 데이터 타입을 자동으로 분석하는 시스템의 구성도이다.1 is a schematic diagram of a system for automatically analyzing field positions and data types for unknown file formats of the present invention.

본 발명을 수행하기 위한 시스템은 파일 스캐너(File Scanner, 104)와 파일 분석기(File Analyzer, 106)로 구성되어 있다.The system for carrying out the present invention is composed of a file scanner (104) and a file analyzer (106).

파일 스캐너는 알려지지 않은 파일 포맷을 로드하는 프로그램의 동작을 감시하기 위한 모듈을 의미하고, 파일 분석기는 파일 스캐너에서 감시한 정보를 이용하여 파일 포맷의 필드 위치 및 데이터 타입을 분석하는 모듈을 의미한다. 즉, 파일 스캐너는 대상 파일이 메모리에 로드될 때 함수를 추적할 수 있는 디버거로서의 기능을 수행하며, 파일 분석기는 추출한 데이터를 분석하여 알려지지 않은 파일 포맷의 데이터에서 필드 위치 및 데이터 타입을 추출하는 기능을 수행한다.The file scanner refers to a module for monitoring the operation of a program that loads an unknown file format, and the file analyzer refers to a module for analyzing field positions and data types of the file format using information monitored by the file scanner. In other words, the file scanner functions as a debugger that can track functions when the target file is loaded into memory, and the file analyzer analyzes the extracted data to extract field positions and data types from data in unknown file formats. Do this.

이와 같이, 본 발명은 파일 스캐너 및 파일 분석기로 이루어진 시스템을 통해 알려지지 않은 파일 포맷에 대해 필드 위치와 데이터 타입 분석을 수행한다.As such, the present invention performs field position and data type analysis on unknown file formats through a system consisting of a file scanner and a file analyzer.

상기와 같이 구성된 본 발명의 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템의 동작에 대해 개략적으로 설명한다.An operation of an unknown file format analysis system for performing software security testing of the present invention configured as described above will be described schematically.

도 1에 도시된 바와 같이, 알려지지 않은 파일 포맷으로 이루어진 파일(101)이 메모리에 로드될 때 대상 프로그램(103)은 다양한 함수를 호출하여 파일(102)의 데이터를 이용한다. 파일 스캐너는 파일을 로드하고 있는 프로그램을 디버깅한다. 파일 스캐너는 대상 파일이 로드되는 과정에서 호출되는 함수들의 파라미터를 감시 하여 관련 정보를 파싱 데이터(105) 형태로 파일 분석기(106)로 전달한다. 이에 파일 분석기는 파일 스캐너에서 수신한 정보를 이용하여 알려지지 않은 파일 포맷의 필드 위치와 데이터 타입에 대한 정보(107)를 출력한다.As shown in FIG. 1, when a file 101 of an unknown file format is loaded into a memory, the target program 103 calls various functions to use the data of the file 102. The file scanner debugs the program that is loading the file. The file scanner monitors the parameters of the functions called in the process of loading the target file and transmits the relevant information to the file analyzer 106 in the form of parsing data 105. Accordingly, the file analyzer outputs information 107 on the field position and data type of the unknown file format using the information received from the file scanner.

도 2는 함수 파라미터로 전달되는 데이터들을 3가지로 분류하기 위한 스택의 구조이다.2 is a structure of a stack for classifying three types of data delivered as function parameters.

도 2에 도시된 바와 같이, 파일의 데이터가 메모리에 로드된 후 파일 포맷에 따라 파싱(parsing)을 하기 위해 스택(stack)에서 파일 데이터가 사용된 경우를 나타내고 있다.As shown in FIG. 2, the file data is used in the stack for parsing according to the file format after the data of the file is loaded into the memory.

여기서, 추출할 데이터 타입은 다음과 같이 2가지로 구분한다.Here, data types to be extracted are classified into two types as follows.

- 수(number) 타입 : 2 바이트(byte) 또는 4 바이트로 사용되며 소프트웨어 내부에서는 명시적으로 수로 사용됨.Number type: 2 bytes or 4 bytes, used explicitly in software.

- 스트링(string) 타입 : 수 타입 이외의 모든 타입을 스트링 타입으로 간주하며, 문자열이 아닐 수 있으나 긴 데이터열 역시 스트링 타입으로 간주함.-String type: All types other than male type are considered to be string type. Although not string type, long data string is also considered to be string type.

이와 같이, 데이터 타입을 수와 스트링의 2가지로 나누었을 경우, 함수 파라미터의 값들은 다음의 3가지 경우로 정의할 수 있다.As such, when the data type is divided into two, a number and a string, the function parameter values can be defined in the following three cases.

- (CASE 1) 메모리에 있는 파일의 일부 데이터를 가리키는 주소(201) : 가리키는 데이터는 문자열이나 데이터 구조체가 될 수 있다. 이 값들은 파일 포맷을 알지 못하므로 무엇을 나타내는지 알 수 없다. 따라서 추후 어떻게 파싱이 되는지 지 속적으로 관찰을 해야 한다. 문자열인 경우에는 문자열 관련 함수에 해당 주소값이 그대로 사용되는 경우가 많다. 이 같은 경우에는 해당 스트링을 문자열로 간주한다. 데이터 구조체인 경우에는 이후의 함수 호출에서 스트링이 분해되어 여러 개의 수나 어떠한 데이터를 가리키는 주소로 나누어질 가능성이 있다. 따라서 문자열인지 데이터 구조체인 지 알 수 없으므로 해당 값을 지속적으로 감시하면서 무엇으로 사용되는지 분석한다.(CASE 1) Address 201 pointing to some data in a file in memory. The pointing data can be a string or a data structure. Since these values do not know the file format, they do not know what they represent. Therefore, it is necessary to continuously observe how it is parsed later. In the case of a string, the address value is often used as it is for string related functions. In such cases, the string is considered a string. In the case of data structures, strings may be decomposed in subsequent function calls and broken up into multiple numbers or addresses that point to some data. Therefore, since it is not known whether it is a string or a data structure, it constantly monitors the value and analyzes what is used.

- (CASE 2) 명시적으로 수로 사용(202) : 파일의 데이터 중 2 바이트 또는 4 바이트의 값이 바로 사용되는 경우이다. 이들 값은 파일 포맷 중 명시적으로 수로 사용되는 경우가 많으며, 이들 값들에 대해서는 파일 내에서의 위치와 사용된 바이트 수를 파악하며, 추후 결함 삽입을 수행할 때 수와 관련된 결함(fault) 연산을 수행한다. 해당 값이 파일 내의 위치를 나타내는 오프셋(offset)으로 사용될 수 있으나 이 값 역시 명시적으로 수로 사용된 경우이다.-(CASE 2) Explicitly used as a number (202): A case in which two or four bytes of data in a file are directly used. These values are often used explicitly as numbers in the file format, and these values determine the location within the file and the number of bytes used, and later perform fault-related fault operations when performing fault insertion. To perform. This value can be used as an offset indicating a location in the file, but this value is also explicitly used as a number.

- (CASE 3) 소프트웨어 자체 생성 데이터(203) : 해당 파라미터의 값들은 소프트웨어가 파일을 로드할 때 내부적인 필요에 의해 생성한 값이다. 이들 값들은 수로 사용되거나 어떠한 데이터를 가리키는 주소로 사용될 수 있으나 파일내 필드 위치를 파악할 때는 필요하지 않으므로 본 발명의 알려지지 않은 파일 포맷에 대한 필드 분석에서는 무시된다.(CASE 3) Software self-generated data 203: The values of the corresponding parameters are values generated by internal needs when the software loads the file. These values can be used as numbers or as addresses that point to some data, but are not necessary when determining field locations in a file and are therefore ignored in field analysis for unknown file formats of the present invention.

도 3은 함수 파라미터를 통해 파일의 데이터 필드를 추출하는 메커니즘을 나타낸 구성도이다.3 is a block diagram illustrating a mechanism for extracting a data field of a file through a function parameter.

도 3을 참조하면, 파일 분석기(106)에서 도 2의 3가지 케이스(CASE)를 기반으로 필드의 위치와 데이터 타입을 추출하는 과정을 나타내고 있다.Referring to FIG. 3, the file analyzer 106 illustrates a process of extracting the location and data type of a field based on the three cases of FIG. 2.

실행지시에 대응하여(S1) 정상 파일을 로드하는 경우 함수를 호출할 때 파라미터 검사를 수행한다(S2).When the normal file is loaded in response to the execution instruction (S1), the parameter check is performed when the function is called (S2).

파라미터 카운트(Parameter Count)는 해당 함수의 파라미터 수를 나타내며(S3), 파라미터 수만큼 CASE1, CASE2, CASE3의 경우를 분석한다.Parameter count represents the number of parameters of the function (S3), and analyzes the cases of CASE1, CASE2, and CASE3 by the number of parameters.

CASE3인 경우 파일 데이터에서 필드의 위치를 파악하는데 사용이 되지 않으므로 해당 값은 무시된다(S4).In case of CASE3, the value is ignored because it is not used to locate the field in the file data (S4).

CASE2의 경우에는 명시적으로 수로 사용되므로 해당 파라미터의 값이 포함된 파일의 위치와 필드의 길이가 2 바이트인지 4 바이트인지 저장을 한다. 해당 경우는 파일 데이터에서 필요한 필드의 위치를 파악했으므로 더 이상 추적하지 않는다(S5~S6).In case of CASE2, it is explicitly used as a number, so the location of the file containing the parameter value and the length of the field are stored as 2 or 4 bytes. In this case, since the location of the required field in the file data has been determined, the tracking is no longer performed (S5 to S6).

CASE1인 경우에는 가리키고 있는 데이터가 문자열인지 데이터 구조체인 지 알 수 없다. 다만 추후 함수가 호출되면서 이 스트링이 무엇으로 파싱될 지 알 수 있다. 따라서 당장은 데이터 타입은 알 수 없지만 추후의 감시를 위해 메모리에 저장된 데이터 영역의 위치와 범위, 그리고 이 영역을 가리키는 포인터를 저장한다. 이들 값들은 추후의 함수 호출과정에서 데이터 타입을 추출하는데 사용된다(S7~S8).In case of CASE1, it is impossible to know whether the data pointed to is a string or a data structure. However, we can see what this string is going to parse as the function is called later. Therefore, for now, the data type is unknown, but for later monitoring, it stores the location and range of the data area stored in memory and a pointer to this area. These values are used to extract the data type in the subsequent function call (S7 ~ S8).

이 과정은 파라미터의 수에 대응하여 반복적(S3~S8)으로 수행하게 된다(S9).This process is performed repeatedly (S3 to S8) corresponding to the number of parameters (S9).

이상에서 몇 가지 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것이 아니고 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다.Although the present invention has been described in more detail with reference to some embodiments, the present invention is not necessarily limited to these embodiments, and various modifications can be made without departing from the spirit of the present invention.

상술한 바와 같이, 본 발명에 의한 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템 및 방법은, 가능한 정해진 파일 포맷의 규격을 맞추어 소프트웨어 테스팅에서 포맷 불일치로 인해 수행되는 에러 처리의 과정을 줄임으로써 제한된 수로 생성된 결함 유발 파일을 이용해 가능한 많은 소프트웨어의 결함을 효율적으로 유도할 수 있다. 이와 같이, 본 발명은 알려지지 않은 파일 포맷에 대해 해당 파일 포맷에 대한 필드 위치와 데이터 타입의 정보를 추출함으로써 결함 삽입 기법을 이용할 때 코드 커버리지를 높이는 이점이 있다.As described above, an unknown file format analysis system and method for performing software security testing according to the present invention can be achieved by reducing the process of error processing performed due to format mismatch in software testing by matching the specification of a given file format if possible. A limited number of fault-generating files can be used to efficiently derive as many software defects as possible. As such, the present invention has an advantage of increasing code coverage when using a defect insertion technique by extracting field position and data type information for a file format for an unknown file format.

Claims (14)

메모리로 알려지지 않은 파일을 로드하는 프로그램을 감시하여 상기 로드된 파일의 함수 파라미터를 파싱하는 파일 스캐너; 및A file scanner that monitors a program that loads a file that is unknown to memory and parses function parameters of the loaded file; And 상기 파일 스캐너로부터 파싱된 정보를 전달받아 상기 알려지지 않은 파일 포맷의 필드 위치와 데이터 타입을 추출하는 파일 분석기File analyzer which receives the parsed information from the file scanner and extracts the field position and data type of the unknown file format 를 포함하는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템.Unknown file format analysis system for performing software security testing, characterized in that it comprises a. 제 1 항에 있어서, 상기 파일 스캐너는 알려지지 않은 파일이 메모리에 로드될 때 함수를 추적하는 디버거인 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템.2. The unknown file format analysis system of claim 1, wherein the file scanner is a debugger that tracks a function when an unknown file is loaded into memory. 제 1 항에 있어서, 상기 파일 분석기는 상기 함수 파라미터와 로드된 파일을 비교하여 파일 포맷의 필드 위치와 데이터 타입을 추출하는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 시스템.2. The unknown file format analysis system of claim 1, wherein the file analyzer compares the function parameter and the loaded file to extract field positions and data types of a file format. (a) 파일 스캐너에서 메모리로 알려지지 않은 파일을 로드하는 해당 프로그램의 동작을 감시하는 단계;(a) monitoring the operation of a corresponding program loading a file unknown to memory in a file scanner; (b) 상기 로드된 파일의 함수 파라미터를 파싱하는 단계;(b) parsing function parameters of the loaded file; (c) 상기 파싱된 정보를 파일 분석부에서 수신하여 알려지지 않은 파일 포맷의 필드 위치와 데이터 타입을 추출하는 단계; 및(c) receiving the parsed information from a file analyzer to extract field positions and data types of unknown file formats; And (d) 상기 추출된 필드 위치와 데이터 타입을 고려하여 결함 연산을 위한 값으로 변경하는 단계(d) changing to a value for a defect operation in consideration of the extracted field position and data type 를 포함하는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.Unknown file format analysis method for performing software security testing comprising a. 제 4 항에 있어서, 상기 (b) 단계는, 스택에서의 파일 데이터 사용에 대응하여 수(number) 타입과 스트링(string) 타입으로 구분 추출하여 파일 포맷에 따라 파싱이 이루어지는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.The software security method of claim 4, wherein the step (b) is performed by dividing and extracting the file into a number type and a string type corresponding to the use of the file data in the stack. Unknown file format analysis method for performing testing. 제 5 항에 있어서, 상기 수(number) 타입과 스트링(string) 타입에 대응한 함수 파라미터의 값은, 메모리에 있는 파일의 일부 데이터를 가리키는 주소, 수(number) 및 소프트웨어 자체 생성 데이터 중에서 어느 하나로 정의되는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.The method of claim 5, wherein the value of the function parameter corresponding to the number type and the string type is any one of an address, a number, and software-generated data indicating some data of a file in a memory. Unknown file format analysis method for performing software security testing, characterized in that it is defined. 제 6 항에 있어서, 상기 함수 파라미터의 값이 메모리에 있는 파일의 일부 데이터를 가리키는 주소인 경우에, 문자열 관련 함수에 해당 주소값이 그대로 사용 되는 문자열, 또는 이후의 함수 호출에서 스트링이 분해되어 여러 개의 수나 임의의 데이터를 가리키는 주소로 사용되는 데이터 구조체 중에서 어느 하나로 사용되는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.The method of claim 6, wherein when the value of the function parameter is an address indicating some data of a file in memory, the string is decomposed into a string in which the address value is used as it is in a string related function, or in a subsequent function call. An unknown file format analysis method for performing software security testing, characterized in that it is used as either a number of pieces or a data structure used as an address that points to arbitrary data. 제 6 항에 있어서, 상기 함수 파라미터의 값이 수(number)인 경우에, 상기 수(number)의 파일내에서의 위치와 바이트 수를 파악하며, 이후 결함 삽입을 수행할 때 수(number)와 관련된 결함(fault) 연산을 수행하는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.7. The method according to claim 6, wherein when the value of the function parameter is a number, the position and the number of bytes in the number file are determined, and then the number and the number of times when the defect insertion is performed. Unknown file format analysis method for performing software security testing, characterized in that it performs an associated fault operation. 제 6 항에 있어서, 상기 함수 파라미터의 값이 소프트웨어 자체 생성 데이터인 경우에, 임의의 데이터를 가리키는 주소로 사용되는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.7. The method of claim 6, wherein if the value of the function parameter is software-generated data, it is used as an address that points to arbitrary data. 제 5 항 내지 제 9 항 중의 어느 한 항에 있어서, 상기 (c) 단계는,The method according to any one of claims 5 to 9, wherein step (c) comprises: 함수를 호출할 때 파라미터 검사를 수행하는 단계;Performing a parameter check when invoking the function; 해당 함수의 파라미터 수에 대응하여 케이스별로 분석을 수행하는 단계; 및Performing analysis for each case corresponding to the number of parameters of the function; And 상기 케이스별 분석 결과를 저장하는 단계Storing the analysis result for each case 를 포함하여 이루어진 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.Unknown file format analysis method for performing software security testing, characterized in that consisting of. 제 10 항에 있어서, 상기 케이스가 메모리에 있는 파일의 일부 데이터를 가리키는 주소인 경우에, 이후의 감시를 위해 메모리에 저장된 데이터 영역의 위치와 범위, 그리고 데이터 영역을 가리키는 포인터를 저장하는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.11. The method of claim 10, wherein when the case is an address indicating some data of a file in the memory, the location and range of the data area stored in the memory and a pointer to the data area are stored for later monitoring. Unknown file format analysis method for performing software security testing. 제 11 항에 있어서, 상기 메모리에 저장된 데이터 영역의 위치와 범위, 그리고 데이터 영역을 가리키는 포인터는 이후의 함수 호출 과정에서 데이터 타입을 추출하는데 사용되는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.12. The method of claim 11, wherein the location and range of the data area stored in the memory and a pointer to the data area are used to extract a data type in a subsequent function call. How to analyze file formats. 제 10 항에 있어서, 상기 케이스가 수(number)로 사용되는 경우에, 해당 파라미터의 값이 포함된 파일의 필드 위치와 데이터 타입을 저장하는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.12. The unknown file for performing software security testing according to claim 10, wherein when the case is used as a number, the field location and data type of the file including the value of the parameter are stored. Format analysis method. 제 10 항에 있어서, 상기 케이스가 프로그램 자체 생성 데이터인 경우에, 상기 프로그램 자체 생성 데이터 값은 무시되는 것을 특징으로 하는 소프트웨어 보안 테스팅을 수행하기 위한 알려지지 않은 파일 포맷 분석 방법.11. The method of claim 10, wherein if the case is program generated data, the program generated data value is ignored.
KR1020070045914A 2006-11-13 2007-05-11 File format analysis system and method for unknown file format to use software security testing KR100924519B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US11/850,921 US20080115016A1 (en) 2006-11-13 2007-09-06 System and method for analyzing unknown file format to perform software security test

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20060111857 2006-11-13
KR1020060111857 2006-11-13

Publications (2)

Publication Number Publication Date
KR20080043204A true KR20080043204A (en) 2008-05-16
KR100924519B1 KR100924519B1 (en) 2009-11-02

Family

ID=39661707

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070045914A KR100924519B1 (en) 2006-11-13 2007-05-11 File format analysis system and method for unknown file format to use software security testing

Country Status (1)

Country Link
KR (1) KR100924519B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190062134A (en) * 2017-11-28 2019-06-05 주식회사 엠시큐어 Method and server for analyzing weak point through library injection
CN111901310A (en) * 2020-07-06 2020-11-06 北京达佳互联信息技术有限公司 Website security testing method and device, electronic equipment and storage medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052590B (en) * 2017-12-11 2019-09-17 四川新网银行股份有限公司 A kind of the dynamic application method and system of structural data

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5421001A (en) * 1992-05-01 1995-05-30 Wang Laboratories, Inc. Computer method and apparatus for a table driven file interface
US7191362B2 (en) 2002-09-10 2007-03-13 Sun Microsystems, Inc. Parsing test results having diverse formats
KR101268220B1 (en) * 2006-08-25 2013-05-27 엘지전자 주식회사 Apparatus for automatic test adaptable to various test environments and Method thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190062134A (en) * 2017-11-28 2019-06-05 주식회사 엠시큐어 Method and server for analyzing weak point through library injection
CN111901310A (en) * 2020-07-06 2020-11-06 北京达佳互联信息技术有限公司 Website security testing method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
KR100924519B1 (en) 2009-11-02

Similar Documents

Publication Publication Date Title
US11888885B1 (en) Automated security analysis of software libraries
CN109101815B (en) Malicious software detection method and related equipment
US20090158260A1 (en) Apparatus and method for automatically analyzing program for detecting malicious codes triggered under specific event/context
US11048798B2 (en) Method for detecting libraries in program binaries
CN103699480A (en) WEB dynamic security flaw detection method based on JAVA
CN111753306B (en) Intelligent contract vulnerability detection method and device, electronic equipment and storage medium
US20200143061A1 (en) Method and apparatus for tracking location of input data that causes binary vulnerability
CN113497809A (en) MIPS framework vulnerability mining method based on control flow and data flow analysis
KR20080042659A (en) Automatic software testing system and method using faulted file
CN111124870A (en) Interface testing method and device
CN110851352A (en) Fuzzy test system and terminal equipment
CN111884876A (en) Method, device, equipment and medium for detecting protocol type of network protocol
JP4587976B2 (en) Application vulnerability inspection method and apparatus
CN112925524A (en) Method and device for detecting unsafe direct memory access in driver
US20070245313A1 (en) Failure tagging
KR100924519B1 (en) File format analysis system and method for unknown file format to use software security testing
US20080115016A1 (en) System and method for analyzing unknown file format to perform software security test
EP2972880B1 (en) Kernel functionality checker
KR20130022280A (en) Low cost apparatus and method for error-based program testing
CN105117332B (en) A kind of detection method of stack overflow position
CN110244954B (en) Compiling method and equipment for application program
CN113032254B (en) Test coverage condition evaluation method and device
CN114741700A (en) Public component library vulnerability availability analysis method and device based on symbolic taint analysis
CN114020645A (en) Test method, device, equipment, readable storage medium and computer program product
Durães et al. A methodology for the automated identification of buffer overflow vulnerabilities in executable software without source-code

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121011

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130930

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140916

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160819

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20171012

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee