WO2017052318A1

WO2017052318A1 - 소프트웨어 분석 방법 및 장치

Info

Publication number: WO2017052318A1
Application number: PCT/KR2016/010738
Authority: WO
Inventors: 박지환; 김은정; 천선일; 최도연
Original assignee: (주)씽크포비엘
Priority date: 2015-09-25
Filing date: 2016-09-26
Publication date: 2017-03-30

Abstract

소프트웨어 분석 방법 및 장치가 개시된다. 본 방법은, 소프트웨어의 소스 코드를 획득하는 단계를 포함할 수 있다. 여기서, 소스 코드는 하나의 메인 함수와 메인 함수가 호출하는 복수의 서브 함수를 포함하며, 복수의 서브 함수의 각각은 기본 라이브러리 또는 사용자 라이브러리로 분류되고, 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보를 포함할 수 있다. 본 방법은, 소스 코드를 연산하여 복수의 서브 함수로 구성되는 함수구문 트리를 생성하는 단계, 함수구문 트리를 구성하는 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하는 단계, 함수구문 트리를 구성하는 복수의 서브 함수 각각의 기능을 추론하는 단계, 및 복수의 서브 함수 중 상기 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하는 단계를 더 포함할 수 있다.

Description

소프트웨어 분석 방법 및 장치

본 발명은 소프트웨어 분석 방법 및 장치에 관한 것이다.

소프트웨어는 현장 모니터링, 위험 감지 및 분석, 위험 경보 및 전파, 현장 대응, 안전 교육 등에 활용됨으로써 재난을 예방하고, 재난으로 발생한 피해를 최소화하며, 재난으로부터의 신속한 복구를 위해 광범위하게 사용되고 있다.

한편, 소프트웨어 자체가 재난 안전사고의 원인이 될 수도 있다. 에너지 관리시스템의 소프트웨어 오류로 인해 세계 최고 수준의 전력망과 기술을 가진 미국에서 역사상 최대 규모의 정전 사고가 발생한 바 있고, 자동차 전자제어장치(Electronic control unit)에 내장된 소프트웨어 결함에 의해 급발진 사고가 발생한 적도 있다. 이렇듯 자동차, 철도, 항공, 전력, 국방, 의료, 금융, 통신 등의 부분에서 소프트웨어의 의존도가 높아짐에 따라 소프트웨어 오류로 인한 인명, 재난의 피해 범위와 규모가 확대되고 있어, 소프트웨어의 안전(Software safety)을 체계적으로 관리해야 하는 필요성이 대두되고 있다.

소프트웨어의 안전 확보 및 검증 체계는 도메인 전문가의 경험이 중요시 되는 분야로 소프트웨어 산업 확산 속도에 부흥하는 안전공학 전문가 확보가 쉽지 않은 상황이다. 따라서, 안전분석 지식 습득 및 도메인 경험 축적을 위해 적은 훈련 비용으로 소프트웨어 안전 진단을 수행할 수 있는 보조 기술이 필요하다. 더하여, 도메인 전문가들이 소프트웨어 안전 진단을 수행하는 경우 위험분석에서 가장 중요한 위험요소 도출 누락과 같은 휴먼 에러(human error)가 발생할 수 있는 문제점이 존재한다.

더욱이, 소프트웨어 안전진단을 위해서는 소프트웨어 요구사항문서를 분석하는 작업이 선행되어야 하기 때문에 소프트웨어 요구사항문서가 분실되었거나, 소프트웨어 개발 후 소스 코드를 여러 번의 수정하거나 기능을 추가한 경우에는 위험에 대해 분석할 수 있는 정보가 없거나 매우 부족하기 때문에 요구사항문서를 기초로 하는 소프트웨어 안전진단을 할 수 없는 상황이 발생하게 된다.

본 발명의 과제는 도메인 소프트웨어 안전진단 전문가들의 직접적인 도움 없이 소프트웨어 위험성을 확인할 수 있도록 소프트웨어 안전진단을 간편하게 제공해주는 소프트웨어 분석 방법 및 장치를 제공하는 것이다.

본 발명의 과제는 소프트웨어 위험성을 확인할 수 있는 효율적인 소프트웨어 안전진단을 제공해주는 소프트웨어 위험분석 방법 및 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 과제들은 이상에서 언급한 과제들에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

본 발명의 실시예의 일 특징에 따르면, 소프트웨어 분석 방법이 제공된다. 본 방법은, 소프트웨어의 소스 코드를 획득하는 단계를 포함할 수 있다. 여기서, 상기 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함하며, 상기 복수의 서브 함수의 각각은 기본 라이브러리 또는 사용자 라이브러리로 분류되고, 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보를 포함한다. 본 방법은, 상기 소스 코드를 연산하여 상기 복수의 서브 함수로 구성되는 함수구문 트리를 생성하는 단계, 상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하는 단계, 상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각의 기능을 추론하는 단계, 및 상기 복수의 서브 함수 중 상기 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하는 단계를 더 포함할 수 있다.

본 발명의 실시예의 일 특징에 따르면, 소프트웨어 위험분석 방법이 제공된다. 본 방법은, 복수의 레코드(records)를 포함하는 위험분석 타입 분류 테이블을 구축하는 단계, 및 소프트웨어의 도메인 정보를 획득하는 단계를 포함할 수 있다. 여기서, 상기 위험분석 타입 분류 테이블의 복수의 레코드의 각각은 ID, 도메인 ID, 위험분석 타입(Hazard Analysis Type), 관련 시스템 및 문서를 포함하고, 상기 소프트웨어는 소스 코드로 구성되며, 상기 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함한다. 본 방법은, 상기 소프트웨어의 기능목록함수 구조화 트리를 획득하는 단계, 상기 기능목록함수 구조화 트리의 상기 복수의 기능 항목의 각각에 대해서 상기 위험분석 타입 분류 테이블을 이용하여 위험분석 타입을 분류하는 단계, 및 상기 소프트웨어의 도메인 정보 및 상기 분류된 위험분석 타입을 기초로 위험요소들의 인과관계를 시각화하는 단계를 더 포함할 수 있다. 여기서, 상기 기능목록함수 구조화 트리는 복수의 기능 항목으로 구성되고, 상기 복수의 기능 항목의 각각은 상기 복수의 서브 함수 중 적어도 하나의 서브 함수를 포함한다.

본 발명의 실시예들에 따른 소프트웨어 분석 방법 및 장치에 따르면, 도메인 소프트웨어 안전진단 전문가들의 직접적인 도움 없이 소프트웨어 위험성을 확인할 수 있도록 하여 소프트웨어 안전진단을 간편하게 제공해 주는 효과가 제공된다.

본 발명의 실시예들에 따른 소프트웨어 위험분석 방법 및 장치에 따르면, 소프트웨어 안전진단을 효율적으로 제공해주는 효과가 제공된다.

본 발명의 실시예들에 따른 소프트웨어 위험분석 방법 및 장치에 따르면, 가장 중요한 위험요소 도출 누락과 같은 휴먼 에러(human error) 없이 소프트웨어 안전진단을 제공해주는 효과가 제공된다.

도 1은 본 발명의 일 실시예에 따른 소프트웨어 분석을 제공하기 위한 예시적인 프로세스의 흐름도이다.

도 2는 본 발명의 일 실시예에 따라 소스 코드를 어휘 분석하여 토큰 열로 분석하고, 파서(Parser)를 이용하여 구문 분석하는 과정을 나타내는 도면이다.

도 3은 본 발명의 일 실시예에 따라 추상구문 트리를 연산하여 생성한 함수구문 트리를 도시하는 도면이다.

도 4a 내지 도 4d는 도 3의 함수구문 트리를 구성하는 일부 서브 함수의 상호호출 관계를 나타내는 도면이다.

도 5는 본 발명의 일실시예에 따라 도 4a 내지 도 4d의 서브 함수를 추상 레벨과 구체 레벨로 분류한 표이다.

도 6은 도 3의 함수구문 트리의 일부를 추상 레벨에 따른 함수 구조화 트리로 재작성하는 과정을 나타내는 도면이다.

도 7은 본 발명의 일 실시예에 따른 도메인(전문) 영역의 주제, 일반 기능 목록의 주제가 미리 정의된 DB 정보를 도시하는 도면이다.

도 8은 본 발명의 일 실시예에 따른 추론된 기능이 동일한 서브 함수들을 그룹핑하는 과정을 나타내는 도면이다.

도 9는 본 발명의 일 실시예에 따른 기능목록 함수 구조화 트리를 도시하는 도면이다.

도 10은 소프트웨어를 분석하기 위한 예시적인 장치를 도시한 도면이다.

도 11은 소프트웨어의 위험을 분석하기 위한 예시적인 소프트웨어 위험분석 장치를 도시한 도면이다.

도 12는 본 발명의 일 실시예에 따른 도메인 테이블을 도시하는 도면이다.

도 13은 본 발명의 일 실시예에 따른 위험분석 타입 분류 테이블을 도시하는 도면이다.

도 14는 본 발명의 일 실시예에 따른 위험분석 타입 별 위험요소 체크리스트 테이블을 도시한 도면이다.

도 15는 본 발명의 일 실시예에 따른 위험요소의 인과관계 테이블을 도시한 도면이다.

도 16은 본 발명의 일 실시예에 따른 테이블들 간의 논리적 연관관계를 도시한 도면이다.

도 17은 본 발명의 일 실시예에 따라 소프트웨어의 위험분석을 제공하기 위한 예시적인 프로세스의 흐름도이다.

도 18은 본 발명의 일 실시예에 따른 기능목록 함수 구조화 트리를 도시하는 도면이다.

도 19는 본 발명의 일 실시예에 따라 위험요소들을 인과관계에 따라 시각화시킨 도면이다.

본 발명의 이점들과 특징들 그리고 이들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해 질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 본 실시예들은 단지 본 발명의 개시가 완전하도록 하며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려 주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

본 명세서에 기재된 실시예에 있어서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하는 기능적 부분을 의미하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 보다 상세히 설명한다. 다만, 이하의 설명에서는 본 발명의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.

도 1은 본 발명의 일 실시예에 따른 소프트웨어 분석을 제공하기 위한 예시적인 프로세스의 흐름도이다. 도 1에 도시된 바와 같이, 예시적인 실시예에서, 소프트웨어 분석은 소스 코드를 획득하는 단계(S110)로부터 시작된다. 분석하고자 하는 소스 코드를 획득한 후, 스캐너(Scanner)를 이용하여 소스 코드를 대상으로 하여 어휘 분석을 실시하여 소스 코드를 토큰(Token) 열로 모두 분리하고, 어휘 분석을 통해 만들어진 토큰 열에 대해서 파서(Parser)를 이용하여 구문 문석을 수행하여 추상구문 트리(Abstract syntax tree)를 생성한다(S120). 일 실시예에서, 소스 코드는 하나의 메인 함수와 메인 함수가 호출하는 복수의 서브 함수를 포함하며, 복수의 서브 함수의 각각은 기본 라이브러리 또는 사용자 라이브러리로 분류되고, 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보를 포함할 수 있다.

단계(S130)에서는 구문분석 결과로 생성된 추상구문 트리를 의미 분석기(Semantic Analyzer)를 이용하여 함수의 의미에 따라 필요한 정보를 유추 또는 분석하여 함수구문 트리로 변환할 수 있다. 단계(S140)에서는 함수구문 트리를 구성하는 복수의 서브 함수 간의 상호호출 관계를 기초로 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류할 수 있다. 단계(S150)에서는 함수구문 트리를 추상 수준에 따른 함수 구조화 트리를 재작성할 수 있다. 단계(S160)에서는 재작성된 함수 구조화 트리를 구성하는 복수의 서브 함수 각각의 기능을 추론할 수 있다. 단계(S170)에서는 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록 함수 구조화 트리를 생성할 수 있다.

도 2는 본 발명의 일 실시예에 따라 소스 코드를 어휘 분석하여 토큰 열로 분석하고, 파서(Parser)를 이용하여 구문 분석하는 과정을 나타내는 도면이다. 이하, 도 2를 참고로 도 1의 단계(S120)를 보다 구체적으로 설명한다. 도 2에 도시된 바와 같이, 예시적인 실시예에서 획득한 소스 코드는 아래와 같다.

소스 코드:

if x = 10 then x+5

else 30

일 실시예에 있어서, 소스 코드가 작성된 프로그래밍 언어에서 사전에 정의되어 있는 스캐너 및 파서를 이용하여 소스 코드를 어휘 분석하면, 'if', 'then' 및 'else'는 예약어로 분석되고, 'x'는 식별자로 분석되며, 수학 기호인 '=' 및 '+'는 수학 기호로서 분석되고, '10', '5' 및 '30'은 정수로 분석됨을 알 수 있다. 일 실시예에서, 스캐너는 렉서 제너레이터(Lexer generator)를 이용할 수 있다. 분석된 토큰 열 각각에 대해 파서를 이용하여 구문 분석을 하면 추상구문 트리(abstract syntax tree)를 생성할 수 있다. 일 실시예에서, 파서는 파서 제너레이터(Parser generator)를 이용할 수 있다.

도 3은 본 발명의 일 실시예에 따라 추상구문 트리를 연산하여 생성한 함수구문 트리를 도시하는 도면이다. 이하, 도 3을 참고로 도 1의 단계(S130)를 보다 구체적으로 설명한다.

추상구문 트리에 대해서 구문 분석기(semantic analyzer)를 이용하여 필요한 정보를 유추 및 분석함으로써 추상구문 트리를 추상화하여 함수구문 트리를 생성할 수 있다. 일 실시예에 있어서, 함수구문 트리는 복수의 서브 함수의 상호호출 관계를 도시할 수 있다. 도 3의 예시적인 함수구문 트리는 함수 명('sysdev_class_remvoe_file')을 가지는 함수를 루트 노드로 하여 복수의 서브 함수들의 상호호출 관계에 따라 복수의 서브 함수들을 부모 노드 또는 자식 노드로 연결한 트리이다.

도 4a 내지 도 4d는 도 3의 함수구문 트리를 구성하는 복수의 서브 함수 중 일부 서브 함수들의 상호호출 관계를 나타내는 도면이다.

일 실시예에서, 함수구문 트리를 구성하는 복수의 서브 함수 각각에 대해 상호호출 관계를 확인할 수 있다. 예컨대, 도 4a에서 함수 명('sysfs_drop_dentry')을 가지는 서브 함수는 함수 명('sysfs_addrm_finish')을 가지는 서브 함수에 의해 호출된다. 도 4a에서 함수 명('sysfs_drop_dentry')을 가지는 서브 함수는 9개의 서브 함수를 호출하는데, 각 서브 함수 명은 'sysfs_type', 'mutex_unlock', '_d_drop', 'd_put', 'd_unhashed', 'dget_locked', 'mutex_lock', 'iput', 및 'ilookup' 이다.

도 4b에서 함수 명('sysfs_addrm_finish')을 가지는 서브 함수는 함수 명('sysfs_hash_and_remove')을 가지는 서브 함수에 의해 호출된다. 도 4b에서 함수 명('sysfs_addrm_finish')을 가지는 서브 함수는 6개의 서브 함수를 호출하는데, 각 서브 함수 명은 'sysfs_deactivate', 'sysfs_put', 'unmap_bin_file', mutex_unlock', 'sysfs_drop_dentry' 및 'iput'이다.

도 4c에서 함수 명('list_empty')을 가지는 서브 함수는 6개의 서브 함수에 의해 호출되는데, 호출하는 서브 함수의 함수 명은 'unmap_mapping_range', 'dput', '_mutex_unlock_common_slowpath', 'dentry_lru_del', '_mutex_lock_common' 및 '_mutex_trylock_slowpath'이다.

도 4d에서 함수 명('mutex_unlock')을 가지는 서브 함수는 4개의 서브 함수에 의해 호출되는데, 호출하는 서브 함수의 함수명은 'sysfs_addrm_finish', 'sysfs_drop_dentry', 'unmap_bin_file' 및 'sysfs_addrm_start'이다. 한편, 함수 명('mutex_unlock')을 가지는 서브 함수는 2개의 서브 함수를 호출하는데, 각 서브 함수 명은 '_mutex_unlock_slowpath' 및 'mutex_clear_owner'이다.

도 5는 본 발명의 일 실시예에 따라 도 4a 내지 도 4d의 서브 함수를 추상 레벨과 구체 레벨로 분류한 표이다. 도 5를 참고하여 도 1의 단계(S140)를 보다 상세하게 설명한다.

도 1의 단계(S140)에서 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류한다. 일 실시예에서, 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하는 것은 복수의 서브 함수 각각에 대해서 상호호출 관계를 기초로 분류할 수 있다. 일 실시예에서, 해당 서브 함수의 상호호출 관계를 기초로 해당 서브 함수가 다른 서브 함수를 참조하는 개수인 원심성 값 및 다른 함수가 해당 서브 함수를 참조하는 개수인 구심성 값을 구할 수 있으며, 이를 기초로 해당 서브 함수의 불안정성 값을 산출할 수 있다. 일 실시예에서, 불안정성은 아래 수식 1에 의해 구할 수 있다.

수식1:

도 4a 내지 4d에 도시된 서브 함수 각각의 원심성 값, 구심성 값 및 불안정성 값을 아래와 같이 구할 수 있다.

도 4a에서 함수 명('sysfs_drop_dentry')을 가지는 서브 함수는 9개의 서브 함수를 호출하고, 1개의 서브 함수에 의해 호출되므로 원심성은 9이고, 구심성은 1이다. 따라서, 불안정성은 0.9이다.

도 4b에서 함수 명('sysfs_addrm_finish')을 가지는 서브 함수는 6개의 서브 함수를 호출하고, 1개의 서브 함수에 의해 호출되므로 원심성은 6이고, 구심성은 1이다. 따라서, 불안정성은 0.86이다.

도 4c에서 함수 명('list_empty')을 가지는 서브 함수는 0개의 서브 함수를 호출하고, 6개의 서브 함수에 의해 호출되므로 원심성은 0이고, 구심성은 6이다. 따라서, 불안정성은 0이다.

도 4d에서 함수 명('mutex_unlock')을 가지는 서브 함수는 2개의 서브 함수를 호출하고, 4개의 서브 함수에 의해 호출되므로 원심성은 2이고, 구심성은 4이다. 따라서, 불안정성은 0.33이다.

일 실시예에 있어서, 불안정성 값이 제1 기준 값 이상이면 해당 서브 함수를 추상 레벨로 분류하고, 불안정성 값이 제1 기준 값 미만이면 해당 서브 함수를 구체 레벨로 분류할 수 있다. 제1 기준 값은 복수의 서브 함수의 불안정성의 분포를 기초로 결정되거나, 사전 정의된 값일 수 있다.

도 5에 도시된 바와 같이, 일 실시예에 있어서, 불안정성에 대한 제1 기준 값이 0.8이라면, sysfs_drop_dentry의 불안정성 값 및 sysfs_addrm_finish의 불안정성 값은 제1 기준 값인 0.8보다 크므로 sysfs_drop_dentry 및 sysfs_addrm_finish은 추상 레벨로 분류되며, list_empty의 불안정성 값 및 mutex_unlock의 불안정성 값은 제1 기준 값인 0.8보다 작으므로 list_empty 및 mutex_unlock은 구체 레벨로 분류될 수 있다.

도 6은 도 3의 함수구문 트리의 일부를 추상 레벨에 따른 함수 구조화 트리로 재작성하는 과정을 나타내는 도면이다. 도 6을 참고하여, 단계(S150)를 보다 상세하게 설명한다.

일 실시예에서, 복수의 서브 함수 중 추상 레벨로 분류된 서브 함수들을 부모 노드들로 정의하고, 부모 노드들에 해당하는 서브 함수들 각각이 호출하는 적어도 하나의 다른 서브 함수를 해당 부모 노드의 자식 노드로 정의하여 추상 레벨에 따른 함수 구조화 트리를 생성할 수 있다.

일 실시예에서, 추상 레벨로 분류된 'sysfs_drop_dentry' 및 'sysfs_addrm_finish'는 부모 노드가 되고, 부모 노드로부터 시작하여 호출 관계를 참조하여 트리를 재작성할 수 있다. 예컨대, 함수 명('sysfs_drop_dentry')을 가지는 서브 함수는 9개의 서브 함수를 호출하는데, 호출되는 각 서브 함수 명은 'sysfs_type', 'mutex_unlock', '_d_drop', 'd_put', 'd_unhashed', 'dget_locked', 'mutex_lock', 'iput', 및 'ilookup' 이므로, 각 서브 함수가 자식 노드가 될 수 있다. 호출된 서브 함수 각각은 다시 다른 서브 함수를 호출하여 이를 자식 노드를 가질 수 있다. 예컨대, 'iput' 서브 함수는 다시 'list_empty'를 호출하여 자식노드로 가지게 된다.

도 7은 본 발명의 일 실시예에 따른 도메인(전문) 영역의 주제, 일반 기능 목록의 주제가 미리 정의된 DB 정보를 도시하는 도면이다. 도 7을 참고하여 도 1의 단계(S160)를 보다 상세하게 설명한다.

도 1의 단계(S160)에서 복수의 서브 함수 각각의 기능을 추론할 수 있다. 일 실시예에서, 복수의 서브 함수 각각의 기능을 추론하는 것은 함수구문 트리를 구성하는 복수의 서브 함수를 기본 라이브러리에 속하는 제1 서브 함수 그룹과 사용자 라이브러리에 속하는 제2 서브 함수 그룹으로 분류하고, 소스 코드가 작성된 프로그래밍 언어에서 사전에 정의된 기능 목록을 기초로 제1 서브 함수그룹의 서브 함수들의 각각의 기능을 추론하고, 제2 서브 함수 그룹의 서브 함수들 각각의 함수 정보를 기초로 제2 서브 함수 그룹의 서브 함수들 각각의 기능을 추론할 수 있다.

일 실시예에서, 제2 그룹의 서브 함수들 각각의 함수 정보에 대해 텍스트 마이닝 기법을 이용하여 주제 DB에서 가장 유사한 기능을 도출하고, 가장 유사한 기능을 해당 제2 그룹 서브 함수의 기능으로 매핑하므로써 제2 서브 함수그룹 의미 추론할 수 있다. 이때 함수 정보는 주석, 함수 명, 입력 파리미터 명, 내부 구현 텍스트 등 서브 함수 내의 모든 텍스트 정보를 포함할 수 있다. 즉, 각 서브 함수의 함수 정보와 DB 정보에 대해 상호 텍스트 유사도를 비교함으로써 가장 높은 유사도를 가지는 주제를 도출하여 해당 서브 함수에 매핑할 수 있다. 예컨데, 함수 정보와 DB 정보의 문자열('Stream', 'Exit', 'Save', 'Delete', 'Directory', 'Path', 'Close', 'Print', 'Print as', 'Recent') 의 유사도를 비교하여 높은 유사도를 가지는 경우 해당 서브 함수의 기능은 "파일"로 추론될 수 있다.

일 실시예에서, 텍스트 마이닝 기법은 "문서 분류(Text Classfication)와 문서 클러스터링(Text Clustering)", "토픽 트랙킹(Topic Tracking)", "웹 마이닝(Web Mining)", "질의응답 시스템(Question Answering)", "Concept linkage", "문서 요약(Summarization)", "Duo-Mining" 및 "정보 추출(Information Extraction)" 기법 중 적어도 하나를 사용할 수 있다.

도 8은 본 발명의 일 실시예에 따른 추론된 기능이 동일한 서브 함수들을 그룹핑하는 과정을 나타내는 도면이다. 도 8을 참고하여 도 1의 단계(S170)를 보다 상세하게 설명한다.

추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성할 수 있다. 일 실시예에서, 복수의 서브 함수 중 추상 레벨로 분류된 서브 함수들을 부모 노드들로 정의하고, 부모 노드들에 해당하는 서브 함수들 각각이 호출하는 적어도 하나의 다른 서브 함수를 해당 부모 노드의 자식 노드로 정의하는 추상 수준에 따른 함수 구조화 트리 재작성할 수 있다. 일 실시예에서 재작성된 함수구문 트리에 포함된 복수의 노드들 각각에 대해서, 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수의 기능이 동일한 경우, 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수를 그룹핑할 수 있다. 이때, 형제 노드는 해당 노드와 부모 노드가 동일한 노드를 의미한다.

즉, 서로 다른 서브 함수의 유추된 기능이 동일한 경우, 2개의 함수를 1개로 그룹핑하고, 하위 서브 함수들도 그룹핑할 수 있다. 예컨대, 함수 명이 'sysfs_drop_dentry'인 서브 함수의 유추된 기능이 "삭제"이고, 함수 명이 'sysfs_addrm_finish'인 서브 함수의 유추된 기능이 "삭제"인 경우, 두 개의 서브 함수를 동일한 기능을 기준으로 그룹핑하고(즉, "삭제('sysfs_drop_dentry', 'sysfs_addrm_finish')"), 해당 서브 함수가 호출하는 함수들도 하위 그룹으로 그룹핑할 수 있다.

일 실시예에서, 최상위 부모 노드들은 주제("File", "Edit", "Options", "Analyze", "Allocate", "Help")를 나타내며, 각 주제와 서브 함수의 기능에 매핑된 경우, 해당 서브 함수를 부모 노드의 자식 노드로 정의할 수 있다. 예컨데, 주제("Edit")과 매핑된 함수 명('Tolerances', 'NodeDOF', 'Allocation Data', 및 'Process Data')의 서브 함수들의 기능은 "Edit"으로 동일하다.

일 실시예에서 기능목록 함수 구조화 트리를 그래픽 유저 인터페이스로 제공함으로써, 사용자가 기능목록 함수 구조화 트리를 보다 직관적으로 인식할 수 있도록 해 줄 수 있다. 일 실시예에서, 복수의 서브 함수에 대해서 불안정성 값이 일정 설정 수준(가령 0.3) 이하인 서브 함수를 따로 표시하여 해당 서브 함수가 포함된 모듈이 다른 모듈에서 참조가 많이 되고 있는 위험한 모듈임을 쉽게 알 수 있게 할 수 있다.

이상에서 설명한 바와 같이 본 발명은 실물형상인 소스 코드로부터 함수 목록을 도출하므로 위험 요소를 판단할 때 누락의 실수 및 위험을 예방할 수 있고, 함수 간의 의존 관계의 빠른 식별이 가능하게 되어 집중해서 위험을 분석해야 할 함수 또는 모듈이 무엇인지 빠르게 확인이 가능하다.

더욱이, 함수 간의 구조 분석의 이해도 및 정확도의 향상을 기대할 수 있으며, 함수 목록의 자동 도출을 통해 시간 및 인력에 대한 비용 절감 효과를 기대할 수 있다.

도 10은 소프트웨어를 분석하기 위한 예시적인 소프트웨어 분석 장치(100)를 도시한 도면이다. 상술된 바와 같이, 예시적인 실시예에서, 소프트웨어 분석 장치(100)는 프로세싱부(110), 저장부(120) 및 입출력부(130)를 포함할 수 있다. 프로세싱부(110), 저장부(120), 및 입/출력부(130)는 서로 연결되어(연결은 도 10에 도시되지 않음), 서로 간에 통신하도록 한다. 분석 장치(100)는 분산 프로세서를 포함할 수 있고, 분석 장치(100)의 각 부분(예를 들면, 프로세싱부(110), 저장부(120), 및 입/출력부(130))은 분산 프로세서를 포함할 수 있다. 소프트웨어 분석 장치(100)는 소프트웨어를 분석하는 것에 연관된 동작을 수행할 수 있다. 예를 들면, 프로세싱부(110)는 소프트웨어 분석을 실행하고, 저장부(120)로부터 소프트웨어 분석 메트릭들을 검색하고, 소프트웨어 분석 메트릭들을 저장할 수 있다. 저장부(120)는 소프트웨어를 분석하는 것에 연관된 모든 파라미터들을 저장할 수 있다.

소프트웨어 분석 장치(100)는 프로세싱부(110)를 포함할 수 있다. 프로세싱부(110)는 입력된 소스 코드를 연산하여 복수의 서브 함수로 구성되는 함수구문 트리를 생성하도록 구성된 함수구분 트리 생성 모듈(112) - 소스 코드는 하나의 메인 함수와 메인 함수가 호출하는 복수의 서브 함수를 포함하며, 복수의 서브 함수의 각각은 기본 라이브러리 또는 사용자 라이브러리로 분류되고, 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보를 포함함-, 함수구문 트리를 구성하는 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하도록 구성된 추상/구체레벨 분류 모듈(114), 함수구문 트리를 구성하는 복수의 서브 함수 각각의 기능을 추론하도록 구성된 함수 기능 추론 모듈(116), 및 복수의 서브 함수 중 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하도록 구성된 기능목록함수 구조화 트리 생성 모듈(118)을 포함할 수 있다.

일 실시예에 있어서, 기능목록함수 구조화 트리 생성 모듈(118)은 복수의 서브 함수 중 추상 레벨로 분류된 서브 함수들을 부모 노드들로 정의하고, 부모 노드들에 해당하는 서브 함수들 각각이 호출하는 적어도 하나의 다른 서브 함수를 해당 부모 노드의 자식 노드로 정의하는 추상 수준에 따른 함수 구조화 트리로 재작성하고, 재배열된 함수구문 트리에 포함된 복수의 노드들 각각에 대해서, 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수의 기능이 동일한 경우, 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수를 그룹핑하도록 더 구성될 수 있다. 이 경우, 형제 노드는 해당 노드와 부모 노드가 동일한 노드이다.

소프트웨어 분석 장치(100)는 저장부(120)를 더 포함할 수 있다. 예시적인 실시예에서, 저장부(120)는 소프트웨어 분석으로부터 나온 메트릭들을 저장할 수 있다.

소프트웨어 분석 장치(100)는 입/출력부(130)를 더 포함할 수 있다. 입/출력부(130)는 소프트웨어를 분석하는 데에 이용되는, 상술된 바와 같은 컴포넌트들을 제공 및/또는 수신할 수 있다. 입/출력부(130)는 또 다른 시스템, 저장 장치 및/또는 데이터 스트림과 서로 데이터를 주고받을 수 있다. 입/출력부(130)는 여러 종류의 소프트웨어 분석에 대한 입력들을 수신하고, 여러 종류의 소프트웨어 분석에 분석 결과들을 제공할 수 있다. 일 실시예에서, 입/출력부(130)는 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스 등과 같은 입력 디바이스(132)를 가질 수 있다. 디스플레이, 스피커, 프린터 등과 같은 출력 디바이스(134) 역시 포함될 수 있다.

입/출력부(130)는 자신이 다른 디바이스들과 통신하도록 하는 통신 연결(들)(136)을 더 포함할 수 있다. 통신 연결(들)(136)은 통신 매체의 일례이다. 제한되지 않는 예로서, 통신 매체는 유선 네트워크 또는 직접 배선 네트워크와 같은 유선 매체, 및 음향, RF, 적외선 및 다른 무선 매체와 같은 무선 매체를 포함한다. 본원에서 사용될 때 컴퓨터 판독가능 매체라는 용어는 저장 매체 및 통신 매체 모두를 포함한다.

도 11은 소프트웨어의 위험을 분석하기 위한 예시적인 소프트웨어 위험분석 장치를 도시한 도면이다. 상술된 바와 같이, 예시적인 실시예에서, 소프트웨어 위험분석 장치(1100)는 프로세싱부(1110), 저장부(1120) 및 입출력부(1130)를 포함할 수 있다. 프로세싱부(1110), 저장부(1120), 및 입/출력부(1130)는 서로 연결되어(연결은 도 11에 도시되지 않음), 서로 간에 통신하도록 한다. 위험분석 장치(1100)는 분산 프로세서를 포함할 수 있고, 위험분석 장치(1100)의 각 부분(예를 들면, 프로세싱부(1110), 저장부(1120), 및 입/출력부(1130))은 분산 프로세서를 포함할 수 있다. 소프트웨어 위험분석 장치(1100)는 소프트웨어의 위험을 분석하는 것에 연관된 동작을 수행할 수 있다. 예를 들면, 프로세싱부(1110)는 소프트웨어 위험분석을 실행하고, 저장부(1120)로부터 소프트웨어 위험분석 메트릭들을 검색하고, 소프트웨어 위험분석 메트릭들을 저장할 수 있다. 저장부(1120)는 소프트웨어를 위험분석하는 것에 연관된 모든 파라미터들을 저장할 수 있다.

소프트웨어 위험분석 장치(1100)는 프로세싱부(1110)를 포함할 수 있다. 프로세싱부(1110)는 소프트웨어의 기능목록함수 구조화 트리의 복수의 기능 항목 각각에 대해서, 위험분석 타입을 분류하도록 구성된 위험분석 타입 분류 모듈(1112)을 포함할 수 있다. 여기서 복수의 기능 항목 각각은 적어도 하나의 서브 함수를 포함한다.

프로세싱부(1110)는 복수의 기능 항목의 각각의 위험분석 타입을 기초로 위험요소들과 위험요소들 간의 인과관계를 도출하도록 구성된 위험요소 도출 모듈(1114)을 더 포함할 수 있다.

소프트웨어 위험분석 장치(1100)는 저장부(1120)를 더 포함할 수 있다. 예시적인 실시예에서, 저장부(1120)는 복수의 테이블을 포함하는 데이터베이스를 포함할 수 있다. 일 실시예에서, 소프트웨어 위험분석에 사용되는 복수의 테이블은 도메인 테이블, 위험분석 타입 분류 테이블, 위험분석 타입 별 위험요소 체크리스트 테이블 및 위험요소의 인과관계 테이블을 포함할 수 있다. 일 실시예에 있어서, 복수의 테이블의 각각은 복수의 레코드(record)를 포함할 수 있다.

일 실시예에서, 도메인 테이블의 복수의 레코드의 각각은 ‘ID’ 및 ‘도메인’를 필드로 포함할 수 있다. 일 실시예에서, 위험분석 타입 분류 테이블의 복수의 레코드의 각각은 ‘ID’, ‘도메인 ID’, ‘위험분석 타입’, ‘관련 시스템’ 및 ‘문서’를 필드로 포함할 수 있다. 일 실시예에서, 위험분석 타입 별 위험요소 체크리스트 테이블의 복수의 레코드의 각각은 ‘ID’, ‘위험분석 타입 ID’, ‘위험요소 체크리스트’를 필드로 포함할 수 있다. 일 실시예에서, 위험요소의 인과관계 테이블의 복수의 레코드의 각각은 ‘ID’, ‘체크리스트 ID’, ‘부모 ID’ 및 ‘위험요소 내용’을 필드로 포함할 수 있다.

소프트웨어 위험분석 장치(1100)는 입/출력부(1130)를 더 포함할 수 있다.

소프트웨어의 위험 분석에 관한 여러 실시예들이 컴퓨터화된 시스템에 특히 적합할 것으로 예상되지만, 본 명세서 내의 범주를 제한하도록 의도되지 않는다. 반대로, 본원에서 사용될 때, "컴퓨터 시스템"이라는 용어는 디바이스가 실제로 전자, 기계, 논리, 또는, 가상인지의 여부와는 관계없이, 디바이스 자체의 동작 및 실행을 제어하기 위해 정보를 저장 및 처리하고 및/또는 저장된 정보를 이용할 수 있는 임의의 모든 디바이스들을 포함하도록 의도된다.

도 12는 본 발명의 일 실시예에 따른 도메인 테이블을 도시하는 도면이다. 도메인 테이블은 ‘ID’ 및 ‘도메인’을 필드로 포함할 수 있고, 하나 이상의 레코드가 존재할 수 있다. ‘ID’는 도메인 테이블의 key값으로 도메인 테이블 내의 복수의 레코드의 각각을 특정할 수 있으며, ‘도메인’은 전문영역을 의미하는데, 가령 자동차, 항만, 철도, 항공, 원자력 또는 무기가 될 수 있다. 일 실시예에서, 분석 대상 소프트웨어의 도메인이 자동차인 경우, 자동차와 연관된 레코드(210)의 도메인 테이블의 ‘ID’값은 1이다.

선택적으로 도메인 테이블을 별도로 구축하지 않고 위험분석의 대상이 되는 소프트웨어의 특정 도메인에 대한 위험분석 타입 분류 테이블, 위험분석 타입 별 위험요소 체크리스트 테이블 및 위험요소의 인과관계 테이블을 구축할 수 있다.

도 13은 본 발명의 일 실시예에 따른 위험분석 타입 분류 테이블을 도시하는 도면이다. 도 13에 도시된 바와 같이, 위험분석 타입 분류 테이블은 ‘ID’, ‘도메인 ID’, ‘위험분석 타입’, ‘관련 시스템’ 및 ‘문서’를 필드로 포함할 수 있고, 위험분석 타입 분류 테이블에는 복수의 레코드들(records)이 존재할 수 있다.

위험분석 타입 분류 테이블의 ‘ID’는 위험분석 타입 분류 테이블의 key값으로 각 레코드를 특정할 수 있는 값이다.

위험분석 타입 분류 테이블의 ‘도메인 ID’는 연관된 도메인 테이블의 ‘ID’값을 의미한다. 예컨대, 분석 대상 소프트웨어의 도메인이 자동차인 경우, 위험분석 타입 분류 테이블의 ‘도메인 ID’값은 도메인 테이블의 ‘ID’값인 1이 된다. 선택적으로, 분석 대상 소프트웨어의 도메인이 자동차인 경우, 도메인 테이블을 별도로 구축하지 않고, 위험분석의 대상이 되는 소프트웨어의 특정 도메인에 대한 위험분석 타입 분류 테이블을 구축하여, 위험분석 타입 분류 테이블의 ‘도메인 ID’ 필드를 생략할 수 있다.

위험분석 타입 분류 테이블의 ‘위험분석 타입’은 위험분석의 대상이 되는 소프트웨어로 인해 야기될 수 있는 위험을 위험분석 타입에 따라 분류한 것을 의미한다. 일 실시예에 있어서, 위험은 개발 단계에 따라 7가지로 분류될 수 있는데, 컨셉 설계 위험분석 타입(Conceptual Design Hazard Analysis Type: CD-HAT), 사전 설계 위험분석 타입(Preliminary Design Hazard Analysis Type: PD-HAT), 상세 설계 위험분석 타입(Detailed Design Hazard Analysis Type: DD-HAT), 시스템 설계 위험분석 타입(System Design Hazard Analysis Type: SD-HAT), 운영 설계 위험분석 타입(Operations Design Hazard Analysis Type: OD-HAT), 사용자 설계 위험분석 타입(Human Design Hazard Analysis Type: HD-HAT), 및 요구사항 설계 위험분석 타입(Requirements Design Hazard Analysis Type: RD-HAT)이다.

일 실시예에서, 위험이 시스템 설계에 대한 것일 경우 위험을 시스템 설계 위험분석 타입으로 분류하고, 위험이 사용자가 운영 중에 발생할 수 있는 위험에 대한 것일 경우 위험을 운영 설계 위험분석 타입으로 분류하고, 위험이 사용자가 사용 중에 발생할 수 있는 위험에 대한 것인 경우 위험을 사용자 설계 타입으로 분류할 수 있다.

위험분석 타입 분류 테이블의 ‘관련 시스템’은 해당 위험이 발생할 수 있는 부분을 의미한다. 일 실시예에서, ‘도메인’이 ‘자동차’일 때, ‘위험분석 타입’의 값이 ‘시스템 설계 타입’인 경우 ‘관련 시스템’은 ‘엔진’, ‘브레이크’, ‘트랜스미션’ 등이 될 수 있고, ‘위험분석 타입’의 값이 ‘운영 설계 타입’인 경우 ‘관련 시스템’은 ‘엔진’, ‘브레이크’, 트랜스미션’ 등이 될 수 있으며, ‘위험분석 타입’의 값이 ‘사용자 설계 타입’인 경우 ‘브레이크’, ‘트랜스미션’ 등이 될 수 있다.

위험분석 타입 분류 테이블의 ‘문서’는 위험분석 타입 및 관련 시스템에 따라 발생할 수 있는 위험을 기술한 것을 의미한다. 일 실시예에서, ‘위험분석 타입’의 값이 ‘시스템 설계 타입’이고 ‘관련 시스템’이 ‘엔진’인 경우, 위험분석 타입 분류 테이블의 레코드(310)가 특정되고 해당 레코드(310)의 ‘문서’ 값은 ‘위험분석 타입’의 값이 ‘운영 설계 타입’이고 ‘관련 시스템’이 ‘엔진’인 경우 특정되는 위험분석 타입 분류 테이블의 레코드(350)의 ‘문서’ 값과 다르다.

도 14는 본 발명의 일 실시예에 따른 위험분석 타입 별 위험요소 체크리스트 테이블을 도시한 도면이다. 도 14에 도시된 바와 같이, 위험분석 타입 별 위험요소 체크리스트 테이블은 ‘ID’, ‘위험분석타입 ID’, 및 ‘위험요소 체크리스트’를 필드로 포함할 수 있고, 복수의 레코드들이 존재할 수 있다.

위험분석 타입 별 위험요소 체크리스트 테이블의 ‘ID’는 key값으로 각 레코드를 특정할 수 있다.

‘위험분석타입 ID’는 연관된 위험분석 타입 분류 테이블의 ‘ID’값을 의미한다. 일 실시예에서, 분석 대상 소프트웨어의 도메인이 자동차이고, 위험분석 타입이 ‘운영 설계 타입’이며, 관련 시스템이 ‘엔진’인 레코드(350)의 ‘ID’값은 5이며, 따라서 위험분석 타입 별 위험요소 체크리스트(400)의 ‘위험분석 ID’값이 5인 레코드들(410, 420)과 연관된다. 연관된 레코드(410)의 ‘ID’는 7이고, ‘위험요소 체크리스트’는 “엔진 급발진의 위험이 있는가?”이다. 연관된 레코드(420)의 ‘ID’는 8이고, ‘위험요소 체크리스트’는 “엔진 ECU SW 주소 입력 오류의 위험이 있는가?”이다.

도 15는 본 발명의 일 실시예에 따른 위험요소의 인과관계 테이블을 도시한 도면이다. 도 15에 도시된 바와 같이, 위험요소의 인과관계 테이블은 ‘ID’, ‘체크리스트 ID’, ‘부모 ID’ 및 ‘위험요소 내용’을 필드로 포함할 수 있고, 복수의 레코드들이 존재할 수 있다.

위험요소의 인과관계 테이블의 ‘ID’는 key값으로 각 레코드를 특정할 수 있으며, ‘체크리스트 ID’는 연관된 위험요소 체크리스트 테이블의 ‘ID’값을 의미한다. 예컨대, 위험요소의 인과관계 테이블의 ‘체크리스트 ID’가 7인 레코드들(501, 503, 505)은 위험요소 체크리스트 테이블의 ‘ID’가 7인 레코드(410)와 연관될 수 있다.

위험요소의 인과관계 테이블의 ‘부모 ID’는 특정 레코드와 다른 레코드들 간의 인과관계를 나타낸다. 즉, 특정 레코드의 ‘부모 ID’와 타 레코드의 ‘ID’가 일치하는 경우, 특정 레코드의 ‘위험요소 내용’은 해당 레코드(즉, 특정 레코드의 ‘부모 ID’ 값과 일치하는 ‘ID’ 값을 가지는 레코드)의 ‘위험요소 내용’의 원인일 수 있다. 예컨대, 일 실시예에서, ‘부모 ID’가 20인 레코드들(507, 509, 511)의 ‘위험요소 내용’(즉, 엑셀포지션 센서 통신 오류 등)은 ‘ID’가 20인 레코드(501)의 ‘위험요소 내용’(즉,센서 통신 불량)의 원인일 수 있고, ‘부모 ID’가 21인 레코드들(513, 515. 517)의 ‘위험요소 내용’(즉, 스로틀 밸브 제어 오류, 브레이크 제어 오류, 제어 메모리 공유 오류’)은 ‘ID’가 21인 레코드(503)의 ‘위험요소 내용’(즉, ECU의 시스템 제어 불량)의 원인일 수 있으며, ‘부모 ID’가 28인 레코드들(519, 521, 523)은 ‘ID’가 28인 레코드(517)의 ‘위험요소 내용’(즉, 스로틀밸브 사용 메모리 공유 오류, 엑셀 포지션 사용 메모리 오류 등)은 ‘ID’가 22인 레코드(505)의 ‘위험요소 내용’(즉, …)의 원인일 수 있다.

위험요소의 인과관계 테이블의 ‘위험요소 내용’은 특정 서브함수의 오류로 인해 발생할 수 있는 위험을 기술하고 있다. 예컨대, ‘위험요소 내용’으로는 센서 통신 불량, ECU의 시스템 제어 불량 또는 엑셀포지션 센서 통신 오류 등이 있을 수 있다.

도 16은 본 발명의 일 실시예에 따른 테이블들 간의 논리적 연관관계를 도시한 도면이다. 도 16에 도시된 바와 같이, 도메인 테이블은 위험분석 타입 분류 테이블과 연관될 수 있고, 위험분석 타입 분류 테이블은 위험분석 타입 별 위험요소 체크리스트 테이블과 연관될 수 있으며, 위험분석 타입 별 위험요소 체크리스트 테이블은 위험요소의 인과관계 테이블과 연관될 수 있다.

도 12 내지 도 16에 도시된 복수의 테이블들은 본 발명에 따른 소프트웨어 위험분석 방법을 구현하기 위한 데이터베이스의 모든 테이블을 반영한 것이 아니고 필수적인 것도 아니다. 따라서, 본 발명에 따른 소프트웨어 위험분석 방법을 구현하기 위한 데이터베이스는 도시된 테이블들 보다 많은 테이블을 포함하거나 그 보다 적은 테이블을 포함할 수 있음을 인식하여야 한다. 더하여, 각각의 테이블의 필드들도 도시된 필드들 보다 많은 필드를 포함하거나 그 보다 적은 필드를 포함할 수 있음을 인식하여야 한다.

도 17은 본 발명의 일 실시예에 따라 소프트웨어의 위험분석을 제공하기 위한 예시적인 프로세스의 흐름도이다. 도 17에 도시된 바와 같이, 예시적인 실시예에서, 소프트웨어 위험분석은 복수의 테이블을 포함하는 데이터베이스를 구축하는 단계(S710)로부터 시작된다. 소프트웨어 위험분석에 사용되는 복수의 테이블은 도메인 테이블, 위험분석 타입 분류 테이블, 위험분석 타입 별 위험요소 체크리스트 테이블 및 위험요소의 인과관계 테이블을 포함할 수 있다. 일 실시예에 있어서, 복수의 테이블의 각각은 복수의 레코드를 포함할 수 있다.

일 실시예에서, 도메인 테이블의 복수의 레코드의 각각은 ‘ID’ 및 ‘도메인’을 필드로 포함할 수 있다.

일 실시예에서, 위험분석 타입 분류 테이블의 복수의 레코드의 각각은 ‘ID’, ‘도메인 ID’, ‘위험분석 타입’, ‘관련 시스템’ 및 ‘문서’를 필드로 포함할 수 있다.

일 실시예에서, 위험분석 타입 별 위험요소 체크리스트 테이블의 복수의 레코드의 각각은 ‘ID’, ‘위험분석 타입 ID’, ‘위험요소 체크리스트’를 필드로 포함할 수 있다.

일 실시예에서, 위험요소의 인과관계 테이블의 복수의 레코드의 각각은 ‘ID’, ‘체크리스트 ID’, ‘부모 ID’ 및 ‘위험요소 내용’을 필드로 포함할 수 있다.

단계(S720)에서는, 위험을 분석해야 할 대상인 소프트웨어의 도메인 정보를 획득할 수 있다. 일 실시예에서, 소프트웨어의 도메인은 도메인 테이블의 ‘도메인’ 필드의 값 중 하나일 수 있다. 예컨대, 소프트웨어의 도메인이 ‘자동차’이고, 도메인 테이블의 ‘도메인’ 값으로 ‘자동차’를 가지는 레코드(210)를 특정할 수 있고, 레코드(210)의 ‘ID’는 1이다.

일 실시예에 있어서, 선택적으로 도메인 테이블을 별도로 구축하지 않고 위험분석의 대상이 되는 소프트웨어의 도메인에 대한 위험분석 타입 분류 테이블 위험분석 타입 별 위험요소 체크리스트 테이블 및 위험요소의 인과관계 테이블을 생성할 수 있다. 이 경우, 단계(S720)는 생략될 수 있다.

단계(S730)에서는 위험을 분석해야 할 대상인 소프트웨어의 기능목록 함수 구조화 트리를 획득할 수 있다. 여기서, 소프트웨어는 소스 코드로 구성되며, 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함할 수 있다. 기능목록함수 구조화 트리는 서브 함수를 기능에 따라 트리 구조로 도식화한 트리이다.

도 18은 본 발명의 일 실시예에 따른 기능목록 함수 구조화 트리를 도시하는 도면이다. 일 실시예에서, 기능목록함수 구조화 트리는 복수의 기능 항목으로 구성되고, 복수의 기능 항목의 각각은 상기 복수의 서브 함수 중 적어도 하나의 서브 함수를 포함할 수 있다. 여기서, 복수의 서브 함수의 각각은 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보에 의해 정의될 수 있다.

일 실시예에서, 최상위 부모 노드들은 주제(“File”, “Edit”, “Options”, “Analyze”, “Allocate”, “Help”)를 나타내며, 각 주제와 서브 함수의 기능에 매핑된 경우, 해당 서브 함수를 부모 노드의 자식 노드로 정의할 수 있다. 예컨데, 주제(“Edit”)과 매핑된 함수 명(‘Tolerances’, ‘NodeDOF’, ‘Allocation Data’, 및 ‘Process Data’)의 서브 함수들의 기능은 “Edit”으로 동일하다.

일 실시예에 있어서, 소프트웨어의 기능목록함수 구조화 트리를 획득하는 것은 소프트웨어의 기능목록함수 구조화 트리를 입력받는 것일 수 있다. 선택적으로, 일 실시예에서, 소프트웨어의 기능목록함수 구조화 트리를 획득하는 것은 해당 소프트웨어의 소스 코드를 획득하고, 소스 코드를 연산하여 복수의 서브 함수로 구성되는 함수구문 트리를 생성하고, 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하며, 함수구문 트리를 구성하는 복수의 서브 함수 각각의 기능을 추론하고, 복수의 서브 함수 중 상기 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하는 것일 수 있다. 일 실시예에서, 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하는 것은 복수의 서브 함수 각각에 대해서 상호호출 관계를 기초로 분류할 수 있다. 일 실시예에서, 소프트웨어의 기능목록함수 구조화 트리를 획득하는 것은 한국특허출원번호 제10-2015-0136251호에 따라 생성할 수 있다.

단계(S740)에서 기능목록함수 구조화 트리의 복수의 기능 항목의 각각에 대해서 위험분석 타입 분류 테이블을 이용하여 복수의 기능 항목 각각을 위험분석 타입으로 분류할 수 있다.

일 실시예에서, 기능목록 함수 구조화 트리의 복수의 기능 항목 각각에 대해서 위험분석 타입 분류 테이블을 이용하여 위험분석 타입을 분류하는 것은 해당 기능 항목이 포함하는 적어도 하나의 서브 함수의 함수 정보와 위험분석 타입 분류 테이블의 문서들 간에 텍스트 기반으로 유사도를 계산하여 가장 유사도가 높은 문서의 위험분석 타입으로 위험분석 타입을 분류하는 것일 수 있다.

일 실시예에서, 텍스트 기반으로 유사도를 계산하여 위험분석 타입을 분류하는 것은 해당 기능 항목이 포함하는 적어도 하나의 서브 함수의 함수 정보와 상기 위험분석 타입 분류 테이블의 ‘문서’ 필드 값들 간에 텍스트 기반으로 유사도를 계산하여 가장 유사도가 높은 필드 값을 가지는 ‘문서’와 연관된 레코드를 검색하고, 해당 기능 항목을 해당 레코드와 연관시키는 것일 수 있다. 예컨대, 복수의 기능 항목 중 어느 하나의 기능 항목에 대해서 위험분석 타입 분류 테이블을 이용하여 위험분석 타입을 분류하여 보니, 가장 유사도가 높은 필드 값을 가지는 ‘문서’와 연관된 레코드가 레코드(310)일 때, 레코드(310)의 ‘ID’는 5이고, 해당 기능 항목의 ‘위험분석 타입’은 운영설계 타입이고, ‘관련 시스템’은 엔진일 수 있다.

일 실시예에서, 코사인 기반 유사도 알고리즘 및 유클리디안 거리기반 유사도 알고리즘 중 적어도 하나를 사용하여 텍스트 기반의 유사도를 계산할 수 있다.

일 실시예에서, 위험분석 타입은 컨셉 설계 위험분석 타입(CD-HAT), 사전 설계 위험분석 타입(PD-HAT), 상세 설계 위험분석 타입(DD-HAT), 시스템 설계 위험분석 타입(SD-HAT), 운영 설계 위험분석 타입(OD-HAT), 사용자 설계 위험분석 타입(HD-HAT), 요구사항 설계 위험분석 타입(RD-HAT) 중 어느 하나일 수 있다.

일 실시예에서, 기능목록 함수 구조화 트리의 복수의 기능 항목 각각에 대해서 위험분석 타입 분류 테이블을 이용하여 위험분석 타입을 분류하는 것은 복수의 기능 항목 각각이 시스템 설계에 대한 것일 경우 해당 기능 항목을 시스템 설계 위험분석 타입으로 분류하고, 해당 기능 항목이 사용자가 운영 중에 발생할 수 있는 위험에 대한 것일 경우 해당 기능 항목을 운영 설계 위험분석 타입으로 분류하고, 해당 기능 항목이 사용자가 사용 중에 발생할 수 있는 위험에 대한 것인 경우 해당 기능 항목을 사용자 설계 타입으로 분류할 수 있다.

단계 (S750)에서는 위험분석 타입 별 위험요소 체크리스트를 도출할 수 있다. 단계 (S740)에서 가장 유사도가 높은 문서의 위험분석 타입 및 관련시스템과 연관된 위험분석 타입 분류 테이블의 레코드의 ‘ID’를 구하고, 위험분석 타입 별 위험요소 체크리스트 테이블의 레코드들 중 ‘위험분석 타입 ID’가 단계(S740)에서 구한 위험분석 타입 분류 테이블의 레코드의 ID와 일치하는 위험분석 타입 별 위험요소 체크리스트 테이블의 적어도 하나의 레코드를 검색할 수 있다. 검색된 적어도 하나의 레코드의 ‘ID’ 및 해당 레코드의 ‘위험요소 체크리스트’를 도출할 수 있다.

일 실시예에서 위험분석 타입 분류 테이블의 레코드(310)의 ‘ID’가 5인 경우, 연관된 위험분석 타입 별 위험요소 체크리스트 테이블의 레코드들 중 ‘위험분석 타입 ID’가 5인 레코드들(410, 420)을 검색한다. 레코드(410)의 ‘ID’는 7이고, 레코드(420)의 ‘ID’는 8이다. 해당 레코드들(410, 420)의 ‘위험요소 체크리스트’는 “엔진 급발진의 위험이 있는가?”(레코드 410) 이거나, “엔진 ECU SW 주소 입력 오류의 위험이 있는가”(레코드 420)이다.

단계 (S760)에서는 위험요소들 간의 인과관계를 도출할 수 있다.

위험분석 타입 별 위험요소 체크리스트 테이블의 특정 레코드의 ‘ID’가 위험요소의 인과관계 테이블의 ‘체크리스트 ID’와 일치하는 위험요소의 인과관계 테이블의 적어도 하나의 레코드를 검색할 수 있다. 검색된 적어도 하나의 레코드의 ‘ID’ 및 ‘위험요소 내용’ 필드 값을 도출 할 수 있다.

일 실시예에서 위험분석 타입 별 위험요소 체크리스트 테이블의 레코드(410)의 ‘ID’가 7인 경우, 연관된 위험요소의 인과관계 테이블의 레코드들 중 ‘체크리스트 ID’가 7인 레코드들(501, 503, 505)을 검색한다. 레코드(501)의 ‘ID’는 20, 레코드(503)의 ‘ID’는 21, 레코드(505)의 ‘ID’는 22이다. 레코드들(501)의 ‘위험요소 내용’은 “센서 통신 분량”이고, 레코드들(503)의 ‘위험요소 내용’은 “ECU의 시스템 제어 불량”이며, 레코드들(505)의 ‘위험요소 내용’은 “…”이다.

일 실시예에서, 위험요소의 인과관계 테이블의 복수의 레코드들 중 ‘부모 ID’와 다른 레코드들의 ‘ID’가 일치하는 적어도 하나의 레코드를 검색할 수 있다. 검색된 적어도 하나의 레코드의 ‘위험요소 내용’ 필드 값을 도출 할 수 있다.

일 실시예에서 위험요소의 인과관계 테이블의 레코드들(507, 509, 511)의 ‘부모 ID’는 20이다. 레코드들(507, 509, 511)은 ‘ID’가 20인 레코드(501)와 연관된다. 이는 레코드들(507, 509, 511)의 ‘위험요소 내용’은 레코드(501)의 ‘위험요소 내용’의 원인이 될 수 있음을 의미한다.

유사하게, 위험요소의 인과관계 테이블의 레코드들(513, 515, 517)의 ‘부모 ID’는 21이다. 레코드들(513, 515, 517)은 ‘ID’가 21인 레코드(503)와 연관된다. 레코드들(513, 515, 517)의 ‘위험요소 내용’은 레코드(503)의 ‘위험요소 내용’의 원인이 될 수 있다.

유사하게, 위험요소의 인과관계 테이블의 레코드들(519, 521, 523)의 ‘부모 ID’는 28이다. 레코드들(519, 521, 523)은 ‘ID’가 28인 레코드(517)와 연관된다. 레코드들(519, 521, 523)의 ‘위험요소 내용’은 레코드(517)의 ‘위험요소 내용’의 원인이 될 수 있다.

단계 (S770)에서는 위험요소들을 인과관계에 따라 시각화시킬 수 있다.

도 19는 본 발명의 일 실시예에 따라 위험요소의 인과관계 테이블을 이용하여 위험요소들을 인과관계에 따라 시각화시킨 도면이다. 도 19에 도시된 바와 같이, 위험요소를 시각화된 그래픽 유저 인터페이스로 제공함으로써, 사용자가 위험요소를 보다 직관적으로 인식할 수 있도록 해 줄 수 있다.

일 실시예에서, 위험분석 타입 분류 테이블의 레코드(410)의 ‘위험요소 체크리스트’ 값인 “엔진 급발진의 위험이 있는가”에 대한 인과관계를 시각화할 수 있다. 레코드(410)의 ‘ID’는 7이다. 인과관계 테이블에서 복수의 레코드들 중 ‘체크리스트 ID’가 7인 레코드들(501, 503, 505)을 검색할 수 있다. 레코드들(501, 503, 505)의 ‘위험요소 내용’은 레코드(410)의 ‘위험요소 체크리스트’의 원인일 수 있다. 따라서, 레코드들(501, 503, 505)의 ‘위험요소 내용’을 논리연산자 OR로 묶여, 레코드(410)의 ‘위험요소 체크리스트’의 하위 노드로 구성할 수 있다.

유사하게, 레코드들(507, 509, 511)의 ‘부모 ID’는 20이다. 레코드들(507, 509, 511)은 ‘ID’가 20인 레코드(501)와 연관된다. 이는 레코드들(507, 509, 511)의 ‘위험요소 내용’은 레코드(501)의 ‘위험요소 내용’의 원인이 될 수 있음을 의미하므로 레코드들(507, 509, 511)의 ‘위험요소 내용’을 논리연산자 OR로 묶여, 레코드(501)의 ‘위험요소 내용’의 하위 노드로 구성할 수 있다.

유사하게, 레코드들(513, 515, 517)의 ‘부모 ID’는 21이다. 레코드들(513, 515, 517)은 ‘ID’가 21인 레코드(503)와 연관된다. 레코드들(513, 515, 517)의 ‘위험요소 내용’은 레코드(503)의 ‘위험요소 내용’의 원인이 될 수 있다. 따라서, 레코드들(513, 515, 517)의 ‘위험요소 내용’을 논리연산자 OR로 묶여, 레코드(503)의 ‘위험요소 내용’의 하위 노드로 구성할 수 있다.

유사하게, 레코드들(519, 521, 523)의 ‘부모 ID’는 28이다. 레코드들(519, 521, 523)은 ‘ID’가 28인 레코드(517)와 연관된다. 레코드들(519, 521, 523)의 ‘위험요소 내용’은 레코드(517)의 ‘위험요소 내용’의 원인이 될 수 있다. 따라서, 레코드들(519, 521, 523)의 ‘위험요소 내용’을 논리연산자 OR로 묶여, 레코드(517)의 ‘위험요소 내용’의 하위 노드로 구성할 수 있다.

이상에서 설명한 바와 같이 본 발명은 데이터베이스를 구축하여 위험요소를 도출하므로 위험요소를 판단할 때 누락의 실수 및 위험을 예방할 수 있고, 위험요소의 원인, 결과 관계를 분석하여 논리 연산자 조합으로 표현함으로써 사용자에게 빠른 식별이 가능하게 되어 집중해서 위험을 분석해야 할 함수 또는 모듈이 무엇인지 빠르게 확인이 가능하다.

소프트웨어 분석의 여러 실시예들이 컴퓨터화된 시스템에 특히 적합할 것으로 예상되지만, 본 명세서 내의 범주를 제한하도록 의도되지 않는다. 반대로, 본원에서 사용될 때, "컴퓨터 시스템"이라는 용어는 디바이스가 실제로 전자, 기계, 논리, 또는, 가상인지의 여부와는 관계없이, 디바이스 자체의 동작 및 실행을 제어하기 위해 정보를 저장 및 처리하고 및/또는 저장된 정보를 이용할 수 있는 임의의 모든 디바이스들을 포함하도록 의도된다.

소프트웨어 분석이 다양한 도면의 예시적인 실시예와 관련하여 기술되어져 왔지만, 다른 유사한 실시예들이 이용될 수 있고, 또는 본 발명을 벗어나지 않고서 반복적인 동적 및 정적 소프트웨어 분석의 동일한 기능을 수행하기 위한 수정 및 추가가, 설명된 실시예들에 대해 만들어질 수 있다는 것이 이해되어야 한다. 그러므로, 본원에 기술된 소프트웨어 분석은 어떤 단일 실시예로 한정되어서는 아니되며, 첨부 청구항에 따른 범위 및 범주안에서 이해되어져야 한다.

본 발명의 다른 과제는 소프트웨어 구조에 관한 문서(즉, 요구사항문서)가 없어서 그 구조를 파악하기 어려운 상황에서도 소스 코드를 분석하여 어떤 서브 함수가 위험한지의 정보가 포함된 기능목록 구조화를 하여 소프트웨어 안전진단을 제공해주는 소프트웨어 분석 방법 및 장치를 제공하는 것이다.

본 발명의 다른 과제는 소프트웨어를 구성하는 위험요소를 분석하여 가장 중요한 위험요소 도출 누락과 같은 휴먼 에러 없이 소프트웨어 안전진단을 제공해주는 소프트웨어 위험분석 방법 및 장치를 제공하는 것이다.

Claims

소프트웨어 분석 방법으로서,

소프트웨어의 소스 코드를 획득하는 단계 - 상기 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함하며, 상기 복수의 서브 함수의 각각은 기본 라이브러리 또는 사용자 라이브러리로 분류되고, 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보를 포함함 -,

상기 소스 코드를 연산하여 상기 복수의 서브 함수로 구성되는 함수구문 트리를 생성하는 단계,

상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하는 단계,

상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각의 기능을 추론하는 단계, 및

상기 복수의 서브 함수 중 상기 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하는 단계를 포함하는 소프트웨어 분석 방법.
제1항에 있어서,

상기 소스 코드를 연산하여 상기 복수의 서브 함수로 구성되는 함수구문 트리를 생성하는 단계는

상기 소스 코드를 스캔하고 파싱하여 추상구문 트리(abstract syntax tree)를 생성하는 단계, 및

구문 분석기(semantic analyzer)를 이용하여 상기 추상구문 트리를 함수구문 트리로 변환하는 단계를 포함하는, 소프트웨어 분석 방법.
제1항에 있어서,

상기 추상 레벨 또는 구체 레벨로 분류하는 단계는

상기 복수의 서브 함수 각각에 대해서 상호호출 관계를 산출하는 단계,

상기 상호호출 관계를 기초로 상기 해당 서브 함수가 다른 서브 함수를 참조하는 개수인 원심성 값 및 다른 함수가 상기 해당 서브 함수를 참조하는 개수인 구심성 값을 구하는 단계,

상기 해당 서브 함수의 상기 원심성 값 및 상기 구심성 값을 기초로 상기 해당 서브 함수의 불안정성 값을 산출하는 단계, 및

상기 불안정성 값이 제1 기준 값 이상이면 상기 해당 서브 함수를 상기 추상 레벨로 분류하고, 상기 불안정성 값이 상기 제1 기준 값 미만이면 상기 해당 서브 함수를 상기 구체 레벨로 분류하는 단계를 포함하는, 소프트웨어 분석 방법.
제1항에 있어서,

상기 방법은

상기 복수의 서브 함수 중 상기 추상 레벨로 분류된 서브 함수들 각각을 루트 노드로 정의 하고, 상기 루트 노드를 시작으로 트리를 구성하는 단계 - 상기 트리에서는, 다른 서브 함수를 호출하는 서브 함수를 부모 노드로 정의하고 상기 부모 노드에 해당하는 서브 함수가 호출하는 다른 서브 함수를 자식 노드로 정의함 - 를 더 포함하는 소프트웨어 분석 방법.
제1항에 있어서,

상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각의 기능을 추론하는 단계는

상기 함수구문 트리를 구성하는 상기 복수의 서브 함수를 상기 기본 라이브러리에 속하는 제1 서브 함수 그룹과 상기 사용자 라이브러리에 속하는 제2 서브 함수 그룹으로 분류하는 단계,

상기 소스 코드가 작성된 프로그래밍 언어에서 사전에 정의된 기능 목록을 기초로 상기 제1 서브 함수그룹의 서브 함수들의 각각의 기능을 추론하는 제1 서브 함수그룹 의미 추론 단계, 및

상기 제2 서브 함수 그룹의 서브 함수들 각각의 함수 정보를 기초로 상기 제2 서브 함수 그룹의 서브 함수들 각각의 기능을 추론하는 제2 서브 함수그룹 의미 추론 단계를 포함하는, 소프트웨어 분석 방법.
제5항에 있어서,

상기 제2 서브 함수그룹 의미 추론 단계는

상기 제2 그룹의 서브 함수들 각각의 함수 정보를 텍스트 마이닝하여 주제 DB에서 가장 유사한 기능을 도출하고, 상기 가장 유사한 기능을 상기 해당 제2 그룹 서브 함수의 기능으로 매핑하는 단계를 포함하는 소프트웨어 분석 방법.
제1항에 있어서,

상기 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하는 단계는

상기 복수의 서브 함수 중 추상 레벨로 분류된 서브 함수들을 부모 노드들로 정의하고, 상기 부모 노드들에 해당하는 서브 함수들 각각이 호출하는 적어도 하나의 다른 서브 함수를 상기 해당 부모 노드의 자식 노드로 정의하는 추상 수준에 따른 함수 구조화 트리 재작성 단계, 및

상기 재배열된 함수구문 트리에 포함된 복수의 노드들 각각에 대해서, 상기 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수의 기능이 동일한 경우, 상기 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수를 그룹핑하는 단계 - 상기 형제 노드는 상기 해당 노드와 부모 노드가 동일함 - 를 포함하는, 소프트웨어 분석 방법.
제3항에 있어서,

상기 산출된 원심성 값 및 상기 산출된 구심성 값을 기초로 불안정성 값을 산출하는 단계는, 수식 1에 따라 불안정성 값을 계산하는 단계를 포함하는, 소프트웨어 분석 방법.

수식 1:
소프트웨어 분석 장치로서,

입력된 소스 코드를 연산하여 복수의 서브 함수로 구성되는 함수구문 트리를 생성하도록 구성된 함수구분 트리 생성 모듈 - 상기 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함하며, 상기 복수의 서브 함수의 각각은 기본 라이브러리 또는 사용자 라이브러리로 분류되고, 주석, 함수 명, 입력 파라미터 명 및 내부 구현 텍스트를 포함하는 함수 정보를 포함함- ,

상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각을 추상 레벨 또는 구체 레벨로 분류하도록 구성된 추상/구체 레벨 분류 모듈,

상기 함수구문 트리를 구성하는 상기 복수의 서브 함수 각각의 기능을 추론하도록 구성된 함수기능 추론 모듈, 및

상기 복수의 서브 함수 중 상기 추론된 기능이 동일한 서브 함수들을 구조화하여 기능목록함수 구조화 트리를 생성하도록 구성된 기능목록함수 구조화 트리 생성 모듈을 포함하는 소프트웨어 분석 장치.
제9항에 있어서,

상기 기능목록함수 구조화 트리 생성 모듈은

상기 복수의 서브 함수 중 추상 레벨로 분류된 서브 함수들을 부모 노드들로 정의하고, 상기 부모 노드들에 해당하는 서브 함수들 각각이 호출하는 적어도 하나의 다른 서브 함수를 상기 해당 부모 노드의 자식 노드로 정의하는 추상 수준에 따른 함수 구조화 트리로 재작성하고,

상기 재배열된 함수구문 트리에 포함된 복수의 노드들 각각에 대해서, 상기 해당 노드에 대응하는 서브 함수와 형제 노드에 대응하는 서브 함수의 기능이 동일한 경우, 상기 해당 노드에 대응하는 서브 함수와 형제 노드 - 상기 형제 노드는 상기 해당 노드와 부모 노드가 동일함 - 에 대응하는 서브 함수를 그룹핑하도록 더 구성되는, 소프트웨어 분석 장치.
소프트웨어 위험분석 방법으로서,

복수의 레코드(records)를 포함하는 위험분석 타입 분류 테이블을 구축하는 단계 - 상기 위험분석 타입 분류 테이블의 복수의 레코드의 각각은 ID, 도메인 ID, 위험분석 타입(Hazard Analysis Type), 관련 시스템 및 문서를 포함함 -,

소프트웨어의 도메인 정보를 획득하는 단계 - 상기 소프트웨어는 소스 코드로 구성되며, 상기 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함함 -,

상기 소프트웨어의 기능목록함수 구조화 트리를 획득하는 단계 - 상기 기능목록함수 구조화 트리는 복수의 기능 항목으로 구성되고, 상기 복수의 기능 항목의 각각은 상기 복수의 서브 함수 중 적어도 하나의 서브 함수를 포함함 -,

상기 기능목록함수 구조화 트리의 상기 복수의 기능 항목의 각각에 대해서 상기 위험분석 타입 분류 테이블을 이용하여 위험분석 타입을 분류하는 단계, 및

상기 소프트웨어의 도메인 정보 및 상기 분류된 위험분석 타입을 기초로 위험요소들의 인과관계를 시각화하는 단계

를 포함하는 소프트웨어 위험분석 방법.
제11항에 있어서,

상기 위험분석 타입은 컨셉 설계 위험분석 타입(CD-HAT), 사전 설계 위험분석 타입(PD-HAT), 상세 설계 위험분석 타입(DD-HAT), 시스템 설계 위험분석 타입(SD-HAT), 운영 설계 위험분석 타입(OD-HAT), 사용자 설계 위험분석 타입(HD-HAT), 요구사항 설계 위험분석 타입(RD-HAT) 중 적어도 하나로 분류되는, 소프트웨어 위험분석 방법.
프로그램을 기록한 컴퓨터 판독가능 기록매체로서, 상기 프로그램은 명령어들을 포함하고, 상기 명령어들은 컴퓨터에 의해 실행될 때 제1항 내지 제8항 및 제11항 내지 제12항 중 어느 한 항에 따른 방법을 수행하는, 컴퓨터 판독가능 기록매체.
소프트웨어 위험분석 장치로서,

위험분석 타입 분류 테이블 - 상기 위험분석 타입 분류 테이블은 복수의 레코드를 포함하고, 상기 복수의 레코드의 각각은 ID, 도메인 ID, 위험분석 타입, 관련 시스템 및 문서를 포함함 -,

소프트웨어의 기능목록함수 구조화 트리의 복수의 기능 항목 각각에 대해서, 상기 위험분석 타입 분류 테이블을 이용하여 위험분석 타입을 분류하도록 구성된 위험분석 타입 분류 모듈 - 상기 복수의 기능 항목의 각각은 적어도 하나의 서브 함수를 포함함 -, 및

소프트웨어의 도메인 정보 및 위험분석 타입을 기초로 위험요소들의 인과관계를 시각화하도록 구성된 위험요소 도출 모듈 - 상기 소프트웨어는 소스 코드로 구성되며, 상기 소스 코드는 하나의 메인 함수와 상기 메인 함수가 호출하는 복수의 서브 함수를 포함함 -

을 포함하는 소프트웨어 위험분석 장치.
제14항에 있어서,

상기 위험분석 타입 분류 모듈은

상기 복수의 기능 항목 각각이 시스템 설계에 대한 것일 경우 상기 해당 기능 항목을 시스템 설계 위험분석 타입으로 분류하고,

상기 해당 기능 항목이 사용자가 운영 중에 발생할 수 있는 위험에 대한 것일 경우 상기 해당 기능 항목을 운영 설계 위험분석 타입으로 분류하고,

상기 해당 기능 항목이 사용자가 사용 중에 발생할 수 있는 위험에 대한 것인 경우 상기 해당 기능 항목을 사용자 설계 타입으로 분류하도록 더 구성되는
제14항에 있어서,

상기 위험분석 타입 분류 테이블과 연관된 복수의 레코드를 포함하는 위험분석 타입 별 위험요소 체크리스트 테이블 - 상기 위험요소 인과관계 데이터베이스의 복수의 레코드의 각각은 ID, 위험분석 타입 ID, 위험요소 체크리스트를 포함함 -을 더 포함하고,

상기 위험요소 도출 모듈은, 상기 가장 유사도가 높은 레코드의 ID를 획득하고, 상기 위험분석 타입 별 위험요소 체크리스트 테이블의 복수의 레코드 중 위험분석 타입 ID가 상기 가장 유사도가 높은 레코드의 ID와 일치하는 적어도 하나의 레코드를 선택하여, 상기 선택된 적어도 하나의 레코드의 위험요소 체크리스트 값을 도출하도록 더 구성되는 소프트웨어 위험분석 장치.