KR101457073B1 - 산업군에 대한 위기지수 산출방법 및 장치 - Google Patents

산업군에 대한 위기지수 산출방법 및 장치 Download PDF

Info

Publication number
KR101457073B1
KR101457073B1 KR1020130006069A KR20130006069A KR101457073B1 KR 101457073 B1 KR101457073 B1 KR 101457073B1 KR 1020130006069 A KR1020130006069 A KR 1020130006069A KR 20130006069 A KR20130006069 A KR 20130006069A KR 101457073 B1 KR101457073 B1 KR 101457073B1
Authority
KR
South Korea
Prior art keywords
crisis
nts
variable
independent
value
Prior art date
Application number
KR1020130006069A
Other languages
English (en)
Other versions
KR20140093532A (ko
Inventor
김군호
김희수
김대현
Original Assignee
주식회사 에프앤가이드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에프앤가이드 filed Critical 주식회사 에프앤가이드
Priority to KR1020130006069A priority Critical patent/KR101457073B1/ko
Publication of KR20140093532A publication Critical patent/KR20140093532A/ko
Application granted granted Critical
Publication of KR101457073B1 publication Critical patent/KR101457073B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명에 따른 산업군에 대한 위기지수 산출방법은 제1 기간 동안의 중분류 산업군에 대한 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행하는 단계; 제2 기간 동안의 상기 중분류 산업군에 대한 m(m은 1보다 크거나 같은 자연수)개의 독립변수들 및 필터링된 상기 종속변수를 사용해 상기 독립변수들이 상기 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 상기 독립변수들에 대해 각각 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 단계; 및 상기 선별 독립변수들 각각의 NTS값들을 사용해 상기 중분류 산업군에 대한 중분류 위기지수를 산출하는 단계를 포함하는 것을 특징으로 한다.

Description

산업군에 대한 위기지수 산출방법 및 장치{A method and an apparatus for calculating crisis index for an industrial estate}
본 발명은 미래의 위기를 예측하기 위한 기술에 관한 것으로, 보다 상세하게는 특정 산업과 관련된 데이터(예 : GDP, 무역수지) 등의 독립변수들을 통해서 여신 상황의 위기임을 상징하는 위기 지표에 해당하는 종속 변수의 차후 움직임을 예측하는 종합위기지수를 산출하기 위한 기술에 관한 것이다.
일반적으로, 여신을 관리하는데 있어서 연체율, 연체발생율은 일종의 위험으로 간주되며 이 수치들이 증가하면 여신 규모를 줄여야 한다.
그러나 위험이 이미 발생한 시점에는 이에 대응하기가 힘들며 미래의 위기를 현재 시점에 감지하는 툴들이 존재하지 않는다는 점에 문제점이 있다.
본 발명이 해결하고자 하는 과제는 수많은 산업지수들을 포함하는 독립변수들 중에서 위기를 판단하는데 있어서 적절한 독립변수들을 선별하고, 이렇게 선별된 독립변수들과 종속변수를 이용하여 해당 산업군에 대한 위기 여부를 판단할 수 있는 종합위기지수를 산출할 수 있도록 하는 산업군에 대한 위기지수 산출방법 및 장치에 관한 것이다.
상기의 과제를 해결하기 위한, 본 발명에 따른 산업군에 대한 위기지수 산출방법은 제1 기간 동안의 중분류 산업군에 대한 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행하는 단계; 제2 기간 동안의 상기 중분류 산업군에 대한 m(m은 1보다 크거나 같은 자연수)개의 독립변수들 및 필터링된 상기 종속변수를 사용해 상기 독립변수들이 상기 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 상기 독립변수들에 대해 각각 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 단계; 및 상기 선별 독립변수들 각각의 NTS값들을 사용해 상기 중분류 산업군에 대한 중분류 위기지수를 산출하는 단계를 포함하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출방법은, 상기 종속변수에 대한 필터링 후에, 상기 독립변수들과 상기 종속변수의 값들 중에서 일정 기준에 누락되어 있는 데이터를 상기 일정 기준에 따라 각각 내삽하는 단계를 더 포함하는 것을 특징으로 한다.
상기 일정 기준은 월별 데이터에 해당하는 것을 특징으로 하며, 상기 독립변수들 및 상기 종속변수가 일별 데이터인 경우에 매월 말일의 데이터를 상기 월별 데이터로 산출하는 것을 특징으로 한다.
상기 독립변수들 및 상기 종속변수가 년도별 데이터 및 분기별 데이터 중 어느 하나인 경우에 큐빅 스플라인(Cubic Spline) 내삽 방식을 사용해, 상기 독립변수들 및 상기 종속변수에 대한 상기 월별 데이터를 산출하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출방법은, 상기 종속변수에 대한 필터링 후에, 상기 독립변수들이 통계 분석을 위한 정상적인 데이터인가 여부에 대해 ADF(Augmented Dicky Fuller) 테스트를 수행하고, 상기 ADF 테스트를 통해 상기 독립변수들 중 비정상적인 데이터를 통계 분석을 위한 정상적인 데이터로 변환하는 단계를 더 포함하는 것을 특징으로 한다.
상기 일정 NTS 기준값을 충족하는 상기 선별 독립변수들을 검출하는 단계는, 상기 종속변수가 위기임을 판단하기 위한 종속변수 위기 기준값을 사용해 상기 종속변수의 위기 여부를 검출하는 단계; 상기 독립변수들 중 i(i는 1보다 크거나 같고 m보다 작거나 같은 자연수)번째 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들 각각을 사용해, 상기 독립변수 위기 기준값들 각각에 대한 상기 i번째 독립변수의 위기 여부를 검출 및 각각의 NTS값들을 산출하는 단계; 상기 산출된 NTS값들 중에서 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당하는가를 판단하는 단계; 상기 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당한다면, 상기 i번째 독립변수를 상기 선별 독립변수들 중 어느 하나로서 검출하는 단계; 및 상기 선별 독립변수들의 검출과정을 종료할 것인가를 판단하는 단계를 포함하는 것을 특징으로 한다.
상기 종속변수의 위기 여부를 검출하는 단계는, 상기 종속변수 위기 기준값을 다음의 수학식을 사용해 산출하는 것을 특징으로 한다.
[수학식]
종속변수 위기 기준값 = 종속변수의 평균 + (k*종속변수의 표준편차)
여기서, k는 사용자 입력값이다.
상기 NTS값들을 산출하는 단계는, 다음의 수학식을 사용해 상기 NTS값들을 산출하는 것을 특징으로 한다.
[수학식]
NTS=(B/(B+D))/(A/(A+C))
여기서, A는 상기 독립변수와 상기 종속변수가 모두 위기에 해당하는 빈도를 의미하고, B는 상기 독립변수가 위기이고 상기 종속변수가 정상에 해당하는 빈도를 의미하고, C는 상기 독립변수가 정상이고 상기 종속변수가 위기에 해당하는 빈도를 의미하고, D는 상기 독립변수와 상기 종속변수가 모두 정상에 해당하는 빈도를 의미한다.
상기 NTS값들을 산출하는 단계는, 상기 복수의 독립변수 위기 기준값들은 상기 i번째 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 사용하고, 상기 i번째 독립변수의 상하방향에 따라 구분하여 상기 NTS값들을 산출하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출방법은, 상기 NTS값들을 산출한 후에, 상기 최소 NTS값을 사용해 상기 i번째 독립변수에 대해 위기, 보류 및 정상 중 어느 하나의 상황으로 분류하여 표시하는 단계를 더 포함하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출방법은, 상기 선별 독립변수들을 검출한 후에, 상기 선별 독립변수들 사이에서 나타나는 다중공선성(Multicollinearity)을 해결하기 위해, 상기 선별 독립변수들에 대해 주성분 분석(Principal Component Analysis)을 수행하여 상기 선별 독립변수들을 펙터들로 그룹화하는 단계; 및 그룹화된 상기 펙터들 및 상기 종속변수를 사용해 상기 NTS(Noise To Signal)값을 상기 펙터들에 대해 각각 산출하고, 산출된 펙터 NTS값들 중에서 상기 일정 NTS 기준값을 충족하는 선별 펙터들을 검출하는 단계를 더 포함하고, 상기 선별 펙터들 각각의 선별 NTS값들을 사용해 상기 중분류 산업군에 대한 상기 중분류 위기지수를 산출하는 것을 특징으로 한다.
상기 산업군에 대한 중분류 위기지수를 산출하는 단계는, 다음의 수학식을 사용해 상기 중분류 위기지수를 산출하는 것을 특징으로 한다.
[수학식]
중분류 위기지수 = ∑(Pi*(1 - NTSi))/∑(1 - NTSi)
여기서, Pi는 i번째 독립변수에 대한 위기 여부를 나타내는 값으로서 위기이면 1이고, 정상이면 0의 값을 갖으며, NTSi는 i번째 독립변수에 대한 NTS값을 의미한다.
상기 산업군에 대한 위기지수 산출방법은, 상기 중분류 위기지수를 산출한 후에, 상기 중분류 위기지수를 사용해 상기중분류 산업군에 대한 위험 등급을 색상으로 구분하여 표시하는 단계를 더 포함하는 것을 특징으로 한다.
상기의 과제를 해결하기 위한 본 발명에 따른, 산업군에 대한 위기지수 산출장치는 중분류 산업군에 대한 m(m은 1보다 크거나 같은 자연수)개의 독립변수들 및 하나의 종속변수에 대한 데이터를 저장하고 있는 데이터베이스; 제1 기간 동안의 상기 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행하는 필터링부; 제2 기간 동안의 상기 독립변수들 및 필터링된 상기 종속변수를 사용해 상기 독립변수들이 상기 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 상기 독립변수들에 대해 각각 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 독립변수 선별 검출부; 상기 선별 독립변수들 각각의 NTS값들을 사용해 상기 중분류 산업군에 대한 중분류 위기지수를 산출하는 중분류 위기지수 산출부; 및 상기 데이터베이스, 상기 필터링부, 상기 독립변수 선별 추출부 및 상기 중분류 위기지수 산출부의 동작을 제어하는 제어부를 포함하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출장치는, 상기 독립변수들과 상기 종속변수의 값들 중에서 일정 기준에 누락되어 있는 데이터를 상기 일정 기준에 따라 각각 내삽하는 내삽 처리부를 더 포함하는 것을 특징으로 한다.
상기 내삽 처리부는 상기 독립변수들 및 상기 종속변수가 일별 데이터인 경우에 매월 말일의 데이터를 상기 월별 데이터로 산출하는 것을 특징으로 한다.
상기 내삽 처리부는 상기 독립변수들 및 상기 종속변수가 년도별 데이터 및 분기별 데이터 중 어느 하나인 경우에 큐빅 스플라인(Cubic Spline) 내삽 방식을 사용해 상기 독립변수들 및 상기 종속변수에 대한 상기 월별 데이터를 산출하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출장치는, 상기 독립변수들이 통계 분석을 위한 정상적인 데이터인가 여부에 대해 ADF(Augmented Dicky Fuller) 테스트를 수행하고, 상기 ADF 테스트를 통해 상기 독립변수들 중 비정상적인 데이터를 통계 분석을 위한 정상적인 데이터로 변환하는 ADF 분석 처리부를 더 포함하는 것을 특징으로 한다.
상기 독립변수 선별 검출부는, 상기 종속변수가 위기임을 판단하기 위한 종속변수 위기 기준값을 사용해 상기 종속변수의 위기 여부를 검출하는 종속변수 위기판단모듈; 상기 독립변수들 중 i(i는 1보다 크거나 같고 m보다 작거나 같은 자연수)번째 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들 각각을 사용해, 상기 독립변수 위기 기준값들 각각에 대한 상기 i번째 독립변수의 위기 여부를 검출 및 각각의 NTS값들을 산출하는 NTS값 산출모듈; 및 상기 산출된 NTS값들 중에서 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당하는가를 판단하고, 상기 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당한다면, 상기 i번째 독립변수를 상기 선별 독립변수들 중 어느 하나로서 검출하는 독립변수 검출모듈을 포함하는 것을 특징으로 한다.
상기 종속변수 위기판단모듈은, 다음의 수학식을 사용해 상기 종속변수 위기 기준값을 산출하는 것을 특징으로 한다.
[수학식]
종속변수 위기 기준값 = 종속변수의 평균 + (k*종속변수의 표준편차)
여기서, k는 사용자 입력값이다.
상기 NTS값 산출모듈은, 다음의 수학식을 사용해 상기 NTS값들을 산출하는 것을 특징으로 한다.
[수학식]
NTS=(B/(B+D))/(A/(A+C))
여기서, A는 상기 독립변수와 상기 종속변수가 모두 위기에 해당하는 빈도를 의미하고, B는 상기 독립변수가 위기이고 상기 종속변수가 정상에 해당하는 빈도를 의미하고, C는 상기 독립변수가 정상이고 상기 종속변수가 위기에 해당하는 빈도를 의미하고, D는 상기 독립변수와 상기 종속변수가 모두 정상에 해당하는 빈도를 의미한다.
상기 NTS값 산출모듈은, 상기 복수의 독립변수 위기 기준값들은 상기 i번째 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 사용하고, 상기 i번째 독립변수의 상하방향에 따라 구분하여 상기 NTS값들을 산출하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출장치는, 상기 최소 NTS값을 사용해 상기 i번째 독립변수에 대해 위기, 보류 및 정상 중 어느 하나의 상황으로 분류하여 표시하는 독립변수 상황표시부를 더 포함하는 것을 특징으로 한다.
상기 산업군에 대한 위기지수 산출장치는, 상기 선별 독립변수들 사이에서 나타나는 다중공선성(Multicollinearity)을 해결하기 위해, 상기 선별 독립변수들에 대해 주성분 분석(Principal Component Analysis)을 수행하여 상기 선별 독립변수들을 펙터들로 그룹화하는 주성분 분석부; 및 그룹화된 상기 펙터들 및 상기 종속변수를 사용해 상기 NTS(Noise To Signal)값을 상기 펙터들에 대해 각각 산출하고, 산출된 펙터 NTS값들 중에서 상기 일정 NTS 기준값을 충족하는 선별 펙터들을 검출하는 펙터 선별 검출부를 더 포함하고, 상기 중분류 위기지수 산출부가 상기 선별 펙터들 각각의 선별 NTS값들을 사용해 상기 중분류 산업군에 대한 상기 중분류 위기지수를 산출하는 것을 특징으로 한다.
상기 중분류 위기지수 산출부는, 다음의 수학식을 사용해 상기 중분류 위기지수를 산출하는 것을 특징으로 한다.
[수학식]
중분류 위기지수 = ∑(Pi*(1 - NTSi))/∑(1 - NTSi)
여기서, Pi는 i번째 독립변수에 대한 위기 여부를 나타내는 값으로서 위기이면 1이고, 정상이면 0의 값을 갖으며, NTSi는 i번째 독립변수에 대한 NTS값을 의미한다.
상기 산업군에 대한 위기지수 산출장치는, 상기 중분류 위기지수를 사용해 상기 중분류 산업군에 대한 위험 등급을 색상으로 구분하여 표시하는 위험등급 표시부를 더 포함하는 것을 특징으로 한다.
본 발명에 따르면, 특정 산업군에 대한 위기 여부에 대해 이전의 산업지수들에 해당하는 독립변수들 및 이에 따른 연체율 등의 종속변수를 사용하여 미래의 위험을 예측할 수 있도록 하는 효과가 있다.
미래의 위험을 예측하기 위한 변수들을 적절히 선별함으로써, 해당 산업군에 대한 위험을 정확히 예측할 수 있다.
해당 산업군에 대한 미래 위험을 사전에 경고함으로써, 현재 시점에서 선제적 대응이 가능하도록 할 수 있다.
도 1은 본 발명에 따른 산업군에 대한 위기지수 산출방법을 설명하기 위한 일 실시예의 플로차트이다.
도 2는 산업군에 대한 대분류 및 중분류의 일 예를 나타내는 참조도이다.
도 3은 불규칙한 종속변수 데이터에 대해 유의미한 데이터로 필터링한 결과를 나타내는 참조도이다.
도 4는 모수의 변화에 따라 달라지는 필터링 결과를 예시한 참조도이다.
도 5는 내삽 방식을 설명하기 위한 일 예의 참조도이다.
도 6은 독립변수 중에서 비정상적인 데이터에 대해 정상적인 데이터로 변환하는 것을 설명하기 위한 일 예의 참조도이다.
도 7은 제106 단계의 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 단계를 설명하기 위한 일 실시예의 플로차트이다.
도 8은 복수의 독립변수 위기기준값들을 사용해, 해당 독립변수에 대한 각각의 NTS값들을 산출한 테이블 정보를 예시한 것이다.
도 9는 독립변수의 위기 여부에 대한 3가지 사황을 독립변수 위기 기준값을 기준으로 하여 분류한 것을 시각적으로 예시한 참조도이다.
도 10은 주성분 분석을 통해 많은 수의 독립변수들을 몇 개의 펙터들로 그룹화한 것을 설명하기 위한 참조도이다.
도 11은 중분류 산업군에 대한 위험 등급을 색상별로 구분하여 한 화면에 표시한 일 예의 참조도이다.
도 12는 본 발명에 따른 산업군에 대한 위기지수 산출장치를 설명하기 위한 일 실시예의 블록도이다.
도 13은 도 12에 도시된 독립변수 선별 검출부를 설명하기 위한 일 실시예의 블록도이다.
본 발명에 따른 산업군에 대한 위기지수 산출방법을 개략적으로 설명하면 다음과 같다.
본 발명은 미래의 위기를 예측하기 위한 것으로, 특정 산업군과 관련된 독립변수 데이터(예를 들어, GDP, 무역수지)를 통해서, 여신 상황의 위기임을 상징하는 위기 지표(종속변수)의 차후의 움직임을 예측하는 것이다. 여신을 관리하는데 있어서 연체율, 연체 발생율은 일종의 위험으로 간주되며 이 수치들이 증가하면 여신 규모를 줄여야 한다. 그러나 위험이 이미 발생한 시점에는 대응하기가 힘들며 미래의 위기를 현재 시점에 감지하여 선제적 대응을 하고자 하는 것이다. 그렇다면 위험을 예측하기 위하여 어떤 방법을 선택할 것인가에 대한 방법을 고안하기 위하여 먼저 다음과 같은 생각을 할 수 있다. 예를 들어, 조선업의 6개월 후의 연체율은 현재 조선업 현황과 분명 밀접한 관련이 있을 것이기 때문이다. 산업군에 포함된 수많은 독립변수들이 위기를 얼마나 잘 찾아내는지를 계산하여 수많은 변수들 중에서 그 중 도움이 될만한 변수들을 골라낸다. 즉 의미 있는 변수만을 선별하여 그것을 조합하여 더 좋은 예측력을 지닌 데이터로 가공하여 위기 지수를 산출하는 것이다.
다음의 표 1은 본원발명을 설명하기 위한 예시적인 참조표이다.
종속변수 기간 2008/7 2008/8 2008/9 2008/10 2008/11 2008/12
종속변수(연체율) 정상/위험 정상 정상 위기 위기 위기 정상
톡립변수 기간 2008/1 2008/2 2008/3 2008/4 2008/5 2008/6
독리변수 1
정상/위험
위기 정상 정상 정상 위기 정상
독립변수 2
정상/위험
정상 위기 위기 위기 위기 정상
상기 표 1은 독립변수 1, 독립 변수 2와 종속변수(연체율) 데이터가 6개월 차이로 배치되어 있다. 어떤 데이터가 특정 경계값보다 높을 경우 '위기'라고 정의하자(예를 들어 연체율이 7%보다 높으면 위기). 연체율의 경우 09월, 10월, 11월에 연체율이 높은 상황, 즉 위기로 정의되어 있다. 그 아래 독립 변수 역시 비슷한 절차로 위기임을 정의하였다. 독립변수 1은 연체율이 위기로 정의된 세 구간 중에 한 구간만이 위험이었지만 독립변수 2는 세 구간 모두 위기로 정의되었다. 이런 결과는 독립변수 2가 독립변수 1보다 6개월 후의 연체율을 더 잘 예측한다고 판단할 수 있으며 독립변수 1을 배제하는 등의 처리를 통해서 예측력을 높일 수 있을 것이다.
이하, 본 발명에 따른 산업군에 대한 위기지수 산출방법을 첨부된 도면을 참조하여 구체적으로 설명한다.
도 1은 본 발명에 따른 산업군에 대한 위기지수 산출방법을 설명하기 위한 일 실시예의 플로차트이다.
제1 기간 동안의 중분류 산업군에 대한 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행한다(제100 단계).
도 2는 산업군에 대한 대분류 및 중분류의 일 예를 나타내는 참조도이다. 도 2에 도시된 바와 같이, 조선 해운업이라는 대분류에 해당하는 산업군은 조선업 및 해운업이라는 중분류에 해당하는 산업군을 포함한다. 즉, 하나의 대분류는 여러 개의 중분류로 나뉜다. 이러한 대분류 산업군 또는 중분류 산업군과 관련된 데이터 중에서 GDP 성장률, 무역지수, 금리, 물가상승률, 유가, 환율, 원자재 가격 등을 산업군에 대한 독립변수로서 칭한다. 한편, 이러한 독립변수에 의해 위험 상황을 나타내는 연체율, 연체 발생율 등의 지표를 종속변수라고 칭한다.
여기서, 제1 기간은 현재 시점을 기준으로 과거의 일정 시점까지의 기간으로 정의할 수 있으며, 예를 들어, 전술한 표 1에서의 연체율에 해당하는 종속변수의 경우에 2008년 7월부터 2008년 12월(현재시점)까지의 6개월의 기간을 제1 기간으로 예시할 수 있다.
종속 변수에 대해 필터링하는 이유는 종속변수(연체율)의 불규칙성이 상당히 크기 때문이다. 이러한 불규치적인 요소를 제거하는 것을 필터링이라 한다.
도 3은 불규칙한 종속변수 데이터에 대해 유의미한 데이터로 필터링한 결과를 나타내는 참조도이다. 도 3에 도시된 바와 같이, 원본 데이터의 불규칙적인 성분을 제거하여 시계열이 다소 평탄해 졌음을 확인할 수 있다. 도 3은 제지업의 종속변수(연체발생률)와 그것을 필터링을 통하여 가공한 데이터를 그래프로 표현한 것이다. 연체발생률이 증가하면 이는 위기로 간주할 수 있다. 이를 위해 위기인지 아닌지를 구분할 수 있는 위기기준을 설정하였다. 도 3에서 살펴보면 2008년 7월 1일부터 2009년 7월 1일까지는 연체발생률이 상당히 높은 '위기'라고 규정할만한 구간이라고 볼 수 있다. 여기서, 원본데이터(필터링 되지 않은 데이터)를 살펴보면 그 구간 중에 이상값이 존재하여, 해당 구간의 경우에는 위기로 식별되지 못하고 있음을 확인할 수 있다. 연체발생률의 경우에 상각 등의 이벤트로 인하여 데이터가 급격히 감소할 수 있으나 이것이 위기를 부정하는 것은 아니기 때문이다. 필터링된 데이터를 살펴보면, 위기가 아니라고 판단될 수 있는 데이터를 적절하게 보정하여 연체발생률이 높은 '위기' 구간으로 설정함을 확인할 수 있다.
도 4는 모수의 변화에 따라 달라지는 필터링 결과를 예시한 참조도이다. 모수는 모집단의 특성을 나타내는 수치로서, 도 4를 살펴보면, 사용자가 모수의 값을 증가시킬수록 데이터를 더욱 평탄하게 변경시킴을 알 수 있다. 따라서 모수를 증가시킨다는 것은 불규칙적인 요소를 더욱 많이 제거시키지만 자칫 데이터를 왜곡시킬 수 있다는 것을 의미한다. 반대로 모수를 감소시킨다는 것은 데이터를 보다 원본에 가깝게 유지시키는 것으로써 데이터 왜곡의 가능성은 적지만 불규칙적인 요소를 비교적 제거하지 못한다는 것을 의미한다. 따라서, 적정 값을 찾는 것이 중요하며, 종속변수 필터링의 경우에는 0.1의 초기값을 사용하는 것이 바람직하다.
제100 단계 후에, 제2 기간 동안의 중분류 산업군에 대한 복수개의 독립변수들의 값들과 상기 필터링된 종속변수의 값 중에서 일정 기준에 누락되어 있는 데이터를 일정 기준에 따라 각각 내삽한다(제102 단계). 일정 기준은 월별 데이터에 해당하는 것으로, 독립변수들 및 종속변수가 일별 데이터인 경우에 매월 말일의 데이터를 월별 데이터로 산출하며, 독립변수들 및 종속변수가 년도별 데이터 및 분기별 데이터 중 어느 하나인 경우에 큐빅 스플라인(Cubic Spline) 내삽 방식을 사용해, 독립변수들 및 종속변수에 대한 월별 데이터를 산출한다.
여기서, 제2 기간은 제1 기간과 대비하기 위한 기간으로, 과거 일정 시점을 기준으로 그 이전의 대과거의 일정 시점까지의 기간으로 정의할 수 있다. 예를 들어, 전술한 표 1에서의 독립변수 1 또는 2의 경우에 2008년 1월부터 2008년 6월까지의 6개월의 기간을 제2 기간으로 예시할 수 있다.
독립변수들은 동일한 시간간격(예를 들어, 월별)을 지닌 데이터이어야 한다. 그러나 'GDP 성장률'에 해당하는 독립변수는 년도별로 공시되는 반면에 '원유가격'에 해당하는 독립변수는 일별로 공시된다. 또한 데이터 중에서는 누락이 되어 있거나, 필요로 하는 구간이 아닌 그 이후의 기간부터 공시되는 경우에는 필요로 하는 독립변수의 데이터를 채워 넣는 작업이 필요하다. 이를 해결하기 위한 것이 내삽(Interpolation)이라 하며, 누락된 데이터의 시간적 연속성을 유지하도록 하는 것이다.
여기서, 독립변수가 일별 데이터의 경우 동일한 월 내의 어떤 데이터를 해당 월을 대표하는 데이터로 사용할 것인가에 대한 문제로 귀결되며, 독립변수가 연도별, 분기별 데이터인 경우에는 그 사이의 각 월별 데이터를 어떤 데이터로 채울 것인가에 대한 문제로 귀결된다.
일별 데이터의 경우에는 데이터에 대한 매월 마지막 데이터를 그 월의 대표 데이터로 취급할 수 있다. 즉, 매월 말일 데이터를 선택하며 나머지 데이터는 버린다. 이런 방식 외에 평균을 취하는 방식이 있을 수 있으나 본 발명에서는 해당 월을 가장 잘 표현하는 데이터로서 매월의 마지막에 공시된 값을 대표성이 있는 데이터로 취급한다.
연도별 또는 분기별 데이터의 경우에는 데이터 내삽 방식을 사용하는데, 내삽을 위한 하나의 방식 중에서 큐빅 스플라인 방식(Cubic Spline Method)을 사용한다. 도 5는 내삽 방식을 설명하기 위한 일 예의 참조도이다. 도 5에 도시된 바와 같이, Cubic Spline의 가장 큰 특징은 각 점(존재하는 데이터)와 점 사이를 2차 함수로 연결시키되 기울기까지 고려하여 최대한 부드럽게 함수를 결정하는 것이다. 도 5에서, 2011년 7월 데이터와 2011년 9월 데이터는 존재하지만 2011년 8월 데이터가 존재하지 않으므로, 이 데이터를 구해야 한다. 따라서 2011년 8월 위치 전후의 두 점을 부드럽게 연결시키는 함수를 통해서 그 사이의 특정 값을 2011년 8월의 값으로 결정하는 것이다. 이런 방식으로 누락되어 있는 데이터나 공시되지 않은 구간의 데이터를 모두 추정할 수 있으며 년, 분기 데이터를 모두 월별 데이터로 변경시킬 수 있다. 위와 같은 절차를 통하여 형식이 다른 데이터들을 동일한 시간 간격을 갖는 데이터들로 정렬할 수 있다. 이때 종속변수와 독립변수의 시간을 사용자로부터 입력받는 제1 시간 및 제2 시간 간격을 유지하여 데이터를 배치한다.
제102 단계 후에, 필터링 및 내삽 처리된 독립변수들이 통계 분석을 위한 정상적인 데이터인가 여부에 대해 ADF(Augmented Dicky Fuller) 테스트를 수행하고, 상기 ADF 테스트를 통해 독립변수들 중 비정상적인 데이터를 통계 분석을 위한 정상적인 데이터로 변환한다(제104 단계).
독립변수들 중에서 과연 이 데이터가 통계적으로 분석할 만한 가치가 있는 정상적인 데이터인지 여부를 확인하기 위하여 정상성 테스트 즉, ADF(Augmented Dicky Fuller) 테스트를 수행한다. 여기서 정상성이란 통계학 용어로서, 과거의 데이터가 미래의 값을 추정할 수 있는 패턴을 갖고 있는지 여부를 테스트하는 것이다. ADF 테스트 결과 이러한 테스트를 통과하는 독립변수들에 대해서는 별다른 데이터 변환을 하지 않지만, ADF 테스트를 통과하지 못하는 데이터는 분석할 가치가 없는 데이터에 해당한다. 따라서, 이러한 데이터에 대해서 정상적인 데이터로 변환한다는 것은 미래값의 추정이 가능한 패턴을 갖는 값으로 변환하는 것을 의미한다. 이러한 변환의 한 방식으로 독립변수 데이터에 대한 변화율에 해당하는 값으로 변환한다.
도 6은 독립변수 중에서 비정상적인 데이터에 대해 정상적인 데이터로 변환하는 것을 설명하기 위한 일 예의 참조도이다. 원본데이터(독립변수) A는 대체로 상승추세에 있는 데이터이기 때문에 이것을 위기 구간과 비위기구간으로 나뉘어 분석하기가 용이하지 않다. 그러나 원본 데이터 A의 변화값을 새로운 데이터로 간주하여 그래프를 그려보면 분석이 가능한 데이터로 바뀌었음을 확인할 수 있다. 예를 들어, 위와 같은 처리는 '국내총생산' 라는 데이터를 사용하는 대신에 '국내총생산 변화율'을 사용하는 것과 같은 의미이다.
다음의 표 2는 비정상적인 데이터를 미래 추정이 가능한 정상적인 데이터로 변환한 일 예를 나타내는 참조표이다.
날짜 비정상적인 독립변수 정상적인 독립변수
2011년 2월 10 없음
2011년 3월 15 5 (15-10)
.... .... ....
2011년 8월 20 7
2011년 9월 15 -5
표 2는 비정상적인 독립변수를 그것의 변화값으로 변경시켜 정상적인 독립변수로 변환한 것을 예시한 것이다. 이 과정에서 비정상적인 독립변수는 정상적인 독립변수보다 최초의 데이터가 존재하지 않음으로 인해 데이터 하나가 줄어드는 것을 확인할 수 있다. 이는 비정상적인 독립변수의 변화값을 검출함에 야기되는 것으로, 독립변수들과 종속변수의 데이터 숫자를 동일하게 유지시키기 위하여 모든 변수들의 첫 데이터는 배제한다.
제104 단계 후에, 독립변수들 및 필터링된 종속변수를 사용해, 독립변수들이 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 독립변수들각각에 대해 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출한다(제106 단계). NTS란 Noise to signal 의 약자로 해당 독립변수의 위기 식별 능력을 나타내는 값이다.
도 7은 제106 단계의 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 단계를 설명하기 위한 일 실시예의 플로차트이다.
종속변수가 위기임을 판단하기 위한 종속변수 위기 기준값을 사용해 상기 종속변수의 위기 여부를 검출한다(제200 단계). 종속변수 위기 기준값을 산출하기 위해 다음의 수학식 1을 사용한다.
Figure 112013005311479-pat00001
여기서, k는 사용자 입력값이다. 종속변수의 경우 연체율, 연체발생율과 같이 값이 커질수록 위기에 가까워지는 데이터들이 사용된다. 따라서 본 발명에서는 종속변수가 투입되는 데이터의 평균보다 얼마나 더 큰 값인가를 기준으로 위기임을 판별한다. 여기서, 종속변수 위기 기준값은 데이터의 표준편차를 사용하며, 표준편차의 몇 배수를 위기로 지정할 것인가에 대해서는 사용자 입력값에 따라 결정된다.
제200 단계 후에, 상기 독립변수들 중 어느 하나의 독립변수에 대해 해당 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들 각각을 사용해, 상기 독립변수 위기 기준값들 각각에 대한 상기 i번째 독립변수의 위기 여부를 검출 및 각각의 NTS값들을 산출한다(제202 단계). 해당 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들은 해당 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 각각 사용한다.
복수의 독립변수 위기기준값들 각각에 대한 NTS값들은 다음의 수학식 2를 사용해 산출한다.
Figure 112013005311479-pat00002
여기서, A는 상기 독립변수와 상기 종속변수가 모두 위기에 해당하는 빈도를 의미하고, B는 상기 독립변수가 위기이고 상기 종속변수가 정상에 해당하는 빈도를 의미하고, C는 상기 독립변수가 정상이고 상기 종속변수가 위기에 해당하는 빈도를 의미하고, D는 상기 독립변수와 상기 종속변수가 모두 정상에 해당하는 빈도를 의미한다.
표 3은 독립변수와 종속변수 사이의 위기 및 정상에 대한 빈도를 표로 예시한 것이다.
종속변수 위기 독립변수 정상
독립변수 위기 A B
독립변수 정상 C D
NTS=(B/(B+D))/(A/(A+C)) [A, B, C, D는 각 상황의 빈도]
전술한 표 1의 데이터를 사용하여 NTS의 계산과정을 살펴본다. 먼저, 독립변수 1의 상황에 따른 빈도 즉, A, B, C, D 는 각각 1, 1, 2, 2이므로, 수학식 2를 사용해 독립변수 1의 NTS값을 산출하면 1이 된다. 한편, 독립변수 2의 A, B, C, D 는 각각 3, 1, 0, 2이므로, 수학식 2를 사용해 독립변수 2의 NTS값을 산출하면 4/9가 된다. 따라서, 독립변수 2의 NTS값이 독립변수 1의 NTS값보다 더 작게 나오는 것을 확인할 수 있다. NTS값의 의미를 파악해 보자면 B(종속변수의 위험을 예상하지 못한 경우)의 빈도가 클수록 값이 증가하며, A(종속변수의 위험을 예상한 경우)의 빈도가 클수록 값이 감소하는 것을 확인할 수 있다. 따라서 NTS가 작을수록 예측력이 큰 독립변수라고 볼 수 있다.
독립변수의 경우 임의의 위기 기준값들에 대해서 NTS값을 각각 구하고 가장 작은 NTS값을 도출한 위기기준과 방향성을 채택한다.
도 8은 복수의 독립변수 위기 기준값들을 사용해, 해당 독립변수에 대한 각각의 NTS값들을 산출한 테이블 정보를 예시한 것이다. 도 8에서 보는 바와 같이, 독립변수의 최대값과 최소값을 사용자로부터 입력받은 개수만큼의 구간으로 나누어 주고, 나뉘어진 각 구간을 독립변수 위기 기준값으로 각각 설정한다. 즉, 독립변수 중 최소값 10과 최대값 40 사이를 4개의 구간으로 나눈다면, 10, 20, 30 및 40을 각각 독립변수 위기 기준값으로 설정할 수 있다. 이렇게 설정된 독립변수 위기 기준값 각각과 임의의 독립변수의 데이터를 비교하여 설정된 독립변수 위기 기준값을 벗어나는 데이터에 대해 위기로 판단하고, 설정된 독립변수 위기 기준값을 벗어나지 않는 데이터에 대해서는 정상으로 판단한다. 독립변수의 각 데이터에 대한 위기 또는 정상 여부를 검출한 후에, 독립변수의 방향에 대해 상방 또는 하방으로 구분하여 전술한 수학식 2를 이용하여 각각의 NTS값들을 산출한다. 도 8에서는 독립변수 위기 기준값들이 10, 20, 30 및 40이고, 독립변수의 방향이 상방(UP) 및 하방(DOWN)인 것에 따라 각각의 NTS값의 산출된 결과를 보여주고 있다. 한편, 각 독립변수의 방향성 선택을 사용자의 선택에 의해 적용할 수도 있고 적용하지 않을 수 있도록 한다. 만약 독립변수가 상방으로 지정받았다면, 이 독립변수는 상방에 대해서만 NTS값을 산출한다. 그 외에 방향성을 지정받지 않은 독립변수는 상방 및 하방모두에 대해서 NTS값을 산출한다.
제202 단계 후에, 상기 산출된 NTS값들 중에서 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당하는가를 판단한다(제204 단계). 제202 단계에서 산출된 NTS값들 중에서 최소 NTS값을 검출한다. 예를 들어, 도 8에 도시된 바와 같이, 산출된 모든 NTS값들 중에서 독립변수 위기 기준값이 '30'에 해당하고, 방향성이 '하방(DOWN)'에 해당하는 경우에, 최소의 NTS값 0.3이 산출됨을 확인할 수 있다. 이렇게 산출된 최소 NTS값이 사용자에 의해 설정된 일정 NTS 기준값 이하인가를 판단한다. 여기서, 일정 NTS 기준값은 위기 산출을 위한 변수로서 독립변수가 갖추어야할 NTS값의 임계치에 해당한다. 따라서, 최소 NTS값이 일정 NTS 기준값 이하에 해당하지 않는다면, 해당 독립변수는 위기 산출을 위한 적절한 독립변수에 해당하지 않는 것이므로 위기 지수 산출을 위한 변수에서 배제된다. 본 발명에서는 일정 NTS 기준값을 '1'로 권장하고 있는데, 그 이유는 NTS값이 '1'을 넘을 경우에는 예측 비율보다 예측하지 못한 비율이 더 크기 때문이다.
제204 단계 후에, 최소 NTS값이 일정 NTS 기준값 이하에 해당한다면, 해당 독립변수를 선별 독립변수로서 검출한다(제206 단계). 최소 NTS값이 일정 NTS 기준값 이하에 해당한다면, 해당 독립변수는 위기 산출을 위한 적절한 독립변수에 해당하는 것이므로 위기 지수 산출을 위한 변수 즉, 선별 독립변수로 판단한다. 로직에서는 이 값의 초기값을 1로 권장하고 있는데 이 이유는 NTS 가 1을 넘는다는 것은 예측 비율보다 예측하지 못한 비율이 더 크다는 의미이기 때문이다.
제206 단계 후에, 상기 선별 독립변수들의 검출과정을 종료할 것인가를 판단한다(제208 단계). 아직 독립변수들에 대한 검출 과정이 종료되지 않았다면, 전술한 제202 단계로 진행하여 전술한 과정을 반복하게 되며, 선별 독립변수를 검출하는 과정이 종료되었다면, 제108 단계로 진행한다.
제106 단계 후에, 최소 NTS값을 사용해 해당 독립변수에 대해 위기, 보류 및 정상 중 어느 하나의 상황으로 분류하여 표시한다(제108 단계).
제106 단계에서 독립변수의 위기 여부를 산출하였으로, 각 시점별 위기 여부를 표시할 수 있다. 각 시점별 위기 여부를 '위기', '보류' 및 '정상'이라는 3가지 신호등 색깔로 구분하여 표시한다. 도 9는 독립변수의 위기 여부에 대한 3가지 사황을 독립변수 위기 기준값을 기준으로 하여 분류한 것을 시각적으로 예시한 참조도이다.
각각 위기, 보류, 정상의 상황을 Red(위기), Yellow(보류), Green(정상)에 매칭시킨다. 여기서 Y(보류)로 얼마나 많이 판단할 것인가에 대해서 사용자 입력 값을 받는다. 각 R, Y, G는 다음의 수학식 3 내지 5를 사용하여 분류한다.
Figure 112013005311479-pat00003
Figure 112013005311479-pat00004
Figure 112013005311479-pat00005
여기서, 위기간격이란 NTS값의 독립변수 위기기준값을 구하기 위하여 독립변수의 최대값 최소값의 차이를 나눈 간격을 의미한다. 도 9에 도시된 바와 같이, 사용자 입력값이 증가할수록 Y로 판별되는 경우가 많아진다.
전술한 수학식 3 내지 5는 방향성이 상방일 경우(값이 증가할수록 위기)의 예시이며, 만일, 방향성이 하방(값이 작아질수록 위기)이라면 위 수식의 부등호는 반대가 된다.
제108 단계 후에, 상기 선별 독립변수들 사이에서 나타나는 다중공선성(Multicollinearity)을 해결하기 위해, 상기 선별 독립변수들에 대해 주성분 분석(PCA:Principal Component Analysis)을 수행하여 상기 선별 독립변수들을 펙터들로 그룹화한다(제110 단계).
선별된 독립변수들을 통해서 미래의 위기를 나타낼 수 있는 하나의 지수를 생성해야 한다. 그러나 선별된 독립변수들을 단순한 산술계산(예를 들어 평균)으로 지수를 생성하는 것은 다중공선성의 문제가 존재한다. 이를 해결하기 위하여 주성분 분석을 사용한다.
먼저, 선별된 독립변수들에 대해 주성분 분석이 사용되어야 하는 이유를 다음의 표 4를 참조하여 설명한다.
독립변수 종류 2012년 7월 2012년 8월 2012년 9월 2012년 10월
건설업 BSI 전망(업황전망) 6.5 8 9 11
건설업 BSI 전망(업황전망) 6.4 7.4 9.5 12
건설업 BSI 전망(업황전망) 5.9 6.7 9.2 10
환율 1300 1100 1000 1100
건설업의 위기를 예측하기 위하여 업황전망, 자금사전전망, 인력사정전망 및 환율 네 가지 독립변수를 사용한다고 가정한다. 이 네 가지는 모두 NTS값이 기준치보다 작았기 때문에 데이터에서 누락되지 않는다. 위의 세 종류의 데이터는 모두 [건설업 BSI 전망]으로 비슷한 성질의 데이터이기 때문에 유사한 움직임을 보인다. 사실상 세 개의 데이터는 값은 다소 다를 수 있으나 하나의 데이터나 마찬가지인 셈이다. 만일, 위 네 가지 독립변수에 균등한 비중을 부여한다면, 건설업 BSI라는 데이터가 '3'의 비중이라면 환율은 '1'의 비중을 갖게 된다. 이는 환율의 예측력을 상대적으로 과소평가하게 된다. 이와 같은 문제를 통계학적으로 다중공선성 문제라 한다. 그리고 이를 해결하기 위해 비슷하게 움직이는 데이터를 한 덩어리로 취급하는 방식이 주성분 분석(PCA)이다. 즉, 주성분 분석(PCA)은 공통되는 데이터를 갖는 복수개의 독립변수들에 대해 하나의 펙터(Factor)로 그룹화함으로써, 다중공선성 문제를 해결한다.
도 10은 주성분 분석을 통해 많은 수의 독립변수들을 몇 개의 펙터들로 그룹화한 것을 설명하기 위한 참조도이다. 도 10에 도시된 바와 같이, 주성분 분석은 수백 종류의 독립변수들(도 10의 (a))을 몇 개의 중요한 펙터들(도 10의 (b))로 그룹화한다. 즉, 종류가 축소된 또 다른 시계열 데이터 테이블을 만드는 것이다. 따라서, 주성분 분석을 통해서 계산된 펙터들을 위기 지수 산출을 위한 새로운 독립변수로 취급한다.
제110 단계 후에, 그룹화된 펙터들 및 종속변수를 사용해, 각 펙터들에 대한 각각의 NTS(Noise To Signal)값을 산출하고, 산출된 펙터 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 펙터들을 검출한다(제112 단계). 각 펙터들에 대한 각각의 펙터 NTS(Noise To Signal)값을 산출하는 과정은 전술한 제202 단계에서의 독립변수들에 대한 각각의 NTS값들을 산출하는 과정과 동일한 것으로, 복수의 펙터 위기 기준값들에 대한 해당 펙터의 위기 여부를 검출하고, 검출된 위기 여부에 따라 각각의 펙터 NTS값들을 산출한다.
그 후, 산출된 펙터 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 펙터들을 검출하는 과정은 전술한 제204 단계 및 제206 단계와 동일한 것으로, 산출된 펙터 NTS값들 중에서 최소 펙터 NTS값이 일정 NTS 기준값 이하에 해당하는가를 판단하고, 최소 펙터 NTS값이 일정 NTS 기준값 이하에 해당한다면, 해당 펙터를 선별 펙터로서 검출한다
제112 단계 후에, 선별 펙터들 각각의 선별 NTS값들을 사용해 중분류 산업군에 대한 중분류 위기지수를 산출한다(제114 단계). 산업군에 대한 중분류 위기지수는 다음의 수학식 6을 사용해 산출한다.
Figure 112013005311479-pat00006
여기서, Pi는 i번째 펙터(또는 독립변수)에 대한 위기 여부를 나타내는 값으로 위기이면 1이고, 정상이면 0의 값을 갖는다. NTSi는 i번째 펙터(또는 독립변수)에 대한 펙터 NTS값(또는 NTS값)을 의미한다.
펙터 NTS값(또는 NTS값) 자체는 작을수록 예측력이 좋은 펙터(또는 독립변수)이므로 (1-NTS)는 값이 클수록 예측력이 좋다는 것을 의미한다. 따라서 해당 시점 펙터의 위기 여부를 예측력에 대한 비중을 반영하여 점수를 계산하는 것이다.
중분류 위기지수를 산출하기 위한 과정을 설명하기 위해, 다음의 표 5 및 6을 예시한다.
최소 펙터 NTS값 방향성 펙터(독립변수)위기 기준값
펙터 1 0.5 UP 10
펙터 2 0.8 DOWN 5
펙터 3 0.9 UP 8
표 5는 펙터는 세 종류가 주성분 분석에 의하여 추출되었으며, 펙터 위기 기준값을 기준으로 하여 최소 펙터 NTS값을 산출한 결과를 예시한 것이다.
2011년 1월 2011년 2월 2011년 3월
펙터 1 11 (위기) 9 (정상) 8 (정상)
펙터 2 6 (위기) 6 (위기) 4 (정상)
펙터 3 4 (정상) 6 (정상) 9 (위기)
표 6은 각 펙터들에 대한 각각의 펙터 데이터 및 이에 따른 위기/정상 여부를 예시한 것으로, 해당 펙터 데이터를 표 5의 펙터 위기 기준값과 각각 비교함으로써, 해당 펙터에 대한 정상 또는 위기임을 표시한 것이다.
표 6의 펙터 데이터를 기초로 하여 2011년 1월, 2011년 2월, 2011년 3월의 중분류 위기지수를 전술한 수학식 6을 사용하여 계산하면 다음과 같다.
2011년 1월 중분류 위기지수 :
Figure 112013005311479-pat00007
,
2011년 2월 중분류 위기지수 :
Figure 112013005311479-pat00008
,
2011년 3월 중분류 위기지수 :
Figure 112013005311479-pat00009
중분류 위기지수의 산출 결과를 해석하면, 시간이 지날수록 위기지수가 낮아지고 있으므로 미래의 위기(예를 들어, 여신 상황)이 개선되고 있다고 판단할 수 있다.
제114 단계 후에, 상기 중분류 위기지수를 사용해 상기 중분류 산업군에 대한 위험 등급을 색상으로 구분하여 표시한다(제116 단계). 각각의 중분류 산업군에 대해, 전술한 제100 단계 내지 제114 단계를 수행함으로써, 해당 시점에 대한 중분류 산업군의 위험 상황 여부를 등급으로 구분한다. 이러한 등급 구분은 사용자의 필요에 따라, 5 내지 10등급 등으로 구분할 수 있다.
도 11은 중분류 산업군에 대한 위험 등급을 색상별로 구분하여 한 화면에 표시한 일 예의 참조도이다. 도 11에 도시된 바와 같이, 약 100개의 중분류 산업군에 대하여 위험 등급을 중분류 위기지수에 따라 각각 분류하고, 분류된 위험 등급에 따라 색상을 달리하여 한 화면에 표시함으로써, 중분류 산업군에 대한 산업 전반적인 위험 상황(여신 상황)을 한눈에 볼 수 있도록 한다. 여기서, 위험등급 산출은 다음의 수학식 7을 사용하여 산출한다.
Figure 112013005311479-pat00010
위험 등급은 연체율을 예측하고자 한 위기 지수와 현재 연체율의 상황을 가중평균한 결과로 볼 수 있다. 중분류 위기지수를 바로 위험 등급으로 사용하지 않고 수학식 7을 사용해 위험 등급을 산정한 이유는 다음과 같다. 즉, 중분류 위기지수는 디지털적인 속성을 갖는다. 이는 중분류 위기지수 산출을 위해 사용된 종속변수인 연체발생률이 극단적으로 점프현상이 존재하는 데이터이기 때문이다. 따라서, 이러한 디지털적인 속성을 완화하고 위험 등급의 연속성을 확보하기 위해 수학식 7을 사용해 위험 등급을 산출한다. 전술한 수학식 7의 위험 등급 산출을 위해 사용되는 중분류 산업군의 3개월 위기지수의 최대값, 3개년 연체율 평균등급, 3개월 연체율 평균등급은 예시적인 것으로, 필요에 따라 개월수 및 년수를 달리하거나, 최대값 대신에 평균값을 사용할 수도 있다.
제116 단계 후에, 산출된 중분류 산업군과 다른 중분류 산업군들을 포함하는 대분류 산업군에 대한 대분류 위기지수를 산출한다(제118 단계). 도 2에 도시된 바와 같이, 하나의 대분류 산업군(조선해운업)은 여러 개의 중분류 산업군(조선업 및 해운업 등)으로 나뉜다. 이러한 대분류 산업군에 대한 위기지수를 중분류 산업군에 대한 각각의 중분류 위기지수와 해당 중분류 산업군의 여신규모를 고려하여 산출한다. 대분류 위기지수는 대분류에 포함되는 중분류 위기지수에 중분류 산업군의 여신규모를 반영한 가중평균이다.
이하, 본 발명에 따른 산업군에 대한 위기지수 산출장치를 첨부된 도면을 참조하여 구체적으로 설명한다.
도 12는 본 발명에 따른 산업군에 대한 위기지수 산출장치를 설명하기 위한 일 실시예의 블록도로서, 데이터베이스(200), 필터링부(202), 내삽 처리부(204), ADF 분석 처리부(206), 독립변수 선별 검출부(208), 독립변수 상황 표시부(210), 주성분 분석부(212), 펙터 선별 검출부(214), 중분류 위기지수 산출부(216), 위험등급 표시부(218), 대분류 위기지수 산출부(220) 및 제어부(222)를 포함한다.
데이터베이스(200)는 각각의 중분류 산업군에 대한 복수개의 독립변수들 및 종속변수에 대한 데이터를 저장하고 있다. 또한, 데이터베이스(200)는 중분류 산업군 각각에 대한 여신 규모 등에 대한 데이터를 포함하고 있다. 또한, 도 2에 도시된 바와 같이, 데이터베이스(200)는 중분류 산업군을 포함하는 대분류 산업군에 대한 계층 구조에 대한 정보 등을 포함하고 있다.
필터링부(202)는 제1 기간 동안의 상기 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행한다. 제1 기간은 현재 시점을 기준으로 과거의 일정 시점까지의 기간으로 정의할 수 있으며, 예를 들어, 전술한 표 1에서의 연체율에 해당하는 종속변수의 경우에 2008년 7월부터 2008년 12월(현재시점)까지의 6개월의 기간을 제1 기간으로 예시할 수 있다.
모수는 모집단의 특성을 나타내는 수치로서, 모수의 값이 증가할수록 데이터가 평탄화된다. 따라서 모수를 증가시킨다는 것은 불규칙적인 요소를 더욱 많이 제거시키지만 자칫 데이터를 왜곡시킬 수 있으므로, 적정 모수를 정하는 것이 바람직하다. 본 발명의 필터링부(202)는 0.1의 초기값을 사용한다.
내삽 처리부(204)는 제2 기간 동안의 중분류 산업군에 대한 복수개의 독립변수들의 값들과 상기 필터링된 종속변수의 값 중에서 일정 기준에 누락되어 있는 데이터를 일정 기준에 따라 각각 내삽한다. 제2 기간은 제1 기간과 대비하기 위한 기간으로, 과거 일정 시점을 기준으로 그 이전의 대과거의 일정 시점까지의 기간으로 정의할 수 있다. 예를 들어, 전술한 표 1에서의 독립변수 1 또는 2의 경우에 2008년 1월부터 2008년 6월까지의 6개월의 기간을 제2 기간으로 예시할 수 있다.
내삽 처리부(204)는 독립변수들 및 종속변수가 일별 데이터인 경우에 매월 말일의 데이터를 월별 데이터로 산출한다. 즉, 내삽 처리부(204)는 매월 말일 데이터를 선택하며 나머지 데이터는 버린다.
또한, 내삽 처리부(204)는 독립변수들 및 종속변수가 년도별 데이터 및 분기별 데이터 중 어느 하나인 경우에 큐빅 스플라인(Cubic Spline) 내삽 방식을 사용해, 독립변수들 및 종속변수에 대한 월별 데이터를 산출한다. 도 5에 도시된 바와 같이, 2011년 7월 데이터와 2011년 9월 데이터는 존재하지만 2011년 8월 데이터가 존재하지 않으므로, 내삽 처리부(204)는 존재하지 않는 데이터에 대해, 2011년 8월 위치 전후의 두 점을 부드럽게 연결시키는 함수를 통해서 그 사이의 특정 값을 2011년 8월의 값으로 산출한다.
ADF 분석 처리부(206)는 상기 독립변수들이 통계 분석을 위한 정상적인 데이터인가 여부에 대해 ADF(Augmented Dicky Fuller) 테스트를 수행하고, 상기 ADF 테스트를 통해 상기 독립변수들 중 비정상적인 데이터를 통계 분석을 위한 정상적인 데이터로 변환한다.
ADF 분석 처리부(206)는 독립변수들 중에서 과연 이 데이터가 통계적으로 분석할 만한 가치가 있는 정상적인 데이터인지 여부를 확인하기 위하여 정상성 테스트 즉, ADF(Augmented Dicky Fuller) 테스트를 수행한다. ADF 분석 처리부(206)는 ADF 테스트 결과 이러한 테스트를 통과하는 독립변수들에 대해서는 별다른 데이터 변환을 하지 않지만, ADF 테스트를 통과하지 못하는 데이터에 대해서는 미래값의 추정이 가능한 패턴을 갖는 값으로 변환한다.
독립변수 선별 검출부(208)는 제2 기간 동안의 상기 독립변수들 및 필터링된 상기 종속변수를 사용해 상기 독립변수들이 상기 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 상기 독립변수들에 대해 각각 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출한다.
도 13은 도 12에 도시된 독립변수 선별 검출부를 설명하기 위한 일 실시예의 블록도로서, 종속변수 위기판단모듈(300), NTS값 산출모듈(302) 및 독립변수 검출모듈(304)을 포함한다.
종속변수 위기판단모듈(300)은 상기 종속변수가 위기임을 판단하기 위한 종속변수 위기 기준값을 사용해 상기 종속변수의 위기 여부를 검출한다. 종속변수 위기판단모듈(300)은 전술한 수학식 1을 사용해 상기 종속변수 위기 기준값을 산출한다. 종속변수의 경우 연체율, 연체 발생율과 같이 값이 커질수록 위기에 가까워지는 데이터들이 사용된다. 여기서, 종속변수 위기판단모듈(300)은 종속변수 위기 기준값으로서 데이터의 표준편차를 사용하며, 표준편차의 몇 배수를 위기로 지정할 것인가에 대해서는 사용자 입력값에 따라 결정한다. 종속변수 위기판단모듈(300)은 종속변수가 투입되는 데이터의 평균보다 얼마나 더 큰 값인가를 기준으로 위기임을 판별한다.
NTS값 산출모듈(302)은 독립변수들 중 임의의 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들 각각을 사용해, 독립변수 위기 기준값들 각각에 대한 해당 독립변수의 위기 여부를 검출 및 각각의 NTS값들을 산출한다. NTS값 산출모듈(302)은 해당 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들은 해당 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 각각 사용한다. NTS값 산출모듈(302)은 전술한 수학식 2를 사용해 NTS값들을 산출한다.
NTS값 산출모듈(302)은 상기 복수의 독립변수 위기 기준값들은 상기 i번째 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 사용하고, 상기 i번째 독립변수의 상하방향에 따라 구분하여 상기 NTS값들을 산출한다. NTS값은 작을수록 예측력이 큰 독립변수라 할 수 있다.
독립변수의 경우 임의의 위기 기준값들에 대해서 NTS값을 각각 구하고 가장 작은 NTS값을 도출한 위기기준과 방향성을 채택한다. 도 8에서 보는 바와 같이, NTS값 산출모듈(302)은 독립변수의 최대값과 최소값을 사용자로부터 입력받은 개수만큼의 구간으로 나누어 주고, 나뉘어진 각 구간을 독립변수 위기 기준값으로 각각 설정한다. 즉, 독립변수 중 최소값 10과 최대값 40 사이를 4개의 구간으로 나눈다면, 10, 20, 30 및 40을 각각 독립변수 위기 기준값으로 설정할 수 있다. 이렇게 설정된 독립변수 위기 기준값 각각과 임의의 독립변수의 데이터를 비교하여 설정된 독립변수 위기 기준값을 벗어나는 데이터에 대해 위기로 판단하고, 설정된 독립변수 위기 기준값을 벗어나지 않는 데이터에 대해서는 정상으로 판단한다. NTS값 산출모듈(302)은 독립변수의 각 데이터에 대한 위기 또는 정상 여부를 검출한 후에, 독립변수의 방향에 대해 상방 또는 하방으로 구분하여 전술한 수학식 2를 이용하여 각각의 NTS값들을 산출한다. 한편, NTS값 산출모듈(302)은 각 독립변수의 방향성 선택을 사용자로부터 입력받으면, 사용자에 의해 지정된 방향에 대해서만 NTS값을 산출한다.
독립변수 검출모듈(304)은 상기 산출된 NTS값들 중에서 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당하는가를 판단하고, 상기 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당한다면, 해당 독립변수를 상기 선별 독립변수들 중 어느 하나로서 검출한다. 독립변수 검출모듈(304)은 산출된 NTS값들 중에서 최소 NTS값을 검출한다. 독립변수 검출모듈(304)은 산출된 최소 NTS값이 미리 설정된 일정 NTS 기준값 이하인가를 판단한다. 여기서, 일정 NTS 기준값은 위기 산출을 위한 변수로서 독립변수가 갖추어야할 NTS값의 임계치에 해당한다. 최소 NTS값이 일정 NTS 기준값 이하에 해당하지 않는다면, 독립변수 검출모듈(304)은 해당 독립변수에 대해 위기 산출을 위한 적절한 독립변수에 해당하지 않는 것이므로 판단하여 위기 지수 산출을 위한 변수에서 배제시킨다. 그러나, 최소 NTS값이 일정 NTS 기준값 이하에 해당한다면, 독립변수 검출모듈(304)은 해당 독립변수를 선별 독립변수로서 검출한다최소 NTS값이 일정 NTS 기준값 이하에 해당한다면, 독립변수 검출모듈(304)은 해당 독립변수에 대해 위기 산출을 위한 적절한 독립변수에 해당하는 것으로 판단하여, 위기 지수 산출을 위한 선별 독립변수로 결정한다. 이렇게, 독립변수 검출모듈(304)은 중분류 산업군에 대한 모든 독립변수들에 대한 선별 독립변수 검출과정을 수행한다.
독립변수 상황 표시부(210)는 상기 최소 NTS값을 사용해 상기 i번째 독립변수에 대해 위기, 보류 및 정상 중 어느 하나의 상황으로 분류하여 표시한다.
독립변수 상황 표시부(210)는 각 시점별 위기 여부를 '위기', '보류' 및 '정상'이라는 3가지 신호등 색깔로 구분하여 표시한다. 독립변수 상황 표시부(210)는 각각 위기, 보류, 정상의 상황을 Red(위기), Yellow(보류), Green(정상)에 매칭시킨다. 독립변수 상황 표시부(210)는 전술한 수학식 3 내지 5를 사용해 R, Y, G를 분류한다.
주성분 분석부(212)는 상기 선별 독립변수들 사이에서 나타나는 다중공선성(Multicollinearity)을 해결하기 위해, 상기 선별 독립변수들에 대해 주성분 분석(Principal Component Analysis)을 수행하여 상기 선별 독립변수들을 펙터들로 그룹화한다. 도 10에 도시된 바와 같이, 주성분 분석부(212)는 수백 종류의 독립변수들(도 10의 (a))을 몇 개의 중요한 펙터들(도 10의 (b))로 그룹화한다. 따라서, 주성분 분석을 통해서 계산된 펙터들을 위기 지수 산출을 위한 새로운 독립변수로 취급한다.
펙터 선별 검출부(214)는 그룹화된 상기 펙터들 및 상기 종속변수를 사용해 상기 NTS(Noise To Signal)값을 상기 펙터들에 대해 각각 산출하고, 산출된 펙터 NTS값들 중에서 상기 일정 NTS 기준값을 충족하는 선별 펙터들을 검출한다.
펙터 선별 검출부(214)는 복수의 펙터 위기 기준값들에 대한 해당 펙터의 위기 여부를 검출하고, 검출된 위기 여부에 따라 각각의 펙터 NTS값들을 산출한다. 이를 위해, 펙터 선별 검출부(214)는 도 13의 NTS값 산출모듈(302)과 동일한 기능을 수행하는 구성요소로서, 펙터 NTS값 산출모듈(미도시)를 구비하고 있다.
펙터 선별 검출부(214)는 산출된 펙터 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 펙터들을 검출하기 위해, 산출된 펙터 NTS값들 중에서 최소 펙터 NTS값이 일정 NTS 기준값 이하에 해당하는가를 판단하고, 최소 펙터 NTS값이 일정 NTS 기준값 이하에 해당한다면, 해당 펙터를 선별 펙터로서 검출한다. 이를 수행하기 위해, 펙터 선별 검출부(214)는 도 13의 독립변수 산출모듈(304)와 동일한 기능을 수행하는 펙터 검출모듈(미도시)을 구비하고 있다.
중분류 위기지수 산출부(216)는 선별 펙터들(또는 선별 독립변수들) 각각의 선별 펙터 NTS값들(또는 선별 NTS값들)을 사용해 중분류 산업군에 대한 중분류 위기지수를 산출한다. 이를 위해, 중분류 위기지수 산출부(216)는 전술한 수학식 6을 사용해 중분류 위기지수를 산출한다. 펙터 NTS값(또는 NTS값) 자체는 작을수록 예측력이 좋은 펙터(또는 독립변수)이므로 (1-NTS)는 값이 클수록 예측력이 좋다는 것을 의미한다. 따라서, 중분류 위기지수 산출부(216)는 해당 시점 펙터의 위기 여부를 예측력에 대한 비중을 반영하여 산출한다. 전술한 표 6의 펙터 데이터를 기초로 하여 중분류 위기지수의 산출 결과를 해석하면, 시간이 지날수록 위기지수가 낮아지고 있으므로 미래의 위기(예를 들어, 여신 상황)이 개선되고 있다고 판단할 수 있다.
위험등급 표시부(218)는 상기 중분류 위기지수를 사용해 상기 중분류 산업군에 대한 위험 등급을 색상으로 구분하여 표시한다. 도 11에 도시된 바와 같이, 위험등급 표시부(218)는 약 100개의 중분류 산업군에 대하여 위험 등급을 중분류 위기지수에 따라 각각 분류하고, 분류된 위험 등급에 따라 색상을 달리하여 한 화면에 표시한다. 이때, 위험등급 표시부(218)는 위험등급 산출은 전술한 수학식 7을 사용한다.
대분류 위기지수 산출부(220)는 상기 중분류 산업군과 다른 중분류 산업군들을 포함하는 대분류 산업군에 대한 대분류 위기지수를 산출한다. 대분류 위기지수 산출부(220)는 전술한 수학식 을 사용하여 산출한다. 대분류 위기지수 산출부(220)는 대분류 산업군에 대한 위기지수를 중분류 산업군에 대한 각각의 중분류 위기지수와 해당 중분류 산업군의 여신규모를 고려하여 산출한다. 대분류 위기지수는 대분류에 포함되는 중분류 위기지수에 중분류 산업군의 여신규모를 반영한 가중평균이다.
제어부(2220)는 시스템 전체의 동작을 제어하는 것으로, 특히, 전술한 데이터베이스(200), 필터링부(202), 내삽 처리부(204), ADF 분석 처리부(206), 독립변수 선별 검출부(208), 독립변수 상황 표시부(210), 주성분 분석부(212), 펙터 선별 검출부(214), 중분류 위기지수 산출부(216), 위험등급 표시부(218) 및 대분류 위기지수 산출부(220)의 각 구성요소의 동작을 제어한다.
한편, 상술한 본 발명의 산업군에 대한 위기지수 산출방법은 컴퓨터에서 읽을 수 있는 코드/명령들(instructions)/프로그램으로 구현될 수 있다. 예를 들면, 컴퓨터로 읽을 수 있는 기록 매체를 이용하여 상기 코드/명령들/프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는 마그네틱 저장 매체(예를 들어, 롬, 플로피 디스크, 하드디스크, 마그네틱 테이프 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 와 같은 저장 매체를 포함한다.
이러한 본원 발명인 산업군에 대한 위기지수 산출방법 및 장치는 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
200: 데이터베이스
202: 필터링부
204: 내삽 처리부
206: ADF 분석 처리부
208: 독립변수 선별 검출부
210: 독립변수 상황 표시부
212: 주성분 분석부
214: 펙터 선별 검출부
216: 중분류 위기지수 산출부
218: 위험등급 표시부
220: 대분류 위기지수 산출부
222: 제어부
300: 종속변수 위기판단모듈
302: NTS값 산출모듈
304: 독립변수 검출모듈

Claims (28)

  1. 제1 기간 동안의 중분류 산업군에 대한 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행하는 단계;
    제2 기간 동안의 상기 중분류 산업군에 대한 m(m은 1보다 크거나 같은 자연수)개의 독립변수들 및 필터링된 상기 종속변수를 사용해 상기 독립변수들이 상기 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 상기 독립변수들에 대해 각각 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 단계; 및
    상기 선별 독립변수들 각각의 NTS값들을 사용해 상기 중분류 산업군에 대한 중분류 위기지수를 산출하는 단계를 포함하고,
    상기 산업군에 대한 위기지수 산출방법은,
    상기 선별 독립변수들을 검출한 후에, 상기 선별 독립변수들 사이에서 나타나는 다중공선성(Multicollinearity)을 해결하기 위해, 상기 선별 독립변수들에 대해 주성분 분석(Principal Component Analysis)을 수행하여 상기 선별 독립변수들을 펙터들로 그룹화하는 단계;
    그룹화된 상기 펙터들 및 상기 종속변수를 사용해 상기 NTS(Noise To Signal)값을 상기 펙터들에 대해 각각 산출하고, 산출된 펙터 NTS값들 중에서 상기 일정 NTS 기준값을 충족하는 선별 펙터들을 검출하는 단계; 및
    상기 선별 펙터들 각각의 선별 NTS값들을 사용해 상기 중분류 산업군에 대한 상기 중분류 위기지수를 산출하는 단계;를 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  2. 제1항에 있어서, 상기 산업군에 대한 위기지수 산출방법은
    상기 종속변수에 대한 필터링 후에, 상기 독립변수들과 상기 종속변수의 값들 중에서 일정 기준에 누락되어 있는 데이터를 상기 일정 기준에 따라 각각 내삽하는 단계를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  3. 제2항에 있어서,
    상기 일정 기준은 월별 데이터에 해당하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  4. 제3항에 있어서,
    상기 독립변수들 및 상기 종속변수가 일별 데이터인 경우에 매월 말일의 데이터를 상기 월별 데이터로 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  5. 제3항에 있어서,
    상기 독립변수들 및 상기 종속변수가 년도별 데이터 및 분기별 데이터 중 어느 하나인 경우에 큐빅 스플라인(Cubic Spline) 내삽 방식을 사용해, 상기 독립변수들 및 상기 종속변수에 대한 상기 월별 데이터를 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  6. 제1항에 있어서, 상기 산업군에 대한 위기지수 산출방법은
    상기 종속변수에 대한 필터링 후에, 상기 독립변수들이 통계 분석을 위한 정상적인 데이터인가 여부에 대해 ADF(Augmented Dicky Fuller) 테스트를 수행하고, 상기 ADF 테스트를 통해 상기 독립변수들 중 비정상적인 데이터를 통계 분석을 위한 정상적인 데이터로 변환하는 단계를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  7. 제1항에 있어서, 상기 일정 NTS 기준값을 충족하는 상기 선별 독립변수들을 검출하는 단계는
    상기 종속변수가 위기임을 판단하기 위한 종속변수 위기 기준값을 사용해 상기 종속변수의 위기 여부를 검출하는 단계;
    상기 독립변수들 중 i(i는 1보다 크거나 같고 m보다 작거나 같은 자연수)번째 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들 각각을 사용해, 상기 독립변수 위기 기준값들 각각에 대한 상기 i번째 독립변수의 위기 여부를 검출 및 각각의 NTS값들을 산출하는 단계;
    상기 산출된 NTS값들 중에서 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당하는가를 판단하는 단계;
    상기 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당한다면, 상기 i번째 독립변수를 상기 선별 독립변수들 중 어느 하나로서 검출하는 단계; 및
    상기 선별 독립변수들의 검출과정을 종료할 것인가를 판단하는 단계를 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  8. 제7항에 있어서, 상기 종속변수의 위기 여부를 검출하는 단계는
    상기 종속변수 위기 기준값을 다음의 수학식을 사용해 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
    [수학식]
    종속변수 위기 기준값 = 종속변수의 평균 + (k*종속변수의 표준편차)
    여기서, k는 사용자 입력값이다.
  9. 제7항에 있어서, 상기 NTS값들을 산출하는 단계는
    다음의 수학식을 사용해 상기 NTS값들을 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
    [수학식]
    NTS=(B/(B+D))/(A/(A+C))
    여기서, A는 상기 독립변수와 상기 종속변수가 모두 위기에 해당하는 빈도를 의미하고, B는 상기 독립변수가 위기이고 상기 종속변수가 정상에 해당하는 빈도를 의미하고, C는 상기 독립변수가 정상이고 상기 종속변수가 위기에 해당하는 빈도를 의미하고, D는 상기 독립변수와 상기 종속변수가 모두 정상에 해당하는 빈도를 의미한다.
  10. 제7항에 있어서, 상기 NTS값들을 산출하는 단계는
    상기 복수의 독립변수 위기 기준값들은 상기 i번째 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 사용하고, 상기 i번째 독립변수의 상하방향에 따라 구분하여 상기 NTS값들을 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  11. 제7항에 있어서, 상기 산업군에 대한 위기지수 산출방법은
    상기 NTS값들을 산출한 후에, 상기 최소 NTS값을 사용해 상기 i번째 독립변수에 대해 위기, 보류 및 정상 중 어느 하나의 상황으로 분류하여 표시하는 단계를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  12. 삭제
  13. 제1항에 있어서, 상기 산업군에 대한 중분류 위기지수를 산출하는 단계는
    다음의 수학식을 사용해 상기 중분류 위기지수를 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
    [수학식]
    중분류 위기지수 = ∑(Pi*(1 - NTSi))/∑(1 - NTSi)
    여기서, Pi는 i번째 독립변수에 대한 위기 여부를 나타내는 값으로서 위기이면 1이고, 정상이면 0의 값을 갖으며, NTSi는 i번째 독립변수에 대한 NTS값을 의미한다.
  14. 제1항에 있어서, 상기 산업군에 대한 위기지수 산출방법은
    상기 중분류 위기지수를 산출한 후에, 상기 중분류 위기지수를 사용해 상기중분류 산업군에 대한 위험 등급을 색상으로 구분하여 표시하는 단계를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출방법.
  15. 중분류 산업군에 대한 m(m은 1보다 크거나 같은 자연수)개의 독립변수들 및 하나의 종속변수에 대한 데이터를 저장하고 있는 데이터베이스;
    제1 기간 동안의 상기 종속변수에 대해 일정 모수(population parameter)를 사용해 필터링을 수행하는 필터링부;
    제2 기간 동안의 상기 독립변수들 및 필터링된 상기 종속변수를 사용해 상기 독립변수들이 상기 종속변수를 예측할 수 있는 정도를 나타내는 NTS(Noise To Signal)값을 상기 독립변수들에 대해 각각 산출하고, 산출된 NTS값들 중에서 일정 NTS 기준값을 충족하는 선별 독립변수들을 검출하는 독립변수 선별 검출부;
    상기 선별 독립변수들 각각의 NTS값들을 사용해 상기 중분류 산업군에 대한 중분류 위기지수를 산출하는 중분류 위기지수 산출부; 및
    상기 데이터베이스, 상기 필터링부, 상기 독립변수 선별 추출부 및 상기 중분류 위기지수 산출부의 동작을 제어하는 제어부;
    상기 선별 독립변수들 사이에서 나타나는 다중공선성(Multicollinearity)을 해결하기 위해, 상기 선별 독립변수들에 대해 주성분 분석(Principal Component Analysis)을 수행하여 상기 선별 독립변수들을 펙터들로 그룹화하는 주성분 분석부;
    그룹화된 상기 펙터들 및 상기 종속변수를 사용해 상기 NTS(Noise To Signal)값을 상기 펙터들에 대해 각각 산출하고, 산출된 펙터 NTS값들 중에서 상기 일정 NTS 기준값을 충족하는 선별 펙터들을 검출하는 펙터 선별 검출부;를 포함하고,
    상기 중분류 위기지수 산출부가 상기 선별 펙터들 각각의 선별 NTS값들을 사용해 상기 중분류 산업군에 대한 상기 중분류 위기지수를 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  16. 제15항에 있어서, 상기 산업군에 대한 위기지수 산출장치는
    상기 독립변수들과 상기 종속변수의 값들 중에서 일정 기준에 누락되어 있는 데이터를 상기 일정 기준에 따라 각각 내삽하는 내삽 처리부를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  17. 제16항에 있어서,
    상기 일정 기준은 월별 데이터에 해당하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  18. 제17항에 있어서,
    상기 내삽 처리부는 상기 독립변수들 및 상기 종속변수가 일별 데이터인 경우에 매월 말일의 데이터를 상기 월별 데이터로 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  19. 제17항에 있어서,
    상기 내삽 처리부는 상기 독립변수들 및 상기 종속변수가 년도별 데이터 및 분기별 데이터 중 어느 하나인 경우에 큐빅 스플라인(Cubic Spline) 내삽 방식을 사용해 상기 독립변수들 및 상기 종속변수에 대한 상기 월별 데이터를 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  20. 제15항에 있어서, 상기 산업군에 대한 위기지수 산출장치는
    상기 독립변수들이 통계 분석을 위한 정상적인 데이터인가 여부에 대해 ADF(Augmented Dicky Fuller) 테스트를 수행하고, 상기 ADF 테스트를 통해 상기 독립변수들 중 비정상적인 데이터를 통계 분석을 위한 정상적인 데이터로 변환하는 ADF 분석 처리부를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  21. 제15항에 있어서, 상기 독립변수 선별 검출부는
    상기 종속변수가 위기임을 판단하기 위한 종속변수 위기 기준값을 사용해 상기 종속변수의 위기 여부를 검출하는 종속변수 위기판단모듈;
    상기 독립변수들 중 i(i는 1보다 크거나 같고 m보다 작거나 같은 자연수)번째 독립변수의 위기임을 판단하기 위한 복수의 독립변수 위기 기준값들 각각을 사용해, 상기 독립변수 위기 기준값들 각각에 대한 상기 i번째 독립변수의 위기 여부를 검출 및 각각의 NTS값들을 산출하는 NTS값 산출모듈; 및
    상기 산출된 NTS값들 중에서 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당하는가를 판단하고, 상기 최소 NTS값이 상기 일정 NTS 기준값 이하에 해당한다면, 상기 i번째 독립변수를 상기 선별 독립변수들 중 어느 하나로서 검출하는 독립변수 검출모듈을 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  22. 제21항에 있어서, 상기 종속변수 위기판단모듈은
    다음의 수학식을 사용해 상기 종속변수 위기 기준값을 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
    [수학식]
    종속변수 위기 기준값 = 종속변수의 평균 + (k*종속변수의 표준편차)
    여기서, k는 사용자 입력값이다.
  23. 제21항에 있어서, 상기 NTS값 산출모듈은
    다음의 수학식을 사용해 상기 NTS값들을 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
    [수학식]
    NTS=(B/(B+D))/(A/(A+C))
    여기서, A는 상기 독립변수와 상기 종속변수가 모두 위기에 해당하는 빈도를 의미하고, B는 상기 독립변수가 위기이고 상기 종속변수가 정상에 해당하는 빈도를 의미하고, C는 상기 독립변수가 정상이고 상기 종속변수가 위기에 해당하는 빈도를 의미하고, D는 상기 독립변수와 상기 종속변수가 모두 정상에 해당하는 빈도를 의미한다.
  24. 제21항에 있어서, 상기 NTS값 산출모듈은
    상기 복수의 독립변수 위기 기준값들은 상기 i번째 독립변수의 최대값 및 최소값을 복수의 구간으로 나눈 값들을 사용하고, 상기 i번째 독립변수의 상하방향에 따라 구분하여 상기 NTS값들을 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  25. 제21항에 있어서, 상기 산업군에 대한 위기지수 산출장치는
    상기 최소 NTS값을 사용해 상기 i번째 독립변수에 대해 위기, 보류 및 정상 중 어느 하나의 상황으로 분류하여 표시하는 독립변수 상황표시부를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
  26. 삭제
  27. 제15항에 있어서, 상기 중분류 위기지수 산출부는
    다음의 수학식을 사용해 상기 중분류 위기지수를 산출하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
    [수학식]
    중분류 위기지수 = ∑(Pi*(1 - NTSi))/∑(1 - NTSi)
    여기서, Pi는 i번째 독립변수에 대한 위기 여부를 나타내는 값으로서 위기이면 1이고, 정상이면 0의 값을 갖으며, NTSi는 i번째 독립변수에 대한 NTS값을 의미한다.
  28. 제15항에 있어서, 상기 산업군에 대한 위기지수 산출장치는
    상기 중분류 위기지수를 사용해 상기 중분류 산업군에 대한 위험 등급을 색상으로 구분하여 표시하는 위험등급 표시부를 더 포함하는 것을 특징으로 하는 산업군에 대한 위기지수 산출장치.
KR1020130006069A 2013-01-18 2013-01-18 산업군에 대한 위기지수 산출방법 및 장치 KR101457073B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130006069A KR101457073B1 (ko) 2013-01-18 2013-01-18 산업군에 대한 위기지수 산출방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130006069A KR101457073B1 (ko) 2013-01-18 2013-01-18 산업군에 대한 위기지수 산출방법 및 장치

Publications (2)

Publication Number Publication Date
KR20140093532A KR20140093532A (ko) 2014-07-28
KR101457073B1 true KR101457073B1 (ko) 2014-10-31

Family

ID=51739697

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130006069A KR101457073B1 (ko) 2013-01-18 2013-01-18 산업군에 대한 위기지수 산출방법 및 장치

Country Status (1)

Country Link
KR (1) KR101457073B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101597939B1 (ko) * 2015-07-02 2016-02-25 한국기업데이터 주식회사 거시경제지표를 활용한 산업별 신용위험도 예측 장치 및 방법
KR101688412B1 (ko) * 2015-09-01 2016-12-21 주식회사 에스원 종속 변수의 예측 모델링 방법 및 시스템

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
박원암,"한국 외환위기의 예측 모형", 한국금융연구원, 한국경제의 분석 제7권 제2호 (2001.3) *
박원암,"한국 외환위기의 예측 모형", 한국금융연구원, 한국경제의 분석 제7권 제2호 (2001.3)*

Also Published As

Publication number Publication date
KR20140093532A (ko) 2014-07-28

Similar Documents

Publication Publication Date Title
CN109948932B (zh) 基于大数据的风险监控分析系统
JP6661052B2 (ja) 時系列データ処理装置、時系列データ処理システムおよび時系列データ処理方法
JP5254612B2 (ja) グラフィック再検査ユーザ設定インタフェース
JP5014500B1 (ja) 異常要因特定方法および装置、上記異常要因特定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4394728B2 (ja) 影響要因特定装置
US20080117213A1 (en) Method and apparatus for automated graphing of trends in massive, real-world databases
US11170332B2 (en) Data analysis system and apparatus for analyzing manufacturing defects based on key performance indicators
US8473498B2 (en) Natural language text analytics
CN112180230A (zh) 芯片测试参数异常的侦测方法、存储介质、终端
WO2022038804A1 (ja) 診断装置及びパラメータ調整方法
US11436769B2 (en) Visualized data generation device, visualized data generation system, and visualized data generation method
CN111080159A (zh) 临床试验研究中心质量监管的风险监控方法和系统
KR101457073B1 (ko) 산업군에 대한 위기지수 산출방법 및 장치
JP5405245B2 (ja) 画像検査方法及び画像検査装置
JP2005092466A (ja) 診断プロセス支援方法とそのためのプログラム
US7640131B2 (en) Data analysis method for analyzing failure root causes for products
KR101257371B1 (ko) 원자력발전소 비상운전 전산화절차서의 운전자 진단오류 영향 평가 방법 및 이를 이용한 시스템
JP7019339B2 (ja) 不良原因抽出システム及びその方法
KR101983603B1 (ko) 증강현실을 활용한 원자력 발전설비의 기계학습식 예측진단장치
US11347811B2 (en) State analysis device, state analysis method, and storage medium
US11443265B2 (en) Analysis system and analysis method
JP3449470B2 (ja) イベント記録の解析方法
CN110597729B (zh) 基于维度的压力测试方法、装置及系统
CN114926008A (zh) 数据质量评估方法及系统
JP2019003453A (ja) 不良要因分析システム及び不良要因分析方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170829

Year of fee payment: 6