KR20210017053A - 개인사업체에 대한 매출액 추정 모형의 도출방법 - Google Patents

개인사업체에 대한 매출액 추정 모형의 도출방법 Download PDF

Info

Publication number
KR20210017053A
KR20210017053A KR1020190095718A KR20190095718A KR20210017053A KR 20210017053 A KR20210017053 A KR 20210017053A KR 1020190095718 A KR1020190095718 A KR 1020190095718A KR 20190095718 A KR20190095718 A KR 20190095718A KR 20210017053 A KR20210017053 A KR 20210017053A
Authority
KR
South Korea
Prior art keywords
sales
model
business
estimation model
optimal
Prior art date
Application number
KR1020190095718A
Other languages
English (en)
Other versions
KR102428511B1 (ko
Inventor
여윤희
권영철
Original Assignee
코리아크레딧뷰로 (주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코리아크레딧뷰로 (주) filed Critical 코리아크레딧뷰로 (주)
Priority to KR1020190095718A priority Critical patent/KR102428511B1/ko
Publication of KR20210017053A publication Critical patent/KR20210017053A/ko
Application granted granted Critical
Publication of KR102428511B1 publication Critical patent/KR102428511B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

개인사업체의 여신 심사 시 실제 매출 증빙 없이도 신속하고 정확하게 매출액을 추정할 수 있는 매출액 추정 모형의 도출방법이 제공된다. 이 매출액 추정 모형의 도출방법은, 학습용 데이터를 이용해 복수의 매출액 추정 모형을 생성하고, 검증용 데이터를 이용해 최적 매출액 추정 모형을 선별하고, 최적 매출액 추정 모형 중 유효변수를 추출하고, 검증용 데이터를 업종 및 매출규모에 따라 복수의 세그먼트로 분할하고, 세그먼트별 매출액 추정 모형을 생성하는 단계를 포함한다.

Description

개인사업체에 대한 매출액 추정 모형의 도출방법{Method for deriving sales estimating models for individual proprietorship}
본 발명은 매출액 추정 모형의 도출방법에 관한 것으로서, 더욱 상세하게는 개인사업체에 대한 매출액 추정 모형의 도출방법에 관한 것이다.
소호(SOHO)는 'small office home office'를 나타내는 신조어로서, 작은 사무실 혹은 가정을 사무실로 이용하는 사업을 말한다. 예를 들어, 인터넷 등을 통한 소규모 사업체뿐만 아니라 새로운 미래 사업 형태의 개인사업체를 지칭하기도 한다.
최근 들어 정부차원의 소상공 지원 정책, 비대면 소액신용대출 활성화 등으로 인하여 소호사업체 또는 개인사업체가 증가하고 있다. 일반적으로 금융회사가 이러한 개인사업체의 여신 승인을 위해 매출정보가 필요한데, 주로 회계자료, 세무신고자료 또는 금융회사 직원의 방문 조사를 통한 실매출 정보를 활용하고 있다.
하지만 이러한 개인사업체의 경우, 여신 규모가 소액인 경우가 대부분이고 많은 여신 심사를 동시에 처리해야 하기 때문에 종래 실매출 정보를 이용한 여신심사는 수집비용 및 처리기간의 문제로 인하여 활용하기 어려운 문제가 있다. 그 대신 인터넷을 이용한 비대면 프로세스를 적용하여 신속하게 여심심사를 처리할 필요가 있다.
본 발명이 해결하고자 하는 과제는, 개인사업체의 여신 심사 시 실제 매출 증빙 없이도 신속하고 정확하게 매출액을 추정할 수 있는 매출액 추정 모형의 도출방법을 제공하고자 하는 것이다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 과제를 달성하기 위한 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법은, 모형도출장치가: 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 매출액을 종속변수로 설정하여, 기계학습을 통해 복수의 매출액 추정 모형을 생성하는 단계; 검증용 데이터를 상기 매출액 추정 모형에 입력하여 상기 검증용 데이터의 매출액과 상기 매출액 추정 모형의 추정값을 비교하여 최적 매출액 추정 모형을 선별하는 단계; 상기 최적 매출액 추정 모형의 독립변수 중에서 종속변수와의 상관관계가 소정의 수준 이상인 변수(이를 '유효변수'라 함)를 추출하는 단계; 상기 검증용 데이터를 개인사업체의 업종 및 매출규모에 따라 복수의 세그먼트로 분할하는 단계; 및 각 세그먼트마다 상기 최적 매출액 추정 모형의 추정값과 상기 유효변수를 독립변수로 설정하고, 상기 검증용 데이터의 매출액을 종속변수로 설정하여, 회귀모형 또는 기계학습을 통해 세그먼트별 매출액 추정 모형을 생성하는 단계를 포함할 수 있다.
상기 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 소액사업자 유무를 종속변수로 설정하여, 기계학습을 통해 매출규모 추정 모형을 생성하는 단계를 더 포함할 수 있다. 여기서, 상기 복수의 세그먼트로 분할하는 단계는, 상기 검증용 데이터를 개인사업체의 업종에 따라 N개로 분할하고(N은 자연수), 각 업종마다 상기 매출규모 추정 모형의 추정값을 기준으로 매출규모에 따라 M개로 분할하여(M은 자연수), 총 N×M개 세그먼트로 분할할 수 있다.
상기 세그먼트별 매출액 추정 모형을 생성할 때, 각 세그먼트의 매출규모에 따라 상기 최적 매출액 추정 모형의 추정값과 상기 유효변수 각각에 개별적으로 기여도를 적용시킬 수 있다.
상기 매출규모가 상대적으로 큰 세그먼트의 경우, 상기 세그먼트별 매출액 추정 모형을 생성할 때 상기 유효변수보다 상기 최적 매출액 추정 모형의 추정값의 기여도를 상대적으로 높게 적용시킬 수 있고, 상기 매출규모가 상대적으로 작은 세그먼트의 경우, 상기 세그먼트별 매출액 추정 모형을 생성할 때 상기 최적 매출액 추정 모형의 추정값보다 상기 유효변수의 기여도를 상대적으로 높게 적용시킬 수 있다.
상기 검증용 데이터에 대해, 표준산업분류의 업종코드, 상기 최적 매출액 추정 모형의 적중률 및 소액사업자 비율을 기준으로 N개의 업종을 정의하고, 상기 최적 매출액 추정 모형의 적중률은 각 업종에 속하는 개인사업체에 대해 상기 최적 매출액 추정 모형의 추정값이 상기 검증용 데이터의 매출액의 소정 오차 범위 내에 속하는 비율이고, 상기 소액사업자 비율은 각 업종에 속하는 개인사업체에 대해 상기 검증용 데이터의 매출액이 소정 값 이하인 비율일 수 있다.
상기 최적 매출액 추정 모형의 종속변수인 매출액과 상기 유효변수 간의 적합도 또는 선형성을 높이도록 상기 유효변수를 변환하는 단계를 더 포함할 수 있다.
상기 유효변수를 변환하는 단계는, 상기 유효변수에 대해 상하한 설정, 로그 함수, 제곱근 함수, 역 함수, 제곱 함수, 절대값 함수 또는 이들의 조합을 적용할 수 있다.
기타 실시예들의 구체적인 사항들은 구체적인 내용 및 도면들에 포함되어 있다.
상술한 바와 같이 본 발명에 따른 매출액 추정 모형에 의하면, 개인사업체 여신 심사 시 실제 매출 증빙 없이도 신속하고 정확하게 매출액을 추정할 수 있다. 특히 비대면 프로세스를 통해 여신 심사를 수행할 때 신뢰성 높은 개인사업체의 추정 매출 정보를 제공할 수 있다.
특히, 개인사업체에 대한 사업자 신용정보, 사업체 정보 및 업황통계정보를 포함한 학습용 데이터를 이용해 1차적으로 매출액 추정 모형을 생성한 후, 검증용 데이터를 이용해 기 생성된 매출액 추정 모형의 적합성을 검증하여 최적 매출액 추정 모형을 선별함으로써 모형의 신뢰성을 높일 수 있다.
나아가, 본 발명은 개인사업체의 매출액을 추정하기 위해 하나의 최적 매출액 추정 모형을 사용하는 것이 아니라, 개인사업체가 속하는 업종 및 매출규모에 따라 복수의 세그먼트로 정의한 후 각 세그먼트별 맞춤형 매출액 추정 모형을 제공하기 때문에 더욱 정확한 매출액 추정이 가능하다.
도 1은 본 발명의 일 실시예에 따른 모형 도출 장치를 개략적으로 나타낸 구성도이다.
도 2는 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법에 있어서 유효변수의 변환방법을 예시적으로 나타낸 것이다.
도 3은 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법에 따라 검증용 데이터를 예시적으로 9개의 업종으로 분류한 표를 나타낸 것이다.
도 4는 본 발명의 일 실시예에 따른 매출규모 추정 모형의 등급에 따른 소형사업자 비중과 최적 매출액 추정 모형의 적중률을 나타낸 것이다.
도 5는 본 발명의 일 실시예에 따른 모형 튜닝부에 의한 모형 조정 결과를 개략적으로 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법을 순차적으로 나타낸 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
본 발명에 따른 매출액 추정 모형은 실제 매출액 정보를 쉽게 입수하기 어려운 개인사업체(individual proprietorship)를 대상으로 한다. 여기서 개인사업체는 법인이나 단체가 아닌 개인이 혼자 소유/경영하거나 법인격을 갖추지 않고 2인 이상이 공동으로 운영하는 사업체를 말한다.
도 1은 본 발명의 일 실시예에 따른 모형 도출 장치를 개략적으로 나타낸 구성도이다. 본 발명의 모형 도출 장치(100)는 모형생성부(30), 모형검증부(40), 유효변수 추출부(50), 유효변수 변환부(60), 데이터 분류부(70), 모형 튜닝부(80), 학습용 데이터 베이스(10) 및 검증용 데이터 베이스(20)를 포함한다.
학습용 데이터 베이스(10)는 매출액 추정 모형을 생성하기 위한 학습용 데이터를 저장하는 장치로서, 예를 들어 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보, 업황통계정보, 매출액 등을 저장할 수 있다.
여기서, 사업자 신용정보는 개인사업체 대표자에 대한 개인신용정보로서, 예를 들어 대표자의 개인대출정보, 카드사용정보, 예금정보, 자산정보, 이들의 증감율 등을 포함할 수 있다. 또한 사업자 신용정보는 사업자 결제액 정보를 포함할 수 있는데, 사업자 결제액 정보는 사업자의 결제 수단별 매출액 정보로서 예를 들어 사업자의 신용카드 단말기, POS 단말기, 간편결제 서비스, 전자상거래 쇼핑몰 등에서 발생한 결제액 정보를 포함할 수 있다. 사업체 개요정보는 개인사업체에 대한 기본정보로서, 예를 들어 한국표준산업분류에 따른 사업체의 업종(또는 업종코드), 지역(표준코드), 사업영위기간, 종업원수, 점포면적 등을 포함할 수 있다. 업황통계정보는 사업체가 속한 업종 및 지역별로 산출되는 사업체수, 평균매출액, 평균대출잔액, 평균카드이용금액, 연체율, 폐업률, 이들의 증감율 등을 포함할 수 있다.
학습용 데이터 베이스(10)는 개인이나 개인사업체의 대출정보 및 신용정보를 보유한 기관의 데이터 베이스로서, 이러한 기관으로는 예를 들어 신용조회회사, 은행, 생명보험회사, 여신금융회사, 금융투자회사 또는 카드사 등이 포함될 수 있다.
검증용 데이터 베이스(20)는 매출 추정 모형을 검증하기 위한 검증용 데이터를 저장하는 장치로서, 예를 들어 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보, 업황통계정보, 매출액 등을 저장할 수 있다. 검증용 데이터 베이스(20)는 개인이나 개인사업체의 대출정보, 매출액 및 신용정보를 보유한 외부 기관의 데이터 베이스로서, 이러한 기관으로는 예를 들어 통계청, 국세청 등이 포함될 수 있다. 검증용 데이터 베이스(20)는 학습용 데이터 베이스(10)보다 개인 및/또는 개인사업체의 매출액 정보를 더 많이 보유하는 것이 바람직하다.
모형생성부(30)는 학습용 데이터 베이스(10)의 학습용 데이터를 이용하여 <매출액 추정 모형>을 생성한다. 구체적으로, 모형생성부(30)는 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 그 매출액을 종속변수로 설정하여, 기계학습을 통해 복수의 매출액 추정 모형을 생성한다. 예를 들어, 그래디언트 부스팅 머신(Gradient Boosting Machine) 알고리즘을 활용하여 기계학습을 수행할 수 있다.
또한 모형생성부(30)는 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 소액사업자 유무를 종속변수로 설정하여, 기계학습을 통해 <매출규모 추정 모형>을 생성한다. 여기서 매출규모 추정 모형은 개인사업체가 소액사업자인지 여부를 판별하는 모형이다. 예를 들어 매출액이 1억원 미만인 경우를 소액사업자로 정의하여 매출규모 추정 모형을 생성하는 경우, 그 추정값은 해당 개인사업체의 매출액이 1억원 미만일 경우, 즉 소액사업자에 해당할 확률을 나타낸다.
모형검증부(40)는 검증용 데이터 베이스(20)로부터 검증용 데이터를 입수하여 복수의 매출액 추정 모형에 입력하고, 검증용 데이터의 매출액과 매출액 추정 모형의 추정값을 비교하고, 적합도를 기준으로 최적 매출액 추정 모형을 선별한다. 최적 매출액 추정 모형은 복수의 매출액 추정 모형 중 하나 이상일 수도 있다.
유효변수 추출부(50)는 최적 매출액 추정 모형에 사용된 독립변수 중에서 종속변수와의 상관관계가 소정의 수준 이상인 변수(이를 '유효변수'라 함)를 추출한다. 예를 들어, 유효변수 추출부(50)는 최적 매출액 추정 모형에 대한 단변량 분석(univariate analysis)을 통해 검증용 데이터의 매출액에 대해 소정의 수준 이상의 상관관계를 가지는 독립변수를 추출하여 유효변수로 정의한다.
유효변수 변환부(60)는 최적 매출액 추정 모형의 종속변수(즉, 검증용 데이터의 매출액)과 유효변수 간의 적합도 또는 선형성을 높이기 위해 유효변수를 변환할 수 있다. 예를 들어, 유효변수 변환부(60)는 유효변수에 대해 상/하한을 설정하거나, 로그 함수, 제곱근 함수, 역 함수, 절대값 함수 또는 이들의 조합을 적용할 수 있고, 변환된 유효변수를 최적 매출액 추정 모형의 독립변수로 사용할 수 있다.
도 2는 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법에 있어서 유효변수의 변환방법을 예시적으로 나타낸 것이다. 구체적으로, 도 2(a)는 유효변수(대표자 연령)와 매출액의 관계를 예시적으로 나타낸 것인데, 42세에서 매출액이 최대값을 가지는 경우 절대값 함수(예를 들어 |연령-42|)를 사용하여 유효변수를 변환함으로써 매출액과의 선형성을 높일 수 있다. 도 2(b)는 유효변수(카드신판 12개월 이용액)와 매출액의 관계를 예시적으로 나타낸 것이데, 카드 이용액이 연 600만원 미만일 경우 매출액이 유사하기 때문에 카드 이용액 600만원 미만은 600만원으로 간주하는 하한을 적용할 경우 매출액과의 선형성을 높일 수 있다. 도 2(c)는 유효변수(기업대출금액)과 매출액의 관계를 예시적으로 나타낸 것인데, 기업대출금액에 로그 함수를 적용하여 유효변수를 변환함으로써 매출액과의 선형성을 높일 수 있다.
데이터 분류부(70)는 검증용 데이터를 개인사업체의 업종 및 매출규모에 따라 복수의 세그먼트로 분할한다. 예를 들어, N×M개 세그먼트로 분할할 수 있다.
먼저 데이터 분류부(70)는 검증용 데이터를 개인사업체의 업종에 따라 N개로 분할한다(N은 자연수). 예를 들어, 데이터 분류부(70)는 검증용 데이터에 대해, 표준산업분류의 업종코드, 업종별 특성, 최적 매출액 추정 모형의 적중률, 소액사업자 비율 등을 기준으로 N개의 업종으로 분류하여 정의할 수 있다. 여기서, 최적 매출액 추정 모형의 적중률은 각 업종에 속하는 개인사업체에 대해 최적 매출액 추정 모형의 추정값이 검증용 데이터의 매출액을 기준으로 소정의 오차 범위 내에 속하는 비율을 의미한다. 예를 들어, 하나의 업종에 대해 추정값이 매출액을 기준으로 10 내지 30% 오차범위 내에 속하는 비율로 정의될 수 있다. 소액사업자 비율은 각 업중에 속하는 개인사업체에 대해 검증용 데이터의 매출액이 소정 값 이하인 비율을 의미한다. 예를 들어, 하나의 업종에 속하는 개인사업체에 대해 매출액이 1억미만인 경우의 비율로 정의될 수 있다. 도 3은 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법에 따라 검증용 데이터를 예시적으로 9개의 업종으로 분류한 표를 나타낸 것이다.
이어서 데이터 분류부(70)는 각 업종마다 매출규모 추정 모형의 추정값을 기준으로 매출규모에 따라 M개로 분할한다(M은 자연수). 매출규모 추정 모형은 개인사업체가 소액사업자인지 여부를 판별하는 모형으로, 그 추정값은 소액사업자에 해당할 확률을 나타낸다. 본 실시예에서는, 데이터 분류부(70)는 매출규모 추정 모형의 추정값의 크기에 따라 복수의 등급으로 나눌 수 있다. 예를 들어 매출규모 추정 모형의 추정값을 크기에 따라 제1 내지 제10 등급으로 나눌 경우, 제1 내지 제2 등급은 매출규모가 '대형'인 것으로 정의하고, 제3 내지 제8 등급은 매출규모가 '중형'인 것으로 정의하고, 제9 내지 제10 등급은 매출규모가 '소형'인 것으로 정의할 수 있다.
도 4는 본 발명의 일 실시예에 따른 매출규모 추정 모형의 등급에 따른 소형사업자 비중과 최적 매출액 추정 모형의 적중률을 나타낸 것이다. 도 4에 도시된 바와 같이, 등급이 낮을수록 소형사업자, 즉 매출액이 1억미만인 사업체의 비중이 낮고 또한 최적 매출액 추정 모형의 적중률이 높을 것을 알 수 있다. 구체적으로, 매출규모가 대형인 경우(제1 내지 제2 등급), 매출액이 1억 미만인 사업체의 비중이 상대적으로 낮고 최적 매출액 추정 모형의 적중률이 높다는 것을 알 수 있다. 매출규모가 중형인 경우(제3 내지 제8 등급), 매출액이 1억 미만인 사업체의 비중이 약 30-70%이며 최적 매출액 추정 모형의 적중률이 약 10-30%인 것을 알 수 있다. 매출규모가 소형인 경우(제9 내지 제10 등급), 매출액이 1억 미만인 사업체의 비중이 약 70% 이상이며 최적 매출액 추정 모형의 적중률이 매우 낮다는 것을 알 수 있다.
이와 같이 매출규모에 따라 최적 매출액 추정 모형의 적중률에는 큰 차이가 있으며 이러한 차이는 업종마다 다르게 나타난다. 이러한 차이를 최소화하기 위해 모형 튜닝부(80)는 최적 매출액 추정 모형을 이용하여 각 세그먼트에 최적화된 <세그먼트별 매출액 추정 모형>을 생성한다. 구체적으로, 모형 튜닝부(80)는 각 세그먼트마다 최적 매출액 추정 모형의 추정값과 유효변수를 독립변수로 설정하고, 검증용 데이터의 매출액을 종속변수로 설정하여, 회귀모형 또는 기계학습을 통해 세그먼트별 매출액 추정 모형을 생성한다.
이 때, 모형 튜닝부(80)는 각 세그먼트의 매출규모에 따라 최적 매출액 추정 모형의 추정값과 유효변수 각각에 개별적으로 기여도를 적용시켜 세그먼트별 매출액 추정 모형을 생성할 수 있다. 여기서, 최적 매출액 추정 모형의 추정값의 기여도를 A라고 하면, 유효변수의 기여도를 (1-A)라고 정의할 수 있다(0≤A≤1).
구체적으로, 매출규모가 상대적으로 큰 세그먼트의 경우, 유효변수보다 최적 매출액 추정 모형의 추정값의 기여도를 상대적으로 높게 적용시킬 수 있다. 예를 들어, 매출규모가 '대형'인 경우 최적 매출액 추정 모형의 추정값에 대한 기여도를 1로 설정하고 유효변수의 기여도를 0으로 설정할 수 있으며, 이 경우 세그먼트별 매출액 추정 모형은 최적 매출액 추정 모형과 실질적으로 동일한 매출액을 추정하게 된다.
매출규모가 상대적으로 작은 세그먼트의 경우, 최적 매출액 추정 모형의 추정값보다 유효변수의 기여도를 상대적으로 높게 적용시킬 수 있다. 예를 들어, 매출규모가 '소형'인 경우 최적 매출액 추정 모형의 추정값에 대한 기여도를 0으로 설정하고 유효변수의 기여도를 1로 설정할 수 있으며, 이 경우 세그먼트별 매출액 추정 모형은 유효변수를 독립변수로 하고 검증용 데이터의 매출액을 종속변수로 하여 회귀모형 또는 기계학습을 통해 생성된 새로운 모형이다.
예를 들어, 매출규모가 '중형'인 경우, 최적 매출액 추정 모형의 추정값에 대한 기여도를 0.3으로 설정하고, 유효변수의 기여도를 0.7로 설정하여 세그먼트별 매출액 추정 모형을 생성할 수 있다.
도 5는 본 발명의 일 실시예에 따른 모형 튜닝부에 의한 모형 조정 결과를 개략적으로 나타낸 도면이다. 최적 매출액 추정 모형의 경우 매출액이 낮을 때(특히 매출액이 1억 미만일 때) 모형의 적중률이 낮은 것으로 확인되었으나, 조정된 세그먼트별 매출액 추정 모형은 매출액이 낮은 경우에도 높은 모형 적중률을 가지는 것으로 확인되었다.
이하 도 6을 참조하여 본 발명의 매출액 추정 모형의 도출방법에 대해 설명한다. 도 6은 본 발명의 일 실시예에 따른 매출액 추정 모형의 도출방법을 순차적으로 나타낸 순서도이다.
먼저 모형생성부(30)는 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 그 매출액을 종속변수로 설정하여, 기계학습을 통해 복수의 매출액 추정 모형을 생성한다(S10). 또한 모형생성부(30)는 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 소액사업자 유무를 종속변수로 설정하여, 기계학습을 통해 매출규모 추정 모형을 생성한다(S20).
모형검증부(40)는 검증용 데이터를 복수의 매출액 추정 모형에 입력하고, 검증용 데이터의 매출액과 매출액 추정 모형의 추정값을 비교하여 적합도를 기준으로 최적 매출액 추정 모형을 선별한다(S30).
유효변수 추출부(50)는 단변량 분석을 통해 최적 매출액 추정 모형에 사용된 독립변수 중에서 종속변수와의 상관관계가 소정의 수준 이상인 유효변수를 추출하고, 유효변수 변환부(60)는 최적 매출액 추정 모형의 종속변수과 유효변수 간의 적합도 또는 선형성을 높이도록 유효변수를 변환한다(S40).
데이터 분류부(70)는 검증용 데이터를 개인사업체의 업종 및 매출규모에 따라 복수의 세그먼트로 분할한다(S50).
모형 튜닝부(80)는 최적 매출액 추정 모형의 추정값과 유효변수를 이용하여(여기서 각각에 매출규모에 따른 개별적 기여도를 적용) 회귀모형 또는 기계학습을 통해 각 세그먼트에 최적화된 세그먼트별 매출액 추정 모형을 생성한다(S60).
이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
10: 학습용 데이터 베이스
20: 검증용 데이터 베이스
30: 모형생성부
40: 모형검증부
50: 유효변수 추출부
60: 유효변수 변환부
70: 데이터 분류부
80: 모형 튜닝부
100: 모형 도출 장치

Claims (7)

  1. 모형도출장치가:
    학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 매출액을 종속변수로 설정하여, 기계학습을 통해 복수의 매출액 추정 모형을 생성하는 단계;
    검증용 데이터를 상기 매출액 추정 모형에 입력하여 상기 검증용 데이터의 매출액과 상기 매출액 추정 모형의 추정값을 비교하여 최적 매출액 추정 모형을 선별하는 단계;
    상기 최적 매출액 추정 모형의 독립변수 중에서 종속변수와의 상관관계가 소정의 수준 이상인 변수(이를 '유효변수'라 함)를 추출하는 단계;
    상기 검증용 데이터를 개인사업체의 업종 및 매출규모에 따라 복수의 세그먼트로 분할하는 단계; 및
    각 세그먼트마다 상기 최적 매출액 추정 모형의 추정값과 상기 유효변수를 독립변수로 설정하고, 상기 검증용 데이터의 매출액을 종속변수로 설정하여, 회귀모형 또는 기계학습을 통해 세그먼트별 매출액 추정 모형을 생성하는 단계를 포함하는 매출액 추정 모형의 도출방법.
  2. 제1항에 있어서,
    상기 학습용 데이터에서 복수의 개인사업체에 대한 사업자 신용정보, 사업체 개요정보 및 업황통계정보를 독립변수로 설정하고 소액사업자 유무를 종속변수로 설정하여, 기계학습을 통해 매출규모 추정 모형을 생성하는 단계를 더 포함하고,
    상기 복수의 세그먼트로 분할하는 단계는, 상기 검증용 데이터를 개인사업체의 업종에 따라 N개로 분할하고(N은 자연수), 각 업종마다 상기 매출규모 추정 모형의 추정값을 기준으로 매출규모에 따라 M개로 분할하여(M은 자연수), 총 N×M개 세그먼트로 분할하는 것을 특징으로 하는 매출액 추정 모형의 도출방법.
  3. 제1항에 있어서,
    상기 세그먼트별 매출액 추정 모형을 생성할 때, 각 세그먼트의 매출규모에 따라 상기 최적 매출액 추정 모형의 추정값과 상기 유효변수 각각에 개별적으로 기여도를 적용시키는 것을 특징으로 하는 매출액 추정 모형의 도출방법.
  4. 제1항에 있어서,
    상기 매출규모가 상대적으로 큰 세그먼트의 경우, 상기 세그먼트별 매출액 추정 모형을 생성할 때 상기 유효변수보다 상기 최적 매출액 추정 모형의 추정값의 기여도를 상대적으로 높게 적용시키고,
    상기 매출규모가 상대적으로 작은 세그먼트의 경우, 상기 세그먼트별 매출액 추정 모형을 생성할 때 상기 최적 매출액 추정 모형의 추정값보다 상기 유효변수의 기여도를 상대적으로 높게 적용시키는 것을 특징으로 하는 매출액 추정 모형의 도출방법.
  5. 제1항에 있어서,
    상기 검증용 데이터에 대해, 표준산업분류의 업종코드, 상기 최적 매출액 추정 모형의 적중률 및 소액사업자 비율을 기준으로 N개의 업종을 정의하고,
    상기 최적 매출액 추정 모형의 적중률은 각 업종에 속하는 개인사업체에 대해 상기 최적 매출액 추정 모형의 추정값이 상기 검증용 데이터의 매출액의 소정 오차 범위 내에 속하는 비율이고,
    상기 소액사업자 비율은 각 업종에 속하는 개인사업체에 대해 상기 검증용 데이터의 매출액이 소정 값 이하인 비중인 것을 특징으로 하는 매출액 추정 모형의 도출방법.
  6. 제1항에 있어서,
    상기 최적 매출액 추정 모형의 종속변수인 매출액과 상기 유효변수 간의 적합도 또는 선형성을 높이도록 상기 유효변수를 변환하는 단계를 더 포함하는 매출액 추정 모형의 도출방법.
  7. 제6항에 있어서,
    상기 유효변수를 변환하는 단계는, 상기 유효변수에 대해 상하한 설정, 로그 함수, 제곱근 함수, 역 함수, 제곱 함수, 절대값 함수 또는 이들의 조합을 적용하는 것을 특징으로 하는 매출액 추정 모형의 도출방법.
KR1020190095718A 2019-08-06 2019-08-06 개인사업체에 대한 매출액 추정 모형의 도출방법 KR102428511B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190095718A KR102428511B1 (ko) 2019-08-06 2019-08-06 개인사업체에 대한 매출액 추정 모형의 도출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190095718A KR102428511B1 (ko) 2019-08-06 2019-08-06 개인사업체에 대한 매출액 추정 모형의 도출방법

Publications (2)

Publication Number Publication Date
KR20210017053A true KR20210017053A (ko) 2021-02-17
KR102428511B1 KR102428511B1 (ko) 2022-08-03

Family

ID=74732491

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190095718A KR102428511B1 (ko) 2019-08-06 2019-08-06 개인사업체에 대한 매출액 추정 모형의 도출방법

Country Status (1)

Country Link
KR (1) KR102428511B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102510463B1 (ko) * 2021-11-09 2023-03-16 주식회사 하이퍼리서치 상권 분석 정보 제공 방법 및 이를 기록한 기록매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110047721A (ko) * 2009-10-30 2011-05-09 주식회사 하나은행 영업중인 의원을 위한 사업성평가 서버 및 그 방법
KR20140021178A (ko) * 2012-08-09 2014-02-20 연세대학교 산학협력단 고속도로 휴게소의 최적 위치와 규모의 산출 방법 및 장치
KR101885032B1 (ko) * 2017-06-13 2018-08-02 삼성물산 주식회사 예측 모델 기반의 매출 예측 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110047721A (ko) * 2009-10-30 2011-05-09 주식회사 하나은행 영업중인 의원을 위한 사업성평가 서버 및 그 방법
KR20140021178A (ko) * 2012-08-09 2014-02-20 연세대학교 산학협력단 고속도로 휴게소의 최적 위치와 규모의 산출 방법 및 장치
KR101885032B1 (ko) * 2017-06-13 2018-08-02 삼성물산 주식회사 예측 모델 기반의 매출 예측 장치 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102510463B1 (ko) * 2021-11-09 2023-03-16 주식회사 하이퍼리서치 상권 분석 정보 제공 방법 및 이를 기록한 기록매체

Also Published As

Publication number Publication date
KR102428511B1 (ko) 2022-08-03

Similar Documents

Publication Publication Date Title
US8306986B2 (en) Method, system, and computer program product for linking customer information
Abdul-Majid et al. The impact of Islamic banking on the cost efficiency and productivity change of Malaysian commercial banks
Griffin et al. Common stock returns and rating changes: A methodological comparison
US20180082371A1 (en) Systems and methods for electronic account certification and enhanced credit reporting
US20120150786A1 (en) Multidimensional risk-based detection
AU2014202660C1 (en) A system and method using multi-dimensional rating to determine an entity&#39;s future commercial viability
US20150356543A1 (en) System and method for associating identifiers with transactions
US20090248465A1 (en) Assessment of risk associated with doing business with a party
US11354749B2 (en) Computing device for machine learning based risk analysis
US20090248559A1 (en) Assessment of risk associated with doing business with a party
Kadam et al. Prediction for loan approval using machine learning algorithm
Annan et al. Determinants of tax evasion in Ghana: 1970-2010
Dimitras et al. Evaluation of empirical attributes for credit risk forecasting from numerical data
US8682684B2 (en) Method, apparatus and computer program product for monitoring compliance in reporting unclaimed property
Samreen et al. Design and Development of Credit Scoring Model for the Commercial Banks in Pakistan: Forecasting Creditworthiness of Corporate Borrowers
KR102428511B1 (ko) 개인사업체에 대한 매출액 추정 모형의 도출방법
Chen et al. Modeling recovery rate for leveraged loans
Seagraves et al. The cap rate spread: a new metric for commercial underwriting
KR102175616B1 (ko) 사업체 리스크의 평가 방법 및 이를 실행시키기 위한 컴퓨터프로그램
Burnett et al. Managerial discretion in revenue recognition amidst financial restatements and implications for GAAP compliance
CN110941652A (zh) 银行流水数据的分析方法
JP2008046835A (ja) 企業の信用力算出システム及び算出プログラム
Alfonsius Accounting Information System and Business Organizations: GARRY ALFONSIUS Bachelor of Science in Business Administration at Universal Institute of Professional Management UIPM Singapore
Nwokoye et al. The effect of misalignment in exchange rate during pre and post liberalization periods In Nigeria
Mortezaee et al. Financial Risk Management-A Comparative Study Between Iranian Banks

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right