KR20200036241A - 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법 - Google Patents

회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법 Download PDF

Info

Publication number
KR20200036241A
KR20200036241A KR1020180115645A KR20180115645A KR20200036241A KR 20200036241 A KR20200036241 A KR 20200036241A KR 1020180115645 A KR1020180115645 A KR 1020180115645A KR 20180115645 A KR20180115645 A KR 20180115645A KR 20200036241 A KR20200036241 A KR 20200036241A
Authority
KR
South Korea
Prior art keywords
regression analysis
prediction model
regression
value
business management
Prior art date
Application number
KR1020180115645A
Other languages
English (en)
Inventor
이혜영
Original Assignee
주식회사 알스피릿
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 알스피릿 filed Critical 주식회사 알스피릿
Priority to KR1020180115645A priority Critical patent/KR20200036241A/ko
Publication of KR20200036241A publication Critical patent/KR20200036241A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 다각도의 복합적인 데이터 온라인 분석 시스템을 제공하는 데에 있어 주요 지표들간 회귀 분석 예측모델을 수립하여, 기업 경영에 대한 이상치를 탐지할 수 있다. 또한, 회귀 분석 예측 모델에 기반하여 신뢰구간 및 누적 잔차를 통한 이상 탐지를 수행하고, 데이터 패턴 변수에 따른 파라미터를 조정하여, 다중 로지스틱 회귀 분석을 수행할 수 있다.

Description

회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법 {METHOD FOR ANOMALY DETECTION BASED ON REGRESSION ANALYSIS PREDICTIVE MODEL}
본 발명은 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지에 관한 것으로서, 보다 상세하게는, 경영현황 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출하고 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성하여 학습 및 예측을 수행하여 기업의 경영현황에 대한 이상을 탐지하는 방법에 관한 것이다.
일반적으로 기업은 변하는 주위 상황에 따라서 끊임없이 변해야만 생존할 수 있다. 특히 글로벌 경제시대의 도래에 따라 기업의 운영에 영향을 미치는 수많은 상황들이 발생하고, 이에 적극적으로 대처하지 못하면 위기에 빠지거나 도산에 이르게 되는 기업들이 수없이 발생하고 있으며, 그렇기 때문에 기업들은 계속해서 경영 혁신을 시도하고 이러한 경영 혁신을 통해 지속적인 발전을 꾀하고 있다.
이에 따라, 기업의 운영 전반에 대한 진단을 통해 기업 구조를 고도화하고 리스크 사후관리를 도모하는 것이 필수적으로 요구되고 있으며, 이러한 기업 운영 전반에 대한 진단방법 및 시스템의 중요성이 갈수록 커지고 있다. 또한, 이러한 기업의 진단방법 및 시스템은 수많은 유형의 기업들과 수많은 종류의 상황에 대응할 수 있으면서도 진단에 의한 분석결과뿐 아니라 해결책 또한 제시할 수 있어야 하고 그 결과와 해결책이 객관성과 신뢰도가 있어야 한다. 그리고 진단결과를 산출할 수 있는 진단 시스템과 진단 방법은 상기와 같이 객관적이면서 실질적인 효과를 가져 올 수 있어야 한다.
국내외 기업에 대한 대용량의 기업에 대한 연구 정보들은 누적되어 있으나 다양한 각도에서의 경영 환경분석은 미흡하며 주식시장 온/오프라인 데이터 서비스들 또한 근거 기반한 과학적인 환경 분석, 투자예측 및 경영 이상 탐지에 대한 정확도가 높지 않다는 문제점이 존재하고 있다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 기업 경영 내부현황 데이터뿐만 아니라 외부(정치, 경제, 정책, 사회 과학기술 변화, SNS 소통) 등 다각도의 복합적인 데이터 온라인 분석 시스템을 제공하는 데에 있어 주요 지표들간 회귀 분석 예측모델을 수립하고, 실측치(주가 또는 영업이익)와 예측치(주가 또는 영업이익)의 차이가 일정구간을 벗어나는 경우 기업경영현황 이상치 감지하는데 그 목적이 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예에 따르는, 서버에 의해 수행되는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법은, (a) 경영현황 지표에 대해 수신하는 단계; (b) 상기 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출하는 단계; (c) 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성하는 단계; 및 (d) 상기 회귀 분석 모델에 대해 학습 및 예측을 수행하여 상기 기업의 경영현황에 대한 이상 탐지를 수행하는 단계;를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따르는 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 프로그램이 저장된 메모리; 및 상기 프로그램을 실행하는 프로세서; 를 포함하되, 상기 프로세서는 상기 프로그램의 실행에 따라, 경영현황 지표에 대해 수신하고, 상기 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출하고, 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성하고, 상기 회귀 분석 모델에 대해 학습 및 예측을 수행하여 상기 기업의 경영현황에 대한 이상 탐지를 수행할 수 있다.
본 발명은 다각도의 복합적인 데이터 온라인 분석 시스템을 제공하는 데에 있어 주요 지표들간 회귀 분석 예측모델을 수립하여, 기업 경영에 대한 이상치를 탐지할 수 있다.
또한, 회귀 분석 예측 모델에 기반하여 신뢰구간 및 누적 잔차를 통한 이상 탐지를 수행하고, 데이터 패턴 변수에 따른 파라미터를 조정하여, 다중 로지스틱 회귀 분석을 수행할 수 있다.
도 1은, 본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하기 위한 시스템의 구조도 이다.
도 2는, 본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 설명하기 위한 순서도 이다.
도 3은, 본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법의 이상 탐지를 수행하는 방법을 설명하기 위한 개념도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.
이하에서 언급되는 "단말"은 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), VR HMD(예를 들어, HTC VIVE, Oculus Rift, GearVR, DayDream, PSVR 등)등을 포함할 수 있다. 여기서, VR HMD 는 PC용 (예를 들어, HTC VIVE, Oculus Rift, FOVE, Deepon 등)과 모바일용(예를 들어, GearVR, DayDream, 폭풍마경, 구글 카드보드 등) 그리고 콘솔용(PSVR)과 독립적으로 구현되는 Stand Alone 모델(예를 들어, Deepon, PICO 등) 등을 모두 포함한다. 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 스마트폰(smart phone), 태블릿 PC, 웨어러블 디바이스뿐만 아니라, 블루투스(BLE, Bluetooth Low Energy), NFC, RFID, 초음파(Ultrasonic), 적외선, 와이파이(WiFi), 라이파이(LiFi) 등의 통신 모듈을 탑재한 각종 디바이스를 포함할 수 있다. 또한, "네트워크"는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.
이하, 도 1을 참조하여, 본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하기 위한 시스템에 대해 구체적으로 설명한다.
본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하기 위한 시스템(10)은, 서버(100) 및 사용자 단말(200)을 포함할 수 있으며, 서버(100) 및 사용자 단말(200)은 유/무선 네트워크를 통해 연결될 수 있다.
회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버(100)는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 프로그램이 저장된 메모리 및 프로그램을 실행하는 프로세서를 포함하되, 프로세서는 프로그램의 실행에 따라, 경영현황 지표에 대해 수신하고, 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출하고, 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성하고, 회귀 분석 모델에 대해 학습 및 예측을 수행하여 기업의 경영현황에 대한 이상 탐지를 수행할 수 있다.
또한, 서버(100)는, 이상 탐지를 수행한 결과 이상치가 감지되는 경우, 감지된 이상치에 대해 단말(200)로 제공할 수 있다.
회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 단말(200)은, 사용자가 소지하는 디바이스 또는 특정 장소에 설치된 컴퓨팅 장치로서, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 프로그램이 설치되어 있을 수 있다.
이하, 도 2를 참조하여 본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법에 대해 구체적으로 설명한다.
회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버(100)는, 경영현황 지표에 대해 수신할 수 있다(S210).
이때, 경영현황 지표는, 기업재무, 날씨, 정치, 정책, 사회 트렌드, 통계, 교통 및 SNS(Social Network Services) 데이터 중 어느 하나 이상의 지표가 될 수 있으며, 이외에도 기업 경영과 관련한 다양한 변수들이 지표가 될 수 있다.
이후, 서버(100)는 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출할 수 있다(S220).
서버(100)로부터 추출되는 복수의 결과 지표는, 기업의 업종 및 테마 중 하나 이상을 고려하여 결정되되, 영향요인 분석, 관계분석 및 상관분석 중 하나 이상의 분석에 기초하여 추출될 수 있다.
예를 들어, 바람직하게, 상관 분석을 통한 지표 정의에 따라 대상 기업에 맞춘 주요 지표를 통계 상관 분석을 통해 도출할 수 있다.
즉, 결과 지표는 기업재무, 날씨, 정치, 정책, 사회 트렌드, 통계, 교통 및 SNS(Social Network Services) 데이터과 같은 지표들 간의 상관도 분석을 수행하여, 각 기업별로 핵심이 되는 지표를 도출하여 생성된 지표로 정의할 수 있다.
복수의 결과 지표를 생성한 후, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버(100)는 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성할 수 있다(S230).
회귀 분석 예측 모델 생성은, 바람직하게, 다중 회귀 분석식을 통해 생성될 수 있으며 종속변수에 대한 독립변수 선정들로 신뢰성이 높은 독립변수(지표들) 최종 선정하여, 회귀 분석 모델 예측을 진행할 수 있다.
즉, 예측하고자 하는 종속변수에 대한 독립변수를 설정하되, 독립 변수는 복수의 결과 지표들 중 하나 이상이 될 수 있다.
다중 회귀 분석식은, 'ax1+bx2+…α(잔차)'과 같은 형태가 될 수 있으며, 이때, 잔차는, 회귀 분석 예측 모델을 수행하기 위한 다중 회귀 분석에서 변수 값으로 충족되지 않는 상수 값이 될 수 있다.
또한, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버(100)는, 기업의 업종 및 테마 중 하나 이상을 고려하여, 회귀 분석 예측 모델을 생성함에 있어서, 시계열 회귀 분석을 수행할 수 있다.
이후, 회귀 분석 모델에 대해 학습 및 예측을 수행하여 상기 기업의 경영현황에 대한 이상 탐지를 수행할 수 있다(S240).
예를 들어, 종속변수에 대한 값의 상한 값 내지 하한 값을 설정하고 회귀 분석 모델에 대한 예측치가 종속변수에 대한 값의 상한 값 내지 하한 값의 범위를 벗어나는 경우, 이상치로 탐지할 수 있다.
또한, 회귀 분석 예측 모델의 잔차 값의 누적치가 기 설정된 임계치 보다 큰 경우에도 이상치로 탐지할 수 있다.
(S240) 단계 이후, 종속변수에 대한 예측치와 실측치를 비교하여 차이 값을 생성하고, 차이 값이 기 설정된 범위를 벗어나는 경우, 이상치로 탐지할 수 있다.
이하, 도 3을 참조하여, 본 발명의 일 실시예에 따르는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법의 이상 탐지를 수행하는 방법에 대해 구체적으로 설명한다.
(S240) 단계 이후, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버(100)는 종속 변수에 대한 상한 값 및 하한 값을 설정할 수 있다(S241).
이후, 실측 된 값이 상한 값 내지 하한 값 범위 이내 값을 초과하는 경우에 이상치로 탐지할 수 있다(S242).
실측 된 값이 상한 값 내지 하한 값 범위 이내 값인 경우, 회귀 분석 예측 모델의 잔차 값의 누적치를 확인하고 잔차 값의 누적치가 임계치를 초과하는 경우 이상치로 탐지할 수 있다(S243).
실측치와 예측치의 값을 비교하여 기 설정된 범위를 벗어나는 값인 경우 이상치로 탐지할 수 있다(S244).
(S242) 내지 (S244) 단계에서 이상치로 탐지 되는 경우, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버(100)는, 단말(200)로 이상치를 제공할 수 있다.
이하 에서는 이상 탐지 방법에 대해 구체적으로 설명한다.
이상 탐지란, 정상치에서 벗어난 관측치를 탐지하는 것으로서, 노멀 데이터를 정의하고 노멀 데이터의 범주를 벗어난 데이터를 탐지하는 것이 될 수 있다.
또한, 미래에 이상치로 진입될 여지가 있는 데이터를 미리 탐지하는 것 역시 이상 탐지가 될 수 있다.
이상징후 문제는 실제 문제에서 사용하기 힘드나 대상에 대한 이해도가 높은 경우 활용도가 매우 높아질 수 있으며, 학습데이터 설정이 매우 중요하고, 학습 데이터가 존재하지 않을 시에는 클러스터링을 하거나 밀도 추정을 통해 확률이 낮은 것을 추출하여 탐지할 수 있다.
이상치를 탐지함에 있어서, 데이터 사이언스 또는 빅데이터에서 머신러닝을 통해서만 문제를 해결하려는 경우, '이상치' 값은 매우 상대적인 개념이므로 정의와 명세가 매우 부족하기 때문에 구체화 하지 못하면 대부분의 사례에서 문제 해결이 힘들 수 있다.
평면 그래프에서 밀집되어 있는 데이터 셋의 범위에 들어가는 데이터는 노멀 데이터(정상 데이터)로 분류할 수 있으며, 밀집 분포된 범위 이외 데이터는 이상 데이터로 감지할 수 있다.
예를 들어, p(x)라는 함수를 용하여 판단하는데 이p(x)데이터는 데이터들의 밀도를 사용하는 함수가 된다. 여기서, p(x)는 이 데이터가 정상적인 데이터일 가능성(Probablity)를 의미한다.
위 함수에서 데이터를 확인한 결과 값이 어떤 특정한 값(ε)보다 작을 경우 이 데이터는 비정상적 이라고 판단이 가능하다.
예를 들어, x라는 벡터 값이 존재하고, x 벡터에 대한 training set이 있다고 가정하면, x 벡터가 가지고 있는 n개의 features에 대하여 각 feature 마다 고유한 분포를 이루고 있을 것이다. 이 모든 features의 가우스 분포를 곱하면 p(x)가 될 수 있다.
x 벡터가 가지고 있는 n개의 features에 대하여 특이하게 값이 크거나 작거나 하여 이상이 생길 만한 feature를 선택하거나 어느 feature가 일반적인 속성을 가지고 있어 분포를 보일 가능성이 있는 것을 선택하고, 각 feature 마다 가우스 분포를 이루는 parameter인 μ와 σ의 값을 찾을 수 있다.
parameter인 μ와 σ의 값은 벡터 연산을 통하여 구할 수 있다. 이후, p(x)의 함수를 연산하고, 특정 값(ε)값과 비교하여 작을 경우에는 이상치로 판단할 수 있다.
결과 값이 아주 작은 값이 된다는 것은 이 데이터가 정상 데이터일 가능성이 매우 낮다는 의미가 될 수 있으므로 이상치로 판단이 가능할 수 있다.
이상치 탐지는 이외에도, 기존 데이터와 특정 지표에 대한 값이 감소할 때, 이에 대한 상관관계를 갖는 지표에서 정상 데이터와 이상 데이터의 차이를 이상치로 감지하여 분석할 수 있다.
또한, 새로운 값이 수집될 때, 이상군집화 또는 정상군집화를 기계 학습을 이용하여 학습할 수 있다.
상술한 방식을 포함하여, 유사도 기반 클러스트링 접근 방법, 거리 기반 클러스트링 접근 방법, 밀도 클러스트링 접근 방법 및 그래프 기반 클러스트링 접근 방법을 활용하여 이상 탐지에 적용할 수 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능 한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비 휘발성 매체, 분리형 및 비 분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비 휘발성, 분리형 및 비 분리형 매체를 모두 포함한다.
본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10: 시스템
100: 서버 200: 단말

Claims (11)

  1. 서버에 의해 수행되는, 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법에 있어서,
    (a) 경영현황 지표에 대해 수신하는 단계;
    (b) 상기 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출하는 단계;
    (c) 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성하는 단계; 및
    (d) 상기 회귀 분석 모델에 대해 학습 및 예측을 수행하여 상기 기업의 경영현황에 대한 이상 탐지를 수행하는 단계;
    를 포함하는,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  2. 제 1 항에 있어서,
    상기 (a) 단계의,
    경영현황 지표는,
    기업재무, 날씨, 정치, 정책, 사회 트렌드, 통계, 교통 및 SNS(Social Network Services) 데이터 중 어느 하나 이상의 지표인 것인,
    기업 경영현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법.
  3. 제 1 항에 있어서,
    상기 (b) 단계의,
    상기 복수의 결과 지표는,
    상기 기업의 업종 및 테마 중 하나 이상을 고려하여 결정되되, 영향요인 분석, 관계분석 및 상관분석 중 하나 이상의 분석에 기초하여 추출되는 것인,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  4. 제 1 항에 있어서,
    상기 (c) 단계는,
    예측하고자 하는 종속변수에 대한 독립변수를 설정하되, 상기 독립 변수는 상기 복수의 결과 지표들 중 하나 이상인 것인,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  5. 제 4 항에 있어서,
    상기 (d) 단계는,
    상기 종속변수에 대한 값의 상한 값 내지 하한 값을 설정하고 상기 회귀 분석 모델에 대한 예측치가 상기 종속변수에 대한 값의 상한 값 내지 하한 값의 범위를 벗어나는 경우, 이상치로 탐지하는 것인,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  6. 제 4 항에 있어서,
    상기 (d) 단계는,
    상기 회귀 분석 예측 모델의 잔차 값의 누적치가 기 설정된 임계치 보다 큰 경우, 이상치로 탐지하는 것인,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  7. 제 6 항에 있어서,
    상기 잔차는,
    상기 회귀 분석 예측 모델을 수행하기 위한 다중 회귀 분석에서 변수 값으로 충족되지 않는 상수 값인 것인,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  8. 제 1 항에 있어서,
    상기 (c) 단계는,
    상기 기업의 업종 및 테마 중 하나 이상을 고려하여, 회귀 분석 예측 모델을 생성함에 있어서, 시계열 회귀 분석을 수행하는 단계를 더 포함하는,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  9. 제 4 항에 있어서,
    상기 (d) 단계 후,
    상기 종속변수에 대한 예측치와 실측치를 비교하여 차이 값을 생성하는 단계; 및
    상기 차이 값이 기 설정된 범위를 벗어나는 경우, 이상치로 탐지하는 것인,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법.
  10. 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버에 있어서,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 프로그램이 저장된 메모리; 및
    상기 프로그램을 실행하는 프로세서; 를 포함하되,
    상기 프로세서는 상기 프로그램의 실행에 따라,
    경영현황 지표에 대해 수신하고, 상기 지표들의 상관 분석을 통한 특정 기업의 핵심이 되는 복수의 결과 지표를 추출하고, 다중 회귀 분석을 통한 회귀 분석 예측 모델을 생성하고, 상기 회귀 분석 모델에 대해 학습 및 예측을 수행하여 상기 기업의 경영현황에 대한 이상 탐지를 수행하는,
    회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하는 서버.
  11. 제 1 항에 따르는 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법을 수행하기 위한 컴퓨터 프로그램이 기록 된 컴퓨터 판독가능 기록 매체.
KR1020180115645A 2018-09-28 2018-09-28 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법 KR20200036241A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180115645A KR20200036241A (ko) 2018-09-28 2018-09-28 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180115645A KR20200036241A (ko) 2018-09-28 2018-09-28 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법

Publications (1)

Publication Number Publication Date
KR20200036241A true KR20200036241A (ko) 2020-04-07

Family

ID=70290921

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180115645A KR20200036241A (ko) 2018-09-28 2018-09-28 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법

Country Status (1)

Country Link
KR (1) KR20200036241A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779507A (zh) * 2021-09-15 2021-12-10 中国电建集团贵州电力设计研究院有限公司 一种基于高程数据覆冰预测模型的建立方法
CN115017211A (zh) * 2022-06-15 2022-09-06 平安国际融资租赁有限公司 异常检测对象的确定方法及装置、存储介质、计算机设备
CN116230191A (zh) * 2023-05-08 2023-06-06 深圳市普朗医疗科技发展有限公司 一种输注类医疗耗材的智能管理方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779507A (zh) * 2021-09-15 2021-12-10 中国电建集团贵州电力设计研究院有限公司 一种基于高程数据覆冰预测模型的建立方法
CN115017211A (zh) * 2022-06-15 2022-09-06 平安国际融资租赁有限公司 异常检测对象的确定方法及装置、存储介质、计算机设备
CN116230191A (zh) * 2023-05-08 2023-06-06 深圳市普朗医疗科技发展有限公司 一种输注类医疗耗材的智能管理方法及系统
CN116230191B (zh) * 2023-05-08 2023-08-18 深圳市普朗医疗科技发展有限公司 一种输注类医疗耗材的智能管理方法及系统

Similar Documents

Publication Publication Date Title
US9661010B2 (en) Security log mining devices, methods, and systems
US11093519B2 (en) Artificial intelligence (AI) based automatic data remediation
US20190354809A1 (en) Computational model management
Yu et al. An improved ARIMA-based traffic anomaly detection algorithm for wireless sensor networks
US20220103444A1 (en) Methods and systems for predicting time of server failure using server logs and time-series data
CN108876600A (zh) 预警信息推送方法、装置、计算机设备和介质
Azadeh et al. An integrated support vector regression–imperialist competitive algorithm for reliability estimation of a shearing machine
KR20200039852A (ko) 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법
KR20200036241A (ko) 회귀 분석 예측모델에 기반한 기업 경영현황 이상 탐지 방법
CN112015909B (zh) 知识图谱的构建方法及装置、电子设备、存储介质
Wang et al. A spatial association-coupled double objective support vector machine prediction model for diagnosing the deformation behaviour of high arch dams
US20230229738A1 (en) Unsupervised anomaly detection machine learning frameworks
Stødle et al. Data‐driven predictive modeling in risk assessment: Challenges and directions for proper uncertainty representation
Zhang et al. A Novel Encoder‐Decoder Model for Multivariate Time Series Forecasting
Khosravi et al. Performance evaluation of machine learning regressors for estimating real estate house prices
CN113785317A (zh) 使用因领域而异的建模来进行反馈挖掘
Liu et al. Hybridizing kernel‐based fuzzy c‐means with hierarchical selective neural network ensemble model for business failure prediction
Yu Hard disk drive failure prediction challenges in machine learning for multi-variate time series
CN116542673B (zh) 应用于机器学习的欺诈行为识别方法及系统
CN110990164B (zh) 账户检测方法和装置、账户检测模型的训练方法和装置
Han et al. Using source code and process metrics for defect prediction-A case study of three algorithms and dimensionality reduction.
Wu et al. RSF-based model for predicting pump failure trends in tunnels
Wang et al. [Retracted] Enabling Legal Risk Management Model for International Corporation with Deep Learning and Self Data Mining
CN113537659A (zh) 识别项目异常的方法和装置
Saidi et al. Remaining useful life prognosis for wind turbine using a neural network with a long-term prediction

Legal Events

Date Code Title Description
E601 Decision to refuse application