KR20190036254A - 변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법 - Google Patents

변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법 Download PDF

Info

Publication number
KR20190036254A
KR20190036254A KR1020170125266A KR20170125266A KR20190036254A KR 20190036254 A KR20190036254 A KR 20190036254A KR 1020170125266 A KR1020170125266 A KR 1020170125266A KR 20170125266 A KR20170125266 A KR 20170125266A KR 20190036254 A KR20190036254 A KR 20190036254A
Authority
KR
South Korea
Prior art keywords
variable
information
machine learning
probability
learning algorithm
Prior art date
Application number
KR1020170125266A
Other languages
English (en)
Inventor
강정석
김광호
정윤희
Original Assignee
주식회사 에이젠글로벌
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에이젠글로벌 filed Critical 주식회사 에이젠글로벌
Priority to KR1020170125266A priority Critical patent/KR20190036254A/ko
Publication of KR20190036254A publication Critical patent/KR20190036254A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Mathematical Optimization (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치는 머신러닝 알고리즘을 기반으로 고객의 특정한 행동 패턴을 예측하도록 학습된 예측 모델, 예측 모델이 소정의 고객에 대한 행동 패턴을 예측한 제1 확률을 저장하는 예측 저장부, 소정의 고객에 대한 행동 패턴을 예측하는 데에 사용된 변수에 대한 정보를 입력 받는 입력부, 변수에 대한 정보 중 어느 하나의 정보를 변경시켜 복수의 변수 조합 세트를 생성하는 변수 조합부, 복수의 변수 조합 세트를 각각 예측 모델에 입력하여 복수의 제2 확률값을 도출하는 확률 계산부, 제1 확률값 및 복수의 제2 확률값을 비교하는 비교부 및 복수의 제2 확률값 중 제1 확률값과 차이가 가장 큰 제2 확률값을 판별하고, 차이가 가장 큰 제2 확률값을 도출하는데에 예측 모델에 입력된 상기 변수 조합 세트를 판별하는 설명부를 포함한다.

Description

변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법 {APPARATUS AND METHOD FOR EXPLAINING REASONING OF DECISION MAKING PROCESS OF MACHINE LEARNING ALGORITHM}
본 발명은 머신러닝 알고리즘의 의사결정과정 설명 장치 및 방법에 관한 것으로서, 보다 자세하게는 머신러닝 알고리즘의 의사결정과정에 영향을 미치는 요소를, 다차원 공간상의 거리를 이용한 목표 데이터를 선정하고, 설명하고자하는 데이터의 각 변수를 목표 데이터의 변수 값으로 하나씩 변경함에 따른 각 변수별 해당 의사결정에 미치는 영향도를 계산하여, 의사결정 과정을 역으로 추정하는 방법에 관한 것이다.
최근 시장에는 머신러닝을 이용하여 각 산업에 적용하고자 하는 시도가 급속도로 증가하고 하고 있다. 하지만, 많은 산업에서는 머신러닝이 방대한 데이터를 기반으로 빠른 속도로 의사결정에 도움을 준다는 점을 알고 있지만, 의료나 금융과 같은 의사결정의 원인에 대한 설명이 없으며 사후에 문제가 발생할 경우, 적절한 대응방법을 찾지 못하기 때문에 적극적으로 해당 산업에 도입을 주저하고 있는 상황이다.
예를 들어, 의료에서는 환자가 특정한 병에 걸릴 확률을 70%라고 진단하지만, 그 원인이 환자의 나이, 흡연, 음주, 영양상태, 가족력 등에 있는지 원인을 파악하지 못한 경우에는 적정할 후속조치를 내릴 수가 없는 상황이 발생하게 된다. 또한, 금융업에서는 각 대출신청자가 갖고 있는 나이, 소득수준, 재산 및 부채 규모, 과거 상환이력 등을 고려하여 대출 상품의 승인 여부를 결정하게 되는데, 대출 상품의 승인을 거절할 경우 거절의 이유에 대한 적절한 설명을 하지 못한다면 금융규제당국의 제제를 받을 수 있기 때문에 머신러닝 알고리즘의 의사결정에 영향을 미치는 주요한 변수를 알 필요성이 있다.
즉, 머신러닝 알고리즘을 사용하는데에 있어서 어떠한 결론이 도출되는데에 사용되는 변수가 어떠한 영향을 미치는지 알 수 있다면, 다양한 분야에서 머신러닝 알고리즘을 적극적으로 도입되는데 큰 역할을 할 수 있다.
본 발명의 실시예에서 해결하고자 하는 과제는 머신러닝 알고리즘에 활용되는 변수의 조합을 달리하면서, 그 특정 조건이 발생할 확률값의 변화정도를 측정하여 각 변수의 조합이 영향을 미치는 정도를 계산하고, 그 특정조합 데이터가 발생할 원인을 설명함으로써, 금융 및 의료 산업에서 의사 결정 및 사후 대응 전략의 편의성을 높일 수 있는 기술을 제공하는 것이다.
다만, 본 발명의 실시예가 이루고자 하는 기술적 과제는 이상에서 언급한 과제로 제한되지 않으며, 이하에서 설명할 내용으로부터 통상의 기술자에게 자명한 범위 내에서 다양한 기술적 과제가 도출될 수 있다.
본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치는 머신러닝 알고리즘 학습에 사용된 변수를 입력받아 학습하는 예측 모델, 예측 모델을 기반으로 예측값을 나타내고 저장하는 예측저장부가 있다. 또한 머신러닝 알고리즘 학습에 사용된 변수를 입력받는 입력부, 머신러닝 알고리즘의 의사결정과정 설명장치에서 활용하여 각 변수의 설명력을 계산하기 위해 활용할 변수의 조합을 구성하는 변수 조합부, 새롭게 조합된 변수를 예측 모델에 적용하여 변수별 영향도를 계산하는 확률 계산부, 원본 변수에 대한 정보를 예측 모델에 입력하여 출력한 확률값과 새롭게 조합된 변수를 예측 모델에 입력한 확률값의 차이를 비교하는 비교부, 각 변수 별로 예측한 차이를 기반으로 원인을 설명하는 설명부를 포함한다.
또한 설명부는 기존의 알고리즘을 학습하기 위해 사용된 원본 변수 전체를 기반으로 예측한 확률값과, 변수 조합부에서 새롭게 조합된 변수를 기존의 알고리즘에 적용하여 예측한 확률값과의 차이를 계산하여, 어떠한 조합의 변수가 가장 큰 영향을 미치는지를 계산하여 제공할 수 있다.
아울러 변수 조합부는 원본 변수 전체 중 어느 하나의 변수를 변경한 새로운 데이터 조합을 생성하여 예측 모델에 입력을 하게 된다. 예를 들어 예측 모델이 입력 받는 변수가 n개(n은 2 이상의 자연수)인 경우, 새로운 조합은 n개의 변수 중 i번째(i는 1 이상 n 이하의 자연수)의 변수를 무작위로 순차적으로 선정하여, i번째 변수가 가질 수 있는 값을 순차적으로 변화시킨 모든 조합을 구하는 과정을 거치게 된다. 이때 기 설정된 수 이상의 조합의 개수가 발생한다면, 모든 조합들 중에 다차원 공간상에서의 유클리디안 거리를 활용한 일부의 목표 데이터를 선정할 수 있다.
이때 n개의 변수가 있는 경우에, (n + (n-1) + (n-2) + ... + 1)개의 조합을 선정하여 영향력이 있는 변수를 도출할 수 있다. 가령 목표 데이터 내의 변수 중에서 각 변수를 목표 데이터의 변수 값으로 n번 변경하면서 가장 큰 영향도를 제시하는 변수를 먼저 선정한다. 이후, 가장 큰 영향도를 제시하는 변수를 고정으로 하고, 다시 (n-1)번 다른 변수의 값을 변경하면서 두번째로 영향도가 제일 높은 변수를 선정한다. 이런 과정을 모든 변수에 대해서 수행할 수 있다. 목표 데이터의 선정은 변수의 영향력을 설명하고자 하는 변수에서, 예측 모델이 불량으로 예측한 경우(여신심사의 경우 연체 확률이 높다고 판단되거나, 의료 진단에서 폐암발병확률이 높게 나타는 경우)와 우량이면서 설명하고자 하는 입력 데이터에서 가장 가까운 목표 데이터를 유클리디안 거리를 이용하여 계산함으로써 선정할 수 있다.
본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명방법은 머신러닝 알고리즘 학습에 사용된 변수를 입력하는 입력단계, 머신러닝 알고리즘의 의사결정과정 설명장치에서 활용하여 각 변수의 설명력을 계산하기 위해 활용할 변수의 조합을 구성하는 변수조합 단계, 새롭게 조합된 변수를 기존의 학습된 알고리즘에 적용하여 변수별 영향도를 계산하는 확률계산단계, 기존의 머신러닝학습을 위해 이용한 전체 변수를 활용하여 예측한 확률값과 새롭게 조합된 변수를 활용하여 예측한 값의 차이를 비교하는 비교 단계, 각 변수별로 예측한 차이를 기반으로 원인을 설명하는 설명 단계를 포함한다.
본 발명의 실시예에 따르면, 머신러닝 알고리즘의 의사결정과정에 미치는 원인을 파악하여, 머신러닝 알고리즘에 따른 의사결정 사용 및 상황에 맞는 적절할 사후 조치를 취할 수 있다.
도 1은 본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치가 동작하는 원리를 간단하게 설명하기 위한 예시도이다.
도 2는 본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치를 구성하는 기능 블럭도이다.
도 3은 본 발명의 일 실시예에 따라 각 변수의 설명력을 계산하기 위해 활용할 변수의 조합을 구성하는 변수조합부의 과정을 여신심사 의사결정과정에 적용한 예시도이다.
도 4는 본 발명의 일 실시예에 따라 각 변수의 설명력을 계산하기 위해 활용할 변수의 조합을 구성하는 변수조합부의 과정을 의료 진단에 적용한 예시도이다.
도 5는 본 발명의 일 실시예에 따라 예측 모델을 통해 예측한 확률값과 새롭게 조합된 변수를 예측 모델에 입력하여 예측한 확률값의 차이를 비교하는 비교부의 예시도이다.
본 발명의 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하의 상세한 설명에 의해 보다 명확하게 이해될 것이다. 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다.
본 명세서에서 개시되는 실시예들은 본 발명의 범위를 한정하는 것으로 해석되거나 이용되지 않아야 할 것이다. 이 분야의 통상의 기술자에게 본 명세서의 실시예를 포함한 설명은 다양한 응용을 갖는다는 것이 당연하다. 따라서, 본 발명의 상세한 설명에 기재된 임의의 실시예들은 본 발명을 보다 잘 설명하기 위한 예시적인 것이며 본 발명의 범위가 실시예들로 한정되는 것을 의도하지 않는다.
도면에 표시되고 아래에 설명되는 기능 블록들은 가능한 구현의 예들일 뿐이다. 다른 구현들에서는 상세한 설명의 사상 및 범위를 벗어나지 않는 범위에서 다른 기능 블록들이 사용될 수 있다. 또한, 본 발명의 하나 이상의 기능 블록이 개별 블록들로 표시되지만, 본 발명의 기능 블록들 중 하나 이상은 동일 기능을 실행하는 다양한 하드웨어 및 소프트웨어 구성들의 조합일 수 있다.
또한, 어떤 구성 요소들을 포함한다는 표현은 개방형의 표현으로서 해당 구성 요소들이 존재하는 것을 단순히 지칭할 뿐이며, 추가적인 구성 요소들을 배제하는 것으로 이해되어서는 안 된다.
나아가 어떤 구성 요소가 다른 구성 요소에 연결되어 있다거나 접속되어 있다고 언급될 때에는, 그 다른 구성 요소에 직접적으로 연결 또는 접속되어 있을 수도 있지만, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 한다.
또한 '제1, 제2' 등과 같은 표현은 복수의 구성들을 구분하기 위한 용도로만 사용된 표현으로써, 구성들 사이의 순서나 기타 특징들을 한정하지 않는다.
이하에서는 도면들을 참조하여 본 발명의 실시예들에 대해 설명하도록 한다.
도 1 내지 도 5에서는 머신러닝 알고리즘의 의사결정 과정 설명을 여신 심사 의사결정 및 특정 병의 발생 확률을 제시하는 의료분야 적용 사례를 통해 설명하고 있지만, 본 발명의 실시예가 적용될 수 있는 분야가 이러한 예시에 한정되는 것이 아니며, 머신러닝 알고리즘의 의사결정 과정 설명 장치를 제공하는 데에 있어 머신러닝 알고리즘에 사용된 각 변수의 영향력을 알기 위한 다양한 분야에 본 발명의 실시예가 적용될 수 있다.
도 1은 본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치(200)가 동작하는 원리를 간단하게 설명하기 위한 예시도이다.
도 1을 참조하면, 예를 들어 머신러닝 알고리즘 예측 모델은 특정 사람에 대한 정보를 입력한 경우 해당 사람이 폐암에 걸릴 확률을 도출할 수 있다. 이때 일 예로, 폐암에 걸릴 확률을 도출하기 위한 변수로서, 성별, 음주 여부, 흡연 여부가 변수로 사용될 수 있다. 이때 사람 A가 성별이 남자고 음주를 하지 않으며 흡연을 하지 않을 때, 이러한 정보를 예측 모델에 입력한 경우, 30%의 확률로 폐암에 걸릴 가능성이 있다고 가정한다.
이때 본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치(200)는 사람 A의 폐암 가능성을 예측하는 데에 쓰인 변수에 대한 정보를 변경하여 새로운 확률을 도출한다. 예를 들어, 사람 A가 음주하는 것으로 변경할 경우 폐암 걸릴 확률은 50%가 출력되며, 사람 A가 흡연하는 것으로 입력할 경우 폐암 걸릴 확률은 55%로 출력될 수 있다. 이에 따라, 머신러닝 알고리즘의 의사결정과정 설명 장치(200)는 사람 A의 경우에는 흡연이 음주보다 폐암에 영향을 더 크게 주는 것으로 예측할 수 있다.
도 2는 본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치(200)의 구성을 나타내는 기능 블럭도이다.
도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치(200)는 예측 모델(210), 예측 저장부(220), 입력부(230), 변수 조합부(240), 확률 계산부(250), 비교부(260) 및 설명부(270)를 포함할 수 있다.
본 발명의 일 실시예에 따른 머신러닝 알고리즘의 의사결정과정 설명 장치(200)는 빅데이터를 기반으로 머신러닝을 통해 고객의 특정한 행동 패턴을 예측하는 예측 모델(210)을 기반으로 기존 고객 또는 신규 고객에 대해 예측한 확률을 예측 저장부(220)가 저장하고, 입력부(230)는 기존 고객 또는 신규 고객의 정보를 입력 받아, 변수 조합부(240)는 기존 고객 또는 신규 고객의 정보 중 특정 변수의 정보를 변경한 새로운 변수의 조합을 생성하고, 확률 계산부는 이러한 새로운 변수의 조합을 예측 모델(210)에 입력하여 새로운 예측 확률값을 도출하고, 비교부(260)는 예측 저장부(220)가 저장하고 있는 기존 고객 또는 신규 고객의 예측 확률과 변수를 변경하여 예측된 확률값을 비교하여, 설명부(270)는 각 변수가 특정행동 패턴에 미치는 영향력을 판별할 수 있다.
이때 고객이 갖고 있는 정보는, 고객이 보유하고 변하지 않는 기본적인 성별과 같은 정보부터, 고객의 생활환경 및 소득 및 부채 수준을 고려한 정보뿐만 아니라, 고객의 생활습관에 관한 정보까지 포함할 수 있다. 또한 고객의 거래에 관한 정보는 위와 같이 거래에 직접적으로 관련된 정보에 제한되지 않고 해당 거래를 한 고객의 인적 정보, 재정 정보 등 고객의 속성을 나타내는 정보까지 포함할 수 있다.
예를 들어, 금융기관에서 고객에 대하여 대출을 승인하는 경우 성별, 나이, 주거형태, 급여수준, 부채규모, 과거 상환이력, 모바일 접속 매체, 접속 시간, 음주 및 흡연 습관, 소셜미디어 활용패턴, 등 고객과 관련된 모든 조합을 활용하여 예측할 수 있다.
도 3은 본 발명의 일 실시예에 따라 데이터 조합부의 실제 데이터 조합 결과를 보여주기 위한 여신심사과정에서의 조합 데이터셋을 보여주는 예시도이다.
도 3을 참조하면, 은행 대출을 위한 여신심사인 경우 고객의 거래에 관한 정보는 성별, 나이, 주거 형태, 소득, 부채 규모등의 항목(변수)를 포함할 수 있다. 여신심사를 받기 위한 특정 고객의 경우에 (성별이 남자, 나이가 30대, 주거형태가 아파트, 연소득이 3,000만원, 부채가 500만원)의 데이터 셋이 있다고 가정하자. 이 데이터에서 조합1 데이터셋은 나이가 30대로 변경되고, 조합2 데이터셋은 주거형태가 연립주택으로 변경되고, 조합3 데이터셋은 연소득이 5,000만원으로 증가됨을 보여주고 있다. 연체행동패턴 확률은 확률 계산부(250)에 의해서 원본 및 조합 데이터셋에 대한 연체 행동패턴의 예측 확률을 제시함을 확인 할 수 있다.
도 4는 의료 분야에서 고객에 대한 나이, 음주 여부, 흡연 여부에 따른 원본 데이터셋과 조합 데이터셋을 보여주고 있다. 또한 확률 계산부를 통한 폐암 발병 확률 결과를 제시함으로써, 어떠한 요인에 의해서 폐암이 발병할 확률이 높은지를 확인 할 수 있음을 보여주기 위한 예시도이다.
도 4의 원본 데이터셋은 (성별이 남자이고, 나이가 30대이며, 음주는 하지 않고, 흡연은 하지 않은) 고객에 대해서는 폐암 발병 예측확률을 30%로 머신러닝 알고리즘이 제시하고 있다. 이에 대해서 조합1 데이터셋은 원본 데이터셋에서 나이가 20대로만 변하고, 조합2 데이터셋은 원본 데이터셋에서 음주를 하는 것으로 변경되고, 조합 3 데이터셋은 원본 데이터셋에서 음주를 하는 것으로 변경된 경우를 보여주고 있다.
도 3 및 도 4에서 본 발명의 실시예에 적용될 수 있는 데이터 입력 변수에 대해서는 예시로 보여주는 데이터 변수에 한정되는 것은 아니며, 머신러닝 알고리즘을 활용하여 예측하는 분야에 대해서는 다양한 입력 데이터 변수에 대해서도 적용될 수 있다.
도 5는 도 4에서 예시로 보여주고 있는 의료 분야에서 고객에 대한 나이, 음주 여부, 흡연 여부에 따른 조합 데이터셋에 대한 비교 과정을 설명하기 위한 예시도이다.
도 5를 참조하면, 원본 데이터셋에 대해서는, 폐암발병 예측확률이 30%임을 보여주고 있다. 그리고, 조합1 데이터셋은 원본 데이터셋에서 나이가 20대로만 변경되었을 경우에는 폐암발병 예측확률이 20%임을 나타낸다. 조합2 데이터셋은 음주 여부에 대해서 음주를 하게 변경되었을 경우에는 폐암발병 예측 확률이 50%로 증가함을 보여준다. 조합3 데이터셋은 흡연 여부에 대해서 흡연을 하게 변경되었을 경우에는 폐암발병 예측확률이 55%로 가장 큰 증가된 결과를 제시한다. 따라서, 특정 고객에 대한 폐암발병 예측확률에 가장 큰 차이를 보이는 흡연여부가 폐암발병에 가장 큰 요소임을 확인함으로써 고객에서 흡연을 자제하라고 할 수 있다.
상술한 본 발명의 실시예들은 다양한 수단을 통해 구현될 수 있다. 예를 들어, 본 발명의 실시예들은 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다.
하드웨어에 의한 구현의 경우, 본 발명의 실시예들에 따른 방법은 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서, 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 실시예들에 따른 방법은 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차 또는 함수 등의 형태로 구현될 수 있다. 소프트웨어 코드는 메모리 유닛에 저장되어 프로세서에 의해 구동될 수 있다. 상기 메모리 유닛은 상기 프로세서 내부 또는 외부에 위치하여, 이미 공지된 다양한 수단에 의해 상기 프로세서와 데이터를 주고 받을 수 있다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
200: 머신러닝 알고리즘의 의사결정과정 설명 장치
210: 예측 모델
220: 예측 저장부
230: 입력부
240: 변수 조합부
250: 확률 계산부
260: 비교부
270: 설명부

Claims (10)

  1. 머신러닝 알고리즘을 기반으로 고객의 특정한 행동 패턴을 예측하도록 학습된 예측 모델;
    상기 예측 모델이 소정의 고객에 대한 상기 행동 패턴을 예측한 제1 확률을 저장하는 예측 저장부;
    상기 소정의 고객에 대한 상기 행동 패턴을 예측하는 데에 사용된 변수에 대한 정보를 입력 받는 입력부;
    상기 변수에 대한 정보 중 어느 하나의 정보를 변경시켜 복수의 변수 조합 세트를 생성하는 변수 조합부;
    상기 복수의 변수 조합 세트를 각각 상기 예측 모델에 입력하여 복수의 제2 확률값을 도출하는 확률 계산부;
    상기 제1 확률값 및 상기 복수의 제2 확률값을 비교하는 비교부; 및
    상기 복수의 제2 확률값 중 상기 제1 확률값과 차이가 가장 큰 제2 확률값을 판별하고, 상기 차이가 가장 큰 제2 확률값을 도출하는데에 상기 예측 모델에 입력된 상기 변수 조합 세트를 판별하는 설명부를 포함하는
    머신러닝 알고리즘의 의사결정과정 설명 장치.
  2. 제1항에 있어서,
    상기 변수 조합부는,
    상기 변수에 대한 정보가 상기 변수의 개수를 차원축으로 하는 다차원 공간에서 표현될 때, 상기 다차원 공간에서 상기 변수에 대한 정보가 위치하는 지점으로부터 유클리디안 거리가 기 설정된 거리 이하에 위치하는 정보를 상기 복수의 변수 조합 세트로 생성하는
    머신러닝 알고리즘의 의사결정과정 설명 장치.
  3. 제1항에 있어서,
    상기 설명부는,
    상기 차이가 가장 큰 제2 확률값을 도출하는 데에 상기 예측 모델에 입력된 상기 변수 조합 세트에서 변경된 상기 어느 하나의 정보를 상기 소정의 고객이 상기 행동 패턴을 달성함에 있어 영향이 가장 큰 정보로 판별하는
    머신러닝 알고리즘의 의사결정과정 설명 장치.
  4. 제1항에 있어서,
    상기 변수에 대한 정보는 고객에 대해 불변하는 정보 및 고객에 대해 가변적인 정보를 포함하는
    머신러닝 알고리즘의 의사결정과정 설명 장치.
  5. 하나 이상의 프로세서가 수행하는 머신러닝 알고리즘의 의사결정과정 설명 방법에 있어서,
    머신러닝 알고리즘을 기반으로 고객의 특정한 행동 패턴을 예측하도록 학습된 예측 모델을 마련하는 단계;
    상기 예측 모델이 소정의 고객에 대한 상기 행동 패턴을 예측한 제1 확률을 저장하는 단계;
    상기 소정의 고객에 대한 상기 행동 패턴을 예측하는 데에 사용된 변수에 대한 정보를 입력 받는 단계;
    상기 변수에 대한 정보 중 어느 하나의 정보를 변경시켜 복수의 변수 조합 세트를 생성하는 단계;
    상기 복수의 변수 조합 세트를 각각 상기 예측 모델에 입력하여 복수의 제2 확률값을 도출하는 단계;
    상기 제1 확률값 및 상기 복수의 제2 확률값을 비교하는 단계; 및
    상기 복수의 제2 확률값 중 상기 제1 확률값과 차이가 가장 큰 제2 확률값을 판별하고, 상기 차이가 가장 큰 제2 확률값을 도출하는데에 상기 예측 모델에 입력된 상기 변수 조합 세트를 판별하는 단계를 포함하는
    머신러닝 알고리즘의 의사결정과정 설명 방법.
  6. 제5항에 있어서,
    상기 복수의 변수 조합 세트를 생성하는 단계는
    상기 변수에 대한 정보가 상기 변수의 개수를 차원축으로 하는 다차원 공간에서 표현될 때, 상기 다차원 공간에서 상기 변수에 대한 정보가 위치하는 지점으로부터 유클리디안 거리가 기 설정된 거리 이하에 위치하는 정보를 상기 복수의 변수 조합 세트로 생성하는 단계를 포함하는
    머신러닝 알고리즘의 의사결정과정 설명 방법.
  7. 제5항에 있어서,
    상기 변수 조합 세트를 판별하는 단계는,
    상기 차이가 가장 큰 제2 확률값을 도출하는 데에 상기 예측 모델에 입력된 상기 변수 조합 세트에서 변경된 상기 어느 하나의 정보를 상기 소정의 고객이 상기 행동 패턴을 달성함에 있어 영향이 가장 큰 정보로 판별하는 단계를 포함하는
    머신러닝 알고리즘의 의사결정과정 설명 방법.
  8. 제5항에 있어서,
    상기 변수에 대한 정보는 고객에 대해 불변하는 정보 및 고객에 대해 가변적인 정보를 포함하는
    머신러닝 알고리즘의 의사결정과정 설명 방법.
  9. 제5항 내지 제8항의 어느 한 항의 방법을 프로세서가 수행하도록 하는 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램.
  10. 제5항 내지 제8항의 어느 한 항의 방법을 프로세서가 수행하게 하는 명령어를 포함하는 컴퓨터 프로그램이 기록된 컴퓨터 판독 가능 기록매체.
KR1020170125266A 2017-09-27 2017-09-27 변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법 KR20190036254A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170125266A KR20190036254A (ko) 2017-09-27 2017-09-27 변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170125266A KR20190036254A (ko) 2017-09-27 2017-09-27 변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20190036254A true KR20190036254A (ko) 2019-04-04

Family

ID=66105574

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170125266A KR20190036254A (ko) 2017-09-27 2017-09-27 변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20190036254A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200139603A (ko) * 2019-06-03 2020-12-14 고려대학교 산학협력단 연체 고객의 접촉 시간대 예측 방법, 이를 수행하기 위한 기록매체 및 장치
US11620577B2 (en) 2020-07-01 2023-04-04 International Business Machines Corporation Multi-modal data explainer pipeline
US11651276B2 (en) 2019-10-31 2023-05-16 International Business Machines Corporation Artificial intelligence transparency

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200139603A (ko) * 2019-06-03 2020-12-14 고려대학교 산학협력단 연체 고객의 접촉 시간대 예측 방법, 이를 수행하기 위한 기록매체 및 장치
US11651276B2 (en) 2019-10-31 2023-05-16 International Business Machines Corporation Artificial intelligence transparency
US11620577B2 (en) 2020-07-01 2023-04-04 International Business Machines Corporation Multi-modal data explainer pipeline

Similar Documents

Publication Publication Date Title
US11853854B2 (en) Method of automating data science services
US20210248612A1 (en) Method of operating artificial intelligence machines to improve predictive model training and performance
US20240046156A1 (en) Data clean-up method for improving predictive model training
US12073307B2 (en) Predicting likelihoods of conditions being satisfied using neural networks
Turgeman et al. Insights from a machine learning model for predicting the hospital Length of Stay (LOS) at the time of admission
Oreski et al. Hybrid system with genetic algorithm and artificial neural networks and its application to retail credit risk assessment
US11610152B2 (en) Machine learning model development and optimization process that ensures performance validation and data sufficiency for regulatory approval
Linden et al. Using machine learning to identify structural breaks in single‐group interrupted time series designs
US9652712B2 (en) Analyzing health events using recurrent neural networks
US20170032241A1 (en) Analyzing health events using recurrent neural networks
US20180285969A1 (en) Predictive model training and selection for consumer evaluation
Ala’raj et al. A deep learning model for behavioural credit scoring in banks
US11804302B2 (en) Supervised machine learning-based modeling of sensitivities to potential disruptions
KR20190036254A (ko) 변수별 영향도에 기반한 개인별 행동패턴을 설명가능한 머신러닝 예측 모형 제공 장치 및 방법
Raval et al. A semiparametric discrete choice model: An application to hospital mergers
Lasaga et al. Deep learning to detect medical treatment fraud
WO2023018976A2 (en) Methods and computer systems for automated event detection based on machine learning
Gao et al. Confounding-robust policy improvement with human-ai teams
Anderson Testing machine learning explanation methods
Paigude et al. Deep Learning Model for Work-Life Balance Prediction for Working Women in IT Industry
US8688610B1 (en) Estimation of individual causal effects
Moroz et al. hART: Deep learning-informed lifespan heart failure risk trajectories
Cinaroglu A Fresh Look at Out-of-Pocket Health Expenditures after More than a Decade Health Reform Experience in Turkey: A Data Mining Application
Filikov et al. Use of Stratified Cascade Learning to predict hospitalization risk with only socioeconomic factors
Jeyarajah et al. Influence function-based empirical likelihood for inference of quantile medical costs with censored data