KR20190021189A - 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체 - Google Patents

모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체 Download PDF

Info

Publication number
KR20190021189A
KR20190021189A KR1020187024854A KR20187024854A KR20190021189A KR 20190021189 A KR20190021189 A KR 20190021189A KR 1020187024854 A KR1020187024854 A KR 1020187024854A KR 20187024854 A KR20187024854 A KR 20187024854A KR 20190021189 A KR20190021189 A KR 20190021189A
Authority
KR
South Korea
Prior art keywords
model
customer information
predetermined
information samples
analyzed
Prior art date
Application number
KR1020187024854A
Other languages
English (en)
Inventor
이윈 천
Original Assignee
핑안 테크놀로지 (션젼) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 핑안 테크놀로지 (션젼) 컴퍼니 리미티드 filed Critical 핑안 테크놀로지 (션젼) 컴퍼니 리미티드
Publication of KR20190021189A publication Critical patent/KR20190021189A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • G06N3/0481
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Geometry (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Hardware Design (AREA)

Abstract

본 발명은 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체를 개시하고, 이 방법은 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계와, 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력하는 단계를 포함한다. 본 발명은 다양한 모델을 결합하고 결합된 복합 모델을 이용하여 분석, 예측을 하기 때문에 상이한 모델의 장점을 결합할 수 있어 단일 모델의 예측과 비교하면 예측 결과의 정확도를 효율적으로 향상시킨다.

Description

모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체
본 발명은 컴퓨터 기술 분야에 관한 것으로, 특히 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체에 관한 것이다.
현재, 금융, 보험 등 영역의 데이터 마이닝 예측 프로젝트에서, 업계가 일반적으로 단일 모델을 이용하여 특정 타겟 이벤트(예를 들어, 보험 배상 이벤트)를 예측하고, 상이한 유형의 모델에 따라 타겟 이벤트에 대한 해석 입장과 중점이 다를 수 있는 것은 널리 알려져 있기 때문에 단일 모델을 이용하면 예측 결과의 정확도가 매우 큰 한계를 가지고 예측의 오류율이 높아지게 된다.
본 발명의 주된 목적은 예측 결과의 정확도를 향상시키기 위해, 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체를 제공하고자 한다.
상기 목적을 달성하기 위해, 본 발명은 첫번째 방면에 있어서 모델 분석 방법을 개시하고 상기 방법은 다음과 같은 단계를 포함한다.
A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
또한, 상기 목적을 달성하기 위해, 본 발명은 두번째 방면에 있어서 모델 분석 장치를 개시하고 상기 모델 분석 장치는 처리장비, 저장장치를 포함하고, 이 저장장치에 모델 분석 프로그램이 저장되고 이 모델 분석 프로그램은 상기 처리 장비에 의해 다음과 같은 단계를 수행한다.
A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
본 발명은 셋번째 방면에 있어서, 컴퓨터 판독 가능한 저장매체를 개시하고, 그에 처리장비에 의해 실행된 적어도 하나의 컴퓨터 판독 가능한 명령이 저장되어 다음과 같은 동작을 구현할 수 있다.
A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
본 발명에 따른 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체는, 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하며, 훈련된 당양한 모델을 복합 모델로 결합하고 분석할 고객 정보를 수신한 후 결합된 복합 모델을 이용하여 이 분석할 고객 정보를 분석한다. 다양한 모델을 결합하고 결합된 복합 모델을 이용하여 분석, 예측을 하기 때문에 상이한 모델의 장점을 결합할 수 있어 단일 모델의 예측과 비교하면 예측 결과의 정확도를 효율적으로 향상시킨다.
도1은 본 발명에 따른 모델 분석 방법의 일 실시예의 흐름도이다.
도2는 도1에서의 단계S10의 세분화 흐름도이다.
도3은 본 발명에 따른 모델 분석 장치의 일 실시예의 도면이다.
본 발명의 목적 실현, 기능 특징 및 장점에 대해 실시예를 통해 도면을 참조하여 설명하기로 한다.
본 발명이 해결하고자 하는 기술문제, 기술방안, 유익 효과를 더 명확하고 뚜렷하게 하기 위해, 하기와 같은 도면과 실시예를 통해 본 발명에 대해 진일보 상세하게 설명하기로 한다. 여기서에서 설명하는 구체적인 실시예는 본 발명을 예시적으로 설명하기 위한 것일 뿐 본 발명을 한정하기 위한 것이 아니다.
본 발명은 모델 분석 방법을 개시한다.
도1을 참조하면, 도1은 본 발명에 따른 모델 분석 방법의 일 실시예의 흐름도이다.
일 실시예에 있어서, 이 모델 분석 방법은 다음과 같은 단계를 포함한다.
단계S10, 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
본 실시예에 있어서, 미리 설정된 개수(예를 들어, 10만)의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다. 예를 들어, 상기 고객 정보 샘플에서의 고객 정보는 성별, 나이, 연락처, 집주소, 직장, 신용 조회 기록, 소지하고 있는 보험 상품 정보, 보험가입 습관, 배상 이력 정보 등을 포함하나 이에 한정하지 않으며, 소지하고 있는 보험 상품 정보는 보장형 보험 상품, 수익형 보험 상품, 단기형 보험 상품, 종신형 보험 상품등을 포함하나 이에 한정하지 않으며, 보험가입 습관은 한 고객이 일정한 시간(예를 들어, 최근 1년이나 3년) 동안에 소지하고 있는 보험 상품 중 가장 긴 유지 시간을 갖는 상품이나 최대 유지비를 갖는 상품이 이 고객의 보험가입 습관을 대표한다. 예를 들어, 한 고객이 소지하고 있는 보험 상품 중 미리 설정된 비율(예를 들어, 60%)을 초과하는 상품은 보장형 상품이면, 이 고객의 보험가입 습관이 보장형 상품을 선호하는 것을 대표한다.
미리 결정된 훈련하여야 할 모델은 결정 트리(Decision Tree)모델, 선형 회귀 모델, 로지스틱 회귀(Logistic regression) 모델, 신경 네트워크(Neural Networks, NN) 모델 등을 포함하나 이에 한정하지 않은다. 그 중, 결정 트리 모델은 간단하나 많이 사용되는 분류기로서, 데이터를 훈련하여 결정 트리를 구축함으로써 미지의 데이터를 효율적으로 분류할 수 있다. 결정 트리 모델은 가독성이 좋고 기술성을 구비하고 수동 분석에 유용하며, 효율이 높다. 선형 회귀 모델은 일차원 선형 회귀이나 다변수 선형 회귀 모델일 수도 있고, 일차원 선형 회귀는 주요 영향 요인이고 독립변수로서 종속변수의 변화를 설명하며, 현실 문제 연구에서 종속변수의 변화는 여러 중요요인의 영향을 받으며, 이 때 2개 또는 2개 이상의 영향 요인을 독립변수로 하여 종속변수의 변화를 설명하여야 하는데, 이는 다변수 회귀 즉, 다중 회귀이다. 다수의 독립변수와 종속변수 사이에 선형 관계가 있는 경우, 실시하는 회귀분석은 다중 회귀이다. 로지스틱 회귀 모델은 현재 업계 많이 사용되는 기계 학습 모델로서, 어느 사물의 가능성을 예측하기 위한 것이고, 본 실시예의 경우, 고객의 보험가입 또는 보험가입 유형의 가능성을 예측한다. 신경 네트워크 모델은 대량적이고 간단한 처리 유닛(신경원이라고 한다)은 광범위하게 서로 연결되어 형성된 복잡한 네트워크 시스템이고, 이는 인간 뇌 기능의 여러 기본 특징이 반영되고 고도로 복잡한 비선형 동적 학습 시스템이다. 신경 네트워크는 대규모 병행, 분산메모리 및 처리, 자기 조직, 자기 적응, 자습 능력을 가지고, 특히 여러 요인과 조건을 동시 고려하여야 할 부정확하고 모호한 정보 처리 문제를 처리하기에 적합하다. 예를 들어, 신경 네트워크 모델을 훈련한 후 훈련된 신경 네트워크 모델에 이용하여 고객의 보험 가입의 확률 또는 보험 가입 유형의 확률 등을 예측할 수 있다.
단계S20, 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
미리 설정된 개수의 고객 정보 샘플에 기초하여 훈련된 결정 트리 모델, 선형 회귀 모델, 로지스틱 회귀 모델, 신경 네트워크 모델 등과 같은 다양한 미리 결정된 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합한다. 예를 들어, 상이한 모델의 특점 및 장점에 따르며 분석할 고객 정보의 특점을 종합하여 상이한 모델에 대해 해당 가중치를 설치하며, 종속변수와 목표 변수의 관계가 간단한 선형관계일 뿐이면, 복합 모델을 결합할 때 선형 회귀 모델의 가중치를 향상시킬 수 있어 예측의 속도 및 효율을 향상시키도록 하며, 종속변수가 많고 복잡한 분석을 하여야 하면 복합 모델을 결합할 때 신경 네트워크 모델의 가중치를 향상시킬 수 있어 예측의 정확도를 향상시키도록 한다. 훈련된 다양한 모델을 미리 경정된 결합규칙에 따라 복합 모델로 결합하다가 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합 모델에 입력하여 결정 트리 모델, 선형 회귀 모델, 로지스틱 회귀 모델, 신경 네트워크 모델 등과 같은 다양한 모델의 장점과 서로 다른 판단 각도를 종합하여 이 분석할 고객 정보에 대해 분석, 예측하여 더 정확한 분석 예측 결과를 출력한다.
본 실시예는 미리 설정된 개수의 고객 정보 샘플을 통해 다양한 미리 결정된 모델을 훈련하고 훈련된 다양한 모델을 복합 모델로 결합하다가 분석할 고객 정보를 수신한 후 결합된 복합 모델을 이용하여 이 분석할 고객 정보를 분석한다. 다양한 모델을 결합하고 결합된 복합 모델을 이용하여 분석, 예측을 하기 때문에 상이한 모델의 장점을 결합할 수 있어 단일 모델의 예측과 비교하면 예측 결과의 정확도를 효율적으로 향상시킨다.
또한, 다른 실시예에 있어서, 상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합하는 것은 다음과 같다.
상기 복합모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN
본 실시예에 있어서, 훈련된 다양한 모델을 결합할 때, 다양한 모델을 평균하여 복합모델을 결합하면 각 모델의 영향을 고루 고려하여 각 모델의 예측 결과를 균형하게 하여 각 모델의 예측 결과의 차이가 많지 않은 경우 가장 합리적인 예측 결과를 얻은다.
또한, 다른 실시예에 있어서, 상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합하는 것은 다음과 같다.
상기 복합모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N), 그 중, POWER(Fi,1/N)은 Fi모델이 분석한 결과에 대해 N제곱근을 구한다.
본 실시예에 있어서, 훈련된 다양한 모델을 결합할 때, 각 모델이 분석한 결과에 대해 N제곱근을 구하여 결합하여 복합 모델을 형성하도록 한다. 각 모델의 예측 결과가 최종 결합 모델의 예측 결과에 많은 영향을 끼치며, 각 모델이 결합 모델에서의 작용을 두드러지게 할 수 있어 각 모델이 결합 모델에서의 분석, 예측 작용을 극대화시켜 각 방면의 분석 결과에 기초하여 최종 결합 모델의 예측 결과를 결정하고 예측의 정확도를 향상시킨다.
또한, 다른 실시예에 있어서, 상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합하는 것은 다음과 같다.
상기 복합모델=N/(1/F1+1/F2+......+1/FN)
본 실시예에 있어서, 훈련된 다양한 모델을 결합할 때, 상기 복합모델=N/ (1/F1+1/F2+......+1/FN), 즉, 상기 복합모델=NF1F2*...FN/(F2F3*...FN+ F1F3*...FN+......F1F2*...F(N-1)), 각 모델의 예측결과가 최종 결합 모델의 예측결과에 영향을 끼치는 작용에 기초하며 다수의 모델을 상이하게 결합한 후의 예측 결과가 최종 결합 모델의 예측결과에 끼치는 영향을 고려하여 가장 합리적인 예측결과를 획득하고 예측의 정확도를 더 향상시킨다.
또한, 일 구첵적인 실시방식에 있어서, 로지스틱 회귀, 결정 트리, 신경 네트워크 3종의 모델을 결합하여 결합모델을 형성하며 이 결합 모델이 검증 세트에서의 정확도를 예측하는 표현을 분석한다. 로지스틱 회귀, 결정 트리, 신경 네트워크 3종 모델의 결합에 대하여, 다음과 같이 6가지의 결합 방식이 제공된다. 결합1: 동일한 가중치 평균화 방법 (상기 실시예에서의 상기 복합 모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN과 같다), 결합2: 3개의 모델 확률 가중 평균화 방법, 결합3: 가중 기하학적 결합 평균 모델, 결합4: 가중 블렌딩 기하학적 평균 결합 모델 (상기 실시예에서의 상기 복합 모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N)과 같다), 결합5: 예측 차 자승화 역수 방법. 표 1 에 나타낸 바와 같이, 표1은 로지스틱 회귀, 결합1~결합6 모델이 검증 세트에서 예측하는 상승도를 열거한다. 표1에서의 심도 1-99는 로지스틱 회귀, 결합1~결합6 모델이 검증 세트에서 예측하는 결과과 대응되는 점수가 1%-99%인 샘플을 대표하고, 표1에서의 실험데이터를 통해, 심도가 1인 경우, 결합모델의 평균 표현은 로지스틱 회귀보다 4.5% 상승하며, 심도가 5인 경우, 결합모델의 평균 표현은 로지스틱 회귀보다 5.3% 상승하며, 심도가 10인 경우, 결합모델의 평균 표현은 로지스틱 회귀보다 1.9% 상승하는 것으로 나타난다. 결론적으로 로지스틱 회귀, 결정 트리, 신경 네트워크 3종 모델을 결합함으로써 그의 예측 효과는 단일 로지스틱 회귀 모델의 표현보다 우수하다. 즉, 단일 모델의 예측보다 결합 모델의 예측은 효율적으로 예측결과의 정확도를 향상시킨다.
Figure pct00001
또한, 도2에 도시된 바와 같이, 상기 단계S10은 다음과 같은 단계를 포함할 수 있다.
단계S101, 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 한다.
단계S102, 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산한다.
단계S103, 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료한다.
단계S104, 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계S101로 돌아가 수행한다.
본 실시예에 있어서, 미리 설정된 개수의 고객 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 과정에서, 일 종의 미리 결정된 모델을 훈련할 때, 매번의 훈련이 끝난 후 현재 모델의 정확도를 분석 판단하고 각 고객 정보 샘플을 현재 훈련하는 이 모델에 각각 입력하여 분석 및 예측을 하며, 이 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값(예를 들어, 5%)보다 작으면, 현재 모델의 정확도는 높아 훈련이 종료하고 현재 이 모델을 훈련된 모델로 한다. 이 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값(예를 들어, 5%)보다 크거나 같으면, 현재 모델의 정확도는 낮아 미리 설정된 비율 증가폭(예를 들어, 1%)에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭(예를 들어, 1%)에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소(예를 들어, 총 고객 정보 샘플에서 모델이 정확 분석한 고객 정보 샘플이 차지하는 비율은 80%이면, 감소하고 79%로 된다.)하며, 조절된 고객 정보 샘플에 기초하여 이 모델의 정확도가 규정에 도달할 때까지 이 모델을 계속 학습, 훈련한다.
일 종의 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 현재 이 모델의 정확도를 분석 판단하기 때문에 이 모델의 정확도가 규정에 도달할 때까지만 훈련을 종료하여 결합하기 위한 각 종의 미리결정된 모델은 높은 정확도를 가진다. 현재 이 모델의 정확도가 규정에 도달하지 않은 것으로 판단할 때 총 고객 정보 샘플에 이 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하여 이 모델이 잘못 분석하기 쉬운 고객 정보 샘플 유형으로 이 모델에 대해 중점적으로 학습, 훈련하고 맞춤형이 강하고 모델의 훈련 효율 및 속도를 향상시킨다.
예를 들어, 일 실시 방식에 있어서, 고객이 보험 배상을 청구하는지 여부의 경우, 일반적인 예측 모델은 하나의 업무 목표를 갖고, 예를 들어, 고객이 미래 6개 월 안에 보험 배상을 청구하는지 여부와 보험 배상을 청구하는 확률이 얼마인지를 예측한다. 목표 변수는 Y로 정의되고, 즉, 고객이 보험 배상을 청구하는지 여부, Y는 2치 변수이고, Y=1은 보험 배상을 청구함이고, Y=0은 보험 배상을 청구하지 않음이다. 예측 변수는 목표 변수에 영향을 끼치는 데이터 지표를 선택하는 것이고, 성별, 나이 정보, 소지하고 있는 보험 상품 정보(예를 들어, 보장형 보험 상품, 수익형 보험 상품, 단기형 보험 상품, 종신형 보험 상품 등), 보험가입 습관(예를 들어, 한 고객이 소지하고 있는 보험 상품 중 미리 설정된 비율을 초과하는 상품은 보장형 상품이면, 이 고객의 보험가입 습관이 보장형 상품을 선호하는 것을 대표한다.), 배상 이력 정보 등을 포함한다. 고객의 예측 변수와 목표 변수에 따라 결정 트리 모델을 구축할 수 있고, 결정 트리 모델이 구축되면 어느 고객 정보가 주어지면 이 결정 트리 모델은 각 고객 보험 배상의 확률을 제공하며, 한계값이 0.5이면 이 결정 트리 모델은 고객 보험 배상의 확률이 0.5보다 큰 것으로 예측하면 고객이 미래 6개 월 안에 보험 배상을 청구할 것으로 판단하고, 이 결정 트리 모델은 고객 보험 배상의 확률이 0.5보다 작은 것으로 예측하면 고객이 미래 6개 월 안에 보험 배상을 청구하지 않은 것으로 판단한다. 이 결정 트리 모델에 의해 예측된 고객 보험 배상 청구여부의 변수는 hat(Y)로 하고 hat(Y)와 고객의 실제 보험 배상 상황을 비교한다. hat(Y)=Y이면, 이 샘플이 정확 학습되고 hat(Y)와 Y가 같지 않으면, 이 샘플이 정확하게 잘못 학습되며, 이로써 모든 잘못 학습된 고객 정보 샘플, 즉, 이 결정 트리 모델에 의해 잘못 분석된 고객 정보 샘플을 결정할 수 있다.
본 발명은 모델 분석 장치를 더 개시한다.
도3을 참조하면, 도3은 본 발명에 따른 모델 분석 장치의 일 실시예의 도면이다.
일 실시예에 있어서, 이 모델 분석 장치(2)는 PC(Personal Computer, 퍼스널 컴퓨터)일 수도 있고 스마트폰, 태블릿 PC, 전자책 리더기, 포켓 컴퓨터 등 단말 장치일 수도 있다.
이 모델 분석 장치(2)는 저장 장치(11), 처리장비 (12), 통신 버스(13) 및 네트워크 인터페이스(14)를 포함한다.
그 중, 저장 장치(11)는 적어도 한 종류의 판독 가능한 저장매체를 포함하고, 상기 판독 가능한 저장매체는 플래시 메모리, 하드 디스크, 멀티미디어 카드, 카드 타입 메모리(예를 들어, SD 또는 DX 메모리 등), 자기 메모리, 자기 디스크, 시디롬 등을 포함한다. 일부 실시예에 있어서, 저장 장치(11)는 소셜 네트워크에 기초한 사용자 키워드 추출 장치의 내부 저장 유닛일 수 있고, 예를 들어, 이 보델 분석 장치의 하드 디스크일 수 있다. 다른 일부 실시예에 있어서, 저장 장치(11)는 모델 분석 장치의 외부 저장 유닛일 수도 있고, 예를 들어, 모델 분석 장치에 설치된 플러그인형 하드디스크, 스마트 미디어 카드(Smart Media Card, SMC), 시큐어 디지털(Secure Digital, SD) 카드, 플래시 카드(Flash Card)등과 같다. 또한, 저장 장치(11)는 모델 분석 장치의 내부 저장 유닛을 포함할 뿐만 아니라 외부 저장장치도 포함할 수도 있다. 저장 장치(11)는 모델 분석 장치에 설치된 응용 소프트웨어 및 모델 분석 코드 등의 각 종류의 데이터를 저장할 수도 있고, 이미 출력되거나 출력할 각 종류의 데이터를 일시적으로 저장할 수도 있다.
일부 실시예에 있어서, 처리장비 (12)는 중앙 처리 장치(Central Processing Unit,CPU), 컨트롤러, 마이크로컨트롤러, 또는 기타 데이터 처리 칩일 수 있고, 저장 장치(11)에 저장된 프로그램 코드 또는 처리 데이터를 실행하기 위한 것으로, 예를 들어, 모델 분석 프로그램 등을 실행한다.
네트워크 인터페이스(13)는 표준적 유선 네트워크 인터페이스, 무선 네트워크 인터페이스(예를 들어, WI-FI 인터페이스)를 선택적으로 포함할 수 있고, 이 장치와 다른 전자 장비 사이에서 통신 연결을 구축하기 위한 것이다.
통신 버스(14)는 이 들 모듈 사이의 연결 통신을 구현하기 위한 것이다.
도3은 모듈(11-14)만 가지는 모듈 분석 장치를 도시하나 모든 도시된 모듈을 실시하는 것을 요구하지 않고 더 많거나 적은 모듈으로 대체하여 실시할 수 있다는 것을 이해하여야 한다.
선택적으로, 이 장치는 유저 인터페이스를 더 포함할 수 있고, 유저 인터페이스는 디스플레이 장치(Display), 키보드(Keyboard)와 같은 입력 유닛을 포함할 수 있고, 선택할 수 있는 유저 인터페이스는 표준적인 유선 인터페이스, 무선 인터페이스를 더 포함할 수도 있다. 선택적으로, 일부 실시예에 있어서, 디스플레이 장치는 LED 모니터, 액정 모니터, 터치 액정 모니터 및 OLED(Organic Light-Emitting Diode,유기 발광 다이오드)터치장치 등일 수 있다. 그 중, 디스플레이 장치는 적당히 모니터 또는 디스플레이 유닛이라고 일컫을 수도 있고, 모델 분석 장치에서 처리된 정보를 디스플레이하고 가시화의 유저 인터페이스를 디스플레이한다.
도3에 도시된 장치의 실시예에 있어서, 저장 장치(11)에는 모델 분석 프로그램이 저장되며 처리장비(12)는 저장 장치(11)에 저장된 모델 분석 프로그램을 실행하여 다음과 같은 단계를 수행한다.
A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
본 실시예에 있어서, 미리 설정된 개수(예를 들어, 10만)의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다. 예를 들어, 상기 고객 정보 샘플에서의 고객 정보는 성별, 나이, 연락처, 집주소, 직장, 신용 조회 기록, 소지하고 있는 보험 상품 정보, 보험가입 습관, 배상 이력 정보 등을 포함하나 이에 한정하지 않으며, 소지하고 있는 보험 상품 정보는 보장형 보험 상품, 수익형 보험 상품, 단기형 보험 상품, 종신형 보험 상품등을 포함하나 이에 한정하지 않으며, 보험가입 습관은 한 고객이 일정한 시간(예를 들어, 최근 1년이나 3년) 동안에 소지하고 있는 보험 상품 중 가장 긴 유지 시간을 갖는 상품이나 최대 유지비를 갖는 상품이 이 고객의 보험가입 습관을 대표한다. 예를 들어, 한 고객이 소지하고 있는 보험 상품 중 미리 설정된 비율(예를 들어, 60%)을 초과하는 상품은 보장형 상품이면, 이 고객의 보험가입 습관이 보장형 상품을 선호하는 것을 대표한다.
미리 결정된 훈련하여야 할 모델은 결정 트리(Decision Tree)모델, 선형 회귀 모델, 로지스틱 회귀(Logistic regression) 모델, 신경 네트워크(Neural Networks, NN) 모델 등을 포함하나 이에 한정하지 않은다. 그 중, 결정 트리 모델은 간단하나 많이 사용되는 분류기로서, 데이터를 훈련하여 결정 트리를 구축함으로써 미지의 데이터를 효율적으로 분류할 수 있다. 결정 트리 모델은 가독성이 좋고 기술성을 구비하고 수동 분석에 유용하며, 효율이 높다. 선형 회귀 모델은 일차원 선형 회귀이나 다변수 선형 회귀 모델일 수도 있고, 일차원 선형 회귀는 주요 영향 요인이고 독립변수로서 종속변수의 변화를 설명하며, 현실 문제 연구에서 종속변수의 변화는 여러 중요요인의 영향을 받으며, 이 때 2개 또는 2개 이상의 영향 요인을 독립변수로 하여 종속변수의 변화를 설명하여야 하는데, 이는 다변수 회귀 즉, 다중 회귀이다. 다수의 독립변수와 종속변수 사이에 선형 관계가 있는 경우, 실시하는 회귀분석은 다중 회귀이다. 로지스틱 회귀 모델은 현재 업계 많이 사용되는 기계 학습 모델로서, 어느 사물의 가능성을 예측하기 위한 것이고, 본 실시예의 경우, 고객의 보험가입 또는 보험가입 유형의 가능성을 예측한다. 신경 네트워크 모델은 대량적이고 간단한 처리 유닛(신경원이라고 한다)은 광범위하게 서로 연결되어 형성된 복잡한 네트워크 시스템이고, 이는 인간 뇌 기능의 여러 기본 특징이 반영되고 고도로 복잡한 비선형 동적 학습 시스템이다. 신경 네트워크는 대규모 병행, 분산메모리 및 처리, 자기 조직, 자기 적응, 자습 능력을 가지고, 특히 여러 요인과 조건을 동시 고려하여야 할 부정확하고 모호한 정보 처리 문제를 처리하기에 적합하다. 예를 들어, 신경 네트워크 모델을 훈련한 후 훈련된 신경 네트워크 모델에 이용하여 고객의 보험 가입의 확률 또는 보험 가입 유형의 확률 등을 예측할 수 있다.
B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
미리 설정된 개수의 고객 정보 샘플에 기초하여 훈련된 결정 트리 모델, 선형 회귀 모델, 로지스틱 회귀 모델, 신경 네트워크 모델 등과 같은 다양한 미리 결정된 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합한다. 예를 들어, 상이한 모델의 특점 및 장점에 따르며 분석할 고객 정보의 특점을 종합하여 상이한 모델에 대해 해당 가중치를 설치하며, 종속변수와 목표 변수의 관계가 간단한 선형관계일 뿐이면, 복합 모델을 결합할 때 선형 회귀 모델의 가중치를 향상시킬 수 있어 예측의 속도 및 효율을 향상시키도록 하며, 종속변수가 많고 복잡한 분석을 하여야 하면 복합 모델을 결합할 때 신경 네트워크 모델의 가중치를 향상시킬 수 있어 예측의 정확도를 향상시키도록 한다. 훈련된 다양한 모델을 미리 경정된 결합규칙에 따라 복합 모델로 결합하다가 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합 모델에 입력하여 결정 트리 모델, 선형 회귀 모델, 로지스틱 회귀 모델, 신경 네트워크 모델 등과 같은 다양한 모델의 장점과 서로 다른 판단 각도를 종합하여 이 분석할 고객 정보에 대해 분석, 예측하여 더 정확한 분석 예측 결과를 출력한다.
본 실시예는 미리 설정된 개수의 고객 정보 샘플을 통해 다양한 미리 결정된 모델을 훈련하고 훈련된 다양한 모델을 복합 모델로 결합하다가 분석할 고객 정보를 수신한 후 결합된 복합 모델을 이용하여 이 분석할 고객 정보를 분석한다. 다양한 모델을 결합하고 결합된 복합 모델을 이용하여 분석, 예측을 하기 때문에 상이한 모델의 장점을 결합할 수 있어 단일 모델의 예측과 비교하면 예측 결과의 정확도를 효율적으로 향상시킨다.
또한, 다른 실시예에 있어서, 상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합하는 것은 다음과 같다.
상기 복합모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN
본 실시예에 있어서, 훈련된 다양한 모델을 결합할 때, 다양한 모델을 평균하여 복합모델을 결합하면 각 모델의 영향을 고루 고려하여 각 모델의 예측 결과를 균형하게 하여 각 모델의 예측 결과의 차이가 많지 않은 경우 가장 합리적인 예측 결과를 얻은다.
또한, 다른 실시예에 있어서, 상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합하는 것은 다음과 같다.
상기 복합모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N), 그 중, POWER(Fi,1/N)은 Fi모델이 분석한 결과에 대해 N제곱근을 구한다.
본 실시예에 있어서, 훈련된 다양한 모델을 결합할 때, 각 모델이 분석한 결과에 대해 N제곱근을 구하여 결합하여 복합 모델을 형성하도록 한다. 각 모델의 예측 결과가 최종 결합 모델의 예측 결과에 많은 영향을 끼치며, 각 모델이 결합 모델에서의 작용을 두드러지게 할 수 있어 각 모델이 결합 모델에서의 분석, 예측 작용을 극대화시켜 각 방면의 분석 결과에 기초하여 최종 결합 모델의 예측 결과를 결정하고 예측의 정확도를 향상시킨다.
또한, 다른 실시예에 있어서, 상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델로 결합하는 것은 다음과 같다.
상기 복합모델=N/(1/F1+1/F2+......+1/FN)
본 실시예에 있어서, 훈련된 다양한 모델을 결합할 때, 상기 복합모델=N/ (1/F1+1/F2+......+1/FN), 즉, 상기 복합모델=NF1F2*...FN/(F2F3*...FN+ F1F3*...FN+......F1F2*...F(N-1)), 각 모델의 예측결과가 최종 결합 모델의 예측결과에 영향을 끼치는 작용에 기초하며 다수의 모델을 상이하게 결합한 후의 예측 결과가 최종 결합 모델의 예측결과에 끼치는 영향을 고려하여 가장 합리적인 예측결과를 획득하고 예측의 정확도를 더 향상시킨다.
또한, 일 구첵적인 실시방식에 있어서, 로지스틱 회귀, 결정 트리, 신경 네트워크 3종의 모델을 결합하여 결합모델을 형성하며 이 결합 모델이 검증 세트에서의 정확도를 예측하는 표현을 분석한다. 로지스틱 회귀, 결정 트리, 신경 네트워크 3종 모델의 결합에 대하여, 다음과 같이 6가지의 결합 방식이 제공된다. 결합1: 동일한 가중치 평균화 방법 (상기 실시예에서의 상기 복합 모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN과 같다), 결합2: 3개의 모델 확률 가중 평균화 방법, 결합3: 가중 기하학적 결합 평균 모델, 결합4: 가중 블렌딩 기하학적 평균 결합 모델 (상기 실시예에서의 상기 복합 모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N)과 같다), 결합5: 예측 차 자승화 역수 방법. 표 1 에 나타낸 바와 같이, 표1은 로지스틱 회귀, 결합1~결합6 모델이 검증 세트에서 예측하는 상승도를 열거한다. 표1에서의 심도 1-99는 로지스틱 회귀, 결합1~결합6 모델이 검증 세트에서 예측하는 결과과 대응되는 점수가 1%-99%인 샘플을 대표하고, 표1에서의 실험데이터를 통해, 심도가 1인 경우, 결합모델의 평균 표현은 로지스틱 회귀보다 4.5% 상승하며, 심도가 5인 경우, 결합모델의 평균 표현은 로지스틱 회귀보다 5.3% 상승하며, 심도가 10인 경우, 결합모델의 평균 표현은 로지스틱 회귀보다 1.9% 상승하는 것으로 나타난다. 결론적으로 로지스틱 회귀, 결정 트리, 신경 네트워크 3종 모델을 결합함으로써 그의 예측 효과는 단일 로지스틱 회귀 모델의 표현보다 우수하다. 즉, 단일 모델의 예측보다 결합 모델의 예측은 효율적으로 예측결과의 정확도를 향상시킨다.
Figure pct00002
또한, 일 실시예이 있어서, 상기 단계A는 다음과 같은 단계를 더 포함한다. C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 한다.
D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산한다.
E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료한다.
F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행한다.
본 실시예에 있어서, 미리 설정된 개수의 고객 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 과정에서, 일 종의 미리 결정된 모델을 훈련할 때, 매번의 훈련이 끝난 후 현재 모델의 정확도를 분석 판단하고 각 고객 정보 샘플을 현재 훈련하는 이 모델에 각각 입력하여 분석 및 예측을 하며, 이 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값(예를 들어, 5%)보다 작으면, 현재 모델의 정확도는 높아 훈련이 종료하고 현재 이 모델을 훈련된 모델로 한다. 이 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값(예를 들어, 5%)보다 크거나 같으면, 현재 모델의 정확도는 낮아 미리 설정된 비율 증가폭(예를 들어, 1%)에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭(예를 들어, 1%)에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소(예를 들어, 총 고객 정보 샘플에서 모델이 정확 분석한 고객 정보 샘플이 차지하는 비율은 80%이면, 감소하고 79%로 된다.)하며, 조절된 고객 정보 샘플에 기초하여 이 모델의 정확도가 규정에 도달할 때까지 이 모델을 계속 학습, 훈련한다.
일 종의 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 현재 이 모델의 정확도를 분석 판단하기 때문에 이 모델의 정확도가 규정에 도달할 때까지만 훈련을 종료하여 결합하기 위한 각 종의 미리결정된 모델은 높은 정확도를 가진다. 현재 이 모델의 정확도가 규정에 도달하지 않은 것으로 판단할 때 총 고객 정보 샘플에 이 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하여 이 모델이 잘못 분석하기 쉬운 고객 정보 샘플 유형으로 이 모델에 대해 중점적으로 학습, 훈련하고 맞춤형이 강하고 모델의 훈련 효율 및 속도를 향상시킨다.
예를 들어, 일 실시 방식에 있어서, 고객이 보험 배상을 청구하는지 여부의 경우, 일반적인 예측 모델은 하나의 업무 목표를 갖고, 예를 들어, 고객이 미래 6개 월 안에 보험 배상을 청구하는지 여부와 보험 배상을 청구하는 확률이 얼마인지를 예측한다. 목표 변수는 Y로 정의되고, 즉, 고객이 보험 배상을 청구하는지 여부, Y는 2치 변수이고, Y=1은 보험 배상을 청구함이고, Y=0은 보험 배상을 청구하지 않음이다. 예측 변수는 목표 변수에 영향을 끼치는 데이터 지표를 선택하는 것이고, 성별, 나이 정보, 소지하고 있는 보험 상품 정보(예를 들어, 보장형 보험 상품, 수익형 보험 상품, 단기형 보험 상품, 종신형 보험 상품 등), 보험가입 습관(예를 들어, 한 고객이 소지하고 있는 보험 상품 중 미리 설정된 비율을 초과하는 상품은 보장형 상품이면, 이 고객의 보험가입 습관이 보장형 상품을 선호하는 것을 대표한다.), 배상 이력 정보 등을 포함한다. 고객의 예측 변수와 목표 변수에 따라 결정 트리 모델을 구축할 수 있고, 결정 트리 모델이 구축되면 어느 고객 정보가 주어지면 이 결정 트리 모델은 각 고객 보험 배상의 확률을 제공하며, 한계값이 0.5이면 이 결정 트리 모델은 고객 보험 배상의 확률이 0.5보다 큰 것으로 예측하면 고객이 미래 6개 월 안에 보험 배상을 청구할 것으로 판단하고, 이 결정 트리 모델은 고객 보험 배상의 확률이 0.5보다 작은 것으로 예측하면 고객이 미래 6개 월 안에 보험 배상을 청구하지 않은 것으로 판단한다. 이 결정 트리 모델에 의해 예측된 고객 보험 배상 청구여부의 변수는 hat(Y)로 하고 hat(Y)와 고객의 실제 보험 배상 상황을 비교한다. hat(Y)=Y이면, 이 샘플이 정확 학습되고 hat(Y)와 Y가 같지 않으면, 이 샘플이 정확하게 잘못 학습되며, 이로써 모든 잘못 학습된 고객 정보 샘플, 즉, 이 결정 트리 모델에 의해 잘못 분석된 고객 정보 샘플을 결정할 수 있다.
선택적으로는, 다른 실시예에 있어서, 모델 분석 프로그램은 하나 또는 다수 개의 모듈로 분할될 수도 있고, 하나 또는 다수 개의 모듈은 저장 장치(11)에 저장되고 하나 또는 다수 개의 프로세서(본 발명의 실시예에서 처리 장치(12)를 이용한다)에 실행되어 본 발명을 구현하도록 하며, 본 발명에서 언급한 모듈은 특정 기능을 수행할 수 있는 일련의 컴퓨터 프로그램 명령 세그먼트를 뜻한다. 예를 들어, 도4에 도시된 바와 같이, 도4는 본 발명의 모델 분석 장치의 일 실시예에 따른 모델 분석 프로그램의 기능 모듈의 도면이고, 이 실시예에 있어서, 모델 분석 프로그램은 훈련 모듈(10) 및 분석 모듈(20)로 분할될 수도 있고, 그 중, 분석 모듈(10)과 분석 모듈(20)에 의해 실현된 기능과 작동 단계는 전술과 유사해서 여기서 생략하기로 하며, 예시적으로 예를 들어, 그 중,
훈련 모듈(10)은 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
분석 모듈(20)은 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
또한, 본 발명의 실시예는 컴퓨터 판독 가능한 저장매체를 더 개시하고, 상기 컴퓨터 판독 가능한 저장매체에는 처리장비에 의해 실행될 적어도 하나의 컴퓨터 판독 가능한 명령을 저장하여 다음과 같은 동작을 수행한다.
A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련한다.
B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력한다.
본 발명에 따른 컴퓨터 판독 가능한 저장매체의 구체적인 실시방식은 상기 모델 분석 장치와 모델 분석 방법의 각 실시예와 유사하여 여기서 생략하기로 한다.
본 명세서에 있어서, 용어 "포함하다", "구성하다" 또는 이의 임의 기타 변형은 비 배타성의 포함을 뜻하여 일련의 요소를 포함하는 과정, 방법, 물품 또는 장치는 그런 요소를 포함할 뿐만 아니라 명확하게 열거하지 않은 기타 요소도 포함하거나 이런 과정, 방법, 물품 또는 장치가 고유한 요소를 포함한다. 더 많은 한정이 없는 한 문구 "하나의 ...... 포함한다"에 의해 한정된 요소는 이 요소의 과정, 방법, 물품 또는 장치에는 다른 동일한 요소가 존재한다는 것을 배제하지 않다.
본 기술분야의 당업자에게 있어서 상기와 같은 실시방식에 대한 설명을 통해 상기 실시예 방법이 소프트웨어와 필요하고 통용한 하드웨어 플랫폼으로 구현될 수 있으며 몰론 하드웨어를 통해 구현될 수 있지만 대부분의 경우에서 전자가 바람직한 실시방식임은 자명한 것이다. 이런 이해에 기초하여 본 발명의 기술방안 본질적으로 또는 종래 기술에 공헌할 부분은 소프트웨어 상품으로 구현될 수 있고 이 컴퓨터 소프트웨어 상품은 하나의 저장매체(예를 들어, ROM/RAM, 자기 디스크, 광 디스크)에 저장되고 여러 명령을 포함하여 하나의 단말기장치(휴대폰, 컴퓨터, 서버, 에어컨, 네트워크 장비 등)를 통해 본 발명에 따른 각각의 실시예의 방법을 수행한다.
상기와 같은 실시예는 본 발명의 바람직한 실시예로서 본 발명에 대해 한정하고자 하는 것이 아니다. 상기와 같은 본 발명에 따른 실시예의 순번은 설명하기 위한 것일 뿐 실시예의 우열을 가리기 위한 것이 아니다. 또한, 흐름도에서 논리 순서를 나타내지만 어떤 경우에서 여기의 순서와 다르게 상기 도시되거나 설명된 단계를 수행한다.
본 영역의 기술자들은 본 발명의 범위와 실질을 벗지 않고 여러 가지의 변형방안으로 본 발명을 이룰 수 있으며, 예를 들어, 한 실시예의 특징으로서 다른 실시예에 적용되어 또 다른 실시예를 얻을 수 있다. 본 발명의 기술사상에서 임의 수정, 등가치환, 개진은 모두 본 발명의 특허보호범위내에 포함된다.

Claims (20)

  1. A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계와,
    B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력하는 단계를 포함하는 것을 특징으로 하는 모델 분석 방법.
  2. 제1항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 방법.
  3. 제1항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN 인 것을 특징으로 하는 모델 분석 방법.
  4. 제3항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 방법.
  5. 제1항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N) 이고, 그 중, POWER(Fi,1/N)은 Fi모델이 분석한 결과에 대해 N제곱근을 구하는 것을 특징으로 하는 모델 분석 방법.
  6. 제5항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 방법.
  7. 제1항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델=N/(1/F1+1/F2+......+1/FN) 인 것을 특징으로 하는 모델 분석 방법.
  8. 제7항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 방법.
  9. 처리장비, 저장장치를 포함하고, 이 저장장치에 모델 분석 프로그램이 저장되고 이 모델 분석 프로그램은 상기 처리 장비에 의해,
    A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계와,
    B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력하는 단계를 수행하는 것을 특징으로 하는 모델 분석 장치.
  10. 제9항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 장치.
  11. 제9항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN 인 것을 특징으로 하는 모델 분석 장치.
  12. 제11항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 장치.
  13. 제9항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N) 이고, 그 중, POWER(Fi,1/N)은 Fi모델이 분석한 결과에 대해 N제곱근을 구하는 것을 특징으로 하는 모델 분석 장치.
  14. 제13항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 장치.
  15. 제9항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델=N/(1/F1+1/F2+......+1/FN) 인 것을 특징으로 하는 모델 분석 장치.
  16. 제15항에 있어서,
    상기 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 단계는,
    C. 미리 결정된 모델을 훈련하는 과정에서 매번의 훈련이 끝난 후 각 고객 정보 샘플을 현재 훈련하는 모델에 각각 입력하여 모델이 잘못 분석한 고객 정보 샘플을 결정하도록 하는 단계와,
    D. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작은지 여부를 계산하는 단계와,
    E. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 작으면, 이 미리 결정된 모델의 훈련은 종료하는 단계와,
    F. 모델이 잘못 분석한 고객 정보 샘플 개수가 전부 고객 정보 샘플 개수에서 차지하는 비율이 한계값보다 크거나 같으면, 미리 설정된 비율 증가폭에 따라 총 고객 정보 샘플에는 모델이 잘못 분석한 고객 정보 샘플과 같은 유형에 속한 고객 정보 샘플의 비율을 증가하고 미리 설정된 비율 감소폭에 따라 총 고객 정보 샘플에서는 모델이 정확 분석한 고객 정보 샘플의 비율을 감소하며 상기 단계C, D, E, F로 돌아가 수행하는 단계를 포함하는 것을 특징으로 하는 모델 분석 장치.
  17. 처리장비에 의해 실행된 적어도 하나의 컴퓨터 판독 가능한 명령이 저장되어,
    A. 미리 설정된 개수의 고객 정보 샘플에 기초하여 다양한 미리 결정된 모델을 훈련하는 동작과,
    B. 미리 결정된 결합규칙에 따라 훈련된 당양한 모델을 복합 모델로 결합하며, 분석할 고객 정보를 수신한 후 이 분석할 고객 정보를 상기 복합모델에 입력하여 분석 결과를 출력하는 동작을 수행하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장매체.
  18. 제17항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델=(1/N)*F1+(1/N)*F2+......+(1/N)*FN 인 것을 특징으로 하는 컴퓨터 판독 가능한 저장매체.
  19. 제17항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델= POWER(F1,1/N)*POWER(F2,1/N)*......*POWER(FN,1/N) 이고, 그 중, POWER(Fi,1/N)은 Fi모델이 분석한 결과에 대해 N제곱근을 구하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장매체.
  20. 제17항에 있어서,
    상기 미리 결정된 모델의 개수는 N이고, N은 2보다 큰 자연수이고, i번째의 미리 결정된 모델은 Fi로 표시되고, i는 N보다 작거나 같은 양의 정수이고, 상기 훈련된 다양한 모델을 미리 결정된 결합규칙에 따라 복합모델은,
    상기 복합모델=N/(1/F1+1/F2+......+1/FN) 인 것을 특징으로 하는 컴퓨터 판독 가능한 저장매체.
KR1020187024854A 2017-05-05 2017-08-31 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체 KR20190021189A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710311997.6A CN107766929B (zh) 2017-05-05 2017-05-05 模型分析方法及装置
CN201710311997.6 2017-05-05
PCT/CN2017/100042 WO2018201646A1 (zh) 2017-05-05 2017-08-31 模型分析方法、装置、及计算机可读存储介质

Publications (1)

Publication Number Publication Date
KR20190021189A true KR20190021189A (ko) 2019-03-05

Family

ID=61265240

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187024854A KR20190021189A (ko) 2017-05-05 2017-08-31 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체

Country Status (8)

Country Link
US (1) US11507963B2 (ko)
EP (1) EP3428854A4 (ko)
JP (1) JP2019519821A (ko)
KR (1) KR20190021189A (ko)
CN (1) CN107766929B (ko)
AU (1) AU2017408798A1 (ko)
SG (1) SG11201900264PA (ko)
WO (1) WO2018201646A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492191B (zh) * 2018-09-17 2024-05-07 平安科技(深圳)有限公司 计算投保概率的方法、装置、计算机设备和存储介质
US11124185B2 (en) * 2018-11-13 2021-09-21 Zoox, Inc. Perception collision avoidance
JP7167668B2 (ja) * 2018-11-30 2022-11-09 コニカミノルタ株式会社 学習方法、学習装置、プログラムおよび記録媒体
US10977738B2 (en) * 2018-12-27 2021-04-13 Futurity Group, Inc. Systems, methods, and platforms for automated quality management and identification of errors, omissions and/or deviations in coordinating services and/or payments responsive to requests for coverage under a policy
CN109816158A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 预测模型的组合方法、装置、设备及可读存储介质
CN110321944A (zh) * 2019-06-26 2019-10-11 华中科技大学 一种基于接触网画质评估的深度神经网络模型的构建方法
CN111402068B (zh) * 2020-02-22 2023-07-25 中国平安财产保险股份有限公司 基于大数据的保费数据分析方法、装置及存储介质
CN111489134B (zh) * 2020-04-13 2024-05-10 深圳前海微众银行股份有限公司 数据模型的构建方法、装置、设备及计算机可读存储介质
CN111581615A (zh) * 2020-05-08 2020-08-25 南京大创师智能科技有限公司 一种向个人提供人工智能平台的方法及系统
US20220138632A1 (en) * 2020-10-29 2022-05-05 Accenture Global Solutions Limited Rule-based calibration of an artificial intelligence model
CN113457167A (zh) * 2021-06-29 2021-10-01 网易(杭州)网络有限公司 用户分类网络的训练方法、用户分类方法及装置
CN113487182B (zh) * 2021-07-06 2024-04-26 新奥新智科技有限公司 设备健康状态评估方法、装置、计算机设备和介质
US11651380B1 (en) * 2022-03-30 2023-05-16 Intuit Inc. Real-time propensity prediction using an ensemble of long-term and short-term user behavior models

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1723596A1 (en) * 2004-02-27 2006-11-22 Accenture Global Services GmbH System for individualized customer interaction
US7958063B2 (en) * 2004-11-11 2011-06-07 Trustees Of Columbia University In The City Of New York Methods and systems for identifying and localizing objects based on features of the objects that are mapped to a vector
US7496549B2 (en) * 2005-05-26 2009-02-24 Yahoo! Inc. Matching pursuit approach to sparse Gaussian process regression
US8719073B1 (en) * 2005-08-25 2014-05-06 Hewlett-Packard Development Company, L.P. Producing a measure regarding cases associated with an issue after one or more events have occurred
US7937350B2 (en) * 2007-02-14 2011-05-03 International Business Machines Corporation Method, system and program product for determining a time for retraining a data mining model
US20090240539A1 (en) * 2008-03-21 2009-09-24 Microsoft Corporation Machine learning system for a task brokerage system
US8762180B2 (en) * 2009-08-25 2014-06-24 Accenture Global Services Limited Claims analytics engine
CN102184453A (zh) * 2011-05-16 2011-09-14 上海电气集团股份有限公司 基于模糊神经网络和支持向量机的风电功率组合预测方法
US8620840B2 (en) * 2011-07-19 2013-12-31 Nice Systems Technologies Uk Limited Distributed scalable incrementally updated models in decisioning systems
CN102270309B (zh) 2011-07-27 2013-05-01 华北电力大学 一种基于集成学习的短期电力负荷预测方法
CN102508907B (zh) * 2011-11-11 2013-11-20 北京航空航天大学 一种基于训练集优化的推荐系统的动态推荐方法
CN102663513B (zh) * 2012-03-13 2016-04-20 华北电力大学 利用灰色关联度分析的风电场功率组合预测建模方法
US9070046B2 (en) * 2012-10-17 2015-06-30 Microsoft Technology Licensing, Llc Learning-based image webpage index selection
US20150032598A1 (en) * 2013-07-26 2015-01-29 Corelogic Solutions, Llc System and method for generating a natural hazard credit model
CN103679287A (zh) * 2013-12-05 2014-03-26 王海燕 一种组合型电力负荷预测方法
US10289962B2 (en) * 2014-06-06 2019-05-14 Google Llc Training distilled machine learning models
US9697469B2 (en) * 2014-08-13 2017-07-04 Andrew McMahon Method and system for generating and aggregating models based on disparate data from insurance, financial services, and public industries
JP6239486B2 (ja) 2014-11-05 2017-11-29 株式会社東芝 予測モデル作成方法
US9280740B1 (en) * 2015-01-12 2016-03-08 Bank Of America Corporation Transforming predictive models
JP6678930B2 (ja) * 2015-08-31 2020-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 分類モデルを学習する方法、コンピュータ・システムおよびコンピュータ・プログラム
CN105719002A (zh) * 2016-01-18 2016-06-29 重庆大学 一种基于组合预测的风电机组状态参数异常辨识方法
CN106157132A (zh) * 2016-06-20 2016-11-23 中国工商银行股份有限公司 信用风险监控系统及方法
CN105894138A (zh) * 2016-06-28 2016-08-24 山东大学 一种制造业发货量的最优加权组合预测方法
CN106355140B (zh) * 2016-08-22 2018-03-02 平安科技(深圳)有限公司 车辆检测的方法及装置
CN106548210B (zh) 2016-10-31 2021-02-05 腾讯科技(深圳)有限公司 基于机器学习模型训练的信贷用户分类方法及装置
US10671932B1 (en) * 2017-01-27 2020-06-02 Intuit Inc. Software application selection models integration

Also Published As

Publication number Publication date
JP2019519821A (ja) 2019-07-11
US11507963B2 (en) 2022-11-22
EP3428854A1 (en) 2019-01-16
EP3428854A4 (en) 2020-05-13
US20210117989A1 (en) 2021-04-22
AU2017408798A1 (en) 2018-11-22
CN107766929A (zh) 2018-03-06
SG11201900264PA (en) 2019-02-27
WO2018201646A1 (zh) 2018-11-08
CN107766929B (zh) 2019-05-24

Similar Documents

Publication Publication Date Title
KR20190021189A (ko) 모델 분석 방법, 장치 및 컴퓨터 판독 가능한 저장매체
CN112632385A (zh) 课程推荐方法、装置、计算机设备及介质
US11704500B2 (en) Techniques to add smart device information to machine learning for increased context
US20140330548A1 (en) Method and system for simulation of online social network
CN112035549B (zh) 数据挖掘方法、装置、计算机设备及存储介质
US11403550B2 (en) Classifier
CN112329816A (zh) 数据分类方法、装置、电子设备和可读存储介质
CN112328909A (zh) 信息推荐方法、装置、计算机设备及介质
CN110276382A (zh) 基于谱聚类的人群分类方法、装置及介质
CN112819024B (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN112686301A (zh) 基于交叉验证的数据标注方法及相关设备
CN117093477A (zh) 一种软件质量评估方法、装置、计算机设备及存储介质
CN117235633A (zh) 机构分类方法、装置、计算机设备及存储介质
CN103049629A (zh) 一种检测噪音数据的方法及装置
CN116843483A (zh) 一种车险理赔方法、装置、计算机设备及存储介质
CN116843395A (zh) 一种业务系统的告警分级方法、装置、设备及存储介质
CN113240323A (zh) 基于机器学习的水平评测方法、装置及相关设备
CN112329943A (zh) 组合指标的甄选方法、装置、计算机设备及介质
CN116307742B (zh) 一种细分客群的风险识别方法、装置、设备及存储介质
CN117114894A (zh) 一种理赔结果预测方法、装置、设备及其存储介质
CN116630059A (zh) 基于人工智能的流失预测方法、装置、设备及存储介质
CN114513578A (zh) 外呼方法、装置、计算机设备及存储介质
CN117217812A (zh) 一种用户行为预测方法、装置、计算机设备及存储介质
Kraus et al. Credit scoring optimization using the area under the curve
CN116611941A (zh) 基于人工智能的欺诈识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application