KR102315497B1 - 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스 - Google Patents

채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스 Download PDF

Info

Publication number
KR102315497B1
KR102315497B1 KR1020197026057A KR20197026057A KR102315497B1 KR 102315497 B1 KR102315497 B1 KR 102315497B1 KR 1020197026057 A KR1020197026057 A KR 1020197026057A KR 20197026057 A KR20197026057 A KR 20197026057A KR 102315497 B1 KR102315497 B1 KR 102315497B1
Authority
KR
South Korea
Prior art keywords
characteristic
card model
scoring
variable
characteristic variable
Prior art date
Application number
KR1020197026057A
Other languages
English (en)
Other versions
KR20190113924A (ko
Inventor
싱 자오
Original Assignee
어드밴스드 뉴 테크놀로지스 씨오., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어드밴스드 뉴 테크놀로지스 씨오., 엘티디. filed Critical 어드밴스드 뉴 테크놀로지스 씨오., 엘티디.
Publication of KR20190113924A publication Critical patent/KR20190113924A/ko
Application granted granted Critical
Publication of KR102315497B1 publication Critical patent/KR102315497B1/ko

Links

Images

Classifications

    • G06Q40/025
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Collating Specific Patterns (AREA)
  • Complex Calculations (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

채점 모델을 구축하고 사용자 신용을 평가하기 위한 시스템 및 방법. 채점 모델을 구축하기 위한 예시적인 방법은, 복수의 샘플 데이터세트를 수집하는 단계로서, 각각의 샘플 데이터세트가 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 상기 수집하는 단계; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수를 획득하고, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 단계; 특성 변수의 클러스터링 지수에 따라 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하는 단계; 타깃 특성 변수 및 대응하는 특성값에 따라 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델을 구축하는 단계를 포함할 수도 있다.

Description

채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스
관련 출원에 대한 상호 참조
본 출원은 2017년 3월 27일자로 출원된 중국 출원 제201710188752.9호에 기초하며 그 우선권을 주장하는데, 상기 기초 출원의 전체 내용은 참고로 본 명세서에 원용된다.
기술 분야
본 출원은 컴퓨터 기술의 분야에 관한 것으로, 특히 채점 모델(scoring model)을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스에 관한 것이다.
현존하는 기술에서, 로직 회귀(logic regression) 또는 채점 카드와 같은 모델링 방법이 채점 모델을 구축하기 위해 일반적으로 사용된다. 그러나, 상기의 모델링 방법의 경우, 변수 사이에는 어떠한 상호 작용 관계도 없다는 것이 일반적으로 가정된다. 몇몇 변수 사이에서 상호 작용 관계가 있는 경우, 채점 모델을 구축하기 위해, 클러스터링(clustering) 및 모델링의 방법이 일반적으로 사용되는데, 클러스터링 및 모델링은, 전체 샘플(그룹으로 또한 칭해짐)이 그룹화 변수의 값에 따라 분할되고, 그룹화 변수가 전문가 경험 또는 실험에 따라 일반적으로 선택되는 것을 가리킨다. 다수의 분할 이후, 전체 그룹은 많은 하위 그룹(subgroup)으로 분할될 수 있으며, 그 다음, 각각의 하위 그룹에 대해 대응하는 채점 모델이 구축된다. 그러나, 전문가 경험에 따라 그룹화 변수를 선택하기 위한 효율성은 일반적으로 낮다. 실험에 따라 그룹화 변수를 선택할 때, 클러스터링 및 모델링을 위해 다양한 그룹화 가능성이 일반적으로 시도될 필요가 있고, 그 다음, 결과가 비교된다. 변수의 수가 증가함에 따라, 변수 조합이 기하 급수적으로 증가한다. 변수의 수가 많으면, 모든 가능성을 시도하는 것은 너무 어려울 것이다. 모든 가능성을 시도하는 것이 불가능한 경우, 선택된 그룹 변수는 일반적으로 부정확한데, 이것은 궁극적으로 구성되는 채점 모델의 정확도에 영향을 미친다.
본 개시내용은 채점 모델을 구축하기 위한 그리고 구축된 채점 모델의 정확도를 향상시킬 수 있는 사용자 신용을 평가하기 위한 방법 및 디바이스를 설명한다.
제1 양상은, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하는 단계; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수(interaction index)를 획득하고, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 단계; 특성 변수의 클러스터링 지수에 따라 적어도 하나의 특성 변수로부터 타깃 특성 변수(target characteristic variable)를 선택하는 단계; 타깃 특성 변수 및 대응하는 특성값에 따라 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델(sub-scoring model)을 구축하는 단계를 포함하는 채점 모델을 구축하기 위한 방법을 제공한다.
제2 양상은, 사용자의 신용 데이터 정보를 획득하는 단계; 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정하는 단계로서, 타깃 특성 변수는 복수의 특성 변수의 클러스터링 지수, 및 하위 그룹으로 분류되며 복수의 특성 변수 및 특성 변수의 각각에 대한 대응하는 특성값을 포함하는 복수의 샘플 데이터세트에 따라 선택되는, 상기 특성값을 결정하는 단계; 타깃 특성 변수에 대응하는 특성값에 따라 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하는 단계; 및 사용자의 신용 점수에 따라 사용자의 신용을 평가하는 단계를 포함하는 사용자 신용을 평가하기 위한 방법을 제공한다.
제3 양상은, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하도록 구성되는 수집 유닛; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수를 획득하도록 구성되는 획득 유닛; 획득 유닛에 의해 획득되는 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정하도록 구성되는 결정 유닛; 결정 유닛에 의해 결정되는 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하도록 구성되는 선택 유닛; 선택 유닛에 의해 선택되는 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하도록 구성되는 분할 유닛; 및 분할 유닛에 의해 분할되는 샘플 데이터세트 하위 그룹의 각각에 대해 대응하는 하위 채점 모델을 구축하도록 구성되는 구축 유닛을 포함하는 채점 모델을 구축하기 위한 디바이스를 제공한다.
제4 양상은, 사용자의 신용 데이터 정보를 획득하도록 구성되는 획득 유닛; 획득 유닛에 의해 획득되는 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정하도록 구성되는 결정 유닛으로서, 타깃 특성 변수는 샘플 데이터세트 내의 모든 특성 변수의 클러스터링 지수에 따라 선택되고, 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 결정 유닛; 결정 유닛에 의해 결정되는 타깃 특성 변수에 대응하는 특성값에 따라, 대응하는 샘플 데이터세트 하위 그룹을 선택하도록 구성되는 선택 유닛; 선택 유닛에 의해 선택되는 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하도록 또한 구성되는 결정 유닛; 및 결정 유닛에 의해 결정되는 사용자의 신용 점수에 따라, 사용자의 신용을 평가하도록 구성되는 평가 유닛을 포함하는 사용자 신용을 평가하기 위한 디바이스를 제공한다.
제5 양상은 채점 모델을 구축하기 위한 디바이스를 제공하는데, 디바이스는, 프로세서 및 프로세서에 의해 실행될 때 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함한다. 방법은 다음의 것을 포함할 수도 있다: 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하는 단계; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수(interaction index)를 획득하고, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 단계; 특성 변수의 클러스터링 지수에 따라 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하는 단계; 타깃 특성 변수 및 대응하는 특성값에 따라 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델(sub-scoring model)을 구축하는 단계.
제6 양상은 사용자 신용을 평가하기 위한 디바이스를 제공하는데, 디바이스는, 프로세서 및 프로세서에 의해 실행될 때 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함한다. 방법은 사용자의 신용 데이터 정보를 획득하는 단계; 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정하는 단계로서, 타깃 특성 변수는 복수의 특성 변수의 클러스터링 지수, 및 하위 그룹으로 분류되며 복수의 특성 변수 및 특성 변수의 각각에 대한 대응하는 특성값을 포함하는 복수의 샘플 데이터세트에 따라 선택되는, 상기 특성값을 결정하는 단계; 타깃 특성 변수에 대응하는 특성값에 따라 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 및 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하는 단계를 포함할 수도 있다.
본 개시내용에 따른 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스를 사용하여, 복수의 샘플 데이터세트를 포함하는 샘플 데이터가 수집될 수 있다. 각각의 샘플 데이터세트에 포함되는 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수가 획득될 수 있다. 상호 작용 지수에 따라, 각각의 특성 변수의 클러스터링 지수가 결정될 수 있다. 모든 특성 변수의 클러스터링 지수에 따라, 타깃 특성 변수가 샘플 데이터세트에 포함되는 특성 변수로부터 선택될 수 있다. 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트는 복수의 샘플 데이터세트 하위 그룹으로 분할될 수 있다. 각각의 샘플 데이터세트 하위 그룹에 대해 대응하는 하위 채점 모델이 구축될 수 있다. 따라서, 각각의 특성 변수의 클러스터링 지수를 계산하는 것에 의해, 본 개시내용은 그룹화를 위한 타깃 특성 변수의 선택을 자동적으로 개시하는데, 이것은 타깃 특성 변수 선택의 효율 및 정확도를 향상시킬 수 있고, 그 다음, 채점 모델 구축의 정확도를 더 향상시킬 수 있다.
본 개시내용의 실시형태에서의 기술적 솔루션을 더욱 명확하게 설명하기 위해, 실시형태의 설명에서 사용될 첨부의 도면이 다음과 같이 간략하게 설명될 것이다. 명백히, 다음의 설명에서의 첨부의 도면은 본 개시내용의 몇몇 실시형태에 불과하다. 기술 분야의 숙련된 자에게는, 발명적 노력 없이 이들 도면에 따라 다른 도면이 추가로 획득될 수도 있다.
도 1은, 본 개시내용의 일 실시형태에 따른, 채점 모델을 구축하기 위한 방법의 플로우차트이다.
도 2는, 본 개시내용에 따른, 특성 변수의 상호 작용 지수를 획득하기 위한 방법의 플로우차트이다.
도 3은, 본 개시내용의 일 실시형태에 따른, 사용자 신용을 평가하기 위한 방법의 플로우차트이다.
도 4는, 본 개시내용의 일 실시형태에 따른, 채점 모델을 구축하기 위한 디바이스의 개략도이다.
도 5는, 본 개시내용의 일 실시형태에 따른, 사용자 신용을 평가하기 위한 디바이스의 개략도이다.
이하, 첨부의 도면을 참조하여 본 개시내용의 실시형태가 하기에서 설명될 것이다.
본 개시내용의 실시형태에 따른 채점 모델을 구축하기 위한 방법 및 디바이스는, 클러스터링 및 모델링의 상황에 적용 가능하다. 클러스터링 및 모델링의 본질은, 복잡한 함수 관계(functional relationship)를 간단한 부가 함수 관계로 분류하는 것이다. 예를 들면, 클러스터링을 수행하기 위해 사용되는 특성 변수가 먼저 결정되고, 그 다음, 샘플 데이터가 특성 변수 및 대응하는 특성값에 따라 클러스터링된다. 클러스터링 이후, 각각의 하위 그룹에 대해 대응하는 하위 채점 모델이 구축된다. 하나의 상황에서, 하위 채점 모델은, 예를 들면, 채점 카드 모델을 사용하여 직접적으로 설명될 수 있는 간단한 부가 함수 관계를 포함할 수도 있다. 따라서, 클러스터링 및 모델링의 프로세스는 클러스터링을 위한 특성 변수의 선택을 수반한다. 본 개시내용은 이하의 실시형태에서 이 부분의 상세한 설명을 제공할 것이다.
또한, 본 개시내용에서 구축되는 채점 모델은 사용자 신용 평가 및 재무 위험 관리(financial risk control)와 같은 영역에 적용될 수 있다.
도 1은, 본 개시내용의 일 실시형태에 따른, 채점 모델을 구축하기 위한 방법의 플로우차트이다. 그 방법을 실행하기 위한 본체(main body)는, 프로세싱 성능을 갖는 디바이스: 서버, 시스템 또는 디바이스일 수도 있다. 도 1에 도시된 바와 같이, 방법은 다음의 것을 포함한다:
단계 110, 복수의 샘플 데이터세트를 포함하는 샘플 데이터를 수집함.
수집된 샘플 데이터는, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 포함할 수도 있다.
몇몇 실시형태에서, 상기의 특성 변수는 미리 수동으로 구성될 수도 있다. 예를 들면, 상기의 채점 모델이 사용자 신용 평가에 적용될 때, 상기의 샘플 데이터세트의 특성 변수는 다음의 세 가지 타입으로 분류될 수 있다: 1) 사용자 활동 데이터("A"); 2) 사용자 경향 데이터("T"); 3) 사용자 프로파일 데이터("P"). 사용자 활동 데이터는 다음의 것을 포함할 수도 있다: 사용자 거래 활동 데이터(user transaction activity data), 사용자 재무 관리 활동 데이터(user financial management activity data), 및 다른 사용자 활동 데이터. 여기서, 사용자 거래 활동 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 수 일(a number of days)(예를 들면, 90일) 동안의 평균 지불 금액; b. 수 일(예를 들면, 180일) 이내의 지불 활동 일수; c. 수 일(예를 들면, 180일) 이내의 지불 금액; d. 마지막 지불과 현재 사이의 시간. 사용자 재무 관리 활동 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 수 일 이내에 제1 타깃 제품이 구매된 횟수, 예를 들면, Zhao Cai Bao™(자오차이바오)과 같은 금융 서비스 플랫폼에 의해 제공되는 금융 서비스 제품이 90일 이내에 구매된 횟수; b. 수 일 이내에 제2 타깃 제품이 구매된 횟수, 예를 들면 Yu E Bao™(위어바오)과 같은 금융 서비스 플랫폼에 의해 제공되는 금융 서비스 제품이 90일 이내에 구매된 횟수; c. 수 일 이내에 제2 타깃 제품을 구매하기 위해 사용되는 금액, 예를 들면 90일 이내에 Yu E Bao™을 구매하기 위해 사용되는 잔액. 다른 사용자 활동 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 수 일(예를 들면, 180일) 이내에 사용자로부터의 통화 횟수; b. 마지막 로그온이 발생한 도시; c. 마지막 로그온과 현재 사이의 시간; d. 수 일(예를 들면, 90일) 이내에 로그온 활동의 횟수. 사용자 경향 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 사용자의 평균 잔고의 변동 경향(30일/30-90일); b. 로그온 활동의 횟수의 변동 경향(30일/30-60일); c. 원격 프로시져 호출(Remote Procedure Call: RPC)의 변동 경향(30일/30-60일); d. 지불 횟수의 변동 경향(30일/30-90일). 사용자 프로파일 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 사용자가 독신인지의 여부; b. 사용자가, 자신의 집에 대한 수리(renovation)와 같은 소정의 활동을 행했는지의 여부; c. 사용자가 결혼했는지의 여부; d. 사용자의 나이; e. 사용자의 등록 이후의 시간; f. 사용자의 교육 레벨; g. 사용자의 수입 등.
몇몇 실시형태에서, 샘플 데이터세트 내의 모든 특성 변수에 대응하는 특성값은, 예를 들면, 이산화(discretization)에 의해 미리 프로세싱될 수도 있다. 예를 들면, 특성 변수가 사용자의 나이이라는 것을 가정하면, 사용자의 나이는 이산화되어 다음의 네 개의 세그먼트(하위 박스로 또한 칭해짐)를 획득한다: "20세 미만", "20세 이상 25세 이하", "25세 이상 30세 미만" 및 "30세 이상".
단계 120은, 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수를 획득함.
본원에서의 다른 특성 변수는, 각각의 샘플 데이터세트에서의 특성 변수 이외의 나머지 특성 변수를 가리키며, 복수의 다른 특성 변수가 존재할 수도 있다. 예를 들면, 샘플 데이터세트가 세 개의 특성 변수 및 대응하는 특성값을 포함한다는 것, 및 이들 세 개의 특성 변수가 각각 x1, x2 및 x3이라는 것을 가정한다. 특성 변수가 x1인 경우, 다른 특성 변수는 x2 및 x3을 포함한다.
하나의 구현예에서, 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하는 프로세스는, 도 2에 도시된 바와 같을 수도 있다. 프로세스는 다음의 단계를 포함할 수도 있다:
단계 210, 샘플 데이터세트 내의 적어도 하나의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨(sample label)에 따라, 일반 채점 카드 모델(regular scoring card model)을 트레이닝시킴.
일반 채점 카드 모델을 트레이닝시키는 프로세스는 다음의 것을 포함할 수도 있다: 일반 채점 카드 모델: y = f1(x1) + f2(x2)를 미리 설정함, 여기서 y는 채점 결과로서 정의될 수도 있고, x1은 특성 변수이며, x2는 하나의 다른 특성 변수이다. 함수 관계 f1(x1)은 특성 변수 x1의 다양한 세그먼트에 대응하는 점수 값으로서 정의될 수도 있고, 함수 관계 f2(x2)는 다른 특성 변수 x2의 다양한 세그먼트에 대응하는 점수 값으로서 정의될 수도 있다. 후속하여, 일반 채점 카드 모델의 트레이닝은 함수 관계 f1 및 f2를 최적화하는 것에 의해 달성된다. 몇몇 실시형태에서, 함수 관계 f1을 최적화하는 것은, 특성 변수 x1의 다양한 세그먼트에 대응하는 점수 값을 조정하는 프로세스이고, 함수 관계 f2를 최적화하는 것은, 다른 특성 변수 x2의 다양한 세그먼트에 대응하는 점수 값을 조정하는 프로세스이다.
하나의 예에서, 함수 관계 f1 및 f2는 복수의 샘플 데이터세트 내의 샘플 데이터를 학습시키는 것에 의해 최적화될 수 있다. 예를 들면, 각각의 샘플 데이터세트는 미리 설정된 일반 채점 카드 모델에 의해 채점될(scored) 수 있다. 현재의 일반 채점 카드 모델은, 두 개의 함수 관계(f1 및 f2)를 포함하고, f1은 x1에 관련되고, f2는 x2에 관련된다. 따라서, 미리 설정된 일반 채점 카드 모델을 통해 샘플 데이터를 채점하는 프로세스는 다음의 것을 포함할 수 있다: f1(x1)을 통해 제1 채점 결과를 획득하는 것, 및 f2(x2)를 통해 제2 채점 결과를 획득하는 것. 여기서, 제1 채점 결과를 획득하는 프로세스는, 현재의 샘플 데이터세트에 포함되는 특성 변수 x1의 특성값에 따라, 특성값이 속하는 세그먼트에 대응하는 점수 값을, f1로부터 선택하는 프로세스이다. 제2 채점 결과를 획득하는 프로세스는, 현재의 샘플 데이터세트에 포함되는 하나의 다른 특성 변수 x2의 특성값에 따라, 특성값이 속하는 세그먼트에 대응하는 점수 값을, f2로부터 선택하는 프로세스이다. 후속하여, 제1 채점 결과 및 제2 채점 결과를 가산하는 것에 의해 최종 채점 결과가 획득된다. 최종 채점 결과가 획득되면, 최종 채점 결과를 샘플 데이터세트의 샘플 라벨(예를 들면, 라벨링된 채점 결과 y' 및 라벨링은 수동으로 수행될 수도 있거나 또는 다르게는 미리 결정될 수도 있음)과 비교하는 것에 의해 f1 및 f2가 조정되고, 그에 의해, 최적화된 f1 및 f2를 획득한다. 하나의 구현예에서, 미리 설정된 일반 채점 카드 모델에 의한 각각의 샘플 데이터세트의 채점 결과의 정확도가 미리 설정된 임계 값에 도달하는 경우, 미리 설정된 일반 채점 카드 모델은 트레이닝되었다.
일례에서, 트레이닝된 일반 채점 카드 모델이 표 1에서 도시되어 있다.
Figure 112019091323169-pct00001
몇몇 실시형태에서, 일반 채점 카드 모델이 단계 210에서 구성될 때, f1은 특성 변수 x1에 관련되고 f2는 특성 변수 x2에 관련된다는 것이 가정된다. 즉, f1 및 f2는 둘 모두 일변량 함수(univariate function)이다, 즉, 상기의 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않을 수도 있다.
몇몇 실시형태에서, f1은 특성 변수 x1에만 관련되고, f2는 특성 변수 x2에만 관련된다. 결과적으로, 그것은, f1 및 f2를 조정하는 프로세스에서, 많은 수의 샘플 데이터세트를 필요로 하지 않는다. 많은 수의 샘플 데이터세트에 대한 필요성이 없기 때문에, 일반 채점 카드 모델이 빠르게 트레이닝될 수 있다.
단계 220, 샘플 데이터세트 내의 적어도 하나의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라, 교차 채점 카드 모델(cross scoring card model)을 트레이닝시킴.
교차 채점 카드 모델을 트레이닝시키는 프로세스는 다음의 것을 포함할 수도 있다: 교차 채점 카드 모델: y = f(x1, x2)를 미리 설정함, 여기서 y는 채점 결과로서 정의될 수도 있고, x1은 특성 변수이며, x2는 하나의 다른 특성 변수이다. 함수 관계 f(x1, x2)는 하나의 다른 특성 변수 x2와의 특성 변수 x1의 교차 세그먼트(이진 교차 세그먼트로 또한 칭해짐)에 대응하는 점수 값으로 정의될 수도 있다. 후속하여, 일반 채점 카드 모델의 트레이닝은 함수 관계 f를 최적화하는 것에 의해 달성된다. 몇몇 실시형태에서, 함수 관계 f를 최적화하는 것은, 하나의 다른 특성 변수 x2와의 특성 변수 x1의 교차 세그먼트에 대응하는 점수 값을 조정하는 프로세스이다.
함수 관계 f를 최적화하는 프로세스는 f1을 최적화하는 프로세스와 유사한데, 이것은 여기서는 반복되지 않을 것이다.
특성 변수가 "사용자의 나이"이고, 사용자의 나이의 네 개의 세그먼트가 "20세 미만", "20세 이상 25세 이하", "25세 이상 30세 미만" 및 "30세 이상"이라는 것이 가정되는 예를 통해, 교차 세그먼트가 하기에서 설명될 것이다. 하나의 다른 특성 변수가 사용자의 교육 레벨이고, 사용자 교육 레벨의 네 개의 세그먼트가 "단기 대학 졸업생(associate) 또는 이하", "학사", "석사" 및 "박사 또는 그 이상"인 경우, 특성 변수 및 다른 특성 변수는 4 * 4 = 16 개의 교차 세그먼트를 형성할 수 있는데, 그 중 하나의 교차 세그먼트는, 예를 들면 "20세 미만 및 단기 대학 졸업생 또는 그 이하"일 수도 있다.
몇몇 실시형태에서, 교차 채점 카드 모델이 단계 220에서 구성될 때, y는 두 개의 독립적인 특성 변수(x1 및 x2)에 동시에 관련된다는 것이 가정된다. 즉, f(x1, x2)는 이진 함수이다, 즉, 상기의 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려한다. 따라서, 특성 변수 사이의 상호 작용은 교차 채점 카드 모델을 통해 잘 설명할 수 있다.
단계 230, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 성능 차이값을 상호 작용 지수로서 사용함.
하나의 예에서, 상기의 성능 차이값을 결정하기 이전에, 트레이닝된 일반 채점 카드 모델의 성능 지수값 obj{f1(x1) + f2(x2)} 및 트레이닝된 교차 채점 카드 모델의 성능 지수값 obj{f(x1, x2)}가 먼저 결정될 수 있다. 여기서, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 프로세스는 다음의 것을 포함할 수도 있다: 트레이닝된 일반 채점 카드 모델을 통해 샘플 데이터세트(예를 들면, 수집된 샘플 데이터 내의 모든 샘플 데이터세트)를 채점하는 것; 트레이닝된 일반 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것.
트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 프로세스는 다음의 것을 포함할 수도 있다: 트레이닝된 일반 채점 카드 모델을 사용하여 각각의 샘플 데이터세트를 채점하여 각각의 샘플 데이터세트에 대한 채점 결과를 획득하는 것; 각각의 샘플 데이터세트의 채점 결과 및 각각의 샘플 데이터세트의 샘플 라벨에 따라, 각각의 샘플 데이터세트의 에러를 결정하는 것; 모든 샘플 데이터세트의 에러에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것.
트레이닝된 교차 채점 카드 모델의 성능 지수값 obj{f(x1, x2)}를 결정하는 프로세스는 다음의 것을 포함할 수도 있다: 트레이닝된 교차 채점 카드 모델을 사용하여 각각의 샘플 데이터세트를 채점하는 것; 트레이닝된 교차 채점 카드 모델에 의한 채점 결과 및 각각의 샘플 데이터세트의 샘플 라벨에 따라, 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 것.
일반 채점 카드 모델 및 교차 채점 카드 모델에 대한 성능 지수를 결정하기 위한 상기의 방법은 단지 예시에 불과하다. 실제로, 모델 성능을 평가하는 다른 방법이 있는데, 그 다른 방법은 하나씩 반복되지는 않을 것이다.
트레이닝된 일반 채점 카드 모델의 성능 지수값 및 트레이닝된 교차 채점 카드 모델의 성능 지수값이 결정된 이후, 두 값에 대한 감산이 수행되어, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값 I(x1, x2)를 결정할 수도 있다. 즉, I(x1, x2) = obj{f(x1, x2)} - obj{f1(x1) + f2(x2)}이다. 몇몇 실시형태에서, 성능 차이값 I(x1, x2)는, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이를 설명하기 위해 사용된다.
몇몇 실시형태에서, 교차 채점 카드 모델이 특성 변수 사이의 상호 작용을 고려하기 때문에, 특성 변수 사이의 상호 작용은 교차 채점 카드 모델을 통해 잘 설명될 수 있다. 그러나, 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 일반적으로 설명하지 않는다. 따라서, 성능 차이값은 특성 변수 사이의 상호 작용 지수로서 사용될 수 있다. 예를 들면, 상호 작용 지수가 상대적으로 작은 경우(예를 들면, 0에 가까운 경우), 그것은, 두 특성 변수 사이의 상호 작용은 상대적으로 약하다는 것을 나타낸다. 반대로, 상호 작용 지수가 상대적으로 높은 경우, 그 것은, 두 특성 변수 사이의 상호 작용이 상대적으로 강하다는 것을 나타낸다.
단계 130, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 것.
몇몇 실시형태에서, 복수의 다른 특성 변수가 존재하는 경우, 복수의 상호 작용 지수가 획득되는데, 상호 작용 지수의 각각을 획득하기 위한 방법은, 도 2에 도시된 바와 같이, 유사하며, 여기서는 반복되지 않을 것이다.
예를 들면, 샘플 데이터세트가 세 개의 특성 변수 및 대응하는 특성값을 포함한다는 것, 및 이들 세 개의 특성 변수가 각각 x1, x2 및 x3이라는 것을 가정한다. 특성 변수가 x1인 경우, 다른 특성 변수는 x2 및 x3을 포함한다. 상응하여, 계산될 두 개의 상호 작용 지수가 있다: I(x1, x2) 및 I(x1, x3). 하나의 구현예에서, 복수의 상호 작용 지수가 결정된 이후, 복수의 상호 작용 지수는 가산될 수 있고, 가산 결과는 특성 변수 x1의 클러스터링 지수로서 사용된다. 즉, 식 1이 사용되어 특성 변수의 클러스터링 지수를 결정할 수 있다.
Figure 112019091323169-pct00002
여기서, xi는, 클러스터링 지수가 현재 결정될 필요가 있는 특성 변수인데, [1, N]의 값 범위를 가지며, Agg(xi)는 특성 변수 xi의 클러스터링 지수이고, N은 xj는 특성 변수의 개수이고, xj는 특성 변수 xi와는 상이한 다른 N-1 개의 특성 변수이다.
몇몇 실시형태에서, N 개의 클러스터링 지수는, Agg(x1), Agg(x2), ..., Agg(xN)에 의해 각각 표현되는 N 개의 특성 변수가 존재하는 경우에 결정될 수 있다.
단계 140, (예를 들면, 모든) 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택함.
하나의 구현예에서, 모든 특성 변수의 클러스터링 지수는 비교될 수 있고, 최대 클러스터링 지수에 대응하는 특성 변수는 타깃 특성 변수로서 선택된다. 몇몇 실시형태에서, 특성 변수의 클러스터링 지수는, 특성 변수 및 다른 특성 변수의 상호 작용 지수의 합이고, 한편 상호 작용 지수는 특성 변수와의 상호 작용의 강도를 설명하기 위해 사용된다. 따라서, 특성 변수가 최대 클러스터링 지수를 갖는 경우, 그것은, 특성 변수가 다른 모든 특성 변수와 상대적으로 강한 상호 작용을 갖는다는 것을 나타낸다. 즉, 다른 모든 특성 변수와 상대적으로 강한 상호 작용을 갖는 특성 변수가 타깃 특성 변수로서 선택될 수 있다.
단계 150, 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할함.
여기서, 샘플 데이터세트를 하위 그룹으로 분할하는 프로세스는 클러스터링 프로세스로 또한 칭해질 수도 있다. 클러스터링 및 모델링에서 특성 변수 및 대응하는 특성값에 따라 샘플 데이터세트를 클러스터링하는 것은 종래 기술일 수도 있는데, 여기서는 반복되지 않을 것이다.
몇몇 실시형태에서, 상기에서 언급되는 바와 같이, 타깃 특성 변수는, 다른 모든 특성 변수와 상대적으로 강한 상호 작용을 갖는 특성 변수를 지칭할 수도 있다. 따라서, 타깃 특성 변수 및 대응하는 특성값에 따른 샘플 데이터세트의 클러스터링은, 클러스터 내에서의 상호 작용을 감소시켜, 가장 이상적인 클러스터링 및 모델링의 목표를 달성할 수 있다.
단계 160, 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델을 구축함.
예를 들면, 모든 샘플 데이터세트 하위 그룹이 획득된 이후, 각각의 샘플 데이터세트 하위 그룹에 대해 일반 채점 카드 모델이 트레이닝될 수 있는데, 이것은 표 1에서 도시되어 있다.
몇몇 실시형태에서, 채점 모델이 구축된 이후, 채점 모델에 기초하여 사용자 신용이 평가될 수 있거나 또는 거래 활동 위험이 추정될 수 있다. 채점 모델에 기초한 사용자 신용 평가를 예로 들면, 평가 방법은 도 3에 도시된 바와 같을 수도 있다. 도 3에 도시된 바와 같이, 방법은 다음의 단계를 포함할 수도 있다:
310 단계, 사용자의 신용 데이터 정보를 획득함.
여기서, 사용자의 신용 데이터 정보는 백엔드 데이터베이스로부터 수동으로 또는 서버에 의해 수집될 수도 있는데, 사용자의 신용 데이터 정보는 다음의 세 가지 양태의 데이터를 포함할 수 있지만, 그러나 이들로 제한되는 것은 아니다: 1) 사용자 활동 데이터; 2) 사용자 경향 데이터; 3) 사용자 프로파일 데이터.
단계 320, 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정함. 몇몇 실시형태에서, 타깃 특성 변수는 복수의 특성 변수의 클러스터링 지수, 및 하위 그룹으로 분류되며 복수의 특성 변수 및 특성 변수의 각각에 대한 대응하는 특성값을 포함하는 복수의 샘플 데이터세트에 따라 선택된다.
본원에서의 타깃 특성 변수는, 상기 단계 120 내지 단계 140을 통해 선택되는 타깃 특성 변수를 가리킨다. 그 선택 프로세스는 상기에서 설명되는 바와 동일한데, 여기서는 반복되지 않을 것이다.
신용 데이터 정보가, 20세인 사용자의 나이, 학사인 사용자의 교육 레벨, 및 0인 사용자의 수입을 포함하는 일례에서, 타깃 특성 변수가 사용자의 나이이고, 다른 특성 변수가 사용자의 교육 레벨 및 사용자의 수입을 포함한다는 것을 가정한다. 타깃 특성 변수에 대응하는 특성값은 20세의 나이이고, 다른 타깃 특성 변수에 대응하는 특성값은 각각 학사 및 0이다.
단계 330에서, 타깃 특성 변수에 대응하는 특성값에 따라 대응하는 샘플 데이터세트 하위 그룹을 선택함.
예를 들면, 타깃 특성 변수가 사용자의 나이이고, 복수의 샘플 데이터세트를 포함하는 샘플 데이터가, 타깃 특성 변수에 대응하는 특성값에 따라, 네 개의 샘플 데이터세트 하위 그룹으로 분할되고(예를 들면, 네 개의 클러스터로 분할됨), 제1 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 20세보다 더 어리고, 제2 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 20세와 25세 사이이고, 제3 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 25세와 30세 사이이며, 제4 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 30세보다 더 많다는 것을 가정한다. 사용자의 신용 데이터 정보에 따라, 타깃 특성 변수에 대응하여 결정되는 특성값은 20세에 대해 선택되는 제2 샘플 데이터세트 하위 그룹이다.
단계 340, 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정함.
상기의 예에서와 같이, 제2 샘플 데이터세트 하위 그룹에 대응하는 선택된 하위 채점 모델은 표 2에 도시된 바와 같다는 것이 가정된다.
Figure 112019091323169-pct00003
예를 들면, 제2 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델이 표 2에 도시된 바와 같은 경우, 두 개의 다른 특성 변수에 대응하는 특성값은 학사 및 0이고, 그 다음, 사용자의 신용 점수 = 37 + 30 = 67이다.
단계 350, 사용자의 신용 점수에 따라 사용자의 신용을 평가함.
하나의 구현예에서, 임계치가 구성될 수 있다. 사용자의 신용 점수가 미리 설정된 임계치를 초과하면, 그것은, 사용자가 상대적으로 높은 신용을 가지고 있다는 것을 나타낸다. 사용자의 신용 점수가 미리 설정된 임계치를 초과하지 않으면, 그것은, 사용자가 상대적으로 낮은 신용을 갖는다는 것을 나타낸다.
본 개시내용의 실시형태에 따른 사용자 신용을 평가하기 위한 방법은, 사용자의 신용을 정확하게 평가할 수 있고 평가 효율성을 향상시킬 수 있다.
채점 모델을 구축하기 위한 상기의 방법에 대응하여, 본 개시내용의 실시형태는 또한, 도 4에 도시된 바와 같은 채점 모델을 구축하기 위한 디바이스(예를 들면, 서버 단말)를 제공하며, 디바이스는 서로 커플링되는 프로세서(411) 및 메모리(412)를 포함할 수도 있다. 메모리(412)는 비일시적이며 컴퓨터 판독 가능할 수도 있고, 프로세서(411)에 의해 실행될 때 디바이스로 하여금 본원에서 설명되는 다양한 단계 및 방법을 수행하게 하는 명령어를 저장한다. 명령어는 하기에서 설명되는 다양한 유닛으로서 구현될 수도 있다. 용어 "비일시적 매체" 및 유사한 용어는, 본원에서 사용될 때, 머신으로 하여금 특정한 양식으로 동작하게 하는 데이터 및/또는 명령어를 저장하는 임의의 매체를 지칭한다. 그러한 비일시적 매체는 불휘발성 매체 및/또는 휘발성 매체를 포함할 수도 있다. 불휘발성 매체는, 예를 들면, 스토리지 디바이스(410)와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 매체는, 메인 메모리(406)와 같은 동적 메모리를 포함한다. 비일시적 매체의 일반적인 형태는, 예를 들면, 플로피 디스크, 플렉시블 디스크, 하드 디스크, 솔리드 스테이트 드라이브, 자기 테이프, 또는 임의의 다른 자기 데이터 저장 매체, CD-ROM, 임의의 다른 광학 데이터 저장 매체, 홀의 패턴을 갖는 임의의 물리적 매체, RAM, PROM, 및 EPROM, FLASH-EPROM, NVRAM, 임의의 다른 메모리 칩 또는 카트리지, 및 이들의 네트워크화된 버전을 포함한다.
몇몇 실시형태에서, 그러한 유닛은, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하도록 구성되는 수집 유닛(401); 및 각각의 특성 변수에 대해, 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하도록 구성되는 획득 유닛(402)을 포함할 수도 있다.
옵션 사항으로, 획득 유닛(402)은: 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라, 일반 채점 카드 모델을 트레이닝하도록; 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라, 교차 채점 카드 모델을 트레이닝하도록; 그리고 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 성능 차이값을 상호 작용 지수로 사용하도록 구성될 수도 있다.
여기서, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은 다음의 것을 포함할 수도 있다: 트레이닝된 일반 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 일반 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것; 트레이닝된 교차 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 교차 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 것; 및 트레이닝된 일반 채점 카드 모델의 성능 지수값 및 트레이닝된 교차 채점 카드 모델의 성능 지수값에 따라 성능 차이값을 결정하는 것.
다양한 유닛은, 획득 유닛(402)에 의해 획득되는 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정하도록 구성되는 결정 유닛(403)을 더 포함할 수도 있다.
옵션 사항으로(optionally), 복수의 상호 작용 지수가 존재하는 경우, 결정 유닛(403)은: 복수의 상호 작용 지수에 대해 덧셈 연산을 수행하여 합산 결과를 획득하도록; 그리고 덧셈 결과를 특성 변수의 클러스터링 지수로서 사용하도록 구성될 수 있다.
다양한 유닛은, 결정 유닛(403)에 의해 결정되는 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하도록 구성되는 선택 유닛(404)을 더 포함할 수도 있다.
옵션 사항으로, 선택 유닛(404)은 구체적으로: 모든 특성 변수의 클러스터링 지수를 비교하고, 최대 클러스터링 지수에 대응하는 특성 변수를 타깃 특성 변수로서 선택하도록 구성될 수 있다.
다양한 유닛은, 선택 유닛(404)에 의해 선택되는 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하도록 구성되는 분할 유닛(405)을 더 포함할 수도 있다.
다양한 유닛은, 분할 유닛(405)에 의해 분할되는 각각의 샘플 데이터세트 하위 그룹에 대한 대응하는 하위 채점 모델을 구축하도록 구성되는 구축 유닛(406)을 더 포함할 수도 있다.
본 개시내용의 실시형태에 따른 디바이스의 기능 모듈(예를 들면, 유닛)의 기능은, 상기의 방법 실시형태의 단계를 통해 구현될 수 있다. 따라서, 본 개시내용에 따른 디바이스의 특정한 작업 프로세스는 여기에서는 반복되지 않을 것이다.
본 개시내용의 몇몇 실시형태에 따른 채점 모델을 구축하기 위한 디바이스에서, 수집 유닛(401)은 복수의 샘플 데이터세트를 포함하는 샘플 데이터를 수집한다. 각각의 특성 변수에 대해, 획득 유닛(402)은 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득한다. 결정 유닛(403)은, 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정한다. 선택 유닛(404)은, 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택한다. 분할 유닛(405)은, 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할한다. 각각의 샘플 데이터세트 하위 그룹에 대해, 구축 유닛(406)은 대응하는 하위 채점 모델을 구축한다. 따라서, 채점 모델 구축의 정확도가 향상될 수 있다.
본 개시내용의 하나의 양태에 따르면, 도 4에 도시된 바와 같이, 유닛(401-406)은 메모리에 저장되어 있는 명령어를 포함하는 소프트웨어 기능 유닛이다. 다른 양태에 따르면, 유닛(401-406)은 하드웨어, 예를 들면 상기에서 설명되는 바와 같은 기능성(functionality)을 수행하도록 프로그래밍되는 회로부(circuitry)에 의해 구현될 수도 있다.
사용자 신용을 평가하기 위한 상기에서 설명된 방법에 대응하여, 본 개시내용의 실시형태는 또한, 도 5에 도시된 바와 같이 사용자 신용을 평가하기 위한 디바이스(예를 들면, 서버 단말)를 제공하며, 디바이스는 서로 커플링되는 프로세서(511) 및 메모리(512)를 포함할 수도 있다. 메모리(512)는 비일시적이며 컴퓨터 판독 가능할 수도 있고, 프로세서(511)에 의해 실행될 때 디바이스로 하여금 본원에서 설명되는 다양한 단계 및 방법을 수행하게 하는 명령어를 저장한다. 명령어는 하기에서 설명되는 다양한 유닛으로서 구현될 수도 있다.
몇몇 실시형태에서, 그러한 유닛은 다음의 것을 포함할 수도 있다: 사용자의 신용 데이터 정보를 획득하도록 구성되는 획득 유닛(501); 획득 유닛(501)에 의해 획득되는 신용 데이터 정보에 따라, 타깃 특성 변수 및 다른 특성 변수에 각각 대응하는 특성값을 결정하도록 구성되는 결정 유닛(502)으로서, 타깃 특성 변수는 샘플 데이터세트 내의 모든 특성 변수의 클러스터링 지수에 따라 선택되고, 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 상기 결정 유닛; 결정 유닛(502)에 의해 결정되는 타깃 특성 변수에 대응하는 특성값에 따라, 대응하는 샘플 데이터세트 하위 그룹을 선택하도록 구성되는 선택 유닛(503).
몇몇 실시형태에서, 결정 유닛(502)은 또한, 선택 유닛(503)에 의해 선택되는 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하도록 구성될 수도 있다.
몇몇 실시형태에서, 다양한 유닛은, 결정 유닛(502)에 의해 결정되는 사용자의 신용 점수에 따라, 사용자의 신용을 평가하도록 구성되는 평가 유닛(504)을 더 포함할 수도 있다.
옵션 사항으로, 선택 유닛(503)은 또한: 샘플 데이터세트 내의 각각의 특성 변수에 대해, 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하도록; 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정하도록; 그리고 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하도록 구성된다.
옵션 사항으로, 상기의 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하는 것은 다음의 것을 포함할 수 있다: 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것; 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것; 및 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 성능 차이값을 상호 작용 지수로서 사용하는 것.
옵션 사항으로, 상기의 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은 다음의 것을 포함한다: 트레이닝된 일반 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 일반 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것; 트레이닝된 교차 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 교차 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 것; 트레이닝된 일반 채점 카드 모델의 성능 지수값 및 트레이닝된 교차 채점 카드 모델의 성능 지수값에 따라 성능 차이값을 결정하는 것.
본 개시내용의 실시형태에 따른 디바이스의 기능 모듈의 기능은, 상기의 방법 실시형태의 단계를 통해 구현될 수 있다. 따라서, 본 개시내용에 따른 디바이스의 특정한 작업 프로세스는 여기에서는 반복되지 않을 것이다.
본 개시내용의 하나의 양태에 따르면, 도 5에 도시된 바와 같이, 유닛(501-504)은 메모리에 저장되어 있는 명령어를 포함하는 소프트웨어 기능 유닛이다. 다른 양태에 따르면, 유닛(501-504)은 하드웨어, 예를 들면 상기에서 설명되는 바와 같은 기능성을 수행하도록 프로그래밍되는 회로부에 의해 구현될 수도 있다.
본 개시내용의 실시형태에 따른 사용자 신용을 평가하기 위한 디바이스는 사용자 신용을 정확하게 평가할 수 있다.
기술 분야의 숙련된 자는, 상기의 하나 이상의 예에서 본 개시내용에 의해 설명되는 기능이 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의의 조합을 통해 구현될 수 있다는 것을 인식해야 한다. 소프트웨어를 통해 구현될 때, 이들 기능은 컴퓨터 판독 가능 매체에 저장될 수 있거나 또는 컴퓨터 판독 가능 매체 상의 하나 이상의 명령어 또는 코드로서 전파될 수 있다.
상기에서 설명되는 구현예는 또한, 본 개시내용의 목적, 기술적 솔루션 및 유리한 효과를 상세히 설명한다. 상기의 설명은 단지 예시적인 것이며 본 개시내용의 범위를 제한하기 위해 사용되는 것이 아니다는 것이 이해되어야 한다. 본 출원의 기술적 솔루션에 기초하여 이루어지는 임의의 수정예, 등가적 대체예 또는 개선예는 본 개시내용의 범위에 의해 포괄될 것이다.

Claims (18)

  1. 프로세서를 포함하여 채점 모델(scoring model)을 구축하기 위한 디바이스에 의해 수행되는 채점 모델을 구축하기 위한 방법으로서,
    상기 디바이스가 다수의 특성 변수를 포함하는 복수의 샘플 데이터세트를 수집하는 단계로서, 각각의 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 복수의 샘플 데이터세트를 수집하는 단계;
    상기 디바이스가, 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수(interaction index)를 획득하는 단계로서,
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 샘플 라벨(sample label)에 따라 일반 채점 카드 모델(regular scoring card model)을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델(cross scoring card model)을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
    트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
    을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
    상기 디바이스가, 각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
    상기 디바이스가 상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수(target characteristic variable)를 선택하는 단계;
    상기 디바이스가 상기 타깃 특성 변수 및 대응하는 특성값에 따라 상기 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및
    상기 디바이스가 상기 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델(sub-scoring model)을 구축하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
  2. 삭제
  3. 제1항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
    상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
    상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
    상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
  4. 제1항에 있어서, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계는,
    상기 디바이스가 상기 복수의 상호 작용 지수에 대해 덧셈 연산을 수행하여 합산 결과를 획득하는 단계; 및
    상기 디바이스가 상기 합산 결과를 상기 특성 변수의 상기 클러스터링 지수로서 사용하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
  5. 제1항에 있어서, 상기 타깃 특성 변수를 선택하는 단계는,
    상기 디바이스가 상기 특성 변수의 상기 클러스터링 지수를 비교하고, 상기 특성 변수 중, 최대 클러스터링 지수에 대응하는 특성 변수를 상기 타깃 특성 변수로서 선택하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
  6. 프로세서를 포함하여 사용자 신용을 평가하기 위한 디바이스에 의해 수행되는 사용자 신용을 평가하기 위한 방법으로서,
    상기 디바이스가 다수의 특성 변수 및 상기 다수의 특성 변수에 대응하는 제1 특성값을 포함하는 샘플 데이터세트를 획득하는 단계;
    상기 디바이스가, 상기 다수의 특성 변수 각각에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수를 획득하는 단계로서,
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
    트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
    을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
    상기 디바이스가, 각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
    상기 디바이스가 상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수를 선택하는 단계;
    상기 디바이스가 상기 타깃 특성 변수 및 대응하는 제1 특성값에 따라 샘플 데이터세트를 다수의 샘플 데이터세트 하위 그룹으로 분할하는 단계;
    상기 디바이스가 사용자의 신용 데이터를 획득하는 단계;
    상기 디바이스가 상기 신용 데이터에 따라, 상기 타깃 특성 변수 및 다른 특성 변수에 각각 대응하는 제2 특성값을 결정하는 단계;
    상기 디바이스가 상기 타깃 특성 변수에 대응하는 제2 특성값에 따라 상기 샘플 데이터세트 하위 그룹으로부터 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 및
    상기 디바이스가 상기 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 상기 다른 특성 변수에 대응하는 제2 특성값에 따라 상기 사용자의 신용 점수를 결정하는 단계를 포함하는, 사용자 신용을 평가하기 위한 방법.
  7. 삭제
  8. 삭제
  9. 제6항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
    상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
    상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
    상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 사용자 신용을 평가하기 위한 방법.
  10. 디바이스로서, 상기 디바이스는 프로세서 및 상기 프로세서에 의해 실행될 때 상기 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함하며, 상기 방법은,
    다수의 특성 변수를 포함하는 복수의 샘플 데이터세트를 수집하는 단계로서, 각각의 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 복수의 샘플 데이터세트를 수집하는 단계;
    각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수를 획득하는 단계로서,
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
    트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
    을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
    각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
    상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수를 선택하는 단계;
    상기 타깃 특성 변수 및 대응하는 특성값에 따라 상기 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및
    상기 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델을 구축하는 단계를 포함하는, 디바이스.
  11. 삭제
  12. 제10항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
    상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
    상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
    상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 디바이스.
  13. 제10항에 있어서, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계는,
    상기 복수의 상호 작용 지수에 대해 덧셈 연산을 수행하여 합산 결과를 획득하는 단계; 및
    상기 합산 결과를 상기 특성 변수의 상기 클러스터링 지수로서 사용하는 단계를 포함하는, 디바이스.
  14. 제10항에 있어서, 상기 타깃 특성 변수를 선택하는 단계는,
    상기 특성 변수의 상기 클러스터링 지수를 비교하고, 상기 특성 변수 중, 최대 클러스터링 지수에 대응하는 특성 변수를 상기 타깃 특성 변수로서 선택하는 단계를 포함하는, 디바이스.
  15. 디바이스로서, 상기 디바이스는 프로세서 및 상기 프로세서에 의해 실행될 때 상기 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함하고, 상기 방법은,
    다수의 특성 변수 및 상기 다수의 특성 변수에 대응하는 제1 특성값을 포함하는 샘플 데이터세트를 획득하는 단계;
    상기 다수의 특성 변수 각각에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수를 획득하는 단계로서,
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
    상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
    트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
    을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
    각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
    상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수를 선택하는 단계;
    상기 타깃 특성 변수 및 대응하는 제1 특성값에 따라 샘플 데이터세트를 다수의 샘플 데이터세트 하위 그룹으로 분할하는 단계;
    사용자의 신용 데이터를 획득하는 단계;
    상기 신용 데이터에 따라, 상기 타깃 특성 변수 및 다른 특성 변수에 각각 대응하는 제2 특성값을 결정하는 단계;
    상기 타깃 특성 변수에 대응하는 제2 특성값에 따라 상기 샘플 데이터세트 하위 그룹으로부터 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 및
    상기 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 상기 다른 특성 변수에 대응하는 제2 특성값에 따라 상기 사용자의 신용 점수를 결정하는 단계를 포함하는, 디바이스.
  16. 삭제
  17. 삭제
  18. 제15항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
    상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
    상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
    상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
    상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 디바이스.
KR1020197026057A 2017-03-27 2018-03-22 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스 KR102315497B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710188752.9A CN108665120B (zh) 2017-03-27 2017-03-27 打分模型的建立、用户信用的评估方法及装置
CN201710188752.9 2017-03-27
PCT/US2018/023692 WO2018183069A1 (en) 2017-03-27 2018-03-22 Method and device for constructing scoring model and evaluating user credit

Publications (2)

Publication Number Publication Date
KR20190113924A KR20190113924A (ko) 2019-10-08
KR102315497B1 true KR102315497B1 (ko) 2021-10-21

Family

ID=61966072

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197026057A KR102315497B1 (ko) 2017-03-27 2018-03-22 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스

Country Status (8)

Country Link
US (1) US11188565B2 (ko)
JP (1) JP6905076B2 (ko)
KR (1) KR102315497B1 (ko)
CN (1) CN108665120B (ko)
PH (1) PH12019501965A1 (ko)
SG (1) SG11201907663XA (ko)
TW (1) TW201835789A (ko)
WO (1) WO2018183069A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11202008619PA (en) * 2018-05-31 2020-10-29 Simplecredit Micro Lending Co Ltd Adjusting Method and Adjusting Device, Server and Storage Medium for Scorecard Model
CN109359850A (zh) * 2018-10-10 2019-02-19 大连诺道认知医学技术有限公司 一种生成风险评估量表的方法及装置
CN109598446A (zh) * 2018-12-09 2019-04-09 国网江苏省电力有限公司扬州供电分公司 一种基于机器学习算法的电费回收风险预警系统
CN109658193A (zh) * 2018-12-20 2019-04-19 拉扎斯网络科技(上海)有限公司 系统对象重要性的确定方法、装置、电子设备及存储介质
CN110033158A (zh) * 2019-02-03 2019-07-19 阿里巴巴集团控股有限公司 一种用户信用行为评估方法、装置和电子设备
CN110264038A (zh) * 2019-05-22 2019-09-20 深圳壹账通智能科技有限公司 一种产品测评模型的生成方法及设备
CN110544165B (zh) * 2019-09-02 2022-06-03 中诚信征信有限公司 一种信用风险评分卡创建方法、装置及电子设备
CN110956386A (zh) * 2019-11-27 2020-04-03 北京国腾联信科技有限公司 基于多渠道的信用数据的处理方法和装置
CN111598143B (zh) * 2020-04-27 2023-04-07 浙江工业大学 基于信用评估的面向联邦学习中毒攻击的防御方法
CN112365336A (zh) * 2020-11-09 2021-02-12 深圳前海微众银行股份有限公司 用户信用模型建立方法、装置及设备
CN112766649B (zh) * 2020-12-31 2022-03-15 平安科技(深圳)有限公司 基于多评分卡融合的目标对象评价方法及其相关设备
CN112634033A (zh) * 2021-01-04 2021-04-09 深圳前海微众银行股份有限公司 基于域分解机的模型构建方法、装置、系统及存储介质
CN112907035B (zh) * 2021-01-27 2022-08-05 厦门卫星定位应用股份有限公司 基于K-means的交通运输主体信用评级方法及装置
CN113435746B (zh) * 2021-06-28 2022-09-27 平安银行股份有限公司 用户工作量的评分方法、装置、电子设备及存储介质
US11423680B1 (en) 2021-11-10 2022-08-23 Sas Institute Inc. Leveraging text profiles to select and configure models for use with textual datasets
CN114462516B (zh) * 2022-01-21 2024-04-16 天元大数据信用管理有限公司 一种企业信用评分样本标注方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169958A (ja) * 2000-12-01 2002-06-14 Financial Technology Research Institute Inc 信用評価システム、信用評価方法及び信用評価プログラムを格納した記憶媒体
WO2006046737A1 (ja) * 2004-10-26 2006-05-04 Yokohama National University 多変数モデル解析システム、方法、プログラム、およびプログラム媒体
US20160048766A1 (en) * 2014-08-13 2016-02-18 Vitae Analytics, Inc. Method and system for generating and aggregating models based on disparate data from insurance, financial services, and public industries

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7451065B2 (en) * 2002-03-11 2008-11-11 International Business Machines Corporation Method for constructing segmentation-based predictive models
US7813945B2 (en) 2003-04-30 2010-10-12 Genworth Financial, Inc. System and process for multivariate adaptive regression splines classification for insurance underwriting suitable for use by an automated system
US7720757B2 (en) 2003-11-12 2010-05-18 Compucredit Intellectual Property Holdings Corp. Ii System and method for providing a credit account for debt recovery
US20050234761A1 (en) 2004-04-16 2005-10-20 Pinto Stephen K Predictive model development
US7814004B2 (en) 2004-10-29 2010-10-12 American Express Travel Related Services Company, Inc. Method and apparatus for development and use of a credit score based on spend capacity
US7912770B2 (en) 2004-10-29 2011-03-22 American Express Travel Related Services Company, Inc. Method and apparatus for consumer interaction based on spend capacity
US8543499B2 (en) 2004-10-29 2013-09-24 American Express Travel Related Services Company, Inc. Reducing risks related to check verification
US20070016542A1 (en) 2005-07-01 2007-01-18 Matt Rosauer Risk modeling system
US20080243569A1 (en) 2007-04-02 2008-10-02 Michael Shane Hadden Automated loan system and method
US7805395B2 (en) 2007-04-17 2010-09-28 Austin Logistics Incorporated System and method for automated population splitting to assist task management through analytics
US20090018982A1 (en) 2007-07-13 2009-01-15 Is Technologies, Llc Segmented modeling of large data sets
US8615467B2 (en) 2007-11-07 2013-12-24 International Business Machines Corporation Electronic system for selecting the best card from a collection of consumer credit, debit, and discount cards
CN101685458B (zh) 2008-09-27 2012-09-19 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN102063457A (zh) 2010-09-21 2011-05-18 合肥兆尹信息科技有限责任公司 一种数据分类方法及系统
US8694401B2 (en) 2011-01-13 2014-04-08 Lenddo, Limited Systems and methods for using online social footprint for affecting lending performance and credit scoring
US8990149B2 (en) 2011-03-15 2015-03-24 International Business Machines Corporation Generating a predictive model from multiple data sources
CN103782318A (zh) 2011-05-18 2014-05-07 信用公司 用于产生信贷反馈环的系统和方法
US20130166436A1 (en) 2011-12-22 2013-06-27 Ike O. Eze Deriving buyer purchasing power from buyer profile and social network data
CN103377296B (zh) * 2012-04-19 2016-05-18 中国科学院声学研究所 一种多指标评价信息的数据挖掘方法
US8984022B1 (en) * 2012-04-20 2015-03-17 Fair Isaac Corporation Automating growth and evaluation of segmentation trees
US9501799B2 (en) 2012-11-08 2016-11-22 Hartford Fire Insurance Company System and method for determination of insurance classification of entities
US20140156501A1 (en) 2012-12-04 2014-06-05 Mastercard International Incorporated Real-time interactive credit score improvement coach
US9367520B2 (en) 2012-12-20 2016-06-14 Fair Isaac Corporation Scorecard models with measured variable interactions
US10699335B2 (en) 2013-05-02 2020-06-30 The Dun & Bradstreet Corporation Apparatus and method for total loss prediction
US20140365356A1 (en) * 2013-06-11 2014-12-11 Fair Isaac Corporation Future Credit Score Projection
US10650446B2 (en) 2013-12-25 2020-05-12 Behalf Ltd. System and method for generating a virtual credit score and a respective virtual credit line
US20150235321A1 (en) 2014-02-18 2015-08-20 Mastercard International Incorporated Insurance risk modeling method and apparatus
US20160055589A1 (en) 2014-08-20 2016-02-25 Midwest Employers Casualty Company Automated claim risk factor identification and mitigation system
US10223746B2 (en) 2014-12-29 2019-03-05 Lexisnexis Risk Solutions Fl Inc. Systems and methods for inferring the performance of rejected credit applicants
US20160225073A1 (en) * 2015-01-30 2016-08-04 Wal-Mart Stores, Inc. System, method, and non-transitory computer-readable storage media for predicting a customer's credit score
US9904916B2 (en) * 2015-07-01 2018-02-27 Klarna Ab Incremental login and authentication to user portal without username/password
CN105354210A (zh) * 2015-09-23 2016-02-24 深圳市爱贝信息技术有限公司 移动游戏支付账户行为数据处理方法和装置
US9723144B1 (en) 2016-09-20 2017-08-01 Noble Systems Corporation Utilizing predictive models to improve predictive dialer pacing capabilities

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169958A (ja) * 2000-12-01 2002-06-14 Financial Technology Research Institute Inc 信用評価システム、信用評価方法及び信用評価プログラムを格納した記憶媒体
WO2006046737A1 (ja) * 2004-10-26 2006-05-04 Yokohama National University 多変数モデル解析システム、方法、プログラム、およびプログラム媒体
US20160048766A1 (en) * 2014-08-13 2016-02-18 Vitae Analytics, Inc. Method and system for generating and aggregating models based on disparate data from insurance, financial services, and public industries

Also Published As

Publication number Publication date
WO2018183069A1 (en) 2018-10-04
PH12019501965A1 (en) 2020-06-29
JP6905076B2 (ja) 2021-07-21
JP2020515965A (ja) 2020-05-28
CN108665120A (zh) 2018-10-16
SG11201907663XA (en) 2019-09-27
US20180276291A1 (en) 2018-09-27
KR20190113924A (ko) 2019-10-08
CN108665120B (zh) 2020-10-20
TW201835789A (zh) 2018-10-01
US11188565B2 (en) 2021-11-30

Similar Documents

Publication Publication Date Title
KR102315497B1 (ko) 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스
WO2020082865A1 (zh) 用于构建机器学习模型的特征选取方法、装置以及设备
KR102044205B1 (ko) 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법
AU2018206822A1 (en) Simplified tax interview
CN107040397B (zh) 一种业务参数获取方法及装置
CN110852755B (zh) 针对交易场景的用户身份识别方法和装置
US9811527B1 (en) Methods and apparatus for database migration
US10521748B2 (en) Retention risk determiner
CN110442516B (zh) 信息处理方法、设备及计算机可读存储介质
CN113407694B (zh) 客服机器人知识库歧义检测方法、装置及相关设备
US10083263B2 (en) Automatic modeling farmer
US20200134483A1 (en) Method for configuring a matching component
CN111368147A (zh) 图特征处理的方法及装置
US20230133247A1 (en) Systems and techniques to monitor text data quality
US20160180291A1 (en) Retention risk mitigation system
CN106776757B (zh) 用户完成网银操作的指示方法及装置
CN107330709B (zh) 确定目标对象的方法及装置
CN106874286B (zh) 一种筛选用户特征的方法及装置
CN110717787A (zh) 一种用户的分类方法及装置
WO2016166598A1 (en) Requirements determination
US20150356574A1 (en) System and method for generating descriptive measures that assesses the financial health of a business
CN113987351A (zh) 基于人工智能的智能推荐方法、装置、电子设备及介质
CN111160929A (zh) 一种客户类型的确定方法及装置
US11989243B2 (en) Ranking similar users based on values and personal journeys
Wang et al. Conditional functional clustering for longitudinal data with heterogeneous nonlinear patterns

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant