KR102315497B1

KR102315497B1 - 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스

Info

Publication number: KR102315497B1
Application number: KR1020197026057A
Authority: KR
Inventors: 싱 자오
Original assignee: 어드밴스드 뉴 테크놀로지스 씨오., 엘티디.
Priority date: 2017-03-27
Filing date: 2018-03-22
Publication date: 2021-10-21
Also published as: WO2018183069A1; PH12019501965A1; JP6905076B2; JP2020515965A; CN108665120A; SG11201907663XA; US20180276291A1; KR20190113924A; CN108665120B; TW201835789A; US11188565B2

Abstract

채점 모델을 구축하고 사용자 신용을 평가하기 위한 시스템 및 방법. 채점 모델을 구축하기 위한 예시적인 방법은, 복수의 샘플 데이터세트를 수집하는 단계로서, 각각의 샘플 데이터세트가 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 상기 수집하는 단계; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수를 획득하고, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 단계; 특성 변수의 클러스터링 지수에 따라 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하는 단계; 타깃 특성 변수 및 대응하는 특성값에 따라 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델을 구축하는 단계를 포함할 수도 있다.

Description

채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스

관련 출원에 대한 상호 참조

본 출원은 2017년 3월 27일자로 출원된 중국 출원 제201710188752.9호에 기초하며 그 우선권을 주장하는데, 상기 기초 출원의 전체 내용은 참고로 본 명세서에 원용된다.

기술 분야

본 출원은 컴퓨터 기술의 분야에 관한 것으로, 특히 채점 모델(scoring model)을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스에 관한 것이다.

현존하는 기술에서, 로직 회귀(logic regression) 또는 채점 카드와 같은 모델링 방법이 채점 모델을 구축하기 위해 일반적으로 사용된다. 그러나, 상기의 모델링 방법의 경우, 변수 사이에는 어떠한 상호 작용 관계도 없다는 것이 일반적으로 가정된다. 몇몇 변수 사이에서 상호 작용 관계가 있는 경우, 채점 모델을 구축하기 위해, 클러스터링(clustering) 및 모델링의 방법이 일반적으로 사용되는데, 클러스터링 및 모델링은, 전체 샘플(그룹으로 또한 칭해짐)이 그룹화 변수의 값에 따라 분할되고, 그룹화 변수가 전문가 경험 또는 실험에 따라 일반적으로 선택되는 것을 가리킨다. 다수의 분할 이후, 전체 그룹은 많은 하위 그룹(subgroup)으로 분할될 수 있으며, 그 다음, 각각의 하위 그룹에 대해 대응하는 채점 모델이 구축된다. 그러나, 전문가 경험에 따라 그룹화 변수를 선택하기 위한 효율성은 일반적으로 낮다. 실험에 따라 그룹화 변수를 선택할 때, 클러스터링 및 모델링을 위해 다양한 그룹화 가능성이 일반적으로 시도될 필요가 있고, 그 다음, 결과가 비교된다. 변수의 수가 증가함에 따라, 변수 조합이 기하 급수적으로 증가한다. 변수의 수가 많으면, 모든 가능성을 시도하는 것은 너무 어려울 것이다. 모든 가능성을 시도하는 것이 불가능한 경우, 선택된 그룹 변수는 일반적으로 부정확한데, 이것은 궁극적으로 구성되는 채점 모델의 정확도에 영향을 미친다.

본 개시내용은 채점 모델을 구축하기 위한 그리고 구축된 채점 모델의 정확도를 향상시킬 수 있는 사용자 신용을 평가하기 위한 방법 및 디바이스를 설명한다.

제1 양상은, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하는 단계; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수(interaction index)를 획득하고, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 단계; 특성 변수의 클러스터링 지수에 따라 적어도 하나의 특성 변수로부터 타깃 특성 변수(target characteristic variable)를 선택하는 단계; 타깃 특성 변수 및 대응하는 특성값에 따라 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델(sub-scoring model)을 구축하는 단계를 포함하는 채점 모델을 구축하기 위한 방법을 제공한다.

제2 양상은, 사용자의 신용 데이터 정보를 획득하는 단계; 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정하는 단계로서, 타깃 특성 변수는 복수의 특성 변수의 클러스터링 지수, 및 하위 그룹으로 분류되며 복수의 특성 변수 및 특성 변수의 각각에 대한 대응하는 특성값을 포함하는 복수의 샘플 데이터세트에 따라 선택되는, 상기 특성값을 결정하는 단계; 타깃 특성 변수에 대응하는 특성값에 따라 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하는 단계; 및 사용자의 신용 점수에 따라 사용자의 신용을 평가하는 단계를 포함하는 사용자 신용을 평가하기 위한 방법을 제공한다.

제3 양상은, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하도록 구성되는 수집 유닛; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수를 획득하도록 구성되는 획득 유닛; 획득 유닛에 의해 획득되는 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정하도록 구성되는 결정 유닛; 결정 유닛에 의해 결정되는 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하도록 구성되는 선택 유닛; 선택 유닛에 의해 선택되는 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하도록 구성되는 분할 유닛; 및 분할 유닛에 의해 분할되는 샘플 데이터세트 하위 그룹의 각각에 대해 대응하는 하위 채점 모델을 구축하도록 구성되는 구축 유닛을 포함하는 채점 모델을 구축하기 위한 디바이스를 제공한다.

제4 양상은, 사용자의 신용 데이터 정보를 획득하도록 구성되는 획득 유닛; 획득 유닛에 의해 획득되는 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정하도록 구성되는 결정 유닛으로서, 타깃 특성 변수는 샘플 데이터세트 내의 모든 특성 변수의 클러스터링 지수에 따라 선택되고, 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 결정 유닛; 결정 유닛에 의해 결정되는 타깃 특성 변수에 대응하는 특성값에 따라, 대응하는 샘플 데이터세트 하위 그룹을 선택하도록 구성되는 선택 유닛; 선택 유닛에 의해 선택되는 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하도록 또한 구성되는 결정 유닛; 및 결정 유닛에 의해 결정되는 사용자의 신용 점수에 따라, 사용자의 신용을 평가하도록 구성되는 평가 유닛을 포함하는 사용자 신용을 평가하기 위한 디바이스를 제공한다.

제5 양상은 채점 모델을 구축하기 위한 디바이스를 제공하는데, 디바이스는, 프로세서 및 프로세서에 의해 실행될 때 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함한다. 방법은 다음의 것을 포함할 수도 있다: 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하는 단계; 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수(interaction index)를 획득하고, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 단계; 특성 변수의 클러스터링 지수에 따라 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하는 단계; 타깃 특성 변수 및 대응하는 특성값에 따라 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델(sub-scoring model)을 구축하는 단계.

제6 양상은 사용자 신용을 평가하기 위한 디바이스를 제공하는데, 디바이스는, 프로세서 및 프로세서에 의해 실행될 때 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함한다. 방법은 사용자의 신용 데이터 정보를 획득하는 단계; 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정하는 단계로서, 타깃 특성 변수는 복수의 특성 변수의 클러스터링 지수, 및 하위 그룹으로 분류되며 복수의 특성 변수 및 특성 변수의 각각에 대한 대응하는 특성값을 포함하는 복수의 샘플 데이터세트에 따라 선택되는, 상기 특성값을 결정하는 단계; 타깃 특성 변수에 대응하는 특성값에 따라 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 및 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하는 단계를 포함할 수도 있다.

본 개시내용에 따른 채점 모델을 구축하고 사용자 신용을 평가하기 위한 방법 및 디바이스를 사용하여, 복수의 샘플 데이터세트를 포함하는 샘플 데이터가 수집될 수 있다. 각각의 샘플 데이터세트에 포함되는 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수가 획득될 수 있다. 상호 작용 지수에 따라, 각각의 특성 변수의 클러스터링 지수가 결정될 수 있다. 모든 특성 변수의 클러스터링 지수에 따라, 타깃 특성 변수가 샘플 데이터세트에 포함되는 특성 변수로부터 선택될 수 있다. 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트는 복수의 샘플 데이터세트 하위 그룹으로 분할될 수 있다. 각각의 샘플 데이터세트 하위 그룹에 대해 대응하는 하위 채점 모델이 구축될 수 있다. 따라서, 각각의 특성 변수의 클러스터링 지수를 계산하는 것에 의해, 본 개시내용은 그룹화를 위한 타깃 특성 변수의 선택을 자동적으로 개시하는데, 이것은 타깃 특성 변수 선택의 효율 및 정확도를 향상시킬 수 있고, 그 다음, 채점 모델 구축의 정확도를 더 향상시킬 수 있다.

본 개시내용의 실시형태에서의 기술적 솔루션을 더욱 명확하게 설명하기 위해, 실시형태의 설명에서 사용될 첨부의 도면이 다음과 같이 간략하게 설명될 것이다. 명백히, 다음의 설명에서의 첨부의 도면은 본 개시내용의 몇몇 실시형태에 불과하다. 기술 분야의 숙련된 자에게는, 발명적 노력 없이 이들 도면에 따라 다른 도면이 추가로 획득될 수도 있다.
도 1은, 본 개시내용의 일 실시형태에 따른, 채점 모델을 구축하기 위한 방법의 플로우차트이다.
도 2는, 본 개시내용에 따른, 특성 변수의 상호 작용 지수를 획득하기 위한 방법의 플로우차트이다.
도 3은, 본 개시내용의 일 실시형태에 따른, 사용자 신용을 평가하기 위한 방법의 플로우차트이다.
도 4는, 본 개시내용의 일 실시형태에 따른, 채점 모델을 구축하기 위한 디바이스의 개략도이다.
도 5는, 본 개시내용의 일 실시형태에 따른, 사용자 신용을 평가하기 위한 디바이스의 개략도이다.

이하, 첨부의 도면을 참조하여 본 개시내용의 실시형태가 하기에서 설명될 것이다.

본 개시내용의 실시형태에 따른 채점 모델을 구축하기 위한 방법 및 디바이스는, 클러스터링 및 모델링의 상황에 적용 가능하다. 클러스터링 및 모델링의 본질은, 복잡한 함수 관계(functional relationship)를 간단한 부가 함수 관계로 분류하는 것이다. 예를 들면, 클러스터링을 수행하기 위해 사용되는 특성 변수가 먼저 결정되고, 그 다음, 샘플 데이터가 특성 변수 및 대응하는 특성값에 따라 클러스터링된다. 클러스터링 이후, 각각의 하위 그룹에 대해 대응하는 하위 채점 모델이 구축된다. 하나의 상황에서, 하위 채점 모델은, 예를 들면, 채점 카드 모델을 사용하여 직접적으로 설명될 수 있는 간단한 부가 함수 관계를 포함할 수도 있다. 따라서, 클러스터링 및 모델링의 프로세스는 클러스터링을 위한 특성 변수의 선택을 수반한다. 본 개시내용은 이하의 실시형태에서 이 부분의 상세한 설명을 제공할 것이다.

또한, 본 개시내용에서 구축되는 채점 모델은 사용자 신용 평가 및 재무 위험 관리(financial risk control)와 같은 영역에 적용될 수 있다.

도 1은, 본 개시내용의 일 실시형태에 따른, 채점 모델을 구축하기 위한 방법의 플로우차트이다. 그 방법을 실행하기 위한 본체(main body)는, 프로세싱 성능을 갖는 디바이스: 서버, 시스템 또는 디바이스일 수도 있다. 도 1에 도시된 바와 같이, 방법은 다음의 것을 포함한다:

단계 110, 복수의 샘플 데이터세트를 포함하는 샘플 데이터를 수집함.

수집된 샘플 데이터는, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 포함할 수도 있다.

몇몇 실시형태에서, 상기의 특성 변수는 미리 수동으로 구성될 수도 있다. 예를 들면, 상기의 채점 모델이 사용자 신용 평가에 적용될 때, 상기의 샘플 데이터세트의 특성 변수는 다음의 세 가지 타입으로 분류될 수 있다: 1) 사용자 활동 데이터("A"); 2) 사용자 경향 데이터("T"); 3) 사용자 프로파일 데이터("P"). 사용자 활동 데이터는 다음의 것을 포함할 수도 있다: 사용자 거래 활동 데이터(user transaction activity data), 사용자 재무 관리 활동 데이터(user financial management activity data), 및 다른 사용자 활동 데이터. 여기서, 사용자 거래 활동 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 수 일(a number of days)(예를 들면, 90일) 동안의 평균 지불 금액; b. 수 일(예를 들면, 180일) 이내의 지불 활동 일수; c. 수 일(예를 들면, 180일) 이내의 지불 금액; d. 마지막 지불과 현재 사이의 시간. 사용자 재무 관리 활동 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 수 일 이내에 제1 타깃 제품이 구매된 횟수, 예를 들면, Zhao Cai Bao™(자오차이바오)과 같은 금융 서비스 플랫폼에 의해 제공되는 금융 서비스 제품이 90일 이내에 구매된 횟수; b. 수 일 이내에 제2 타깃 제품이 구매된 횟수, 예를 들면 Yu E Bao™(위어바오)과 같은 금융 서비스 플랫폼에 의해 제공되는 금융 서비스 제품이 90일 이내에 구매된 횟수; c. 수 일 이내에 제2 타깃 제품을 구매하기 위해 사용되는 금액, 예를 들면 90일 이내에 Yu E Bao™을 구매하기 위해 사용되는 잔액. 다른 사용자 활동 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 수 일(예를 들면, 180일) 이내에 사용자로부터의 통화 횟수; b. 마지막 로그온이 발생한 도시; c. 마지막 로그온과 현재 사이의 시간; d. 수 일(예를 들면, 90일) 이내에 로그온 활동의 횟수. 사용자 경향 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 사용자의 평균 잔고의 변동 경향(30일/30-90일); b. 로그온 활동의 횟수의 변동 경향(30일/30-60일); c. 원격 프로시져 호출(Remote Procedure Call: RPC)의 변동 경향(30일/30-60일); d. 지불 횟수의 변동 경향(30일/30-90일). 사용자 프로파일 데이터는, 예를 들면, 다음의 것을 포함할 수도 있다: a. 사용자가 독신인지의 여부; b. 사용자가, 자신의 집에 대한 수리(renovation)와 같은 소정의 활동을 행했는지의 여부; c. 사용자가 결혼했는지의 여부; d. 사용자의 나이; e. 사용자의 등록 이후의 시간; f. 사용자의 교육 레벨; g. 사용자의 수입 등.

몇몇 실시형태에서, 샘플 데이터세트 내의 모든 특성 변수에 대응하는 특성값은, 예를 들면, 이산화(discretization)에 의해 미리 프로세싱될 수도 있다. 예를 들면, 특성 변수가 사용자의 나이이라는 것을 가정하면, 사용자의 나이는 이산화되어 다음의 네 개의 세그먼트(하위 박스로 또한 칭해짐)를 획득한다: "20세 미만", "20세 이상 25세 이하", "25세 이상 30세 미만" 및 "30세 이상".

단계 120은, 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 특성 변수의 상호 작용 지수를 획득함.

본원에서의 다른 특성 변수는, 각각의 샘플 데이터세트에서의 특성 변수 이외의 나머지 특성 변수를 가리키며, 복수의 다른 특성 변수가 존재할 수도 있다. 예를 들면, 샘플 데이터세트가 세 개의 특성 변수 및 대응하는 특성값을 포함한다는 것, 및 이들 세 개의 특성 변수가 각각 x1, x2 및 x3이라는 것을 가정한다. 특성 변수가 x1인 경우, 다른 특성 변수는 x2 및 x3을 포함한다.

하나의 구현예에서, 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하는 프로세스는, 도 2에 도시된 바와 같을 수도 있다. 프로세스는 다음의 단계를 포함할 수도 있다:

단계 210, 샘플 데이터세트 내의 적어도 하나의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨(sample label)에 따라, 일반 채점 카드 모델(regular scoring card model)을 트레이닝시킴.

일반 채점 카드 모델을 트레이닝시키는 프로세스는 다음의 것을 포함할 수도 있다: 일반 채점 카드 모델: y = f1(x1) + f2(x2)를 미리 설정함, 여기서 y는 채점 결과로서 정의될 수도 있고, x1은 특성 변수이며, x2는 하나의 다른 특성 변수이다. 함수 관계 f1(x1)은 특성 변수 x1의 다양한 세그먼트에 대응하는 점수 값으로서 정의될 수도 있고, 함수 관계 f2(x2)는 다른 특성 변수 x2의 다양한 세그먼트에 대응하는 점수 값으로서 정의될 수도 있다. 후속하여, 일반 채점 카드 모델의 트레이닝은 함수 관계 f1 및 f2를 최적화하는 것에 의해 달성된다. 몇몇 실시형태에서, 함수 관계 f1을 최적화하는 것은, 특성 변수 x1의 다양한 세그먼트에 대응하는 점수 값을 조정하는 프로세스이고, 함수 관계 f2를 최적화하는 것은, 다른 특성 변수 x2의 다양한 세그먼트에 대응하는 점수 값을 조정하는 프로세스이다.

하나의 예에서, 함수 관계 f1 및 f2는 복수의 샘플 데이터세트 내의 샘플 데이터를 학습시키는 것에 의해 최적화될 수 있다. 예를 들면, 각각의 샘플 데이터세트는 미리 설정된 일반 채점 카드 모델에 의해 채점될(scored) 수 있다. 현재의 일반 채점 카드 모델은, 두 개의 함수 관계(f1 및 f2)를 포함하고, f1은 x1에 관련되고, f2는 x2에 관련된다. 따라서, 미리 설정된 일반 채점 카드 모델을 통해 샘플 데이터를 채점하는 프로세스는 다음의 것을 포함할 수 있다: f1(x1)을 통해 제1 채점 결과를 획득하는 것, 및 f2(x2)를 통해 제2 채점 결과를 획득하는 것. 여기서, 제1 채점 결과를 획득하는 프로세스는, 현재의 샘플 데이터세트에 포함되는 특성 변수 x1의 특성값에 따라, 특성값이 속하는 세그먼트에 대응하는 점수 값을, f1로부터 선택하는 프로세스이다. 제2 채점 결과를 획득하는 프로세스는, 현재의 샘플 데이터세트에 포함되는 하나의 다른 특성 변수 x2의 특성값에 따라, 특성값이 속하는 세그먼트에 대응하는 점수 값을, f2로부터 선택하는 프로세스이다. 후속하여, 제1 채점 결과 및 제2 채점 결과를 가산하는 것에 의해 최종 채점 결과가 획득된다. 최종 채점 결과가 획득되면, 최종 채점 결과를 샘플 데이터세트의 샘플 라벨(예를 들면, 라벨링된 채점 결과 y' 및 라벨링은 수동으로 수행될 수도 있거나 또는 다르게는 미리 결정될 수도 있음)과 비교하는 것에 의해 f1 및 f2가 조정되고, 그에 의해, 최적화된 f1 및 f2를 획득한다. 하나의 구현예에서, 미리 설정된 일반 채점 카드 모델에 의한 각각의 샘플 데이터세트의 채점 결과의 정확도가 미리 설정된 임계 값에 도달하는 경우, 미리 설정된 일반 채점 카드 모델은 트레이닝되었다.

일례에서, 트레이닝된 일반 채점 카드 모델이 표 1에서 도시되어 있다.

몇몇 실시형태에서, 일반 채점 카드 모델이 단계 210에서 구성될 때, f1은 특성 변수 x1에 관련되고 f2는 특성 변수 x2에 관련된다는 것이 가정된다. 즉, f1 및 f2는 둘 모두 일변량 함수(univariate function)이다, 즉, 상기의 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않을 수도 있다.

몇몇 실시형태에서, f1은 특성 변수 x1에만 관련되고, f2는 특성 변수 x2에만 관련된다. 결과적으로, 그것은, f1 및 f2를 조정하는 프로세스에서, 많은 수의 샘플 데이터세트를 필요로 하지 않는다. 많은 수의 샘플 데이터세트에 대한 필요성이 없기 때문에, 일반 채점 카드 모델이 빠르게 트레이닝될 수 있다.

단계 220, 샘플 데이터세트 내의 적어도 하나의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라, 교차 채점 카드 모델(cross scoring card model)을 트레이닝시킴.

교차 채점 카드 모델을 트레이닝시키는 프로세스는 다음의 것을 포함할 수도 있다: 교차 채점 카드 모델: y = f(x1, x2)를 미리 설정함, 여기서 y는 채점 결과로서 정의될 수도 있고, x1은 특성 변수이며, x2는 하나의 다른 특성 변수이다. 함수 관계 f(x1, x2)는 하나의 다른 특성 변수 x2와의 특성 변수 x1의 교차 세그먼트(이진 교차 세그먼트로 또한 칭해짐)에 대응하는 점수 값으로 정의될 수도 있다. 후속하여, 일반 채점 카드 모델의 트레이닝은 함수 관계 f를 최적화하는 것에 의해 달성된다. 몇몇 실시형태에서, 함수 관계 f를 최적화하는 것은, 하나의 다른 특성 변수 x2와의 특성 변수 x1의 교차 세그먼트에 대응하는 점수 값을 조정하는 프로세스이다.

함수 관계 f를 최적화하는 프로세스는 f1을 최적화하는 프로세스와 유사한데, 이것은 여기서는 반복되지 않을 것이다.

특성 변수가 "사용자의 나이"이고, 사용자의 나이의 네 개의 세그먼트가 "20세 미만", "20세 이상 25세 이하", "25세 이상 30세 미만" 및 "30세 이상"이라는 것이 가정되는 예를 통해, 교차 세그먼트가 하기에서 설명될 것이다. 하나의 다른 특성 변수가 사용자의 교육 레벨이고, 사용자 교육 레벨의 네 개의 세그먼트가 "단기 대학 졸업생(associate) 또는 이하", "학사", "석사" 및 "박사 또는 그 이상"인 경우, 특성 변수 및 다른 특성 변수는 4 * 4 = 16 개의 교차 세그먼트를 형성할 수 있는데, 그 중 하나의 교차 세그먼트는, 예를 들면 "20세 미만 및 단기 대학 졸업생 또는 그 이하"일 수도 있다.

몇몇 실시형태에서, 교차 채점 카드 모델이 단계 220에서 구성될 때, y는 두 개의 독립적인 특성 변수(x1 및 x2)에 동시에 관련된다는 것이 가정된다. 즉, f(x1, x2)는 이진 함수이다, 즉, 상기의 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려한다. 따라서, 특성 변수 사이의 상호 작용은 교차 채점 카드 모델을 통해 잘 설명할 수 있다.

단계 230, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 성능 차이값을 상호 작용 지수로서 사용함.

하나의 예에서, 상기의 성능 차이값을 결정하기 이전에, 트레이닝된 일반 채점 카드 모델의 성능 지수값 obj{f1(x1) + f2(x2)} 및 트레이닝된 교차 채점 카드 모델의 성능 지수값 obj{f(x1, x2)}가 먼저 결정될 수 있다. 여기서, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 프로세스는 다음의 것을 포함할 수도 있다: 트레이닝된 일반 채점 카드 모델을 통해 샘플 데이터세트(예를 들면, 수집된 샘플 데이터 내의 모든 샘플 데이터세트)를 채점하는 것; 트레이닝된 일반 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것.

트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 프로세스는 다음의 것을 포함할 수도 있다: 트레이닝된 일반 채점 카드 모델을 사용하여 각각의 샘플 데이터세트를 채점하여 각각의 샘플 데이터세트에 대한 채점 결과를 획득하는 것; 각각의 샘플 데이터세트의 채점 결과 및 각각의 샘플 데이터세트의 샘플 라벨에 따라, 각각의 샘플 데이터세트의 에러를 결정하는 것; 모든 샘플 데이터세트의 에러에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것.

트레이닝된 교차 채점 카드 모델의 성능 지수값 obj{f(x1, x2)}를 결정하는 프로세스는 다음의 것을 포함할 수도 있다: 트레이닝된 교차 채점 카드 모델을 사용하여 각각의 샘플 데이터세트를 채점하는 것; 트레이닝된 교차 채점 카드 모델에 의한 채점 결과 및 각각의 샘플 데이터세트의 샘플 라벨에 따라, 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 것.

일반 채점 카드 모델 및 교차 채점 카드 모델에 대한 성능 지수를 결정하기 위한 상기의 방법은 단지 예시에 불과하다. 실제로, 모델 성능을 평가하는 다른 방법이 있는데, 그 다른 방법은 하나씩 반복되지는 않을 것이다.

트레이닝된 일반 채점 카드 모델의 성능 지수값 및 트레이닝된 교차 채점 카드 모델의 성능 지수값이 결정된 이후, 두 값에 대한 감산이 수행되어, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값 I(x1, x2)를 결정할 수도 있다. 즉, I(x1, x2) = obj{f(x1, x2)} - obj{f1(x1) + f2(x2)}이다. 몇몇 실시형태에서, 성능 차이값 I(x1, x2)는, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이를 설명하기 위해 사용된다.

몇몇 실시형태에서, 교차 채점 카드 모델이 특성 변수 사이의 상호 작용을 고려하기 때문에, 특성 변수 사이의 상호 작용은 교차 채점 카드 모델을 통해 잘 설명될 수 있다. 그러나, 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 일반적으로 설명하지 않는다. 따라서, 성능 차이값은 특성 변수 사이의 상호 작용 지수로서 사용될 수 있다. 예를 들면, 상호 작용 지수가 상대적으로 작은 경우(예를 들면, 0에 가까운 경우), 그것은, 두 특성 변수 사이의 상호 작용은 상대적으로 약하다는 것을 나타낸다. 반대로, 상호 작용 지수가 상대적으로 높은 경우, 그 것은, 두 특성 변수 사이의 상호 작용이 상대적으로 강하다는 것을 나타낸다.

단계 130, 상호 작용 지수에 따라 특성 변수의 클러스터링 지수를 결정하는 것.

몇몇 실시형태에서, 복수의 다른 특성 변수가 존재하는 경우, 복수의 상호 작용 지수가 획득되는데, 상호 작용 지수의 각각을 획득하기 위한 방법은, 도 2에 도시된 바와 같이, 유사하며, 여기서는 반복되지 않을 것이다.

예를 들면, 샘플 데이터세트가 세 개의 특성 변수 및 대응하는 특성값을 포함한다는 것, 및 이들 세 개의 특성 변수가 각각 x1, x2 및 x3이라는 것을 가정한다. 특성 변수가 x1인 경우, 다른 특성 변수는 x2 및 x3을 포함한다. 상응하여, 계산될 두 개의 상호 작용 지수가 있다: I(x1, x2) 및 I(x1, x3). 하나의 구현예에서, 복수의 상호 작용 지수가 결정된 이후, 복수의 상호 작용 지수는 가산될 수 있고, 가산 결과는 특성 변수 x1의 클러스터링 지수로서 사용된다. 즉, 식 1이 사용되어 특성 변수의 클러스터링 지수를 결정할 수 있다.

여기서, xi는, 클러스터링 지수가 현재 결정될 필요가 있는 특성 변수인데, [1, N]의 값 범위를 가지며, Agg(xi)는 특성 변수 xi의 클러스터링 지수이고, N은 xj는 특성 변수의 개수이고, xj는 특성 변수 xi와는 상이한 다른 N-1 개의 특성 변수이다.

몇몇 실시형태에서, N 개의 클러스터링 지수는, Agg(x1), Agg(x2), ..., Agg(xN)에 의해 각각 표현되는 N 개의 특성 변수가 존재하는 경우에 결정될 수 있다.

단계 140, (예를 들면, 모든) 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택함.

하나의 구현예에서, 모든 특성 변수의 클러스터링 지수는 비교될 수 있고, 최대 클러스터링 지수에 대응하는 특성 변수는 타깃 특성 변수로서 선택된다. 몇몇 실시형태에서, 특성 변수의 클러스터링 지수는, 특성 변수 및 다른 특성 변수의 상호 작용 지수의 합이고, 한편 상호 작용 지수는 특성 변수와의 상호 작용의 강도를 설명하기 위해 사용된다. 따라서, 특성 변수가 최대 클러스터링 지수를 갖는 경우, 그것은, 특성 변수가 다른 모든 특성 변수와 상대적으로 강한 상호 작용을 갖는다는 것을 나타낸다. 즉, 다른 모든 특성 변수와 상대적으로 강한 상호 작용을 갖는 특성 변수가 타깃 특성 변수로서 선택될 수 있다.

단계 150, 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할함.

여기서, 샘플 데이터세트를 하위 그룹으로 분할하는 프로세스는 클러스터링 프로세스로 또한 칭해질 수도 있다. 클러스터링 및 모델링에서 특성 변수 및 대응하는 특성값에 따라 샘플 데이터세트를 클러스터링하는 것은 종래 기술일 수도 있는데, 여기서는 반복되지 않을 것이다.

몇몇 실시형태에서, 상기에서 언급되는 바와 같이, 타깃 특성 변수는, 다른 모든 특성 변수와 상대적으로 강한 상호 작용을 갖는 특성 변수를 지칭할 수도 있다. 따라서, 타깃 특성 변수 및 대응하는 특성값에 따른 샘플 데이터세트의 클러스터링은, 클러스터 내에서의 상호 작용을 감소시켜, 가장 이상적인 클러스터링 및 모델링의 목표를 달성할 수 있다.

단계 160, 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델을 구축함.

예를 들면, 모든 샘플 데이터세트 하위 그룹이 획득된 이후, 각각의 샘플 데이터세트 하위 그룹에 대해 일반 채점 카드 모델이 트레이닝될 수 있는데, 이것은 표 1에서 도시되어 있다.

몇몇 실시형태에서, 채점 모델이 구축된 이후, 채점 모델에 기초하여 사용자 신용이 평가될 수 있거나 또는 거래 활동 위험이 추정될 수 있다. 채점 모델에 기초한 사용자 신용 평가를 예로 들면, 평가 방법은 도 3에 도시된 바와 같을 수도 있다. 도 3에 도시된 바와 같이, 방법은 다음의 단계를 포함할 수도 있다:

310 단계, 사용자의 신용 데이터 정보를 획득함.

여기서, 사용자의 신용 데이터 정보는 백엔드 데이터베이스로부터 수동으로 또는 서버에 의해 수집될 수도 있는데, 사용자의 신용 데이터 정보는 다음의 세 가지 양태의 데이터를 포함할 수 있지만, 그러나 이들로 제한되는 것은 아니다: 1) 사용자 활동 데이터; 2) 사용자 경향 데이터; 3) 사용자 프로파일 데이터.

단계 320, 신용 데이터 정보에 따라, 타깃 특성 변수 및 하나 이상의 다른 특성 변수에 각각 대응하는 특성값을 결정함. 몇몇 실시형태에서, 타깃 특성 변수는 복수의 특성 변수의 클러스터링 지수, 및 하위 그룹으로 분류되며 복수의 특성 변수 및 특성 변수의 각각에 대한 대응하는 특성값을 포함하는 복수의 샘플 데이터세트에 따라 선택된다.

본원에서의 타깃 특성 변수는, 상기 단계 120 내지 단계 140을 통해 선택되는 타깃 특성 변수를 가리킨다. 그 선택 프로세스는 상기에서 설명되는 바와 동일한데, 여기서는 반복되지 않을 것이다.

신용 데이터 정보가, 20세인 사용자의 나이, 학사인 사용자의 교육 레벨, 및 0인 사용자의 수입을 포함하는 일례에서, 타깃 특성 변수가 사용자의 나이이고, 다른 특성 변수가 사용자의 교육 레벨 및 사용자의 수입을 포함한다는 것을 가정한다. 타깃 특성 변수에 대응하는 특성값은 20세의 나이이고, 다른 타깃 특성 변수에 대응하는 특성값은 각각 학사 및 0이다.

단계 330에서, 타깃 특성 변수에 대응하는 특성값에 따라 대응하는 샘플 데이터세트 하위 그룹을 선택함.

예를 들면, 타깃 특성 변수가 사용자의 나이이고, 복수의 샘플 데이터세트를 포함하는 샘플 데이터가, 타깃 특성 변수에 대응하는 특성값에 따라, 네 개의 샘플 데이터세트 하위 그룹으로 분할되고(예를 들면, 네 개의 클러스터로 분할됨), 제1 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 20세보다 더 어리고, 제2 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 20세와 25세 사이이고, 제3 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 25세와 30세 사이이며, 제4 샘플 데이터세트 하위 그룹 내의 사용자의 나이가 30세보다 더 많다는 것을 가정한다. 사용자의 신용 데이터 정보에 따라, 타깃 특성 변수에 대응하여 결정되는 특성값은 20세에 대해 선택되는 제2 샘플 데이터세트 하위 그룹이다.

단계 340, 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정함.

상기의 예에서와 같이, 제2 샘플 데이터세트 하위 그룹에 대응하는 선택된 하위 채점 모델은 표 2에 도시된 바와 같다는 것이 가정된다.

예를 들면, 제2 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델이 표 2에 도시된 바와 같은 경우, 두 개의 다른 특성 변수에 대응하는 특성값은 학사 및 0이고, 그 다음, 사용자의 신용 점수 = 37 + 30 = 67이다.

단계 350, 사용자의 신용 점수에 따라 사용자의 신용을 평가함.

하나의 구현예에서, 임계치가 구성될 수 있다. 사용자의 신용 점수가 미리 설정된 임계치를 초과하면, 그것은, 사용자가 상대적으로 높은 신용을 가지고 있다는 것을 나타낸다. 사용자의 신용 점수가 미리 설정된 임계치를 초과하지 않으면, 그것은, 사용자가 상대적으로 낮은 신용을 갖는다는 것을 나타낸다.

본 개시내용의 실시형태에 따른 사용자 신용을 평가하기 위한 방법은, 사용자의 신용을 정확하게 평가할 수 있고 평가 효율성을 향상시킬 수 있다.

채점 모델을 구축하기 위한 상기의 방법에 대응하여, 본 개시내용의 실시형태는 또한, 도 4에 도시된 바와 같은 채점 모델을 구축하기 위한 디바이스(예를 들면, 서버 단말)를 제공하며, 디바이스는 서로 커플링되는 프로세서(411) 및 메모리(412)를 포함할 수도 있다. 메모리(412)는 비일시적이며 컴퓨터 판독 가능할 수도 있고, 프로세서(411)에 의해 실행될 때 디바이스로 하여금 본원에서 설명되는 다양한 단계 및 방법을 수행하게 하는 명령어를 저장한다. 명령어는 하기에서 설명되는 다양한 유닛으로서 구현될 수도 있다. 용어 "비일시적 매체" 및 유사한 용어는, 본원에서 사용될 때, 머신으로 하여금 특정한 양식으로 동작하게 하는 데이터 및/또는 명령어를 저장하는 임의의 매체를 지칭한다. 그러한 비일시적 매체는 불휘발성 매체 및/또는 휘발성 매체를 포함할 수도 있다. 불휘발성 매체는, 예를 들면, 스토리지 디바이스(410)와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 매체는, 메인 메모리(406)와 같은 동적 메모리를 포함한다. 비일시적 매체의 일반적인 형태는, 예를 들면, 플로피 디스크, 플렉시블 디스크, 하드 디스크, 솔리드 스테이트 드라이브, 자기 테이프, 또는 임의의 다른 자기 데이터 저장 매체, CD-ROM, 임의의 다른 광학 데이터 저장 매체, 홀의 패턴을 갖는 임의의 물리적 매체, RAM, PROM, 및 EPROM, FLASH-EPROM, NVRAM, 임의의 다른 메모리 칩 또는 카트리지, 및 이들의 네트워크화된 버전을 포함한다.

몇몇 실시형태에서, 그러한 유닛은, 적어도 하나의 특성 변수 및 대응하는 특성값을 각각 포함하는 복수의 샘플 데이터세트를 수집하도록 구성되는 수집 유닛(401); 및 각각의 특성 변수에 대해, 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하도록 구성되는 획득 유닛(402)을 포함할 수도 있다.

옵션 사항으로, 획득 유닛(402)은: 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라, 일반 채점 카드 모델을 트레이닝하도록; 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라, 교차 채점 카드 모델을 트레이닝하도록; 그리고 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 성능 차이값을 상호 작용 지수로 사용하도록 구성될 수도 있다.

여기서, 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은 다음의 것을 포함할 수도 있다: 트레이닝된 일반 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 일반 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것; 트레이닝된 교차 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 교차 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 것; 및 트레이닝된 일반 채점 카드 모델의 성능 지수값 및 트레이닝된 교차 채점 카드 모델의 성능 지수값에 따라 성능 차이값을 결정하는 것.

다양한 유닛은, 획득 유닛(402)에 의해 획득되는 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정하도록 구성되는 결정 유닛(403)을 더 포함할 수도 있다.

옵션 사항으로(optionally), 복수의 상호 작용 지수가 존재하는 경우, 결정 유닛(403)은: 복수의 상호 작용 지수에 대해 덧셈 연산을 수행하여 합산 결과를 획득하도록; 그리고 덧셈 결과를 특성 변수의 클러스터링 지수로서 사용하도록 구성될 수 있다.

다양한 유닛은, 결정 유닛(403)에 의해 결정되는 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하도록 구성되는 선택 유닛(404)을 더 포함할 수도 있다.

옵션 사항으로, 선택 유닛(404)은 구체적으로: 모든 특성 변수의 클러스터링 지수를 비교하고, 최대 클러스터링 지수에 대응하는 특성 변수를 타깃 특성 변수로서 선택하도록 구성될 수 있다.

다양한 유닛은, 선택 유닛(404)에 의해 선택되는 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하도록 구성되는 분할 유닛(405)을 더 포함할 수도 있다.

다양한 유닛은, 분할 유닛(405)에 의해 분할되는 각각의 샘플 데이터세트 하위 그룹에 대한 대응하는 하위 채점 모델을 구축하도록 구성되는 구축 유닛(406)을 더 포함할 수도 있다.

본 개시내용의 실시형태에 따른 디바이스의 기능 모듈(예를 들면, 유닛)의 기능은, 상기의 방법 실시형태의 단계를 통해 구현될 수 있다. 따라서, 본 개시내용에 따른 디바이스의 특정한 작업 프로세스는 여기에서는 반복되지 않을 것이다.

본 개시내용의 몇몇 실시형태에 따른 채점 모델을 구축하기 위한 디바이스에서, 수집 유닛(401)은 복수의 샘플 데이터세트를 포함하는 샘플 데이터를 수집한다. 각각의 특성 변수에 대해, 획득 유닛(402)은 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득한다. 결정 유닛(403)은, 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정한다. 선택 유닛(404)은, 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택한다. 분할 유닛(405)은, 타깃 특성 변수 및 대응하는 특성값에 따라, 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할한다. 각각의 샘플 데이터세트 하위 그룹에 대해, 구축 유닛(406)은 대응하는 하위 채점 모델을 구축한다. 따라서, 채점 모델 구축의 정확도가 향상될 수 있다.

본 개시내용의 하나의 양태에 따르면, 도 4에 도시된 바와 같이, 유닛(401-406)은 메모리에 저장되어 있는 명령어를 포함하는 소프트웨어 기능 유닛이다. 다른 양태에 따르면, 유닛(401-406)은 하드웨어, 예를 들면 상기에서 설명되는 바와 같은 기능성(functionality)을 수행하도록 프로그래밍되는 회로부(circuitry)에 의해 구현될 수도 있다.

사용자 신용을 평가하기 위한 상기에서 설명된 방법에 대응하여, 본 개시내용의 실시형태는 또한, 도 5에 도시된 바와 같이 사용자 신용을 평가하기 위한 디바이스(예를 들면, 서버 단말)를 제공하며, 디바이스는 서로 커플링되는 프로세서(511) 및 메모리(512)를 포함할 수도 있다. 메모리(512)는 비일시적이며 컴퓨터 판독 가능할 수도 있고, 프로세서(511)에 의해 실행될 때 디바이스로 하여금 본원에서 설명되는 다양한 단계 및 방법을 수행하게 하는 명령어를 저장한다. 명령어는 하기에서 설명되는 다양한 유닛으로서 구현될 수도 있다.

몇몇 실시형태에서, 그러한 유닛은 다음의 것을 포함할 수도 있다: 사용자의 신용 데이터 정보를 획득하도록 구성되는 획득 유닛(501); 획득 유닛(501)에 의해 획득되는 신용 데이터 정보에 따라, 타깃 특성 변수 및 다른 특성 변수에 각각 대응하는 특성값을 결정하도록 구성되는 결정 유닛(502)으로서, 타깃 특성 변수는 샘플 데이터세트 내의 모든 특성 변수의 클러스터링 지수에 따라 선택되고, 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 상기 결정 유닛; 결정 유닛(502)에 의해 결정되는 타깃 특성 변수에 대응하는 특성값에 따라, 대응하는 샘플 데이터세트 하위 그룹을 선택하도록 구성되는 선택 유닛(503).

몇몇 실시형태에서, 결정 유닛(502)은 또한, 선택 유닛(503)에 의해 선택되는 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 다른 특성 변수에 대응하는 특성값에 따라 사용자의 신용 점수를 결정하도록 구성될 수도 있다.

몇몇 실시형태에서, 다양한 유닛은, 결정 유닛(502)에 의해 결정되는 사용자의 신용 점수에 따라, 사용자의 신용을 평가하도록 구성되는 평가 유닛(504)을 더 포함할 수도 있다.

옵션 사항으로, 선택 유닛(503)은 또한: 샘플 데이터세트 내의 각각의 특성 변수에 대해, 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하도록; 상호 작용 지수에 따라, 특성 변수의 클러스터링 지수를 결정하도록; 그리고 모든 특성 변수의 클러스터링 지수에 따라, 적어도 하나의 특성 변수로부터 타깃 특성 변수를 선택하도록 구성된다.

옵션 사항으로, 상기의 다른 특성 변수와의 특성 변수의 상호 작용 지수를 획득하는 것은 다음의 것을 포함할 수 있다: 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것; 샘플 데이터세트 내의 특성 변수 및 대응하는 특성값, 및 다른 특성 변수 및 대응하는 특성값, 및 샘플 데이터세트의 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것; 및 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 성능 차이값을 상호 작용 지수로서 사용하는 것.

옵션 사항으로, 상기의 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은 다음의 것을 포함한다: 트레이닝된 일반 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 일반 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 것; 트레이닝된 교차 채점 카드 모델을 사용하여 샘플 데이터세트를 채점하는 것; 트레이닝된 교차 채점 카드 모델에 의한 샘플 데이터세트 채점 결과 및 샘플 라벨에 따라, 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 것; 트레이닝된 일반 채점 카드 모델의 성능 지수값 및 트레이닝된 교차 채점 카드 모델의 성능 지수값에 따라 성능 차이값을 결정하는 것.

본 개시내용의 실시형태에 따른 디바이스의 기능 모듈의 기능은, 상기의 방법 실시형태의 단계를 통해 구현될 수 있다. 따라서, 본 개시내용에 따른 디바이스의 특정한 작업 프로세스는 여기에서는 반복되지 않을 것이다.

본 개시내용의 하나의 양태에 따르면, 도 5에 도시된 바와 같이, 유닛(501-504)은 메모리에 저장되어 있는 명령어를 포함하는 소프트웨어 기능 유닛이다. 다른 양태에 따르면, 유닛(501-504)은 하드웨어, 예를 들면 상기에서 설명되는 바와 같은 기능성을 수행하도록 프로그래밍되는 회로부에 의해 구현될 수도 있다.

본 개시내용의 실시형태에 따른 사용자 신용을 평가하기 위한 디바이스는 사용자 신용을 정확하게 평가할 수 있다.

기술 분야의 숙련된 자는, 상기의 하나 이상의 예에서 본 개시내용에 의해 설명되는 기능이 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의의 조합을 통해 구현될 수 있다는 것을 인식해야 한다. 소프트웨어를 통해 구현될 때, 이들 기능은 컴퓨터 판독 가능 매체에 저장될 수 있거나 또는 컴퓨터 판독 가능 매체 상의 하나 이상의 명령어 또는 코드로서 전파될 수 있다.

상기에서 설명되는 구현예는 또한, 본 개시내용의 목적, 기술적 솔루션 및 유리한 효과를 상세히 설명한다. 상기의 설명은 단지 예시적인 것이며 본 개시내용의 범위를 제한하기 위해 사용되는 것이 아니다는 것이 이해되어야 한다. 본 출원의 기술적 솔루션에 기초하여 이루어지는 임의의 수정예, 등가적 대체예 또는 개선예는 본 개시내용의 범위에 의해 포괄될 것이다.

Claims

프로세서를 포함하여 채점 모델(scoring model)을 구축하기 위한 디바이스에 의해 수행되는 채점 모델을 구축하기 위한 방법으로서,
상기 디바이스가 다수의 특성 변수를 포함하는 복수의 샘플 데이터세트를 수집하는 단계로서, 각각의 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 복수의 샘플 데이터세트를 수집하는 단계;
상기 디바이스가, 각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수(interaction index)를 획득하는 단계로서,
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 샘플 라벨(sample label)에 따라 일반 채점 카드 모델(regular scoring card model)을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델(cross scoring card model)을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
상기 디바이스가, 각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
상기 디바이스가 상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수(target characteristic variable)를 선택하는 단계;
상기 디바이스가 상기 타깃 특성 변수 및 대응하는 특성값에 따라 상기 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및
상기 디바이스가 상기 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델(sub-scoring model)을 구축하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
삭제
제1항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
제1항에 있어서, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계는,
상기 디바이스가 상기 복수의 상호 작용 지수에 대해 덧셈 연산을 수행하여 합산 결과를 획득하는 단계; 및
상기 디바이스가 상기 합산 결과를 상기 특성 변수의 상기 클러스터링 지수로서 사용하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
제1항에 있어서, 상기 타깃 특성 변수를 선택하는 단계는,
상기 디바이스가 상기 특성 변수의 상기 클러스터링 지수를 비교하고, 상기 특성 변수 중, 최대 클러스터링 지수에 대응하는 특성 변수를 상기 타깃 특성 변수로서 선택하는 단계를 포함하는, 채점 모델을 구축하기 위한 방법.
프로세서를 포함하여 사용자 신용을 평가하기 위한 디바이스에 의해 수행되는 사용자 신용을 평가하기 위한 방법으로서,
상기 디바이스가 다수의 특성 변수 및 상기 다수의 특성 변수에 대응하는 제1 특성값을 포함하는 샘플 데이터세트를 획득하는 단계;
상기 디바이스가, 상기 다수의 특성 변수 각각에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수를 획득하는 단계로서,
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
상기 디바이스가, 각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
상기 디바이스가 상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수를 선택하는 단계;
상기 디바이스가 상기 타깃 특성 변수 및 대응하는 제1 특성값에 따라 샘플 데이터세트를 다수의 샘플 데이터세트 하위 그룹으로 분할하는 단계;
상기 디바이스가 사용자의 신용 데이터를 획득하는 단계;
상기 디바이스가 상기 신용 데이터에 따라, 상기 타깃 특성 변수 및 다른 특성 변수에 각각 대응하는 제2 특성값을 결정하는 단계;
상기 디바이스가 상기 타깃 특성 변수에 대응하는 제2 특성값에 따라 상기 샘플 데이터세트 하위 그룹으로부터 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 및
상기 디바이스가 상기 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 상기 다른 특성 변수에 대응하는 제2 특성값에 따라 상기 사용자의 신용 점수를 결정하는 단계를 포함하는, 사용자 신용을 평가하기 위한 방법.
삭제
삭제
제6항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 디바이스가 상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
상기 디바이스가 상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 사용자 신용을 평가하기 위한 방법.
디바이스로서, 상기 디바이스는 프로세서 및 상기 프로세서에 의해 실행될 때 상기 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함하며, 상기 방법은,
다수의 특성 변수를 포함하는 복수의 샘플 데이터세트를 수집하는 단계로서, 각각의 샘플 데이터세트는 적어도 하나의 특성 변수 및 대응하는 특성값을 포함하는, 복수의 샘플 데이터세트를 수집하는 단계;
각각의 특성 변수에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수를 획득하는 단계로서,
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 특성값, 상기 다른 특성 변수 및 대응하는 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수를 선택하는 단계;
상기 타깃 특성 변수 및 대응하는 특성값에 따라 상기 복수의 샘플 데이터세트를 복수의 샘플 데이터세트 하위 그룹으로 분할하는 단계; 및
상기 샘플 데이터세트 하위 그룹의 각각에 대한 대응하는 하위 채점 모델을 구축하는 단계를 포함하는, 디바이스.
삭제
제10항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 디바이스.
제10항에 있어서, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계는,
상기 복수의 상호 작용 지수에 대해 덧셈 연산을 수행하여 합산 결과를 획득하는 단계; 및
상기 합산 결과를 상기 특성 변수의 상기 클러스터링 지수로서 사용하는 단계를 포함하는, 디바이스.
제10항에 있어서, 상기 타깃 특성 변수를 선택하는 단계는,
상기 특성 변수의 상기 클러스터링 지수를 비교하고, 상기 특성 변수 중, 최대 클러스터링 지수에 대응하는 특성 변수를 상기 타깃 특성 변수로서 선택하는 단계를 포함하는, 디바이스.
디바이스로서, 상기 디바이스는 프로세서 및 상기 프로세서에 의해 실행될 때 상기 디바이스로 하여금 방법을 수행하게 하는 명령어를 저장하는 비일시적 컴퓨터 판독 가능 저장 매체를 포함하고, 상기 방법은,
다수의 특성 변수 및 상기 다수의 특성 변수에 대응하는 제1 특성값을 포함하는 샘플 데이터세트를 획득하는 단계;
상기 다수의 특성 변수 각각에 대해, 하나 이상의 다른 특성 변수의 각각과의 상기 특성 변수의 상호 작용 지수를 획득하는 단계로서,
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 샘플 데이터세트 내의 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 샘플 라벨에 따라 일반 채점 카드 모델을 트레이닝시키는 것으로서, 상기 일반 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하지 않는 것;
상기 샘플 데이터세트 내의 상기 특성 변수 및 대응하는 제1 특성값, 상기 다른 특성 변수 및 대응하는 제1 특성값, 및 상기 샘플 데이터세트의 상기 샘플 라벨에 따라 교차 채점 카드 모델을 트레이닝시키는 것으로서,상기 교차 채점 카드 모델은 특성 변수 사이의 상호 작용을 고려하는 것; 및
트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하고, 상기 성능 차이값을 상기 상호 작용 지수로서 사용하는 것;
을 포함하는 동작을 수행하여, 상기 상호 작용 지수를 획득하는 것인, 상기 상호 작용 지수를 획득하는 단계;
각각의 특성 변수에 대해, 상기 상호 작용 지수에 따라 상기 특성 변수의 클러스터링 지수를 결정하는 단계로서, 각각의 클러스터링 지수는 특성 변수와 다른 특성 변수 간의 상호 작용의 상대적 강도를 나타내는, 상기 클러스터링 지수를 결정하는 단계;
상기 특성 변수의 상기 클러스터링 지수에 따라, 다른 특성 변수와의 상호 작용의 상대적 강도가 가장 높은 특성 변수로부터 타깃 특성 변수를 선택하는 단계;
상기 타깃 특성 변수 및 대응하는 제1 특성값에 따라 샘플 데이터세트를 다수의 샘플 데이터세트 하위 그룹으로 분할하는 단계;
사용자의 신용 데이터를 획득하는 단계;
상기 신용 데이터에 따라, 상기 타깃 특성 변수 및 다른 특성 변수에 각각 대응하는 제2 특성값을 결정하는 단계;
상기 타깃 특성 변수에 대응하는 제2 특성값에 따라 상기 샘플 데이터세트 하위 그룹으로부터 대응하는 샘플 데이터세트 하위 그룹을 선택하는 단계; 및
상기 샘플 데이터세트 하위 그룹에 대응하는 하위 채점 모델 및 상기 다른 특성 변수에 대응하는 제2 특성값에 따라 상기 사용자의 신용 점수를 결정하는 단계를 포함하는, 디바이스.
삭제
삭제
제15항에 있어서, 상기 트레이닝된 일반 채점 카드 모델과 트레이닝된 교차 채점 카드 모델 사이의 성능 차이값을 결정하는 것은,
상기 트레이닝된 일반 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 트레이닝된 일반 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 일반 채점 카드 모델의 성능 지수값을 결정하는 단계;
상기 트레이닝된 교차 채점 카드 모델을 사용하여 상기 샘플 데이터세트를 채점하는 단계;
상기 트레이닝된 교차 채점 카드 모델에 의해 채점되는 샘플 데이터세트 채점 결과 및 상기 샘플 라벨에 따라, 상기 트레이닝된 교차 채점 카드 모델의 성능 지수값을 결정하는 단계; 및
상기 트레이닝된 일반 채점 카드 모델의 상기 성능 지수값 및 상기 트레이닝된 교차 채점 카드 모델의 상기 성능 지수값에 따라 상기 성능 차이값을 결정하는 단계를 포함하는, 디바이스.