KR20230068067A

KR20230068067A - 빅데이터 기반 부동산 매물 데이터 분석 방법

Info

Publication number: KR20230068067A
Application number: KR1020210153993A
Authority: KR
Inventors: 정동훈
Original assignee: 주식회사 세이프홈즈
Priority date: 2021-11-10
Filing date: 2021-11-10
Publication date: 2023-05-17

Abstract

데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 방법이 개시된다. 개시된 방법은 정상 매물로 분류된 복수의 부동산 매물에 대한 제1 참조 데이터를 획득하는 단계; 위험 매물로 분류된 복수의 부동산 매물에 대한 제2 참조 데이터를 획득하는 단계; 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출하고, 상기 평가 파라미터들의 값들에 기반하여 상기 제1 참조 데이터에 포함된 부동산 매물들에 대응하는 제1 포인트들의 좌표를 결정하는 단계; 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출함으로써 상기 제2 참조 데이터에 포함된 부동산 매물들에 대응하는 제2 포인트들의 좌표를 결정하는 단계; 상기 제1 포인트들 및 상기 제2 포인트들의 좌표에 기반하여 n차원 공간 상에 포인트 맵을 생성하는 단계; (n은 상기 평가 파라미터들의 개수에 대응하는 2 이상의 자연수) 평가대상 부동산 매물의 평가 파라미터들을 추출함으로써 상기 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정하고, 상기 포인트 맵에 상기 평가대상 포인트를 추가하는 단계; 상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계; 및 상기 평가대상 포인트가 포함된 타깃 클러스터를 구성하는 포인트들의 정보에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 단계를 포함한다.

Description

빅데이터 기반 부동산 매물 데이터 분석 방법{REAL ESTATE SALES DATA ANALYSIS BASED ON BIG DATA}

이하의 설명은 데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 방법 및 장치에 관한 것이다. 보다 구체적으로 정상 매물로 분류된 제1 참조 데이터와 위험 매물로 분류된 제2 참조 데이터에 기반하여 포인트 맵을 형성하고, 포인트 맵에서의 클러스터링을 이용하여 부동산 매물의 위험도를 효과적으로 분석하는 방법 및 장치에 관한 것이다.

일반적으로 부동산은 자산에서 가장 큰 비중을 차지하고 있으며 희소성에 의한 영향과 사회적, 경제적, 행정적 작용에 의해 그 가치와 권리가 영향을 받는다. 이로 인해 부동산 거래에 있어서 매물을 분석하는 데에는 높은 전문성과 많은 시간이 소요된다.

부동산의 거래 형태는 다양하며 대표적인 거래 형태로 임대차 계약이 있다. 통상적으로 임차인은 부동산에 대한 정보 수집 능력이 부족하기 때문에 임차 보증금의 적정성, 거래의 위험성 등을 파악할 능력이 부재하다.

최근 부동산 매물의 안정성에 대해 분석 솔루션을 제공하는 기술들이 제시되고 있다. 하지만, 종래 기술들은 미리 정해진 알고리즘에 평가하고자 하는 부동산 매물의 파라미터를 입력하는 방식으로서, 변화하는 거래 실정을 유연하게 반영하기 어려우며 알고리즘의 정확도가 매우 떨어지는 문제가 있다. 또한, 부동산 거래에 있어서 위험도에 관여하는 변수가 매우 많을 뿐 아니라 변수가 위험도에 주는 영향이 획일적이지 않기 때문에 부동산 매물의 위험도를 자동으로 예측하는 것이 어려운 실정이다.

(공개특허) 재10-2006-0033976호 (등록특허) 제10-1996797호 (등록특허) 제10-2092790호 (등록특허) 제10-2210619호

적어도 하나의 실시 예에 따르면, 데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 방법 및 장치가 개시된다.

일 측면에 따르면 데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 방법이 개시된다. 개시된 방법은 정상 매물로 분류된 복수의 부동산 매물에 대한 제1 참조 데이터를 획득하는 단계; 위험 매물로 분류된 복수의 부동산 매물에 대한 제2 참조 데이터를 획득하는 단계; 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출하고, 상기 평가 파라미터들의 값들에 기반하여 상기 제1 참조 데이터에 포함된 부동산 매물들에 대응하는 제1 포인트들의 좌표를 결정하는 단계; 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출함으로써 상기 제2 참조 데이터에 포함된 부동산 매물들에 대응하는 제2 포인트들의 좌표를 결정하는 단계; 상기 제1 포인트들 및 상기 제2 포인트들의 좌표에 기반하여 n차원 공간 상에 포인트 맵을 생성하는 단계; (n은 상기 평가 파라미터들의 개수에 대응하는 2 이상의 자연수), 평가대상 부동산 매물의 평가 파라미터들을 추출함으로써 상기 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정하고, 상기 포인트 맵에 상기 평가대상 포인트를 추가하는 단계; 상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계; 및 상기 평가대상 포인트가 포함된 타깃 클러스터를 구성하는 포인트들의 정보에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 단계를 포함한다.

상기 평가 파라미터들은 부동산 매매 가격, 평당 가격, 부동산 평수, 보증금, 월 임대료, 단위 기간당 거래 횟수, 선순위 담보 물권 개수, 선순위 담보권 채권액, 단위 기간동안 부동산 매매 가격 상승률, 단위 기간동안 보증금 상승률 및 적어도 둘 이상의 파라미터들을 포함할 수 있다.

상기 방법은 상기 평가대상 부동산 매물의 메타데이터를 획득하는 단계; 및 상기 평가대상 부동산 매물의 메타데이터와 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제1 포인트들 각각의 질량 가중치를 결정하는 단계; 상기 평가대상 부동산 매물의 메타데이터와 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제2 포인트들 각각의 질량 가중치를 결정하는 단계를 더 포함하며, 상기 제1 포인트들 각각의 질량 가중치 및 상기 제2 포인트들 각각의 질량 가중치가 상기 포인트 맵에 반영될 수 있다.

상기 부동산 매물의 메타데이터는 건물의 위치, 건물의 용도, 냉/난방 방식, 승강기 정보, 전용 면적, 공유 면적 중 적어도 둘 이상을 포함할 수 있다.

상기 방법은 상기 포인트 맵의 포인트들을 상기 n차원 공간의 좌표축들 각각에 투영(projection)하는 단계; 상기 좌표축들 각각에 대하여 투영된 포인트들의 분포에 기초하여 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계; 및 상기 효용성이 낮은 적어도 하나의 좌표축을 제외함으로써 상기 포인트 맵을 m차원 공간 상으로 투영하는 단계를 더 포함하며, (m은 상기 n보다 작은 자연수) 상기 클러스터링은 상기 m차원 공간 상의 포인트 맵에 대해서 수행될 수 있다.

상기 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계는, 상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 좌표축들 각각에 투영된 제2 포인트들의 제2 질량중심 사이의 거리에 기초하여 상기 좌표축들 각각의 효용성을 결정할 수 있다.

상기 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계는, 상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 제1 포인트들 사이의 거리의 제곱의 합과, 상기 좌표축들 각각에 대해 투영된 제2 포인트들의 제2 질량중심과 상기 제2 포인트들 사이의 거리의 제곱의 합에 기초하여 상기 좌표축들 각각의 효용성을 결정할 수 있다.

상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계는, k-평균 클러스터링(k-means clustering), k-중간점(k-medoid), 평균 이동 클러스터링(mean-shift clustering), 응집적 계층적 클러스터링(Agglomerative Hierarchical Clustering) 중 적어도 하나를 이용하여 수행될 수 있다.

상기 평가대상 부동산 매물의 위험도를 결정하는 단계는, 상기 타깃 클러스터에 포함된 제1 포인트들의 질량 합과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량 합에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정할 수 있다.

상기 평가대상 부동산 매물의 위험도를 결정하는 단계는, 상기 타깃 클러스터에 포함된 제1 포인트들의 질량중심과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량중심에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정할 수 있다.

상기 방법은 상기 평가대상 부동산 매물의 정보 변동 이력을 감지하는 단계; 상기 평가대상 부동산 매물의 정보 변동 이력에 기초하여 상기 평가대상 포인트의 좌표를 갱신하는 단계; 갱신된 평가대상 포인트의 좌표에 기초하여 상기 평가대상 부동산 매물의 위험도를 재산출하는 단계; 및 상기 평가대상 부동산 매물의 위험도가 변경된 경우, 사용자에게 알람을 제공하는 단계를 포함할 수 있다.

다른 측면에 있어서, 데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 컴퓨팅 장치가 제공된다. 상기 컴퓨팅 장치는 통신부; 및

통신부를 제어하는 프로세서를 포함하며, 상기 프로세서는 정상 매물로 분류된 복수의 부동산 매물에 대한 제1 참조 데이터를 획득하는 단계; 위험 매물로 분류된 복수의 부동산 매물에 대한 제2 참조 데이터를 획득하는 단계; 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출하고, 상기 평가 파라미터들의 값들에 기반하여 상기 제1 참조 데이터에 포함된 부동산 매물들에 대응하는 제1 포인트들의 좌표를 결정하는 단계; 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출함으로써 상기 제2 참조 데이터에 포함된 부동산 매물들에 대응하는 제2 포인트들의 좌표를 결정하는 단계; 상기 제1 포인트들 및 상기 제2 포인트들의 좌표에 기반하여 n차원 공간 상에 포인트 맵을 생성하는 단계; (n은 상기 평가 파라미터들의 개수에 대응하는 2 이상의 자연수), 평가대상 부동산 매물의 평가 파라미터들을 추출함으로써 상기 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정하고, 상기 포인트 맵에 상기 평가대상 포인트를 추가하는 단계; 상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계; 및 상기 평가대상 포인트가 포함된 타깃 클러스터를 구성하는 포인트들의 정보에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 단계를 수행할 수 있다.

상기 프로세서는, 상기 평가대상 부동산 매물의 메타데이터를 획득하는 단계; 및 상기 평가대상 부동산 매물의 메타데이터와 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제1 포인트들 각각의 질량 가중치를 결정하는 단계; 상기 평가대상 부동산 매물의 메타데이터와 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제2 포인트들 각각의 질량 가중치를 결정하는 단계를 더 수행하며, 상기 제1 포인트들 각각의 질량 가중치 및 상기 제2 포인트들 각각의 질량 가중치가 상기 포인트 맵에 반영될 수 있다.

상기 프로세서는 상기 포인트 맵의 포인트들을 상기 n차원 공간의 좌표축들 각각에 투영(projection)하는 단계; 상기 좌표축들 각각에 대하여 투영된 포인트들의 분포에 기초하여 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계; 및 상기 효용성이 낮은 적어도 하나의 좌표축을 제외함으로써 상기 포인트 맵을 m차원 공간 상으로 투영하는 단계를 더 수행하며(m은 상기 n보다 작은 자연수), 상기 클러스터링은 상기 m차원 공간 상의 포인트 맵에 대해서 수행될 수 있다.

상기 프로세서는, 상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 좌표축들 각각에 투영된 제2 포인트들의 제2 질량중심 사이의 거리에 기초하여 상기 좌표축들 각각의 효용성을 결정할 수 있다.

상기 프로세서는, 상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 제1 포인트들 사이의 거리의 제곱의 합과, 기 좌표축들 각각에 대해 투영된 제2 포인트들의 제2 질량중심과 상기 제2 포인트들 사이의 거리의 제곱의 합에 기초하여 상기 좌표축들 각각의 효용성을 결정할 수 있다.

상기 프로세서는, 기 타깃 클러스터에 포함된 제1 포인트들의 질량 합과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량 합에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정할 수 있다.

상기 프로세서는 상기 타깃 클러스터에 포함된 제1 포인트들의 질량중심과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량중심에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정할 수 있다.

상기 프로세서는, 상기 평가대상 부동산 매물의 정보 변동 이력을 감지하는 단계; 상기 평가대상 부동산 매물의 정보 변동 이력에 기초하여 상기 평가대상 포인트의 좌표를 갱신하는 단계; 신된 평가대상 포인트의 좌표에 기초하여 상기 평가대상 부동산 매물의 위험도를 재산출하는 단계; 및 기 평가대상 부동산 매물의 위험도가 변경된 경우, 사용자에게 알람을 제공하는 단계를 더 수행할 수 있다.

적어도 하나의 실시예에 따르면, 부동산 평가에 이용되는 다양한 변수들을 클러스터링 과정에서 한꺼번에 고려함으로써 부동산 매물의 위험도 분석 과정을 단순화할 수 있다. 적어도 하나의 실시예에 따르면, 평가대상 부동산 매물의 위험도를 결정하는 계산과정이 평가대상 부동산의 종류 등에 국한되지 않고 범용적으로 활용될 수 있다. 또한, 평가대상 부동산 매물의 위험도를 통계적 클러스터링에 기반하여 결정함으로써 분석 결과에 대한 신뢰도가 높아질 수 있다. 적어도 하나의 실시예에 따르면, 효용성이 낮은 축을 포인트 맵 공간에서 제외함으로써 포인트 맵에 대한 클러스터링의 신뢰도를 높일 수 있다. 적어도 하나의 실시예에 따르면, 메타데이터 비교 결과를 포인트의 질량에 반영함으로써, 사용자가 원하는 평가대상 부동산 매물과 유사한 매물들의 참조 데이터가 반영되는 비중을 높일 수 있다. 적어도 하나의 실시예에 따르면, 사용자가 관심을 두는 평가대상 부동산 매물에 대한 위험도 변경을 쉽게 확인할 수 있다. 적어도 하나의 실시예에 따르면, 사용자가 거래를 원하는 부동산 매물의 위험도에 대한 정확한 정보를 용이하게 획득함으로써 부동산 거래 사고를 방지할 수 있다.

도 1은 예시적인 실시예에 따라 부동산 매물의 위험도를 분석하는 컴퓨팅 장치를 나타낸 블록도이다.
도 2는 예시적인 실시예에 따른 부동산 매물의 위험도 분석 방법을 나타낸 순서도이다.
도 3은 도 2의 S130 단계의 수행 과정을 나타내기 위한 개념도이다.
도 4는 도 2의 S140 단계의 수행 과정을 나타내기 위한 개념도이다.
도 5는 컴퓨팅 장치가 제1 포인트들 각각의 질량을 결정하는 과정을 나타낸 개념도이다.
도 6은 평가대상 포인트가 추가된 포인트 맵을 예시적으로 나타낸 개념도이다.
도 7은 컴퓨팅 장치가 클러스터링을 수행하는 과정을 예시적으로 나타낸 개념도이다.
도 8은 컴퓨팅 장치가 포인트 맵의 차원을 축소시키는 과정을 설명하기 위한 개념도이다.
도 9는 컴퓨팅 장치가 평가대상 부동산 매물의 정보 변동을 반영하는 과정을 나타낸 순서도이다.

실시 예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 실시될 수 있다. 따라서, 실시 예들은 특정한 개시형태로 한정되는 것이 아니며, 본 명세서의 범위는 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.

제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.

도 1은 예시적인 실시예에 따라 부동산 매물의 위험도를 분석하는 컴퓨팅 장치(100)를 나타낸 블록도이다.

도 1을 참조하면, 컴퓨팅 장치(100)는 통신부(110) 및 프로세서(120)를 포함할 수 있다. 통신부(110)는 네트워크를 통해 인터넷 망 또는 다른 장치와 통신을 수행할 수 있다. 프로세서(120)는 통신부(110)를 제어하며, 통신부(110)로부터 획득한 정보를 가공할 수 있다. 프로세서(120)는 타깃 제품의 추천 색을 결정하기 위해 필요한 연산을 수행할 수 있다.

컴퓨팅 장치(100)는 전형적인 컴퓨터 하드웨어(예컨대, 컴퓨터 프로세서, 메모리, 스토리지, 입력 장치 및 출력 장치, 기타 기존의 컴퓨팅 장치의 구성요소들을 포함할 수 있는 장치; 라우터, 스위치 등과 같은 전자 통신 장치; 네트워크 부착 스토리지(NAS; network-attached storage) 및 스토리지 영역 네트워크(SAN; storage area network)와 같은 전자 정보 스토리지 시스템)와 컴퓨터 소프트웨어(즉, 컴퓨팅 장치로 하여금 특정의 방식으로 기능하게 하는 명령어들)의 조합을 이용하여 원하는 시스템 성능을 달성하는 것일 수 있다.

또한, 상술한 네트워크는 상기 구성들을 연결하는 망(Network)으로서 유선 네트워크, 무선 네트워크 등을 포함한다. 네트워크는 LAN(Local Area Network), WAN(Wide Area Network)등의 폐쇄형 네트워크 또는 인터넷(Internet)과 같은 개방형 네트워크일 수 있다. 인터넷은 TCP/IP 프로토콜 및 그 상위계층에 존재하는 여러 서비스, 즉 HTTP(HyperText Transfer Protocol), Telnet, FTP(File Transfer Protocol), DNS(Domain Name System), SMTP(Simple Mail Transfer Protocol), SNMP(Simple Network Management Protocol), NFS(Network File Service), NIS(Network Information Service)를 제공하는 전 세계적인 개방형 컴퓨터 네트워크 구조를 의미한다.

도 2는 예시적인 실시예에 따른 부동산 매물의 위험도 분석 방법을 나타낸 순서도이다. 도 2에서 나타낸 방법은 도 1에서 나타낸 컴퓨팅 장치(100)에 의해 수행될 수 있다.

도 2를 참조하면, S110 단계에서 컴퓨팅 장치(100)는 제1 참조 데이터를 획득할 수 있다. 컴퓨팅 장치(100)는 다른 장치로부터 통신부(110)를 통해 제1 참조 데이터를 수신하거나 컴퓨팅 장치(100)와 연결된 메모리 장치를 통해 제1 참조 데이터를 획득할 수 있다.

제1 참조 데이터는 정상 매물로 분류된 복수의 부동산 매물에 대한 데이터를 포함할 수 있다.

정상 매물로 분류된 매물들은 현존 또는 과거에 존재했던 부동산 매물들 중 전문가가 정상 매물로 분류한 매물들을 포함할 수 있다. 다른 예로 정상 매물로 분류된 매물들은 담보 채무 불이행 이력이 없는 매물들을 포함할 수 있다.

제1 참조 데이터는 정상 매물로 분류된 매물들의 정보를 포함할 수 있다. 예를 들어, 제1 참조 데이터는 정상 매물로 분류된 매물들의 평가 파라미터 정보들을 포함할 수 있다. 예를 들어, 평가 파라미터들은 부동산 매매 가격, 평당 가격, 부동산 평수, 보증금, 월 임대료, 단위 기간당 거래 횟수, 선순위 담보 물권 개수, 선순위 담보권 채권액, 단위 기간동안 부동산 매매 가격 상승률, 단위 기간동안 보증금 상승률 등을 포함할 수 있으나 실시예가 이에 제한되는 것은 아니다. 매물들 각각의 평가 파라미터들은 후술하는 포인트 맵에서 해당 매물의 포인트 좌표를 결정하는데 활용될 수 있다.

제1 참조 데이터는 정상 매물로 분류된 매물들의 메타데이터를 포함할 수 있다. 예를 들어, 메타데이터는 건물의 위치, 건물의 용도, 냉/난방 방식, 승강기 정보, 전용 면적, 공유 면적 등을 포함할 수 있으나 실시예가 이에 제한되는 것은 아니다. 통상의 기술자는 부동산 거래 실정 등을 고려하여 상기 평가 파라미터들 및 메타데이터의 항목을 추가하거나 변경할 수 있다. 메타데이터는 후술하는 포인트 맵에서 해당 매물의 포인트가 가지는 질량 가중치를 결정하는데 활용될 수 있다.

S120 단계에서 컴퓨팅 장치(100)는 제2 참조 데이터를 획득할 수 있다. 제2 참조 데이터는 위험 매물로 분류된 복수의 부동산 매물에 대한 데이터를 포함할 수 있다.

위험 매물로 분류된 매물들은 현존 또는 과거에 존재했던 부동산 매물들 중 전문가가 위험 매물로 분류한 매물들을 포함할 수 있다. 다른 예로 정상 매물로 분류된 매물들은 담보 채무 불이행 이력이 있거나 강제집행 이력이 있는 매물들을 포함할 수 있다.

제2 참조 데이터는 위험 매물로 분류된 매물들의 정보를 포함할 수 있다. 위험 매물들 각각의 평가 파라미터들은 후술하는 포인트 맵에서 해당 매물의 포인트 좌표를 결정하는데 활용될 수 있다.

제2 참조 데이터는 정상 매물로 분류된 매물들의 메타데이터를 포함할 수 있다. 메타데이터는 후술하는 포인트 맵에서 해당 매물의 포인트가 가지는 질량 가중치를 결정하는데 활용될 수 있다.

S130 단계에서 컴퓨팅 장치(100)는 제1 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출할 수 있다. 컴퓨팅 장치(100)는 제1 참조 데이터의 부동산 매물들 각각의 평가 파라미터들에 기반하여 제1 포인트들의 좌표를 결정할 수 있다.

예를 들어, 평가 파라미터들의 개수가 n(n은 2 이상의 자연수)인 경우, 컴퓨팅 장치(100)는 n차원 공간 상에서 제1 포인트들 각각의 좌표를 결정할 수 있다. 제1 포인트들은 제1 참조 데이터를 구성하는 부동산 매물들에 대응할 수 있다.

도 3은 도 2의 S130 단계의 수행 과정을 나타내기 위한 개념도이다.

도 3을 참조하면, 제1 참조 데이터는 정상 매물로 분류된 복수의 부동산 매물들(정상 매물 #1, 정상 매물 #2, ??.)의 평가 파라미터들(C1, C2, C3, ??. Cn)에 대한 정보를 포함할 수 있다.

컴퓨팅 장치(100)는 제1 참조 데이터로부터 제1 포인트들(P_1-1, P_1-2,P_1-3,P_1-4, ??.)의 좌표들을 결정할 수 있다. 제1 포인트들은 정상 매물로 분류된 복수의 부동산 매물들(정상 매물 #1, 정상 매물 #2, ??.)을 n차원 공간에 나타낸 포인트들일 수 있다. 제1 포인트들의 좌표는 정상 매물로 분류된 부동산 매물들의 평가 파라미터들(C1, C2, C3, ??. Cn)에 의해 결정될 수 있다.

예를 들어, 평가 파라미터들(C1, C2, C3 ??.Cn)은 부동산 매물의 위험도와 관련성이 높은 파라미터들로서 부동산 매매 가격, 평당 가격, 부동산 평수, 보증금, 월 임대료, 단위 기간당 거래 횟수, 선순위 담보 물권 개수, 선순위 담보권 채권액, 단위 기간동안 부동산 매매 가격 상승률, 단위 기간동안 보증금 상승률 등을 포함할 수 있으나 실시예가 이에 제한되는 것은 아니며 통상의 기술자가 용이하게 변경할 수 있는 범위 내에서 변경될 수 있다.

평가 파라미터들(C1, C2, C3 ??.Cn) 각각은 제1 포인트들 각각의 좌표 값과 연결될 수 있다. 예시적으로, 정상 매물 #1의 평가 파라미터 C1은 제1-1 포인트(P_1-1)의 x₁ 좌표와 연관되고 정상 매물 #1의 평가 파라미터 C2는 제1-2 포인트(P_1-2)의 x2 좌표와 연관될 수 있다. 상술한 바와 같이 컴퓨팅 장치(100)는 정상 매물로 분류된 부동산 매물들 각각을 평가 파라미터들에 기초하여 n차원 공간 상에 포인트들로 표현할 수 있다. 이를 통해 컴퓨팅 장치(100)는 규격화되지 않은 부동산 데이터를 n차원 공간 상에 규격화하여 표현함으로써 후술하는 클러스터링 과정을 용이하게 수행할 수 있다.

다시 도 2를 참조하면, S140 단계에서 컴퓨팅 장치(100)는 제2 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출할 수 있다. 컴퓨팅 장치(100)는 제2 참조 데이터의 부동산 매물들 각각의 평가 파라미터들에 기반하여 제2 포인트들의 좌표를 결정할 수 있다.

예를 들어, 평가 파라미터들의 개수가 n(n은 2 이상의 자연수)인 경우, 컴퓨팅 장치(100)는 n차원 공간 상에서 제2 포인트들 각각의 좌표를 결정할 수 있다. 제2 포인트들은 제2 참조 데이터를 구성하는 부동산 매물들(e.g. 위험 매물들)에 대응할 수 있다.

도 4는 도 2의 S140 단계의 수행 과정을 나타내기 위한 개념도이다.

도 4를 참조하면, 제2 참조 데이터는 위험 매물로 분류된 복수의 부동산 매물들(위험 매물 #1, 위험 매물 #2, ??.)의 평가 파라미터들(C1, C2, C3, ??. Cn)에 대한 정보를 포함할 수 있다.

컴퓨팅 장치(100)는 제2 참조 데이터로부터 제2 포인트들(P_2-1, P_2-2,P_2-3,P_2-4, ??.)의 좌표들을 결정할 수 있다. 제2 포인트들은 위험 매물로 분류된 복수의 부동산 매물들(위험 매물 #1, 위험 매물 #2, ??.)을 n차원 공간에 나타낸 포인트들일 수 있다. 제2 포인트들의 좌표는 위험 매물로 분류된 부동산 매물들의 평가 파라미터들(C1, C2, C3, ??. Cn)에 의해 결정될 수 있다.

평가 파라미터들(C1, C2, C3 ??.Cn) 각각은 제2 포인트들 각각의 좌표 값과 연결될 수 있다. 예시적으로, 위험 매물 #1의 평가 파라미터 C1은 제2-1 포인트(P_2-1)의 x₁ 좌표와 연관되고 위험 매물 #1의 평가 파라미터 C2는 제2-2 포인트(P_2-2)의 x2 좌표와 연관될 수 있다. 상술한 바와 같이 컴퓨팅 장치(100)는 위험 매물로 분류된 부동산 매물들 각각을 평가 파라미터들에 기초하여 n차원 공간 상에 포인트들로 표현할 수 있다.

다시 도 2를 참조하면, S150 단계에서 컴퓨팅 장치(100)는 포인트 맵을 생성할 수 있다. 컴퓨팅 장치(100)는 제1 포인트들의 좌표들에 기반하여 제1 포인트들을 포인트 맵에 나타내고 제2 포인트들의 좌표들에 기반하여 제2 포인트들을 포인트 맵에 나타낼 수 있다. 후술하는 클러스터링 단계에서 컴퓨팅 장치(100)는 포인트 맵에 있는 제1 포인트들과 제2 포인트들을 구분하지 않고 클러스터링을 수행할 수 있다. 하지만, 컴퓨팅 장치(100)는 평가대상 포인트가 속한 클러스터에서 제1 포인트들과 제2 포인트들의 분포를 확인하기 위해 제1 포인트들과 제2 포인트들에게 서로 다른 태그를 부여할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 포인트 맵의 제1 포인트들에게 제1 태그를 부여하고, 제2 포인트들에게 제2 태그를 부여할 수 있다. 이를 통해 정상 매물들의 데이터로부터 도출된 제1 포인트들과 위험 매물들의 데이터로부터 도출된 제2 포인트들이 서로 구분될 수 있다.

예시적으로, 컴퓨팅 장치(100)는 포인트 맵을 생성하는 과정에서 제1 포인트들 및 제2 포인트들 각각에게 동일한 질량을 부여할 수 있다. 여기서, 포인트들의 질량은 포인트들의 가중치에 비례하는 값일 수 있다. 포인트들의 질량이 높을수록 후술하는 클러스터링 및 평가대상 부동산의 위험도를 결정하는 과정에서 포인트들 각각이 고려되는 비중이 높아질 수 있다.

다른 예로 컴퓨팅 장치(100)는 포인트 맵을 생성하는 과정에서 제1 포인트들 및 제2 포인트들 각각에게 서로 다른 질량을 부여할 수 있다. 컴퓨팅 장치(100)는 평가대상 부동산 매물과 포인트들 각각에 대응하는 부동산 매물의 유사도에 기반하여 포인트들 각각의 질량을 결정할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 평가대상 부동산 매물과 유사도가 높은 부동산 매물에 대응하는 포인트의 질량을 크게 결정하고, 평가대상 부동산 매물과 유사도가 낮은 부동산 매물에 대응하는 포인트의 질량을 작게 결정할 수 있다.

이를 위해 컴퓨팅 장치(100)는 평가대상 부동산 매물의 메타데이터와 포인트들에 대응하는 부동산 매물들 각각의 메타데이터를 비교할 수 있다.

도 5는 컴퓨팅 장치(100)가 제1 포인트들 각각의 질량을 결정하는 과정을 나타낸 개념도이다.

도 5를 참조하면, 컴퓨팅 장치(100)는 제1 참조 데이터에서 제1 포인트들에 대응하는 부동산 매물들(정상 매물 #1, 정상 매물 #2, ??.) 각각의 메타데이터를 평가대상 부동산 매물의 메타데이터와 비교할 수 있다.

메타데이터는 부동산 매물들 사이의 유사도를 판단하기 위한 데이터로서 건물의 위치, 건물의 용도, 냉/난방 방식, 승강기 정보, 전용 면적, 공유 면적 등에 대한 정보를 포함할 수 있다. 하지만, 실시예가 이에 제한되는 것은 아니며 통상의 기술자는 거래 실정과 통계적 정확성에 따라 메타데이터 항목을 추가 또는 변경할 수 있다.

컴퓨팅 장치(100) 평가대상 부동산 매물의 메타데이터와 정상 매물들 각각의 메타데이터를 비교할 수 있다. 비교 결과 서로 일치하는 메타데이터 항목이 많을수록 컴퓨팅 장치(100)는 해당 정상 매물에 대응하는 제1 포인트의 질량을 크게 결정할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 정상 매물#1의 메타데이터와 평가대상 부동산 매물의 메타데이터를 비교한 결과에 기초하여 정상 매물#1에 대응하는 포인트 P_1-1의 질량 m1_1을 결정할 수 있다. 마찬가지로 컴퓨팅 장치(100)는 정상 매물#2의 메타데이터와 평가대상 부동산 매물의 메타데이터를 비교한 결과에 기초하여 정상 매물#2에 대응하는 포인트 P_1-2의 질량 m1_2를 결정할 수 있다.

상술한 바와 같이 컴퓨팅 장치(100)가 메타데이터 비교 결과를 포인트의 질량에 반영함으로써, 사용자가 원하는 평가대상 부동산 매물과 유사한 매물들의 참조 데이터가 반영되는 비중을 높일 수 있다. 이를 통해 평가대상 부동산 매물의 분석 결과가 사용자의 선호도를 반영하여 보다 더 정확해질 수 있다.

도 5에서는 제1 참조 데이터에 포함된 정상 매물들의 메타데이터로부터 제1 포인트들의 질량을 결정하는 과정을 나타냈다. 유사한 방식으로 컴퓨팅 장치(100)는 제2 참조 데이터에 포함된 위험 매물들의 메타데이터로부터 제2 포인트들의 질량을 결정할 수 있다.

다시 도 2를 참조하면, S160 단계에서 컴퓨팅 장치(100)는 평가대상 부동산 매물의 평가 파라미터들을 추출할 수 있다. 제1 포인트들 및 제2 포인트들의 좌표를 결정할 때와 마찬가지로 컴퓨팅 장치(100)는 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정할 수 있다. 컴퓨팅 장치(100)는 평가대상 포인트를 S150 단계에서 생성된 포인트 맵에 추가할 수 있다.

도 6은 평가대상 포인트가 추가된 포인트 맵을 예시적으로 나타낸 개념도이다.

도 6에서는 도식화의 편의를 위해 포인트 맵을 2차원 공간 상에서 나타냈다. 하지만, 실시예가 이에 제한되는 것은 아니다. 포인트 맵은 부동산 평가 파라미터들의 개수 n에 대응하는 n차원 공간 상에 형성될 수 있다. n차원 공간 상에서 각각의 좌표축은 평가 파라미터에 대응할 수 있다.

도 6을 참조하면, 컴퓨팅 장치(100)는 정상 매물들에 대응하는 제1 포인트들 및 위험 매물들에 대응하는 제2 포인트들의 좌표 정보를 이용하여 포인트 맵을 생성할 수 있다. 컴퓨팅 장치(100)는 사용자가 평가하고자 하는 평가대상 부동산 매물의 평가 파라미터들을 획득하고 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정할 수 있다. 컴퓨팅 장치(100)는 평가대상 포인트를 포인트 맵에 추가할 수 있다. 또한, 제1 포인트들에는 제1 태그가 부여되고 제2 포인트들에는 제2 태그가 부여되며 평가대상 포인트에는 제3 태그가 부여될 수 있다. 따라서, 컴퓨팅 장치(100)는 각각의 포인트가 제1 포인트 집단에 속하는지, 제2 포인트 집단에 속하는지 혹은 평가대상 포인트 인지를 확인할 수 있다.

S170 단계에서 컴퓨팅 장치(100)는 평가대상 포인트가 추가된 포인트 맵에 대해서 클러스터링(clustering)을 수행할 수 있다. 예시적으로, 컴퓨팅 장치(100)는 k-평균 클러스터링(k-means clustering) 기법을 이용하여 클러스터링을 수행할 수 있다. 클러스터링 단계에서 포인트 맵에 포함된 포인트들 각각에 부여된 태그는 고려되지 않을 수 있다. 따라서, 컴퓨팅 장치(100)는 클러스터링 단계에서는 제1 포인트, 제2 포인트 및 평가대상 포인트를 구분하지 않고 클러스터링을 수행할 수 있다. 단, 컴퓨팅 장치(100)는 제1 포인트들, 제2 포인트들 각각의 질량은 클러스터링 단계에서 반영할 수 있다. 이를 통해 컴퓨팅 장치(100)는 클러스터링 과정에서는 포인트들 각각이 위험 매물에 해당하는지 정상 매물에 해당하는지 여부 등을 고려하지 않고 통계적 유사성 만을 고려하여 클러스터들을 구분할 수 있다. 따라서, 컴퓨팅 장치(100)가 수행하는 클러스터링 결과의 신뢰도가 높아질 수 있다.

도 7은 컴퓨팅 장치(100)가 클러스터링을 수행하는 과정을 예시적으로 나타낸 개념도이다.

도 7의 (A)를 참조하면, 컴퓨팅 장치(100)는 포인트 맵에서 임의로 클러스터들을 분할할 수 있다. 도 7에서는 컴퓨팅 장치(100)가 3개의 클러스터를 구성한 경우를 나타냈지만 실시예가 이에 제한되는 것은 아니다. 컴퓨팅 장치(100)가 구성하는 클러스터의 개수는 포인트 맵에 포함된 포인트들의 개수 및 분포에 따라 다르게 설정될 수도 있다.

컴퓨팅 장치(100)는 초기에 설정된 클러스터들(CL1, CL2, CL3) 각각의 질량중심을 계산할 수 있다. 이 과정에서 제1 포인트들 및 제2 포인트들 각각에 부여된 질량이 고려될 수 있다. 컴퓨팅 장치(100)는 포인트들 각각이 가장 가까운 질량중심을 가지는 클러스터에 속하도록 클러스터들(CL1, CL2, CL3)을 재설정할 수 있다. 컴퓨팅 장치(100)는 재설정된 클러스터들(CL1, CL2, CL3)의 질량중심을 다시 계산하고, 재계산된 질량중심에 기초하여 클러스터들(CL1, CL2, CL3)을 재조정할 수 있다. 컴퓨팅 장치(100)는 클러스터들(CL1, CL2, CL3)이 변하지 않을 때까지 재조정 과정을 반복할 수 있다. 그 결과, 컴퓨팅 장치(100)는 도 7의 (B)와 같은 클러스터링 결과를 도출할 수 있다. 컴퓨팅 장치(100)는 n차원 공간 상에서 통계적으로 유사성을 가지는 포인트들이 클러스터들을 구성하도록 할 수 있다. 컴퓨팅 장치(100)는 부동산 평가에 이용되는 다양한 변수들을 클러스터링 과정에서 한꺼번에 고려함으로써 부동산 매물의 위험도 분석 과정을 단순화할 수 있다.

이상에서는 컴퓨팅 장치(100)가 k-평균 클러스터링 기법을 이용하는 것을 예시적으로 설명하였다. 하지만, 실시예가 이에 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치(100)는 k-중간점(k-medoid), 평균 이동 클러스터링(mean-shift clustering), 응집적 계층적 클러스터링(Agglomerative Hierarchical Clustering) 등의 다른 클러스터링 기법을 이용할 수도 있다. 클러스터링 기법은 통상의 기술자가 용이하게 예상할 수 있는 범위 안에서 다양하게 변형될 수 있다.

다시 도 2를 참조하면, S180 단계에서 컴퓨팅 장치(100)는 평가대상 부동산 매물의 위험도를 결정할 수 있다. 컴퓨팅 장치(100)는 평가대상 포인트가 포함된 타깃 클러스터를 구성하는 포인트들의 정보를 추출할 수 있다. 컴퓨팅 장치(100)는 추출된 타깃 클러스터에 대한 정보에 기초하여 평가대상 부동산 매물의 위험도를 결정할 수 있다.

컴퓨팅 장치(100)는 도 7의 (B)에서 평가대상 부동산 매물이 속한 제3 클러스터(CL3)를 타깃 클러스터로 결정할 수 있다. 컴퓨팅 장치(100)는 타깃 클러스터인 제3 클러스터(CL3)에 속하는 포인트들의 정보를 추출할 수 있다. 이 과정에서 컴퓨팅 장치(100)는 제3 클러스터(CL3)에 속한 포인트들의 태그와 질량을 확인할 수 있다.

예시적으로, 컴퓨팅 장치(100)는 타깃 클러스터에 속한 제1 포인트들의 질량 합과, 타깃 클러스터에 속한 제2 포인트들의 질량 합을 비교할 수 있다. 컴퓨팅 장치(100)는 타깃 클러스터에 속한 제1 포인트들의 질량 합과 제2 포인트들의 질량 합의 차이를 계산할 수 있다. 컴퓨팅 장치(100)는 제1 포인트들의 질량 합이 제2 포인트들의 질량 합에 비해 클수록 평가대상 부동산 매물의 위험도를 낮게 결정할 수 있다. 컴퓨팅 장치(100)는 제2 포인트들의 질량 합이 제1 포인트들의 질량 합에 비해 클수록 평가대상 부동산 매물의 위험도를 높게 결정할 수 있다.

다른 예로, 컴퓨팅 장치(100)는 타깃 클러스터에 속한 제1 포인트들의 질량중심과 평가대상 포인트 사이의 제1 거리를 계산할 수 있다. 컴퓨팅 장치(100)는 타깃 클러스터에 속한 제2 포인트들의 질량중심과 평가대상 포인트 사이의 제2 거리를 계산할 수 있다. 컴퓨팅 장치(100)는 상기 제1 거리가 상기 제2 거리에 비해 클수록 평가대상 부동산 매물의 위험도를 낮게 결정할 수 있다. 컴퓨팅 장치(100)는 상기 제2 거리가 상기 제1 거리에 비해 클수록 평가대상 부동산 매물의 위험도를 높게 결정할 수 있다.

컴퓨팅 장치(100)는 통계적 유사성에 의해 타깃 클러스터로 분류된 클러스터 안에 포함된 제1 포인트들 및 제2 포인트들의 정보에 기초하여 평가대상 부동산 매물의 위험도를 결정할 수 있다. 이를 통해 평가대상 부동산 매물의 위험도를 결정하는 계산과정이 간단해질 수 있다. 또한, 평가대상 부동산 매물의 위험도를 결정하는 계산과정이 평가대상 부동산의 종류 등에 국한되지 않고 범용적으로 활용될 수 있다. 또한, 평가대상 부동산 매물의 위험도를 통계적 클러스터링에 기반하여 결정함으로써 분석 결과에 대한 신뢰도가 높아질 수 있다.

상술한 실시예에서는 컴퓨팅 장치(100)가 n차원 공간 상의 포인트 맵을 이용하는 경우를 설명하였다. 하지만, 실시예가 이에 제한되는 것은 아니다. 필요에 의해 컴퓨팅 장치(100)는 n차원 공간 상의 포인트 맵을 m차원(m은 n보다 작은 자연수) 공간으로 축소하여 클러스터링을 수행할 수 있다.

경우에 따라 부동산의 매물 위험도와 관련하여 정상 매물 집단과 위험 매물 집단의 평가 결과에 유의미한 경향성이 없는 평가 파라미터가 존재할 수 있다. 이러한 평가 파라미터가 개입될 경우, n차원 공간 상에서 클러스터링 결과의 신뢰도를 저하시킬 수 있다.

따라서, 컴퓨팅 장치(100)는 클러스터링 결과의 신뢰도를 저하시킬 수 있는 평가 파라미터를 결정하고, 해당 평가 파라미터에 대응하는 축을 제거함으로써 포인트 맵의 차원을 축소시킬 수 있다.

컴퓨팅 장치(100)는 포인트 맵의 포인트들을 n차원 공간을 구성하는 좌표축들 각각에 투영(projection)할 수 있다. n차원 공간의 경우, 컴퓨팅 장치(100)는 n개의 좌표축 각각에 포인트들을 투영할 수 있다. 컴퓨팅 장치(100)는 n개의 좌표축 각각에 투영된 포인트들의 분포에 기초하여 효용성이 낮은 좌표축을 결정할 수 있다.

도 8은 컴퓨팅 장치(100)가 포인트 맵의 차원을 축소시키는 과정을 설명하기 위한 개념도이다. 도 8에서는 편의상 두 개의 좌표축에 대해 포인트들이 투영된 결과를 나타냈다. 하지만, 이는 설명의 편의를 위한 것이며 컴퓨팅 장치(100)는 n개의 축 각각에 대해 포인트들을 투영할 수 있다.

도 8의 (a)를 참조하면, 제1 축에서 제1 포인트들과 제2 포인트들이 투영될 수 있다. 제1 축(예를 들어, 전용면적 파라미터와 관련된 축)에 투영결과로부터 컴퓨팅 장치(100)는 제1 축에서 제1 포인트들의 질량중심(CM_1)과 제1 축에서 제2 포인트들의 질량중심(CM_2)을 계산할 수 있다. 마찬가지로 도 8의 (b)를 참조하면, 제2 축(예를 들어, 선순위 담보권 개수와 관련된 축)에 투영결과로부터 컴퓨팅 장치(100)는 제2 축에서 제1 포인트들의 질량중심(CM1_2)과 제2 포인트들의 질량중심(CM_2)을 계산할 수 있다.

예를 들어, 컴퓨팅 장치(100)는 제2 축에서 제1 포인트들의 질량중심(CM1_2)과 제2 포인트들의 질량중심(CM2_2) 사이의 거리가 기준 값 보다 크기 때문에 제2 축의 효용성이 낮다고 판단할 수 있다. 따라서, 컴퓨팅 장치(100)는 제2 축을 포인트 맵 공간에서 제외시킬 수 있다. 컴퓨팅 장치(100)는 제1 축에서는 제1 포인트들의 질량중심(CM1_1)과 제2 포인트들의 질량중심(CM2_1) 사이의 거리가 기준 값보다 작기 때문에 제1 축의 효용성은 높다고 판단하여 제1 축은 포인트 맵에서 유지시킬 수 있다.

다른 예로 컴퓨팅 장치(100)는 제2 축에서 제1 포인트들의 질량중심(CM1_2)과 제1 포인트들 사이의 거리의 제곱합과, 제2 축에서 제2 포인트들의 질량중심(CM2_2)과 제2 포인트들 사이의 거리의 제곱합을 계산할 수 있다. 컴퓨팅 장치(100)는 거리 제곱합이 기준 값보다 크기 때문에 제2 축은 효용성이 낮다고 판단할 수 있다. 따라서, 컴퓨팅 장치(100)는 제2 축을 포인트 맵 공간에서 제외시킬 수 있다.

컴퓨팅 장치(100)는 제1 축에서는 제1 포인트들의 질량중심(CM1_1)과 제1 포인트들 사이의 거리의 제곱합과, 제1 축에서 제2 포인트들의 질량중심(CM2_1)과 제2 포인트들 사이의 거리의 제곱합이 기준 값보다 크기 때문에 제2 축의 효용성은 높다고 판단할 수 있다. 따라서, 컴퓨팅 장치(100)는 제2 축은 포인트 맵에서 유지시킬 수 있다.

상술한 바와 같이 컴퓨팅 장치(100)가 투영 결과에 기반하여 효용성이 낮은 축을 제외함으로써 포인트 맵에 대한 클러스터링의 신뢰도를 높일 수 있다.

도 9는 컴퓨팅 장치(100)가 평가대상 부동산 매물의 정보 변동을 반영하는 과정을 나타낸 순서도이다.

도 9를 참조하면, S192 단계에서 컴퓨팅 장치(100)는 평가대상 부동산 매물의 정보 변동 이력을 감지할 수 있다. 컴퓨팅 장치(100)는 평가대상 부동산 매물의 정보를 지속적으로 트래킹할 수 있다. 컴퓨팅 장치(100)는 주기적으로 평가대상 부동산 매물의 등기부등본, 토지대장, 건축물 관리 대장과 같은 문서를 전자파일 형태의 데이터로 수집할 수 있다. 컴퓨팅 장치(100)는 수집한 평가대상 부동산 매물에 대한 문서를 이전 문서와 비교할 수 있다. 컴퓨팅 장치(100)는 비교 결과에 기초하여 평가대상 부동산 매물의 평가 파라미터가 변동되었는지 여부를 판단할 수 있다.

평가대상 부동산 매물의 평가 파라미터가 변경된 경우, S194 단계에서 컴퓨팅 장치(100)는 변동된 평가 파라미터들을 반영하여 평가대상 포인트의 좌표를 갱신할 수 있다.

S196 단계에서 컴퓨팅 장치(100)는 변동된 평가대상 포인트의 좌표에 기초하여 도 2의 S160 단계 내지 S180 단계를 수행함으로써 평가대상 부동산 매물의 위험도를 재산출 할 수 있다. 만약, 위험도 정보가 변경된 경우, 컴퓨팅 장치(100)는 변동 사항에 대한 알람을 사용자 단말에게 제공할 수 있다. 이를 통해 사용자가 관심을 두는 평가대상 부동산 매물에 대한 위험도 변경을 쉽게 확인할 수 있다.

이상 도 1 내지 도 9를 참조하여 예시적인 실시예들에 따른 부동산 매물의 위험도 분석 방법 및 장치에 관하여 설명하였다. 적어도 하나의 실시예에 따르면, 부동산 평가에 이용되는 다양한 변수들을 클러스터링 과정에서 한꺼번에 고려함으로써 부동산 매물의 위험도 분석 과정을 단순화할 수 있다. 적어도 하나의 실시예에 따르면, 평가대상 부동산 매물의 위험도를 결정하는 계산과정이 평가대상 부동산의 종류 등에 국한되지 않고 범용적으로 활용될 수 있다. 또한, 평가대상 부동산 매물의 위험도를 통계적 클러스터링에 기반하여 결정함으로써 분석 결과에 대한 신뢰도가 높아질 수 있다. 적어도 하나의 실시예에 따르면, 효용성이 낮은 축을 포인트 맵 공간에서 제외함으로써 포인트 맵에 대한 클러스터링의 신뢰도를 높일 수 있다. 적어도 하나의 실시예에 따르면, 메타데이터 비교 결과를 포인트의 질량에 반영함으로써, 사용자가 원하는 평가대상 부동산 매물과 유사한 매물들의 참조 데이터가 반영되는 비중을 높일 수 있다. 적어도 하나의 실시예에 따르면, 사용자가 관심을 두는 평가대상 부동산 매물에 대한 위험도 변경을 쉽게 확인할 수 있다. 적어도 하나의 실시예에 따르면, 사용자가 거래를 원하는 부동산 매물의 위험도에 대한 정확한 정보를 용이하게 획득함으로써 부동산 거래 사고를 방지할 수 있다.

이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

Claims

데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 방법에 있어서,
정상 매물로 분류된 복수의 부동산 매물에 대한 제1 참조 데이터를 획득하는 단계;
위험 매물로 분류된 복수의 부동산 매물에 대한 제2 참조 데이터를 획득하는 단계;
상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출하고, 상기 평가 파라미터들의 값들에 기반하여 상기 제1 참조 데이터에 포함된 부동산 매물들에 대응하는 제1 포인트들의 좌표를 결정하는 단계;
상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출함으로써 상기 제2 참조 데이터에 포함된 부동산 매물들에 대응하는 제2 포인트들의 좌표를 결정하는 단계;
상기 제1 포인트들 및 상기 제2 포인트들의 좌표에 기반하여 n차원 공간 상에 포인트 맵을 생성하는 단계;
(n은 상기 평가 파라미터들의 개수에 대응하는 2 이상의 자연수)
평가대상 부동산 매물의 평가 파라미터들을 추출함으로써 상기 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정하고, 상기 포인트 맵에 상기 평가대상 포인트를 추가하는 단계;
상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계;
상기 평가대상 포인트가 포함된 타깃 클러스터를 구성하는 포인트들의 정보에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 단계를 포함하는 부동산 매물 위험도 분석 방법.
제 1 항에 있어서,
상기 평가 파라미터들은 부동산 매매 가격, 평당 가격, 부동산 평수, 보증금, 월 임대료, 단위 기간당 거래 횟수, 선순위 담보 물권 개수, 선순위 담보권 채권액, 단위 기간동안 부동산 매매 가격 상승률, 단위 기간동안 보증금 상승률 및 적어도 둘 이상의 파라미터들을 포함하는 부동산 매물 위험도 분석 방법.
제 1 항에 있어서,
상기 평가대상 부동산 매물의 메타데이터를 획득하는 단계; 및
상기 평가대상 부동산 매물의 메타데이터와 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제1 포인트들 각각의 질량 가중치를 결정하는 단계;
상기 평가대상 부동산 매물의 메타데이터와 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제2 포인트들 각각의 질량 가중치를 결정하는 단계를 더 포함하며,
상기 제1 포인트들 각각의 질량 가중치 및 상기 제2 포인트들 각각의 질량 가중치가 상기 포인트 맵에 반영되는 부동산 매물 위험도 분석 방법.
제 3 항에 있어서,
상기 부동산 매물의 메타데이터는 건물의 위치, 건물의 용도, 냉/난방 방식, 승강기 정보, 전용 면적, 공유 면적 중 적어도 둘 이상을 포함하는 부동산 매물 위험도 분석 방법.
제 1 항에 있어서,
상기 포인트 맵의 포인트들을 상기 n차원 공간의 좌표축들 각각에 투영(projection)하는 단계;
상기 좌표축들 각각에 대하여 투영된 포인트들의 분포에 기초하여 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계; 및
상기 효용성이 낮은 적어도 하나의 좌표축을 제외함으로써 상기 포인트 맵을 m차원 공간 상으로 투영하는 단계를 더 포함하며,
(m은 상기 n보다 작은 자연수)
상기 클러스터링은 상기 m차원 공간 상의 포인트 맵에 대해서 수행되는 부동산 매물 위험도 분석 방법.
제 5 항에 있어서,
상기 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계는,
상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 좌표축들 각각에 투영된 제2 포인트들의 제2 질량중심 사이의 거리에 기초하여 상기 좌표축들 각각의 효용성을 결정하는 부동산 매물 위험도 분석 방법.
제 5 항에 있어서,
상기 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계는,
상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 제1 포인트들 사이의 거리의 제곱의 합과,
상기 좌표축들 각각에 대해 투영된 제2 포인트들의 제2 질량중심과 상기 제2 포인트들 사이의 거리의 제곱의 합에 기초하여 상기 좌표축들 각각의 효용성을 결정하는 부동산 매물 위험도 분석 방법.
제 1 항에 있어서,
상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계는, k-평균 클러스터링(k-means clustering), k-중간점(k-medoid), 평균 이동 클러스터링(mean-shift clustering), 응집적 계층적 클러스터링(Agglomerative Hierarchical Clustering) 중 적어도 하나를 이용하여 수행되는 부동산 매물 위험도 분석 방법.
제 8 항에 있어서,
상기 평가대상 부동산 매물의 위험도를 결정하는 단계는,
상기 타깃 클러스터에 포함된 제1 포인트들의 질량 합과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량 합에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 부동산 매물 위험도 분석 방법.
제 8 항에 있어서,
상기 평가대상 부동산 매물의 위험도를 결정하는 단계는,
상기 타깃 클러스터에 포함된 제1 포인트들의 질량중심과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량중심에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 부동산 매물 위험도 분석 방법.
제 1 항에 있어서,
상기 평가대상 부동산 매물의 정보 변동 이력을 감지하는 단계;
상기 평가대상 부동산 매물의 정보 변동 이력에 기초하여 상기 평가대상 포인트의 좌표를 갱신하는 단계;
갱신된 평가대상 포인트의 좌표에 기초하여 상기 평가대상 부동산 매물의 위험도를 재산출하는 단계; 및
상기 평가대상 부동산 매물의 위험도가 변경된 경우, 사용자에게 알람을 제공하는 단계를 포함하는 부동산 매물 위험도 분석 방법.
데이터 클러스터링에 기반하여 부동산 매물의 위험도를 분석하는 컴퓨팅 장치에 있어서,
통신부; 및
통신부를 제어하는 프로세서를 포함하며,
상기 프로세서는
정상 매물로 분류된 복수의 부동산 매물에 대한 제1 참조 데이터를 획득하는 단계;
위험 매물로 분류된 복수의 부동산 매물에 대한 제2 참조 데이터를 획득하는 단계;
상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출하고, 상기 평가 파라미터들의 값들에 기반하여 상기 제1 참조 데이터에 포함된 부동산 매물들에 대응하는 제1 포인트들의 좌표를 결정하는 단계;
상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 평가 파라미터들을 추출함으로써 상기 제2 참조 데이터에 포함된 부동산 매물들에 대응하는 제2 포인트들의 좌표를 결정하는 단계;
상기 제1 포인트들 및 상기 제2 포인트들의 좌표에 기반하여 n차원 공간 상에 포인트 맵을 생성하는 단계;
(n은 상기 평가 파라미터들의 개수에 대응하는 2 이상의 자연수)
평가대상 부동산 매물의 평가 파라미터들을 추출함으로써 상기 평가대상 부동산 매물에 대응하는 평가대상 포인트의 좌표를 결정하고, 상기 포인트 맵에 상기 평가대상 포인트를 추가하는 단계;
상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계; 및
상기 평가대상 포인트가 포함된 타깃 클러스터를 구성하는 포인트들의 정보에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 단계를 수행하는 컴퓨팅 장치.
제 12 항에 있어서,
상기 평가 파라미터들은 부동산 매매 가격, 평당 가격, 부동산 평수, 보증금, 월 임대료, 단위 기간당 거래 횟수, 선순위 담보 물권 개수, 선순위 담보권 채권액, 단위 기간동안 부동산 매매 가격 상승률, 단위 기간동안 보증금 상승률 및 적어도 둘 이상의 파라미터들을 포함하는 컴퓨팅 장치.
제 12 항에 있어서,
상기 프로세서는,
상기 평가대상 부동산 매물의 메타데이터를 획득하는 단계; 및
상기 평가대상 부동산 매물의 메타데이터와 상기 제1 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제1 포인트들 각각의 질량 가중치를 결정하는 단계;
상기 평가대상 부동산 매물의 메타데이터와 상기 제2 참조 데이터에 포함된 부동산 매물들 각각의 메타데이터를 비교하여 상기 제2 포인트들 각각의 질량 가중치를 결정하는 단계를 더 수행하며,
상기 제1 포인트들 각각의 질량 가중치 및 상기 제2 포인트들 각각의 질량 가중치가 상기 포인트 맵에 반영되는 컴퓨팅 장치.
제 14 항에 있어서,
상기 부동산 매물의 메타데이터는 건물의 위치, 건물의 용도, 냉/난방 방식, 승강기 정보, 전용 면적, 공유 면적 중 적어도 둘 이상을 포함하는 컴퓨팅 장치.
제 12 항에 있어서,
상기 프로세서는
상기 포인트 맵의 포인트들을 상기 n차원 공간의 좌표축들 각각에 투영(projection)하는 단계;
상기 좌표축들 각각에 대하여 투영된 포인트들의 분포에 기초하여 효용성이 낮은 적어도 하나의 좌표축을 결정하는 단계; 및
상기 효용성이 낮은 적어도 하나의 좌표축을 제외함으로써 상기 포인트 맵을 m차원 공간 상으로 투영하는 단계를 더 수행하며,
(m은 상기 n보다 작은 자연수)
상기 클러스터링은 상기 m차원 공간 상의 포인트 맵에 대해서 수행되는 컴퓨팅 장치.
제 16 항에 있어서,
상기 프로세서는,
상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 좌표축들 각각에 투영된 제2 포인트들의 제2 질량중심 사이의 거리에 기초하여 상기 좌표축들 각각의 효용성을 결정하는 컴퓨팅 장치.
제 16 항에 있어서,
상기 프로세서는,
상기 좌표축들 각각에 대해 투영된 제1 포인트들의 제1 질량중심과 상기 제1 포인트들 사이의 거리의 제곱의 합과,
상기 좌표축들 각각에 대해 투영된 제2 포인트들의 제2 질량중심과 상기 제2 포인트들 사이의 거리의 제곱의 합에 기초하여 상기 좌표축들 각각의 효용성을 결정하는 컴퓨팅 장치.
제 12 항에 있어서,
상기 포인트 맵에 포함된 포인트들을 둘 이상의 클러스터들로 클러스터링 하는 단계는, k-평균 클러스터링(k-means clustering), k-중간점(k-medoid), 평균 이동 클러스터링(mean-shift clustering), 응집적 계층적 클러스터링(Agglomerative Hierarchical Clustering) 중 적어도 하나를 이용하여 수행되는 컴퓨팅 장치.
제 19 항에 있어서,
상기 프로세서는,
상기 타깃 클러스터에 포함된 제1 포인트들의 질량 합과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량 합에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 부동산 매물 위험도 분석 방법.
제 19 항에 있어서,
상기 프로세서는 상기 타깃 클러스터에 포함된 제1 포인트들의 질량중심과 상기 타깃 클러스터에 포함된 제2 포인트들의 질량중심에 기초하여 상기 평가대상 부동산 매물의 위험도를 결정하는 컴퓨팅 장치.
제 12 항에 있어서,
상기 프로세서는,
상기 평가대상 부동산 매물의 정보 변동 이력을 감지하는 단계;
상기 평가대상 부동산 매물의 정보 변동 이력에 기초하여 상기 평가대상 포인트의 좌표를 갱신하는 단계;
갱신된 평가대상 포인트의 좌표에 기초하여 상기 평가대상 부동산 매물의 위험도를 재산출하는 단계; 및
상기 평가대상 부동산 매물의 위험도가 변경된 경우, 사용자에게 알람을 제공하는 단계를 더 수행하는 컴퓨팅 장치.