KR20190041439A - System of building big data for estimating house price using space information having function of data error correction - Google Patents

System of building big data for estimating house price using space information having function of data error correction Download PDF

Info

Publication number
KR20190041439A
KR20190041439A KR1020190030989A KR20190030989A KR20190041439A KR 20190041439 A KR20190041439 A KR 20190041439A KR 1020190030989 A KR1020190030989 A KR 1020190030989A KR 20190030989 A KR20190030989 A KR 20190030989A KR 20190041439 A KR20190041439 A KR 20190041439A
Authority
KR
South Korea
Prior art keywords
information
data
housing
price
real estate
Prior art date
Application number
KR1020190030989A
Other languages
Korean (ko)
Inventor
맹준영
장명수
최우현
이유형
Original Assignee
주식회사 공감랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 공감랩 filed Critical 주식회사 공감랩
Priority to KR1020190030989A priority Critical patent/KR20190041439A/en
Publication of KR20190041439A publication Critical patent/KR20190041439A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration

Abstract

Disclosed are a system for building big data for estimating a house price based on spatial information and a method thereof. According to the present invention, the system comprises: a real estate data collection/correction module collecting data affecting formation of a house price from one or more databases and correcting a data error of the collected data based on a spatial feature value; a big data building module linking the data whose error is corrected in the real estate data collection/correction module in accordance with a real estate level to build big data; and a house price formation information extraction module extracting house price formation information affecting formation of a house price from the big data built in the big data building module. Accordingly, various physical, social, and local price formation factors are collected from various databases, and an error in the collected data is corrected to build big data, thereby providing effects of complexly considering various factors such as a region, a building, education, transportation and the like, and increasing correctness in estimation of a house price based on the big data.

Description

데이터 오류 수정 기능을 갖는 주택 가격 추정을 위한 빅데이터 구축 시스템{SYSTEM OF BUILDING BIG DATA FOR ESTIMATING HOUSE PRICE USING SPACE INFORMATION HAVING FUNCTION OF DATA ERROR CORRECTION}FIELD OF THE INVENTION [0001] The present invention relates to a system and method for estimating a house price with a data error correction function,

본 발명은 주택 관련 빅데이터 구축 시스템 및 방법에 관한 것으로서, 구체적으로는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to a system and method for building big data related to a house, and more particularly, to a system and method for building big data for estimating a house price using spatial information.

주택 가격을 추정하기 위한 다양한 알고리즘이 개시되어 있다.Various algorithms for estimating house prices are disclosed.

다양한 관점에서 주택 가격을 추정하고 있는데, 대부분은 수요와 공급에 따라 결정되는 경제적 이론을 배경으로 주택 소재 지역, 주택 개별 특성 등의 요인을 고려하고 있다. 이러한 요인을 가격 형성 요인이라고 하는데, 이러한 가격 형성 요인을 수집하여 적정하게 하나의 주택 가격대를 추정해 내는 것은 매우 복잡하고 어려운 작업이다.Housing prices are estimated from a variety of perspectives. Most of them take into consideration factors such as housing area, housing characteristics, etc., based on economic theory, which is determined by demand and supply. These factors are called pricing factors. It is a very complicated and difficult task to collect such price formation factors and to estimate one housing price properly.

그러나, 주택 가격 추정에 있어서는 단순하게 어느 하나의 가격 형성 요인만을 고려할 수는 없다. 주택 가격에는 물리적, 지역적, 사회적, 교육적 요인들이 복합적으로 작용하고 있다.However, in estimating the housing price, it is not possible to consider only one price formation factor. Housing prices are a combination of physical, regional, social and educational factors.

그러나, 이러한 가격 형성 요인들을 다양한 관점에서 고려하여 주택 가격을 추정할 수 있도록 하는 데이터베이스는 구축되어 있지 못한 실정이다. 그리고 다양한 데이터베이스들의 데이터는 상호 간에 오류가 있을 가능성이 있는데, 이러한 오류를 정제하여 활용하는 수단도 없는 실정이다.However, there is no database to estimate the price of housing considering various factors of price formation factors. In addition, there is a possibility that data of various databases may have mutual errors, and there is no means to refine and utilize these errors.

또한, 이러한 가격 형성 요인들은 여러 데이터베이스에 산재하여 있는데, 정확한 가격 형성 요인의 정보들을 수집하는 작업 역시 매우 중요하다.In addition, these pricing factors are scattered among various databases, and it is also important to collect accurate pricing information.

토지 대장, 건물 대장, 대지권 등록부는 물론, 위치 좌표, 교통 정보 등의 다양한 정보들을 수집하여 활용할 필요가 있다.It is necessary to collect and utilize various information such as land register, building register, land register, as well as position coordinates and traffic information.

10-177391110-1773911 10-176483410-1764834

본 발명의 목적은 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템을 제공하는 데 있다.An object of the present invention is to provide a big data construction system for estimating a house price using spatial information.

본 발명의 다른 목적은 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법을 제공하는 데 있다.It is another object of the present invention to provide a method of constructing big data for estimating a house price using spatial information.

상술한 본 발명의 목적에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템은, 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 부동산 데이터 수집/정제 모듈; 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 빅데이터 구축 모듈; 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 주택 가격 형성 정보 추출 모듈을 포함하도록 구성될 수 있다.A big data construction system for housing price estimation using spatial information according to an object of the present invention collects data affecting the formation of a house price in at least one database, A real estate data collection / refinement module to refine data errors between each other; A big data building module for building big data by linking the data whose data error has been corrected in the real estate data collection / refinement module according to the level of the real estate; And a home price formation information extraction module for extracting home price formation information that affects the formation of a home price from the big data constructed in the big data construction module.

여기서, 상기 공간적 속성치는, 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다.Here, the spatial attribute value is at least one of space coordinates, lot number, street name address, administrative zone name, short name, administrative zone name and short name, administrative zone name and business name, . ≪ / RTI >

그리고 상기 부동산 데이터 수집/정제 모듈은, 부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성될 수 있다.The real estate data collection / refinement module is configured to collect big data by searching the real estate land register, the land registry register, the building register, the housing disclosure price database, the land use planning database, the school database, the latitude and longitude coordinate database, .

그리고 상기 부동산 데이터 수집/정제 모듈은, 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 주거 타입 분석부; 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 대지권 추출부; 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 주택 용도 분류부; 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 특수 주택 분류부; 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 정비 주택 분류부; 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 교육 학군 분류부; 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단지 분류부; 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 부동산 기사 수집 분류부 중 적어도 하나 이상을 포함하도록 구성될 수 있다.The real estate data collection / refinement module may use the information on the number of floors, the total oil amount and the area listed on the building lot of the house to classify the housing type classification information composed of the single type, the double layer type, the mixed type, A housing type analyzer for generating and outputting area information; A land lot extraction unit for generating and outputting land lot right information using land related information of the land ledger and the land land register, the complex information of the house, the same information, and the call information; A housing usage classifying unit for generating housing usage classifying information using the title block information and the housing disclosure price information of the building ledger and outputting the classified information; A special housing classifying unit for generating and outputting special housing information classified as one of a general house, a luxury house or a special house using the housing disclosure price information and the housing type classification information and the actual housing area information outputted from the housing type analysis unit; A maintenance housing classifying unit for generating and outputting redevelopment housing information or reconstructed housing information and corresponding business stage information using land use planning information; The School District Classification Division generates and outputs the education district information classified into the general district and the premium Korea by using the surrounding school information centered on the district number of the house. A classification section for generating and outputting classification information classified into a general complex and a similar complex using the coordinates of the latitude and longitude of the house, the overall title of the building, the title of the building, and the published price of the house; And a real estate article collection classifier that automatically collects, classifies and outputs data related to real estate in a news article.

그리고 상기 부동산 레벨은, 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성될 수 있다.And the real estate level may be configured to include at least one of a local level, a merely level, a co-level, and a call level.

그리고 상기 빅데이터 구축 모듈은, 상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.And the big data construction module is configured to store the housing type classification information and the actual housing area information, the land use right information, the housing usage classification information, the special housing information, the redevelopment housing information or the reconstruction housing information, School district information, and classification information are classified into information applied in common to the corresponding area of the house, information applied to the complex, information applied to the corresponding parcel, information applied to the corresponding parcel, Data. ≪ / RTI >

상술한 본 발명의 다른 목적에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법은, 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 단계; 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 단계; 주택 가격 형성 정보 추출 모듈이 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 단계를 포함하도록 구성될 수 있다.According to another aspect of the present invention, there is provided a method of building big data for estimating a house price using spatial information, the method comprising: a real estate data collection / refinement module collecting data influencing housing price formation in at least one database, , Refining the collected data with respect to each other through a spatial attribute value; The big data building module establishing big data by linking the data error corrected data in the real estate data collection / refinement module according to the level of the real estate; And a step of extracting the home price formation information extracting module from the big data constructed in the big data building module, the home price formation information influencing the formation of the home price.

여기서, 상기 공간적 속성치는, 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다.Here, the spatial attribute value is at least one of space coordinates, lot number, street name address, administrative zone name, short name, administrative zone name and short name, administrative zone name and business name, . ≪ / RTI >

그리고 상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 단계는, 부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성될 수 있다.And the real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases, and the collected data is refinement of mutual data errors via spatial attribute values, , A land registry book, a building register, a housing disclosure price database, a land use plan database, a school database, a latitude and longitude coordinate database, and a news article database to collect big data.

그리고 상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 단계는, 주거 타입 분석부가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 단계; 대지권 추출부가 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 단계; 주택 용도 분류부가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 단계; 특수 주택 분류부가 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 단계; 정비 주택 분류부가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 단계; 교육 학군 분류부가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 단계; 단지 분류부가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단계; 부동산 기사 수집 분류부가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 단계 중 적어도 하나 이상을 포함하도록 구성될 수 있다.And the real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases, and refining data errors among the collected data through spatial attribute values, Generating and outputting housing type classification information and actual housing area information, which are composed of a single type, a multi-layer type, a mixed type, a mixed type, and a positive type using the information on the number of stories, A land use right extracting unit for generating and outputting land use right information by using the land related information of the land ledger and the land tenure register, the complex information of the house, the same information, and the call information; Generating housing usage classification information using the title division information and the housing disclosure price information of the housing use classification additional building ledger; A step of generating and outputting special housing information classified as one of a general house, a luxury house or a special house by using the information on the sale price of the special house classification unit and the housing type classification information and the actual housing area information output from the housing type analysis unit ; Generating and outputting redevelopment housing information or reconstructed housing information and corresponding business stage information using the land use planning information of the maintenance house classification section; Generating and outputting the education district information classified into the general district and the premium Korea using the surrounding school information centered on the district number of the education district classification division; Generating and outputting classification information classified into a general complex and a similar complex using the latitude and longitude coordinates of the classification unit, the overall title of the building, the title of the building, and the published price of the house; And the real estate article collection category may automatically include at least one of collecting, sorting and outputting data related to real estate in the news article.

그리고 상기 부동산 레벨은, 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성될 수 있다.And the real estate level may be configured to include at least one of a local level, a merely level, a co-level, and a call level.

그리고 상기 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계는, 상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.And the big data establishing module establishing the big data by linking the data error-refined data in the real estate data collecting / refining module according to the real estate level includes the housing type classification information, the real estate information, , Information on the classification of the housing for use, the special housing information, the redevelopment housing information or the reconstructed housing information and the corresponding business stage information, the education district information, and the classification information to the corresponding complex Information to be applied to the relevant parcels, information to be applied to the corresponding parcels, and information to be applied to the relevant call.

상술한 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법에 의하면, 다양한 물리적, 사회적, 지역적 가격 형성 요인 등을 다양한 데이터베이스에서 수집하여 상호 간의 오류를 정제하여 빅데이터를 구축하도록 구성됨으로써, 빅데이터를 활용하여 지역, 건물 자체, 교육, 교통 등의 다양한 요소들의 복합적으로 고려하고 주택 가격 추정의 정확도를 높일 수 있는 효과가 있다.According to the system and method for building big data for estimating the house price using the spatial information, various physical, social, and local pricing factors are collected from various databases, and errors are refined to construct big data, By using Big Data, it is possible to consider various factors such as area, building itself, education, traffic, etc., and to improve the accuracy of house price estimation.

도 1은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 모듈의 세부 구성도이다.
도 3은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법의 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 단계의 세부 흐름도이다.
FIG. 1 is a block diagram of a big data construction system for estimating a house price using spatial information according to an embodiment of the present invention. Referring to FIG.
2 is a detailed configuration diagram of a real estate data collection / refinement module according to an embodiment of the present invention.
3 is a flowchart of a method of constructing big data for estimating a house price using spatial information according to an embodiment of the present invention.
4 is a detailed flowchart of real estate data collection / refinement steps according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 발명을 실시하기 위한 구체적인 내용에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail to the concrete inventive concept. It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention. Like reference numerals are used for like elements in describing each drawing.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms first, second, A, B, etc. may be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. And / or < / RTI > includes any combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprises" or "having" and the like are used to specify that there is a feature, a number, a step, an operation, an element, a component or a combination thereof described in the specification, But do not preclude the presence or addition of one or more other features, integers, steps, operations, elements, components, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the contextual meaning of the related art and are to be interpreted as either ideal or overly formal in the sense of the present application Do not.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템의 블록 구성도이고, 도 2는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 모듈의 세부 구성도이다.FIG. 1 is a block diagram of a big data construction system for estimating a house price using spatial information according to an embodiment of the present invention. FIG. 2 is a block diagram of a detailed structure of a real estate data collection / refinement module according to an embodiment of the present invention .

도 1을 참조하면, 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템(100)은 부동산 데이터 수집/정제 모듈(110), 빅데이터 구축 모듈(120), 주택 가격 형성 정보 추출 모듈(130)을 포함하도록 구성될 수 있다.Referring to FIG. 1, a big data construction system 100 for housing price estimation using spatial information according to an embodiment of the present invention includes a real estate data collection / refinement module 110, a big data construction module 120, And a pricing formation information extraction module 130. [

이하, 세부적인 구성에 대하여 설명한다.Hereinafter, the detailed configuration will be described.

부동산 데이터 수집/정제 모듈(110)은 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 자동으로 수집하도록 구성될 수 있다. 스케줄러(scheduler)에 의해 주기적을 수집하도록 구성될 수 있다.The real estate data collection / refinement module 110 may be configured to automatically collect data that affects housing price formation in at least one or more databases. And may be configured to collect the periodic by a scheduler.

부동산 데이터 수집/정제 모듈(110)은 여러 데이터베이스에서 부동산 데이터를 수집하도록 구성될 수 있다.The real estate data collection / refinement module 110 may be configured to collect real estate data from multiple databases.

데이터베이스로서는 건물 대장(총괄 표제부), 건물 대장(표제부), 건물 대장(층), 건물 대장(전유부), 건물 대장(면적), 주택 공시 가격 데이터베이스, 토지 대장, 대지권 등록부, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 지하철 데이터베이스, 뉴스 기사 데이터베이스 등을 포함할 수 있다.The databases include the building title, the building title, the building ledger, the building ledger, the building ledger, the housing disclosure price database, the land register, the land register book, the land use planning database, A school database, a latitude and longitude coordinate database, a subway database, a news article database, and the like.

데이터베이스는 여러 곳에 산재하여 있을 수 있다. 국토부, 등기소, 교육부 등에서 각자 운용되는 데이터베이스가 될 수 있다.The database can be scattered in many places. It can be a database operated by the Ministry of Land, the Registry, and the Ministry of Education.

토지 이용 계획 데이터베이스 학교 데이터베이스, 지하철 데이터베이스 등은 현재의 정보는 물론 미래의 정보 즉, 토지 이용에 대한 미래 계획 정보, 학교 설립 예정 정보, 지하철 개통 예정 정보 등을 포함하도록 구성될 수 있으며, 이러한 미래의 정보도 가격 형성 요인으로서 고려될 수 있다.Land use planning database The school database and the subway database can be configured to include current information as well as future information such as future planning information about the land use, school building schedule information, and subway opening schedule information. Information can also be considered as a factor of price formation.

부동산 데이터 수집/정제 모듈(110)은 데이터베이스에 저장된 다양한 정보들 중에서 부동산에 관련된 데이터들을 텍스트 마이닝(text mining), 데이터 마이닝(data mininig) 등의 다양한 데이터 수집 기법을 이용하여 수집하도록 구성될 수 있다.The real estate data collection / refinement module 110 may be configured to collect real estate related data among various information stored in the database using various data collection techniques such as text mining and data mining .

부동산 데이터 수집/정제 모듈(110)은 이와 같이 다양한 데이터베이스에서 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 수집된 데이터의 데이터 오류를 정제하도록 구성될 수 있다. 동일한 내용에 대한 데이터라 하더라도 데이터베이스마다 서로 다른 데이터로 저장될 수 있으며, 이러한 오류에 대해 정제를 수행하도록 구성될 수 있다.The real estate data collection / refinement module 110 may be configured to refine the data collected in the various databases and to correct data errors of the collected data with each other via the spatial attribute values. Data for the same contents can be stored as different data for each database, and can be configured to perform refinement for such errors.

여기서, 공간적 속성치는 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보이며, 다양한 데이터베이스를 통해 수집된 데이터들이 동일한 내용에 관한 데이터인지는 공간적 속성치를 통해 확인할 수 있다.Here, the spatial attribute value is information that can specify the location of the real estate or can limit the range, and whether the data collected through the various databases are data related to the same contents can be confirmed through the spatial attribute value.

공간적 속성치는 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다. 여기서, 공간 좌표로서 경위도 좌표, UTM 좌표가 이용될 수 있다.The spatial attribute value may be configured to include at least one of space coordinates, lot number, street name address, administrative zone name, complex name, administrative zone name and complex name, administrative zone name, and business name. Here, latitude and longitude coordinates and UTM coordinates may be used as spatial coordinates.

부동산 데이터 수집/정제 모듈(110)은 다양하 루트를 통해 수집된 데이터를 공간적 속성치를 매개로 연관시켜 상호 간에 불일치나 모순이되는 데이터들이 있는지 확인하여 정제하도록 구성될 수 있다.The real estate data collection / refinement module 110 may be configured to correlate the data collected through the various routes with the spatial attribute values so as to check whether there is inconsistent or contradictory data among the mutual data.

예를 들어, 특정 건물의 호별 면적의 합은 층별 면적의 합을 넘을 수 없지만, 수집된 데이터에는 상호 간에 모순이나 오류가 있을 수 있다. 이러한 모순이나 오류를 소정의 알고리즘에 따라 자동으로 정제하도록 구성될 수 있다.For example, the sum of the area of each door in a particular building can not exceed the sum of the floor area, but the collected data may have contradictions or errors. And may be configured to automatically refine such inconsistencies or errors according to a predetermined algorithm.

먼저 여러 데이터베이스에서 수집된 데이터를 정확한 정보인지 부정확한 정보인지를 확인하여 분류하고, 정확성 정보로 확인되는 데이터는 그대로 빅데이터 구축에 활용하도록 구성될 ㅜㅅ 있다. 그러나, 정확성이 매우 떨어지거나 또는 정확성을 판단할 수 없는 경우에는 오류로 분류하도록 구성될 수 있다.First, the data collected from various databases is classified by confirming whether the information is correct or incorrect, and the data confirmed by the accuracy information is configured to be used for building big data as it is. However, if the accuracy is too low or the accuracy can not be determined, it can be configured to be classified as error.

그리고 나서, 오류로 분류된 데이터에 대해 오류 패턴을 분석하도록 구성될 수 있다. 오류 패턴이 과거의 오류 패턴에 해당하는 경우에는 과거의 오류 패턴 정정 자료를 활용하여 오류가 해결되는 오류 패턴인 경우에는 이러한 과거의 오류 패턴 정정 자료를 활용하여 오류를 해결하고 이를 빅데이터 구축에 활용할 수 있다.And then analyze the error pattern for the data classified as error. If the error pattern corresponds to the past error pattern, if it is an error pattern in which the error is solved by using the past error pattern correction data, the past error pattern correction data can be used to solve the error and utilized in building big data .

과거의 오류 패턴 정정 자료를 활용하여 정정할 수 없는 경우에는 새로운 오류 패턴으로 분류하여 저장하고 사용자에 의해 오류를 정정하도록 구성될 수 있다. 새로운 오류 패턴은 다시 과거의 오류 패턴 정정 자료로 활용되어 유사한 오류 패턴의 자동 정정에 활용될 수 있다.If it is not possible to correct using the error pattern correction data of the past, it may be classified and stored as a new error pattern and corrected by the user. The new error pattern can be used as a correction data of past error patterns and can be used for automatic correction of similar error patterns.

한편, 도 2를 참조하면, 부동산 데이터 수집/정제 모듈(110)은 주거 타입 분석부(111), 대지권 추출부(112), 주택 용도 분류부(113), 특수 주택 분류부(114), 정비 주택 분류부(115), 교육 학군 분류부(116), 단지 분류부(117), 주택 가격 추정부(118), 부동산 기사 수집 분류부(119)를 포함하도록 구성될 수 있다.2, the real estate data collection / refinement module 110 includes a housing type analysis unit 111, a land use right extraction unit 112, a housing usage classification unit 113, a special housing classification unit 114, A housing classifying section 115, a school education classifying section 116, a classifying section 117, a house price estimating section 118 and an estate article collection classifying section 119. [

주거 타입 분석부(111)는 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하도록 구성될 수 있다.The residential type analyzing unit 111 analyzes the information on the number of stories, the total oil level, and the area on the building ledger of the house to obtain housing type classification information and actual residence area information, which are composed of a single type, a double type, a mixed type, And output it.

대지권 추출부(112)는 토지 대장 및 대지권 등록부의 대지 관련 정보, 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하도록 구성될 수 있다.The land use right extracting unit 112 may be configured to generate and output land use right information using the land related information of the land ledger and the land use land register, housing information, the same information, and call information.

여기서, 단지 정보, 동 정보, 호 정보는 부동산 데이터 수집/정제 모듈(110)에 의해 수집된 정보가 될 수도 있다.Here, the information, the same information, and the call information may be information collected by the real estate data collection / refinement module 110.

단지 정보는 단지명, 대지 면적, 건축 면적, 세대수, 주차 대수, 단지 코드 등이 될 수 있다. 단지 코드는 단지 분류부(117)에 의해 분류된 일반 단지인지 유사 단지인지에 대한 정보가 될 수 있다.The information can be just a name, a site area, a building area, a household number, a parking number, a complex code, and the like. Only the code may be information about whether it is a general complex or categorical complex classified by the classifier 117.

동 정보는 동 명칭, 사용 승인, 엘리베이터 유무, 최고층수, 구조/지붕, EPI 점수에 대한 정보가 될 수 있다.The information may be information on the name, use authorization, elevator availability, maximum number of floors, structure / roof, and EPI score.

호 정보는 호 명칭, 전용 면적, 주거 면적, 비주거 면적, 공용 면적, 대지 지분, 용도, 특수주택 여부, 주택 유형에 대한 정보가 될 수 있다. 전용 면적, 주거 면적, 비주거 면적, 공용 면적, 주택 유형은 주거 타입 분석부(111)에 의해 생성되는 정보이며, 특수 주택 여부는 특수 주택 분류부(114)에 의해 생성되는 정보가 될 수 있다. The call information can be information about the name of the call, private area, residential area, non-residential area, public area, land ownership, use, special housing, and housing type. The private area, the residential area, the non-residential area, the common area, and the housing type are information generated by the residential type analyzing unit 111, and the special housing may be information generated by the special housing classifying unit 114.

주택 용도 분류부(113)는 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하도록 구성될 수 있다.The housing usage classifying unit 113 may be configured to generate housing usage classification information using the title block information and the housing disclosure price information of the building ledger and output it.

특수 주택 분류부(114)는 주택 공시가격 정보 및 주거 타입 분석부(111)에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하도록 구성될 수 있다.The special house classifying unit 114 classifies the special housing information classified into one of the general house, the luxury house or the special house by using the housing disclosure price information and the housing type classification information and the actual housing area information output from the housing type analysis unit 111 And output it.

정비 주택 분류부(115)는 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하도록 구성될 수 있다. 사업 단계에 따라서도 주택 가격이 단계별로 미치는 영향이 다를 수 있다.The maintenance house classification unit 115 may be configured to generate and output redevelopment housing information or reconstructed housing information and corresponding business stage information using the land use planning information. Depending on the stage of the project, the effect of the housing price on the stage may be different.

교육 학군 분류부(116)는 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하도록 구성될 수 있다.The education classifier classifier 116 may be configured to generate and output the education classroom information classified into the general school district and the premium Korean class using the surrounding school information centered on the lot number of the house.

단지 분류부(117)는 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하도록 구성될 수 있다. 단지 코드에 의해 일반 단지와 유사 단지가 확인될 수 있다.The classification section 117 may be configured to generate and output the classification information classified into the general complex and the similar complex by using the coordinates of the latitude and longitude of the house, the overall title of the building, the title of the building, and the published price of the house. Only ordinary complexes and similar complexes can be identified by code.

부동산 기사 수집 분류부(119)는 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하도록 구성될 수 있다. 예를 들어, 어느 지역의 단지가 재건축을 추진하고 있다든지 또는 어느 지역에 지하철이나 순환 도로가 개설된다든지, 특정 공공 기관이 특정 지역에 설립된다든지 또는 재건축 단지나 재개발 단지에 입주가 시작되는 것과 같은 다양한 부동산 관련 데이터가 수집될 수 있다.The real estate article collection classifying section 119 can be configured to automatically collect, classify and output data related to real estate in a news article. For example, if a jurisdiction is promoting reconstruction, or a metro or a ring road is established in a certain area, a specific public institution is established in a certain area, or a residential area is moved to a reconstruction or redevelopment complex Various real estate related data can be collected.

빅데이터 구축 모듈(120)은 부동산 데이터 수집/정제 모듈(110)에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하도록 구성될 수 있다. 여기서, 부동산 레벨은 지역 레벨, 단지 레벨, 동 레벨, 호 레벨 등의 레벨이나 단위 또는 위상을 의미한다.The big data construction module 120 can be configured to construct big data by linking the data error corrected data in the real estate data collection / refinement module 110 according to the level of the real estate. Here, the real estate level means a level, a unit, or a phase such as a local level, a merely level, a co-level, a call level, and the like.

빅데이터 구축 모듈(120)은 부동산 데이터 수집/정제 모듈(110)에서 수집되고 오류 정제된 데이터를 그 부동산 레벨에 따라 분류하도록 구성될 수 있다.The big data building module 120 can be configured to classify the error corrected data collected and collected by the real estate data collection / refinement module 110 according to the property level.

구체적으로는 빅데이터 구축 모듈(120)은 주택 유형 분류 정보 및 실주거면적 정보, 대지권 정보, 주택 용도 분류 정보, 특수 주택 정보, 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 교육 학군 정보, 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.Specifically, the big data establishing module 120 may include information on the type of housing, classification of real estate, land use right information, housing use classification information, special housing information, redevelopment housing information or reconstructed housing information, Classification information should be classified into information applied in common to the relevant area of the house, information applied to the complex, information applied to the parcel, information applied to the parcel, Lt; / RTI >

주택 가격 형성 정보 추출 모듈(130)은 빅데이터 구축 모듈(120)에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하도록 구성될 수 있다.The home price formation information extraction module 130 can be configured to extract the home price formation information that affects the formation of the home price from the big data constructed in the big data construction module 120. [

주택 가격 형성 정보 추출 모듈(130)은 빅데이터에서 지역 레벨, 단지 레벨, 동 레벨, 호 레벨의 데이터들을 수집하여 특정 주택의 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하여 주택 가격 추정 모듈(200)에 제공하도록 구성될 수 있다. 주택 가격 추정 모듈(200)은 주택 가격 형성 정보를 이용하여 해당 주택의 가격을 추정할 수 있다.The home price formation information extraction module 130 collects the local level, the merely level, the same level, and the call level data from the big data to extract the housing price formation information affecting the housing price formation of the specific house, (Not shown). The housing price estimation module 200 can estimate the price of the corresponding house using the housing price formation information.

주택 가격 추정 모듈(200)은 주택 가격을 추정하는 다양한 모형을 적용할 수 있다. 그 중에서 여러 가지 주택 가격 형성 정보에 가중치를 적용하여 주택 가격을 추정할 수 있다. 그리고 재건축, 재개발, 학교 설립, 지하철 개통 등의 예상 시점 등을 고려하여 주택 가격 추정가를 시기별로 추정하는 등의 다양한 방식이 적용될 수 있다.The home price estimation module 200 may apply various models for estimating the home price. The house price can be estimated by applying the weight to various housing price formation information. In addition, various methods can be applied such as estimating the housing price estimate based on the timing of reconstruction, redevelopment, school establishment, and opening of the subway.

또한, 지역별 인구 유출입과 지역별 유출입 인구의 연령대, 성별 등을 고려하거나 지역별로 주택 공급률을 산정하여 수요/공급에 따른 가격 형성 요인을 적용할 수도 있다.In addition, it is possible to consider factors such as age and gender of population flow by region and the number of inhabitants in each region, or to estimate the housing supply rate by region and apply price formation factors according to demand / supply.

도 3은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법의 흐름도이다.3 is a flowchart of a method of constructing big data for estimating a house price using spatial information according to an embodiment of the present invention.

도 3을 참조하면, 부동산 데이터 수집/정제 모듈(110)이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제한다(S110).Referring to FIG. 3, the real estate data collection / refinement module 110 collects data affecting housing price formation in at least one or more databases, and collects the collected data as a data error (S110).

여기서, 공간적 속성치는 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다. 여기서, 공간 좌표로서 경위도 좌표, UTM 좌표가 이용될 수 있다.Here, the spatial attribute value may include at least one of space coordinates, lot number, street name address, administrative zone name, short name, administrative zone name and short name, administrative zone name and business name, Lt; / RTI > Here, latitude and longitude coordinates and UTM coordinates may be used as spatial coordinates.

그리고 부동산 데이터 수집/정제 모듈(110)은 주택의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스 기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성될 수 있다.The real estate data collection / refinement module 110 then collects the big data by searching the housing lot, the land register, the building register, the housing disclosure price database, the land use planning database, the school database, the latitude and longitude coordinate database, Lt; / RTI >

다음으로, 빅데이터 구축 모듈(120)이 부동산 데이터 수집/정제 모듈(110)에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축한다(S120).Next, the big data establishing module 120 constructs big data by linking the refined data with the data error in the real estate data collection / refinement module 110 according to the level of the real estate (S120).

여기서, 부동산 레벨은 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성될 수 있다.Here, the real estate level may be configured to include at least one of a local level, a merely level, a co-level, and a call level.

다음으로, 주택 가격 형성 정보 추출 모듈(130)이 빅데이터 구축 모듈(120)에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출한다(S130).Next, the home price formation information extraction module 130 extracts home price formation information that affects the formation of the home price from the big data constructed in the big data construction module 120 (S130).

도 4는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 단계의 세부 흐름도이다.4 is a detailed flowchart of real estate data collection / refinement steps according to an embodiment of the present invention.

도 4를 참조하면, 주거 타입 분석부(111)가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력한다.4, the residential type analyzing unit 111 analyzes the information on the number of stories, the total oil level, and the area on the building main building of a house and classifies the type of the residential building, which is composed of a single type, a duplex type, a mixed type, Information and actual residential area information are generated and output.

그리고 대지권 추출부(112)가 토지 대장 및 대지권 등록부의 대지 관련 정보, 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력한다Then, the land use right extracting unit 112 generates land use right information by using the land related information of the land ledger and the land use right register, housing information, the same information, and call information, and outputs it

그리고 주택 용도 분류부(113)가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력한다.The housing usage classification unit 113 generates housing usage classification information using the title portion information and the housing disclosure price information of the building ledger and outputs the same.

그리고 특수 주택 분류부(114)가 주택 공시가격 정보 및 주거 타입 분석부(111)에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력한다. Then, the special housing classification unit 114 generates a special housing classified into a general house, a luxury house, or a special house using the housing disclosure price information and the housing type classification information and the actual housing area information output from the housing type analysis unit 111 And generates and outputs information.

그리고 정비 주택 분류부(115)가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력한다.The maintenance house classification unit 115 generates and outputs redevelopment housing information or reconstructed housing information and corresponding business step information using the land use plan information.

그리고 교육 학군 분류부(116)가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력한다.Then, the education district group classification unit 116 generates and outputs the education district information classified into the general district and the premium Korea using the surrounding school information centering on the lot number of the house.

그리고 단지 분류부(117)가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력한다.Then, the classification unit 117 generates and outputs complex classification information classified into the general complex and the similar complex using the longitudinal direction coordinates of the house, the comprehensive heading of the building ledger, the title of the building ledger, and the published price of the house.

그리고 부동산 기사 수집 분류부(118)가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력한다.Then, the real estate article collection and classification unit 118 automatically collects and classifies the data related to the real estate in the news article.

도 3의 빅데이터 구축 모듈(120)이 부동산 데이터 수집/정제 모듈(110)에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계(S110)는, 주거 타입 분석부(111)에서 출력된 주택 유형 분류 정보 및 실주거면적 정보, 대지권 추출부(112)에서 출력된 대지권 정보, 주택 용도 분류부(113)에서 출력된 주택 용도 분류 정보, 특수 주택 분류부(114)에서 출력된 특수 주택 정보, 정비 주택 분류부(115)에서 출력된 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 교육 학군 분류부(116)에서 출력된 교육 학군 정보, 단지 분류부(117)에서 출력된 단지 분류 정보, 부동산 기사 수집 분류부(118)에서 분류된 부동산에 관련된 데이터 중 적어도 하나 이상을 이용하여 빅데이터를 구축하도록 구성될 수 있다.The step S110 of building the big data by linking the data error-refined data according to the real estate level in the real data collection / refinement module 110 of the real data collection / refinement module 110 of FIG. Housing type classification information and actual residential area information outputted from the land use right extracting unit 112, land use right information outputted from the land use right extracting unit 112, housing use classification information outputted from the housing usage classifying unit 113, The redevelopment house information or reconstructed housing information output from the maintenance house classifying unit 115 and the corresponding business stage information, the education school district information output from the education school classifying unit 116, The real estate article collection classifier 118 classifies the real estate classified by the real estate article collection classifier 118 into at least one of the real estate classified by the real estate article collection classifier 118,

여기서, 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.Here, information to be applied to the relevant area of the house, information to be applied to the complex, information to be applied to the parcel, information to be applied to the parcel, and information to be applied to the relevant call, .

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the invention as defined in the following claims. There will be.

110: 부동산 데이터 수집/정제 모듈
111: 주거 타입 분석부
112: 대지권 추출부
113: 주택 용도 분류부
114: 특수 주택 분류부
115: 정비 주택 분류부
116: 교육 학군 분류부
117: 단지 분류부
118: 부동산 기사 수집 분류부
120: 빅데이터 구축 모듈
130: 주택 가격 형성 정보 추출 모듈
200: 주택 가격 추정 모듈
110: Real Estate Data Collection / Refinement Module
111: Housing type analysis unit
112:
113: Home use classification section
114: Special housing classification division
115: Maintenance Housing Classification Division
116: School District Division Division
117:
118: Real Estate Article Collection Division
120: Big data construction module
130: house price formation information extraction module
200: Home price estimation module

Claims (8)

적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 부동산 데이터 수집/정제 모듈;
상기 부동산 데이터 수집/정제 모듈에서 정확한 정보로 분류된 데이터와 오류가 자동 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 빅데이터 구축 모듈;
상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 주택 가격 형성 정보 추출 모듈을 포함하고,
상기 부동산 데이터 수집/정제 모듈은,
상기 데이터베이스에서 수집된 데이터 중에서 서로 다른 속성의 데이터 상호 간에 모순이 있는지 여부를 미리 준비된 소정의 알고리즘에 따라 판단하고, 판단 결과 상호 간에 모순이 있는 것으로 판단되는 경우 소정의 알고리즘에 따라 해당 데이터를 자동 정제하도록 구성되며, 자동 정제를 할 수 없는 경우 오류로 분류하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템.
Collecting data affecting housing price formation in at least one or more databases, identifying errors between the collected data through the spatial attribute value of the collected data, classifying the collected data into accurate information and incorrect information, A real estate data collection / refinement module for automatically refining the data classified as inaccurate information;
A big data building module for building big data by linking data classified as accurate information and automatically corrected data in the real estate data collection / refinement module according to a level of a real estate;
And a home price formation information extracting module for extracting home price formation information that affects housing price formation in the big data constructed in the big data building module,
The real estate data collection /
Determining whether there is a contradiction between data of different attributes among the data collected in the database according to a predetermined algorithm prepared in advance; and if it is determined that there is a contradiction between the data, the data is automatically refined according to a predetermined algorithm And if the automatic refinement is not possible, it is classified as an error. The big data construction system for housing price estimation using spatial information having a data error correction function.
제1항에 있어서, 상기 서로 다른 속성의 데이터 상호 간의 모순은,
소정 건물의 층별 정보의 수가 상기 건물의 최고 층수보다 많은 경우, 소정 층의 호별 면적의 합이 해당 층의 층별 면적을 초과하는 경우 또는 재건축/재개발 사업 또는 공공 시설 사업의 시행 예정일이 시행 완료일 이후인 경우 중 적어도 하나 이상을 포함하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템.
2. The method of claim 1,
When the number of floor information of a certain building is greater than the maximum number of floors of the building, the sum of the area of each floor of the predetermined floor exceeds the floor area of the floor, or the reconstruction / redevelopment project or the public facility project is due The system comprising: at least one of a plurality of data processing systems including a plurality of data processing systems;
제1항에 있어서, 상기 부동산 데이터 수집/정제 모듈은,
부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템.
The system of claim 1, wherein the real estate data collection /
Wherein the data error correcting function is configured to search the database of the real estate land register, the land registry register, the building register, the housing disclosure price database, the land use plan database, the school database, the latitude and longitude coordinate database, Big Data Construction System for Housing Price Estimation Using Spatial Information.
제1항에 있어서, 상기 부동산 데이터 수집/정제 모듈은,
주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 주거 타입 분석부;
토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 대지권 추출부;
건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 주택 용도 분류부;
주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 특수 주택 분류부;
토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 정비 주택 분류부;
주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 교육 학군 분류부;
주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단지 분류부;
뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 부동산 기사 수집 분류부 중 적어도 하나 이상을 포함하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템.
The system of claim 1, wherein the real estate data collection /
Housing type classification information composed of single type, double type, mixed type, mixed type and positive type by using the information on the number of stories, total oil level and area listed in the building of the house, and a housing type analysis part;
A land lot extraction unit for generating and outputting land lot right information using land related information of the land ledger and the land land register, the complex information of the house, the same information, and the call information;
A housing usage classifying unit for generating housing usage classifying information using the title block information and the housing disclosure price information of the building ledger and outputting the classified information;
A special housing classifying unit for generating and outputting special housing information classified as one of a general house, a luxury house or a special house using the housing disclosure price information and the housing type classification information and the actual housing area information outputted from the housing type analysis unit;
A maintenance housing classifying unit for generating and outputting redevelopment housing information or reconstructed housing information and corresponding business stage information using land use planning information;
The School District Classification Division generates and outputs the education district information classified into the general district and the premium Korea by using the surrounding school information centered on the district number of the house.
A classification section for generating and outputting classification information classified into a general complex and a similar complex using the coordinates of the latitude and longitude of the house, the overall title of the building, the title of the building, and the published price of the house;
And a real estate article collection classifier for automatically collecting and classifying data related to real estate in a news article and outputting the classified real estate article collection classifier. Data building system.
제1항에 있어서, 상기 부동산 레벨은,
지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템.
The method according to claim 1,
A local level, a merely level, a co-level, and a call level. The system for building big data for estimating a house price using spatial information having a data error correcting function.
제4항에 있어서, 상기 빅데이터 구축 모듈은,
상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를
주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템.
The method of claim 4, wherein the big data construction module comprises:
The housing classification information and the actual residence area information, the land-ownership information, the housing usage classification information, the special housing information, the redevelopment housing information or the reconstruction housing information and the corresponding business stage information, the education school district information,
It is structured to construct big data classified into information applied in common to the relevant area of the house, information applied to the complex, information applied to the parcel, information applied to the parcel, and information applied to the call Big Data Construction System for Housing Price Estimation Using Spatial Information with Data Error Correction Function.
부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계;
빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 정확한 정보로 분류된 데이터와 오류가 자동 정제된 데이터를 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨로 구성되는 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 단계;
주택 가격 형성 정보 추출 모듈이 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 단계를 포함하고,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
상기 데이터베이스에서 수집된 데이터 중에서 서로 다른 속성의 데이터 상호 간에 모순이 있는지 여부를 미리 준비된 소정의 알고리즘에 따라 판단하고, 판단 결과 상호 간에 모순이 있는 것으로 판단되는 경우 소정의 알고리즘에 따라 해당 데이터를 자동 정제하도록 구성되며, 자동 정제를 할 수 없는 경우 오류로 분류하도록 구성되며,
상기 서로 다른 속성의 데이터 상호 간의 모순은,
소정 건물의 층별 정보의 수가 상기 건물의 최고 층수보다 많은 경우, 소정 층의 호별 면적의 합이 해당 층의 층별 면적을 초과하는 경우 또는 재건축/재개발 사업 또는 공공 시설 사업의 시행 예정일이 시행 완료일 이후인 경우 중 적어도 하나 이상을 포함하도록 구성되며,
상기 공간적 속성치는,
부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
주거 타입 분석부가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 단계와, 대지권 추출부가 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 단계와, 주택 용도 분류부가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 단계와, 특수 주택 분류부가 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 단계와, 정비 주택 분류부가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 단계와, 교육 학군 분류부가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 단계와, 단지 분류부가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단계와, 부동산 기사 수집 분류부가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 단계 중 적어도 하나 이상을 포함하도록 구성되며,
상기 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계는,
상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법.
A real estate data collection / refinement module collects data affecting the formation of a house price in at least one database, identifies errors between the collected data through the spatial attribute value of the collected data, Automatically classifying data classified as inaccurate information and automatically classifying data classified as inaccurate information;
The big data establishing module associates the data classified with accurate information and the automatically corrected data with the real estate level composed of the local level, the merely level, the same level, and the call level in the real estate data collection / refinement module Building big data;
The home price formation information extraction module extracts home price formation information that affects the formation of the home price in the big data constructed in the big data construction module,
Wherein the real estate data collection / refinement module collects data affecting housing price formation in at least one database and identifies errors between the collected data via spatial attribute values to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
Determining whether there is a contradiction between data of different attributes among the data collected in the database according to a predetermined algorithm prepared in advance; and if it is determined that there is a contradiction between the data, the data is automatically refined according to a predetermined algorithm And is configured to classify as an error if automatic refinement is not possible,
The contradiction between the data of the different attributes,
When the number of floor information of a certain building is greater than the maximum number of floors of the building, the sum of the area of each floor of the predetermined floor exceeds the floor area of the floor, or the reconstruction / redevelopment project or the public facility project is due And at least one of the cases,
Wherein the spatial attribute value comprises:
The information including at least one of space coordinates, lot number, street name address, administrative zone name, complex name, administrative zone name and complex name, administrative zone name and business name,
The real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases and identifies errors between the collected data via spatial attribute values of the collected data to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
And is configured to collect big data by searching the land register, the land registry book, the building register book, the housing disclosure price database, the land use planning database, the school database, the latitude and longitude coordinate database,
The real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases and identifies errors between the collected data via spatial attribute values of the collected data to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
Housing Type Analysis The house type classification information and the living room area information composed of the single type, the double type, the mixed type, the mixed type and the positive type are generated and outputted by using the information on the number of stories, A land use right extracting unit generating and outputting land use right information by using the land related information of the land ledger and the land use right register, the housing information of the house, the same information, and the call information, And generating and outputting housing use classification information by using the housing disclosure price information, and a step of generating and outputting housing usage classification information by using the housing disclosure price information and the housing type classification information and the actual housing area information output from the housing type analysis unit Generate and output special house information classified as one of houses, luxury houses or special houses A step of generating and outputting redevelopment housing information or reconstructed housing information and corresponding business step information using the land use planning information and the maintenance school classification information, A step of generating and outputting education district information classified into a general school district and a premium Korea; and a step of generating and outputting education district information classified as a general district and a premium Korea by using the coordinates of the latitude and longitude of the classification unit, the general title unit of the building, And a step of automatically collecting, classifying and outputting the data related to the real estate in the news article, and outputting the classified information,
Wherein the big data building module constructs big data by linking data refined data in the real estate data collection / refinement module according to a property level,
The housing classification information and the actual residence area information, the land-ownership information, the housing usage classification information, the special housing information, the redevelopment housing information or the reconstruction housing information and the corresponding business stage information, the education school district information, It is structured to construct big data classified into information applied in common to the relevant area of the house, information applied to the complex, information applied to the parcel, information applied to the parcel, and information applied to the call A method for constructing big data for estimating house price using spatial information with data error correction function.
부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계;
빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 정확한 정보로 분류된 데이터와 오류가 자동 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 단계;
주택 가격 형성 정보 추출 모듈이 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 단계를 포함하고,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
상기 데이터베이스에서 수집된 데이터 중에서 서로 다른 속성의 데이터 상호 간에 모순이 있는지 여부를 미리 준비된 소정의 알고리즘에 따라 판단하고, 판단 결과 상호 간에 모순이 있는 것으로 판단되는 경우 소정의 알고리즘에 따라 해당 데이터를 자동 정제하도록 구성되며, 자동 정제를 할 수 없는 경우 오류로 분류하도록 구성되며,
상기 서로 다른 속성의 데이터 상호 간의 모순은,
소정 건물의 층별 정보의 수가 상기 건물의 최고 층수보다 많은 경우, 소정 층의 호별 면적의 합이 해당 층의 층별 면적을 초과하는 경우 또는 재건축/재개발 사업 또는 공공 시설 사업의 시행 예정일이 시행 완료일 이후인 경우 중 적어도 하나 이상을 포함하도록 구성되며,
상기 공간적 속성치는,
부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
상기 수집된 데이터 상호 간의 오류 패턴을 분석하고, 분석된 오류 패턴이 과거의 오류 패턴에 해당하는 경우에는 과거의 오류 패턴에 대한 오류 패턴 정정 자료를 이용하여 오류가 정정되는지 판단하고, 판단 결과 정정되는 경우 해당 오류 패턴 정정 자료를 이용하여 오류를 자동 정제하도록 구성되며, 판단 결과 정정되지 않는 경우 사용자에 의해 오류가 정제될 수 있도록 새로운 오류 패턴으로 분류하고, 상기 새로운 오류 패턴에 대한 오류 패턴 정정 자료를 이후의 오류에 대한 오류 패턴 정정 자료로 활용하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
주거 타입 분석부가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 단계와, 대지권 추출부가 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 단계와, 주택 용도 분류부가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 단계와, 특수 주택 분류부가 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 단계와, 정비 주택 분류부가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 단계와, 교육 학군 분류부가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 단계와, 단지 분류부가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단계와, 부동산 기사 수집 분류부가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 단계 중 적어도 하나 이상을 포함하도록 구성되며,
상기 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계는,
상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성되는 것을 특징으로 하는 데이터 오류 수정 기능을 갖는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법.
A real estate data collection / refinement module collects data affecting the formation of a house price in at least one database, identifies errors between the collected data through the spatial attribute value of the collected data, Automatically classifying data classified as inaccurate information and automatically classifying data classified as inaccurate information;
Building big data by linking the data classified as accurate information and the automatically refined data in the real data collection / refinement module according to the level of the real estate;
The home price formation information extraction module extracts home price formation information that affects the formation of the home price in the big data constructed in the big data construction module,
Wherein the real estate data collection / refinement module collects data affecting housing price formation in at least one database and identifies errors between the collected data via spatial attribute values to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
Determining whether there is a contradiction between data of different attributes among the data collected in the database according to a predetermined algorithm prepared in advance; and if it is determined that there is a contradiction between the data, the data is automatically refined according to a predetermined algorithm And is configured to classify as an error if automatic refinement is not possible,
The contradiction between the data of the different attributes,
When the number of floor information of a certain building is greater than the maximum number of floors of the building, the sum of the area of each floor of the predetermined floor exceeds the floor area of the floor, or the reconstruction / redevelopment project or the public facility project is due And at least one of the cases,
Wherein the spatial attribute value comprises:
The information including at least one of space coordinates, lot number, street name address, administrative zone name, complex name, administrative zone name and complex name, administrative zone name and business name,
The real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases and identifies errors between the collected data via spatial attribute values of the collected data to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
If the analyzed error pattern corresponds to the past error pattern, it is determined whether the error is corrected using the error pattern correction data of the past error pattern, and if the error pattern is corrected, The error pattern correction data for the new error pattern is classified into a new error pattern so that the error can be refined by the user if the error is not corrected as a result of the determination, It is configured to use as an error pattern correction data for subsequent errors,
The real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases and identifies errors between the collected data via spatial attribute values of the collected data to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
And is configured to collect big data by searching the land register, the land registry book, the building register book, the housing disclosure price database, the land use planning database, the school database, the latitude and longitude coordinate database,
The real estate data collection / refinement module collects data affecting housing price formation in at least one or more databases and identifies errors between the collected data via spatial attribute values of the collected data to provide accurate and inaccurate information The step of automatically classifying data classified as inaccurate information comprises:
Housing Type Analysis The house type classification information and the living room area information composed of the single type, the double type, the mixed type, the mixed type and the positive type are generated and outputted by using the information on the number of stories, A land use right extracting unit generating and outputting land use right information by using the land related information of the land ledger and the land use right register, the housing information of the house, the same information, and the call information, And generating and outputting housing use classification information by using the housing disclosure price information, and a step of generating and outputting housing usage classification information by using the housing disclosure price information and the housing type classification information and the actual housing area information output from the housing type analysis unit Generate and output special house information classified as one of houses, luxury houses or special houses A step of generating and outputting redevelopment housing information or reconstructed housing information and corresponding business step information using the land use planning information and the maintenance school classification information, A step of generating and outputting education district information classified into a general school district and a premium Korea; and a step of generating and outputting education district information classified as a general district and a premium Korea by using the coordinates of the latitude and longitude of the classification unit, the general title unit of the building, And a step of automatically collecting, classifying and outputting the data related to the real estate in the news article, and outputting the classified information,
Wherein the big data building module constructs big data by linking data refined data in the real estate data collection / refinement module according to a property level,
The housing classification information and the actual residence area information, the land-ownership information, the housing use classification information, the special housing information, the redevelopment housing information or the reconstruction housing information and the corresponding business stage information, the education school district information, It is structured to construct big data classified into information applied in common to the relevant area of the house, information applied to the complex, information applied to the parcel, information applied to the parcel, and information applied to the call A method for constructing big data for estimating house price using spatial information with data error correction function.
KR1020190030989A 2019-03-19 2019-03-19 System of building big data for estimating house price using space information having function of data error correction KR20190041439A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190030989A KR20190041439A (en) 2019-03-19 2019-03-19 System of building big data for estimating house price using space information having function of data error correction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190030989A KR20190041439A (en) 2019-03-19 2019-03-19 System of building big data for estimating house price using space information having function of data error correction

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170132177A Division KR20190041121A (en) 2017-10-12 2017-10-12 System and method of building big data for estimating house price using space information

Publications (1)

Publication Number Publication Date
KR20190041439A true KR20190041439A (en) 2019-04-22

Family

ID=66283196

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190030989A KR20190041439A (en) 2019-03-19 2019-03-19 System of building big data for estimating house price using space information having function of data error correction

Country Status (1)

Country Link
KR (1) KR20190041439A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052407A (en) * 2020-08-28 2020-12-08 深圳市彬讯科技有限公司 Service area query method and device, computer equipment and readable storage medium
CN115587694A (en) * 2022-09-27 2023-01-10 深圳市云智评信息技术有限公司 Data processing method, device and equipment for house rent batch evaluation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764834B1 (en) 2016-07-27 2017-08-04 주식회사 케이앤컴퍼니 System for estimating market price of real estate using bigdata and method thereof
KR101773911B1 (en) 2016-09-27 2017-09-01 주식회사 케이앤컴퍼니 Apparatus for estimating market price of real estate using market price and officially assessed price and method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764834B1 (en) 2016-07-27 2017-08-04 주식회사 케이앤컴퍼니 System for estimating market price of real estate using bigdata and method thereof
KR101773911B1 (en) 2016-09-27 2017-09-01 주식회사 케이앤컴퍼니 Apparatus for estimating market price of real estate using market price and officially assessed price and method thereof

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052407A (en) * 2020-08-28 2020-12-08 深圳市彬讯科技有限公司 Service area query method and device, computer equipment and readable storage medium
CN115587694A (en) * 2022-09-27 2023-01-10 深圳市云智评信息技术有限公司 Data processing method, device and equipment for house rent batch evaluation
CN115587694B (en) * 2022-09-27 2023-11-28 深圳市云智评信息技术有限公司 Data processing method, device and equipment for house rent batch evaluation

Similar Documents

Publication Publication Date Title
Hurst et al. Public transit and urban redevelopment: The effect of light rail transit on land use in Minneapolis, Minnesota
Renne et al. The cost and affordability paradox of transit-oriented development: A comparison of housing and transportation costs across transit-oriented development, hybrid and transit-adjacent development station typologies
Cao et al. Do changes in neighborhood characteristics lead to changes in travel behavior? A structural equations modeling approach
Trépanier et al. Individual trip destination estimation in a transit smart card automated fare collection system
Pacheco-Raguz Assessing the impacts of Light Rail Transit on urban land in Manila
Guo et al. Impacts of property accessibility and neighborhood built environment on single-unit and multiunit residential property values
Scerri et al. The value of architecture to tourism
Manoj et al. A structural equation model based analysis of non-workers’ activity-travel behaviour from a city of a developing country
Bienzeisler et al. Development of an agent-based transport model for the city of hanover using empirical mobility data and data fusion
KR20190041439A (en) System of building big data for estimating house price using space information having function of data error correction
KR20190053825A (en) System and method of building big data for estimating house price using space information
Carrion et al. Value of reliability: high occupancy toll lanes, general purpose lanes, and arterials
Wu et al. Modeling shopping center location choice: shopper preference–based competitive location model
KR20190041121A (en) System and method of building big data for estimating house price using space information
Hofmann et al. Automated identification of linked trips at trip level using electronic fare collection data
Lee et al. Machine learning based prediction of the value of buildings
Liang et al. Towards walkability enhancement: A systematic review and future directions
Yu et al. Exploring Taxi Demand Distribution of Comprehensive Land-Use Patterns Using Online Car-Hailing Data and Points of Interest in Chengdu, China
Daisa et al. Trip generation rates for transportation impact analyses of infill developments
JP2022138368A (en) Facility value estimate device, public equipment influence evaluation system, and public equipment influence evaluation method
Ho et al. Housing prices and price endogeneity in tenure and dwelling type choice models
Stich et al. Using a multiple criteria decision-making model to streamline and enhance NEPA and public participation processes
Young et al. Defining probability-based rail station catchments for demand modelling
Kilic et al. Effects of reverse geocoding on OpenStreetMap tag quality assessment
Gan et al. System for transit performance analysis using the national transit database

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application