KR102245888B1 - System and method of building big data for estimating house price using space information - Google Patents

System and method of building big data for estimating house price using space information Download PDF

Info

Publication number
KR102245888B1
KR102245888B1 KR1020190054780A KR20190054780A KR102245888B1 KR 102245888 B1 KR102245888 B1 KR 102245888B1 KR 1020190054780 A KR1020190054780 A KR 1020190054780A KR 20190054780 A KR20190054780 A KR 20190054780A KR 102245888 B1 KR102245888 B1 KR 102245888B1
Authority
KR
South Korea
Prior art keywords
information
housing
data
price
real estate
Prior art date
Application number
KR1020190054780A
Other languages
Korean (ko)
Other versions
KR20190053825A (en
Inventor
맹준영
장명수
최우현
이유형
Original Assignee
주식회사 공감랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 공감랩 filed Critical 주식회사 공감랩
Priority to KR1020190054780A priority Critical patent/KR102245888B1/en
Publication of KR20190053825A publication Critical patent/KR20190053825A/en
Application granted granted Critical
Publication of KR102245888B1 publication Critical patent/KR102245888B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법이 개시된다. 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 부동산 데이터 수집/정제 모듈; 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 빅데이터 구축 모듈; 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 주택 가격 형성 정보 추출 모듈을 구성한다. 상술한 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법에 의하면, 다양한 물리적, 사회적, 지역적 가격 형성 요인 등을 다양한 데이터베이스에서 수집하여 상호 간의 오류를 정제하여 빅데이터를 구축하도록 구성됨으로써, 빅데이터를 활용하여 지역, 건물 자체, 교육, 교통 등의 다양한 요소들의 복합적으로 고려하고 주택 가격 추정의 정확도를 높일 수 있는 효과가 있다.
Disclosed is a system and method for constructing big data for estimating a house price using spatial information. A real estate data collection/purification module that collects data affecting the formation of housing prices from at least one database, and refines data errors between the collected data through spatial attribute values; A big data construction module for constructing big data by linking data for which data errors are refined in the real estate data collection/purification module according to a real estate level; Construct a house price formation information extraction module that extracts information on housing price formation that affects the formation of house prices from the big data built in the big data construction module. According to the big data construction system and method for estimating housing price using the above-described spatial information, it is configured to collect various physical, social, regional price formation factors, etc. from various databases and refine the errors to build big data, Using big data, there is an effect of increasing the accuracy of housing price estimation by considering various factors such as area, building itself, education, and transportation in a complex manner.

Description

공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법{SYSTEM AND METHOD OF BUILDING BIG DATA FOR ESTIMATING HOUSE PRICE USING SPACE INFORMATION}Big data construction system and method for estimating house price using spatial information {SYSTEM AND METHOD OF BUILDING BIG DATA FOR ESTIMATING HOUSE PRICE USING SPACE INFORMATION}

본 발명은 주택 관련 빅데이터 구축 시스템 및 방법에 관한 것으로서, 구체적으로는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법에 관한 것이다.The present invention relates to a house-related big data construction system and method, and more specifically, to a big data construction system and method for estimating a house price using spatial information.

주택 가격을 추정하기 위한 다양한 알고리즘이 개시되어 있다.Various algorithms for estimating house prices have been disclosed.

다양한 관점에서 주택 가격을 추정하고 있는데, 대부분은 수요와 공급에 따라 결정되는 경제적 이론을 배경으로 주택 소재 지역, 주택 개별 특성 등의 요인을 고려하고 있다. 이러한 요인을 가격 형성 요인이라고 하는데, 이러한 가격 형성 요인을 수집하여 적정하게 하나의 주택 가격대를 추정해 내는 것은 매우 복잡하고 어려운 작업이다.Housing prices are estimated from various perspectives, and most of them consider factors such as the location of the housing and the individual characteristics of the housing against the background of an economic theory that is determined by supply and demand. This factor is called a price-forming factor, and collecting these price-forming factors and estimating the price of one house appropriately is a very complex and difficult task.

그러나, 주택 가격 추정에 있어서는 단순하게 어느 하나의 가격 형성 요인만을 고려할 수는 없다. 주택 가격에는 물리적, 지역적, 사회적, 교육적 요인들이 복합적으로 작용하고 있다.However, in estimating housing prices, it is not possible to simply consider one price-forming factor. Physical, regional, social, and educational factors are compounding housing prices.

그러나, 이러한 가격 형성 요인들을 다양한 관점에서 고려하여 주택 가격을 추정할 수 있도록 하는 데이터베이스는 구축되어 있지 못한 실정이다. 그리고 다양한 데이터베이스들의 데이터는 상호 간에 오류가 있을 가능성이 있는데, 이러한 오류를 정제하여 활용하는 수단도 없는 실정이다.However, there is no database for estimating housing prices by considering these price-forming factors from various viewpoints. In addition, there is a possibility that data of various databases may have errors, and there is no means to refine and utilize these errors.

또한, 이러한 가격 형성 요인들은 여러 데이터베이스에 산재하여 있는데, 정확한 가격 형성 요인의 정보들을 수집하는 작업 역시 매우 중요하다.In addition, these price-forming factors are scattered in various databases, and the task of collecting accurate price-forming factors is also very important.

토지 대장, 건물 대장, 대지권 등록부는 물론, 위치 좌표, 교통 정보 등의 다양한 정보들을 수집하여 활용할 필요가 있다.It is necessary to collect and utilize various information such as the land register, the building register, and the site right register, as well as location coordinates and traffic information.

10-177391110-1773911 10-176483410-1764834

본 발명의 목적은 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템을 제공하는 데 있다.An object of the present invention is to provide a big data construction system for estimating a house price using spatial information.

본 발명의 다른 목적은 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법을 제공하는 데 있다.Another object of the present invention is to provide a big data construction method for estimating a house price using spatial information.

상술한 본 발명의 목적에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템은, 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 부동산 데이터 수집/정제 모듈; 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 빅데이터 구축 모듈; 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 주택 가격 형성 정보 추출 모듈을 포함하도록 구성될 수 있다.The big data construction system for estimating house price using spatial information according to the object of the present invention as described above collects data affecting the formation of house price from at least one database, and uses the collected data as a spatial attribute value. A real estate data collection/purification module for refining data errors between each other through a medium; A big data construction module for constructing big data by linking data for which data errors are refined in the real estate data collection/purification module according to a real estate level; It may be configured to include a house price formation information extraction module for extracting the house price formation information that affects the house price formation from the big data built in the big data construction module.

여기서, 상기 공간적 속성치는, 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다.Here, the spatial attribute value is information capable of specifying the location or limiting the range of the real estate, and at least one of spatial coordinates, lot number, road name address, administrative area name, complex name, administrative area name and complex name, administrative area name, and business name. It can be configured to include.

그리고 상기 부동산 데이터 수집/정제 모듈은, 부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성될 수 있다.In addition, the real estate data collection/refining module is configured to collect big data by searching the real estate land register, property right register, building ledger, housing public price database, land use plan database, school database, longitude and latitude coordinate database, and news article database. Can be.

그리고 상기 부동산 데이터 수집/정제 모듈은, 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 주거 타입 분석부; 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 대지권 추출부; 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 주택 용도 분류부; 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 특수 주택 분류부; 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 정비 주택 분류부; 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 교육 학군 분류부; 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단지 분류부; 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 부동산 기사 수집 분류부 중 적어도 하나 이상을 포함하도록 구성될 수 있다.In addition, the real estate data collection/refining module uses information on the number of floors, exclusive ownership, and area listed in the building register of the house, and includes information on housing type classification and real housing consisting of single, double, mixed, mixed and categorized. A housing type analysis unit that generates and outputs area information; A site right extraction unit for generating and outputting site right information using land-related information, the housing complex information, the information and the number information of the land register and site right registration unit; A housing usage classification unit for generating and outputting housing usage classification information using the title portion information of the building ledger and the published housing price information; A special housing classification unit for generating and outputting information on a special house classified as one of a general house, a luxury house, or a special house by using the published housing price information and the housing type classification information and real housing area information output from the housing type analysis unit; A maintenance housing classification unit that generates and outputs redevelopment housing information or redevelopment housing information and corresponding business stage information by using land use plan information; An education district classification unit that generates and outputs information on education districts classified into general school districts and premium Korea by using information on surrounding schools centered on the housing lot number; A complex classification unit that generates and outputs complex classification information classified into general complexes and similar complexes by using the longitude and latitude coordinates of the house, the general heading of the building ledger, the heading of the building ledger, and the published price of the house; It may be configured to include at least one or more of a real estate article collection and classification unit that automatically collects, classifies, and outputs data related to real estate from a news article.

그리고 상기 부동산 레벨은, 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성될 수 있다.And the real estate level may be configured to include at least one or more of a local level, a complex level, a same level, and a ho level.

그리고 상기 빅데이터 구축 모듈은, 상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.And the big data construction module, the housing type classification information and real housing area information, the land rights information, the housing use classification information, the special housing information, the redevelopment housing information or reconstruction housing information and corresponding business stage information, the education School district information and the above complex classification information are classified into information that is commonly applied to the corresponding area of the housing, information that is applied to the relevant complex, information that is applied to the relevant lot, information that is applied to the relevant building, and information that is applied to the relevant issue. It can be configured to build data.

상술한 본 발명의 다른 목적에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법은, 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 단계; 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 단계; 주택 가격 형성 정보 추출 모듈이 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 단계를 포함하도록 구성될 수 있다.In the big data construction method for estimating house price using spatial information according to another object of the present invention described above, the real estate data collection/refining module collects data affecting the formation of house price from at least one database, and And refining data errors between the collected data through spatial attribute values; Constructing big data by linking, by a big data construction module, data for which data errors are purified in the real estate data collection/purification module according to real estate levels; The house price formation information extraction module may be configured to include the step of extracting house price formation information that affects the formation of house prices from the big data built in the big data construction module.

여기서, 상기 공간적 속성치는, 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다.Here, the spatial attribute value is information capable of specifying the location or limiting the range of the real estate, and at least one of spatial coordinates, lot number, road name address, administrative area name, complex name, administrative area name and complex name, administrative area name, and business name. It can be configured to include.

그리고 상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 단계는, 부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성될 수 있다.In addition, the real estate data collection/refining module collects data that affects the formation of housing prices from at least one database, and refines the data errors between the collected data through spatial attribute values, the land register of real estate. , A property register, a building register, a housing public price database, a land use plan database, a school database, a longitude and latitude coordinate database, and a news article database to collect big data.

그리고 상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제하는 단계는, 주거 타입 분석부가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 단계; 대지권 추출부가 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 단계; 주택 용도 분류부가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 단계; 특수 주택 분류부가 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 단계; 정비 주택 분류부가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 단계; 교육 학군 분류부가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 단계; 단지 분류부가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단계; 부동산 기사 수집 분류부가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 단계 중 적어도 하나 이상을 포함하도록 구성될 수 있다.In addition, the real estate data collection/refining module collects data affecting the formation of housing prices from at least one database, and refines the data errors between the collected data through spatial attribute values, the residential type analysis unit Generating and outputting housing type classification information and real housing area information composed of single type, double storey type, mixed type, mixed type, and bisexual type using information on the number of floors, exclusive ownership, and area described in the building register of the house; Generating and outputting the site rights information by using the site-related information, the housing complex information, the information and the number information of the land register and the site right registration unit by the site right extraction unit; Generating and outputting the housing usage classification information by using the title portion information of the building ledger and the published housing price information by the housing usage classification unit; The step of generating and outputting special housing information classified as one of general housing, luxury housing, or special housing by using the published housing price information by the special housing classification unit and the housing type classification information and actual housing area information output from the housing type analysis unit. ; Generating and outputting redevelopment housing information or redevelopment housing information and corresponding business stage information by using the land use plan information by the maintenance housing classification unit; Generating and outputting information on education districts classified as general school districts and premium Korea by using the information on surrounding schools centered on the housing lot number by the education district classification unit; Generating and outputting complex classification information classified into general complexes and similar complexes by using the complex classification unit's longitude and latitude coordinates, the general heading unit of the building ledger, the heading unit of the building ledger, and the published housing price; The real estate article collection and classification unit may be configured to include at least one or more of automatically collecting, classifying, and outputting data related to real estate from a news article.

그리고 상기 부동산 레벨은, 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성될 수 있다.And the real estate level may be configured to include at least one or more of a local level, a complex level, a same level, and a ho level.

그리고 상기 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계는, 상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.In addition, the step of constructing big data by linking, by the big data building module, data for which data errors are refined in the real estate data collection/purification module according to the real estate level, comprises: the housing type classification information and real housing area information, and the site right information. , The housing use classification information, the special housing information, the redevelopment housing information or reconstruction housing information and the corresponding business stage information, the education school district information, the information commonly applied to the corresponding area of the housing complex, and the corresponding complex It can be configured to construct big data by classifying it into information that is applied, information that is applied to the parcel, information that is applied to the building, and information that is applied to the issue.

상술한 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템 및 방법에 의하면, 다양한 물리적, 사회적, 지역적 가격 형성 요인 등을 다양한 데이터베이스에서 수집하여 상호 간의 오류를 정제하여 빅데이터를 구축하도록 구성됨으로써, 빅데이터를 활용하여 지역, 건물 자체, 교육, 교통 등의 다양한 요소들의 복합적으로 고려하고 주택 가격 추정의 정확도를 높일 수 있는 효과가 있다.According to the big data construction system and method for estimating housing price using the above-described spatial information, it is configured to collect various physical, social, regional price formation factors, etc. from various databases and refine the errors to build big data, Using big data, there is an effect of increasing the accuracy of housing price estimation by considering various factors such as the area, the building itself, education, and transportation in a complex manner.

도 1은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 모듈의 세부 구성도이다.
도 3은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법의 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 단계의 세부 흐름도이다.
1 is a block diagram of a big data construction system for estimating a house price using spatial information according to an embodiment of the present invention.
2 is a detailed configuration diagram of a real estate data collection/purification module according to an embodiment of the present invention.
3 is a flowchart of a method of constructing big data for estimating a house price using spatial information according to an embodiment of the present invention.
4 is a detailed flowchart of a real estate data collection/purification step according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 발명을 실시하기 위한 구체적인 내용에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.In the present invention, various modifications may be made and various embodiments may be provided, and specific embodiments will be illustrated in the drawings and will be described in detail in specific details for carrying out the invention. However, this is not intended to limit the present invention to a specific embodiment, it should be understood to include all changes, equivalents, and substitutes included in the spirit and scope of the present invention. In describing each drawing, similar reference numerals have been used for similar elements.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as first, second, A, and B may be used to describe various elements, but the elements should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element. The term and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is referred to as being "connected" or "connected" to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. It should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in the middle.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present application, terms such as "comprise" or "have" are intended to designate the presence of features, numbers, steps, actions, components, parts, or combinations thereof described in the specification, but one or more other features. It is to be understood that the presence or addition of elements or numbers, steps, actions, components, parts, or combinations thereof does not preclude in advance.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein including technical or scientific terms have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in the present application. Does not.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템의 블록 구성도이고, 도 2는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 모듈의 세부 구성도이다.1 is a block diagram of a big data construction system for estimating a house price using spatial information according to an embodiment of the present invention, and FIG. 2 is a detailed configuration of a real estate data collection/purification module according to an embodiment of the present invention It is a degree.

도 1을 참조하면, 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 시스템(100)은 부동산 데이터 수집/정제 모듈(110), 빅데이터 구축 모듈(120), 주택 가격 형성 정보 추출 모듈(130)을 포함하도록 구성될 수 있다.1, a big data construction system 100 for estimating a house price using spatial information according to an embodiment of the present invention includes a real estate data collection/purification module 110, a big data construction module 120, and a housing. It may be configured to include the price formation information extraction module 130.

이하, 세부적인 구성에 대하여 설명한다.Hereinafter, a detailed configuration will be described.

부동산 데이터 수집/정제 모듈(110)은 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 자동으로 수집하도록 구성될 수 있다. 스케줄러(scheduler)에 의해 주기적을 수집하도록 구성될 수 있다.The real estate data collection/purification module 110 may be configured to automatically collect data affecting the formation of housing prices from at least one or more databases. It can be configured to collect periodic by a scheduler.

부동산 데이터 수집/정제 모듈(110)은 여러 데이터베이스에서 부동산 데이터를 수집하도록 구성될 수 있다.The real estate data collection/purification module 110 may be configured to collect real estate data from multiple databases.

데이터베이스로서는 건물 대장(총괄 표제부), 건물 대장(표제부), 건물 대장(층), 건물 대장(전유부), 건물 대장(면적), 주택 공시 가격 데이터베이스, 토지 대장, 대지권 등록부, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 지하철 데이터베이스, 뉴스 기사 데이터베이스 등을 포함할 수 있다.As a database, building register (general title), building register (title section), building register (floor), building register (proprietary section), building register (area), housing published price database, land register, land right register, land use plan database, It may include a school database, a longitude and latitude coordinate database, a subway database, a news article database, and the like.

데이터베이스는 여러 곳에 산재하여 있을 수 있다. 국토부, 등기소, 교육부 등에서 각자 운용되는 데이터베이스가 될 수 있다.Databases can be scattered in several places. It can be a database operated by the Ministry of Land, Infrastructure, and Records, the Ministry of Education, etc.

토지 이용 계획 데이터베이스 학교 데이터베이스, 지하철 데이터베이스 등은 현재의 정보는 물론 미래의 정보 즉, 토지 이용에 대한 미래 계획 정보, 학교 설립 예정 정보, 지하철 개통 예정 정보 등을 포함하도록 구성될 수 있으며, 이러한 미래의 정보도 가격 형성 요인으로서 고려될 수 있다.Land use planning database School database, subway database, etc. can be configured to include not only current information but also future information, that is, future planning information on land use, school establishment schedule information, subway opening schedule information, and the like. Information can also be considered as a price shaping factor.

부동산 데이터 수집/정제 모듈(110)은 데이터베이스에 저장된 다양한 정보들 중에서 부동산에 관련된 데이터들을 텍스트 마이닝(text mining), 데이터 마이닝(data mininig) 등의 다양한 데이터 수집 기법을 이용하여 수집하도록 구성될 수 있다.The real estate data collection/purification module 110 may be configured to collect real estate-related data among various pieces of information stored in a database using various data collection techniques such as text mining and data mining. .

부동산 데이터 수집/정제 모듈(110)은 이와 같이 다양한 데이터베이스에서 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 수집된 데이터의 데이터 오류를 정제하도록 구성될 수 있다. 동일한 내용에 대한 데이터라 하더라도 데이터베이스마다 서로 다른 데이터로 저장될 수 있으며, 이러한 오류에 대해 정제를 수행하도록 구성될 수 있다.The real estate data collection/purification module 110 may be configured to purify data errors of data collected from each other by using the data collected from various databases as a means of spatial attribute values. Even data for the same content may be stored as different data for each database, and may be configured to perform purification for such errors.

여기서, 공간적 속성치는 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보이며, 다양한 데이터베이스를 통해 수집된 데이터들이 동일한 내용에 관한 데이터인지는 공간적 속성치를 통해 확인할 수 있다.Here, the spatial attribute value is information capable of specifying the location or limiting the scope of the real estate, and whether the data collected through various databases are data related to the same content can be confirmed through the spatial attribute value.

공간적 속성치는 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다. 여기서, 공간 좌표로서 경위도 좌표, UTM 좌표가 이용될 수 있다.The spatial attribute value may be configured to include at least one of spatial coordinates, lot numbers, road name addresses, administrative district names, complex names, administrative district names and complex names, administrative district names, and business names. Here, longitude and latitude coordinates and UTM coordinates may be used as spatial coordinates.

부동산 데이터 수집/정제 모듈(110)은 다양하 루트를 통해 수집된 데이터를 공간적 속성치를 매개로 연관시켜 상호 간에 불일치나 모순이되는 데이터들이 있는지 확인하여 정제하도록 구성될 수 있다.The real estate data collection/purification module 110 may be configured to correlate data collected through various routes through spatial attribute values to check and refine whether there are inconsistent or contradictory data.

예를 들어, 특정 건물의 호별 면적의 합은 층별 면적의 합을 넘을 수 없지만, 수집된 데이터에는 상호 간에 모순이나 오류가 있을 수 있다. 이러한 모순이나 오류를 소정의 알고리즘에 따라 자동으로 정제하도록 구성될 수 있다.For example, the sum of the area of each house of a specific building cannot exceed the sum of the area of each floor, but there may be contradictions or errors in the collected data. It can be configured to automatically refine these contradictions or errors according to a predetermined algorithm.

먼저 여러 데이터베이스에서 수집된 데이터를 정확한 정보인지 부정확한 정보인지를 확인하여 분류하고, 정확성 정보로 확인되는 데이터는 그대로 빅데이터 구축에 활용하도록 구성될 수 있다. 그러나, 정확성이 매우 떨어지거나 또는 정확성을 판단할 수 없는 경우에는 오류로 분류하도록 구성될 수 있다.First, the data collected from various databases can be classified by checking whether it is accurate or inaccurate information, and the data identified as accurate information can be configured to be used for big data construction as it is. However, if the accuracy is very poor or the accuracy cannot be determined, it may be configured to be classified as an error.

그리고 나서, 오류로 분류된 데이터에 대해 오류 패턴을 분석하도록 구성될 수 있다. 오류 패턴이 과거의 오류 패턴에 해당하는 경우에는 과거의 오류 패턴 정정 자료를 활용하여 오류가 해결되는 오류 패턴인 경우에는 이러한 과거의 오류 패턴 정정 자료를 활용하여 오류를 해결하고 이를 빅데이터 구축에 활용할 수 있다.Then, it may be configured to analyze an error pattern for the data classified as an error. If the error pattern corresponds to the past error pattern, in the case of an error pattern in which the error is resolved by using the past error pattern correction data, these past error pattern correction data are used to solve the error and use it to build big data. I can.

과거의 오류 패턴 정정 자료를 활용하여 정정할 수 없는 경우에는 새로운 오류 패턴으로 분류하여 저장하고 사용자에 의해 오류를 정정하도록 구성될 수 있다. 새로운 오류 패턴은 다시 과거의 오류 패턴 정정 자료로 활용되어 유사한 오류 패턴의 자동 정정에 활용될 수 있다.If it cannot be corrected by using the previous error pattern correction data, it can be classified as a new error pattern, stored, and configured to correct the error by the user. The new error pattern can be used again as data for correcting past error patterns and used for automatic correction of similar error patterns.

한편, 도 2를 참조하면, 부동산 데이터 수집/정제 모듈(110)은 주거 타입 분석부(111), 대지권 추출부(112), 주택 용도 분류부(113), 특수 주택 분류부(114), 정비 주택 분류부(115), 교육 학군 분류부(116), 단지 분류부(117), 주택 가격 추정부(118), 부동산 기사 수집 분류부(119)를 포함하도록 구성될 수 있다.Meanwhile, referring to FIG. 2, the real estate data collection/purification module 110 includes a housing type analysis unit 111, a land area extraction unit 112, a housing use classification unit 113, a special housing classification unit 114, and maintenance. It may be configured to include a housing classification unit 115, an education district classification unit 116, a complex classification unit 117, a housing price estimation unit 118, and a real estate article collection and classification unit 119.

주거 타입 분석부(111)는 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하도록 구성될 수 있다.The housing type analysis unit 111 uses information on the number of floors, exclusive ownership, and area recorded in the building register of the house, and includes information on classifying the housing type, consisting of a single type, a multi-storey type, a mixed type, a mixed type, and a bisexual type. Can be configured to generate and output.

대지권 추출부(112)는 토지 대장 및 대지권 등록부의 대지 관련 정보, 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하도록 구성될 수 있다.The site right extraction unit 112 may be configured to generate and output site right information by using land-related information, housing complex information, the same information, and number information of the land register and site right registration unit.

여기서, 단지 정보, 동 정보, 호 정보는 부동산 데이터 수집/정제 모듈(110)에 의해 수집된 정보가 될 수도 있다.Here, only the information, the information, and the call information may be information collected by the real estate data collection/purification module 110.

단지 정보는 단지명, 대지 면적, 건축 면적, 세대수, 주차 대수, 단지 코드 등이 될 수 있다. 단지 코드는 단지 분류부(117)에 의해 분류된 일반 단지인지 유사 단지인지에 대한 정보가 될 수 있다.The complex information can be the complex name, site area, building area, number of households, number of parking units, complex code, etc. The only code may be information on whether it is a general complex or a similar complex classified by the classification unit 117.

동 정보는 동 명칭, 사용 승인, 엘리베이터 유무, 최고층수, 구조/지붕, EPI 점수에 대한 정보가 될 수 있다.This information can be information about the name of the building, approval for use, the presence of elevators, the number of top floors, the structure/roof, and the EPI score.

호 정보는 호 명칭, 전용 면적, 주거 면적, 비주거 면적, 공용 면적, 대지 지분, 용도, 특수주택 여부, 주택 유형에 대한 정보가 될 수 있다. 전용 면적, 주거 면적, 비주거 면적, 공용 면적, 주택 유형은 주거 타입 분석부(111)에 의해 생성되는 정보이며, 특수 주택 여부는 특수 주택 분류부(114)에 의해 생성되는 정보가 될 수 있다. The call information can be information on the name of the call, exclusive area, residential area, non-residential area, common area, land share, usage, special housing status, and type of house. The exclusive area, the residential area, the non-residential area, the common area, and the house type are information generated by the housing type analysis unit 111, and whether a special house may be information generated by the special housing classification unit 114.

주택 용도 분류부(113)는 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하도록 구성될 수 있다.The housing usage classification unit 113 may be configured to generate and output housing usage classification information using information on the title portion of the building ledger and the published housing price information.

특수 주택 분류부(114)는 주택 공시가격 정보 및 주거 타입 분석부(111)에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하도록 구성될 수 있다.Special housing classification unit 114 is classified as a general housing, luxury housing, or special housing information by using the housing type classification information and actual housing area information output from the published housing price information and the housing type analysis section 111. Can be configured to generate and output.

정비 주택 분류부(115)는 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하도록 구성될 수 있다. 사업 단계에 따라서도 주택 가격이 단계별로 미치는 영향이 다를 수 있다.The maintenance housing classification unit 115 may be configured to generate and output redevelopment housing information or redevelopment housing information and corresponding business stage information by using land use plan information. Depending on the business stage, the impact of house prices by stage may be different.

교육 학군 분류부(116)는 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하도록 구성될 수 있다.The education district classification unit 116 may be configured to generate and output education district information classified into general school districts and premium Korea by using information on surrounding schools centered on the housing lot number.

단지 분류부(117)는 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하도록 구성될 수 있다. 단지 코드에 의해 일반 단지와 유사 단지가 확인될 수 있다.The complex classification unit 117 may be configured to generate and output complex classification information classified into a general complex and a similar complex by using the long-latitude coordinates of the house, the general heading of the building ledger, the heading of the building ledger, and the published price of the house. The general complex and the similar complex can be identified by the complex code.

부동산 기사 수집 분류부(119)는 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하도록 구성될 수 있다. 예를 들어, 어느 지역의 단지가 재건축을 추진하고 있다든지 또는 어느 지역에 지하철이나 순환 도로가 개설된다든지, 특정 공공 기관이 특정 지역에 설립된다든지 또는 재건축 단지나 재개발 단지에 입주가 시작되는 것과 같은 다양한 부동산 관련 데이터가 수집될 수 있다.The real estate article collection and classification unit 119 may be configured to automatically collect, classify, and output data related to real estate from news articles. For example, a complex in a certain area is pursuing reconstruction, a subway or ring road is opened in a certain area, a specific public institution is established in a specific area, or moving into a redevelopment complex or redevelopment complex is initiated. Various real estate-related data can be collected.

빅데이터 구축 모듈(120)은 부동산 데이터 수집/정제 모듈(110)에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하도록 구성될 수 있다. 여기서, 부동산 레벨은 지역 레벨, 단지 레벨, 동 레벨, 호 레벨 등의 레벨이나 단위 또는 위상을 의미한다.The big data building module 120 may be configured to build big data by linking data for which data errors have been refined in the real estate data collection/purification module 110 according to real estate levels. Here, the real estate level means a level, unit, or phase, such as a local level, a complex level, a building level, a house level, and the like.

빅데이터 구축 모듈(120)은 부동산 데이터 수집/정제 모듈(110)에서 수집되고 오류 정제된 데이터를 그 부동산 레벨에 따라 분류하도록 구성될 수 있다.The big data building module 120 may be configured to classify the data collected by the real estate data collection/purification module 110 and purified by errors according to the real estate level.

구체적으로는 빅데이터 구축 모듈(120)은 주택 유형 분류 정보 및 실주거면적 정보, 대지권 정보, 주택 용도 분류 정보, 특수 주택 정보, 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 교육 학군 정보, 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.Specifically, the big data construction module 120 includes housing type classification information and real housing area information, land area information, housing use classification information, special housing information, redevelopment housing information or reconstruction housing information and corresponding business stage information, education district information, To build big data by classifying the complex classification information into information commonly applied to the relevant area of the house, information applied to the relevant complex, information applied to the relevant lot, information applied to the relevant building, and information applied to the relevant issue. Can be configured.

주택 가격 형성 정보 추출 모듈(130)은 빅데이터 구축 모듈(120)에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하도록 구성될 수 있다.The house price formation information extraction module 130 may be configured to extract house price formation information that affects the formation of house prices from the big data built in the big data construction module 120.

주택 가격 형성 정보 추출 모듈(130)은 빅데이터에서 지역 레벨, 단지 레벨, 동 레벨, 호 레벨의 데이터들을 수집하여 특정 주택의 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하여 주택 가격 추정 모듈(200)에 제공하도록 구성될 수 있다. 주택 가격 추정 모듈(200)은 주택 가격 형성 정보를 이용하여 해당 주택의 가격을 추정할 수 있다.The house price formation information extraction module 130 is a house price estimation module by collecting data of a region level, a complex level, a building level, and a house level from big data and extracting the house price formation information that affects the formation of the housing price of a specific house. It may be configured to provide 200. The house price estimation module 200 may estimate the price of a corresponding house by using the house price formation information.

주택 가격 추정 모듈(200)은 주택 가격을 추정하는 다양한 모형을 적용할 수 있다. 그 중에서 여러 가지 주택 가격 형성 정보에 가중치를 적용하여 주택 가격을 추정할 수 있다. 그리고 재건축, 재개발, 학교 설립, 지하철 개통 등의 예상 시점 등을 고려하여 주택 가격 추정가를 시기별로 추정하는 등의 다양한 방식이 적용될 수 있다.The house price estimation module 200 may apply various models for estimating house prices. Among them, it is possible to estimate the house price by applying weights to various information on the formation of house prices. In addition, various methods can be applied, such as estimating the estimated housing price by period in consideration of the expected timing of reconstruction, redevelopment, school establishment, and subway opening.

또한, 지역별 인구 유출입과 지역별 유출입 인구의 연령대, 성별 등을 고려하거나 지역별로 주택 공급률을 산정하여 수요/공급에 따른 가격 형성 요인을 적용할 수도 있다.In addition, it is possible to apply price-forming factors according to demand/supply by taking into account the population inflow and outflow by region, age group, gender, etc. of the population inflow by region, or by calculating the housing supply rate by region.

도 3은 본 발명의 일 실시예에 따른 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법의 흐름도이다.3 is a flowchart of a method of constructing big data for estimating a house price using spatial information according to an embodiment of the present invention.

도 3을 참조하면, 부동산 데이터 수집/정제 모듈(110)이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상호 간의 데이터 오류를 정제한다(S110).Referring to FIG. 3, the real estate data collection/purification module 110 collects data affecting the formation of housing prices from at least one database, and data errors between the collected data as a medium of spatial attribute values It is purified (S110).

여기서, 공간적 속성치는 부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성될 수 있다. 여기서, 공간 좌표로서 경위도 좌표, UTM 좌표가 이용될 수 있다.Here, the spatial attribute value is information capable of specifying the location or limiting the scope of the real estate, and includes at least one of spatial coordinates, lot numbers, street names, addresses, administrative district names, complex names, administrative district names and complex names, administrative district names, and business names. Can be configured. Here, longitude and latitude coordinates and UTM coordinates may be used as spatial coordinates.

그리고 부동산 데이터 수집/정제 모듈(110)은 주택의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스 기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성될 수 있다.In addition, the real estate data collection/refining module 110 searches for a land register of a house, a property register, a building register, a housing public price database, a land use plan database, a school database, a long-latitude coordinate database, and a news article database to collect big data. Can be configured.

다음으로, 빅데이터 구축 모듈(120)이 부동산 데이터 수집/정제 모듈(110)에서 데이터 오류가 정제된 데이터를 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축한다(S120).Next, the big data construction module 120 builds big data by linking the data for which data errors are purified in the real estate data collection/purification module 110 according to the real estate level (S120).

여기서, 부동산 레벨은 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨 중 적어도 하나 이상을 포함하도록 구성될 수 있다.Here, the real estate level may be configured to include at least one of a local level, a complex level, a same level, and a ho level.

다음으로, 주택 가격 형성 정보 추출 모듈(130)이 빅데이터 구축 모듈(120)에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출한다(S130).Next, the house price formation information extraction module 130 extracts house price formation information that affects the formation of house prices from the big data built in the big data construction module 120 (S130).

도 4는 본 발명의 일 실시예에 따른 부동산 데이터 수집/정제 단계의 세부 흐름도이다.4 is a detailed flowchart of a step of collecting/purifying real estate data according to an embodiment of the present invention.

도 4를 참조하면, 주거 타입 분석부(111)가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력한다.Referring to FIG. 4, the housing type analysis unit 111 classifies a house type consisting of a single type, a double storey type, a mixed type, a mixed type, and a bisexual type by using information on the number of floors, exclusive ownership, and area described in the building register of the house. Generates and outputs information and actual living area information.

그리고 대지권 추출부(112)가 토지 대장 및 대지권 등록부의 대지 관련 정보, 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력한다In addition, the land right extraction unit 112 generates and outputs land right information using land-related information, housing complex information, the same information, and number information of the land register and land right register.

그리고 주택 용도 분류부(113)가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력한다.In addition, the housing usage classification unit 113 generates and outputs housing usage classification information using information on the title portion of the building ledger and the published housing price information.

그리고 특수 주택 분류부(114)가 주택 공시가격 정보 및 주거 타입 분석부(111)에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력한다.And special housing classified as one of general housing, luxury housing, or special housing by the special housing classification unit 114 using the published housing price information and the housing type classification information and real housing area information output from the housing type analysis unit 111. Generate and print information.

그리고 정비 주택 분류부(115)가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력한다.Then, the maintenance housing classification unit 115 generates and outputs redevelopment housing information or redevelopment housing information and corresponding business stage information by using the land use plan information.

그리고 교육 학군 분류부(116)가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력한다.In addition, the education district classification unit 116 generates and outputs information on education districts classified as general school districts and premium Korea by using information on surrounding schools centered on the housing lot number.

그리고 단지 분류부(117)가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력한다.In addition, the complex classification unit 117 generates and outputs complex classification information classified into a general complex and a similar complex by using the longitude and latitude coordinates of the house, the general heading of the building ledger, the heading of the building ledger, and the published price of the house.

그리고 부동산 기사 수집 분류부(118)가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력한다.In addition, the real estate article collection and classification unit 118 automatically collects, classifies, and outputs data related to real estate from the news article.

도 3의 빅데이터 구축 모듈(120)이 부동산 데이터 수집/정제 모듈(110)에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계(S110)는, 주거 타입 분석부(111)에서 출력된 주택 유형 분류 정보 및 실주거면적 정보, 대지권 추출부(112)에서 출력된 대지권 정보, 주택 용도 분류부(113)에서 출력된 주택 용도 분류 정보, 특수 주택 분류부(114)에서 출력된 특수 주택 정보, 정비 주택 분류부(115)에서 출력된 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 교육 학군 분류부(116)에서 출력된 교육 학군 정보, 단지 분류부(117)에서 출력된 단지 분류 정보, 부동산 기사 수집 분류부(118)에서 분류된 부동산에 관련된 데이터 중 적어도 하나 이상을 이용하여 빅데이터를 구축하도록 구성될 수 있다.The step (S110) of constructing big data by linking the data for which the data error is refined in the real estate data collection/purification module 110 by the big data construction module 120 of FIG. 3 according to the real estate level (S110), includes a residential type analysis unit ( 111), the housing type classification information and the real housing area information, the land right information output from the land ticket extraction unit 112, the housing use classification information output from the housing use classification unit 113, and the special housing classification unit 114 Special housing information output, redevelopment housing information or reconstruction housing information output from the maintenance housing classification unit 115 and information on the corresponding business stage, education school district information output from the education district classification unit 116, and the complex classification unit 117 It may be configured to construct big data using at least one or more of the output complex classification information and data related to real estate classified by the real estate article collection and classification unit 118.

여기서, 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성될 수 있다.Here, it will be configured to construct big data by classifying it into information that is commonly applied to the corresponding area of the house, information that is applied to the relevant complex, information that is applied to the relevant lot, information that is applied to the relevant building, and information that is applied to the relevant issue. I can.

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although described with reference to the above embodiments, those skilled in the art can understand that various modifications and changes can be made to the present invention without departing from the spirit and scope of the present invention described in the following claims. There will be.

110: 부동산 데이터 수집/정제 모듈
111: 주거 타입 분석부
112: 대지권 추출부
113: 주택 용도 분류부
114: 특수 주택 분류부
115: 정비 주택 분류부
116: 교육 학군 분류부
117: 단지 분류부
118: 부동산 기사 수집 분류부
120: 빅데이터 구축 모듈
130: 주택 가격 형성 정보 추출 모듈
200: 주택 가격 추정 모듈
110: Real estate data collection/purification module
111: housing type analysis unit
112: Earth sphere extraction unit
113: housing use classification unit
114: Special housing classification department
115: maintenance housing classification unit
116: Education District Classification Division
117: only classification unit
118: Real Estate Article Collection Classification
120: Big data building module
130: house price formation information extraction module
200: house price estimation module

Claims (1)

부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스(database)에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계;
빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 정확한 정보로 분류된 데이터와 오류가 자동 정제된 데이터를 지역 레벨, 단지 레벨, 동 레벨 및 호 레벨로 구성되는 부동산 레벨(level)에 따라 연계하여 빅데이터(big data)를 구축하는 단계;
주택 가격 형성 정보 추출 모듈이 상기 빅데이터 구축 모듈에서 구축된 빅데이터에서 주택 가격 형성에 영향을 미치는 주택 가격 형성 정보를 추출하는 단계;
주택 가격 추정 모듈이 상기 추출된 주택 가격 형성 정보를 이용하여 주택 가격을 추정하는 단계를 포함하고,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터를 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
상기 데이터베이스에서 수집된 데이터 중에서 서로 다른 속성의 데이터 상호 간에 모순이 있는지 여부를 미리 준비된 소정의 알고리즘에 따라 판단하고, 판단 결과 상호 간에 모순이 있는 것으로 판단되는 경우 소정의 알고리즘에 따라 해당 데이터를 자동 정제하도록 구성되며, 자동 정제를 할 수 없는 경우 오류로 분류하도록 구성되며,
상기 공간적 속성치는,
부동산의 위치를 특정하거나 범위를 한정할 수 있는 정보로서, 공간 좌표, 지번, 도로명 주소, 행정구역명, 단지명, 행정구역명 및 단지명, 행정구역명 및 사업명칭 중 적어도 하나 이상을 포함하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
상기 수집된 데이터 상호 간의 오류 패턴을 분석하고, 분석된 오류 패턴이 과거의 오류 패턴에 해당하는 경우에는 과거의 오류 패턴에 대한 오류 패턴 정정 자료를 이용하여 오류가 정정되는지 판단하고, 판단 결과 정정되는 경우 해당 오류 패턴 정정 자료를 이용하여 오류를 자동 정제하도록 구성되며, 판단 결과 정정되지 않는 경우 사용자에 의해 오류가 정제될 수 있도록 새로운 오류 패턴으로 분류하고, 상기 새로운 오류 패턴에 대한 오류 패턴 정정 자료를 이후의 오류에 대한 오류 패턴 정정 자료로 활용하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
부동산의 토지 대장, 대지권 등록부, 건물 대장, 주택 공시 가격 데이터베이스, 토지 이용 계획 데이터베이스, 학교 데이터베이스, 경위도 좌표 데이터베이스, 뉴스기사 데이터베이스를 검색하여 빅데이터를 수집하도록 구성되며,
상기 부동산 데이터 수집/정제 모듈이 적어도 하나 이상의 데이터베이스에서 주택 가격 형성에 영향을 미치는 데이터를 수집하고, 수집된 데이터의 공간적 속성치를 매개로 하여 상기 수집된 데이터 상호 간의 오류를 확인하여 정확한 정보와 부정확한 정보로 분류하고, 부정확한 정보로 분류된 데이터를 자동 정제하는 단계는,
주거 타입 분석부가 주택의 건물 대장에 기재된 층수, 전유부 및 면적에 관한 정보를 이용하여 단일형, 복층형, 혼합형, 혼합부속형 및 양성화형으로 구성되는 주택 유형 분류 정보 및 실주거면적 정보를 생성하여 출력하는 단계와, 대지권 추출부가 토지 대장 및 대지권 등록부의 대지 관련 정보, 상기 주택의 단지 정보, 동 정보 및 호 정보를 이용하여 대지권 정보를 생성하여 출력하는 단계와, 주택 용도 분류부가 건물 대장의 표제부 정보 및 주택 공시가격 정보를 이용하여 주택 용도 분류 정보를 생성하여 출력하는 단계와, 특수 주택 분류부가 주택 공시가격 정보 및 상기 주거 타입 분석부에서 출력된 주택 유형 분류 정보 및 실주거면적 정보를 이용하여 일반주택, 고급주택 또는 특수주택 중 하나로 분류되는 특수 주택 정보를 생성하여 출력하는 단계와, 정비 주택 분류부가 토지 이용 계획 정보를 이용하여 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보를 생성하여 출력하는 단계와, 교육 학군 분류부가 주택의 지번을 중심으로 하는 주변 학교 정보를 이용하여 일반 학군 및 프리미엄 한국으로 분류되는 교육 학군 정보를 생성하여 출력하는 단계와, 단지 분류부가 주택의 경위도 좌표, 건물 대장의 총괄 표제부, 건물 대장의 표제부, 주택 공시 가격을 이용하여 일반 단지 및 유사 단지로 분류되는 단지 분류 정보를 생성하여 출력하는 단계와, 부동산 기사 수집 분류부가 뉴스 기사에서 부동산에 관련된 데이터를 자동으로 수집하여 분류하여 출력하는 단계 중 적어도 하나 이상을 포함하도록 구성되며,
상기 빅데이터 구축 모듈이 상기 부동산 데이터 수집/정제 모듈에서 데이터 오류가 정제된 데이터를 부동산 레벨에 따라 연계하여 빅데이터를 구축하는 단계는,
상기 주택 유형 분류 정보 및 실주거면적 정보, 상기 대지권 정보, 상기 주택 용도 분류 정보, 상기 특수 주택 정보, 상기 재개발 주택 정보 또는 재건축 주택 정보와 해당 사업 단계 정보, 상기 교육 학군 정보, 상기 단지 분류 정보를 주택의 해당 지역에 공통적으로 적용되는 정보, 해당 단지에 적용되는 정보, 해당 필지에 적용되는 정보, 해당 동에 적용되는 정보, 해당 호에 적용되는 정보로 분류하여 빅데이터를 구축하도록 구성되고,
상기 주택 가격 추정 모듈이 상기 추출된 주택 가격 형성 정보를 이용하여 주택 가격을 추정하는 단계는,
재건축, 재개발, 학교 설립 또는 지하철 개통의 예상 시점을 각각 고려하여 재건축, 재개발, 학교 설립 또는 지하철 개통의 예상 시점에 따른 주택 가격 형성 정보에 각각의 가중치를 적용하고, 지역별 유출입 인구, 지역유출입 인구의 연령대 및 성별, 지역별 주택 공급률에 따른 수요와 공급의 가격 형성 요인을 적용하여 주택 가격을 추정하도록 구성되고,
상기 주택 가격 추정 모듈이 상기 추출된 주택 가격 형성 정보를 이용하여 주택 가격을 추정하는 단계는,
상기 재건축 또는 재개발 시 해당 사업 단계별로 달라지는 가격 형성 요인을 적용하여 주택 가격을 추정하도록 구성되는 것을 특징으로 하는 공간 정보를 이용한 주택 가격 추정을 위한 빅데이터 구축 방법.
The real estate data collection/purification module collects data that affects the formation of housing prices from at least one database, and checks errors between the collected data through the spatial attribute value of the collected data to provide accurate information and Classifying as inaccurate information and automatically refining the data classified as inaccurate information;
The big data construction module connects the data classified as accurate information in the real estate data collection/purification module and the data automatically refined from errors according to the real estate level consisting of the local level, the complex level, the same level, and the house level. Building big data;
Extracting, by a house price formation information extraction module, house price formation information that affects formation of a house price from the big data built in the big data construction module;
A house price estimation module including the step of estimating a house price using the extracted house price formation information,
The real estate data collection/refining module collects data that affects the formation of housing prices from at least one database, and checks the errors between the collected data by using the collected data as a means of spatial attribute values to provide accurate and inaccurate information. Classifying as information and automatically purifying the data classified as inaccurate information,
Among the data collected from the database, it is determined according to a predetermined algorithm prepared in advance whether there is a contradiction between data of different attributes, and when it is determined that there is a contradiction between the data collected from the database, the corresponding data is automatically refined according to a predetermined algorithm. It is configured to be classified as an error when automatic purification cannot be performed,
The spatial attribute value,
As information capable of specifying the location or limiting the scope of the real estate, it is configured to include at least one of spatial coordinates, lot numbers, street names, addresses, administrative district names, complex names, administrative district names and complex names, administrative district names, and business names,
The real estate data collection/purification module collects data that affects the formation of housing prices from at least one database, and checks the errors between the collected data through the spatial attribute value of the collected data to ensure accurate and inaccurate information. Classifying as information and automatically purifying the data classified as inaccurate information,
An error pattern between the collected data is analyzed, and if the analyzed error pattern corresponds to a past error pattern, it is determined whether the error is corrected using the error pattern correction data for the past error pattern, and the result of the determination is corrected. If the error is not corrected as a result of the judgment, it is classified as a new error pattern so that the error can be refined by the user, and the error pattern correction data for the new error pattern is It is configured to be used as error pattern correction data for subsequent errors.
The real estate data collection/purification module collects data that affects the formation of housing prices from at least one database, and checks the errors between the collected data through the spatial attribute value of the collected data to ensure accurate and inaccurate information. Classifying as information and automatically purifying the data classified as inaccurate information,
It is configured to collect big data by searching real estate land register, property right register, building register, public housing price database, land use plan database, school database, longitude and latitude coordinate database, and news article database.
The real estate data collection/purification module collects data that affects the formation of housing prices from at least one database, and checks the errors between the collected data through the spatial attribute value of the collected data to ensure accurate and inaccurate information. Classifying as information and automatically purifying the data classified as inaccurate information,
The housing type analysis unit generates and prints information on housing type classification and actual housing area, which are composed of single, double, mixed, mixed, and bisexual, using the information on the number of floors, exclusive use, and area listed in the building register of the house. And the step of generating and outputting the site right information by using the site-related information, the housing complex information, the information and the number information of the land register and the property right register by the site right extraction unit, and the step of generating and outputting the site right information, and the housing use classification unit information on the title part of the building ledger. And generating and outputting the housing use classification information using the published housing price information, and the special housing classification unit uses the published housing price information and the housing type classification information and the actual living area information output from the housing type analysis unit. Steps for generating and outputting special housing information classified as one of housing, luxury housing, or special housing, and the maintenance housing classification unit generates and outputs redevelopment housing information or redevelopment housing information and corresponding business stage information using land use plan information. Steps, the education district classification unit generates and outputs information on education districts classified as general school districts and premium Korea by using the information of surrounding schools centered on the housing lot number, and the complex classification unit generates and outputs the longitude and latitude coordinates of the housing and the building register. Using the general heading, the heading of the building ledger, and the published price of the house to generate and output complex classification information classified into general complexes and similar complexes, the real estate article collection and classification unit automatically collects real estate-related data from news articles. It is configured to include at least one or more of the steps of classifying and outputting,
The step of constructing big data by linking, by the big data building module, data for which data errors are refined in the real estate data collection/purification module, according to the real estate level,
The housing type classification information and real housing area information, the land right information, the housing use classification information, the special housing information, the redevelopment housing information or reconstruction housing information and the corresponding business stage information, the education school district information, and the complex classification information It is configured to construct big data by classifying it into information commonly applied to the relevant area of the house, information applied to the relevant complex, information applied to the relevant lot, information applied to the relevant building, and information applied to the relevant issue,
The step of estimating, by the house price estimation module, a house price using the extracted house price formation information,
Each weight is applied to the housing price formation information according to the expected time of reconstruction, redevelopment, school establishment, or subway opening by considering the expected timing of reconstruction, redevelopment, school establishment, or subway opening. It is configured to estimate the housing price by applying the price-forming factors of supply and demand according to the housing supply rate by age group, gender, and region,
The step of estimating, by the house price estimation module, a house price using the extracted house price formation information,
The method of constructing big data for estimating house price using spatial information, characterized in that, when the reconstruction or redevelopment is performed, the house price is estimated by applying a price forming factor that varies for each project step.
KR1020190054780A 2019-05-10 2019-05-10 System and method of building big data for estimating house price using space information KR102245888B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190054780A KR102245888B1 (en) 2019-05-10 2019-05-10 System and method of building big data for estimating house price using space information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190054780A KR102245888B1 (en) 2019-05-10 2019-05-10 System and method of building big data for estimating house price using space information

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170132177A Division KR20190041121A (en) 2017-10-12 2017-10-12 System and method of building big data for estimating house price using space information

Publications (2)

Publication Number Publication Date
KR20190053825A KR20190053825A (en) 2019-05-20
KR102245888B1 true KR102245888B1 (en) 2021-04-30

Family

ID=66678465

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190054780A KR102245888B1 (en) 2019-05-10 2019-05-10 System and method of building big data for estimating house price using space information

Country Status (1)

Country Link
KR (1) KR102245888B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102322594B1 (en) * 2019-09-16 2021-11-05 김다솜 system of providing anaiyzed proper bidding price for real estate based on big-data with AI and operating method thereof
CN116303624B (en) * 2023-05-17 2023-09-19 山东建筑大学 Agricultural data processing method and device, electronic equipment and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101542195B1 (en) * 2014-03-28 2015-08-05 주식회사 솔트룩스 System And Method For Building Knowledge Base Using Extracting Property Of Informal Data

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101636953B1 (en) * 2014-05-30 2016-07-07 조성환 Method for analyzing data and apparatus using the method
KR101764834B1 (en) 2016-07-27 2017-08-04 주식회사 케이앤컴퍼니 System for estimating market price of real estate using bigdata and method thereof
KR101773911B1 (en) 2016-09-27 2017-09-01 주식회사 케이앤컴퍼니 Apparatus for estimating market price of real estate using market price and officially assessed price and method thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101542195B1 (en) * 2014-03-28 2015-08-05 주식회사 솔트룩스 System And Method For Building Knowledge Base Using Extracting Property Of Informal Data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
옥진아 외 1인. 경기도 주택·부동산 빅데이터 분석 및 활용체계 연구. 정책연구. 경기연구원. 2015년 11월, pp.1-112 (2015.11.) 1부.*

Also Published As

Publication number Publication date
KR20190053825A (en) 2019-05-20

Similar Documents

Publication Publication Date Title
Scorrano et al. Active mobility in an Italian city: Mode choice determinants and attitudes before and during the Covid-19 emergency
Renne et al. The cost and affordability paradox of transit-oriented development: A comparison of housing and transportation costs across transit-oriented development, hybrid and transit-adjacent development station typologies
Jeffrey et al. Using walkability measures to identify train stations with the potential to become transit oriented developments located in walkable neighbourhoods
Cao et al. Do changes in neighborhood characteristics lead to changes in travel behavior? A structural equations modeling approach
Patnaik et al. Estimation of bus arrival times using APC data
Guo et al. Efficiency assessment of transit-oriented development by data envelopment analysis: Case study on the Den-en Toshi line in Japan
Salon et al. Opportunities for value capture to fund public transport: A comprehensive review of the literature with a focus on East Asia
Tamakloe et al. Determinants of transit-oriented development efficiency focusing on an integrated subway, bus and shared-bicycle system: Application of Simar-Wilson's two-stage approach
Ordonez Medina et al. Estimating dynamic workplace capacities by means of public transport smart card data and household travel survey in Singapore
KR102245888B1 (en) System and method of building big data for estimating house price using space information
Shah et al. Diagnosing transportation: Developing key performance indicators to assess urban transportation systems
Bienzeisler et al. Development of an agent-based transport model for the city of hanover using empirical mobility data and data fusion
Schmidt et al. Causal, spatiotemporal impacts of transit investments: Exploring spatial heterogeneity from announcement through long-run operation
Elias et al. Gender and travel behavior in two Arab communities in Israel
Cyril et al. Electronic ticket machine data analytics for public bus transport planning
KR20190041439A (en) System of building big data for estimating house price using space information having function of data error correction
KR20190041121A (en) System and method of building big data for estimating house price using space information
Hofmann et al. Automated identification of linked trips at trip level using electronic fare collection data
Zhou et al. Big data for intrametropolitan human movement studies A case study of bus commuters based on smart card data
Hwang et al. An examination of the accuracy of an activity-based travel simulation against smartcard and navigation device data
Ghaffar et al. Meta-analysis of shared micromobility ridership determinants
Liang et al. Towards walkability enhancement: A systematic review and future directions
Beukes et al. Quantifying the contextual influences on road design
Stich et al. Using a multiple criteria decision-making model to streamline and enhance NEPA and public participation processes
Cho et al. Validation of activity-based travel demand model using smart-card data in Seoul, South Korea

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right