KR102278092B1 - 도시 정보 분석 방법 및 시스템 - Google Patents
도시 정보 분석 방법 및 시스템 Download PDFInfo
- Publication number
- KR102278092B1 KR102278092B1 KR1020190117294A KR20190117294A KR102278092B1 KR 102278092 B1 KR102278092 B1 KR 102278092B1 KR 1020190117294 A KR1020190117294 A KR 1020190117294A KR 20190117294 A KR20190117294 A KR 20190117294A KR 102278092 B1 KR102278092 B1 KR 102278092B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- web
- analysis
- complex
- floor
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000009193 crawling Effects 0.000 claims description 36
- 238000007619 statistical method Methods 0.000 claims description 7
- 238000012876 topography Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 10
- 238000007405 data analysis Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000012066 statistical methodology Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B29/00—Maps; Plans; Charts; Diagrams, e.g. route diagram
- G09B29/003—Maps
- G09B29/006—Representation of non-cartographic information on maps, e.g. population distribution, wind direction, radiation levels, air and sea routes
- G09B29/007—Representation of non-cartographic information on maps, e.g. population distribution, wind direction, radiation levels, air and sea routes using computer methods
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Ecology (AREA)
- Mathematical Physics (AREA)
- Educational Technology (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
도시 정보 분석 방법 및 시스템으로, 획득된 온라인 데이터 및 내부 저장 데이터에 대한 인덱싱을 수행하고, XML 구문 기반의 웹 데이터베이스를 구축하여 저장하고, 상기 웹 데이터베이스 대상으로 최적 웹 크롤러를 생성하며, 상기 웹 데이터베이스에 저장된 데이터를 대상으로 상기 최적 웹 크롤러를 이용하여 데이터를 추출하고, 상기 추출된 데이터를 대상으로 데이터 전처리를 수행하고, 상기 전처리된 데이터에 기초하여 적어도 층별 실거래 가격 및 단지별 관리비를 예측하여 분석 결과를 도출하며, 상기 분석 결과에 기초하여 3차원 공동주택 도시 MAP을 구현한다.
Description
본 개시는 도시 정보 분석 방법 및 시스템에 관한 것이다.
기존 데이터베이스를 활용한 데이터 분석 기술의 경우, 데이터 저장 공간을 구축하기 위해서 상당한 용량이 필요하다. 기존의 도시 정보의 경우, 그 범위가 교통, 주거, 부동산, 에너지 등을 포함하는 광범위한 정보이고, 각각 다른 공공 기관을 통해 관리되고 있어, 이를 통합하여 저장 및 분석하는데 어려움이 있다.
도시 정보를 통합하여 저장 및 분석할 수 있는 시스템을 제공하고자 한다.
본 발명의 한 특징에 따른 도시 정보 분석 방법은, 획득된 온라인 데이터 및 내부 저장 데이터에 대한 인덱싱을 수행하고, XML 구문 기반의 웹 데이터베이스를 구축하여 저장하는 단계, 상기 웹 데이터베이스 대상으로 최적 웹 크롤러를 생성하는 단계, 상기 웹 데이터베이스에 저장된 데이터를 대상으로 상기 최적 웹 크롤러를 이용하여 데이터를 추출하고, 상기 추출된 데이터를 대상으로 데이터 전처리를 수행하는 단계, 상기 전처리된 데이터에 기초하여 적어도 층별 실거래 가격 및 단지별 관리비를 예측하여 분석 결과를 도출하는 단계, 및 상기 분석 결과에 기초하여 3차원 공동주택 도시 MAP을 구현하는 단계를 포함한다.
상기 도시 정보 분석 방법은, 적어도 복수의 URL을 설정하는 단계, 상기 설정된 복수의 URL을 복수의 그룹으로 구분하고, 상기 복수의 URL 그룹 각각에 대해서 수집 타겟을 할당하는 단계, 및 상기 할당된 수집 타겟 별로 자동 및 반복적으로 웹 크롤링을 수행하여 상기 획득된 온라인 데이터를 추출하는 단계를 더 포함할 수 있다.
상기 웹 데이터베이스 대상으로 최적 웹 크롤러를 생성하는 단계는, 상기 웹 데이터베이스에 저장된 모든 데이터를 대상으로 통계 분석을 수행하고, 상기 통계 분석 결과에 기초하여 변수를 선정하며, 상기 선정된 변수를 대상으로 크롤링 코드를 작성하여 상기 최적 웹 크롤러를 생성하는 단계를 포함할 수 있다.
상기 전처리된 데이터에 기초하여 적어도 층별 실거래 가격 및 단지별 관리비를 예측하여 분석 결과를 도출하는 단계는, 복수의 분석 방법을 사용하여 상기 적어도 층별 실거래 가격 및 단지별 관리비를 예측하는 단계, 상기 복수의 분석 방법 각각의 예측 결과에 대한 오차율을 산출하는 단계, 상기 복수의 분석 방법 각각의 오차율 중 낮은 순서로 적어도 두 개의 분석 방법을 선택하는 단계, 및 상기 적어도 두 개의 분석 방법에 의해 예측한 결과에 기초하여 분석 결과를 도출하는 단계를 포함할 수 있다.
상기 분석 결과에 기초하여 3차원 공동주택 도시 MAP을 구현하는 단계는, 도시 지형 마크업 언어(CityGML)로 상기 적어도 예측된 층별 실거래 가격 및 단지별 관리비를 코딩하여 상세도(Level of Detail, LoD) 3단계로 구현하고, 3D CityGML Viewer로 3차원으로 표시하는 단계를 포함할 수 있다.
본 발명의 또 다른 특징에 따른 도시 정보 분석 시스템은, 앞서 설명한 단계들 중 대응하는 적어도 하나의 단계를 수행하기 위한 복수의 모듈을 포함할 수 있다.
도시 정보를 통합하여 저장 및 분석할 수 있는 시스템을 제공할 수 있다.
도 1은 일 실시예에 따른 도시 정보 분석 시스템을 나타낸 도면이다.
도 2는 일 실시예에 따른 도시 정보 분석 방법을 나타낸 순서도이다.
도 3A 내지 도 3D는 데이터 수집에 필요한 기준을 정렬한 테이블이다.
도 2는 일 실시예에 따른 도시 정보 분석 방법을 나타낸 순서도이다.
도 3A 내지 도 3D는 데이터 수집에 필요한 기준을 정렬한 테이블이다.
본 발명의 일 실시예는 XML(Extensible Markup Language) 구문만으로 웹 데이터베이스를 구축하여 별도의 서버를 구축할 필요가 없고, 단계별 웹 크롤링(web crawling) 수행을 통해 분석을 위한 데이터 수집이 효율적이며, 웹 크롤링을 통한 자동/반복적 데이터 수집이 가능하여 데이터 업데이트가 용이하고, 데이터 분석과 관련된 필수 정보만을 추출하고, 하나의 시스템을 통해 수집, 저장, 및 분석이 자동 수행되어, 전체 정보의 통합 및 관리가 가능하다.
일 실시예는, 웹 크롤링을 통해 인터넷 상의 웹페이지에서 필요한 데이터를 획득하고, 획득된 데이터를 XML 구문 기반으로 웹 데이터 베이스화하여 웹 데이터 베이스를 구축한다. XML(Extensible Markup Language)은 인터넷에 연결된 시스템끼리 데이터를 쉽게 주고 받기 위해 다른 많은 종류의 데이터를 기술하는 데 사용될 수 있다.
일 실시예는, 웹 크롤링과 웹 데이터베이스를 연동 및 통합하여 시스템을 구축할 수 있다. 자동/반복적인 1단계 웹 크롤링을 통해 필요한 데이터를 수집하여 웹 데이터베이스를 개발하고, 이를 대상으로 2단계 웹 크롤링을 수행하여 데이터를 재 수집한다. 그러면, 데이터 수집 및 분석에 있어 효율성이 증대되고, 분석 목적에 맞게 최적화된 시스템을 구출할 수 있다.
또한, 데이터베이스 및 서버를 구축하지 않고, XML 구문의 TXT 만이 웹 데이터베이스로 저장되므로, 데이터 확장이 용이하고, 저비용/저용량의 데이터 저장이 구현될 수 있다. 이를 통해, 시간, 비용, 위치, 이력 사항, 현황, 사진 등 필요한 모든 도시 정보를 통합 관리할 수 있다. 그리고 다양한 공공기관에서 분산되어 관리되는 도시와 관련된 온라인 오픈 데이터(open data)뿐만 아니라 내부에 저장된 데이터 등 분석 목적에 최적화된 데이터를 누적 수집할 수 있다. 나아가 컴퓨터 내의 다양한 분석 프로그램과 시스템 연동을 통해 최적의 분석이 수행될 수 있다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시예를 상세히 설명하되, 동일하거나 유사한 구성요소에는 동일, 유사한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
도 1은 일 실시예에 따른 도시 정보 분석 시스템을 나타낸 도면이다.
도 2는 일 실시예에 따른 도시 정보 분석 방법을 나타낸 순서도이다.
도 1에 도시된 바와 같이, 도시 정보 분석 시스템(1)은, 데이터 수집 모듈(10), 제1 웹 크롤링 모듈(20), 웹 데이터베이스 모듈(30), 제2 웹 크롤링 모듈(40), 데이터 추출/전처리 모듈(50), 및 예측/표시 모듈(60)을 포함한다.
도 1에 도시된 각 모듈은 도 2에 도시된 각 단계를 수행하기 위한 모듈의 일 예일 수 있다. 각 모듈은 대응하는 적어도 하나의 단계를 수행할 수 있다.
데이터 수집 모듈(10)은 필요한 정보를 찾을 대상 사이트명, URL 등과 함께 수집 주기를 설정하고, 설정된 조건에 따라 필요한 정보에 대한 데이터 수집을 수행한다. 이때, 데이터 수집 모듈(10)은 복수의 URL을 복수의 그룹으로 구분하고, 복수의 URL 그룹 각각에 대해서 수집 타겟을 할당할 수 있다(S1). 수집 타겟은 각 URL에서 얻고자 하는 데이터의 수집 기준을 의미한다.
제1 웹 크롤링 모듈(20)은 복수의 URL 그룹 각각에 대해서 할당된 수집 타겟 별로 자동 및 반복적으로 웹 크롤링을 수행하고, 각 타겟에 대한 주거분야 온라인 데이터를 추출할 수 있다(S2).
웹 데이터베이스 모듈(30)은 제1 웹 크롤링 모듈(20)에 의해 추출된 온라인 데이터를 획득하고, 내부적으로 저장된 데이터와 함께 데이터 인덱싱을 수행하며(S3), XML 구문 기반의 웹 데이터베이스를 구축하여 저장한다(S4). 내부적으로 저장된 데이터는 온라인에서 웹 크롤링에 의해 획득되지 않은 다른 수단에 의해 획득된 데이터일 수 있다.
일 예로, 웹 데이터베이스 모듈(30)에 의해 공동주택 단지별 데이터를 각 홈페이지에서 수집하여, 웹 데이터베이스에 저장할 수 있다.
도 3A 내지 도 3D는 데이터 수집에 필요한 기준을 정렬한 테이블이다.
도 3A 내지 도 3D는 하나의 테이블로 구현될 수 있으나, 페이지 사이즈를 고려하여 4 개의 도면으로 나눠 도시하였다.
먼저, 테이블에서 좌측에 위치한 열의 "세부단지별 기본정보", "주택가격 및 거래분야", "주택공급 및 환경분야 지표 등," 및 "거시경제 및 일반지표 등"이 복수의 URL 그룹에 해당한다.
데이터 수집 모듈(10)은 부동산 통계안내서(국토교통부 부동산 통계 협의회, 2014), 공동주택가격조사 산정기준(국토교통부, 2016), 공동주택 개발사업 타당성 평가항목에 관한 연구(홍주현 외 1인, 2008), 통계로 본 서울주거(서울연구원, 2013), 주거 통계 프레임워크 작성 과제(한성대학교, 2016) 및 국토교통부 통계누리, 한국감정원 부동산통계정보 사이트 등에 기초하여 설정된 기준에 따라 위와 같이 복수의 URL 그룹을 구분할 수 있다. 그러나 이는 일 예시로 복수의 URL 그룹을 구분하는 기준이 이에 한정되는 것은 아니며, 설계에 따라 변경될 수 있다.
데이터 수집 모듈(10)은 각 그룹의 URL 특성에 따라 각 URL 그룹별로 수집 타겟을 설정할 수 있다. 예를 들어, 거시적인 데이터에 대한 수집 타겟으로 행정구역 별 예를 들어, 광역지방자치단체, 기초지방자치단체, 비자치구역이 될 수 있고, 세부단지 데이터에 대한 수집 타겟은 공동주택 단지명/지번/도로명 주소가 될 수 있다.
제1 웹 크롤링 모듈(20)은 행정구역/세부단지 별로 지정된 URL 그룹에서 각 URL에 접속하여 수집 타겟에 해당하는 데이터를 수집한다. 예를 들어, 제1 웹 크롤링 모듈(20)은 도 3A 내지 도 3D의 테이블에서 각 URL에 접속하여 지정된 수집 타겟에 대한 데이터를 수집하고, 이렇게 수집된 데이터에 기초하여 주거분야 온라인 데이터를 획득할 수 있다.
도 3A 및 도 3B에 도시된 일 예로, URL 그룹 "세부단지별 기본정보"에서, 건물요인(단지정보), 외부요인, 기타, 개별요인, 관리비 정보 각각의 수집 타겟에 대한 정보를 획득할 수 있는 출처 웹 사이트의 URL이 매핑되어 있다.
이어서, 도 3B 및 도 3C에 걸쳐서, URL 그룹 "주택가격 및 거래분야"에서, 가격, 거래현황, 동향정보, 심리지수 각각의 수집 타겟에 대한 정보를 획득할 수 있는 출처 웹 사이트의 URL이 매핑되어 있다.
도 3C에, URL 그룹 "주택공급 및 환경분야 지표 등"에서, 공동주택 현황, 주택공급 분야, 주거서비스-환경분야, 형평성지표, 주택금융 분야 각각의 수집 타겟에 대한 정보를 획득할 수 있는 출처 웹 사이트의 URL이 매핑되어 있다.
마지막으로, 도 3D에, URL 그룹 "거시경제 및 일반지표 등"에서, 경제금융관련, 일반지표, 지가지표 각각의 수집 타겟에 대한 정보를 획득할 수 있는 출처 웹 사이트의 URL이 매핑되어 있다.
이와 같이, 27개 사이트에 중복적·산발적으로 흩어진 데이터를 도 3A 내지 도 3D의 테이블에 기재된 하나의 테이블에 매핑하여, 각 URL 그룹으로 분류할 수 있다.
제2 웹 크롤링 모듈(40)은 웹 데이터베이스 모듈(30)에 저장된 데이터를 대상으로 웹 크롤링을 수행하여 최적의 웹 크롤러를 생성한다(S5). 제2 웹 크롤링 모듈(40)은 통계적 방법론을 통해 최적의 웹 크롤러(이하, '최적 웹 크롤러'라 함)를 생성할 수 있다. 제2 웹 크롤링 모듈(40)은 웹 데이터베이스 모듈(30)에 저장된 모든 데이터를 대상으로 통계분석을 수행하고 통계분석 결과에 기초하여 크롤링 코드를 작성한다. 구체적으로, 제2 웹 크롤링 모듈(40)은, 수정된 R², P값 등 통계적 지표 및 전제 사항(등분산성, 정규성, 독립성 등)에 따라 변수를 선정하고, 선정된 변수를 대상으로 크롤링 코드를 작성하여 최적 웹 크롤러를 생성한다. 변수는 예측하고자 하는 대상에 영향을 끼치는 다양한 인자들 중에서 전제사항에 따라 검토되며, 통계적 지표인 수정된 결정계수(coefficient of determination, R²), P값(probability value)에 따라 설정될 수 있다. 구체적으로, 수정된 R²은 높을수록, P 값은 0.05, 0.01, 0.10 등 유의수준 하에 있을 때 해당 인자가 변수로 설정될 가능성이 높을 수 있다. 예를 들어 경과년수, 세대당 CCTV 수, 세대당 주차대수 등이 변수로 설정될 수 있다. 이와 같이, 제2 웹 크롤링 모듈(40)은 통계분석 결과에 기초하여 선정된 변수 및 선정된 변수를 대상으로 작성한 크롤링 코드로 최적 웹 크롤러를 생성할 수 있다.
제1 웹 크롤링 모듈(10)의 주기적인 웹 크롤링을 통해 데이터가 지속적으로 업데이트 되는 점을 고려하여, 제2 웹 크롤링 모듈(40)도 웹 데이터베이스 모듈(30)에 저장된 데이터를 통계 분석하여 크롤링 코드를 지속적으로 갱신할 필요가 있다.
데이터 추출/전처리 모듈(50)은 웹 데이터베이스 모듈(20)에 저장된 데이터에 대상으로 최적 웹 크롤러를 이용하여 데이터를 추출하고, 추출된 데이터를 대상으로 데이터 전처리를 수행한다(S6). 데이터 전처리는 1) 이상값 처리, 2) 결측값 정리, 3) 데이터 변환 등을 포함하고, 이는 엑셀 매크로와 같은 범용적인 수단으로 구현될 수 있다. 데이터 변환은 표준화/정규화/이산화/단위 변환 등의 단계를 포함한다. 예를 들어, 'CCTV의 수'라는 데이터는 단지 전체의 CCTV수로서 분석을 위해서는 '세대당 CCTV 수'와 같은 방식으로 변수 단위 변경 등의 변환이 선행되어야 한다. 데이터 전처리는, 도 3A 내지 도 3D에 도시된 테이블에서 목록 별로 미리 그 방법을 선정하고, 엑셀 매크로로 구현될 수 있다.
예측/표시 모듈(60)은 전처리된 데이터에 기초하여 층별 실거래 가격, 단지별 관리비 등을 예측하고(S7), 예측한 결과에 기초한 분석 결과를 도출하며, 층별, 단지별 등으로 가시화할 수 있다. 이때, 예측/표시 모듈(60)은 3차원 공동주택 도시 지도를 통해 표시할 수 있다.
예를 들어, 예측/표시 모듈(60)은 전처리된 데이터에 대해서 자기회귀모형, 시계열 분석, 공간계량경제모형, 헤도닉 가격모형, 자산가격모형(CAPM), 충격반응 및 분산분해 분석, 벡타오차수정모형(VECM), 지리가중회귀모델 등의 분석을 수행하고, 분석 결과 중 오차율이 낮은 순서로 적어도 2개의 분석 방법을 선택한다. 예측/표시 모듈(60)은 선택된 적어도 2 개의 분석 방법에 의해 예측한 결과에 기초하여 층별 실거래 가격, 단지별 관리비 등을 예측한 분석 결과를 도출할 수 있다. 예측/표시 모듈(60)은 적어도 2 개의 분석 방법에 의해 예측한 결과를 통계적인 방법 예를 들어, 평균값, 대푯값, 중앙값 등으로 분석할 수 있다.
이때, 예측/표시 모듈(60)은 각 분석 방법에 대한 정확도, 정밀도, 및 실제값 재현율 중 적어도 하나를 고려하여 오차율을 산출할 수 있다. 정확도는 얼마나 정확하게 예측하는가에 대한 지표이고, 정밀도는 얼마나 정밀하게 예측하는가에 대한 지표이면, 실제값 재현율은 얼마나 실제값과 비슷하게 예측하는가에 대한 지표일 수 있다.
예측/표시 모듈(60)은 층별 실거래 가격, 단지별 관리비 등에 대한 예측 오차율을 산출하기 위해서, 수집된 단지의 데이터 중 소정 비율(예를 들어, 30%)의 데이터를 테스트 데이터로 활용하여 교차검증을 수행하여 실제값 재현율을 산출할 수 있다. 또한, 공동주택 준공에 따른 신규 데이터 발생 시 해당 단지의 데이터를 실제값 재현의 테스트 데이터로 사용할 수도 있다.
아울러, 예측/표시 모듈(60)은 예측된 층별 실거래 가격, 단지별 관리비 등에 기초하여 3차원 공동주택 도시 MAP을 구현한다(S8). 구체적으로, 예측/표시 모듈(60)은 도시 지형 마크업 언어(CityGML)로 예측된 층별 실거래 가격, 단지별 관리비 등을 코딩하여 상세도(Level of Detail, LoD) 3단계로 구현하고, 3D CityGML Viewer로 3차원으로 표시할 수 있다. 3차원 공동주택 도시 MAP을 구현하는 언어가 CityGML에 한정되는 것은 아니며, 동일한 기능의 다양한 언어가 사용될 수 있다.
이와 같이, 3차원 공동주택 도시 MAP을 제공함으로써, 사용자 입장의 편리성 제고 및 의사결정 지원이 가능한 효과가 발생한다.
일 실시예에 따른 도시 정보 제공 시스템 및 방법에 의해, XML 구문만으로 웹 데이터베이스가 구축되어, 데이터 저장 시스템이 경량화되고, 확장성이 개선되며, 저비용 및 저용량이 실현될 수 있다.
아울러, 단계별 웹 크롤링을 통해 데이터 수집의 효율성이 개선된다. 1단계 웹 크롤링은 자동/반복적으로 데이터 수집되어 데이터 업데이트가 용이하고, 1단계 웹 크롤링을 통해 수집된 데이터로 구축된 웹 데이터베이스에 대해서 2단계 웹 크롤링을 통해 데이터를 재수집하므로, 데이터 수집 및 분석에 있어 효율성이 개선되고, 분석 목적에 최적화된 시스템이 구축될 수 있다.
또한, 종래 도시 정보는 교통, 주거, 부동산, 에너지 등 광범위하고, 각 다른 공공기관에서 관리되어, 광범위한 데이터를 통합, 저장, 및 관리하는데 어려움이 있어왔다. 그러나, 일 실시예에 따르면, 이를 통합하여 웹 데이터베이스에 저장하고, 필요한 정보에 적합한 웹 크롤러를 생성하며, 이를 이용하여 데이터를 재수집할 수 있어, 업데이트 되는 데이터를 포함하는 광범위한 데이터를 통합, 저장, 및 관리하기가 용이하다. 또한, 분석 목적에 최적화된 데이터 수집이 가능하여 도시 정보를 보다 정확하게 예측할 수 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였으나, 본 발명의 권리범위가 이에 한정되는 것은 아니며 본 발명이 속하는 분야에서 통상의 지식을 가진 자가 여러 가지로 변형 및 개량한 형태 또한 본 발명의 권리범위에 속한다.
1: 도시 정보 분석 시스템
10: 데이터 수집 모듈
20: 제1 웹 크롤링 모듈
30: 웹 데이터베이스 모듈
40: 제2 웹 크롤링 모듈
50: 데이터 추출/전처리 모듈
60: 예측/표시 모듈
10: 데이터 수집 모듈
20: 제1 웹 크롤링 모듈
30: 웹 데이터베이스 모듈
40: 제2 웹 크롤링 모듈
50: 데이터 추출/전처리 모듈
60: 예측/표시 모듈
Claims (6)
- 획득된 온라인 데이터 및 내부 저장 데이터에 대한 인덱싱을 수행하고, XML 구문 기반의 웹 데이터베이스를 구축하여 저장하는 단계;
상기 웹 데이터베이스 대상으로 웹 크롤러를 생성하는 단계;
상기 웹 데이터베이스에 저장된 데이터를 대상으로 상기 웹 크롤러를 이용하여 데이터를 추출하고, 상기 추출된 데이터를 대상으로 데이터 전처리를 수행하는 단계;
상기 전처리된 데이터에 기초하여 적어도 층별 실거래 가격 및 단지별 관리비를 예측하여 분석 결과를 도출하는 단계; 및
상기 분석 결과에 기초하여 3차원 공동주택 도시 MAP을 구현하는 단계를 포함하고,
상기 웹 데이터베이스 대상으로 웹 크롤러를 생성하는 단계는,
상기 웹 데이터베이스에 저장된 모든 데이터를 대상으로 통계 분석을 수행하고, 수정된 결정계수(coefficient of determination, R²) 및 P 값을 포함하는 통계적 지표 및 전제사항에 따라 변수를 선정하며, 상기 선정된 변수를 대상으로 크롤링 코드를 작성하여 상기 웹 크롤러를 생성하는 단계를 포함하고,
상기 수정된 R²은 높을수록, 상기 P 값은 소정의 기준에 대해 유의수준 하에 있을 때의 해당 인자가 상기 변수로 선정될 가능성이 높은,
도시 정보 분석 방법. - 제1항에 있어서,
적어도 복수의 URL을 설정하는 단계;
상기 설정된 복수의 URL을 복수의 그룹으로 구분하고, 상기 복수의 URL 그룹 각각에 대해서 수집 타겟을 할당하는 단계; 및
상기 할당된 수집 타겟 별로 자동 및 반복적으로 웹 크롤링을 수행하여 상기 획득된 온라인 데이터를 추출하는 단계를 더 포함하는,
도시 정보 분석 방법. - 삭제
- 제1항에 있어서,
상기 전처리된 데이터에 기초하여 적어도 층별 실거래 가격 및 단지별 관리비를 예측하여 분석 결과를 도출하는 단계는,
복수의 분석 방법을 사용하여 상기 적어도 층별 실거래 가격 및 단지별 관리비를 예측하는 단계;
상기 복수의 분석 방법 각각의 예측 결과에 대한 오차율을 산출하는 단계;
상기 복수의 분석 방법 각각의 오차율 중 낮은 순서로 적어도 두 개의 분석 방법을 선택하는 단계; 및
상기 적어도 두 개의 분석 방법에 의해 예측한 결과에 기초하여 분석 결과를 도출하는 단계를 포함하는,
도시 정보 분석 방법. - 제1항에 있어서,
상기 분석 결과에 기초하여 3차원 공동주택 도시 MAP을 구현하는 단계는,
도시 지형 마크업 언어(CityGML)로 상기 예측된 적어도 층별 실거래 가격 및 단지별 관리비를 코딩하여 상세도(Level of Detail, LoD) 3단계로 구현하고, 3D CityGML Viewer로 3차원으로 표시하는 단계를 포함하는,
도시 정보 분석 방법. - 제1항, 제2항, 제4항, 및 제5항 중 어느 한 항에 있어서,
상기 단계들 중 대응하는 적어도 하나의 단계를 수행하기 위한 복수의 모듈을 포함하는 도시 정보 분석 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190117294A KR102278092B1 (ko) | 2019-09-24 | 2019-09-24 | 도시 정보 분석 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190117294A KR102278092B1 (ko) | 2019-09-24 | 2019-09-24 | 도시 정보 분석 방법 및 시스템 |
Publications (3)
Publication Number | Publication Date |
---|---|
KR20210035469A KR20210035469A (ko) | 2021-04-01 |
KR102278092B1 true KR102278092B1 (ko) | 2021-07-14 |
KR102278092B9 KR102278092B9 (ko) | 2024-03-15 |
Family
ID=75441351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190117294A KR102278092B1 (ko) | 2019-09-24 | 2019-09-24 | 도시 정보 분석 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102278092B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102692040B1 (ko) * | 2021-10-14 | 2024-08-07 | (주)이지스 | 3차원 가상 모델을 활용한 시설물 모니터링 방법 및 시스템 |
CN114625983B (zh) * | 2022-03-28 | 2023-08-15 | 北京有竹居网络技术有限公司 | 房源信息展示方法和装置、电子设备和可读存储介质 |
KR102456302B1 (ko) * | 2022-05-25 | 2022-10-19 | (주)올포랜드 | 3D 기하 객체 정보를 이용한 CityGML 기반의 빌딩 객체 정보 생성 방법, 빌딩 객체 정보 생성 시스템, 이를 위한 컴퓨터 프로그램 |
CN116756263B (zh) * | 2023-08-18 | 2023-11-14 | 中国标准化研究院 | 一种基于地理信息数据对城镇化大数据进行处理的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101791054B1 (ko) * | 2017-03-02 | 2017-10-27 | 주식회사 호갱노노 | 가격 변동량 디스플레이 방법 및 그 장치 |
KR101860565B1 (ko) | 2017-08-11 | 2018-07-05 | 주식회사 라운더스 | 온라인에서 부동산 권리관계 정보를 수집 및 분석하는 부동산 빅데이터 분석방법 |
KR101875698B1 (ko) | 2017-01-31 | 2018-08-02 | 송희종 | 부동산 토탈 거래 서비스 제공 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090089745A (ko) * | 2008-02-19 | 2009-08-24 | 엔에이치엔비즈니스플랫폼 주식회사 | 진성 확인된 중개사의 부동산 거래 정보를 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
KR20150068898A (ko) * | 2014-11-10 | 2015-06-22 | 주식회사 디지털 태인 | 부동산 정보 제공 시스템 및 방법 |
KR20190093757A (ko) * | 2018-01-11 | 2019-08-12 | 주식회사 와이즈인컴퍼니 | 여론 및 설문조사 데이터 분석 및 레포팅 시스템 |
-
2019
- 2019-09-24 KR KR1020190117294A patent/KR102278092B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101875698B1 (ko) | 2017-01-31 | 2018-08-02 | 송희종 | 부동산 토탈 거래 서비스 제공 방법 |
KR101791054B1 (ko) * | 2017-03-02 | 2017-10-27 | 주식회사 호갱노노 | 가격 변동량 디스플레이 방법 및 그 장치 |
KR101860565B1 (ko) | 2017-08-11 | 2018-07-05 | 주식회사 라운더스 | 온라인에서 부동산 권리관계 정보를 수집 및 분석하는 부동산 빅데이터 분석방법 |
Non-Patent Citations (3)
Title |
---|
류정림 추승연, 공간자료 구축을 위한 BIM/GIS 표준정보 기반건축도시통합모델(iBUM)의 개발에 관한 기초연구, Journal of Korea Spatial Information Society Vol.22, No.5, 2014.10. 1부.* |
석민수, 아파트관리비 부정도 빅데이터로 잡아낸다. 매일경제 신문기사, 2016.01.24. 1부.* |
크레파스, 웹 데이터베이스와 XML, 네이버 블로그, 2009.04.13. URL: https://m.blog.naver.com/sharon0a/110045868914. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
KR102278092B9 (ko) | 2024-03-15 |
KR20210035469A (ko) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102278092B1 (ko) | 도시 정보 분석 방법 및 시스템 | |
Jalaei et al. | An integrated BIM-LEED application to automate sustainable design assessment framework at the conceptual stage of building projects | |
Roohi et al. | Implication of building inventory accuracy on physical and socio-economic resilience metrics for informed decision-making in natural hazards | |
Monteiro et al. | An urban building database (UBD) supporting a smart city information system | |
Lantada et al. | Vulnerability index and capacity spectrum based methods for urban seismic risk evaluation. A comparison | |
Vaz et al. | Crowdsourced mapping of land use in urban dense environments: An assessment of Toronto | |
KR102290132B1 (ko) | 부동산 가격 예측 장치 및 방법 | |
CN112183916B (zh) | 土地储备生命周期管理系统 | |
D'Urso et al. | Multicriteria fuzzy analysis for a GIS‐based management of earthquake scenarios | |
Bruno et al. | Location and GIS | |
KR20200006501A (ko) | Gis 기반 토지 이용 계획 검토 시스템 및 방법 | |
Dell’Anna | What advantages do adaptive industrial heritage reuse processes provide? An econometric model for estimating the impact on the surrounding residential housing market | |
Wang et al. | Simulating the effect of urban light rail transit on urban development by coupling cellular automata and conjugate gradients | |
Dabirian et al. | Structuring heterogeneous urban data: A framework to develop the data model for energy simulation of cities | |
Bajat et al. | Spatial hedonic modeling of housing prices using auxiliary maps | |
KR20190041439A (ko) | 데이터 오류 수정 기능을 갖는 주택 가격 추정을 위한 빅데이터 구축 시스템 | |
Hudson | Urban Characterisation; Expanding Applications for, and New Approaches to Building Attribute Data Capture | |
Lee et al. | Machine learning based prediction of the value of buildings | |
Pawar et al. | Analysis of Residential Location Choices of Different Socio-Economic Groups and Their Impact on the Density in a City Using Agent Based Modelling | |
Torres et al. | Using remote sensing for exposure and seismic vulnerability evaluation: is it reliable? | |
Gasbarri et al. | Optimized data connection for a BIM-GIS based university asset management system | |
Blinn et al. | How to Grow?-Modeling Land Use Change to Develop Sustainable Pathways for Settlement Growth in the Hinterland of Cologne, Germany | |
Bibi et al. | Geo-Smart City Applications | |
Nichersu | Scale aware modeling and monitoring of the urban energy chain | |
Balasooriya et al. | Location Intelligence Based Smart E-Commerce Platform for Residential Real-Estate Industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
G170 | Re-publication after modification of scope of protection [patent] |