KR20210063005A - 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법 - Google Patents

정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법 Download PDF

Info

Publication number
KR20210063005A
KR20210063005A KR1020190151371A KR20190151371A KR20210063005A KR 20210063005 A KR20210063005 A KR 20210063005A KR 1020190151371 A KR1020190151371 A KR 1020190151371A KR 20190151371 A KR20190151371 A KR 20190151371A KR 20210063005 A KR20210063005 A KR 20210063005A
Authority
KR
South Korea
Prior art keywords
real estate
event
estate price
change
events
Prior art date
Application number
KR1020190151371A
Other languages
English (en)
Other versions
KR102423530B1 (ko
Inventor
권우영
이호경
김현민
Original Assignee
주식회사 와이즈넛
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 와이즈넛 filed Critical 주식회사 와이즈넛
Priority to KR1020190151371A priority Critical patent/KR102423530B1/ko
Publication of KR20210063005A publication Critical patent/KR20210063005A/ko
Application granted granted Critical
Publication of KR102423530B1 publication Critical patent/KR102423530B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 부동산 가격 변동을 예측하는 방법에 관합니다.
본 발명은 부동산 시장의 가격변동을 예측하기 위해 텍스트로 구성된 비정형 데이터와 수치로 구성된 통계 데이터들로부터 이벤트를 추출하고 정제하여 이벤트들 간의 인과관계와 시간관계를 추론하는 방법을 제안합니다. 본 발명에 의하면, 비정형 데이터인 텍스트 데이터와 정형데이터인 수치데이터를 함께 사용하여 부동산 가격예측을 합니다. 또한, 부동산 가격변동에 대한 간접요인들을 사전에 파악하여 미래의 부동산가격의 변동과 불확실성의 정도를 예측할 수 있도록 하는 특징이 있습니다.

Description

정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법{PREDICTION METHOD OF PRICE CHANGING IN REAL ESTATE MARKET USING TEMPORAL CAUSAL MODELING}
본 발명은 부동산 시장의 가격변동을 예측하는 기술에 관한다.
부동산 시장에 대한 사회적 관심이 높고 그것이 사회에 미치는 영향력이 크기 때문에 이에 대한 정확한 예측이 요구된다. 그러나 부동산 시장의 불확실성이라는 장벽이 언제나 문제이다. 부동산의 시장 가격은 다양한 요인들에 의해 영향을 받기 때문에 그 예측이 쉽지 않다. 특히 장기적인 관점에서의 예측은 더욱 어렵다. 우선 주가, 환율, 금리 등의 관련 지수의 영향을 많이 받기도 하지만, 사람들의 주관적인 심리와 감성 등에 의해서도 영향을 많이 받으며, 정부정책의 변화 등 일시적 이벤트도 부동산 시장 변화에 큰 변수로 작용하기 때문이다.
한편, 최근 IT 기술의 발달에 따라 뉴스, 소셜 네트워크, 블로그 등의 온라인 텍스트 데이터를 이용해 부동산 시장에 미치는 영향을 분석하는 기술이 도입되고 있다. 중-장기적인 관점에서는 심리동향을 텍스트 분석을 이용해 예측하는 필요성이 있으며, 금리, 환율, 주가지수, 임금 등의 통계지표 역시 부동산 가격변동의 주요 요인이 된다. 재건축, 대출규제, 세제개편 등의 일시적 이벤트는 부동산 가격에 직접적이고 강한 영향을 준다. 부동산 가격에 미치는 다양한 원인과 가격과의 관계를 이용해 예측모델을 만드는 연구가 시도되고 있는 것으로 알려졌으나, 아직 신뢰할 만한 수준으로 발전하지는 못하고 있다.
우리가 분석하기로는, 부동산 가격변동에 영향을 주는 요인은 즉시 그 효과가 나타나는 게 아니라 일정시간 지연된 뒤에 그 효과가 나타나는 것으로 판단되었다. 또한 복수의 요인들이 중첩돼서 나타나기 때문에 그 요인들의 독립된 영향력 분석이 쉽지 않다.
본 발명의 발명자들은 위와 같은 부동산 가격 변동의 다양한 원인과 결과들 사이에 적용되는 시간 지연, 영향의 정도, 중첩성, 불확실성 등을 고려하여 객관적으로 예측하는 방법을 찾기 위해 고심하면서 노력했다. 그런 노력의 일환으로 과학기술정보통신부의 국가연구개발사업에 참여하여 (과제고유번호: 1711094783) 연구 개발을 지속한 끝에 그 성과로서 본 발명을 완성하기에 이르렀다.
그리고, 부동산 가격변동에 영향을 주는 요인은 즉시 그 효과가 나타나는 게 아니라 일정시간 지연된 뒤에 그 효과가 나타나며 복수의 요인들이 중첩되서 나타나기 때문에 영향의 분석이 쉽지 않다. 따라서 부동산 가격변동의 원인과 결과 사이의 시간지연과 영향의 정도, 불확실성을 고려하여 예측하는 방법이 필요하다.
먼저 본 발명의 발명자들은 정확한 부동산 시장을 분석하기 위해서는 온라인을 통해 수집되는 텍스트 데이터를 정형분석으로 하거나 혹은 비정형 데이터 분석으로 나뉘어서 연구돼서는 안 된다고 판단했다. 그러면서 비정형 텍스트 데이터와, 수치형 정형데이터, 그리고 텍스트 정형데이터를 이용해 언제 어떤 활동이 이루어졌는지를 표현하는 이벤트를 추출하고 이벤트들 간의 인과관계와 시간관계를 확률모델로 모델링하는 방법론을 모색했다. 그러므로 본 발명의 목적은 인과관계와 시간관계를 모델링하여 만들어진 확률모델을 이용하여 현재시점에서 관측된 이벤트들을 근거로 하여 미래의 부동산 가격변동을 예측하는 방법론을 제시하는 데 있다.
한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 것이다.
위와 같은 과제를 달성하기 위해 본 발명은 분동산 가격을 예측하는 방법으로서, 부동산 가격변동 예측 서버가:
데이터 저장소에서 텍스트 비정형 이벤트, 시계열 수치형 데이터 이벤트 및 정형 데이터 이벤트를 추출하고,
추출된 이벤트들을 목적 변수인 부동산 가격에 미치는 영향력에 따라 1차 요인, 2차 요인, 3차 요인으로 분류하되, 대출 규제 항목, 기준금리 변동 항목, 신규분양 항목을 포함하는 상기 1차 요인에는 간접 요인 항목을 구성하여 상기 2차 요인을 해당하는 항목은 상기1차 요인의 상기 간접 요인 항목에 포함되도록 계층적으로 분류하고, 상기 3차 요인에 해당하는 항목은 상기 2차 요인에 해당하는 항목에 포함되도록 계층적으로 분류하고,
상기 1차 요인에 포함되는 항목으로 해당 이벤트의 변화량을 표현하는 이산확률변수와 해당 이벤트가 발생하거나 관측된 시간을 표현하는 연속확률변수의 복합확률변수로 부동산 가격 변동 예측모듈을 생성하고,
관측된 이벤트들과 상기 예측모듈을 이용하여 미래의 부동산 가격변동을 추론하는 단계를 포함하는 것을 특징으로 한다.
또한 본 발명의 바람직한 어느 실시예에 따른 부동산 가격 변동을 예측하는 방법에 있어서, 상기 텍스트 비정형 이벤트는, 텍스트 데이터 저장소에 저장된 문서의 부동산에 관련된 이벤트 문장에서 특정 주제에 대한 내용을 미리 정한 구조로 구조화하여 추출되도록 하는 것이 좋다.
또한 본 발명의 바람직한 어느 실시예에 따른 부동산 가격 변동을 예측하는 방법에 있어서, 상기 시계열 수치형 데이터 이벤트는, 부동산/경제 통계에 관한 시계열 데이터 저장소에서 수치형 데이터의 시간당 변화량을 복수 단계로 양자화하여 시계열 이벤트로 추출되도록 하는 것이 좋다.
또한 본 발명의 바람직한 어느 실시예에 따른 부동산 가격 변동을 예측하는 방법에 있어서, 상기 예측모델에서 이벤트의 변화량을 표현하는 상기 이상확률변수는 대폭상승, 소폭상승, 소폭하락, 대폭하락 중 어느 하나의 값이 부여되는 것이 좋다.
또한, 본 발명의 바람직한 어느 실시예에 따른 부동산 가격 변동을 예측하는 방법에 있어서, 상기 미래의 부동산 가격변동을 추론하는 단계에서, 부동산 가격변동의 정도와 시점을 의미하는 타깃 이벤트는 다음 수식으로 정의되며,
Figure pat00001
(여기서, Q은 타깃 이벤트, E은 관측된 이벤트({e1, e2, … en}) H는 관측되지 않은 이벤트({H1, H2, … Hn}, qi은 타깃 이벤트의 종류로 부동산 가격의 대폭상승, 소폭상승, 변동없음, 소폭하락, 대폭하락 중 한 가지로 정해지는 값)
상기 수식을 다음 수식으로 변환하여 미래의 부동산 가격변동에 대해 확률추론을 실시하는 것이 좋다.
Figure pat00002
본 발명에 따르면 부동산과 관련한 심리를 포함하는 비정형 텍스트 데이터와 정형 수치 데이터, 정형 텍스트 데이터를 분석하고 모델링하여 부동산 가격변동에 영향을 주는 요인들 간의 인과관계와 시간관계를 추론할 수 있다. 또한 알려진 요인들로부터 미래의 부동산 가격변동을 높은 신뢰도로 미리 예측할 수 있다.
결과적으로 본 발명은 부동산 시장의 불확실성에 따른 사회적 비용을 경감하는 데 기여할 수 있다. 그러므로 부동산 리스크를 효율적으로 관리할 수 있음은 물론이다.
한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.
도 1은 본 발명의 바람직한 어느 실시예에 따른 부동산 가격 변동 예측 시스템의 개략적인 구성 예를 나타낸다.
도 2는 본 발명의 바람직한 어느 실시예에 있어서 비정형 텍스트 데이터에서 이벤트를 추출하는 과정을 개략적으로 나타낸다.
도 3은 본 발명의 바람직한 어느 실시예에 있어서 시계열적인 수치 데이터에서 이벤트를 추출하는 과정을 개략적으로 나타낸다.
도 4는 본 발명에 따라 대출규제 이벤트와 금리변동 이벤트가 확률변수로 부동산 가격에 어떻게 미치는지를 개념적으로 설명하기 위해 제시한 도면이다.
도 5는 도 4에서 대출규제 이벤트와 금리변동 이벤트 두 요인과 부동산가격 변동과의 시간차이를 가우시안 분포로 나태는 그림이다.
도 6은 본 발명의 바람직한 어느 실시예에 따른 세 가지 이벤트 요인의 계층적인 분류 구조를 나타낸다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다.
이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다. 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
도 1은 본 발명의 바람직한 어느 실시예에 따른 부동산 가격변동 예측 시스템을 개략적으로 나타낸 그림이다.
도 1의 본 발명의 부동산 가격변동 예측 시스템의 구성 및 프로세스는 부동산 가격변동 예측 서버(미도시)에 구축된다. 부동산 가격변동 예측 서버는 하나 이상의 하드웨어/소프트웨어 장비로 구성되며, 통신망을 통해 시스템 외부 또는 내부에 위치하는 데이터베이스에 기록되어 있는 데이터를 수집하고, 수집된 데이터를 분석하고 처리한다.
부동산 가격변동 예측 서버는 부동산 가격변동 예측기(100)를 통해 관측된 부동산 관련 이벤트(99)를 이용하여 미래의 부동산 가격변동의 예측 결과(101)를 출력한다. 결과적으로 언제, 어느 정도의 가격변동이 있을지 신뢰할 만한 데이터를 예측 결과로 출력하는지에 본 발명의 주된 과제해결원리가 놓인다. 그러므로 이를 위하여 본 발명의 부동산 가격변동 예측 서버는 우선 관측된 부동산 관련 이벤트(99)를 효과적으로 수집하고 분석하기 위해서 세 가지 데이터베이스를 수집 대상으로 특정하였다.
첫째 비정형 텍스트에 관한 데이터베이스(1)이다. 이 데이터베이스(1)는 텍스트 데이터 저장소이며 부동산 관련한 뉴스, 보고서, 보도자료, SNS 텍스트 등의 비정형 텍스트를 저장한다. 둘째 시계열 데이터를 저장한 데이터베이스(2)이다. 이 데이터베이스는 시계열 데이터 저장소이며, 시계열적인 데이터 특성을 갖는 부동산 관련 통계, 경제관련 통계, 예컨대 주가지수, 금리, 부동산 지수 등의 수치형 데이터를 저장한다. 셋째, 정형 데이터를 저장하는 데이터베이스(3)이다. 이 데이터베이스(3)는 부동산 정책, 기준금리 변동, 세제개편, 대출 규제 등의 정형 데이터를 저장하는 저장소이다.
또한, 본 발명의 부동산 가격변동 예측 서버는 부동산 가격변동 예측기(100), 부동산 가격변동 예측모델 학습기(50), 이벤트 요인 중요도 분석 모듈(40)을 포함한다. 또한 복수의 데이터 이벤트 추출기(10, 20, 30)가 상기 세 가지 데이터베이스(1, 2, 3)에 저장되어 있는 데이터 이벤트를 추출한다.
도시되어 있는 바와 같이, 본 발명의 부동산 가격변동 예측 서버는 텍스트, 시계열, 정형 데이터로부터 이벤트를 추출하는 단계와, 이벤트의 요인들의 중요도를 분석하는 단계와, 부동산 가격변동 예측모델을 학습하는 단계와, 관측된 부동산 관련 이벤트들을 이용하여 미래의 부동산 가격변동을 예측하는 단계를 각각 실행한다.
먼저 텍스트 비정형 이벤트 추출기(10)는 비정형 텍스트에 관한 데이터베이스(1)에 저장된 문서의 부동산에 관련된 이벤트 문장에서 특정 주제에 대한 내용을 미리 정한 구조로 구조화하여 텍스트 비정형 이벤트를 추출한다.
즉, 이 단계에서는, 뉴스, 보고서, 보도자료, SNS 댓글 등의 부동산 관련 심리를 표현하는 텍스트 문서로부터 특정 주제에 대한 구체적인 내용을 담고 있는 이벤트 문장으로부터 이벤트를 추출한다. 여기에서 말하는 "이벤트 문장"이란 특정 주제에 대한 구체적인 내용, 즉, 누가, 어디서, 언제, 무엇이, 어떠하다 등이 표현된 문장을 의미한다. 예를 들어, 다음과 같은 이벤트 문장이 있다.
“국토교통부는 10월 10일 고가주택을 보유한 1주택자(등기 전 잔금대출을 받은 경우 포함)에 대하여 전세대출 공적보증 제한을 시행하기로 했다. ”
이경우 시간은 2019년 10월 10일, 값은 true(시행) 타입은 전세자금대출제한, 위치는 수도권, 고가주택 1주택보유자 가격이 된다.
도 2는 텍스트 비정형 이벤트 추출기(10)가 비정형 이벤트를 추출하는 위와 같은 과정을 개략적으로 나타내었다. 데이터베이스(1)에 저장되어 있는 부동산 관련 텍스트(11)에서 주요 엔티티를 추출한다(S13). 엔티티는 주요 정보를 담고 있는 단어 또는 텍스트 패턴을 뜻한다. 위에서 제시한 예시 문장의 경우, 국토교통부, 10월 10일, 고가주택, 1주택자, 전세대출 공적보증 제한 등의 단어, 패턴, 구를 추출하는 것이다. 다음으로 해당 텍스트에서 날짜와 출처 등의 메타정보를 추출한다(S14). 한편, 이 메타정보를 이용하여 문서를 분류한다(S15). 문서를 분류해 두면 문서의 종류와 출처를 확인해서 적합한 분야의 텍스트만을 대상으로 이벤트를 추출할 수 있는 장점이 있다. 예컨대 문서 분류 결과가 금융, 부동산 카테고리에 해당되는 문서만을 이벤트 추출 대상으로 설정하는 방식이다.
다음으로 상기 엔티티와 문서의 메타정보를 이용하여 텍스트 비정형 이벤트를 추출할 수 있다(S16). 도 2의 추출된 텍스트 비정형 이벤트(19)에 예시되어 있는 것처럼, 추출되는 이벤트(19)는 필수 요소와 선택 요소로 구성될 수 있다. 필수 요소는 이벤트를 구분하기 위한 타입, 시간, 값이며, 이벤트를 이용해 추론하기 위해 활용된다. 선택 요소는 문장에서 명시적 또는 묵시적으로 파악 가능한 정보로서 주체, 위치, 대상이 있다. 주체는 누가 이 문장의 행위를 했는지, 위치는 대상위치가 어디인지, 대상은 행위의 대상이 누구 또는 무엇인지를 나타낸다.
다음으로 시계열 수치 데이터 이벤트 추출기(20)는 데이터베이스(2)에서 시계열적인 이벤트를 추출한다. 전술한 바와 같이, 주가지수, 부동산 지수, 금리 등의 수치형 데이터이며, 시간 속성을 갖는 시계열 데이터이다.
시계열 이벤트 추출 과정은 도 3에서 개략적으로 나타내었다. 시계열 데이터(22)로부터 시간당 변화량을 측정하는 단계(S23), 복수단계로 양자화하는 단계(S24)를 포함한다.
예를 들어 2년간 CD금리의 시계열 데이터를 입력 데이터로 했을 때, S23 단계에서는 데이터의 시간당 변화량을 측정한다. 본 발명의 어느 실시예에서는 월별 변동량을 사용할 수 있다. 본 발명의 다른 실시예에서는 변화량을 측정하는 기준 시간을 필요에 따라 다르게 설정할 수 있으며, 예컨대 3개월이나 주별 변동량으로 기준 시간을 사용할 수 있다.
한편 S24 단계에서 본 발명의 바람직한 어느 실시예에서는 전단계에서 측정된 시간당 변화량을 대폭상승, 소폭상승, 변화없음, 소폭하락, 대폭하락의 5단계로 구분하는 양자화를 수행한다. 또한, 시계열 데이터에서 메타정보(날짜와 출처 등)를 추출하고(S27). 이 메타정보와 양자화된 변화량을 이용해서 시계열 이벤트(29)를 추출한다(S25).
정형 이벤트 추출기(30)는 데이터베이스(3)에 보관되어 있는 정형 데이터를 이용한다. 쉽게 말해서 정형 이벤트를 추출하는 프로세스는 전문가에 의해 분석이 끝난 주요 이벤트들을 저장한 데이터베이스로부터 이벤트를 추출하는 과정이다. 예컨대 택지 분양이나 재개발 같은 중요한 공시 내용의 경우 사전에 정형 데이터로 저장하고 있다가 학습시 데이터베이스에서 추출한다.
위와 같은 과정을 통해서 세 가지 서로 다른 경로의 이벤트 추출이 종료되면, 이벤트 요인 중요도 분석기(40)가 각 이벤트가 부동산 가격변동에 미치는 영향력을 평가하여 복수로 분류한다.
바람직하게는 부동산 가격변동에 미치는 영향력에 따라 추출된 이벤트들을 1차, 2차, 3차 요인으로 분류한다. 부동산 정책이나 대출규제, 재개발 같은 중요하고 직접적인 영향을 주는 이벤트들은 1차요인으로 분류한다. 주가변동이나 선거, 글로벌 금융이벤트등 요인이 부동산 가격변동에 영향을 주기는 하지만 그 영향력이 실제로 현실화되기까지 시간이 소요되거나 간접적인 영향을 주는 정도에 불과한 이벤트는 2차 요인으로 한다. 그리고 장기적이고 간접적인 영향을 주는 요인을 분류되는 이벤트들은 3차 요인으로 구성한다. 예컨대 SNS나 포털의 댓글, 뉴스 동향 등 경제심리에 관한 요인으로 구성한다.
이들 1차 요인, 2차 요인, 3차 용인은 계층적으로 구성되는데 이에 대해서는 밑에서 다시 살펴보기로 한다.
다음으로 부동산 가격변동 예측모델 학습기(50)가 이벤트 요인 중요도 분석단계에서 구분된 이벤트들을 입력변수로, 부동산 가격지수를 출력변수로 한 예측모델을 생성하여 이를 학습한다. 수집된 이벤트 데이터의 인과관계 및 시간관계의 확률 분포를 제공되는 확률모델을 이용해 학습한다. 아래 그림에서 학습 모델에 대한 개념과 예시를 설명한다. 입력변수와 출력변수, 모두 확률변수로 표시된다.
도 4는 1차 요인으로 분류된 대출규제 요인(111)과 금리변동 요인(112)이 본 발명에 따라 어떻게 부동산 가격(199)에 영향을 미치는지를 개념적으로 예시한다.
대출 규제 이벤트를 표현하는 확률변수를 R, 금리변동을 표현하는 확률변수를 I, 부동산 가격을 표현하는 확률변수를 H라고 정의한다. 여기서 각 변수는 이벤트의 값과 시간을 표현하는 복합 확률변수로서, R = {R, T R } 과 같이 표현된다. 여기서 R은 이산확률변수이다. 바람직하게는 대출규제의 변화를 4단계로 표현하는데, 대폭상승, 소폭상승, 소폭하락, 대폭하락 중 1개의 값을 갖는다. T R 은 대출규제 이벤트가 발생하거나 관측된 시간을 표현하는 연속확률변수이다.
같은 방식으로 금리변동 I가 표현된다. 즉, I = {I, T I } 와 같이 이산확률변수인 I와 연속확률변수인 T I 의 복합 확률변수로 표현되는 것이다. 여기서 I는 금리변동의 변화를 대출규제의 변화와 마찬가지로 4단계로 표현하는데, 대폭상승, 소폭상승, 소폭하락, 대폭하락 중 1개의 값으로 표현될 수 있다. T I 는 금리변동 이벤트가 발생하거나 관측된 시간을 표현하는 연속확률변수이다.
마찬가지로 부동산 가격 H는, H = {H,T H }으로 표현된다. H의 경우 변동없음을 포함한 5단계 값을 가질 수 있다.
대출규제, 금리변동 및 부동산 가격변동간의 인과관계와 시간관계는 아래 식 1의 수식으로 표현될 수 있다.
Figure pat00003
(식 1)
여기서 f HR (tH-tR) 은 대출규제 이벤트가 발생하고 나서 부동산가격이 변동하는 시간을 표현하는 연속확률 분포함수이다. 마찬가지로 f HI (tH-tI) 는 금리변동과 부동산가격 변동 사이에 걸리는 시간을 표현하는 연속확률 분포함수이다. w1과 w2는 대출규제와 금리변동의 두 원인 중에 어느 쪽의 시간표현 가중치가 높은지를 표현하는 상수이다.
P(H|R, I)는 금리변동, 대출규제 이벤트 값에 따라 부동산 가격이 어떻게 변동하는지에 대한 확률을 표현하는 조건부 확률표현이다. 이산확률분포로서 아래 표 1과 같이 테이블로 나타낼 수 있다.
대출규제 금리변동 부동산가격변동 확률
대폭상승 대폭상승 대폭상승 0.11
대폭상승 대폭상승 소폭상승 0.15
대폭상승 대폭상승 변동없음 0.2
대폭상승 대폭상승 소폭하락 0.5
대폭하락 대폭하락 소폭하락 0.2
대폭하락 대폭하락 대폭하락 0.01
수치형 데이터의 경우 각 이벤트가 가질 수 있는 경우의 수는 경우, 바람직한 실시예에서는 대폭상승, 소폭상승, 소폭하락, 대폭하락 등으로 주로 표현되었지만 이벤트의 특성에 따라 다르게 정의될 수도 있다. 또한, 텍스트 이벤트는 각 이벤트의 특성에 따라 다르게 정의된다.
한편, 위와 같은 표 1의 내용과 확률분포함수를 이용하여 금리의 인상폭 및 인상시기가 주어졌을 때 어떤 폭으로 얼마만큼 부동산가격에 변동이 생길지를 추론할 수 있다. 부동산가격변동과 두 요인 간의 영향을 주는 시간 차이는 가우시안 분포를 사용했을 때 도 5와 같이 표현된다. x축은 시간, y축은 확률이다.
전술한 바와 같이, tH-tR은 대출규제 이벤트와 부동산 가격변동의 시간차를 나타낸다. tH-tI는 금리변동 이벤트와 부동산 가격 간의 시간차를 뜻한다.
시간 차이를 표현하는 확률분포함수는 아래의 식 2의 수식으로 표현된다.
Figure pat00004
(식 2)
여기서
Figure pat00005
은 두 이벤트 간 지연 시간의 평균을 표현하는 상수이며
Figure pat00006
은 지연시간 분포의 표준편차를 나타낸다.
이 관계를 일반화하면 목적 변수 X와 다수의 요인 U 1, U 2, … U N간의 관계는 아래의 식 3의 수식으로 표현될 수 있다.
Figure pat00007
(식 3)
위와 같은 설명을 통해, 우리는 부동산 가격의 변동을 예측함에 있어 시간관계를 고려한 확률변수로 목적 변수인 부동산 가격을 모델링할 수 있음을 알게 되었다. 그러면 본 발명에서 인과관계는 어떻게 고려되는가?
도 6은 본 발명의 바람직한 어느 실시예에 있어서 추출된 이벤트들의 인과관계를 계층적으로 모델링한 분류를 예시한다.
이벤트 요인분석단계에서 1차, 2차, 3차요인으로 분석한 이벤트들의 인과관계를 이용하여 예측모델의 구조를 결정한다. 그 예시는 아래와 같다.
추출된 이벤트들을 목적 변수인 부동산 가격에 미치는 영향력에 따라 1차 요인(110), 2차 요인(120), 3차 요인(130)으로 분류하되, 1차 요인(110)에 포함된 항목만이 부동산 가격에 직접 연결되도록 하고, 2차 요인(120)에 포함된 항목들은 간접적으로 연결되도록 계층적인 구조로 분류 관계를 생성한다.
이를 다시 설명하면, 부동산 가격변화(Ma)에 영향을 주는 정도와 시간 차이를 기준으로 따라 1차 요인(110), 2차 요인(120), 3차 요인(130)으로 각각 분류하는 것이다. 부동산 가격에 직접적인 영향을 주는 요인, 즉 대출 규제 이벤트 항목(Lo), 금리 변동 이벤트 항목(In), 신규 분양 이벤트 항목(Ns), 신도시 개발 이벤트 항목(Nt)은 1차 요인(110)으로 분류된다. 한편, 계층적인 분류 구조를 위해 1차 요인(110)에 간접 요인 항목(Id)를 포함시킨다. 그런 다음 2차 요인(120)에 포함된 항목은 상기 간접 요인 항목(Id)을 통해서 부동산 가격변화(Ma)에 영향을 미치도록 구조화한다.
2차 요인(120)에는 주가변동 항목(St), 선거 항목(El), 전월세 등락 항목(Re), 인구이동 항목(Pe), 기관 이전 항목(Or)가 포함될 수 있다. 부동산 가격변동(Ma)에 영향을 주는데 시간이 소요되거나 간접적인 영향을 주는 요인이라는 특성이 있다.
3차요인(130)으로는 부동산 보고서 항목(Es), 부동산 뉴스 항목(Ne), 경제 뉴스 항목(Ec), SNS/포털댓글 항목(Sn), 임금변동 항목(Sa), 교육정책 변화 홍목(Ed) 등이 포함될 수 있다. 부동산 가격변동(Ma)에 장기적이고 간접적인 영향을 주는 요인이라거나 경제심리에 관한 요인이라는 특성이 있다.
도면에서 겹선으로 표시된 타원은 이상에서 설명한 요인이 되는 이벤트를 의미한다. 화살표는 인과관계를 의미한다. 1차 요인(110)은 부동산 가격변화에 직접 연결되며 2차 요인(120) 및 3차 요인(130)은 다른 요인들에 연결되어 간접적으로 영향을 미친다.
이처럼 본 발명에 따르면 수집된 데이터로부터 이벤트를 추출하고, 각 이벤트들과 목적변수인 부동산 가격변화들을 분석하여 그 빈도와 시간간격을 함께 활용함으로써 확률분포와 시간분포를 학습하여 위와 같은 수식들과 인관관계에 의해 예측모델을 생성하였다. 생성된 예측모델은 부동산 가격변동 예측모델 데이터베이스(60)에 저장된다.
마지막으로 부동산 가격변동 예측기(100)가 관측된 부동산 관련 이벤트들과 생성된 예측모델을 이용하여 미래의 부동산 가격변동을 예측한다.
가격변동 예측에는 확률 추론을 이용하며 가격변화의 정도가, 언제, 어느 정도로, 이루어질지를 예측한다.
예측을 위해서는 전체 이벤트를 모두 관측 이벤트, 미관측 이벤트, 타깃 이벤트의 3개의 그룹으로 구분한다.
타깃 이벤트는 예측 대상이 되는 이벤트이다. 본 발명에서는 부동산 가격변화의 정도와 시점을 의미한다.
관측 이벤트는 예측 시점에서 관측된 이벤트를 의미한다. 타깃 이벤트와 미관측 이벤트를 제외한 이벤트이며 관측되지 않았지만 미래에 발생할 것으로 예측되는 이벤트이다.
관측된 이벤트를 E = {e 1, e 2, … e n}, 관측되지 않은 이벤트를 H = {H 1, H 2, … H n}, 타깃 이벤트를 Q라고 할 때 타깃 이벤트의 추론은 다음 식 4의 수식으로 정의된다.
Figure pat00008
(식 4)
모든 이벤트를 구성하는 확률변수는 이산변수와 연속변수로 구성되기 때문에, 식 5와 같이, 더하기와 적분이 혼합된 형태의 식으로 확률추론이 이루어진다.
Figure pat00009
(식 5)
위와 같은 수식으로, 타깃 이벤트의 종류 qi와 타깃 이벤트의 시간분포 TQ에 대한 확률분포의 추론이 가능하다.
여기서 qi는 부동산가격의 대폭상승, 소폭상승, 변동없음, 소폭하락, 대폭하락 중 한가지를 의미한다. 시간분포 TQ는 기준시간으로부터 지연된 시간을 의미한다. tE는 관측된 이벤트들의 시간이다. tH는 관측되지 않은 이벤트들의 시간을 표현한다. 예컨대 금리인상이 2019년 9월 1일에 발표되었다면 그 시간이 tE의 변수가 되겠고, 부동산 대출규제 정책발표가 곧 임박할 것으로 판단되지만 아직 발표가 되지 않았다면 그 시간이 관측되지 않은 이벤트의 시간으로 볼 수 있다. 그러나 아직 알려지지 않은 시간이기 때문에 식 5처럼 모든 시간에 대해 적분을 해서 가능성을 탐색하는 과정을 거친다.
위 수식으로부터 부동산 가격의 변동이 언제 어느 정도의 강도로 일어날지를 예측하고 그 확률을 추정한다.
한편, 1차 요인에 포함되는 이벤트 항목이 자주 발생하는 것은 아니다. 2차 요인과 3차 요인에 속하는 이벤트가 추출되었고 1차 요인에 포함되는 이벤트는 추출되지 않은 경우에는 어떻게 되는가?
예컨대 3차 요인인 임금 변동 항목(Sa)이 대폭상승이고, 부동산 보고서 항목(Es), 부동산 뉴스 항목(Ne), 경제뉴스 항목(Ec)의 값이 긍정, SN/포털댓글 항목(Sn)이 중립으로 이벤트가 추출되었으며, 2차 요인인 주가변동 항목(St)은 소폭상승, 인구이동 항목(Pe)이 소폭하락으로 추출되었으며, 나머지 이벤트는 관측되지 않았다고 가정하자.
이 경우의 부동산 가격변화 예측은 식 6과 같은 수식으로 표현된다.
Figure pat00010
(식 6)
여기서 sa는 임금변동 이벤트를 나타내는 변수를 지칭하며, 이런 변수가 t의 아래첨자로 붙은 것은 시간 관련성을 나타낸다. 예컨대 tsa는 최종적으로 임금변동을 공표한 시간이다.
실제 추론은 관측되지 않은 변수 h들의 경우의 수의 합과 시간 tH에 대한 적분으로 표현된다. 아래의 식 7의 수식을 참조하라.
Figure pat00011
(식 7)
여기에서 h와 tH는 관측되지 않은 이벤트를 표현하는 확률 변수들의 집합이며 아래의 식 8과 같이 표현된다.
Figure pat00012
(식 8)
참고로, 본 발명의 일 실시예에 따른 부동산 가격변동을 예측하는 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독가능매체에 기록될 수 있다. 상기 컴퓨터 판독가능매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독가능매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체, 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다
본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명이 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.

Claims (5)

  1. 부동산 가격변동 예측 서버가,
    데이터 저장소에서 텍스트 비정형 이벤트, 시계열 수치형 데이터 이벤트 및 정형 데이터 이벤트를 추출하고,
    추출된 이벤트들을 목적 변수인 부동산 가격에 미치는 영향력에 따라 1차 요인, 2차 요인, 3차 요인으로 분류하되, 대출 규제 항목, 기준금리 변동 항목, 신규분양 항목을 포함하는 상기 1차 요인에는 간접 요인 항목을 구성하여 상기 2차 요인을 해당하는 항목은 상기1차 요인의 상기 간접 요인 항목에 포함되도록 계층적으로 분류하고, 상기 3차 요인에 해당하는 항목은 상기 2차 요인에 해당하는 항목에 포함되도록 계층적으로 분류하고,
    상기 1차 요인에 포함되는 항목으로 해당 이벤트의 변화량을 표현하는 이산확률변수와 해당 이벤트가 발생하거나 관측된 시간을 표현하는 연속확률변수의 복합확률변수로 부동산 가격 변동 예측모듈을 생성하고,
    관측된 이벤트들과 상기 예측모듈을 이용하여 미래의 부동산 가격변동을 추론하는 단계를 포함하는 부동산 가격 변동을 예측하는 방법.
  2. 제1항에 있어서,
    상기 텍스트 비정형 이벤트는, 텍스트 데이터 저장소에 저장된 문서의 부동산에 관련된 이벤트 문장에서 특정 주제에 대한 내용을 미리 정한 구조로 구조화하여 추출되는 것인, 부동산 가격 변동을 예측하는 방법.
  3. 제1항에 있어서,
    상기 시계열 수치형 데이터 이벤트는, 부동산/경제 통계에 관한 시계열 데이터 저장소에서 수치형 데이터의 시간당 변화량을 복수 단계로 양자화하여 시계열 이벤트로 추출하는 것인, 부동산 가격 변동을 예측하는 방법.
  4. 제1항에 있어서,
    상기 예측모델에서 이벤트의 변화량을 표현하는 상기 이상확률변수는 대폭상승, 소폭상승, 소폭하락, 대폭하락 중 어느 하나의 값이 부여되는 것인, 부동산 가격 변동을 예측하는 방법.
  5. 제1항에 있어서,
    상기 미래의 부동산 가격변동을 추론하는 단계에서, 부동산 가격변동의 정도와 시점을 의미하는 타깃 이벤트는 다음 수식으로 정의되며,
    Figure pat00013

    (여기서, Q은 타깃 이벤트, E은 관측된 이벤트({e1, e2, … en}) H는 관측되지 않은 이벤트({H1, H2, … Hn}, qi은 타깃 이벤트의 종류로 부동산 가격의 대폭상승, 소폭상승, 변동없음, 소폭하락, 대폭하락 중 한 가지로 정해지는 값)
    상기 수식을 다음 수식으로 변환하여 미래의 부동산 가격변동에 대해 확률추론을 실시하는 것인,
    Figure pat00014

    부동산 가격 변동을 예측하는 방법.
KR1020190151371A 2019-11-22 2019-11-22 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법 KR102423530B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190151371A KR102423530B1 (ko) 2019-11-22 2019-11-22 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190151371A KR102423530B1 (ko) 2019-11-22 2019-11-22 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법

Publications (2)

Publication Number Publication Date
KR20210063005A true KR20210063005A (ko) 2021-06-01
KR102423530B1 KR102423530B1 (ko) 2022-07-21

Family

ID=76375905

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190151371A KR102423530B1 (ko) 2019-11-22 2019-11-22 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법

Country Status (1)

Country Link
KR (1) KR102423530B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114300081A (zh) * 2022-03-09 2022-04-08 四川大学华西医院 基于电子病历多模态数据的预测设备、系统和存储介质
KR102478609B1 (ko) * 2022-03-15 2022-12-16 김용남 건물 관리 플랫폼 제공 시스템 및 그 동작 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170009692A (ko) * 2015-07-15 2017-01-25 숭실대학교산학협력단 주가 등락 예측 방법 및 서버
KR101849544B1 (ko) * 2017-04-28 2018-04-17 주식회사 케이비금융지주 빅데이터를 이용한 부동산 예측 방법 및 이를 수행하기 위한 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170009692A (ko) * 2015-07-15 2017-01-25 숭실대학교산학협력단 주가 등락 예측 방법 및 서버
KR101849544B1 (ko) * 2017-04-28 2018-04-17 주식회사 케이비금융지주 빅데이터를 이용한 부동산 예측 방법 및 이를 수행하기 위한 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114300081A (zh) * 2022-03-09 2022-04-08 四川大学华西医院 基于电子病历多模态数据的预测设备、系统和存储介质
CN114300081B (zh) * 2022-03-09 2022-05-27 四川大学华西医院 基于电子病历多模态数据的预测设备、系统和存储介质
KR102478609B1 (ko) * 2022-03-15 2022-12-16 김용남 건물 관리 플랫폼 제공 시스템 및 그 동작 방법

Also Published As

Publication number Publication date
KR102423530B1 (ko) 2022-07-21

Similar Documents

Publication Publication Date Title
Driscoll et al. Decision making in systems engineering and management
Hunziker et al. No extraction without representation: The ethno-regional oil curse and secessionist conflict
CN107025509B (zh) 基于业务模型的决策系统和方法
Murphy et al. Guidance on the use of best available science under the US Endangered Species Act
Thekdi et al. Decision analysis and risk models for land development affecting infrastructure systems
Kempeneer A big data state of mind: Epistemological challenges to accountability and transparency in data-driven regulation
Guo One-shot decision theory: a fundamental alternative for decision under uncertainty
KR102423530B1 (ko) 정형/비정형 이벤트의 시간-인과관계 모델링을 통한 부동산시장의 가격변동 예측방법
Leiser Bias, journalistic endeavours, and the risks of artificial intelligence
CN114418175A (zh) 一种人员管理方法、装置、电子设备及存储介质
Saha et al. Deep learning approach for predictive analytics to support diversion during freeway incidents
BR112019026386A2 (pt) sistema, método e programa de processamento de informação legal
Richetti et al. Deviance mining with treatment learning and declare-based encoding of event logs
Barankin et al. Evidence-driven approach for assessing social vulnerability and equality during extreme climatic events
Smith Mission dependency index of air force built infrastructure: Knowledge discovery with machine learning
Mogensen et al. Tough enough? Robust satisficing as a decision norm for long-term policy analysis
Ramesh Prediction of cost overruns using ensemble methods in data mining and text mining algorithms
Zhao et al. Short-term metro ridership prediction during unplanned events
Vivek et al. Spatio-temporal crime analysis and forecasting on twitter data using machine learning algorithms
Qiao et al. Risk analysis of emergency based on fuzzy evidential reasoning
Roberts et al. Risk Modeling: Practical Applications of Artificial Intelligence, Machine Learning, and Deep Learning
Rangra Performance shaping factor based human reliability assessment using valuation-based systems: application to railway operations
Sivakumar Nair et al. Investigating the Use of Machine Learning Methods in Direct Ridership Models for Bus Transit
Hassannayebi et al. Data-driven multi-criteria assessment framework for analyzing the reliability of bus services
KR102596740B1 (ko) 기계학습을 이용한 경제불확실성 뉴스심리에 따른 거시경제적 요인과 주식수익률 예측방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant