KR101725013B1 - 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법 - Google Patents

회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법 Download PDF

Info

Publication number
KR101725013B1
KR101725013B1 KR1020160094890A KR20160094890A KR101725013B1 KR 101725013 B1 KR101725013 B1 KR 101725013B1 KR 1020160094890 A KR1020160094890 A KR 1020160094890A KR 20160094890 A KR20160094890 A KR 20160094890A KR 101725013 B1 KR101725013 B1 KR 101725013B1
Authority
KR
South Korea
Prior art keywords
index
home sales
sales index
search word
frequency
Prior art date
Application number
KR1020160094890A
Other languages
English (en)
Inventor
한승우
고용호
신영근
김경배
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020160094890A priority Critical patent/KR101725013B1/ko
Application granted granted Critical
Publication of KR101725013B1 publication Critical patent/KR101725013B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/30536
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본원발명은 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법에 관한 것으로, 주택매매지수 예측 장치는 적어도 하나의 웹사이트와 연동되어 일정 기간 동안 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색어 빈도수를 기 설정된 시간 간격으로 수집하는 수집부, 상기 실제 주택매매지수 및 상기 검색어 빈도수를 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출하고, 상기 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산하는 연산부, 상기 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 추출하는 검색어 추출부, 그리고 상기 유효 검색어의 검색어 빈도수 및 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측하는 예측부를 포함한다.
본 발명에 따르면, 웹 사이트를 통해 검색되는 검색어의 검색어 빈도수를 통해 사람들의 관심도 및 트랜드를 반영하여 주택매매지수를 예측할 수 있으며, 모든 수치가 디지털화되어 데이터를 개량하거나 분석함에 용이하다. 또한, 주택매매지수를 예측하기 위한 데이터의 회득 및 분석이 보다 간편하고 신속하게 수행할 수 있어, 소요되는 시간 및 비용 절감의 효과가 있다.

Description

회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법{APPARATUS FOR HOME SALES INDEX PREDICTION USING REGRESSION ANALYSIS AND METHOD THEREOF}
본 발명은 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법에 관한 것으로, 보다 상세하게는 실제 주택매매지수와 밀접하게 연관된 검색어를 추출하고 해당 검색어의 검색어 빈도수 및 실제 주택매매지수를 회귀분석하여 주택매매지수를 예측하는 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법에 관한 것이다.
최근 주택시장은 장기간 공급 부족과 급격한 가격변동으로 어려움을 겪으면서도 과거에 비해서 투명해진 주택거래를 제공하고 주택시장에 대한 많은 정보를 제공하면서 발전해가고 있다. 이러한 주택시장의 변화방향을 알고 활용하기 위해서는 시장과 관련된 다양한 자료를 수집하고 적합한 분석을 통해서 만들어진 정보를 활용하는 것이 필수적이다.
그렇기 때문에 많은 연구 기관에서는 주택시장과 관련된 다양한 지수를 개발하여 공표하고 있다. 하지만, 주택시장이 변화하고 발전함에 따라 실질적으로 주택매매지수에 영향을 미치는 변수가 많아지고 있으며, 이에 따라 다양한 변수들의 데이터를 확보하기가 어려울 뿐만 아니라 각각의 변수를 올바르게 측정하는 것 또한 많은 시간과 노력이 요구되는 문제점이 있다.
또한, 직접 부동산 및 해당 지역 또는 기관을 방문하여 주택시장의 정보를 얻는 방법보다 정보통신의 발달로 인터넷을 통해 주택시장의 정보를 획득하는 방법이 일반화되면서 많은 사람들이 인터넷 검색을 통해서 짧은 시간 내 다양한 지역 정보와 업데이트된 새로운 정보를 보다 쉽게 얻을 수 있게 되었다.
그렇기 때문에 인터넷 검색 데이터들을 분석하면, 부동산의 가격, 수요 및 공급과 같은 주택 시장의 실제 주요 지표보다 앞서 해당 징후를 알 수 있으며, 인터넷 검색 데이터를 분석한 검색 동향 정보는 사람들의 관심, 선호, 평판, 트랜드등을 직간접적으로 방영하고 있으므로 앞으로의 주요 지표의 변화를 예측하는 데 중요한 정보가 된다.
최근에는 인턴넷 검색 데이터를 다양한 방법으로 분석하여 다양한 분야에서 활용될 수 있도록 연구되고 있으나, 구체적인 성과는 아직 미흡하며, 이를 활용할 기술과 아이디어가 부족한 실정이다.
그러므로, 인터넷 검색 데이터 중에서 관련도가 높은 검색어를 선별하여 주택시장의 현황을 가장 대표하고 있는 주택매매지수(HSI: Home Sale Index)를 예측하는 기술이 요구된다.
본 발명의 배경이 되는 기술은 대한민국 국내등록특허 제 10-1435096호(2014.09.01 공고)에 개시되어 있다.
본 발명이 이루고자 하는 기술적 과제는 실제 주택매매지수와 밀접하게 연관된 검색어를 추출하고 해당 검색어의 검색어 빈도수 및 실제 주택매매지수를 회귀분석하여 주택매매지수를 예측하는 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법을 제공하는 것이다.
이러한 기술적 과제를 이루기 위한 본 발명의 실시예에 따르면, 적어도 하나의 웹사이트와 연동되어 일정 기간 동안 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색어 빈도수를 기 설정된 시간 간격으로 수집하는 수집부, 상기 실제 주택매매지수 및 상기 검색어 빈도수를 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출하고, 상기 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산하는 연산부, 상기 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 추출하는 검색어 추출부, 그리고 상기 유효 검색어의 검색어 빈도수 및 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측하는 예측부를 포함한다.
상기 연산부는, 상기 표준 주택매매지수(standardized주택매매지수)와 표준 검색어 빈도수(standardized검색어)간의 양의 관계지수 및 음의 관계지수를 다음 수학식을 이용하여 연산할 수 있다.
Figure 112016072673286-pat00001
여기서 n은 상기 일정 기간 동안 상기 기설정된 시간 간격으로 수집된 주택매매지수 및 검색어 빈도수의 개수를 나타낸다.
상기 예측부는, 상기 유효 검색어 빈도수를 다음과 같은 주택매매지수의 예측식에 적용하여 주택매매지수를 예측할 수 있다.
HSIpre = (X1 * Y1) + (X2 * Y2) +?+ (Xn * Yn) + Xn +1
여기서, HSIpre는 상기 예측 주택매매지수, X1, X2,?, Xn은 예측 계수이고, Xn +1은 상수, Y1, Y2, ?, Yn은 각각 유효 검색어 빈도수를 나타낸다.
상기 예측부는, 회귀분석을 이용한 다음의 수학식을 통해 상기 예측 계수 값(X1, X2,?, Xn ) 및 상수(Xn + 1)를 연산할 수 있다.
Figure 112016072673286-pat00002
여기서, Sy는 유효 검색어 빈도수의 표준편차값, Sy 2은 유효 검색어 빈도수의 분산 값,
Figure 112016072673286-pat00003
는 상기 주택매매지수 실제 값의 평균값,
Figure 112016072673286-pat00004
은 유효 검색어 빈도수(Yn)와 실제 주택매매지수(HIS)의 공분산을 나타낸다.
상기 예측 계수는, 상기 유효 검색어 빈도수의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+)의 부호로 설정되고, 상기 유효 검색어 빈도수의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)의 부호가 설정될 수 있다.
본 발명의 다른 실시예에 따르면, 주택매매예측 장치를 이용한 주택매매지수 예측 방법에 있어서, 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색어 빈도수를 일정 시간 간격으로 수집하는 단계, 상기 실제 주택매매지수 및 상기 검색어 빈도수를 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출하는 단계, 상기 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산하는 단계, 상기 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어 빈도수를 추출하는 단계, 그리고 상기 유효 검색어 빈도수 및 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측하는 단계를 포함한다.
본 발명에 따르면, 웹 사이트를 통해 검색되는 검색어의 검색어 빈도수를 통해 사람들의 관심도 및 트랜드를 반영하여 주택매매지수를 예측할 수 있으며, 모든 수치가 디지털화되어 데이터를 개량하거나 분석함에 용이하다.
또한, 주택매매지수를 예측하기 위한 데이터의 회득 및 분석이 보다 간편하고 신속하게 수행할 수 있어, 주택매매지수를 사용자에게 제공하는 데 소요되는 시간 및 비용 절감의 효과가 있다.
도 1은 본 발명의 실시예에 따른 주택매매지수 예측 장치를 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 주택매매지수 예측 장치의 구성도이다.
도 3은 본 발명의 실시예에 따른 주택매매지수 예측 장치의 주택매매지수 예측 방법을 나타낸 순서도이다.
도 4는 본 발명의 실시예에 따른 표준 주택매매지수와 후보 검색어의 표준 주택매매지수간의 관계를 도시한 예시도이다.
도 5는 본 발명의 실시예에 따른 예측 주택매매지수와 실제 주택매매지수를 비교한 그래프이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
그러면 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 주택매매지수 예측 장치를 설명하기 위한 도면이고, 도 2는 본 발명의 실시예에 따른 주택매매지수 예측 장치의 구성도이다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 웹 사이트(100)와 통신망으로 연결되어 일정 기간 동안 다수의 사람들이 검색한 검색어, 검색어 빈도수 및 실제 주택매매지수를 수집하고, 검색어와 실제 주택매매지수와의 관계지수를 연산하고 유효한 검색어를 추출하여 해당 유효 검색어 빈도수를 이용하여 주택매매지수를 예측한다.
여기서 웹 사이트(100)은 주택매매지수와 관련 사이트, 컨설턴트 관련 사이트 등 전문기관 사이트, 일반 포털 사이트, 검색 엔진 중에서 적어도 하나를 나타내며, 네트워크 통신망을 통해 정보를 검색할 수 있는 모든 사이트를 나타낸다.
그리고 검색어는 주택매매지수와 관련이 있는 검색어부터 전혀 연관관계가 없는 검색어까지 모두 포함하며, 주택매매지수 예측 장치(200)는 웹 사이트(100) 로부터 수신한 복수의 검색어 중에서 랜덤으로 검색어를 후보 검색어로 추출하거나 특정 기관 또는 컨설턴트로부터 추천받은 검색어를 후보 검색어로 추출할 수 있다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 적어도 하나의 웹 사이트(100)으로부터 적어도 하나의 검색어를 일정기간 검색된 검색어 빈도수를 기 설정된 시간 간격마다 수집할 수 있다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 수집부(210), 연산부(220), 검색어 추출부(230), 예측부(240)를 포함한다.
먼저, 수집부(210)는 일정 기간 동안 실제 주택매매지수를 수집하고, 적어도 하나의 후보 검색어에 대한 검색어 빈도수를 포함하는 검색어 데이터를 일정 시간 간격으로 수집한다.
수집부(220)는 통신망을 통해 주택매매지수와 관련된 전문 사이트, 컨설턴트 사이트, 경제 관련 전문 기관 사이트, 일반 포털 사이트, 검색 엔진 중에서 적어도 하나의 웹 사이트(100)와 연결되어 실제 주택매매지수, 검색어, 검색어 빈도수를 수집할 수 있다.
이때, 수집부(220)는 하나 이상의 사이트로부터 검색어 데이터를 수집할 수 있으며, 해당 사이트별로 또는 검색어 데이터 별로 분류하여 별도의 데이터 베이스에 저장할 수 있다. 그리고 수집부(210)는 각종 금융 기관, 부동산 관련 유관 기관, 국책 은행, 일반 은행 등에서 주 단위로 제공되는 주택매매지수 데이터를 수집할 수 있다. 이때, 주택매매지수의 데이터는 특정 날짜의 주택매매지수 값을 100으로 설정하고 이를 기준으로 주택거래 추이를 상대적으로 나타낼 수 있다. 즉, 주택매매 거래량이 특정 날짜의 주택매매지수 값보다 많으면 100 이상의 값을 가지고 특정 날짜의 주택매매지수 값보다 적으면 100이하의 값을 가질 수 있다.
수집부(210)는 네트워크 통신망으로 연결된 관련 사이트로부터 기 설정된 시간 간격으로 후보 검색어와 검색어 빈도수를 수집한다. 수집부(210)는 웹 사이트(100)으로부터 복수의 검색어를 수신하여, 랜덤 또는 관련 기관이나 전문가로부터 추천받은 검색어를 후보 검색어로 선택할 수 있다.
연산부(220)는 실제 주택매매지수와 검색어 데이터를 각각 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출한다. 그리고 연산부(220)는 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산한다.
검색어 추출부(230)는 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 추출한다.
예측부(240)는 유효 검색어 데이터와 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측한다.
도 3은 본 발명의 실시예에 따른 주택매매지수 예측 장치의 주택매매지수 예측 방법을 나타낸 순서도이고, 도 4는 본 발명의 실시예에 따른 표준 주택매매지수와 후보 검색어의 표준 주택매매지수간의 관계를 도시한 예시도이다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어 빈도수를 일정 시간 간격으로 수집한다(S310).
주택매매지수 예측 장치(200)는 적어도 하나의 검색엔진(100)과 통신망을 통해 실제 주택매매지수를 수집하고, 검색어의 검색 데이터를 수신할 수 있다.
여기서, 검색 데이터는 검색어와 검색어의 검색빈도수, 검색 시간대, 검색 지역등을 포함할 수 있다.
주택매매지수 예측 장치(200)는 웹 사이트(200)으로부터 전달받은 복수의 검색어 중에서 랜덤으로 후보 검색어를 선택할 수도 있고, 직접 사용자로부터 검색어를 입력받은 경우, 입력받은 검색어를 후보 검색어로 선택할 수 있다. 또한, 수집부(210)는 포털 사이트 또는 관련 기관에서 주택매매지수와 관련도가 높은 것으로 추천된 검색어를 선택할 수 있다.
주택매매지수 예측 장치(200)는 일정 기간동안 기 설정된 시간 간격으로 실제 주택매매지수와 후보 검색어에 대한 검색빈도수를 수집하여 별도의 데이터베이스(미도시함)에 저장할 수 있다.
도 4와 같이, 주택매매지수 예측 장치(200)는 수집한 검색어들 중에서 랜덤으로 후보 검색어로 CK, 서울집값, IBK라는 검색어를 선택한다고 가정한다. 여기서, CK는 캘빈클라인의 약자로 의류, 향수, 시계를 판매하는 브랜드이고, IBK는 기업은행의 약자를 나타내며, 서울집값과 같이 후보 검색어는 하나의 단어에 한정하지 않고 복수의 단어가 결합된 검색어도 포함된다.
그리고 주택매매지수 예측 장치(200)는 각각의 후보 검색어의 검색어 빈도수를 1주 단위로 약 1년동안의 후보 검색어 데이터 및 강원도 지역의 실제 주택매매지수 값을 수집한다고 가정한다.
이처럼, 주택매매지수 예측 장치(200)가 수집한 실제 주택매매지수 값과 각 후보 검색어의 검색어 빈도수를 도 4와 같이 그래프로 나타낼 수 있다. 도 4의 그래프는 동일 시간 단위의 실제 주택매매지수(X축)에 대응하여 후보 검색어의 검색어 빈도수(Y축)를 나타낸 그래프로, 실제 주택매매지수와 후보 검색어간의 상관관계를 나타낸다.
다음으로 주택매매지수 예측 장치(200)는 실제 주택매매지수 및 검색어 빈도수를 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출한다(S320).
주택매매지수 예측 장치(200)는 다음 수학식 1을 이용하여 표준화 작업을 수행할 수 있다.
Figure 112016072673286-pat00005
여기서, Standardized검색어는 표준 검색어 빈도수를 나타내고, 검색어i는 일정 시간 간격의 후보 검색어에 대한 검색어 빈도수들 중에서 i번째 후보 검색어의 데이터, min검색어는 후보 검색어의 검색어 빈도수중에서 최소값, max검색어 는 후보 검색어의 검색어 빈도수중에서 최대값을 나타낸다.
주택매매지수 예측 장치(200)는 실제 주택매매지수에 대해서도 동일하게 수학식 1을 적용하여 표준 주택매매지수를 추출할 수 있다.
다음으로 주택매매지수 예측 장치(200)는 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산한다(S330).
주택매매지수 예측 장치(200)는 다음 수학식 2를 통해 표준 주택매매지수(standardized주택매매지수)와 표준 검색어 빈도수(standardized검색어)를 이용하여 양의 관계 지수와 음의 관계지수를 추출한다.
Figure 112016072673286-pat00006
이처럼, 주택매매지수 예측 장치(200)는 각 표준 주택매매지수와 표준 검색어 빈도수에 대해서 각각 양의 관계지수 및 음의 관계지수를 연산하면 다음 표 1과 같이 나타낼 수 있다.
Figure 112016072673286-pat00007
표 1의 양의 관계지수 및 음의 관계지수 값은 동일 시간 단위(1주)마다 후보 검색어(CK, 서울집값, IBK)의 표준 검색어 빈도수와 표준 주택매매지수간의 양의 관계지수 및 음의 관계지수를 연산하고, 연산된 복수의 양의 관계지수 및 음의 관계지수의 총합을 동일 시간 단위로 나눠진 개수로 나누어 평균을 낸 값이다.
주택매매지수 예측 장치(200)는 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 추출한다(S340).
주택매매지수 예측 장치(200)는 기 설정된 값 0.3을 기준으로 양의 관계지수 또는 음의 관계지수가 0.3 이하의 값을 가지는 검색어를 유효 검색어로 선택할 수 있다. 즉, 주택매매지수 예측 장치(200)는 표 1의 연산된 관계 지수를 이용하여 음의 관계지수가 0.3보다 작은 값을 가지는 CK와 양의 관계지수가 0.3 보다 작은 값을 가지는 IBK를 유효 검색어로 선택하고 유표 검색어의 검색어 빈도수를 추출할 수 있다.
도 4에 나타낸 그래프와 같이, 주택매매지수 예측 장치(200)가 실제 주택매매지수와 연관된 유효 검색어로 CK와 IBK를 추출한 결과가 상당부분 일치함을 알 수 있다.
즉, 도 4에서 CK 와 주택매매지수간의 그래프는 우하향 하는 것을 알 수 있는데, 이는 CK의 검색어 빈도수가 높을수록 주택매매지수는 낮은 값을 갖게 되는 음의 관계에 있음을 나타낸다. 또한, 도 4에서 IBK와 주택매매지수간에 그래프는 우상향 하는 것을 알 수 있는데, 이는 IBK 의 검색어 빈도수가 높을수록 주택매매지수도 높은 값을 가지는 양의 관계에 있음을 나타낸다.
반면, 서울집값과 주택매매지수간의 그래프는 특정 방향성을 가진다고 볼 수 없으므로, 서울집값의 검색어 빈도수와 주택매매지수간에는 일정한 규칙이 없음을 알 수 있다.
주택매매지수 예측 장치(200)는 유효 검색어 데이터 및 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측한다(S250).
주택매매지수 예측 장치(200)는 다음 수학식 3에 유효 검색어의 검색어 빈도수를 적용하여 주택매매지수를 예측할 수 있다.
Figure 112016072673286-pat00008
여기서, HSIpre 는 예측 주택매매지수, X1, X2,..., Xn은 예측 계수이고, Xn +1은 상수, Y1, Y2, ..., Yn은 각각 유효 대상값으로 검색어의 검색어 빈도수를 나타낸다.
그리고 주택매매지수 예측 장치(200)는 다음과 같은 수학식 4를 통해 예측 계수의 값 및 상수 값을 연산한다.
Figure 112016072673286-pat00009
여기서,
Figure 112016072673286-pat00010
는 주택매지수 실제 값(HSI)의 평균값,
Figure 112016072673286-pat00011
은 은 Yn, HSI의 공분산을 나타낸다.
주택매매지수 예측 장치(200)는 수학식 4에 따른 연립방정식에 실제 주택매매지수 및 검색어 빈도수의 공분산, 표준편차, 분산 등을 대입함으로써, 예측 계수(X1, X2,..., Xn) 및 상수 값을 추출할 수 있다.
즉, 주택매매지수 예측 장치(200)는 유효 대상값으로 추출된 n개의 유효 대상값의 검색어 빈도수(Y1, Y2,..., Yn)과 수학식 4를 통해 획득한 예측 계수 (X1, X2,..., Xn) 및 상수 값을 수학식 3에 대입하여 주택매매지수(HSIpre)를 연산할 수 있다.
이때, 예측 계수는 유효 검색어 빈도수의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+)의 부호로 설정되고, 유효 검색어 빈도수의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)의 부호가 설정될 수 있다.
즉, 주택매매지수 예측 장치(200)는 이러한 과정을 거쳐 추출된 예측 계수 및 상수 값을 수학식 3에 적용한 최종 주택매매지수 예측식을 생성한다.
그리고 주택매매지수 예측 장치(200)는 검색엔진(100)으로부터 복수의 검색어가 아닌, 유효 검색어로 추출된 검색어의 검색어 빈도수만을 수집하여 주택매매지수 예측식에 적용함에 따라, 각종 금융 기관, 부동산 관련 유관 기관, 국책 은행, 일반 은행 등에서 주 단위로 주택매매지수가 제공되기 전에 주택매매지수를 예측할 수 있다.
또한, 주택매매지수 예측 장치(200)는 기 설정된 기간 동안 앞서 생성한 주택매매지수 예측식을 사용하고, 기 설정된 기간이 지나면, 다시 검색엔진(100)으로부터 후보 검색어의 검색어 빈도수를 수집하고, 실제 주택매매지수 및 후보 검색어의 검색어 빈도수를 이용하여 유효 검색어를 추출하고 예측 계수 및 상수 값을 추출하여 수학식 3에 적용한 최종 주택매매지수 예측식을 생성할 수 있다.
도 5는 본 발명의 실시예에 따른 예측 주택매매지수와 실제 주택매매지수를 비교한 그래프이다.
도 5는 1주 단위(X축)로 본 발명의 실시예에 따른 주택매매지수 예측 장치(200)가 예측한 주택매매지수(predict)와 동일 시간 단위인 1주 단위마다의 실제 주택매매지수(actual)을 나타낸 그래프로, 두 그래프는 동일한 방향을 가지며 유사한 값을 가지는 것을 알 수 있다.
이와 같이 본 발명의 실시예에 따르면, 웹 사이트를 통해 검색되는 검색어의 검색어 빈도수를 통해 사람들의 관심도 및 트랜드를 반영하여 주택매매지수를 예측할 수 있으며, 모든 수치가 디지털화되어 데이터를 개량하거나 분석함에 용이하다.
또한, 주택매매지수를 예측하기 위한 데이터의 회득 및 분석이 보다 간편하고 신속하게 수행할 수 있어, 주택매매지수를 사용자에게 제공하는 데 소요되는 시간 및 비용 절감의 효과가 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 다른 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의하여 정해져야 할 것이다.
100: 웹 사이트 200: 주택매매지수 예측 장치
210: 수집부 220: 연산부
230: 검색어 추출부 240: 예측부

Claims (10)

  1. 적어도 하나의 웹사이트와 연동되어 일정 기간 동안 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색어 빈도수를 기 설정된 시간 간격으로 수집하는 수집부,
    상기 실제 주택매매지수 및 상기 검색어 빈도수를 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출하고, 상기 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산하는 연산부,
    상기 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 추출하는 검색어 추출부, 그리고
    상기 유효 검색어의 검색어 빈도수 및 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측하는 예측부를 포함하고,
    상기 연산부는, 상기 표준 주택매매지수(standardized주택매매지수)와 표준 검색어 빈도수(standardized검색어)간의 양의 관계지수 및 음의 관계지수를 다음 수학식을 이용하여 연산하며,
    Figure 112017014474710-pat00012

    여기서 n은 상기 일정 기간 동안 상기 기 설정된 시간 간격으로 수집된 주택매매지수 및 검색어 빈도수의 개수를 나타내고,
    상기 예측부는, 상기 유효 검색어 빈도수를 다음과 같은 주택매매지수의 예측식에 적용하여 주택매매지수를 예측하며,
    HSIpre = (X1 * Y1) + (X2 * Y2) +...+ (Xn * Yn) + Xn+1
    여기서, HSIpre는 예측 주택매매지수, X1, X2,..., Xn은 예측 계수이고, Xn+1은 상수, Y1, Y2, ..., Yn은 각각 유효 검색어 빈도수를 나타내고,
    상기 예측 계수는, 상기 유효 검색어 빈도수의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+)의 부호로 설정되고, 상기 유효 검색어 빈도수의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)의 부호가 설정되는 회귀분석를 이용한 주택매매지수 예측 장치.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 예측부는,
    회귀분석을 이용한 다음의 수학식을 통해 상기 예측 계수 값(X1, X2,..., Xn) 및 상수(Xn+1)를 연산하는 회귀분석을 이용한 주택매매지수 예측 장치:
    Figure 112017014474710-pat00013

    여기서, Sy는 유효 검색어 빈도수의 표준편차값, Sy 2은 유효 검색어 빈도수의 분산 값,
    Figure 112017014474710-pat00014
    는 상기 주택매매지수 실제 값의 평균값,
    Figure 112017014474710-pat00015
    은 유효 검색어 빈도수(Yn)와 실제 주택매매지수(HSI)의 공분산을 나타낸다.
  5. 삭제
  6. 주택매매예측 장치를 이용한 주택매매지수 예측 방법에 있어서,
    적어도 하나의 웹 사이트와 연동되어 일정 기간 동안 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색어 빈도수를 기 설정된 시간 간격으로 수집하는 단계,
    상기 실제 주택매매지수 및 상기 검색어 빈도수를 표준화 작업을 통해 표준 주택매매지수 및 표준 검색어 빈도수를 추출하는 단계,
    상기 표준 주택매매지수와 표준 검색어 빈도수간의 양의 관계지수 및 음의 관계지수를 연산하는 단계,
    상기 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어 빈도수를 추출하는 단계, 그리고
    상기 유효 검색어 빈도수 및 실제 주택매매지수에 대해 회귀분석을 수행하여 주택매매지수를 예측하는 단계를 포함하고,
    상기 관계지수를 연산하는 단계는, 상기 표준 주택매매지수(standardized주택매매지수)와 표준 검색어 빈도수(standardized검색어)간의 양의 관계지수 및 음의 관계지수를 다음 수학식을 이용하여 연산하며,
    Figure 112017014474710-pat00016

    여기서 n은 상기 일정 기간 동안 상기 기 설정된 시간 간격으로 수집된 주택매매지수 및 검색어 빈도수의 개수를 나타내고,
    상기 주택매매지수를 예측하는 단계는, 상기 유효 검색어 빈도수를 다음과 같은 주택매매지수의 예측식에 적용하여 주택매매지수를 예측하며,
    HSIpre = (X1 * Y1) + (X2 * Y2) +...+ (Xn * Yn) + Xn+1
    여기서, HSIpre는 상기 예측 주택매매지수, X1, X2,..., Xn은 예측 계수이고, Xn+1은 상수, Y1, Y2, ..., Yn은 각각 유효 검색어 빈도수를 나타내고,
    상기 예측 계수는, 상기 유효 검색어 빈도수의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+)의 부호로 설정되고, 상기 유효 검색어 빈도수의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)의 부호가 설정되는 회귀분석을 이용한 주택매매지수 예측 방법.
  7. 삭제
  8. 삭제
  9. 제6항에 있어서,
    상기 주택매매지수를 예측하는 단계는,
    회귀분석을 이용한 다음의 수학식을 통해 상기 예측 계수 값(X1, X2,..., Xn) 및 상수(Xn+1)를 연산하는 회귀분석을 이용한 주택매매지수 예측 방법:
    Figure 112017014474710-pat00017

    여기서, Sy는 유효 검색어 빈도수의 표준편차값, Sy 2은 유효 검색어 빈도수의 분산 값,
    Figure 112017014474710-pat00018
    는 상기 주택매매지수 실제 값의 평균값,
    Figure 112017014474710-pat00019
    은 유효 검색어 빈도수(Yn)와 실제 주택매매지수(HIS)의 공분산을 나타낸다.
  10. 삭제
KR1020160094890A 2016-07-26 2016-07-26 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법 KR101725013B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160094890A KR101725013B1 (ko) 2016-07-26 2016-07-26 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160094890A KR101725013B1 (ko) 2016-07-26 2016-07-26 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR101725013B1 true KR101725013B1 (ko) 2017-04-18

Family

ID=58703914

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160094890A KR101725013B1 (ko) 2016-07-26 2016-07-26 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR101725013B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220057121A (ko) * 2020-10-29 2022-05-09 인하대학교 산학협력단 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법
US11561518B2 (en) 2020-05-27 2023-01-24 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
김성도, ‘빅 데이터 기반의 하공 여행객 단기 수요 예측 모형 개발’, 인하대학교 석사학위 논문(2015.08월 공개)
송수진 외 2인, ‘빅 데이터 시대의 도시 인프라 계획’, 한국건설관리학회 학술대회 논문집(2014.11월 공개)
한승우, ‘빅데이터분석방법론을 활용한 연구사례’, 한국건설관리학회지 15권 6호(2014.12월 공개)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11561518B2 (en) 2020-05-27 2023-01-24 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
KR20220057121A (ko) * 2020-10-29 2022-05-09 인하대학교 산학협력단 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법
KR102425013B1 (ko) * 2020-10-29 2022-07-25 인하대학교 산학협력단 검색량 분석과 다중회귀 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그것에 의해 수행되는 탄소 배출권 가격 예측 방법

Similar Documents

Publication Publication Date Title
Dursun et al. Using data mining techniques for profiling profitable hotel customers: An application of RFM analysis
US20170004128A1 (en) Device and method for analyzing reputation for objects by data mining
US20170140464A1 (en) Method and apparatus for evaluating relevance of keyword to asset price
KR101531970B1 (ko) 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 주가 예측 방법 및 이를 적용한 주가 예측 시스템
US20100280882A1 (en) Frequency-based transaction prediction and processing
KR20150053256A (ko) 고객 데이터 해석 시스템
KR102073208B1 (ko) 경기장 방문객 대상 빅데이터 분석 시스템
KR20140053444A (ko) 시장규모예측장치, 시장규모예측방법 및 시장규모를 예측하는 프로그램을 저장하는 저장매체
US20160343004A1 (en) Process journey sentiment analysis
KR20200022144A (ko) 감성사전 구축을 통한 주택시장 동향 분석을 위한 시스템 및 방법
KR101725013B1 (ko) 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법
CN104616180A (zh) 一种热销商品预测方法
CN113239173A (zh) 问答数据的处理方法、装置、存储介质与电子设备
KR20140037384A (ko) 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법
KR101725014B1 (ko) 시계열 모델을 이용한 주택매매지수 예측 장치 및 그 방법
Gutama et al. Analysis of the effect of website sales quality on purchasing decisions on e-commerce websites
JP6818935B2 (ja) データ処理装置、方法、およびプログラムを記憶した媒体
KR101732873B1 (ko) 사용자 맞춤형 인기장소 추천 방법 및 시스템
KR101725015B1 (ko) 인공신경망을 이용한 주택매매지수 예측 장치 및 그 방법
KR101725011B1 (ko) 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법
Amirteimoori et al. Increasing the discrimination power of data envelopment analysis
EP3493082A1 (en) A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends
US20220309370A1 (en) Computationally Efficient System And Method For Observational Causal Inferencing
Gündüz et al. An analysis of the relationship between consumer confidence index and credit card expenditures in turkey 1
KR100738899B1 (ko) 신용카드 결제 시스템을 이용한 창업 및 경영 지원 서비스제공 시스템

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant