KR101725011B1 - 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법 - Google Patents

웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법 Download PDF

Info

Publication number
KR101725011B1
KR101725011B1 KR1020160093385A KR20160093385A KR101725011B1 KR 101725011 B1 KR101725011 B1 KR 101725011B1 KR 1020160093385 A KR1020160093385 A KR 1020160093385A KR 20160093385 A KR20160093385 A KR 20160093385A KR 101725011 B1 KR101725011 B1 KR 101725011B1
Authority
KR
South Korea
Prior art keywords
index
search
home sales
sales index
frequency
Prior art date
Application number
KR1020160093385A
Other languages
English (en)
Inventor
한승우
고용호
신영근
김경배
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020160093385A priority Critical patent/KR101725011B1/ko
Application granted granted Critical
Publication of KR101725011B1 publication Critical patent/KR101725011B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/2745
    • G06F17/30536
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Abstract

본 발명은 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법에 관한 것으로, 주택매매지수 예측 장치는 적어도 하나의 웹사이트와 연동되어 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색 빈도수를 웹을 통하여 일정 시간 간격으로 수집하는 수집부, 상기 실제 주택매매지수 및 상기 후보 검색어의 검색 빈도수에 대하여 표준화 작업을 통해 표준 주택매매지수 및 표준 검색 빈도수를 추출하는 표준화 작업부, 상기 표준 주택매매지수와 상기 후보 검색어에 대한 표준 검색 빈도수를 이용하여 양의 관계지수 및 음의 관계지수를 연산하는 연산부, 그리고 상기 후보 검색어 중에서 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 선택하고, 상기 유효 검색어의 검색어 빈도수를 이용하여 주택매매지수를 예측하는 예측부를 포함한다.
본 발명에 따르면, 주택매매지수를 예측하기 위한 데이터의 회득 및 분석이 보다 간편하고 신속하게 수행할 수 있어, 주택매매지수를 사용자에게 제공하는 데 소요되는 시간 및 비용 절감의 효과가 있다.
또한, 본 발명은 특정 검색어의 검색 빈도수를 통해 사람들의 관심도, 트랜드를 반영하여 주택매매지수를 예측할 수 있으며, 모든 수치가 디지털화되어 데이터를 개량하거나 분석함에 용이하다.

Description

웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법{APPARATUS FOR HOME SALES INDEX PREDICTION USING WEB SEARCHES AND METHOD THEREOF}
본 발명은 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법에 관한 것으로, 보다 상세하게는 실제 주택매매지수와 밀접하게 연관된 웹 검색어를 추출하고 해당 검색어의 검색 빈도수에 따라 주택매매지수를 예측하는 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법에 관한 것이다.
주택매매지수(HSI: Home Sale Index)는 일정기간 동안 거래된 주택 수를 집계한 것으로 부동산 산업과 건설산업의 경제적인 현황을 파악할 수 있는 최적의 지표로 활용된다. 즉, 주택매매지수는 정부의 부동산 정책, 기업의 주택 공급, 기업 및 개인의 투자 방향 등 기존의 경제 상황을 분석 및 평가하며, 앞으로의 계획을 수립하는데 중요한 자료로 활용된다.
하지만, 산업 발전에 따라 실질적으로 주택매매지수에 영향을 미치는 변수가 많아지고 있으며, 이에 따라 다양한 변수들의 데이터를 확보하기가 어려울 뿐만 아니라 각각의 변수를 올바르게 측정하는 것 또한 많은 시간과 노력이 요구되는 문제점이 있다.
또한, 최근에는 인터넷을 통한 정보의 획득이 일반화되면서 인터넷 검색으로 많은 사람들이 주택시장 관련 정보를 얻는 경우가 많아졌다. 많은 사람들은 부동산 거래를 하기 전에 신중하게 결정하기 위한 성향이 강하게 나타나기 때문에 계약 수개월 전부터 인터넷 검색을 통해 정보를 수집한다.
이 때문에 검색 데이터는 부동산의 가격, 수요 및 공급 같은 주택시장의 주요 지표에 앞서 그 징후를 나타나게 된다. 즉, 검색 동향 정보는 사람들의 관심, 선호, 평판, 트렌드 등을 직간접적으로 반영하고 있으며, 사람들의 선택 및 결정을 예측하는 데 중요한 정보가 된다.
최근에는 온라인 검색 데이터의 유형, 내용에 따른 분석 기법도 다양한 방법으로 연구되고 있으나 단어가 갖고 있는 특성들로 인해 그 의미를 도출하는 데 따르는 구체적인 성과는 아직 미흡하며, 이를 활용할만한 기술과 아이디어가 부족한 실정이다.
본 발명의 배경이 되는 기술은 대한민국 국내등록특허 제 10-2014-0037384호(2014.03.27 공고)에 개시되어 있다.
본 발명이 이루고자 하는 기술적 과제는 실제 주택매매지수와 밀접하게 연관된 웹 검색어를 추출하고 해당 검색어의 검색 빈도수에 따라 주택매매지수를 예측하는 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법을 제공하는 것이다.
이러한 기술적 과제를 이루기 위한 본 발명의 실시예에 따르면, 적어도 하나의 웹사이트와 연동되어 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색 빈도수를 웹을 통하여 일정 시간 간격으로 수집하는 수집부, 상기 실제 주택매매지수 및 상기 후보 검색어의 검색 빈도수에 대하여 표준화 작업을 통해 표준 주택매매지수 및 표준 검색 빈도수를 추출하는 표준화 작업부, 상기 표준 주택매매지수와 상기 후보 검색어에 대한 표준 검색 빈도수를 이용하여 양의 관계지수 및 음의 관계지수를 연산하는 연산부, 그리고 상기 후보 검색어 중에서 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 선택하고, 상기 유효 검색어의 검색어 빈도수를 이용하여 주택매매지수를 예측하는 예측부를 포함한다.
상기 연산부는, 상기 표준 주택매매지수(standardized주택매매지수)와 표준 검색 빈도수(standardized검색어)간의 양의 관계지수 및 음의 관계지수를 다음 수학식을 이용하여 연산할 수 있다.
Figure 112016071476747-pat00001
상기 예측부는, 선택된 상기 유효 검색어의 검색 빈도수를 다음 수학식에 적용하여 주택매매지수를 예측할 수 있다.
Figure 112016071476747-pat00002
여기서, x1, x2,..., xk는 각각의 유효 검색어 계수, 검색어1, 검색어2,...,검색어k는 각 상기 유효 검색어의 검색 빈도수, constant는 상수를 나타낸다.
상기 예측부는, 상기 유효 검색어 계수 및 상수(constant)의 값을 각각 기 설정된 단위만큼 변경해가면서 대입하여 상기 예측 주택매매지수를 연산하고 동일 시간 단위에 대응하는 상기 실제 주택매매지수와 상기 예측 주택매매지수 간의 오차를 각 시간 단위마다 연산하며, 상기 연산된 오차의 총합이 가장 작도록 하는 유효 검색어 계수 및 상수 값을 추출할 수 있다.
상기 유효 검색어 계수는, 상기 유효 검색어의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+) 부호로 설정되고, 상기 유효 검색어의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)부호가 설정될 수 있다.
상기 예측부는, 상기 상수의 값을 다음의 조건을 만족한 범위 내에서 기 설정된 단위만큼 변경시킬 수 있다.
Figure 112016071476747-pat00003
여기서,
Figure 112016071476747-pat00004
는 일정 기간동안 실제 주택매매지수의 평균,
Figure 112016071476747-pat00005
는 일정 기간동안 실제 주택매매지수의 표준편차를 나타낸다.
본 발명의 다른 실시예에 따르면, 주택매매예측 장치를 이용한 주택매매지수 예측 방법에 있어서, 적어도 하나의 웹사이트와 연동되어 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색 빈도수를 웹을 통하여 일정 시간 간격으로 수집하는 단계, 상기 실제 주택매매지수 및 상기 후보 검색어의 검색 빈도수에 대하여 표준화 작업을 통해 표준 주택매매지수 및 표준 검색 빈도수를 추출하는 단계, 상기 표준 주택매매지수와 상기 후보 검색어에 대한 표준 검색 빈도수를 이용하여 양의 관계지수 및 음의 관계지수를 연산하는 단계, 그리고 상기 후보 검색어 중에서 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 선택하고, 상기 유효 검색어의 검색어 빈도수를 이용하여 주택매매지수를 예측하는 단계를 포함한다.
본 발명에 따르면, 주택매매지수를 예측하기 위한 데이터의 회득 및 분석이 보다 간편하고 신속하게 수행할 수 있어, 주택매매지수를 사용자에게 제공하는 데 소요되는 시간 및 비용 절감의 효과가 있다.
또한, 본 발명은 특정 검색어의 검색 빈도수를 통해 사람들의 관심도, 트랜드를 반영하여 주택매매지수를 예측할 수 있으며, 모든 수치가 디지털화되어 데이터를 개량하거나 분석함에 용이하다.
도 1은 본 발명의 실시예에 따른 주택매매지수 예측 장치를 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 따른 주택매매지수 예측 장치의 구성도이다.
도 3은 본 발명의 실시예에 따른 주택매매지수 예측 장치의 주택매매지수 예측 방법을 나타낸 순서도이다.
도 4는 본 발명의 실시예에 따른 표준 주택매매지수와 후보 검색어의 표준 주택매매지수간의 관계를 도시한 예시도이다.
도 5는 본 발명의 실시예에 따른 예측 주택매매지수와 실제 주택매매지수를 비교한 그래프이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
그러면 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 주택매매지수 예측 장치를 설명하기 위한 도면이다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 검색 엔진(100)과 통신망으로 연결되어 일정 기간 동안 다수의 사람들이 검색한 검색어 및 검색 빈도수를 수집하여 주택매매지수와의 관계지수를 연산하고 유효한 검색어를 추출하여 유효 검색어의 검색 빈도수를 이용하여 주택매매지수를 예측한다.
여기서 검색 엔진(100)은 주택매매지수와 관련 사이트, 컨설턴트 관련 사이트 등 전문기관 사이트 또는 일반 포털 사이트를 나타내며, 네트워크 통신망을 통해 정보를 검색할 수 있는 사이트를 나타낸다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 적어도 하나의 검색 엔진(100)으로부터 적어도 하나의 검색어를 일정기간 검색된 검색어 빈도수를 수집할 수 있다.
이때, 검색어는 주택매매지수와 관련이 있는 검색어부터 전혀 연관관계가 없는 검색어까지 모두 포함하며, 주택매매지수 예측 장치(200)는 검색엔진(100)으로부터 수신한 복수의 검색어 중에서 랜덤으로 검색어를 후보 검색어로 추출하거나 특정 기관 또는 컨설턴트로부터 추천받은 검색어를 후보 검색어로 추출할 수 있다.
그리고 주택매매지수 예측 장치(200)는 적어도 하나의 검색어에 대해 일정 기간 동안의 검색 빈도수를 수집하고, 실제 주택매매지수를 수집한다.
주택매매지수 예측 장치(200)는 실제 주택매매지수 및 검색 빈도수를 표준화 작업 및 관계지수를 연산하여 실제 주택매매지수와 양의 관계 또는 음의 관계에 있는 유효 검색어를 추출한다.
다음으로 주택매매지수 예측 장치(200)는 유효 검색어의 검색 빈도수를 주택매매지수 예측식에 적용하여 주택매매지수를 예측한다. 그리고 주택매매지수 예측 장치(200)는 유효 검색어, 유효 검색어의 검색 빈도수, 예측 주택매매지수를 별도의 데이터 베이스(미도시함)에 저장할 수 있다.
도 2는 본 발명의 실시예에 따른 주택매매지수 예측 장치의 구성도이다.
본 발명의 실시예에 따른 주택매매지수 예측 장치(200)는 수집부(210), 표준화 작업부(220), 연산부(230) 및 예측부(240)를 포함한다.
먼저, 수집부(210)는 특정 지역에서 일정 기간 동안의 실제 주택매매지수를 수집하고, 적어도 하나의 후보 검색어에 대한 검색 빈도수를 일정 시간 간격으로 수집한다.
여기서, 수집부(210)는 각종 금융 기관, 부동산 관련 유관 기관, 국책 은행, 일반 은행 등에서 주 단위로 제공되는 주택매매지수 데이터를 수집할 수 있다. 이때, 주택매매지수의 데이터는 특정 날짜의 주택매매지수 값을 100으로 설정하고 이를 기준으로 주택거래 추이를 상대적으로 나타낼 수 있다. 즉, 주택매매 거래량이 특정 날짜의 주택매매지수 값보다 많으면 100 이상의 값을 가지고 특정 날짜의 주택매매지수 값보다 적으면 100이하의 값을 가질 수 있다.
수집부(210)는 네트워크 통신망으로 연결된 관련 사이트로부터 일정 시간 간격으로 후보 검색어와 검색 빈도수를 수집한다. 수집부(210)는 검색엔진(100)으로부터 복수의 검색어를 수신하여, 랜덤 또는 관련 기관이나 전문가로부터 추천받은 검색어를 후보 검색어로 선택할 수 있다. 그리고 수집부(210)는 하나 또는 복수의 검색엔진(100)으로부터 후보 검색어에 대한 검색 빈도수를 수집할 수 있다.
표준화 작업부(220)는 실제 주택매매지수와 후보 검색어의 검색 빈도수를 표준화 작업을 통해 표준 주택매매지수와 표준 검색 빈도수를 추출한다.
연산부(230)는 표준화 작업부(220)에서 추출한 표준 주택매매지수와 후보 검색어의 표준 검색 빈도수를 이용하여 양의 관계지수와 음의 관계지수를 연산한다.
예측부(240)는 연산된 양의 관계지수 또는 음의 관계지수가 기설정된 임계값보다 작은 값을 가지는 경우, 해당 후보 검색어를 유효 검색어로 선택한다. 그리고 예측부(240)는 선택된 유효 검색어의 검색 빈도수를 이용하여 주택매매지수를 예측한다.
도 3은 본 발명의 실시예에 따른 주택매매지수 예측 장치의 주택매매지수 예측 방법을 나타낸 순서도이다.
먼저, 수집부(210)가 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색 빈도수를 일정 시간 간격으로 수집한다(S310).
수집부(210)는 적어도 하나의 검색엔진(100)과 통신망을 통해 실제 주택매매지수를 수집하고, 검색어의 검색 데이터를 수신할 수 있다.
여기서, 검색 데이터는 검색어와 검색어의 검색빈도수, 검색 시간대, 검색 지역등을 포함할 수 있다.
수집부(210)는 검색엔진(100)으로부터 전달받은 복수의 검색어 중에서 랜덤으로 후보 검색어를 선택할 수도 있고, 직접 사용자로부터 검색어를 입력받은 경우, 입력받은 검색어를 후보 검색어로 선택할 수 있다. 또한, 수집부(210)는 포털 사이트 또는 관련 기관에서 주택매매지수와 관련도가 높은 것으로 추천된 검색어를 선택할 수 있다.
수집부(210)는 일정 시간 간격으로 실제 주택매매지수와 후보 검색어에 대한 검색빈도수를 수집하여 별도의 데이터베이스에 저장할 수 있다.
다음으로 표준화 작업부(220)가 실제 주택매매지수 및 후보 검색어의 검색 빈도수에 대하여 표준화 작업을 통해 표준 주택매매지수 및 표준 검색빈도수를 추출한다(S320).
표준화 작업부(220)는 다음의 수학식 1을 이용하여 표준화 작업을 수행할 수 있다.
Figure 112016071476747-pat00006
여기서, Standardized검색어는 표준 검색 빈도수를 나타내고, 검색어i는 일정 시간 간격의 후보 검색어에 대한 검색 빈도수들 중에서 i번째 후보 검색어의 데이터, min검색어는 후보 검색어의 검색 빈도수중에서 최소값, max검색어 는 후보 검색어의 검색 빈도수중에서 최대값을 나타낸다.
표준화 작업부(220)는 실제 주택매매지수에 대해서도 동일하게 수학식 1을 적용하여 표준 주택매매지수를 추출할 수 있다.
다음으로, 연산부(230)가 표준 주택매매지수와 후보 검색어의 표준 검색빈도수간의 양의 관계지수 및 음의 관계지수를 다음 수학식 2를 이용하여 연산한다(S330).
Figure 112016071476747-pat00007
다음으로 예측부(240)는 관계지수에 따라 유효 검색어를 선택하고 유효 검색어의 빈도수를 이용하여 주택매매지수를 예측한다(S340).
예측부(240)는 양의 관계지수와 음의 관계지수 중에서 하나의 지수값이 임계값보다 작은 값을 가지면 해당 후보 검색어를 유효 검색어로 선택한다. 그리고 예측부는 유효 검색어의 검색어 빈도수를 다음 수학식 3에 적용하여 주택매매지수를 예측할 수 있다.
Figure 112016071476747-pat00008
여기서, x1, x2,..., xk는 각각의 유효 검색어 계수, 검색어1, 검색어2,...,검색어k는 각 상기 유효 검색어의 검색 빈도수, constant는 상수를 나타낸다.
그리고 수학식 3에서 유효 검색어 계수(x1, x2,..., xk)의 부호는 양의 관계지수가 기 설정된 값보다 작은 경우 양(+)으로 설정되고, 유효 검색어의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)으로 설정된다.
예측부(240)는 수학식 3의 유효 검색어 계수 및 상수 값을 각각 기 설정된 단위만큼 변경해가면서 주택매매지수를 예측하고, 동일 시간 단위에 대응하는 실제 주택매매지수와 비교할 수 있다. 이때, 예측부(240)는 유효 검색어 계수를 0과 일정기간 동안의 유효 검색어의 빈도수에 대한 표준편차 값의 범위 내에서 기 설정된 단위만큼 변경해서 수학식 3에 적용할 수 있다.
그리고 예측부(240)는 상수(constant)에 대해서도 다음의 수학식 4와 같은 조건은 만족시키는 범위 내에서 기 설정된 단위만큼 변경시킬 수 있다.
Figure 112016071476747-pat00009
여기서,
Figure 112016071476747-pat00010
는 일정 기간동안 실제 주택매매지수의 평균,
Figure 112016071476747-pat00011
는 일정 기간동안 실제 주택매매지수의 표준편차를 나타낸다.
즉, 예측부(240)는 유효 검색어 계수와 상수 값을 각각의 유효한 범위내에서 각각 기 설정된 단위만큼 변경하여 예측된 주택매매지수와 실제 주택매매지수 간의 오차를 각 시간 단위마다 연산한다. 그리고 예측부(240)는 연산된 오차의 총합이 가장 적은 유효 검색어 계수와 상수 값을 추출할 수 있다.
이하에서는 도 4와 도 5를 이용하여 구체적인 예를 통하여 주택매매지수를 예측하는 과정에 대해서 설명한다.
도 4는 본 발명의 실시예에 따른 표준 주택매매지수와 후보 검색어의 표준 주택매매지수간의 관계를 도시한 예시도이고, 도 5는 본 발명의 실시예에 따른 예측 주택매매지수와 실제 주택매매지수를 비교한 그래프이다.
먼저, 이하에서는 설명의 편의상 주택매매지수 예측 장치(200)가 검색어들 중에서 랜덤으로 후보 검색어로 CK, 서울집값, IBK라는 검색어를 선택한다고 가정한다. 여기서, CK는 캘빈클라인의 약자로 의류, 향수, 시계를 판매하는 브랜드이고, IBK는 기업은행의 약자를 나타내며, 서울집값과 같이 후보 검색어는 하나의 단어에 한정하지 않고 복수의 단어가 결합된 검색어도 포함된다.
그리고 주택매매지수 예측 장치(200)는 각각의 후보 검색어의 검색 빈도수를 1주 단위로 약 1년동안의 후보 검색어 데이터 및 강원도 지역의 실제 주택매매지수 값을 수집한다고 가정한다.
이처럼, 실제 주택매매지수 값과 각 후보 검색어의 검색 빈도수를 도 4와 같이 나타낼 수 있다. 도 4의 그래프는 동일 시간 단위의 실제 주택매매지수(X축)에 대응하여 후보 검색어의 검색 빈도수(Y축)를 나타낸 그래프로, 실제 주택매매지수와 후보 검색어간의 상관관계를 나타낸다.
주택매매지수 예측 장치(200)는 S320 단계와 같이 각각 1주 단위의 실제 주택매매지수와 후보 검색어의 검색 빈도수를 표준화 작업을 하고, S330 단계와 같이 각각 양의 관계지수 및 음의 관계지수를 연산하면 다음 표 1과 같이 나타낼 수 있다.
Figure 112016071476747-pat00012
표 1의 양의 관계지수 및 음의 관계지수 값은 동일 시간 단위(1주)마다 후보 검색어(CK, 서울집값, IBK)의 표준 검색어 빈도수와 표준 주택매매지수간의 양의 관계지수 및 음의 관계지수를 연산하고, 연산된 복수의 양의 관계지수 및 음의 관계지수의 총합을 동일 시간 단위로 나눠진 개수로 나누어 평균을 낸 값이다.
주택매매지수 예측 장치(200)는 기 설정된 값 0.3을 기준으로 양의 관계지수 또는 음의 관계지수가 0.3 이하의 값을 가지는 검색어를 유효 검색어로 선택한다. 즉, 주택매매지수 예측 장치(200)는 음의 관계지수가 0.3보다 작은 값을 가지는 CK와 양의 관계지수가 0.3 보다 작은 값을 가지는 IBK를 유효 검색어로 선택할 수 있다.
도 4에 나타낸 그래프와 같이, 주택매매지수 예측 장치(200)가 실제 주택매매지수와 연관된 유효 검색어로 CK와 IBK를 추출한 결과가 상당부분 일치함을 알 수 있다.
즉, 도 4에서 CK 와 주택매매지수간의 그래프는 우하향 하는 것을 알 수 있는데, 이는 CK의 검색 빈도수가 높을수록 주택매매지수는 낮은 값을 갖게 되는 음의 관계에 있음을 나타낸다. 또한, 도 4에서 IBK와 주택매매지수간에 그래프는 우상향 하는 것을 알 수 있는데, 이는 IBK 의 검색 빈도수가 높을수록 주택매매지수도 높은 값을 가지는 양의 관계에 있음을 나타낸다.
반면, 서울집값과 주택매매지수간의 그래프는 특정 방향성을 가진다고 볼 수 없으므로, 서울집값의 검색 빈도수와 주택매매지수간에는 일정한 규칙이 없음을 알 수 있다.
이와 같이, 주택매매지수 예측 장치(200)가 유효 검색어로 CK 와 IBK를 추출하면, S340 단계와 같이 각각 1주 단위로 앞서 설명한 수학식 3에 해당 검색 빈도수를 입력하고 CK에 대한 음의 관계 계수와 IBK에 대한 양의 관계 계수, 그리고 상수 값을 기 설정된 값인 0.001 단위로 각각 조정하여 주택매매지수를 예측한다.
예를 들어, CK 관계 계수, IBK 관계 계수 및 상수 값이 다음 표 2와 같이 각 0.01 단위씩 증가시킨 후 주택매매지수를 예측할 수 있다. 표 2는 각각 0.01 단위씩 증가시켜 수학식 3에 적용하는 관계 계수 및 상수 값을 설명하기 위한 하나의 예시로, 표 2의 계수 및 상수 값은 앞서 설명한 유효한 범위내의 값이라고 가정한다.
Figure 112016071476747-pat00013
표 2와 같이 주택매매지수 예측 장치(200)는 CK 관계 계수 및 IBK 관계 계수를 고정하고, 상수 값을 0.001단위로 높여가면서 수학식 3에 적용하여 주택매매지수를 예측하고, CK 관계 계수를 고정하고 IBK 관계 계수에 0.01단위만큼 증가시킨 후, 상수 값을 0.01 단위로 높여가면서 주택매매지수를 예측할 수 있다. 그리고 주택매매지수 예측 장치(200)는 CK 관계 계수를 0.01 단위만큼 증가시킨 후, IBK 관계 계수를 고정시키고, 상수 값을 0.01 단위로 높여가면서 주택매매지수를 예측할 수 있다.
이처럼, 주택매매지수 예측 장치(200)는 각각의 관계 계수 및 상수 값에 따라 연산한 주택매매지수와 동일 시간 단위(1주)의 실제 주택매매지수와의 오차를 연산한다.
예를 들어 CK 관계 계수(0.01), IBK 관계 계수(0.01) 및 상수 값(0.01)이 적용된 수학식 3을 통해 주택매매지수 예측 장치(200)는 1년동안 1주 단위로 총 52개의 주택매매지수를 예측한다. 그리고 주택매매지수 예측 장치(200)는 52개의 연산된 주택매매지수와 52개의 실제 주택매매지수간의 오차 값의 총합을 연산한다.
이와 같이, 주택매매지수 예측 장치(200)는 관계 계수 및 상수값에 따른 주택매매지수 오차값의 총합을 연산하고, 해당 오차의 총합이 가장 적은 CK 관계 계수, IBK 관계 계수 및 상수 값을 추출한다.
즉, 주택매매지수 예측 장치(200)는 이러한 과정을 거쳐 추출된 관계 계수 및 상수 값을 수학식 3에 적용한 최종 주택매매지수 예측식을 생성한다.
그리고 주택매매지수 예측 장치(200)는 검색엔진(100)으로부터 복수의 검색어가 아닌, 유효 검색어로 추출된 검색어의 검색 빈도수만을 수집하여 주택매매지수 예측식에 적용함에 따라, 각종 금융 기관, 부동산 관련 유관 기관, 국책 은행, 일반 은행 등에서 주 단위로 주택매매지수가 제공되기 전에 주택매매지수를 예측할 수 있다.
또한, 주택매매지수 예측 장치(200)는 기 설정된 기간 동안 앞서 생성한 주택매매지수 예측식을 사용하고, 기 설정된 기간이 지나면, 다시 검색엔진(100)으로부터 후보 검색어의 검색어 빈도수를 수집하고, 실제 주택매매지수 및 후보 검색어의 검색어 빈도수를 이용하여 유효 검색어를 추출하고 관계 계수 및 상수 값을 추출하여 수학식 3에 적용한 최종 주택매매지수 예측식을 생성할 수 있다.
도 5는 1주 단위(X축)로 본 발명의 실시예에 따른 주택매매지수 예측 장치(200)가 예측한 주택매매지수(predict)와 동일 시간 단위인 1주 단위마다의 실제 주택매매지수(actual)을 나타낸 그래프로, 두 그래프는 동일한 방향을 가지며 유사한 값을 가지는 것을 알 수 있다.
이와 같이 본 발명의 실시예에 따르면, 주택매매지수를 예측하기 위한 데이터의 회득 및 분석이 보다 간편하고 신속하게 수행할 수 있어, 주택매매지수를 사용자에게 제공하는 데 소요되는 시간 및 비용 절감의 효과가 있다.
또한, 본 발명은 특정 검색어의 검색 빈도수를 통해 사람들의 관심도, 트랜드를 반영하여 주택매매지수를 예측할 수 있으며, 모든 수치가 디지털화되어 데이터를 개량하거나 분석함에 용이하다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 다른 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의하여 정해져야 할 것이다.
100: 검색 엔진 200: 주택매매지수 예측 장치
210: 수집부 220: 표준화 작업부
230: 연산부 240: 예측부

Claims (12)

  1. 적어도 하나의 웹사이트와 연동되어 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색 빈도수를 웹을 통하여 일정 시간 간격으로 수집하는 수집부,
    상기 실제 주택매매지수 및 상기 후보 검색어의 검색 빈도수에 대하여 표준화 작업을 통해 표준 주택매매지수 및 표준 검색 빈도수를 추출하는 표준화 작업부,
    상기 표준 주택매매지수와 상기 후보 검색어에 대한 표준 검색 빈도수를 이용하여 양의 관계지수 및 음의 관계지수를 연산하는 연산부, 그리고
    상기 후보 검색어 중에서 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 선택하고, 상기 유효 검색어의 검색어 빈도수를 이용하여 주택매매지수를 예측하는 예측부를 포함하고,
    상기 연산부는, 상기 표준 주택매매지수(standardized주택매매지수)와 표준 검색 빈도수(standardized검색어)간의 양의 관계지수 및 음의 관계지수를 다음 수학식을 이용하여 연산하며,
    Figure 112017014478152-pat00014

    상기 예측부는, 선택된 상기 유효 검색어의 검색 빈도수를 다음 수학식에 적용하여 주택매매지수를 예측하고,
    Figure 112017014478152-pat00015

    여기서, x1, x2,..., xk는 각각의 유효 검색어 계수, 검색어1, 검색어2,...,검색어k는 각 상기 유효 검색어의 검색 빈도수, constant는 상수를 나타내며,
    상기 유효 검색어 계수는, 상기 유효 검색어의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+) 부호로 설정되고, 상기 유효 검색어의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)부호가 설정되는 웹 검색어를 이용한 주택매매지수 예측 장치.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 예측부는,
    상기 유효 검색어 계수 및 상수(constant)의 값을 각각 기 설정된 단위만큼 변경해가면서 대입하여 상기 예측 주택매매지수를 연산하고
    동일 시간 단위에 대응하는 상기 실제 주택매매지수와 상기 예측 주택매매지수 간의 오차를 각 시간 단위마다 연산하며,
    상기 연산된 오차의 총합이 가장 작도록 하는 유효 검색어 계수 및 상수 값을 추출하는 웹 검색어를 이용한 주택매매지수 예측 장치.
  5. 삭제
  6. 제4항에 있어서,
    상기 예측부는,
    상기 상수의 값을 다음의 조건을 만족한 범위 내에서 기 설정된 단위만큼 변경시키는 웹 검색어를 이용한 주택매매지수 예측 장치:
    Figure 112016071476747-pat00016

    여기서,
    Figure 112016071476747-pat00017
    는 일정 기간동안 실제 주택매매지수의 평균,
    Figure 112016071476747-pat00018
    는 일정 기간동안 실제 주택매매지수의 표준편차를 나타낸다.
  7. 주택매매예측 장치를 이용한 주택매매지수 예측 방법에 있어서,
    적어도 하나의 웹사이트와 연동되어 특정 지역의 실제 주택매매지수 및 적어도 하나의 후보 검색어에 대한 검색 빈도수를 웹을 통하여 일정 시간 간격으로 수집하는 단계,
    상기 실제 주택매매지수 및 상기 후보 검색어의 검색 빈도수에 대하여 표준화 작업을 통해 표준 주택매매지수 및 표준 검색 빈도수를 추출하는 단계,
    상기 표준 주택매매지수와 상기 후보 검색어에 대한 표준 검색 빈도수를 이용하여 양의 관계지수 및 음의 관계지수를 연산하는 단계, 그리고
    상기 후보 검색어 중에서 양의 관계지수 또는 음의 관계지수가 임계값보다 작은 값을 가지는 유효 검색어를 선택하고, 상기 유효 검색어의 검색어 빈도수를 이용하여 주택매매지수를 예측하는 단계를 포함하고,
    상기 관계지수를 연산하는 단계는, 상기 표준 주택매매지수(standardized주택매매지수)와 표준 검색 빈도수(standardized검색어)간의 양의 관계지수 및 음의 관계지수를 다음 수학식을 이용하여 연산하며,
    Figure 112017014478152-pat00019

    상기 예측하는 단계는, 선택된 상기 유효 검색어의 검색 빈도수를 다음 수학식에 적용하여 주택매매지수를 예측하고
    Figure 112017014478152-pat00020

    여기서, x1, x2,..., xk는 각각의 유효 검색어 계수, 검색어1, 검색어2,...,검색어k는 각 상기 유효 검색어의 검색 빈도수, constant는 상수를 나타내며,
    상기 유효 검색어 계수는, 상기 유효 검색어의 양의 관계지수가 기 설정된 값보다 작은 경우 양(+) 부호로 설정되고, 상기 유효 검색어의 음의 관계지수가 기 설정된 값보다 작은 경우 음(-)부호가 설정되는 웹 검색어를 이용한 주택매매지수 예측 방법.
  8. 삭제
  9. 삭제
  10. 제7항에 있어서,
    상기 예측하는 단계는,
    상기 유효 검색어 계수 및 상수(constant)의 값을 각각 기 설정된 단위만큼 변경해가면서 대입하여 상기 예측 주택매매지수를 연산하고
    동일 시간 단위에 대응하는 상기 실제 주택매매지수와 상기 예측 주택매매지수 간의 오차를 각 시간 단위마다 연산하며,
    상기 연산된 오차의 총합이 가장 작도록 하는 유효 검색어 계수 및 상수 값을 추출하는 웹 검색어를 이용한 주택매매지수 예측 방법.
  11. 삭제
  12. 제10항에 있어서,
    상기 예측하는 단계는,
    상기 상수의 값을 다음의 조건을 만족한 범위 내에서 기 설정된 단위만큼 변경시키는 웹 검색어를 이용한 주택매매지수 예측 방법:
    Figure 112016071476747-pat00021

    여기서,
    Figure 112016071476747-pat00022
    는 일정 기간동안 실제 주택매매지수의 평균,
    Figure 112016071476747-pat00023
    는 일정 기간동안 실제 주택매매지수의 표준편차를 나타낸다.
KR1020160093385A 2016-07-22 2016-07-22 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법 KR101725011B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160093385A KR101725011B1 (ko) 2016-07-22 2016-07-22 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160093385A KR101725011B1 (ko) 2016-07-22 2016-07-22 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR101725011B1 true KR101725011B1 (ko) 2017-04-10

Family

ID=58581267

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160093385A KR101725011B1 (ko) 2016-07-22 2016-07-22 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR101725011B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11561518B2 (en) 2020-05-27 2023-01-24 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
김성도, ‘빅 데이터 기반의 하공 여행객 단기 수요 예측 모형 개발’, 인하대학교 석사학위 논문(2015.08월 공개) *
송수진 외 2인, ‘빅 데이터 시대의 도시 인프라 계획’, 한국건설관리학회 학술대회 논문집(2014.11월 공개) *
한승우, ‘빅데이터분석방법론을 활용한 연구사례’, 한국건설관리학회지 15권 6호(2014.12월 공개) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11561518B2 (en) 2020-05-27 2023-01-24 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Similar Documents

Publication Publication Date Title
Park et al. Short-term forecasting of Japanese tourist inflow to South Korea using Google trends data
Athawale et al. Decision making for facility location selection using PROMETHEE II method
US20200242638A1 (en) Methods and systems for using multiple data sets to analyze performance metrics of targeted companies
Barua et al. Artificial neural network–based drought forecasting using a nonlinear aggregated drought index
Bangwayo-Skeete et al. Can Google data improve the forecasting performance of tourist arrivals? Mixed-data sampling approach
JP6363679B2 (ja) キーワードと資産価格との関連性評価方法及びその装置
Maas Short‐term forecasting of the US unemployment rate
Wenninger et al. Benchmarking energy quantification methods to predict heating energy performance of residential buildings in Germany
Kargah-Ostadi et al. Developing performance prediction models for pavement management systems in local governments in absence of age data
Bayzid et al. Prediction of maintenance cost for road construction equipment: A case study
Oshodi et al. Comparing univariate techniques for tender price index forecasting: Box-Jenkins and neural network model
Taltavull de La Paz New housing supply and price reactions: Evidence from Spanish markets
KR101435096B1 (ko) 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법
Li et al. Route-level transit operational-efficiency assessment with a bootstrap super-data-envelopment analysis model
Coble et al. Now-casting building permits with Google trends
Hayden Estimation of a rating model for corporate exposures
KR101725014B1 (ko) 시계열 모델을 이용한 주택매매지수 예측 장치 및 그 방법
Zhao et al. Forecasting residential building costs in New Zealand using a univariate approach
KR101725011B1 (ko) 웹 검색어를 이용한 주택매매지수 예측 장치 및 그 방법
Wang et al. Predicting ENR’S construction cost index using the modified K nearest neighbors (KNN) algorithm
KR101725013B1 (ko) 회귀분석을 이용한 주택매매지수 예측 장치 및 그 방법
JP4777941B2 (ja) 需要予測方法および装置
KR101856550B1 (ko) 해외건설기업 의사결정 지원을 위한 발주국 평가방법 및 시스템
KR101334891B1 (ko) SaaS 환경에서의 재무위험관리 서비스를 제공하기 위한 시스템
Poudel et al. ARIMA Modeling and Forecasting of National Consumer Price Index in Nepal

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant