KR102138967B1 - 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법 - Google Patents
빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR102138967B1 KR102138967B1 KR1020180033055A KR20180033055A KR102138967B1 KR 102138967 B1 KR102138967 B1 KR 102138967B1 KR 1020180033055 A KR1020180033055 A KR 1020180033055A KR 20180033055 A KR20180033055 A KR 20180033055A KR 102138967 B1 KR102138967 B1 KR 102138967B1
- Authority
- KR
- South Korea
- Prior art keywords
- index
- sentiment
- consumer
- data
- emotional
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 제1 경제 지표와 제2 경제 지표를 포함하는 제1 정형 데이터, 소비자 위치 정보를 포함하는 제2 정형 데이터, 및 소셜 미디어 데이터를 포함하는 비정형 데이터가 저장되는 저장부; 상기 제1 정형 데이터와 상기 비정형 데이터를 수집하는 데이터 수집부; 상기 비정형 데이터를 감성 분석하여 감성 지수를 산출하는 감성지수 산출부; 제1 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 독립 변수로 하고, 상기 제1 기간에서의 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출하는 데이터 분석부; 및 상기 상관 함수와 상기 제1 기간 이후의 제2 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 이용하여 소비자심리지수를 산출하는 소비자심리지수 산출부; 를 포함하는 빅데이터 기반 소비자심리지수 제공 시스템에 관한 것이다.
Description
본 발명은 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법에 관한 것으로, 보다 상세하게는 속보성 및 신뢰성을 갖는 소비자심리지수의 제공이 가능한 시스템 및 방법에 관한 것이다.
한국은행 및 통계청을 비롯한 정부기관과 경제단체들은 국가 경제의 현황을 파악하고 경기의 흐름을 빠르고 정확하게 포착하고자 다양한 지표들을 개발하여 활용하고 있다. 이러한 경제현황 파악에 사용되는 지표들은 개별 경제지표나 종합경기지표와 양적 통계를 기반으로 하거나, 경제심리지표와 같은 질적인 정보가 활용되기도 한다. 이 가운데 경제심리지표들은 전통적인 계수통계조사 보다 경기순환변동에 더 민감하고 신속하게 포착할 수 있으며 전체 업황 전망, 소비지출계획 등 계수통계조사로는 조사가 어려운 정보를 획득할 수 있다는 장점으로 인해 경기 동향의 판단 및 예측의 주요지표로서 활용되고 있다.
소비자동향지수(CSI: Consumer Survey Index) 역시 이러한 경제심리지표의 하나로서 소비자의 경제에 대한 현재 인식과 향후 전망 내용 등을 설문조사하는 소비자동향조사 결과를 지수화한 것이다. 소비자동향조사는 1995년부터 실시되고 1998년부터 그 결과가 공표되었는데, 조사기관-대상 가구수-조사항목 등의 조정이 몇 차례 이루어진 후 2008년 9월부터 한국은행이 전담하여 전국 시도 19개 지역의 도시 일반가구를 대표하는 표본가구 2,200가구를 대상으로 매월 15일을 전후하여 5가지 척도를 가진 20여개 항목으로 구성된 설문조사를 실시하고 응답결과를 지수화 하여 매월 말일전후로 그 결과를 발표하고 있다.
한편 소비자동향지수는 생활형편, 경제상황 등 개별 항목별로 소비자동향을 표현하는 지표이므로 각 항목에 대한 소비자들의 태도는 잘 나타내는데 반해 개별지수 간 결과가 상충되거나 또는 소비자의 심리를 대표하는 지수로 활용하기에는 어려움이 있다. 이에 조사기관인 한국은행에서는 2005년부터 소비상황, 경기인식 등에 대한 소비자 태도를 종합적으로 파악할 수 있는 대표지수로서 개별 항목 중 대표도가 높은 6개 항목을 합성하여 소비자심리지수(CCSI: Composite Consumer Sentiment Index)를 편제하여 발표하고 있다. 소비자심리지수(CCSI)에 합성되는 6개 개별 CSI는 경제지표와 상관성이 높고 선행성이 우수한 항목들로서 경제상황(현재경기판단지수, 향후경기전망지수), 생활형편 (현재생활형편지수, 생활형편전망지수), 소득 및 소비(가계수입전망지수, 소비지출전망지수)에서 선별되었다.
다만, 기존의 소비자심리지수의 경우, 설문조사 방식으로 이루어지므로 조사 방식의 성격상 속보성이 떨어지는 문제가 있었다.
본 발명은 소셜 데이터와 같은 비정형 데이터를 활용함으로써, 속보성을 갖는 소비자심리지수의 제공이 가능한 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법을 제공하기 위한 것이다.
또한, 본 발명의 다른 목적은 비정형 데이터뿐만 아니라 경제 지표와 같은 정형 데이터도 함께 활용함으로써, 소비자심리지수의 신뢰성을 향상시킬 수 있는 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법을 제공하기 위함이다.
본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템은 제1 경제 지표와 제2 경제 지표를 포함하는 제1 정형 데이터, 소비자 위치 정보를 포함하는 제2 정형 데이터, 및 소셜 미디어 데이터를 포함하는 비정형 데이터가 저장되는 저장부, 상기 제1 정형 데이터와 상기 비정형 데이터를 수집하는 데이터 수집부, 상기 비정형 데이터를 감성 분석하여 감성 지수를 산출하는 감성지수 산출부, 제1 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 독립 변수로 하고, 상기 제1 기간에서의 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출하는 데이터 분석부 및 상기 상관 함수와 상기 제1 기간 이후의 제2 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 이용하여 소비자심리지수를 산출하는 소비자심리지수 산출부를 포함할 수 있다.
또한, 상기 제1 경제 지표는, 민간 소비지출, 가계 내구재 소비지출, 가계 준내구재 소비지출, 가계 비내구재 소비지출, 소매판매액지수, 서비스업생산지수, 소비자물가지수, 민간 소비지출 증감률, 가계 내구재 소비지출 증감률, 가계 준내구재 소비지출 증감률, 가계 비내구재 소비지출 증감률, 소매판매액지수 증감률, 서비스업생산지수 증감률, 및 소비자물가지수 증감률 중 적어도 하나를 포함할 수 있다.
또한, 상기 제2 경제 지표는, 주가, 환율, 금리, 유가, 원자재 가격, 처분가능 소득, 주가 증감률, 환율 증감률, 금리 증감률, 유가 증감률, 원자재 가격 증감률, 및 처분가능 소득 증감률 중 적어도 하나를 포함할 수 있다.
또한, 상기 소비자 위치 정보는, 적어도 하나 이상의 지역별로 위치한 소비자 수를 포함할 수 있다.
또한, 상기 감성지수 산출부는, 감성 사전을 이용한 감성 분석을 통해 생활형편 감성 지수, 경제상황 감성 지수, 소득 감성 지수, 및 소비 감성 지수를 산출하고, 상기 감성 지수는, 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성 지수, 및 상기 소비 감성 지수를 포함할 수 있다.
또한, 상기 감성지수 산출부는, 감성 사전을 이용한 감성 분석을 통해 생활형편 감성 지수, 경제상황 감성 지수, 소득 감성 지수, 및 소비 감성 지수를 산출하고, 산출된 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성 지수, 및 상기 소비 감성 지수를 통합 지수화하여 상기 감성 지수를 산출할 수 있다.
또한, 상기 데이터 분석부는, 다중 회귀 분석(multiple regression analysis) 또는 머신 러닝(machine learning) 기법을 통해 상기 상관 함수를 도출할 수 있다.
또한, 상기 소비자 위치 정보는, 이동 통신사로부터 제공받을 수 있다.
또한, 상기 소셜 미디어 데이터는, 소셜 네트워크 서비스, 블로그, 온라인 뉴스 중 적어도 하나로부터 수집될 수 있다.
또한, 상기 감성지수 산출부는, 상기 제1 기간에서의 비정형 데이터를 감성 분석하여 상기 제1 기간에서의 감성 지수를 산출하고, 상기 제2 기간에서의 비정형 데이터를 감성 분석하여 상기 제2 기간에서의 감성 지수를 산출할 수 있다.
본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 방법은 제1 경제 지표와 제2 경제 지표를 포함하는 제1 정형 데이터, 소비자 위치 정보를 포함하는 제2 정형 데이터, 및 소셜 미디어 데이터를 포함하는 비정형 데이터를 수집하는 단계, 상기 비정형 데이터를 감성 분석하여 감성 지수를 산출하는 단계, 제1 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 독립 변수로 하고, 상기 제1 기간에서의 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출하는 단계 및 상기 상관 함수와 상기 제1 기간 이후의 제2 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 이용하여 소비자심리지수를 산출하는 단계를 포함할 수 있다.
또한, 상기 제1 경제 지표는, 민간 소비지출, 가계 내구재 소비지출, 가계 준내구재 소비지출, 가계 비내구재 소비지출, 소매판매액지수, 서비스업생산지수, 소비자물가지수, 민간 소비지출 증감률, 가계 내구재 소비지출 증감률, 가계 준내구재 소비지출 증감률, 가계 비내구재 소비지출 증감률, 소매판매액지수 증감률, 서비스업생산지수 증감률, 및 소비자물가지수 증감률 중 적어도 하나를 포함할 수 있다.
또한, 상기 제2 경제 지표는, 주가, 환율, 금리, 유가, 원자재 가격, 처분가능 소득, 주가 증감률, 환율 증감률, 금리 증감률, 유가 증감률, 원자재 가격 증감률, 및 처분가능 소득 증감률 중 적어도 하나를 포함할 수 있다.
또한, 상기 소비자 위치 정보는, 적어도 하나 이상의 지역별로 위치한 소비자 수를 포함할 수 있다.
또한, 상기 감성지수를 산출하는 단계는, 감성 사전을 이용한 감성 분석을 통해 생활형편 감성 지수, 경제상황 감성 지수, 소득 감성 지수, 및 소비 감성 지수를 산출하고, 상기 감성 지수는, 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성 지수, 및 상기 소비 감성 지수를 포함할 수 있다.
또한, 상기 감성지수를 산출하는 단계는, 감성 사전을 이용한 감성 분석을 통해 생활형편 감성 지수, 경제상황 감성 지수, 소득 감성 지수, 및 소비 감성 지수를 산출하고, 산출된 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성 지수, 및 상기 소비 감성 지수를 통합 지수화하여 상기 감성 지수를 산출할 수 있다.
또한, 상기 데이터 분석부는, 다중 회귀 분석(multiple regression analysis) 또는 머신 러닝(machine learning) 기법을 통해 상기 상관 함수를 도출할 수 있다.
또한, 상기 소비자 위치 정보는, 이동 통신사로부터 제공받을 수 있다.
또한, 상기 소셜 미디어 데이터는, 소셜 네트워크 서비스, 블로그, 온라인 뉴스 중 적어도 하나로부터 수집될 수 있다.
또한, 상기 감성지수를 산출하는 단계는, 상기 제1 기간에서의 비정형 데이터를 감성 분석하여 상기 제1 기간에서의 감성 지수를 산출하고, 상기 제2 기간에서의 비정형 데이터를 감성 분석하여 상기 제2 기간에서의 감성 지수를 산출할 수 있다.
이상 살펴본 바와 같은 본 발명에 따르면, 소셜 데이터와 같은 비정형 데이터를 활용함으로써, 속보성을 갖는 소비자심리지수의 제공이 가능한 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법을 제공할 수 있다.
또한, 본 발명에 따르면 비정형 데이터뿐만 아니라 경제 지표와 같은 정형 데이터도 함께 활용함으로써, 소비자심리지수의 신뢰성을 향상시킬 수 있는 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법을 제공할 수 있다.
도 1은 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법을 나타낸 도면이다.
도 2는 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템의 세부 구성을 나타낸 도면이다.
도 3은 본 발명의 실시예에 의한 저장부를 나타낸 도면이다.
도 4는 본 발명의 실시예에 의한 감성지수 산출부의 동작을 설명하기 위한 도면이다.
도 5는 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 의한 감성 지수 산출 단계를 설명하기 위한 도면이다.
도 7은 본 발명의 다른 실시예에 의한 감성 지수 산출 단계를 설명하기 위한 도면이다.
도 2는 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템의 세부 구성을 나타낸 도면이다.
도 3은 본 발명의 실시예에 의한 저장부를 나타낸 도면이다.
도 4는 본 발명의 실시예에 의한 감성지수 산출부의 동작을 설명하기 위한 도면이다.
도 5는 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 의한 감성 지수 산출 단계를 설명하기 위한 도면이다.
도 7은 본 발명의 다른 실시예에 의한 감성 지수 산출 단계를 설명하기 위한 도면이다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 이하의 설명에서 어떤 부분이 다른 부분과 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라 그 중간에 다른 소자를 사이에 두고 연결되어 있는 경우도 포함한다. 또한, 도면에서 본 발명과 관계없는 부분은 본 발명의 설명을 명확하게 하기 위하여 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 동일한 도면 부호를 붙였다.
이하, 본 발명의 실시예들과 관련된 도면들을 참고하여, 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법에 대해 설명하도록 한다.
도 1은 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법을 나타낸 도면이다.
도 1을 참조하면, 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템(100, 이하 소비자심리지수 제공 시스템이라고 함)은 네트워크와 연결됨으로써, 이를 통해 사용자 단말기(200)와 정보를 송수신하거나 다양한 정보(예를 들어, 정형 데이터 및 비정형 데이터)를 수집할 수 있다.
여기서, 네트워크는 단말 및 서버와 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예는, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 3G, 4G, 5G, LTE, Wi-Fi 등이 포함되나 이에 한정되지는 않는다. 인터넷은 TCP/IP 프로토콜 및 그 상위계층에 존재하는 여러 서비스, 즉 HTTP(HyperText Transfer Protocol), Telnet, FTP(File Transfer Protocol), DNS(Domain Name System), SMTP(Simple Mail Transfer Protocol), SNMP(Simple Network Management Protocol), NFS(Network File Service), NIS(Network Information Service)를 제공하는 개방형 컴퓨터 네트워크 구조를 의미한다.
사용자 단말기(200)는 네트워크를 통해 본 발명의 실시예에 의한 소비자심리지수 제공 시스템(100)에 접속할 수 있으며, 이를 통해 사용자는 소비자심리지수 제공 시스템(100)이 제공하는 다양한 서비스를 이용할 수 있다.
예를 들어, 소비자심리지수 제공 시스템(100)은 사용자에게 소비자심리지수 조회 서비스, 소비자심리지수 예측 서비스 등을 제공할 수 있다.
또한, 사용자 단말기(200)는 소비자심리지수 제공 시스템(100)과 연결되는 통신 기능과 이미지나 텍스트를 출력할 수 있는 디스플레이 기능을 갖춘 장치라면 특별히 한정되지 않는다. 예를 들어, 사용자 단말기(200)는, 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 태블릿(tablet) PC, 무선전화기(wireless phone), 모바일폰(mobile phone), 스마트폰(smart phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 내비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 영상 녹화기(digital picture recorder), 디지털 영상 재생기(digital picture player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player) 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
소비자심리지수 제공 시스템(100)은 네트워크를 통해 다양한 정보를 수집할 수 있다. 예를 들어, 소비자심리지수 제공 시스템(100)은 소비자심리지수의 산출 및 예측에 필요한 정형 데이터 및 비정형 데이터를 수집할 수 있다.
또한, 소비자심리지수 제공 시스템(100)은 수집된 방대한 양의 빅데이터 및 인공지능 기술을 이용하여, 소비자심리지수에 대한 산출 및 예측을 수행할 수 있다.
여기서, 빅데이터란 기존 데이터의 수집, 저장, 관리, 분석 역량을 넘어서는 데이터 세트를 의미한다. 빅데이터는 정형화 정도에 따라 정형 데이터, 반정형 데이터, 및 비정형 데이터로 분류될 수 있다. 정형 데이터(structured data)는 고정된 필드에 저장되는 데이터, 즉 일정한 형식을 갖추고 저장되는 데이터를 의미할 수 있다. 반정형 데이터(semi-structured data)는 고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마를 포함하는 데이터를 의미하는데, XML(Extensible Mark-up Language) 및 HTML(Hypertext Mark-up Language) 등을 예로 들 수 있다. 비정형 데이터(unstructured data)는 고정된 필드에 저장되어 있지 않은 데이터를 의미하는데, 텍스트 문서, 이미지 데이터, 동영상 데이터, 및 음성 데이터를 예로 들 수 있다.
본 발명의 실시예에 의한 소비자심리지수 제공 시스템(100)은 상술한 바와 같은 빅데이터를 수집하고 분석할 수 있다. 빅데이터 분석 기술로는 텍스트 마이닝(text mining), 평판 분석(opinion mining), 소셜 네트워크 분석(social network analysis), 군집 분석(cluster analysis), 신경망 분석(neural network analysis), 및 마코브 모델(markov model)을 예로 들 수 있으나, 예시된 분석 기술들로 한정되는 것은 아니다. 텍스트 마이닝은 반정형 텍스트 데이터 또는 비정형 텍스트 데이터에서 자연 언어 처리 기술에 기반하여 유용한 정보를 추출, 가공하는 기술일 수 있다. 자연 언어 처리(Natural Language Processing; NLP) 기술은 자연 언어 이해와 자연 언어 생성이 가능하도록 하는 기술이며, 자연 언어란 사람이 의사소통을 하기 위해 사용하는 용어로 인공 언어(컴퓨터 언어)와 반대되는 개념일 수 있다. 자연 언어 이해란 자연 언어를 기계적으로 분석해서 컴퓨터가 이해할 수 있는 형태로 만드는 것을 의미할 수 있다. 자연 언어 생성은 컴퓨터가 자연 언어를 출력할 수 있도록 하는 것을 의미할 수 있다. 자연 언어 처리 기술은 형태소 분석, 구문 분석, 의미 분석, 및 화용 분석으로 이루어질 수 있다. 평판 분석은 블로그(blog), 소셜 네트워크 서비스(Social Network Service; SNS), 위키(Wiki), 손수제작물(UCC), 마이크로 블로그(Micro-Blog) 등과 같은 소셜 미디어(social media)에서 정형 텍스트 및 비정형 텍스트를 수집 및 분석하여, 제품이나 서비스에 대한 평판(예를 들어, 긍정, 부정, 중립)을 판별하는 기술일 수 있다. 소셜 네트워크 분석은 소셜 네트워크 연결구조 및 연결강도 등에 기초하여, 사용자의 영향력, 관심사, 및 성향을 분석하고, 추출하는 기술일 수 있다. 군집 분석은 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사한 특성을 가진 군을 발굴하는 기술일 수 있다.
한편, 인공지능(AI: Artificial Intelligence)이라는 용어가 등장한 지는 오랜 시간이 흘렀지만 컴퓨터, 연산 등 특정 영역에 국한됐던 과거와는 달리 현대에는 인지, 학습, 추론 등 인간의 고차원적 정보처리 활동을 연구해 ICT를 통해 구현하는 기반 기술 전체를 아우르는 포괄적 개념이 되었다. 알파고 못지않게 인공지능 분야의 최강자라고 할 수 있는 IBM의 경우, 지난 2011년 미국 유명 퀴즈쇼 '제퍼디'에서 우승한 슈퍼컴퓨터 '왓슨'을 발전시켜 인지컴퓨팅(Cognitive computing)이라는 새로운 영역으로 확대시켰다. 즉, 인공지능을 통해 인지 학습이 가능하다는 것이다. 여기서, 인지 학습(cognitive learning)이란 학습의 한 형태로 가시적 또는 직접적으로 관찰할 수 없는 심리적 과정, 특히 인지적 과정을 통해 일어나는 학습 형태를 의미할 수 있다. 구체적으로, 인지 학습에 포함되는 하위 유형은 통찰 학습(insight learning), 잠재 학습(latent learning), 관찰 학습(observational learning) 등이 있을 수 있다.
최근 인공지능 기술의 발전과 관심이 증가하면서 이를 응용한 기술들이 등장하고 있다. 인공지능 기술의 한 분야로서 머신러닝(Machine Learning)이 각종 매체를 통해 집중 조명을 받고 있다. 기계학습이라고도 불리는 머신러닝은 컴퓨터가 데이터를 통해 학습하고, 사람처럼 어떤 대상 혹은 상황을 이해할 수 있게 하는 기술일 수 있는데, 컴퓨터를 학습시켜 패턴을 찾아내 분류하는 기술적 방식으로 컴퓨터가 데이터를 분석할 수 있게 하는 알고리즘이 핵심일 수 있다. 데이터를 활용하는 알고리즘을 정교하게 만들면 컴퓨터가 학습해가며 사용자들에게 의미 있는 결과물을 제공할 수 있다.
도 2는 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 시스템의 세부 구성을 나타낸 도면이고, 도 3은 본 발명의 실시예에 의한 저장부를 나타낸 도면이며, 도 4는 본 발명의 실시예에 의한 감성지수 산출부의 동작을 설명하기 위한 도면이다.
도 2를 참조하면, 본 발명의 실시예에 의한 소비자심리지수 제공 시스템(100)은 저장부(110), 데이터 수집부(120), 감성지수 산출부(130), 데이터 분석부(140), 및 소비자심리지수 산출부(150)를 포함할 수 있다.
저장부(110)는 소비자심리지수 제공 시스템(100)의 동작에 필요한 다양한 정보들이 저장될 수 있다. 예를 들어, 도 3을 참조하면 저장부(110)에는 제1 정형 데이터(DS1), 제2 정형 데이터(DS2), 비정형 데이터(DU), 감성 사전(SD) 등이 저장될 수 있다.
제1 정형 데이터(DS1)는 경제 지표에 관한 데이터를 포함할 수 있다. 예를 들어, 제1 정형 데이터(DS1)는 민간 소비지출, 가계 내구재 소비지출, 가계 준내구재 소비지출, 가계 비내구재 소비지출, 소매판매액지수, 서비스업생산지수, 소비자물가지수, 민간 소비지출 증감률, 가계 내구재 소비지출 증감률, 가계 준내구재 소비지출 증감률, 가계 비내구재 소비지출 증감률, 소매판매액지수 증감률, 서비스업생산지수 증감률, 및 소비자물가지수 증감률 중 적어도 하나를 포함하는 제1 경제 지표와 주가, 환율, 금리, 유가, 원자재 가격, 처분가능 소득, 주가 증감률, 환율 증감률, 금리 증감률, 유가 증감률, 원자재 가격 증감률, 및 처분가능 소득 증감률 중 적어도 하나를 포함하는 제2 경제 지표를 포함할 수 있다.
예를 들어, 금리는 기준 금리, 가계 대출 금리, 국채, 공채, 특수채, 금융채, 회사채, 여전채 등에 대한 금리 등을 포함할 수 있다. 또한, 원자재는 가스오일, 난방유, 천연가스, 구리, 납, 아연, 니켈, 알루미늄합금, 주석, 옥수수, 설탕, 대두, 대두박, 대두유, 면화, 소맥, 쌀, 오렌지주스, 커피, 코코아 등에 대한 가격 및 변동율 등을 포함할 수 있다.
이러한 제1 경제 지표와 제2 경제 지표는 시계열적으로 저장될 수 있으며, 이를 위하여 관련 시기 정보(예를 들어, 일, 월, 분기, 년 정보)와 함께 인덱싱되어 저장될 수 있다.
제2 정형 데이터(DS2)는 소비자 위치 정보를 포함할 수 있다. 예를 들어, 소비자 위치 정보는 적어도 하나 이상의 지역별로 위치하고 있는 소비자 수에 관한 데이터를 포함할 수 있다.
이러한 소비자 위치 정보는 시계열적으로 저장될 수 있으며, 이를 위하여 관련 시기 정보(예를 들어, 날짜, 시간 등)와 함께 인덱싱되어 저장될 수 있다.
일례로, 소비자 위치 정보는 하기와 같은 형태로 구성될 수 있다.
시기 | A 지역 | B 지역 | C 지역 | D 지역 |
2018.2.1 19:00 |
10,561명 | 75,780명 | 5,622명 | 34,789명 |
2018.2.2 19:00 |
9,456명 | 64,245명 | 4,805명 | 28,323명 |
2018년 2월 평균 |
9,641명 | 68,753명 | 5,150명 | 29,804명 |
지역은 행정구역 단위(예를 들어, 구, 동 등)로 분류되거나, 상권 단위(예를 들어, 종로구 광화문 상권, 중구 명동거리 상권, 용산구 경리단길 상권, 강남구 가로수길 상권, 관악구 샤로수길 상권 등)로 분류될 수 있다. 또한, 소비자 위치 정보는 매일 특정 시간대를 중심으로 저장되거나, 특정 기간 단위(예를 들어, 일, 주, 월, 주말 등) 또는 특정 시간 단위로 해당 지역 내에 위치한 평균 소비자 수를 저장할 수 있다.
앞서 설명한 소비자 위치 정보의 형태는 예시적인 것이며, 해당 형태는 다양하게 변화될 수 있다.
이러한 소비자 위치 정보는 이동 통신사로부터 제공받을 수 있다. 즉, 이동 통신사의 경우 기지국 기반의 사용자 위치 정보를 보유하고 있으므로, 이를 본 발명의 소비자 위치 정보로 활용할 수 있다.
비정형 데이터(DU)는 소셜 미디어 데이터를 포함할 수 있다. 소셜 미디어 데이터는 인터넷 등의 네트워크와 접속되는 고정형 컴퓨터 또는 모바일 기기를 통해 입력되는 미디어 데이터로서, 네트워크와 접속된 다른 사용자와 상호 공유될 수 있는 데이터이다. 예를 들어, 소셜 미디어 데이터는 소셜 미디어 서버에서 운영하는 소셜 미디어 사이트들 및 다양한 포털 사이트 등에서 운영하며 개인화된 컨텐츠가 포함된 블로그, 온라인 뉴스 등과 같은 소셜 미디어로부터 수집된 비정형 데이터를 포함할 수 있다.
소셜 미디어 사이트들은 소위 소셜 네트워크 서비스로서, 트위터(twitter), 페이스북(facebook), 다양한 포털 사이트 등에서 서비스하는 소셜 미디어일 수 있다.
감성 사전(SD)은 비정형 데이터(DU)의 감성 분석을 위한 감성 어휘들을 포함할 수 있다. 감성 사전(SD)에 대해서는 추후 자세히 설명하도록 한다.
데이터 수집부(120)는 네트워크를 통해 제1 정형 데이터(DS1) 및 비정형 데이터(DU)와 같은 다양한 온라인 정보를 수집할 수 있으며, 수집된 정보를 저장부(110)에 저장할 수 있다.
이러한 온라인 정보는 외부의 데이터베이스, 서버, 홈페이지, 웹페이지, 사이트, 소셜 미디어, 블로그, 온라인 뉴스, 온라인 신문, SNS 등과 같은 다양한 경로를 통해 수집될 수 있으며, 네트워크를 통해 수집될 수 있는 온라인 정보라면 데이터 수집부(120)에 의한 수집 대상이 될 수 있다.
또한, 데이터 수집부(120)는 이동 통신사 서버에 접속하여, 소비자 위치 정보와 관련된 제2 정형 데이터(DS2)를 수집할 수 있으며, 이를 가공하여 저장부(110)에 저장하는 기능을 함께 수행할 수도 있다.
감성지수 산출부(130)는 데이터 수집부(120)에 의해 수집된 비정형 데이터(DU)를 감성 분석하여 감성 지수를 산출할 수 있다.
이때, 감성지수 산출부(130)는 저장부(110)에 저장된 감성 사전(SD)를 이용하여 특정 기간 단위(제1 기간 및 제2 기간)로 감성 분석을 수행할 수 있다. 예를 들어, 감성지수 산출부(130)는 제1 기간 동안 발생된 비정형 데이터(DU)를 이용하여 제1 기간에서의 감성 지수를 산출할 수 있으며, 또한 제2 기간 동안 발생된 비정형 데이터(DU)를 이용하여 제2 기간에서의 감성 지수를 산출할 수 있다. 이때, 제2 기간은 제1 기간의 이후 기간으로 설정될 수 있다.
감성 분석은 정형화되지 않은 텍스트로부터 사람들의 태도, 의견 혹은 성향과 같은 정보를 알아내는 기법이다. 소비자의 감정과 관련된 텍스트 정보를 자동으로 추출하는 텍스트마이닝 기술의 한 영역이기도한데, 감성어휘로 구성된 감성 사전을 활용하는 방법이 있다. 감성 사전이란 긍정적이거나 부정적인 감정을 나타내는 단어들을 모아놓은 사전이다.
감성 분석은 각 문서의 최소단위인 단어의 감성 극성(sentiment polarity)에 따라 결정되며, 단어의 감성 극성(예를 들어, 긍정 및 부정)이 미리 정의된 감성 사전을 구축한 후, 수집된 비정형 데이터(DU)에 포함된 단어와 감성 사전의 비교를 통해 이루어질 수 있다.
감성지수 산출부(130)는 수집된 비정형 데이터(DU)에서 단어들을 추출한 후, 이를 감성 사전(SD)과 비교함으로써 감성 지수(SI)를 산출할 수 있다. 즉, 감성지수 산출부(130)는 감성 사전(SD)과의 비교를 통해 수집된 비정형 데이터(DU)에 포함된 긍정 어휘 수와 부정 어휘 수를 산출해 낼 수 있다.
예를 들어, 감성 지수 산출부(130)는 하기 수식을 통해 감성 지수(SI)를 산출할 수 있다.
(여기서, A는 긍정 어휘수, B는 부정 어휘수)
다만, 상기 수식은 일 실시예에 불과하므로, 감성 지수(SI)의 산출 방식은 다양하게 변화될 수 있다.
일례로, 감성 사전(SD)은 소비자심리지수와 관련도가 높은 주제를 갖는 생활형편 감성사전(SD1), 경제상황 감성사전(SD2), 소득 감성사전(SD3), 및 소비 감성사전(SD4)을 포함할 수 있다.
즉, 생활형편 감성사전(SD1)은 '생활형편'과 관련된 긍정 어휘들과 부정 어휘들을 포함하고, 경제상황 감성사전(SD2)은 '경제상황'과 관련한 긍정 어휘들과 부정 어휘들을 포함할 수 있다. 또한, 소득 감성사전(SD3)은 '소득'과 관련한 긍정 어휘들과 부정 어휘들을 포함하고, 소비 감성사전(SD4)은 '소비'와 관련한 긍정 어휘들과 부정 어휘들을 포함할 수 있다.
따라서, 감성지수 산출부(130)는 수집된 비정형 데이터(DU)에서 추출된 단어들을 각 감성 사전(SD1~SD4)와 비교함으로써, 각 감성 사전(SD1~SD4)과 관련된 생활형편 감성지수(SI1), 경제상황 감성지수(SI2), 소득 감성지수(SI3), 및 소비 감성지수(SI4)를 산출할 수 있다.
이후, 감성지수 산출부(130)는 생활형편 감성지수(SI1), 경제상황 감성지수(SI2), 소득 감성지수(SI3), 및 소비 감성지수(SI4)로 구성된 감성 지수(SI)를 데이터 분석부(140)에 전달할 수 있다.
다른 실시예에서, 감성지수 산출부(130)는 생활형편 감성지수(SI1), 경제상황 감성지수(SI2), 소득 감성지수(SI3), 및 소비 감성지수(SI4)를 통합 지수화하여 하나의 감성 지수(SI)를 형성한 뒤, 해당 감성 지수(SI)를 데이터 분석부(140)에 전달할 수 있다.
이러한 통합 지수화 방식에는 다양한 방식이 사용될 수 있다. 일례로 다중 회귀 분석(multiple regression analysis) 기법을 통한 상관 함수를 도출하고, 이를 이용하여 통합 지수화를 수행할 수 있다.
즉, 감성지수 산출부(130)는 생활형편 감성지수(SI1), 경제상황 감성지수(SI2), 소득 감성지수(SI3), 및 소비 감성지수(SI4)를 독립 변수로 하고, 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출할 수 있다. 이 경우, 상관 함수는 다음과 같이 표현될 수 있다.
(여기서, Y는 종속 변수, SI1은 생활형편 감성지수, SI2는 경제상황 감성지수, SI3은 소득 감성지수, SI4는 소비 감성지수, a, b, c, d, e는 상수, t는 시간)
상기와 같은 상관 함수 도출 후, 특정 기간(제1 기간 또는 제2 기간)에서의 감성지수들(SI1~SI4)를 독립 변수에 적용하여 최종 통합 지수화된 감성 지수(SI)를 산출할 수 있다.
한편, 감성지수 산출부(130)는 머신 러닝(machine learning) 기법을 통해 상관 함수를 도출할 수 있다. 이 경우, 상관 함수는 다음과 같이 표현될 수 있다.
(여기서, Y는 종속 변수, SI1은 생활형편 감성지수, SI2는 경제상황 감성지수, SI3은 소득 감성지수, SI4는 소비 감성지수, t는 시간)
데이터 분석부(140)는 소비자심리지수의 산출을 위한 상관 함수를 도출할 수 있다. 예를 들어, 데이터 분석부(140)는 제1 기간에서의 제2 경제 지표, 소비자 위치 정보, 및 감성 지수(SI)를 독립 변수로 하고, 상기 제1 기간에서의 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출할 수 있다.
즉, 데이터 분석부(140)는 과거 특정 기간(제1 기간)에 대응되는 데이터 및 감성 지수(SI)를 이용하여 소비자심리지수 산출에 사용되는 상관 함수를 생성할 수 있다.
일례로, 소비자심리지수와 밀접한 관계(동등성)가 있는 제1 경제 지표를 종속 변수로 하고, 그 외 소비자심리지수에 간접 영향을 줄 수 있는 인자인 제2 경제 지표, 소비자 위치 정보, 및 감성 지수(SI)를 독립 변수로 하는 상관 함수를 다중 회귀 분석 기법을 통해 도출할 수 있다. 이 경우, 상관 함수는 다음과 같이 표현될 수 있다.
(여기서, Y는 종속 변수, EI는 제2 경제 지표, PI는 소비자 위치 정보, SI는 감성 지수, a, b, c, d는 상수, t는 시간)
한편, 감성 지수(SI)의 경우 앞서 설명한 바와 같이 하나의 지수로서 통합될 수 있다. 이와 같이, 소비자 위치 정보 역시 데이터 분석부(140)에 의해 하나의 지수로 통합될 수 있다.
이러한 소비자 위치 정보의 통합 지수화 방식에는 다양한 방식이 사용될 수 있다. 일례로 다중 회귀 분석 기법을 통한 상관 함수를 도출하고, 이를 이용하여 통합 지수화를 수행할 수 있다.
즉, 데이터 분석부(140)는 다수의 지역별 소비자 위치 정보를 독립 변수로 하고, 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출할 수 있다. 예를 들어, 소비자 위치 정보가 A 지역, B 지역, C 지역, 및 D 지역의 소비자 수로 구성되는 경우, 상관 함수는 다음과 같이 표현될 수 있다.
(여기서, Y는 종속 변수, PI1은 A지역의 소비자 수, PI2는 B지역의 소비자 수, PI3은 C지역의 소비자 수, PI4는 D지역의 소비자 수, a, b, c, d, e는 상수, t는 시간)
상기와 같은 상관 함수 도출 후, 특정 기간(제1 기간 또는 제2 기간)에서의 소비자 위치 정보를 독립 변수에 적용하여 최종 통합 지수화된 소비자 위치 정보를 산출할 수 있다.
한편, 데이터 분석부(140)는 머신 러닝(machine learning) 기법을 통해 상관 함수를 도출할 수 있다. 이 경우, 상관 함수는 다음과 같이 표현될 수 있다.
(여기서, Y는 종속 변수, PI1은 A지역의 소비자 수, PI2는 B지역의 소비자 수, PI3은 C지역의 소비자 수, PI4는 D지역의 소비자 수, t는 시간)
한편, 제2 경제 지표(EI), 소비자 위치 정보(PI), 및 감성 지수(SI)는 각각 다수의 독립 변수를 구성할 수 있다.
즉, 앞서 설명한 제2 경제 지표(EI) 중 적어도 2개 이상이 다수의 독립 변수를 구성할 수 있다. 또한, 소비자 위치 정보(PI)는 복수의 지역에 대한 소비자 위치 정보가 다수의 독립 변수를 구성할 수 있으며, 감성 지수(SI)의 경우 생활형편 감성지수(SI1), 경제상황 감성지수(SI2), 소득 감성지수(SI3), 및 소비 감성지수(SI4)가 다수의 독립 변수를 구성할 수 있다.
한편, 데이터 분석부(140)는 소비자심리지수의 예측성을 강화하기 위하여, 소정의 시차(i)를 둔 데이터를 이용하여 상관 함수를 도출할 수 있다. 즉, 시차(i)항의 개수가 N으로 설정된 경우, 상관 함수는 하기와 같이 표현될 수 있다. 하기 예는 최소 시차가 1인 경우로, 예측성을 강화하기 위하여 최소 시차의 값을 증가시킬 수 있다. 이와 같이 산출된 상관 함수는 가까운 미래의 소비에 대한 예측 지수의 의미를 갖게 된다.
한편, 데이터 분석부(140)는 머신 러닝 기법을 통해 상관 함수를 도출할 수 있다. 이 경우, 상관 함수는 다음과 같이 표현될 수 있다.
(여기서, Y는 종속 변수, EI는 제2 경제 지표, PI는 소비자 위치 정보, SI는 감성 지수, t는 시간)
이 경우에도 제2 경제 지표(EI), 소비자 위치 정보(PI), 및 감성 지수(SI)는 각각 다수의 독립 변수를 구성할 수 있다. 또한, 이 경우에도 데이터 분석부(140)는 소비자심리지수의 예측성을 강화하기 위하여, 소정의 시차(i)를 둔 데이터를 이용하여 상관 함수를 도출할 수 있다. 즉, 시차(i)항의 개수가 N으로 설정된 경우, 상관 함수는 하기와 같이 표현될 수 있다. 하기 예는 최소 시차가 1인 경우로, 예측성을 강화하기 위하여 최소 시차의 값을 증가시킬 수 있다. 이와 같이 산출된 상관 함수는 가까운 미래의 소비에 대한 예측 지수의 의미를 갖게 된다.
소비자심리지수 산출부(150)는 데이터 분석부(140)에 의해 도출된 상관 함수를 이용하여 소비자심리지수를 산출할 수 있다.
예를 들어, 소비자심리지수 산출부(150)는 최근 특정 기간(제2 기간)에 대응되는 데이터(제2 경제 지표 및 소비자 위치 정보) 및 감성 지수(SI)를 상관 함수의 독립 변수에 적용함으로써, 소비자심리지수를 산출할 수 있다.
이때, 제2 기간은 앞서 설명한 제1 기간 이후의 기간으로 설정될 수 있으며, 제1 기간과 제2 기간의 범위는 일 단위, 주 단위, 월 단위, 분기 단위, 년 단위 등 다양하게 설정될 수 있다.
또한, 소비자심리지수 산출부(150)는 주기적으로 소비자심리지수를 갱신할 수 있다.
예를 들어, 2월 소비자심리지수의 경우, 월 단위로 발표되는 제2 경제 지표를 고정값으로 유지한 상태로 소비자 위치 정보 및/또는 감성 지수를 일 단위 또는 주 단위 등으로 갱신하며, 속보성을 갖는 소비자심리지수를 산출할 수 있다.
한편, 소비자심리지수 산출부(150)는 산출된 소비자심리지수를 네트워크롤 통해 사용자 단말기(200)로 제공할 수 있다.
도 5는 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 방법을 설명하기 위한 도면이고, 도 6은 본 발명의 일 실시예에 의한 감성 지수 산출 단계를 설명하기 위한 도면이며, 도 7은 본 발명의 다른 실시예에 의한 감성 지수 산출 단계를 설명하기 위한 도면이다.
도 1 내지 도 7을 참조하여, 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 방법에 대하여 설명하도록 한다.
도 5를 참조하면, 본 발명의 실시예에 의한 빅데이터 기반 소비자심리지수 제공 방법은 데이터 수집 단계(S100), 감성 지수 산출 단계(S200), 상관 함수 도출 단계(S300), 및 소비자심리지수 산출 단계(S400)를 포함할 수 있다.
데이터 수집 단계(S100)에서는 제1 경제 지표와 제2 경제 지표를 포함하는 제1 정형 데이터(DS1), 소비자 위치 정보를 포함하는 제2 정형 데이터(DS2), 및 소셜 미디어 데이터를 포함하는 비정형 데이터(DU)를 수집할 수 있다.
예를 들어, 제1 정형 데이터(DS1)의 경우 경제 지표를 제공하는 기관 서버 등으로부터 수집될 수 있고, 제2 정형 데이터(DS2)의 경우 사용자 위치 정보를 제공하는 이동 통신사 서버 등으로부터 수집될 수 있으며, 비정형 데이터(DU)의 경우 소셜 네트워크 서비스, 블로그, 온라인 뉴스 중 적어도 하나로부터 수집될 수 있다.
감성 지수 산출 단계(S200)에서는 감성 사전(SD)를 이용하여 특정 기간 단위(제1 기간 및 제2 기간)로 감성 분석을 수행할 수 있다.
예를 들어, 본 단계(S200)는 제1 기간 동안 발생된 비정형 데이터(DU)를 이용하여 제1 기간에서의 감성 지수를 산출할 수 있으며, 또한 제1 기간 이후로 설정되는 제2 기간 동안 발생된 비정형 데이터(DU)를 이용하여 제2 기간에서의 감성 지수를 산출할 수 있다.
또한 도 6을 참조하면, 본 발명의 일 실시예에 의한 감성 지수 산출 단계(S200)에서는 생활형편 감성지수 산출 단계(S210), 경제상황 감성지수 산출 단계(S220), 소득 감성지수 산출 단계(S230), 및 소비 감성지수 산출 단계(S240)가 수행될 수 있다.
생활형편 감성지수 산출 단계(S210)에서는 수집된 비정형 데이터(DU)에서 추출된 단어들을 생활형편 감성 사전(SD1)과 비교하여, 긍정 어휘 수 및 부정 어휘 수의 빈도를 통해 생활형편 감성지수(SI1)를 산출할 수 있다.
경제상황 감성지수 산출 단계(S220)에서는 수집된 비정형 데이터(DU)에서 추출된 단어들을 경제상황 감성 사전(SD2)과 비교하여, 긍정 어휘 수 및 부정 어휘 수의 빈도를 통해 경제상황 감성지수(SI2)를 산출할 수 있다.
소득 감성지수 산출 단계(S230)에서는 수집된 비정형 데이터(DU)에서 추출된 단어들을 소득 감성 사전(SD3)과 비교하여, 긍정 어휘 수 및 부정 어휘 수의 빈도를 통해 소득 감성지수(SI3)를 산출할 수 있다.
소비 감성지수 산출 단계(S240)에서는 수집된 비정형 데이터(DU)에서 추출된 단어들을 소비 감성 사전(SD4)과 비교하여, 긍정 어휘 수 및 부정 어휘 수의 빈도를 통해 소비 감성지수(SI4)를 산출할 수 있다.
한편, 도 7을 참조하면, 본 발명의 일 실시예에 의한 감성 지수 산출 단계(S200')에서는 감성 지수 통합 단계(S250)가 추가적으로 수행될 수 있다.
감성 지수 통합 단계(S250)에서는 생활형편 감성지수(SI1), 경제상황 감성지수(SI2), 소득 감성지수(SI3), 및 소비 감성지수(SI4)를 통합 지수화하여 하나의 감성 지수(SI)를 형성할 수 있다.
이러한 통합 지수화 방식에는 다양한 방식이 사용될 수 있다. 일례로 다중 회귀 분석 또는 머신 러닝 기법을 통한 상관 함수를 도출하고, 이를 이용하여 최종 감성 지수(SI)의 통합 지수화를 수행할 수 있다.
상관 함수 도출 단계(S300)에서는 제1 기간에서의 제2 경제 지표, 소비자 위치 정보, 및 감성 지수(SI)를 독립 변수로 하고, 상기 제1 기간에서의 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출할 수 있다.
즉, 본 단계(S300)에서는 다중 회귀 분석(multiple regression analysis) 또는 머신 러닝(machine learning) 기법을 통해 과거 특정 기간(제1 기간)에 대응되는 데이터 및 감성 지수(SI)를 이용하여 소비자심리지수 산출에 사용되는 상관 함수를 생성할 수 있다.
본 단계(S300)에서는 다수의 제2 경제 지표 및 다수의 소비자 위치 정보를 독립 변수로 사용할 수 있다.
또한, 도 6과 관련하여 살펴본 바와 같이 감성 지수 산출 단계(S200)에서 4개의 감성 지수(SI1~SI4)가 생성된 경우, 상기 4개의 감성 지수(SI1~SI4)를 모두 독립 변수로 활용할 수 있다.
한편, 도 7과 관련하여 살펴본 바와 같이 감성 지수 산출 단계(S200')에서 통합 지수화된 1개의 감성 지수(SI)가 생성된 경우, 상기 1개의 감성 지수(SI)만을 독립 변수로 활용할 수 있다.
소비자심리지수 산출 단계(S400)에서는 상관 함수 도출 단계(S300)에서 도출된 상관 함수와 상기 제1 기간 이후의 제2 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수(SI)를 이용하여 소비자심리지수를 산출할 수 있다.
예를 들어, 소비자심리지수 산출부(150)는 최근 특정 기간(제2 기간)에 대응되는 데이터(제2 경제 지표 및 소비자 위치 정보) 및 감성 지수(SI)를 상관 함수의 독립 변수에 적용함으로써, 소비자심리지수를 산출할 수 있다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이지 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 소비자심리지수 제공 시스템
110: 저장부
120: 데이터 수집부
130: 감성지수 산출부
140: 데이터 분석부
150: 소비자심리지수 산출부
200: 사용자 단말기
DS1: 제1 정형 데이터
DS2: 제2 정형 데이터
DU: 비정형 데이터
SD: 감성 사전
110: 저장부
120: 데이터 수집부
130: 감성지수 산출부
140: 데이터 분석부
150: 소비자심리지수 산출부
200: 사용자 단말기
DS1: 제1 정형 데이터
DS2: 제2 정형 데이터
DU: 비정형 데이터
SD: 감성 사전
Claims (20)
- 제1 경제 지표와 제2 경제 지표를 포함하는 제1 정형 데이터, 소비자 위치 정보를 포함하는 제2 정형 데이터, 소셜 미디어 데이터를 포함하는 비정형 데이터 및 감성 사전이 저장되는 저장부;
상기 제1 정형 데이터, 상기 제2 정형 데이터, 및 상기 비정형 데이터를 수집하는 데이터 수집부;
상기 비정형 데이터를 감성 분석하여 감성 지수를 산출하는 감성지수 산출부;
제1 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 독립 변수로 하고, 상기 제1 기간에서의 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출하는 데이터 분석부; 및
상기 상관 함수와 상기 제1 기간 이후의 제2 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 이용하여 소비자심리지수를 산출하는 소비자심리지수 산출부; 를 포함하고,
상기 제1 경제 지표는, 민간 소비지출, 가계 내구재 소비지출, 가계 준내구재 소비지출, 가계 비내구재 소비지출, 소매판매액지수, 서비스업생산지수, 소비자물가지수, 민간 소비지출 증감률, 가계 내구재 소비지출 증감률, 가계 준내구재 소비지출 증감률, 가계 비내구재 소비지출 증감률, 소매판매액지수 증감률, 서비스업생산지수 증감률, 및 소비자물가지수 증감률 중 적어도 하나를 포함하며,
상기 제2 경제 지표는, 환율, 금리, 유가, 원자재 가격, 처분가능 소득, 주가 증감률, 환율 증감률, 금리 증감률, 유가 증감률, 원자재 가격 증감률, 및 처분가능 소득 증감률 중 적어도 하나를 포함하고,
상기 감성 사전은, 생활형편과 관련된 긍정 어휘들과 부정 어휘들을 포함하는 생활형편 감성사전, 경제상황과 관련한 긍정 어휘들과 부정 어휘들을 포함하는 경제상황 감성사전, 소득과 관련한 긍정 어휘들과 부정 어휘들을 포함하는 소득 감성사전, 및 소비와 관련한 긍정 어휘들과 부정 어휘들을 포함하는 소비 감성사전을 포함하며,
상기 감성지수 산출부는, 상기 생활형편 감성사전, 상기 경제상황 감성사전, 상기 소득 감성사전, 및 상기 소비 감성사전을 이용한 감성 분석을 통해 생활형편 감성 지수, 경제상황 감성 지수, 소득 감성 지수, 및 소비 감성 지수를 산출하고, 산출된 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성 지수, 및 상기 소비 감성 지수를 통합 지수화하여 상기 감성 지수를 산출하고,
상기 데이터 수집부는, 이동 통신사 서버로부터 상기 소비자 위치 정보를 수집하며,
상기 이동 통신사 서버로부터 수집된 소비자 위치 정보는, 기지국 기반의 사용자 위치 정보이고,
상기 감성지수 산출부는, 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성지수 및 상기 소비 감성지수를 독립 변수로 하고, 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출한 후, 상기 제1 기간 또는 상기 제2 기간에서의 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성지수 및 상기 소비 감성지수를 이용하여 상기 감성 지수를 산출하며,
상기 소비자 위치 정보는, 적어도 하나 이상의 지역별로 위치한 소비자 수를 포함하고,
특정 시간대에 각 지역에 위치한 소비자 수 또는 특정 기간 단위 동안 각 지역에 위치한 평균 소비자 수가 상기 저장부에 저장되는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 시스템. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항에 있어서,
상기 데이터 분석부는, 다중 회귀 분석(multiple regression analysis) 또는 머신 러닝(machine learning) 기법을 통해 상기 상관 함수를 도출하는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 시스템. - 삭제
- 제1항에 있어서,
상기 소셜 미디어 데이터는, 소셜 네트워크 서비스, 블로그, 온라인 뉴스 중 적어도 하나로부터 수집되는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 시스템. - 제1항에 있어서,
상기 감성지수 산출부는, 상기 제1 기간에서의 비정형 데이터를 감성 분석하여 상기 제1 기간에서의 감성 지수를 산출하고, 상기 제2 기간에서의 비정형 데이터를 감성 분석하여 상기 제2 기간에서의 감성 지수를 산출하는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 시스템. - 데이터 수집부가 제1 경제 지표와 제2 경제 지표를 포함하는 제1 정형 데이터, 소비자 위치 정보를 포함하는 제2 정형 데이터, 및 소셜 미디어 데이터를 포함하는 비정형 데이터를 수집하여 저장부에 저장하는 단계;
감성지수 산출부가 상기 비정형 데이터를 감성 분석하여 감성 지수를 산출하는 단계;
데이터 분석부가 제1 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 독립 변수로 하고, 상기 제1 기간에서의 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출하는 단계; 및
소비자심리지수 산출부가 상기 상관 함수와 상기 제1 기간 이후의 제2 기간에서의 상기 제2 경제 지표, 상기 소비자 위치 정보, 및 상기 감성 지수를 이용하여 소비자심리지수를 산출하는 단계; 를 포함하고,
상기 제1 경제 지표는, 민간 소비지출, 가계 내구재 소비지출, 가계 준내구재 소비지출, 가계 비내구재 소비지출, 소매판매액지수, 서비스업생산지수, 소비자물가지수, 민간 소비지출 증감률, 가계 내구재 소비지출 증감률, 가계 준내구재 소비지출 증감률, 가계 비내구재 소비지출 증감률, 소매판매액지수 증감률, 서비스업생산지수 증감률, 및 소비자물가지수 증감률 중 적어도 하나를 포함하며,
상기 제2 경제 지표는, 환율, 금리, 유가, 원자재 가격, 처분가능 소득, 주가 증감률, 환율 증감률, 금리 증감률, 유가 증감률, 원자재 가격 증감률, 및 처분가능 소득 증감률 중 적어도 하나를 포함하고,
상기 저장부에 저장된 감성 사전은, 생활형편과 관련된 긍정 어휘들과 부정 어휘들을 포함하는 생활형편 감성사전, 경제상황과 관련한 긍정 어휘들과 부정 어휘들을 포함하는 경제상황 감성사전, 소득과 관련한 긍정 어휘들과 부정 어휘들을 포함하는 소득 감성사전, 및 소비와 관련한 긍정 어휘들과 부정 어휘들을 포함하는 소비 감성사전을 포함하며,
상기 감성지수를 산출하는 단계는, 상기 생활형편 감성사전, 상기 경제상황 감성사전, 상기 소득 감성사전, 및 상기 소비 감성사전을 이용한 감성 분석을 통해 생활형편 감성 지수, 경제상황 감성 지수, 소득 감성 지수, 및 소비 감성 지수를 산출하고, 산출된 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성 지수, 및 상기 소비 감성 지수를 통합 지수화하여 상기 감성 지수를 산출하고,
상기 데이터 수집부는, 이동 통신사 서버로부터 상기 소비자 위치 정보를 수집하며,
상기 이동 통신사 서버로부터 수집된 소비자 위치 정보는, 기지국 기반의 사용자 위치 정보이고,
상기 감성 지수를 산출하는 단계에서, 상기 감성지수 산출부가, 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성지수 및 상기 소비 감성지수를 독립 변수로 하고, 상기 제1 경제 지표를 종속 변수로 하는 상관 함수를 도출한 후, 상기 제1 기간 또는 상기 제2 기간에서의 상기 생활형편 감성 지수, 상기 경제상황 감성 지수, 상기 소득 감성지수 및 상기 소비 감성지수를 이용하여 상기 감성 지수를 산출하며,
상기 소비자 위치 정보는, 적어도 하나 이상의 지역별로 위치한 소비자 수를 포함하고,
상기 저장부는, 특정 시간대에 각 지역에 위치한 소비자 수 또는 특정 기간 단위 동안 각 지역에 위치한 평균 소비자 수를 저장하는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제11항에 있어서,
상기 데이터 분석부는, 다중 회귀 분석(multiple regression analysis) 또는 머신 러닝(machine learning) 기법을 통해 상기 상관 함수를 도출하는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 방법. - 삭제
- 제11항에 있어서,
상기 소셜 미디어 데이터는, 소셜 네트워크 서비스, 블로그, 온라인 뉴스 중 적어도 하나로부터 수집되는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 방법. - 제11항에 있어서,
상기 감성지수를 산출하는 단계는, 상기 제1 기간에서의 비정형 데이터를 감성 분석하여 상기 제1 기간에서의 감성 지수를 산출하고, 상기 제2 기간에서의 비정형 데이터를 감성 분석하여 상기 제2 기간에서의 감성 지수를 산출하는 것을 특징으로 하는 빅데이터 기반 소비자심리지수 제공 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180033055A KR102138967B1 (ko) | 2018-03-22 | 2018-03-22 | 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180033055A KR102138967B1 (ko) | 2018-03-22 | 2018-03-22 | 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190115530A KR20190115530A (ko) | 2019-10-14 |
KR102138967B1 true KR102138967B1 (ko) | 2020-07-28 |
Family
ID=68171276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180033055A KR102138967B1 (ko) | 2018-03-22 | 2018-03-22 | 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102138967B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102405503B1 (ko) * | 2020-04-10 | 2022-06-07 | 주식회사 제로투원파트너스 | 소비 데이터와 소셜 데이터를 이용한 소비동향 예측 지수 생성 방법과 이를 적용한 소비동향 예측 지수 생성 시스템 및 이를 위한 컴퓨터 프로그램 |
KR102496502B1 (ko) * | 2021-07-14 | 2023-02-06 | 주식회사 신한에이아이 | 인공지능을 이용한 금융 지표 생성 방법 및 인공지능을 이용한 금융 지표 생성 장치 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100776919B1 (ko) * | 2006-09-30 | 2007-11-20 | 한국신용평가정보주식회사 | 구매력 정보 제공 시스템 |
KR101524971B1 (ko) * | 2014-02-11 | 2015-06-02 | 숭실대학교산학협력단 | 개인 성향 예측 방법 및 그 장치 |
KR101703529B1 (ko) * | 2015-08-04 | 2017-02-07 | 천지정 | 시장 분석 서비스 제공 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140085613A (ko) * | 2012-12-20 | 2014-07-08 | 현대자동차주식회사 | 소셜 마케팅 시스템, 서버 및 방법 |
-
2018
- 2018-03-22 KR KR1020180033055A patent/KR102138967B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100776919B1 (ko) * | 2006-09-30 | 2007-11-20 | 한국신용평가정보주식회사 | 구매력 정보 제공 시스템 |
KR101524971B1 (ko) * | 2014-02-11 | 2015-06-02 | 숭실대학교산학협력단 | 개인 성향 예측 방법 및 그 장치 |
KR101703529B1 (ko) * | 2015-08-04 | 2017-02-07 | 천지정 | 시장 분석 서비스 제공 방법 |
Non-Patent Citations (1)
Title |
---|
황영자, SNS 데이터를 활용한 소비자성향 분석, 2015년 하반기 연구보고서, 통계개발원, 2015. |
Also Published As
Publication number | Publication date |
---|---|
KR20190115530A (ko) | 2019-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Verma et al. | Big data analytics: Challenges and applications for text, audio, video, and social media data | |
Nazir et al. | Social media signal detection using tweets volume, hashtag, and sentiment analysis | |
Shankaranarayanan et al. | From content to context: The evolution and growth of data quality research | |
Tran et al. | Hashtag recommendation approach based on content and user characteristics | |
Buono et al. | Big data types for macroeconomic nowcasting | |
Ku et al. | Artificial intelligence and visual analytics: a deep-learning approach to analyze hotel reviews & responses | |
US20160063547A1 (en) | Method and system for making targeted offers | |
CN116468460B (zh) | 基于人工智能的消费金融客户画像识别系统及其方法 | |
Wongthongtham et al. | Ontology and trust based data warehouse in new generation of business intelligence: State-of-the-art, challenges, and opportunities | |
Darwiesh et al. | Social Media Big Data Analysis: Towards Enhancing Competitiveness of Firms in a Post‐Pandemic World | |
Li et al. | A fuzzy comprehensive evaluation algorithm for analyzing electronic word-of-mouth | |
Jin et al. | Cryptoeconomics: Data application for token sales analysis | |
Eshleman et al. | " Hey# 311, come clean my street!": a spatio-temporal sentiment analysis of twitter data and 311 civil complaints | |
Zhu et al. | Human activity recognition using social media data | |
KR102138967B1 (ko) | 빅데이터 기반 소비자심리지수 제공 시스템 및 그 방법 | |
JADHAV | The Role of Data Science and Analytics in Predictive Modelling and Decision-Making | |
O'Banion et al. | Using explicit linguistic expressions of preference in social media to predict voting behavior | |
WO2023150112A1 (en) | System for identifying and predicting trends | |
Dave et al. | Identifying big data dimensions and structure | |
US10102257B2 (en) | Real-time and adaptive data mining | |
US10108680B2 (en) | Real-time and adaptive data mining | |
Mrzic et al. | Data science methods and machine learning algorithm implementations for customized pratical usage | |
Roy et al. | Data processing and AI-technology integration for personalized services | |
KR102041915B1 (ko) | 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법 | |
JP6152215B2 (ja) | 算出装置、算出方法及び算出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |