KR101838573B1 - Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon - Google Patents

Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon Download PDF

Info

Publication number
KR101838573B1
KR101838573B1 KR1020170017410A KR20170017410A KR101838573B1 KR 101838573 B1 KR101838573 B1 KR 101838573B1 KR 1020170017410 A KR1020170017410 A KR 1020170017410A KR 20170017410 A KR20170017410 A KR 20170017410A KR 101838573 B1 KR101838573 B1 KR 101838573B1
Authority
KR
South Korea
Prior art keywords
sns
preference
place
analysis
module
Prior art date
Application number
KR1020170017410A
Other languages
Korean (ko)
Inventor
채인영
이영민
유기윤
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020170017410A priority Critical patent/KR101838573B1/en
Application granted granted Critical
Publication of KR101838573B1 publication Critical patent/KR101838573B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0259Targeted advertisements based on store location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0261Targeted advertisements based on user location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

The present invention relates to a location preference analysis method based on emotional analysis using a space emotional word dictionary. The present invention analyzing locations preferred by actual users by using SNS data comprises: (a) a step in which an SNS data collecting module (10), in a connected SNS server, collects SNS data for a predetermined period to be used for location preference analysis by using an open application programming interface (API) provided in an SNS and then stores the collected SNS data in an SNS data DB (11); (b) a step in which a natural language processing module (20) extracts SNS data including a location point-of-interest (POI) among SNS data for a predetermined period collected and stored in the SNS data collecting module and processes natural language; and (c) a step in which a preference analyzing module (30) calculates the preference of location POI by analyzing SNS text including the location POI extracted through the natural language processing module. The present invention has an effect of providing information about a location preferred by actual SNS users by performing emotional analysis using a space emotional word dictionary about SNS text and quantifying the analysis result to calculate preference.

Description

공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법 {Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of analyzing location preference based on sentence analysis using a space-

본 발명은 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법에 관한 것으로, 보다 구체적으로 소셜 네트워크 서비스 데이터를 이용하여 실제 사용자들이 선호하는 장소를 분석하는 것으로, 소셜 네트워크 서비스 텍스트에 대하여 공간 감성어 사전을 이용한 감성분석을 실시하고, 나아가 이를 계량화하여 선호도를 산출함으로써 실제 소셜 네트워크 서비스 사용자들이 선호하는 장소에 대한 정보를 제공하는 방법을 제시하는 것에 관한 것이다.The present invention relates to a method of analyzing location preference based on emotion analysis using a space-sensitive language dictionary, more specifically, by analyzing a preferred place of actual users using social network service data, The present invention relates to a method of providing information on a preferred place of actual social network service users by performing emotional analysis using a word dictionary and quantifying the calculated emotion and calculating a preference.

소셜 네트워크 서비스(Social Network Service, 이하 SNS)와 인터넷의 발달로 인해 정보의 획득이 용이해짐에 따라 과거에 비해 다양한 장소에 대한 접근이 가능해지고 이에 대한 의견 및 정보를 생산하고 공유하는 것이 활발하게 일어나고 있다.As the acquisition of information becomes easier due to the development of Social Network Service (SNS) and the Internet, it becomes possible to access various places in comparison with the past, and production and sharing of opinions and information are actively occurring have.

따라서, 사람들은 SNS를 통해 다녀온 장소에 대해 소개하고 의견을 표출하며, 이는 다른 사용자들이 의사결정을 할 때에 중요한 정보가 될 수 있다. 그러나 SNS 사용자가 급증하고 수많은 게시글이 업로드되면서 방대한 양의 데이터로부터 의미 있는 정보를 얻고 의사결정에 도움을 얻는 것이 어려워지고 있다.Therefore, people introduce and express their opinions about the places they have visited through SNS, which can be important information for other users to make decisions. However, with the surge of SNS users and the uploading of numerous posts, it becomes difficult to gain meaningful information from large amounts of data and to help decision-making.

또한, 최근 여행과 관련된 SNS 글을 올리는 사용자가 증가함에 따라 이를 분석하여 관광객에게 의미있는 관광여행지를 추천하는 연구들이 이루어지고 있으나, 이러한 기존의 연구들은 여행지의 언급빈도수만을 고려하였기 때문에 실제로 사용자들이 여행지에서 불만을 느껴 작성한 내용이 많은 경우에 대한 고려가 이루어지고 있지 않다.In addition, as the number of users who post SNS articles related to the recent travel increases, researches have been conducted to recommend tourist attractions that are meaningful to tourists. However, these conventional studies only consider the frequency of reference of travel destinations, There is no consideration of the case where there is a lot of content that is complained about.

더불어, 종래기술로서 대한민국 공개특허공보 제10-2016-0010746호 (2016.01.28.공개)는 소셜 네트워크 서비스 사용자의 감성 분석 시스템 및 그 방법에 관한 것으로서, (a) 게시물 분류부가 소셜 네트워크 서비스 게시물의 종류를 분류하는 과정; (b) 형용사 추출부가 상기 (a) 과정을 통해 분류된 게시물을 분석하여 각각에 대한 형용사를 추출하는 과정; 및 (c) 감성 값 수치화부가 상기 (b) 과정을 통해 추출된 형용사를 감성 값으로 수치화여 누적하는 과정; 을 포함하는 것을 개시하고 있다. 그러나, 이는 장소에 대한 의견을 분석하여 수치화하기에는 부족한 점이 많이 있다.In addition, Korean Patent Laid-Open Publication No. 10-2016-0010746 (published on Jan. 28, 2016) discloses a system and method for emotional analysis of a social network service user, wherein (a) Classification process; (b) analyzing the adjectives extracted by the adjective extracting unit and extracting an adjective for each post; And (c) a step of the emotional value quantifying part digitizing the adjective extracted through the step (b) into an emotion value and accumulating it; ≪ / RTI > However, this is insufficient to analyze and quantify opinions on places.

대한민국 공개특허공보 제10-2016-0010746호(2016.01.28.공개): 소셜 네트워크 서비스 사용자의 감성 분석 시스템 및 그 방법Korean Patent Laid-Open Publication No. 10-2016-0010746 (published on Jan. 28, 2018): Emotional analysis system and method thereof for users of social network services

본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 SNS 데이터를 이용하여 실제 사용자들이 선호하는 장소를 분석하는 방법을 제공하는 것으로, SNS 텍스트에 대하여 공간 감성어 사전을 이용한 감성분석을 실시하고, 나아가 이를 계량화하여 선호도를 산출함으로써 실제 SNS 사용자들이 선호하는 장소에 대한 정보를 제공하는 데 있다.It is an object of the present invention to provide a method for analyzing a preferred place of real users by using SNS data, And to provide information about the preferred places of real SNS users by analyzing their emotions and quantifying them and calculating their preferences.

본 발명의 다른 목적은 SNS 사용자가 장소 선택에 있어 의사결정을 할 때, 사람들이 실제로 선호하는 장소가 어느 곳인지를 쉽게 알 수 있도록 하여 장소에 대한 정보를 얻는 데에 소모되는 시간과 비용을 절감할 수 있도록 하는, 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법을 제공하는 데 있다.Another object of the present invention is to provide a method and apparatus for an SNS user who can easily know where a person actually places a preference when making a decision on a place selection, thereby saving time and money The present invention relates to a method of analyzing a location preference based on emotion analysis using a space-sensitive dictionary.

상기와 같은 목적을 달성하기 위하여, 본 발명은 (a) SNS 데이터 수집 모듈이 접속된 SNS 서버에서, SNS에서 제공하는 오픈 API(Open Application Programming Interface)를 이용하여 장소 선호도 분석에 이용할 일정 기간 동안의 SNS 데이터를 수집한 후에 SNS 데이터 DB에 저장하는 단계와; (b) 자연어 처리 모듈이 상기 SNS 데이터 수집 모듈에서 수집되어 저장된 일정 기간 동안의 SNS 데이터 가운데 장소 POI(Point of Interest)를 포함하고 있는 SNS 데이터를 추출하고 자연어를 처리하는 단계, 및 (c) 선호도 분석 모듈이 상기 자연어 처리 모듈을 통해 추출된, 장소 POI를 포함하는 SNS 텍스트를 분석하여 장소 POI의 선호도를 산출하는 단계로 이루어지는 것을 기본 특징으로 한다.In order to achieve the above object, the present invention provides a method for analyzing a place preference (SNS) data, which is used for analyzing a place preference by using an open API (Open Application Programming Interface) Storing the SNS data in the SNS data DB after collecting the data; (b) extracting SNS data including a POI (Point of Interest) of the SNS data collected during a certain period collected from the SNS data collection module and processing the natural language, and (c) Analyzing the SNS text including the place POI extracted by the analysis module through the natural language processing module and calculating the preference of the place POI.

또한, 본 발명은 (d) 지도 시각화 모듈이 상기 선호도 분석 모듈을 통해 얻은 각 장소 유형별로 도출된 선호도를 지도로 시각화하는 단계가 추가로 포함되는 것을 특징으로 한다.Further, the present invention is characterized in that (d) the map visualization module further visualizes the preferences derived from each place type obtained through the preference analysis module by a map.

또한, 본 발명은 수집되어 저장된 SNS 데이터로부터 불용어가 제거된 SNS 텍스트 중에서 장소 POI 사전DB와 매칭되고 장소 POI를 포함하는 SNS 텍스트를 추출하며, 형태소 분석을 실시하는 것을 특징으로 한다.In addition, the present invention is characterized in that the SNS text matching with the place POI dictionary DB and extracting the SNS text including the place POI is extracted from the SNS data collected and stored from the stored SNS data.

또한, 본 발명에서 선호도 분석 모듈은 언급빈도수 산출 모듈, 감성분석 모듈, 선호도 산출 모듈을 포함하는데, 상기 언급빈도수 산출 모듈은 SNS 내에서 일정 기간 동안 장소 POI별 언급빈도수를 산출하고, 상기 감성분석 모듈은 각 장소에 대한 공간 감성어와 각 감성어의 해당 극성(Pt) 및 감성확률(Pb)이 저장된 공간 감성어 사전DB(321)을 활용하여 추출된 SNS 텍스트에 대한 감성분석을 실시하며, 상기 선호도 산출 모듈은 상기 언급빈도수 산출 모듈에서 산출한 각 장소 POI에 대한 언급빈도수와 상기 감성분석 모듈에서의 감성확률로부터 산출한 각 장소 POI에 대한 감성지수를 적용하여 각 장소 POI별 선호도 값을 산출하는 것을 특징으로 한다.In the present invention, the preference analysis module includes a frequency-of-reference calculating module, a sensitivity analysis module, and a preference calculating module. The frequency-of-reference calculating module calculates the frequency of referring POIs for each place in the SNS, Emotional analysis is performed on the SNS text extracted using the space-sensitive language dictionary DB 321 in which the space sensitivity word for each place and the corresponding polarity (Pt) and sensibility probability (Pb) of each emotion word are stored, The calculating module calculates the preference value for each POI by applying the emotion index for each place POI calculated from the frequency of referring to each place POI calculated by the frequency-of-reference calculating module and the emotion probability of the emotion analyzing module .

또한, 본 발명에서 각 장소 POI별 선호도 값은 다음의 수학식,In the present invention, the preference value for each place POI is expressed by the following equation,

Figure 112017013061665-pat00001
Figure 112017013061665-pat00001

(여기서, k는 장소 POI이고, SD는 감성방향으로 긍정(

Figure 112017013061665-pat00002
)일 경우 +1, 부정(
Figure 112017013061665-pat00003
)일 경우 -1이며, SP는 각 장소 POI에 대한 긍정지수(
Figure 112017013061665-pat00004
), SN은 각 장소 POI에 대한 부정지수(
Figure 112017013061665-pat00005
)로 이러한 긍정지수와 부정지수를 통칭하여 감성지수라고 하고, FK는 각 장소 POI에 대한 언급빈도수이며, 감성지수에서의 i는 각 장소 POI를 포함하는 SNS 텍스트이고,
Figure 112017013061665-pat00006
이며,
Figure 112017013061665-pat00007
이고, Pb(j)는 공간 감성어j의 감성확률이며, match(i,j)는 텍스트i에 포함된 공간 감성어j가 공간 감성어 사전DB에 존재할 경우 1 아니면 0 임)으로 산출하는 것을 특징으로 한다.(Where k is the place POI and SD is positive in the emotion direction
Figure 112017013061665-pat00002
), +1 for negative,
Figure 112017013061665-pat00003
), And S P is the affirmative index for each place POI (
Figure 112017013061665-pat00004
), S N is the negative index for each place POI (
Figure 112017013061665-pat00005
), F K is the frequency of referring to each place POI, i in the emotion index is the SNS text including each place POI,
Figure 112017013061665-pat00006
Lt;
Figure 112017013061665-pat00007
(I, j) is 1 or 0 when the space-sensitive word j included in the text i exists in the space-sensitive word dictionary DB ) , and Pb (j) .

또한, 본 발명에서 상기 산출된 선호도 값의 정규화는 다음의 수학식,Further, in the present invention, the normalization of the calculated preference value is expressed by the following equation,

Figure 112017013061665-pat00008
Figure 112017013061665-pat00008

(여기서, SDP는 선호도의 감성방향으로 Preference(k)가 1보다 크면 +1(긍정) 0보다 작으면 -1(부정)의 값을 가지고, min과 max은 추출된 모든 장소 POI의 선호도 중에서 최소값과 최대값임)으로 산출하는 것을 특징으로 한다.If the preference (k) is greater than 1, the SDP is -1 (negative) if the preference is less than 0. If the preference (k) is less than 0, the min and max are the minimum And a maximum value).

이상에서 살펴본, 본 발명인 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법은 SNS 데이터를 이용하여 실제 사용자들이 선호하는 장소를 분석하는 것으로, SNS 텍스트에 대하여 공간 감성어 사전을 이용한 감성분석을 실시하고, 나아가 이를 계량화하여 선호도를 산출함으로써 실제 SNS 사용자들이 선호하는 장소에 대한 정보를 제공하는 효과가 있다.As described above, the method of analyzing the location preference based on the emotion analysis using the space-sensitive language dictionary of the present invention analyzes the preferred places of the actual users using the SNS data, and the emotional analysis using the space- Further, it is possible to quantify and calculate the preference degree, thereby providing information on a place preferred by the actual SNS users.

또한, 본 발명은 SNS 사용자가 장소 선택에 있어 의사결정을 할 때, 사람들이 실제로 선호하는 장소가 어느 곳인지를 쉽게 알 수 있도록 하여 장소에 대한 정보를 얻는 데에 소모되는 시간과 비용을 절감할 수 있도록 하는 효과가 있다.In addition, the present invention allows the SNS user to easily know where people are actually preferred when making a decision on a place selection, thereby saving time and money in obtaining information about the place .

도 1 은 본 발명에 따른 감성분석 기반의 장소 선호도 분석방법과 관련된 시스템의 일실시예를 나타낸 구성도.
도 2 는 본 발명에 따른 감성분석 기반의 장소 선호도 분석방법과 관련된 시스템의 다른 실시예를 나타낸 구성도.
도 3 과 도 4 는 공간 감성어 사전 single DB의 예시와 구조를 나타낸 도면.
도 5 와 도 6 은 공간 감성어 사전 combi DB의 예시와 구조를 나타낸 도면.
도 7 은 본 발명에 따른 장소 선호도를 지도 시각화하여 사용자에게 서비스하는 화면의 예시를 나타낸 도면.
도 8 은 본 발명에 따른 감성분석 기반의 장소 선호도 분석방법의 흐름도를 나타낸 도면.
FIG. 1 is a block diagram illustrating an embodiment of a system related to a method for analyzing location preference based on emotion analysis according to the present invention.
2 is a block diagram showing another embodiment of a system related to a method of analyzing location preference based on emotion analysis according to the present invention.
FIGS. 3 and 4 illustrate examples and structures of a space-sensitive dictionary single DB; FIG.
FIGS. 5 and 6 illustrate examples and structures of a space-sensitive dictionary combi DB. FIG.
FIG. 7 is a diagram illustrating an example of a screen for visualizing the location preference according to the present invention and serving the user.
8 is a flowchart illustrating a method of analyzing a location preference based on emotion analysis according to the present invention.

상기와 같이 구성된 본 발명의 바람직한 실시예를 첨부된 도면을 참조하면서 상세히 설명하면 다음과 같다. 첨부된 도면들 및 이를 참조한 설명은 본 발명에 관하여 당해 기술 분야에서 통상의 지식을 가진 자들이 쉽게 이해할 수 있도록 하기 위해 예시된 것이며, 본 발명의 사상 및 범위를 한정하려는 의도로 제시된 것은 아님에 유의하여야 할 것이다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. It is to be understood that the appended drawings and foregoing description are intended for purposes of illustration only and are not intended to limit the scope of the present invention. .

도 1 에서, 일실시예로 웹서버(5)는 사용자단말기(1)와 SNS 서버(3) 및 포털사이트 서버(4)에 접속되어 각종 정보데이터를 송수신하고, 여기서 사용자단말기(1)는 스마트폰이나 태블릿PC 등의 모바일단말기 또는 노트북PC나 데스크톱PC 등이 적용된다. 웹서버(5)에는 장소 선호도 분석용 애플리케이션(2)이 설치되어 있다.1, the web server 5 is connected to the user terminal 1, the SNS server 3, and the portal site server 4 to transmit and receive various information data. Here, the user terminal 1 is a smart Mobile terminals such as phones and tablet PCs, notebook PCs and desktop PCs are applied. The web server 5 is provided with a location preference analysis application 2.

또는 도 2 에서 다른 실시예로 사용자단말기(1)는 SNS 서버(3) 및 포털사이트 서버(4)에 접속되어 각종 정보데이터를 송수신하고, 사용자단말기(1)에는 장소 선호도 분석용 애플리케이션(2)이 설치되어 있다.2, the user terminal 1 is connected to the SNS server 3 and the portal site server 4 to transmit and receive various information data, and the user terminal 1 is provided with a location preference analysis application 2, Is installed.

사용자가 장소 선호도 분석용 애플리케이션(2)을 실행하여 초기 입력자료로 일정 기간과 SNS 종류 및 장소 유형(예를 들어, 카페·음식점·테마공원·문화재·관광지 등)을 탭선택하거나 입력할 수 있도록 하는 것이 바람직하다. 이하에서 '장소'는 상기 초기 입력자료로 입력된 장소 유형 중의 하나이다.The user can run a location preference analysis application (2) to tap and input a certain period of time and SNS type and place type (for example, cafe, restaurant, theme park, cultural property, sightseeing spot, etc.) . Hereinafter, 'place' is one of the place types inputted as the initial input data.

장소 선호도 분석용 애플리케이션(2)의 SNS 데이터 수집 모듈(10)은 접속된 SNS 서버(3)에서 SNS에서 제공하는 오픈 API(Open Application Programming Interface)를 이용하여 장소 선호도 분석에 이용할 일정 기간 동안의 SNS 데이터를 수집한 후에 SNS 데이터 DB(11)에 저장한다. 본 발명에 따른 일실시예에서 이용할 SNS 데이터는 트위터 데이터일 수도 있는데, 이는 140자 이내 단문으로 개인의 의견이나 생각을 공유하고 소통하는 마이크로 블로그이다. 그러나 상기 SNS는 트위터에 한정되는 것은 아니고, 유튜브·구글 트렌드·페이스북·인스타그램 등일 수도 있다.The SNS data collection module 10 of the location preference analyzing application 2 uses the open API (Open Application Programming Interface) provided by the SNS in the connected SNS server 3 to calculate the SNS After the data is collected, it is stored in the SNS data DB 11. The SNS data to be used in one embodiment according to the present invention may be Twitter data, which is a micro blog which shares and communicates an opinion or opinion of an individual within a short sentence of up to 140 characters. However, the SNS is not limited to Twitter, but may be YouTube, Google Trend, Facebook, Instagram, and the like.

장소 선호도 분석용 애플리케이션(2)의 자연어 처리 모듈(20)은 상기 SNS 데이터 수집 모듈(10)에서 수집되어 저장된 일정 기간 동안의 SNS 데이터 가운데 장소 POI(Point of Interest)를 포함하고 있는 SNS 데이터를 추출하고 자연어를 처리한다.The natural language processing module 20 of the location preference analyzing application 2 extracts SNS data including a POI (Point of Interest) of a place among the SNS data collected and stored in the SNS data collection module 10 for a certain period of time And processes natural language.

이를 위해 먼저, SNS 데이터 수집 모듈(10)에서 수집 저장된 SNS 데이터의 텍스트 말뭉치를 생성하고, 특수문자·숫자·영문·이모티콘 등과 같은 불용어를 제거한다(이하, SNS 텍스트).To this end, a text corpus of SNS data collected and stored in the SNS data collection module 10 is generated, and an abbreviation such as a special character, a number, an English alphabet, and an emoticon is removed (hereinafter referred to as SNS text).

다음으로, 자연어 처리 모듈(20)은 장소 POI 목록을 저장한 사전(21)을 포함하고 있어, 이를 바탕으로 앞서 불용어가 제거된 SNS 텍스트 중에서 장소 POI 사전DB(21)와 매칭되고 장소 POI를 포함하는 SNS 텍스트를 추출한다. 여기서 장소 POI 사전DB(21)는 네이버 지도와 같은 포털사이트의 지도 검색 웹사이트의 검색결과를 이용하여 자연어 처리 모듈(20)에서 요청이 있을 때마다 리스트업하여 구축할 수 있는데, 자연어 처리 모듈(20)은 접속된 포털사이트 서버(4)에서 포털사이트의 오픈 API를 이용한다. 예를 들어, 네이버 지도의 ‘서울 관광지’ 검색 결과 목록을 저장하여 서울 관광지 POI 사전DB를 구축한다.Next, the natural language processing module 20 includes the dictionary 21 storing the POI list of the place. Based on the dictionary 21, the natural language processing module 20 matches the place POI dictionary DB 21 among the SNS texts, Extracts the SNS text. Here, the place POI dictionary DB 21 can be listed up and constructed by the natural language processing module 20 whenever there is a request by using the search result of the map search web site of the portal site such as the Naver map. 20 use the open API of the portal site in the connected portal site server 4. For example, a search result list of 'sightseeing spots in Seoul' on the Naver map is stored to construct a POI dictionary DB in Seoul tourist spots.

마지막으로, 장소 POI를 포함하는 SNS 텍스트에 대해 형태소 분석을 실시한다. 이하에서 SNS 텍스트는 형태소 분석이 이루어진 SNS 텍스트이다.Finally, morphological analysis is performed on the SNS text including the place POI. Hereinafter, the SNS text is the SNS text in which the morpheme analysis is performed.

한편, 장소 선호도 분석용 애플리케이션(2)의 선호도 분석 모듈(30)은 상기 자연어 처리 모듈(20)을 통해 추출된, 장소 POI를 포함하는 SNS 텍스트를 분석하여 장소 POI의 선호도를 산출하며, 이 선호도 분석 모듈(30)은 도 1 및 도 2에 도시된 바와 같이 언급빈도수 산출 모듈(31), 감성분석 모듈(32), 선호도 산출 모듈(33)을 포함한다.On the other hand, the preference analysis module 30 of the place preference analyzing application 2 analyzes the SNS text including the place POI extracted through the natural language processing module 20, calculates the preference of the place POI, The analysis module 30 includes a reference frequency calculation module 31, a sensitivity analysis module 32, and a preference calculation module 33 as shown in FIGS. 1 and 2.

상기 언급빈도수 산출 모듈(31)은 각 장소에 대한 SNS 사용자들의 방문 및 관심 정도를 살펴보기 위하여 SNS 내에서 일정 기간 동안 장소 POI별 언급빈도수 즉, 출현 횟수를 계산한다.The reference frequency calculation module 31 calculates the frequency of reference, i.e., the frequency of occurrence, of each place POI in the SNS for a certain period of time in order to examine the degree of visit and interest of the SNS users for each place.

상기 감성분석 모듈(32)은 각 장소에 대한 SNS 사용자들의 의견 및 감성을 살펴보기 위하여 추출된 SNS 텍스트에 대한 감성분석을 실시한다. 이를 위하여 장소에 대한 의견을 나타내는 표현 즉, 공간 감성어가 저장된 공간 감성어 사전DB(321, Spatial Sentiment Lexicon)를 활용한다. 이 공간 감성어 사전DB(321)는 다수의 감성어와 각 감성어의 해당 극성(긍정, 중립, 부정) 및 감성확률을 저장하고 있다.The emotional analysis module 32 performs emotional analysis on the extracted SNS text to examine the opinions and emotion of the SNS users for each place. To do this, we use the Spatial Sentiment Lexicon (Spatial Sentiment Lexicon) 321, which is a representation of opinions about the place, that is, a space emotion dictionary. The spatial emotion dictionary DB 321 stores a plurality of emotion words and corresponding polarities (positive, neutral, and negative) and sensibility probabilities of the emotion words.

여기서, 공간 감성어 사전DB(321)는 single DB(SSLex_single) 와 combi DB(SSLex_combi)로 구분되는데, single DB는 4개의 필드(ID, SP, Pt, Pb)로 구성되며, combi DB는 5개의 필드(ID, SS, SP, Pt, Pb)로 구성된다는 차이가 있다. 도 3 내지 도 6은 두 종류의 공간 감성어 사전DB(321)에 대한 예시와 구조를 나타낸다. 상기 공간 감성어 사전DB(321)에 저장된 감성어(SP:공간 서술어)와, 형태소 분석이 이루어진 SNS 텍스트로부터 추출된 명사·형용사·동사와 매칭하여 이를 감성 값(Pt×Pb)으로 수치화한다. 예를 들어, ‘명동거리 너무 번잡하다’라는 SNS 텍스트가 있다면,‘번잡/NC’이라는 부정적인 감성어가 존재하므로 도 3의 공간 감성어 사전DB(321)에 저장된 값에 따라 -0.978723(즉, 설문조사 분석결과 97.8723%가 부정이라고 답변)의 감성 값을 갖는다. 각 장소 POI에 대하여 SNS 텍스트의 수치화된 감성 값을 긍정과 부정으로 구분 및 누적하여 후술할 감성지수, 즉 긍정지수와 부정지수를 계산하게 된다.Here, the space-sensitive language dictionary DB 321 is divided into a single DB (SSLex_single) and a combi DB (SSLex_combi). The single DB is composed of four fields (ID, SP, Pt and Pb) (ID, SS, SP, Pt, Pb). Figs. 3 to 6 illustrate examples and structures of the two kinds of the spatial-affective-language dictionary DB 321. Fig. (SP) (space descriptor) stored in the space-sensitive language dictionary DB 321 and nouns, adjectives, and verbs extracted from SNS texts subjected to morphological analysis are digitized into emotion values (Pt × Pb). For example, if there is an SNS text of "too busy", there is a negative emotion word of "affliction / NC". Therefore, according to the value stored in the space-sensibility dictionary DB 321 of FIG. 3, -0.978723 As a result of the survey analysis, 97.8723% of respondents answered that they are negative. For each place POI, the emotional value of the SNS text is classified and accumulated as affirmative and negative, and the emotional indices to be described later, that is, the positive index and the negative index are calculated.

보다 구체적으로는 상기 SSLex_single은 단일 단어(형용사, 동사, 명사)만을 포함하며 SSLex_combi는 단어와 단어가 조합된 어휘를 포함하는데, 여기서 명사에는 장소 POI의 명칭은 포함되지 않는다. 즉, SSLex_single은 ID, SP(공간 서술어), Pt(극성), Pb(감성확률)로 구성되며 장소 POI와 SP가 결합된 형태의 어휘에 대한 감성분석을 지원하고, 상기 SSLex_combi는 ID, SS(공간 주제어), SP, Pt, Pb로 구성되며 SS와 SP가 결합된 형태의 어휘에 대한 감성분석을 지원한다.More specifically, the SSLex_single includes only a single word (adjective, verb, and noun), and SSLex_combi includes a combination of words and words, wherein the name of the place POI is not included in the noun. In other words, SSLex_single supports emotional analysis of a vocabulary in which a POI and a SP are combined, and the SSLex_combi is composed of ID, SS (Spatial Descriptor), Pt (Polarity), and Pb SP), SP, Pt, and Pb, and supports emotional analysis of vocabulary in which SS and SP are combined.

다시 말해, 공간 감성어 사전DB(321)는 장소(공간)를 나타내는 어휘의 집합으로, 각 어휘는 해당 어휘가 나타내는 감성의 극성(polarity, Pt) 정보(긍정: 1, 부정: -1, 중립: 0)와 감성확률(probability, Pb)을 보유하고 있고, 이러한 공간 감성어 사전DB는 장소에 대한 감성분석을 실시하기 위해 레퍼런스로서 필요한데, 사용자가 어떤 장소에 대해 작성한 글을 대상으로 감성분석(긍정/부정/중립 파악)을 수행하기 위해서는 각 단어들에 대한 데이터베이스가 구축되어 있어야 하는 것이고, 이때 단어에 대한 극성정보 뿐 아니라 극성의 정도에 대한 값(감성확률)도 함께 포함되어야만 보다 세밀한 감성분석이 가능하며, 상기 각 어휘에 대한 Pt와 Pb는 일반인을 대상으로 설문조사를 실시하고 그 결과를 분석하여 산출한다.In other words, the space-sensitive language dictionary DB 321 is a set of vocabulary expressing a place (space), and each vocabulary has a polarity (Pt) information (affirmative: 1, negative: -1, neutral : 0) and probability of probability (Pb). This spatial emotional dictionary DB is needed as a reference to perform emotional analysis on the place. The emotional analysis (Ie, positive / negative / neutral grasp), a database for each word must be constructed. In this case, not only the polarity information about the word but also the value of the degree of polarity (sensitivity probability) , And Pt and Pb for each of the above vocabularies are calculated by analyzing the results of a survey conducted on the general public.

상기 선호도 산출 모듈(33)은 상기 언급빈도수 산출 모듈(31)과 감성분석 모듈(32)의 결과를 고려한 선호도 산출식에 의하여 선호도 값을 산출한다. 다음의 수학식 1은 장소 선호도(Preference(k), 각 장소 POI별 선호도) 산출식이다.The preference calculating module 33 calculates a preference value based on a preference calculating formula that takes into consideration the results of the reference frequency calculating module 31 and the emotion analyzing module 32. The following equation (1) is an equation for calculating the preference degree (Preference (k), preference degree for each place POI).

Figure 112017013061665-pat00009
Figure 112017013061665-pat00009

여기서, k는 장소 POI이고,Where k is the place POI,

SD(Sentiment Direction)는 감성방향으로 긍정(

Figure 112017013061665-pat00010
)일 경우 +1, 부정(
Figure 112017013061665-pat00011
)일 경우 -1이며,SD (Sentiment Direction) is positive in the direction of emotion
Figure 112017013061665-pat00010
), +1 for negative,
Figure 112017013061665-pat00011
) Is -1,

SP(Sentiment index of Positive)는 각 장소 POI에 대한 긍정지수≥0, SN(Sentiment index of Negative)는 각 장소 POI에 대한 부정지수≤0 로, 이러한 긍정지수와 부정지수를 통칭하여 감성지수라고 하고,S P (Sentiment index of positive) is the positive index ≥0 for each place POI and S N (Sentiment index of negative) is the negative index for each place POI ≤ 0. These positive and negative indexes are collectively referred to as emotion index And,

FK(Frequency of k)는 각 장소 POI에 대한 언급빈도수로 언급빈도수의 산출대상은 상기 자연어 처리 모듈(20)을 통해 추출된, 장소 POI를 포함하는 모든 SNS 텍스트이다.F K (frequency of k) is all the SNS texts including the place POI extracted by the natural language processing module 20 as the frequency of reference to each place POI and the object of calculation of the reference frequency is extracted.

또한, SP 와 SN는 다음의 표 1과 같이 계산할 수 있다.Also, S P S and N can be calculated as shown in Table 1 below.

Figure 112017013061665-pat00012
Figure 112017013061665-pat00012

여기서, i는 각 장소 POI를 포함하는 SNS 텍스트로 그 갯수는 언급빈도수(FK)와 동일하고, Pb(j)는 공간 감성어 j의 감성확률이며, match(i,j)는 텍스트i에 포함된 공간 감성어j(형용사·동사·명사)가 공간 감성어 사전DB(321)에 존재할 경우 1 아니면 0 이다. 더불어, PT(i) NT(i)는 각 장소 POI를 포함하는 SNS 텍스트의 감성지수로 개별 SNS 텍스트에 대한 것이다.Here, i is the SNS text including each place POI, the number of which is equal to the reference frequency (F K ), Pb (j) is the emotional probability of the space-sensitive word j, and match (i, j) 1 or 0 if the spatial emotional word j (adjective, verb, noun) contained in the spatial emotional dictionary DB 321 is present. In addition, PT (i) and NT (i) is for the individual SNS text as the emotion index of the SNS text including each place POI.

따라서, 상기 장소 선호도 산출식에 의하여 도출된 선호도 값이 1보다 크면 장소k는 긍정, 1이면 장소k는 중립, 0보다 작으면 장소k는 부정으로 해석할 수 있다.Therefore, if the preference value derived by the location preference calculating equation is greater than 1, the location k is positive, the location k is neutral, and if the preference is less than 0, the location k can be interpreted as negative.

실제 SNS 사용자들이 많이 방문하고 관심이 높을수록 언급빈도수가 높으며, 장소에 대한 좋은 평가 또는 긍정적인 감성이 나타날수록 긍정지수가 높게 나타난다. 반면, 장소에 대한 부정적인 평가 또는 감성이 나타날수록 부정지수가 높게 나타난다. 따라서 상기 수학식 1은 이를 종합적으로 고려하여 선호도를 수식화한 것이다.The more frequent the SNS users visit and the higher the interest, the higher the frequency of referrals. The more positive evaluation or positive emotions of place, the higher the positive index. On the other hand, the more negative evaluation or emotion of place, the higher the negative index. Therefore, Equation (1) is a formula of preference in consideration of this.

지금까지 상기 모듈을 통해 공원, 카페, 쇼핑몰, 관광지 등과 같은 장소의 유형에 따라 선호도를 산출할 수 있는데, 이러한 정보를 사용자에게 제공하기 위해서는 각 장소 유형별로 최종적으로 도출된 선호도 값의 범위가 다르기 때문에 이를 정규화(Normalization)할 필요가 있다. 즉, 도출된 선호도를 -100에서 +100 사이의 값으로 정규화하여 각 장소 유형별로 선호도의 비교가 가능하도록 한다. 다음의 수학식 2는 선호도의 정규화 식이다.So far, the module can calculate preference according to the type of places such as parks, cafes, shopping malls, sightseeing spots, etc. In order to provide such information to users, the range of preference values finally derived for each place type is different It is necessary to normalize it. That is, the derived preference is normalized to a value between -100 and +100, so that the preference of each place type can be compared. The following equation (2) is a normalization equation of preference.

Figure 112017013061665-pat00013
Figure 112017013061665-pat00013

여기서, SDP(Sentiment Direction of Preference)는 선호도의 감성방향으로 Preference(k)가 1보다 크면 +1(긍정) 0보다 작으면 -1(부정)의 값을 가지고, min과 max은 추출된 모든 장소 POI의 선호도 중에서 최소값과 최대값이다.If the preference (k) is greater than 1, the Sentiment Direction of Preference (SDP) is -1 (positive). If the preference is less than 0, min (min) and max It is the minimum value and the maximum value among the preferences of the POI.

상기 정규화된 선호도 값은 -100에서 +100 사이의 값을 가지고, Normalized Preference(k)가 0보다 크면 장소 k는 긍정, 0이면 중립, 0보다 작으면 부정으로 해석할 수 있다.The normalized preference value has a value between -100 and +100. If the Normalized Preference (k) is greater than 0, the location k can be interpreted as being positive, if it is 0, it is neutral, and if it is less than 0, it can be interpreted as negative.

더불어, 장소 선호도 분석용 애플리케이션(2)의 지도 시각화 모듈(40)은 상기 선호도 분석 모듈(30)을 통해 얻은 각 장소 유형별로 도출된 선호도를 지도로 시각화하여 사용자에게 서비스한다. 도 7은 장소 선호도 분석 서비스의 예시로 각 장소별 대표적 감성어와 정규화된 선호도 값을 나타내고 있다. 이는 상기 지도 시각화 모듈(40)을 통해 많은 양의 SNS 데이터로부터 얻은 의미 있는 정보를 위치에 따라 지도 위에 시각화함으로써 사용자가 필요한 정보를 효율적으로 얻게 하여 정보 탐색에 소모되는 시간과 비용을 절감하고 다양한 의사결정을 하는데에 도움을 줄 수 있다.In addition, the map visualization module 40 of the location preference analysis application 2 visualizes the preferences derived for each place type obtained through the preference analysis module 30 by a map and provides the service to the user. FIG. 7 shows an example of a location preference analysis service, which shows typical emotional words and normalized preference values for each place. This visualizes the meaningful information obtained from a large amount of SNS data through the map visualization module 40 on the map according to the location, thereby efficiently obtaining the necessary information by the user, thereby saving time and cost consumed in information search, It can help to make decisions.

도 8 은 본 발명에 따른 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법의 흐름도를 나타낸 도면으로 그 일련의 과정을 다시 정리하면 다음과 같다.FIG. 8 is a flowchart illustrating a method of analyzing a place preference based on emotion analysis using a space-sensitive speech dictionary according to the present invention.

첫째, SNS 데이터 수집 모듈(10)은 접속된 SNS 서버(3)에서, SNS에서 제공하는 오픈 API(Open Application Programming Interface)를 이용하여 장소 선호도 분석에 이용할 일정 기간 동안의 SNS 데이터를 수집한 후에 SNS 데이터 DB(11)에 저장한다(S10).First, the SNS data collection module 10 collects SNS data for a predetermined period to be used for location preference analysis by using an open API (Open Application Programming Interface) provided by the SNS in the connected SNS server 3, And stores it in the data DB 11 (S10).

둘째, 자연어 처리 모듈(20)은 상기 SNS 데이터 수집 모듈(10)에서 수집되어 저장된 일정 기간 동안의 SNS 데이터 가운데 장소 POI(Point of Interest)를 포함하고 있는 SNS 데이터를 추출하고 자연어를 처리한다(S20).Second, the natural language processing module 20 extracts the SNS data including the POI (Point of Interest) of the SNS data collected during the predetermined period collected in the SNS data collection module 10 and processes the natural language (S20 ).

여기서, 수집되어 저장된 SNS 데이터로부터 불용어가 제거된 SNS 텍스트 중에서 장소 POI 사전DB(21)와 매칭되고 장소 POI를 포함하는 SNS 텍스트를 추출하며 형태소 분석을 실시하게 된다.Here, the SNS text matching with the place POI dictionary DB 21 among the SNS text from which the stopwords are removed from the collected and stored SNS data is extracted and the morphological analysis is performed.

세째, 선호도 분석 모듈(30)은 상기 자연어 처리 모듈(20)을 통해 추출된, 장소 POI를 포함하는 SNS 텍스트를 분석하여 장소 POI의 선호도를 산출한다(S30).Third, the preference analysis module 30 analyzes the SNS text including the place POI extracted through the natural language processing module 20 to calculate the preference of the place POI (S30).

이 선호도 분석 모듈(30)은 언급빈도수 산출 모듈(31), 감성분석 모듈(32), 선호도 산출 모듈(33)을 포함하는데, 상기 언급빈도수 산출 모듈(31)은 각 장소에 대한 SNS 사용자들의 방문 및 관심 정도를 살펴보기 위하여 SNS 내에서 일정 기간 동안 장소 POI별 언급빈도수를 산출하고, 상기 감성분석 모듈(32)은 각 장소에 대한 SNS 사용자들의 의견 및 감성을 살펴보기 위하여 공간 감성어와 각 감성어의 해당 극성(Pt) 및 감성확률(Pb)이 저장된 공간 감성어 사전DB(321)을 활용하여 추출된 SNS 텍스트에 대한 감성분석을 실시하며, 상기 선호도 산출 모듈(33)은 상기 언급빈도수 산출 모듈(31)에서 산출한 각 장소 POI에 대한 언급빈도수와 상기 감성분석 모듈(32)에서의 감성확률로부터 산출한 각 장소 POI에 대한 감성지수를 적용하여 각 장소 POI별 선호도 값을 산출한다.The preference analysis module 30 includes a reference frequency calculation module 31, an emotion analysis module 32 and a preference calculation module 33. The frequency reference calculation module 31 calculates the frequency of use of the SNS users And the degree of interest in the SNS for a predetermined period of time in order to examine the degree of interest, and the emotion analysis module 32 calculates a frequency of referring to each place POI, The sensibility analysis module 33 performs sensibility analysis on the extracted SNS text by utilizing the space sensibility dictionary DB 321 storing the corresponding polarity Pt and sensibility probability Pb of the sensory information The preference value for each place POI is calculated by applying the frequency of reference to each place POI calculated by the location information 31 and the emotion index for each place POI calculated from the emotion probability in the sensibility analysis module 32.

네째, 지도 시각화 모듈(40)은 상기 선호도 분석 모듈(30)을 통해 얻은 각 장소 유형별로 도출된 선호도를 지도로 시각화하여 사용자에게 서비스한다(S40).Fourth, the map visualization module 40 visualizes the preferences derived for each place type obtained through the preference analysis module 30 by a map, and provides services to the user (S40).

한편, 수학식들을 포함하는 상기 이러한 일련의 과정은 이를 컴퓨터로 수행하기 위해 프로그램 언어를 통해 직접 알고리즘을 코딩한 프로그램에 의해 이루어진다.Meanwhile, the series of processes including the mathematical expressions is performed by a program directly coding an algorithm through a programming language to perform it with a computer.

상술한 바와 같이, 본 발명은 SNS 데이터를 이용하여 텍스트 마이닝(Text Mining) 분석을 함으로써 장소에 대한 선호도 정보를 제공하는 것으로, 이를 위해서는 장소에 대한 의견을 나타내는 표현 즉, 공간 감성어에 대한 데이터베이스를 사용하여야 한다. 이는 다수의 감성어와 각 감성어의 해당 극성(긍정,중립,부정) 및 감성확률을 저장하고 있다. 다음으로, 공간 감성어 사전을 활용하여 SNS 텍스트에 대한 감성분석을 실시한다. 여기서 감성분석이란 사용자의 감성과 관련된 텍스트 정보를 자동으로 추출하는 텍스트 마이닝 기술의 한 영역으로서, 문서를 작성한 사람의 감정을 추출해내는 기술로 주어진 주제에 대하여 어떠한 감정을 가지고 있는가를 판단하여 분석하는 기법이다. 마지막으로, 본 발명에서 제안하는 선호도 산출식을 통하여 장소의 선호도를 도출한다. 이는 각 장소에 대한 의견을 종합적으로 고려하여 수치화된 값으로 많은 양의 데이터로부터 도출된 의미 있는 정보라 할 수 있다. 최종적으로 이를 지도 위에 시각화하여 사용자들에게 장소에 대한 정보를 제공하고 의사결정에 도움을 줄 수 있다.As described above, the present invention provides preference information on places by performing text mining analysis using SNS data. To do so, it is necessary to provide a representation of opinions on places, that is, Should be used. It stores the number of emotional words and the corresponding polarity (positive, neutral, negative) and emotional probability of each emotional word. Next, emotional analysis is performed on SNS text using space-sensitive language dictionary. Here, emotional analysis is an area of text mining technology that automatically extracts text information related to a user's emotions, and it is a technique to extract emotions of a person who writes a document and to determine how emotions are given to a given subject . Finally, the preference of the place is derived through the preference calculating equation proposed in the present invention. This is a meaningful information derived from a large amount of data as a numerical value by comprehensively considering opinions on each place. Finally, it can be visualized on the map to provide users with information about the place and to help decision-making.

1: 사용자 단말기 2: 장소 선호도 분석용 애플리케이션
3: SNS 서버 4: 포털사이트 서버
5: 웹서버 10: SNS 데이터 수집 모듈
11: SNS 데이터DB 20: 자연어 처리 모듈
21: 장소 POI 사전DB 30: 선호도 분석 모듈
31: 언급빈도수 산출 모듈 32: 감성분석 모듈
321: 공간 감성어 사전DB 33: 선호도 산출 모듈
40: 지도 시각화 모듈
1: User terminal 2: application for location preference analysis
3: SNS Server 4: Portal Site Server
5: Web server 10: SNS data collection module
11: SNS data DB 20: Natural language processing module
21: Place POI dictionary DB 30: Preference analysis module
31: Reference frequency calculation module 32: Emotion analysis module
321: Spatial Emotion Dictionary DB 33: Preference calculation module
40: Map visualization module

Claims (6)

(a) SNS 데이터 수집 모듈(10)이 접속된 SNS 서버에서, SNS에서 제공하는 오픈 API(Open Application Programming Interface)를 이용하여 장소 선호도 분석에 이용할 일정 기간 동안의 SNS 데이터를 수집한 후에 SNS 데이터 DB(11)에 저장하는 단계와;
(b) 자연어 처리 모듈(20)이 상기 SNS 데이터 수집 모듈에서 수집되어 저장된 일정 기간 동안의 SNS 데이터 가운데 장소 POI(Point of Interest)를 포함하고 있는 SNS 데이터를 추출하고 자연어를 처리하는 단계, 및
(c) 선호도 분석 모듈(30)이 상기 자연어 처리 모듈을 통해 추출된, 장소 POI를 포함하는 SNS 텍스트를 분석하여 장소 POI의 선호도를 산출하는 단계로 이루어지며,
상기 단계(c)에서 선호도 분석 모듈(30)은 언급빈도수 산출 모듈(31), 감성분석 모듈(32), 선호도 산출 모듈(33)을 포함하는데,
상기 언급빈도수 산출 모듈은 SNS 내에서 일정 기간 동안 장소 POI별 언급빈도수를 산출하고,
상기 감성분석 모듈은 각 장소에 대한 공간 감성어와 각 감성어의 해당 극성(Pt) 및 감성확률(Pb)이 저장된 공간 감성어 사전DB(321)을 활용하여 추출된 SNS 텍스트에 대한 감성분석을 실시하며,
상기 선호도 산출 모듈은 상기 언급빈도수 산출 모듈에서 산출한 각 장소 POI에 대한 언급빈도수와 상기 감성분석 모듈에서의 감성확률로부터 산출한 각 장소 POI에 대한 감성지수를 적용하여 각 장소 POI별 선호도 값을 산출하되,
상기 각 장소 POI별 선호도 값은 다음의 수학식,
Figure 112017115810716-pat00030

(여기서, k는 장소 POI이고, SD는 감성방향으로 긍정(
Figure 112017115810716-pat00031
)일 경우 +1, 부정(
Figure 112017115810716-pat00032
)일 경우 -1이며, SP는 각 장소 POI에 대한 긍정지수(
Figure 112017115810716-pat00033
), SN은 각 장소 POI에 대한 부정지수(
Figure 112017115810716-pat00034
)로 이러한 긍정지수와 부정지수를 통칭하여 감성지수라고 하고, FK는 각 장소 POI에 대한 언급빈도수이며, 감성지수에서의 i는 각 장소 POI를 포함하는 SNS 텍스트이고,
Figure 112017115810716-pat00035
이며,
Figure 112017115810716-pat00036
이고, Pb(j)는 공간 감성어j의 감성확률이며, match(i,j)는 텍스트i에 포함된 공간 감성어j가 공간 감성어 사전DB에 존재할 경우 1 아니면 0 임)
으로 산출하는 것을 특징으로 하는, 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법.
(a) The SNS server connected to the SNS data collecting module 10 collects the SNS data for a predetermined period to be used for analyzing the location preference using an open API (Open Application Programming Interface) provided by the SNS, (11);
(b) extracting SNS data including a POI (Point of Interest) of the SNS data collected during a certain period of time collected by the natural language processing module 20 from the SNS data collection module and processing the natural language; and
(c) analyzing the SNS text including the place POI extracted by the preference analysis module 30 through the natural language processing module, and calculating the preference of the place POI,
In the step (c), the preference analysis module 30 includes the reference frequency calculation module 31, the emotion analysis module 32, and the preference calculation module 33,
The referred frequency calculation module calculates the frequency of referring POIs for each place in the SNS for a certain period of time,
The emotional analysis module performs emotional analysis on the extracted SNS text using the space emotive dictionaries DB (321) storing the space emotion words for each place and the corresponding polarity (Pt) and emotion probability (Pb) of each emotion word. In addition,
The preference calculating module calculates the preference value for each POI by applying the emotion index for each place POI calculated from the frequency of referring to each place POI calculated by the frequency-of-reference calculating module and the emotion probability of the emotion analyzing module However,
The preference value for each place POI is expressed by the following equation,
Figure 112017115810716-pat00030

(Where k is the place POI and SD is positive in the emotion direction
Figure 112017115810716-pat00031
), +1 for negative,
Figure 112017115810716-pat00032
), And S P is the affirmative index for each place POI (
Figure 112017115810716-pat00033
), S N is the negative index for each place POI (
Figure 112017115810716-pat00034
), F K is the frequency of referring to each place POI, i in the emotion index is the SNS text including each place POI,
Figure 112017115810716-pat00035
Lt;
Figure 112017115810716-pat00036
(I, j) is 1 or 0 when the space-sensitive word j included in the text i is present in the space-sensitive word dictionary DB, and Pb (j) is the probability of emotion of the space-
Wherein the location preference analyzing method is based on emotion analysis using a space-sensitive dictionary.
제 1 항에 있어서,
(d) 지도 시각화 모듈(40)이 상기 선호도 분석 모듈을 통해 얻은 각 장소 유형별로 도출된 선호도를 지도로 시각화하는 단계가 추가로 포함되는 것을 특징으로 하는, 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법.
The method according to claim 1,
(d) visualizing the preferences derived from each place type obtained by the map visualization module (40) through the preference analysis module, by using a map. Location preference analysis method.
제 1 항에 있어서,
상기 단계(b)에서는, 수집되어 저장된 SNS 데이터로부터 불용어가 제거된 SNS 텍스트 중에서 장소 POI 사전DB와 매칭되고 장소 POI를 포함하는 SNS 텍스트를 추출하며, 형태소 분석을 실시하는 것을 특징으로 하는, 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법.
The method according to claim 1,
Wherein the step (b) extracts the SNS text that matches the place POI dictionary DB and contains the place POI from among the SNS text from which the stopwords are removed from the collected SNS data, and performs morphological analysis A Method for Analyzing Location Preference Based on Emotion Analysis Using Word Dictionary.
삭제delete 삭제delete 제 1 항에 있어서,
상기 산출된 선호도 값의 정규화는 다음의 수학식,
Figure 112017115810716-pat00021

(여기서, SDP는 선호도의 감성방향으로 Preference(k)가 1보다 크면 +1(긍정) 0보다 작으면 -1(부정)의 값을 가지고, min과 max은 추출된 모든 장소 POI의 선호도 중에서 최소값과 최대값임)
으로 산출하는 것을 특징으로 하는, 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법.
The method according to claim 1,
The normalization of the calculated preference value is expressed by the following equation,
Figure 112017115810716-pat00021

If the preference (k) is greater than 1, the SDP is -1 (negative) if the preference is less than 0. If the preference (k) is less than 0, the min and max are the minimum And the maximum value)
Wherein the location preference analyzing method is based on emotion analysis using a space-sensitive dictionary.
KR1020170017410A 2017-02-08 2017-02-08 Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon KR101838573B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170017410A KR101838573B1 (en) 2017-02-08 2017-02-08 Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170017410A KR101838573B1 (en) 2017-02-08 2017-02-08 Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon

Publications (1)

Publication Number Publication Date
KR101838573B1 true KR101838573B1 (en) 2018-03-14

Family

ID=61660457

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170017410A KR101838573B1 (en) 2017-02-08 2017-02-08 Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon

Country Status (1)

Country Link
KR (1) KR101838573B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200087357A (en) 2019-01-02 2020-07-21 주식회사 위팝 System and method of social media user emotion analysis through big data analysis
KR102225128B1 (en) * 2019-09-11 2021-03-09 주식회사 알마덴디자인리서치 Apparatus and method for analyzing keyword using emotion measurement
KR20220065980A (en) * 2020-11-13 2022-05-23 한국방송통신대학교 산학협력단 Sentiment analysis apparatus and controlling method thereof, and newly-coined word and emotion extraction apparatus
KR102646654B1 (en) * 2023-11-13 2024-03-12 액티부키 주식회사 Apparatus and method for analyzing space through semantic analysis of user-generated voice

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101647087B1 (en) * 2015-02-09 2016-08-09 케이에스비퓨처 주식회사 Server and method for goods providing based on natural language processing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101647087B1 (en) * 2015-02-09 2016-08-09 케이에스비퓨처 주식회사 Server and method for goods providing based on natural language processing

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200087357A (en) 2019-01-02 2020-07-21 주식회사 위팝 System and method of social media user emotion analysis through big data analysis
KR102225128B1 (en) * 2019-09-11 2021-03-09 주식회사 알마덴디자인리서치 Apparatus and method for analyzing keyword using emotion measurement
KR20220065980A (en) * 2020-11-13 2022-05-23 한국방송통신대학교 산학협력단 Sentiment analysis apparatus and controlling method thereof, and newly-coined word and emotion extraction apparatus
KR102422923B1 (en) * 2020-11-13 2022-07-20 한국방송통신대학교 산학협력단 Sentiment analysis apparatus and controlling method thereof, and newly-coined word and emotion extraction apparatus
KR102646654B1 (en) * 2023-11-13 2024-03-12 액티부키 주식회사 Apparatus and method for analyzing space through semantic analysis of user-generated voice

Similar Documents

Publication Publication Date Title
O'dea et al. A linguistic analysis of suicide-related Twitter posts
Huai et al. Which environmental features contribute to positive and negative perceptions of urban parks? A cross-cultural comparison using online reviews and Natural Language Processing methods
Chen et al. A bibliometric review of natural language processing empowered mobile computing
KR101838573B1 (en) Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon
Shimada et al. Analyzing tourism information on twitter for a local city
RU2704531C1 (en) Method and apparatus for analyzing semantic information
Egbert et al. The role of the text in corpus and discourse analysis: Missing the trees for the forest
Pope et al. An Analysis of Online Twitter Sentiment Surrounding the European Refugee Crisis.
Rianto et al. Improving the accuracy of text classification using stemming method, a case of non-formal Indonesian conversation
Olson et al. Reading the city through its neighbourhoods: Deep text embeddings of Yelp reviews as a basis for determining similarity and change
Demus et al. Detox: A comprehensive dataset for german offensive language and conversation analysis
Hall Quantitative and qualitative content analysis
CN108681749B (en) Privacy information discrimination method based on network social platform
Camacho et al. Sentiment mapping: point pattern analysis of sentiment classified Twitter data
Colhon et al. Relating the opinion holder and the review accuracy in sentiment analysis of tourist reviews
Vargas-Calderón et al. Machine learning for assessing quality of service in the hospitality sector based on customer reviews
Shin et al. What’s vs. how’s in online hotel reviews: Comparing information value of content and writing style with machine learning
Mutiara et al. Improving the accuracy of text classification using stemming method, a case of non-formal Indonesian conversation
Cheke et al. Understanding the impact of geographical distance on online discussions
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
Biffignandi et al. Can Big Data provide good quality statistics? A case study on sentiment analysis on Twitter data
Oliveira et al. Gazetteer enrichment for addressing urban areas: A case study
Rai et al. Identification of landscape preferences by using social media analysis
Martins et al. Sentiment analysis applied to hotels evaluation
Venkateswaran et al. Exploring and visualizing differences in geographic and linguistic web coverage

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant