KR20190023721A - Apparatus and method for gathering public mood about place - Google Patents

Apparatus and method for gathering public mood about place Download PDF

Info

Publication number
KR20190023721A
KR20190023721A KR1020170109904A KR20170109904A KR20190023721A KR 20190023721 A KR20190023721 A KR 20190023721A KR 1020170109904 A KR1020170109904 A KR 1020170109904A KR 20170109904 A KR20170109904 A KR 20170109904A KR 20190023721 A KR20190023721 A KR 20190023721A
Authority
KR
South Korea
Prior art keywords
place
detailed
location
atmosphere
emotional
Prior art date
Application number
KR1020170109904A
Other languages
Korean (ko)
Inventor
차미영
이동만
김재우
임홍준
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170109904A priority Critical patent/KR20190023721A/en
Publication of KR20190023721A publication Critical patent/KR20190023721A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • G06Q50/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F17/2755

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Remote Sensing (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

An apparatus for inferring and standardizing public sensitivity for a detailed place comprises: a placeness extraction unit extracting effective data including information related to a detailed place becoming a purpose of online social data including information related to a place; and a detailed place atmosphere standardizing module extracting public sensitivity of the corresponding detailed place of the effective data.

Description

세부 장소 관련 온라인 정보의 감성 특성 정형화 장치 및 방법{APPARATUS AND METHOD FOR GATHERING PUBLIC MOOD ABOUT PLACE}[0001] APPARATUS AND METHOD FOR GATHERING PUBLIC MOOD ABOUT PLACE [0002]

본 발명은 온라인 소셜 미디어에 게시된 사용자 의견 분석 기술에 관한 것이다.The present invention relates to a technique for analyzing user opinions posted on online social media.

사용자 의견(opinion)은 일반적으로 지칭 대상(opinion target), 표현된 긍/부정적 내용(sentiment), 표현한 주체(opinion holder)로 구성된다[Liu12]. 의견의 지칭 대상은 특정되는 독립체(ntity)로 존재하며, 표현의 주체가 의견을 갖게 되는 다양한 특징적 구성 요소(attribute/feature)들의 집합을 포함한다[Liu06]. 이와 같이 어떠한 대상에 대해 의견을 분석하는 방법을 오피니언 마이닝(pinion mining), 혹은 감성 분석(entiment analysis)이라고 부른다.Opinion generally consists of an opinion target, an expressed positive / negative sentiment, and an opinion holder [Liu 12]. The nominal object of opinion exists as a specified entity and contains a set of various attribute / features whose subject of expression is to be commented [Liu06]. This way of analyzing opinions on any object is called pinion mining, or entiment analysis.

오피니언 마이닝 기법은 그 접근 방식에 따라 크게 품사 형태와 문장 구조를 고려하는 방법(LP-based approach), 그 순서와 구조적 특성을 고려하지 않고 분석 대상을 단어의 집합으로 생각하는 bag-of-words 방법으로 나눌 수 있다. 그리고 분석 대상이 무엇이냐에 따라 문장 단위(sentence-level), 문서 단위(document-level), 속성 단위(aspect-level)의 오피니언 마이닝으로 나눌 수 있다. 문장 단위 분석은 각 문장으로부터 어떤 주체가, 어떤 대상에 대해, 어떤 감성을 가지고 있는지를 분석한다. 문서 단위 분석은 문장이 모여 구성되는 문서로부터 하나 이상의 주체가 어떤 대상에 대해 어떤 감성을 표현하는 지를 이해하고자 하며, 속성 단위 오피니언 마이닝은 각 대상이 가지는 속성에 대해 감성 분석을 수행하게 된다. Opinion mining techniques are largely classified into a bag-of-words method (LP-based approach), which considers the subject to be analyzed as a set of words without considering the order and structural characteristics . It can be divided into sentence-level, document-level, and aspect-level opinion mining depending on what is analyzed. Sentence unit analysis analyzes what kind of subject, what object, and what sensitivity from each sentence. The document unit analysis attempts to understand how one or more subject expresses a certain emotion from a document composed of sentences, and the attribute unit Opinion Mining performs an emotion analysis on the properties of each object.

초기의 오피니언 마이닝 기술은 문서 단위(document level)의 큰 관점에서 하나의 대표 감성(sentiment)을 추출하는 방식이 주를 이루었다[Pennebaker01]. 하지만 온라인 소셜 미디어와 웹을 통해 사람들이 표현한 텍스트는 길이가 짧고, 다양한 형태로 표현되었기 때문에 이를 이해하기 위해 문장 단위의 연구로써 발전하였다[Esuli06]. 더 나아가, 사람들이 특정 대상의 어떠한 특성에 대해 표현하는 의견을 이해하기 위한 속성 단위의 감성 분석을 위한 시도들이 이루어졌고 이를 통해 한 가지 대상의 다양한 특징에 대한 오피니언 마이닝이 가능하게 되었다[Blair08]. Early opinion mining technology was mainly focused on the extraction of one representative sentiment from the viewpoint of document level [Pennebaker01]. However, since the texts expressed by people through online social media and the web are expressed in short form and in various forms, they have developed as sentence-level research to understand this [Esuli06]. Furthermore, attempts have been made to analyze the emotional properties of the attribute units to understand the opinions expressed by people on certain characteristics of a particular object, thereby enabling opinion mining on various features of one object [Blair08].

이러한 세분화된 의견을 추출해내기 위해서는 대상의 특징적 측면을 기술하는 키워드 셋이 필요하다. 하지만 일반적인 주제에 정의된 단어를 이용하여 오피니언 마이닝을 수행할 경우 정확도는 높으나 그 coverage가 매우 낮다는 단점이 있다[Glasgow14]. 따라서 특정 대상에 대해 사람들이 주로 사용하는 어휘들로 키워드 셋을 구축하기 위한 다양한 방법들이 시도되었다. 초기에는 단어의 사전적인 의미에 기반하여(dictionary-based) 키워드를 추가하는 방법이 시도되었으나 이 방법은 coverage는 증가시킬 수 있으나 여전히 사람들이 실제로 사용하는 단어들을 포함하지 못해 효과적으로 감성을 추출하기 어렵다는 한계점이 있었다. 따라서 일반화된 소수의 키워드 셋에서 출발해 공통적으로 사용되는 키워드를 확장하기 위한 방법들이 고안되었고, 대표적인 것으로 PMI(Pointwise Mutual Information) 기반 [Bouma09], 그래프 기반(Graph-based)[Blair08] 방법론 등을 들 수 있다. 최근에는 crowdsourcing 을 이용하여 키워드 셋을 확장하기 위한 방법이 시도되었으나, 이는 추가적인 비용을 요구하며 결과의 신뢰성을 보장하기 어렵다는 단점이 있다[Hutto14].In order to extract such subdivided opinions, a set of keywords that describe the characteristic aspect of the object is needed. However, when opinion mining is performed using words defined on general topics, accuracy is high but its coverage is very low [Glasgow14]. Thus, various methods have been attempted to construct a set of keywords with the vocabulary that people primarily use for a particular subject. In the beginning, a method of adding dictionary-based keywords based on the dictionary meaning of words has been attempted, but this method has limitations that it is difficult to effectively extract emotions because the coverage can be increased but people can not include words actually used . Therefore, methods for expanding commonly used keywords starting from a generalized set of a few keywords have been devised. Typical examples are Pointwise Mutual Information (PMI) based [Bouma09] and Graph-based [Blair08] methodologies. . Recently, a method for expanding a set of keywords using crowdsourcing has been attempted, but this has the disadvantage that it requires additional cost and it is difficult to guarantee the reliability of the result [Hutto14].

본 발명이 해결하고자 하는 과제는 세부 장소 관련된 온라인 정보의 감성 특성을 정형화하고, 정형화된 세부 장소 분위기를 추출하는 장치 및 방법을 제공하는 것이다.An object of the present invention is to provide an apparatus and method for stereotyping emotional characteristics of on-line information related to a detailed place and extracting a formalized detailed place atmosphere.

본 발명의 장치는 데이터 수집부, 형태소 분석부, 단어 임베딩 모듈, 군집화 모듈, 장소성 추출부, 세부장소 분위기 정형화 모듈을 포함한다.The apparatus of the present invention includes a data collecting unit, a morpheme analyzing unit, a word embedding module, a clustering module, a locality extracting unit, and a detailed site atmosphere shaping module.

데이터 수집부는 세부 장소의 위치와 관련된 정보를 담고 있는 소셜미디어, 블로그, 뉴스 등 온라인에 공개된 다양한 형태의 데이터를 수집하며, 이렇게 수집된 데이터를 그 내용과 메타데이터로 구분하여 저장한다.The data collection unit collects various types of data that are disclosed on-line, such as social media, blogs, and news, which contain information related to the location of the detailed place, and stores the collected data in the form of contents and metadata.

형태소 분석부는 장소성 소셜 데이터를 형태소 분석해 정형화한다. The Morpheme Analysis Department morphs and formalizes location-based social data.

단어 임베딩 모듈은 장소성에 관계된 대중 감성 어휘들을 정형화하기 위해서 장소성 소셜 데이터 내에 나타난 감성 어휘들을 의미를 자동화된 형태로 이해하고, 형태소 분석된 장소성 소셜 데이터를 입력으로 받아 벡터 형태의 단어들을 출력한다. The word embedding module comprehends emotional vocabularies in the place-based social data in an automated manner to formulate the public emotional vocabularies related to the place-locality, receives the morpheme-analyzed place-based social data, and outputs the vector-shaped words .

군집화 모듈은 단어 임베딩 모듈에서 출력된 장소성 소셜 데이터 내에 나타나는 단어들간 관계를 이해한다.The clustering module understands the relationships between the words in place social social data output from the word embedding module.

장소성 추출부는 정형화된 장소성을 나타내는 어휘를 추출하고, 정형화된 장소성의 체계를 이용하여 이에 관련된 행동 어휘를 추출하며, GPS기반 위치정보 또는 형태소 분석부에서 넘겨받은 명사형 정보에 기확보된 장소 대표 고유명사(entity)를 대응시켜 세부장소의 위치 정보를 추출한다.The location property extraction unit extracts the vocabulary representing the formalized place property, extracts the action vocabulary related to the location based on the formalized locality system, and uses the location information based on the GPS or the noun information received from the morphological analysis unit, And the location information of the detailed place is extracted by associating proper nouns (entities).

세부장소 분위기 정형화 모듈은 군집화 모듈에서 얻은 군집화된 단어들과 기정의된 장소 분위기 관련 단어들을 이용하여 장소성에 해당하는 세부장소의 분위기를 정형화한다. 세부장소 분위기 정형화 모듈은 분위기 단어를 씨앗 단어로 하여 해당 단어와 가까운 거리에 위치하는 동일한 군집에 속하는 단어들을 해당 장소에 관계된 분위기 특성으로 정형화한다. The detailed place atmosphere stereotyping module formalizes the atmosphere of the detailed place corresponding to the place property by using the clustered words obtained from the clustering module and the predefined place atmosphere related words. The detailed place atmosphere stereotyping module shapes the words belonging to the same community, which are located close to the corresponding word, with the atmosphere word related to the place, using the atmosphere word as the seed word.

실시예에 따르면, 현재의 지능형 개인 비서 서비스가 갖는 한계점인 장소의 다양한 의미 고려가 결여된 물리적인 위치만을 활용하는 서비스 제공에 그치고 있는 점을 해결하여 사용자의 다양한 요구 사항에 최적화된 지능형 개인 비서 서비스를 제공할 수 있다. 실시예에 따르면, 다양한 형태로 확장성이 있는 지능형 개인 비서 서비스 분야에서 실시간성과 개인화를 강화하여 사용자의 만족도를 향상시킬 수 있다. According to the embodiment, an intelligent personal secretary service optimized for various requirements of users is solved by solving the problem that only the physical location that lacks various meaning consideration of the place, which is the limitation point of current intelligent personal secretary service, Can be provided. According to the embodiment, it is possible to enhance user satisfaction by enhancing real-time and personalization in the field of intelligent personal assistant services having various forms and scalability.

실시예에 따르면, 모바일 서비스인 지능형 개인 비서 및 위치기반 정보/콘텐츠 추천 서비스 산업에서 세부 장소 분위기를 제공할 수 있다.According to an embodiment, an intelligent personal assistant, a mobile service, and a location-based information / content recommendation service industry can provide a detailed place atmosphere.

실시예에 따르면, 적합한 세부 인기 장소와 콘텐츠를 추천하는 과정에서 맞춤형 광고 및 모바일 쿠폰 발행 등을 통해 소셜 커머스 시장 또한 진입할 수 있다.According to the embodiment, the social commerce market can also be entered through a process of recommending suitable detailed popularity place and contents, and issuing customized advertisement and mobile coupon.

도 1은 세부 장소 관련 온라인 정보의 감성 특성 정형화 장치의 구성도이다.FIG. 1 is a block diagram of an emotional characteristic shaping apparatus of on-line information related to a detailed place.

지역별 감성 경향성 추출 연구는 다음과 같다.The regional emotional tendency extraction study is as follows.

[Bertrand13, Mitchell13] 연구는 소셜미디어 플랫폼 트위터 데이터 중 위치 정보를 포함하는 (geo-tagged) 게시글들을 활용하여 지역별로 나타나는 대중 감성을 파악하였다. 주로 스마트 디바이스에서 생산되는 위치 정보를 포함하는 온라인 게시글들은 GPS를 통해 정확한 좌표를 얻을 수 있기 때문에 고해상도 감성 지도 구축을 가능하게 한다. 또한 데이터의 갱신률이 높고 정확한 생성 시간 정보를 포함하고 있기 때문에 요일별 또는 시간별 감성 추이 분석이 가능하고, 향후 실시간 감성 추출에 적용될 수 있는 가능성을 가진다. [Brereton08] 연구에서는 행복도 등 긍/부정의 단순화된 감성 정보에 비해 좀더 세분화된 관점에서 지역적인 차이를 분석했다. [Rentfrow13] 연구는 Big five 성격 유형(개방성, 성실성, 외향성, 친화성, 신경성)에 기반하여 미국의 각 지역별 감성적 특성 (mood) 추출을 시도했다. 지역별 단순화된 감성 추출만을 시도했던 앞에서 언급된 선행 연구들에 비해 세분화된 감성 특성 측정을 시도했다는 장점이 있다. [Bertrand13, Mitchell13] The study used geo-tagged posts (including geo-tagged) among social media platform Twitter data to identify the regional emotions of the region. Online postings, which mainly include location information produced by smart devices, can achieve high resolution emotional maps because they can get accurate coordinates through GPS. In addition, since the update rate of data is high and it includes the accurate generation time information, it is possible to analyze the emotional trend by the day of the week or the time, and has a possibility to be applied to real-time emotion extraction in the future. In the [Brereton08] study, regional differences were analyzed from a more detailed viewpoint compared to the simplified emotion information of positive / negative such as happiness. The [Rentfrow13] study attempted to extract the emotional mood of each region of the United States based on the Big five personality types (openness, integrity, extroversion, affinity, neuroticism). This method has the advantage of trying to measure subtle emotional characteristics compared to the previous studies that have only tried to extract the emotional sensation by region.

위와 같이 지역별 감성을 추출하고자 하는 연구들이 수행되어 왔으나, 여기에는 다음과 같은 한계점이 있다. 첫째로, 감성을 가지는 개별 주체(opinion holder)의 특성이 고려되지 않았다. 주체의 특성이 고려되지 않는 집합적 감성 분석이 수행되었으며, 본 발명에서 제안하고자 하는 것은 스마트 공간에서의 실시간 지능형 정보 추천 서비스를 위한 마이닝 기술이기 때문에 개별 주체의 특성이 고려될 수 있는 감성 분석을 한다.Although there have been studies to extract regional emotions as described above, there are the following limitations. First, the characteristics of opinion holders with emotions are not considered. Collective emotional analysis that does not take into account the characteristics of the subjects has been performed. The present invention proposes emotional analysis that can consider individual characteristics because it is a mining technique for real-time intelligent information recommendation service in smart space .

둘째, 위 연구들은 실제 감성을 표현하는 사람들이 사용하는 키워드 셋이 아닌 감성을 나타내는 가장 일반적인 키워드 셋 만을 이용하여 감성을 분석하였다. 일반적인 감성 키워드 셋은 정확도는 높을 수 있지만 실제 텍스트 내에 드러나는 감성을 이해하기에 그 커버리지가 부족할 수 있다. Second, the above studies analyzed emotions using only the most general keyword sets that express emotions, not the set of keywords used by people expressing actual emotions. A common set of emotional keywords can be high in accuracy, but its coverage may not be enough to understand the emotions exposed in the actual text.

셋째, 분석의 대상이 되는 지역이 county나 state와 같은 상위 수준의 장소이기 때문에 추천 시스템을 위한 감성 분석의 대상이 되기에 부적절하다. Third, it is inappropriate to be the subject of emotional analysis for the recommendation system because the area to be analyzed is a high level place such as county or state.

마지막으로, 오피니언 마이닝 기술을 이용하여 감성을 분석한 위의 연구들은 긍/부정과 같은 단순한 차원에 대해서만 분석이 이루어지고 있다는 한계점이 있다. 따라서, [Brereton08, Rentfrow13] 와 같은 연구들이 다양한 차원에 대한 감성을 이해하려는 시도를 하고 있지만 이는 설문조사 기반으로 이루어져 추천 시스템에 사용되기에는 부적절하다.Finally, the above-mentioned studies analyzing sensibility using Opinion Mining technology have a limitation that analysis is performed only on simple dimensions such as positive / negative. Therefore, studies such as [Brereton08, Rentfrow13] attempt to understand the emotions of various dimensions, but this is based on the questionnaire and is inadequate to be used in recommendation systems.

따라서, 본 발명은 이러한 한계를 해결하기 위해, 세부 장소 관련 온라인 정보의 감성 특성 정형화 장치 및 방법을 제공한다.Accordingly, the present invention provides an apparatus and method for shaping emotional characteristics of on-line information related to detailed places in order to solve these limitations.

본 발명의 장치 및 방법은 사람들에 의해 사용되는 표현들로부터 대중 감성을 다양한 차원에 대해 정량적으로 이해하고, 장소성 소셜 미디어에서 대중 감성은 긍/부정을 넘어 다양한 차원에 대해 추출할 수 있다.The apparatus and method of the present invention can quantitatively understand public sentiment from various expressions used by people, and public sentiment in place social media can be extracted for various dimensions beyond positive / negative.

추천의 대상이 되는 장소에 대해 대중 감성 및 이로부터 분위기의 이해가 이루어져야 한다. 또한, 추천 시스템에 활용되기 위해 장소성을 가지는 적절한 수준의 장소에 대해 감성 분석이 이루어져야 하며, 이를 위해 대중 감성 및 이로부터 분위기의 이해가 선행되어야 한다.For the place to be the object of the recommendation, understanding of the atmosphere from the public sensitivity and it should be done. In order to be used in the recommendation system, emotional analysis should be performed on appropriate places having place characteristics. For this purpose, understanding of the atmosphere from the public emotion should be preceded.

사용자의 세부 목적에 적합한 장소를 추천하기 위해 장소의 감성적 특성이 고려되어야 한다. The emotional characteristics of the place should be considered in order to recommend a place suitable for the user's detailed purpose.

기존의 추천 알고리즘에서 감성적인 요소는 감성이 발현된 맥락 및 표현의 주체에 대한 이해가 부족하여 개인 사용자 단위에서 적용되기가 힘들었기에 제한적으로 사용되었다. 본 발명을 통해 장소에 대한 세부 상황 및 맥락에 대한 감성의 추출이 이루어졌을 때, 사용자의 세부 목적에 연관시켜 이러한 장소의 감성적인 특성을 활용할 수 있어야 한다. 사용자가 갖는 개인적인 선호도 및 취향 정보와 함께, 장소를 방문하고자 하는 세부 목적을 고려하여 그러한 조건에 가장 알맞은 사용자 및 상황에서 표현된 장소의 감성적인 특성을 분석하고, 이를 기반으로 장소의 추천 우선 순위를 추론할 수 있다. 즉 사용자의 세부 목적이 결정되면, 특정 장소 (target)에 대하여 사용자와 비슷한 사람들이 해당 목적과 연관되어 (occasion) 표현한 감성적인 특성을 추출하여, 이를 기반으로 추천 서비스에 활용할 수 있다.In the existing recommendation algorithm, the emotional element was used because it was difficult to apply the emotional context to the individual user because of lack of understanding of the context and the subject of expression. When the present invention extracts emotions about the detailed situation and context of the place, it is necessary to utilize the emotional characteristics of the place in relation to the detailed purpose of the user. In addition to the personal preference and taste information of the user, the emotional characteristic of the place represented in the user and the situation most suitable to the condition is analyzed considering the detailed purpose of visiting the place, and based on this, I can reason. That is, if the user's detailed purpose is determined, the emotional characteristic expressed by the user similar to the user in relation to the target can be extracted and used for the recommendation service based on the extracted emotional characteristic.

도 1을 참고하여 본 발명에 대해 설명한다.The present invention will be described with reference to Fig.

도 1은 세부 장소 관련 온라인 정보의 감성 특성 정형화 장치의 구성도이다.FIG. 1 is a block diagram of an emotional characteristic shaping apparatus of on-line information related to a detailed place.

온라인 소셜 데이터는 사람들에 의해 직접 작성된 비정형 데이터의 형태로 존재하기 때문에 기존의 감성 분석 기법을 그대로 적용하기에는 한계가 있다. 따라서 이를 보완하기 위한 세부 장소 관련 온라인 소셜 데이터 특화 감성 분석을 도 1과 같이 수행한다. Since online social data exist in the form of unstructured data created by people, there is a limit to applying existing emotional analysis techniques. Therefore, the online social data specialized emotional analysis related to the detailed place is supplemented as shown in Fig.

본 발명의 장치는 데이터 수집부, 형태소 분석부, 단어 임베딩 모듈, 군집화 모듈, 장소성 추출부, 세부장소 분위기 정형화 모듈을 포함하고, 장소성 소셜 데이터로부터 감성 정보들을 추출하여 정형화한다.The apparatus includes a data collecting unit, a morpheme analyzing unit, a word embedding module, a clustering module, a locality extracting unit, and a detailed site atmosphere shaping module, and extracts emotion information from the place-based social data and formats it.

데이터 수집부는 세부 장소의 위치와 관련된 정보를 담고 있는 소셜미디어, 블로그, 뉴스 등 온라인에 공개된 다양한 형태의 데이터를 수집하며, 이렇게 수집된 데이터를 그 내용과 메타데이터로 구분하여 저장한다.The data collection unit collects various types of data that are disclosed on-line, such as social media, blogs, and news, which contain information related to the location of the detailed place, and stores the collected data in the form of contents and metadata.

형태소 분석부는 장소성 소셜 데이터를 형태소 분석해 정형화한다. 형태소 분석부는 장소성 소셜 데이터를 입력으로 받아 형태소 분석된 단어의 시퀀스를 얻는다. 형태소 분석은 이미 구현된 다양한 오픈 소스들을 이용할 수 있고 장소성 소셜 데이터에 따라 다른 분석 소스를 활용할 수 있다. 예를 들어, 한글을 분석하기 위해서는 꼬꼬마 형태소 분석기, 한나눔 분석기 등을 이용하며 영어 분석을 위해서는 Stanford NLP tool을 활용할 수 있다. The Morpheme Analysis Department morphs and formalizes location-based social data. The morpheme analysis unit receives the place-sex social data as input and obtains the sequence of the morpheme-analyzed word. Morpheme analysis can take advantage of various open sources that have already been implemented and can utilize different analytical sources according to location-based social data. For example, to analyze Hangul, we use a morpheme analyzer, Hananum analyzer, and Stanford NLP tool for English analysis.

단어 임베딩 모듈은 장소성에 관계된 대중 감성 어휘들을 정형화하기 위해서 장소성 소셜 데이터 내에 나타난 감성 어휘들을 의미를 자동화된 형태로 이해한다. 이를 위해 단어 임베딩을 구현한다. 단어 임베딩은 분산 시맨틱스(Distributional Semantics)에서 문서 내 단어들의 관계를 학습시키는 것이다. 이를 구현하기 위해 word2vec 알고리즘을 이용하여 단어들 간 관계를 벡터 형태로 학습시킬 수 있다. Word2vec 알고리즘은 Google의 Tomas Milkov에 의해 만들어진 것으로 Skip grams를 이용하여 단어 w가 주어졌을 때 이와 함께 등장하는 주변 단어들 (문맥) c가 나타날 확률을 예측하며, CBOW를 이용하여 문맥 c가 주어졌을 때 단어 w가 나타날 확률을 예측한다. 해당 모듈은 형태소 분석 된 장소성 소셜 데이터를 입력으로 받아 벡터 형태의 단어들을 출력한다. The word embedding module understands the emotional vocabularies in the place-based social data in an automated way in order to formalize the popular emotional vocabularies related to the place nature. To do this, we embed the word embedding. Word embedding is learning the relationship of words in a document in Distributed Semantics. To implement this, we can use word2vec algorithm to learn the relation between words in vector form. The Word2vec algorithm was created by Google's Tomas Milkov. It uses the Skip grams to predict the probability of the surrounding words (context) c appearing when the word w is given, and when the context c is given using CBOW Predicts the probability of occurrence of the word w. The module receives the morpheme-analyzed location-based social data as input and outputs the words in vector form.

군집화 모듈은 단어 임베딩 모듈을 이용해 장소성 소셜 데이터 내에 나타나는 단어들간 관계를 이해한다. 단어는 벡터 형태로 표현되기 때문에 벡터의 거리 계산을 이용해 어떤 단어들이 유사한 의미를 가지는지, 혹은 어떤 단어가 전혀 관계가 없는지 등을 이해한다. 더 나아가 어떤 형태로 단어의 그룹이 지어지는 지를 거리 기반의 군집화 알고리즘을 이용하여 이해할 수 있다. 구현을 위해 k-means와 같은 hard clustering clustering, 혹은 Mixture of Gaussian과 같은 soft clustering 방법을 적용하며 벡터간 거리 계산을 위해서는 유클리드 거리 (Euclidean distance)를 활용할 수 있다. 모듈은 밀접한 관계를 갖는 단어들의 군집을 결과로 얻게 된다.The clustering module uses the word embedding module to understand the relationships between words in place-based social data. Because words are expressed in vector form, we use vector distance calculations to understand which words have similar meanings, or which words are not related at all. Furthermore, it is possible to understand the grouping of words in some form by using a distance-based clustering algorithm. For implementation, hard clustering clustering such as k-means or soft clustering method such as Mixture of Gaussian is applied and Euclidean distance can be used for vector distance calculation. The module will result in a cluster of closely related words.

장소성 추출부는 장소성에 관계된 감성 어휘를 얻어내기 위해 장소성 소셜 데이터로부터 장소성을 추출한다. 이를 위해 장소성 추출부는 정형화된 장소성을 나타내는 어휘를 추출한다. 장소성 추출부는 정형화된 장소성의 체계를 이용하여 이에 관련된 행동 어휘를 추출한다. 입력으로 형태소 분석된 장소성 기반 소셜 데이터를 받으며 출력으로 주어진 장소성 소셜 데이터에 대한 장소성 단어들을 내보낸다. 만약 수집된 데이터가 위치 정보를 직접 갖는 메타데이터(geotag)를 포함할 경우 GPS기반 위치정보를 함께 활용하고, 위치 정보가 누락된 경우 형태소 분석부에서 넘겨받은 명사형 정보에 기확보된 장소 대표 고유명사(entity)를 대응시켜 세부장소의 위치 정보를 추출할 수 있다.The locality extraction unit extracts the place locality from the locality social data to obtain the emotional vocabulary related to locality. To this end, the locality extraction unit extracts a vocabulary representing stereotyped locality. The locality extractor extracts the action vocabulary related to the locality using a formalized locality system. Receives location-based social data that is morpheme-typed as input, and outputs place-based words for given place-based social data as output. If the collected data includes meta data (geotag) that directly contains the location information, the GPS based location information is used together, and if the location information is missing, it is possible to extract the location information of the detailed place by associating the entity.

세부장소 분위기 정형화 모듈은 군집화 모듈에서 얻은 군집화된 단어들과 기정의된 장소 분위기 관련 단어들을 이용하여 최종적으로 장소성에 해당하는 세부장소의 분위기를 정형화한다. 분위기 단어를 씨앗 단어로 하여 해당 단어와 가까운 거리에 위치하는 동일한 군집에 속하는 단어들을 해당 장소에 관계된 분위기 특성으로 정형화한다. The detailed place atmosphere stereotyping module formalizes the atmosphere of the detailed place which is finally the place property by using the clustered words obtained from the clustering module and the words related to the appointed place atmosphere. The atmosphere word is used as a seed word, and words belonging to the same community located at a distance from the corresponding word are stereotyped with atmosphere characteristics related to the place.

이와 같이, 온라인 소셜 미디어를 통해 수집한 장소 관련 텍스트 데이터로부터 장소가 갖는 감성적인 특성을 추론하고 이를 사용자 맞춤형 추천 서비스 지원에 활용한다. 감성 분석 기법은 어떤 대상에 대한 대중들의 주관적 의견을 수집하기 위해 활용되어 왔으나, 기존의 추천 알고리즘에서 감성적인 요소는 감성이 발현된 맥락 및 표현의 주체에 대한 이해가 부족하여 개인 사용자 단위에서 적용되기가 힘들었기에 극히 제한적으로 사용되었다. 또한 사용자 맞춤형 추천 서비스를 위해서는 분석 대상이 되는 장소에 대해 다양한 특징적 측면에서 감성적 특성을 평가해야 하고, 이처럼 세분화된 결과를 추출해내기 위해서는 분석하고자 하는 세부 장소에 특화된 분위기 추출이 필요하다. 이에 본 발명은 기존의 일반적인 감성 분석 기법의 요소인 분석 대상(opinion target)과 감성의 내용(sentiment)에 더해, 장소의 다차원 분위기(Multi-class mood) 및 감성 발현 대상의 장소성을 함께 고려하여 추천 서비스 지원용 감성 분석을 할 수 있다.In this way, the emotional characteristics of the place are deduced from the place-related text data collected through on-line social media and utilized to support the customized recommendation service. Emotional analysis techniques have been used to collect subjective opinions of a certain object, but emotional elements in existing recommendation algorithms are not applied to individual users because of lack of understanding of subject and context in which emotion is expressed. Was extremely difficult to use. In addition, for user-customized recommendation service, the emotional characteristics should be evaluated in various characteristic aspects of the analysis target site. In order to extract the refined results, it is necessary to extract the atmosphere specific to the detailed place to analyze. Therefore, the present invention considers the multi-class mood of the place and the place of the object to be expressed in addition to the opinion target and the sentiment of the emotion, which are elements of the conventional emotional analysis technique, Emotional analysis for recommendation service support can be done.

Claims (4)

세부 장소에 대한 대중 감성을 추론 및 정형화하는 장치로서,
장소와 관련된 정보를 포함하는 온라인 소셜 데이터들 중에서, 목적이 되는 세부 장소와 관련된 정보를 포함하는 유효 데이터들을 추출하는 장소성 추출부, 그리고
상기 유효 데이터들 중에서 해당 세부 장소의 대중 감성을 추출하는 세부 장소 분위기 정형화 모듈
을 포함하는 감성 추론 및 정형화 장치.
As an apparatus for inferring and shaping public sensitivity to a detailed place,
A location property extraction unit that extracts, from among online social data including information related to a place, valid data including information related to a target detailed location, and
A detailed location atmosphere shaping module for extracting the public sensibility of the detailed site from among the valid data
Wherein the emotional reasoning and shaping device comprises:
제1항에서,
상기 장소성 추출부는,
GPS 기반 위치정보 또는 장소성 관련 키워드 정보를 이용하여 상기 세부 장소를 추출하는 감성 추론 및 정형화 장치.
The method of claim 1,
Wherein the locality extraction unit comprises:
Wherein the detailed location is extracted using GPS-based location information or location-related keyword information.
제1항에서,
상기 세부 장소 분위기 정형화 모듈은,
수집된 데이터를 형태소 분석, 단어 임베딩,그리고 군집화 과정을 전처리로서 수행하는 감성 추론 및 정형화 장치.
The method of claim 1,
Wherein the detailed location atmosphere shaping module comprises:
Emotional reasoning and shaping device that performs the morphological analysis, word embedding, and clustering process on the collected data as preprocessing.
제1항에서,
상기 세부 장소 분위기 정형화 모듈은,
상기 장소성 추출부에서 추출된 세부 장소를 기반으로 가장 근접한 단어의 대표 군집을 찾고, 미리 정의된 분위기 관련 단어장을 활용하여 세부 장소와 관련된 대중의 대표 감성을 정형화하는 감성 추론 및 정형화 장치.
The method of claim 1,
Wherein the detailed location atmosphere shaping module comprises:
A sensory inference and stereotyping device for searching representative clusters of the closest word based on the detailed place extracted by the locality extraction unit, and formalizing the representative sensibility of the public related to the detailed place using the predefined atmosphere related wordbook.
KR1020170109904A 2017-08-30 2017-08-30 Apparatus and method for gathering public mood about place KR20190023721A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170109904A KR20190023721A (en) 2017-08-30 2017-08-30 Apparatus and method for gathering public mood about place

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170109904A KR20190023721A (en) 2017-08-30 2017-08-30 Apparatus and method for gathering public mood about place

Publications (1)

Publication Number Publication Date
KR20190023721A true KR20190023721A (en) 2019-03-08

Family

ID=65800395

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170109904A KR20190023721A (en) 2017-08-30 2017-08-30 Apparatus and method for gathering public mood about place

Country Status (1)

Country Link
KR (1) KR20190023721A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220109249A (en) * 2021-01-28 2022-08-04 네이버 주식회사 Place recommendation method and system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220109249A (en) * 2021-01-28 2022-08-04 네이버 주식회사 Place recommendation method and system

Similar Documents

Publication Publication Date Title
Neogi et al. Sentiment analysis and classification of Indian farmers’ protest using twitter data
US9779085B2 (en) Multilingual embeddings for natural language processing
Chen et al. A bibliometric review of natural language processing empowered mobile computing
Whitney et al. Don’t want to get caught? don’t say it: The use of emojis in online human sex trafficking ads
Biradar et al. Machine learning tool for exploring sentiment analysis on twitter data
Wijeratne et al. Feature engineering for Twitter-based applications
CN111339295A (en) Method, apparatus, electronic device and computer readable medium for presenting information
Tassone et al. Utilizing deep learning and graph mining to identify drug use on Twitter data
Haque et al. Opinion mining from bangla and phonetic bangla reviews using vectorization methods
Pereira Social media text processing and semantic analysis for smart cities
Khaleq et al. Twitter analytics for disaster relevance and disaster phase discovery
Senekal et al. Open source intelligence (OSINT) for conflict monitoring in contemporary South Africa: Challenges and opportunities in a big data context
Inamdar et al. Machine learning driven mental stress detection on reddit posts using natural language processing
Shi et al. EKGTF: A knowledge-enhanced model for optimizing social network-based meteorological briefings
KR101838573B1 (en) Place Preference Analysis Method based on Sentimental Analysis using Spatial Sentiment Lexicon
Anupama et al. Real time Twitter sentiment analysis using natural language processing
Hassan et al. Sentiment analysis on Bangla conversation using machine learning approach
Chang et al. A deep neural spoiler detection model using a genre-aware attention mechanism
Shrivatava et al. Opinion mining of real time twitter tweets
Baker Al Barghuthi et al. Sentiment analysis on predicting presidential election: Twitter used case
Kim et al. Comparing machine learning classifiers for movie WOM opinion mining
KR20190023722A (en) Apparatus and method for sentiment analysis keyword expansion
Pak Automatic, adaptive, and applicative sentiment analysis
Meddeb et al. Using twitter streams for opinion mining: a case study on airport noise
KR20190023721A (en) Apparatus and method for gathering public mood about place