KR20190017597A - Method for analyzing social service data and apparatus using the same - Google Patents

Method for analyzing social service data and apparatus using the same Download PDF

Info

Publication number
KR20190017597A
KR20190017597A KR1020170117662A KR20170117662A KR20190017597A KR 20190017597 A KR20190017597 A KR 20190017597A KR 1020170117662 A KR1020170117662 A KR 1020170117662A KR 20170117662 A KR20170117662 A KR 20170117662A KR 20190017597 A KR20190017597 A KR 20190017597A
Authority
KR
South Korea
Prior art keywords
text
score
matrix
data
words
Prior art date
Application number
KR1020170117662A
Other languages
Korean (ko)
Other versions
KR102023516B1 (en
Inventor
김선율
우용완
조성국
이태주
류청
김헌범
Original Assignee
주식회사 인데이터랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 인데이터랩 filed Critical 주식회사 인데이터랩
Publication of KR20190017597A publication Critical patent/KR20190017597A/en
Application granted granted Critical
Publication of KR102023516B1 publication Critical patent/KR102023516B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Abstract

According to an embodiment of the present invention, provided is a method for analyzing user response data. The method for analyzing user response data comprises the following steps: receiving at least one text which includes a user response; digitizing the at least one text into a matrix; determining a score of the at least one text using an engine formed to predict the score which represents a positive or negative tendency included in the text based on the digitized matrix of the at least one text; and providing the determined score.

Description

사용자 반응 데이터 분석 방법 및 장치{METHOD FOR ANALYZING SOCIAL SERVICE DATA AND APPARATUS USING THE SAME}TECHNICAL FIELD [0001] The present invention relates to a method and an apparatus for analyzing user reaction data,

본 발명은 사용자 반응 데이터 분석 방법 및 장치에 관한 것으로서, 보다 상세하게는, 사용자 반응 데이터 중 텍스트의 감성지수를 산출하기 위한 사용자 반응 데이터 분석 방법 및 장치에 관한 것이다.The present invention relates to a method and an apparatus for analyzing user response data, and more particularly, to a method and apparatus for analyzing user response data for calculating an emotion index of text among user response data.

제품이나 서비스를 제공하는 기업이 고객의 반응을 알아보는 다양한 방법들이 존재한다. 최근에는 특히 온라인에서 제공할 수 있는 다양한 서베이, 제공 사이트에서의 상품평 등을 통해 고객의 반응이 수집될 수 있다. 마케팅 담당자들은 다양한 방식으로 수집된 상품이나 서비스에 대한 고객의 반응을 참조하여 상품이나 서비스에 대한 개선을 하거나 요구에 맞는 마케팅을 기획하도록 할 수 있다.There are a variety of ways in which a company that provides a product or service can determine the response of a customer. In recent years, customer responses can be gathered through various surveys that can be offered online, and product reviews on the providing sites. Marketers can refer to customer responses to products or services collected in a variety of ways to improve on a product or service or to plan marketing to meet their needs.

발명의 배경이 되는 기술은 본 발명에 대한 이해를 보다 용이하게 하기 위해 작성되었다. 발명의 배경이 되는 기술에 기재된 사항들이 선행기술로 존재한다고 인정하는 것으로 이해되어서는 안 된다.BACKGROUND OF THE INVENTION [0002] Techniques as a background of the invention have been made in order to facilitate understanding of the present invention. And should not be construed as an admission that the matters described in the technical background of the invention are present in the prior art.

그러나, 현존하는 고객 반응 수집은 기업이 제공하는 플랫폼 내에서 수집되므로, 정보의 모수가 편향됨으로 인해 대표성의 오류가 발생할 가능성이 존재한다. 또한, 자사의 고객 반응 수집 결과, 기업의 고객 소통 채널상에 존재하는 고객 반응은 전체 소셜 빅데이터 상에 존재하는 데이터의 5% 미만이다.However, since existing customer response collections are collected within the platform provided by the company, there is a possibility that the error of representation may occur due to the bias of the information parameter. Also, as a result of our collection of customer responses, customer responses on the company's customer channel are less than 5% of the total social big data.

이에 따라, 기업의 합리적인 의사결정을 위해서는 95%의 고객 반응을 반영해야 한다. 이를 위해서는 소셜 미디어에서 나타나는 집단감성에 대한 객관화가 필요하다. 즉, 소셜 미디어의 빅데이터 상에서 제품에 대한 고객의 의견을 제품에 대한 평가 점수로 계량화하여 파악하는 것이 기업에게 있어서 매우 중요하다. As a result, 95 percent of customer responses must be reflected in rational decision-making. To this end, it is necessary to objectify the collective emotion in social media. In other words, it is very important for companies to quantify the opinions of customers about products on the big data of social media with the score of products.

한편, 70% 이상에 달하는 소셜 미디어 상의 고객 반응은 긍정도 부정도 아닌 중립적인 반응이다. 종래의 소셜 데이터 분석 서비스는 브랜드를 추종하는 수호자나 비방하는 비방자도 아닌, 일반적인 소비자들의 반응이 가지는 특수성과 중요성을 고려하지 않는다. 따라서, 기업들은 대다수의 소비자들의 니즈를 정확하게 파악하지 못하고, 효율적인 고객화에 어려움을 겪을 수 있다. On the other hand, over 70% of respondents in social media are neutral and not negative. Traditional social data analysis services do not take into account the specificity and importance of general consumer responses, not brand guardians or libelous defamers. Therefore, companies can not accurately grasp the needs of the majority of consumers, and can experience difficulties in efficient customer customization.

다시 말하면, 종래의 기술로는 기업의 매출 증대를 위해 반드시 파악해야 할 고객 구매 행위의 '이유'는 파악하기 어렵다. 예를 들어, 종래의 이분법적인 분류 방식으로는 고객 반응을 만족 또는 불만족으로 나누기만 할 뿐이므로, 세분화된 소비자의 의견 반영이 불가능하다.In other words, with the conventional technology, it is difficult to grasp the 'reason' of the customer purchasing behavior that must be grasped in order to increase the sales of the enterprise. For example, conventional dichotomous classification schemes only divide the customer response into satisfaction or dissatisfaction, making it impossible to reflect refined consumer opinions.

이에 본 발명의 발명자들은, 소셜 미디어에서 나타나는 텍스트들을 긍정 또는 부정으로 나타내지 않고, 그 감성의 정도를 점수화함으로써, 소비자들의 반응이 가지는 의미를 보다 명확하게 이해할 수 있도록 제공할 수 있다는 점을 인식하였다.Therefore, the inventors of the present invention have recognized that the meaning of the response of the consumers can be more clearly understood by scoring the degree of the emotion without positively or negatively indicating the texts appearing in the social media.

따라서. 본 발명의 해결하고자 하는 과제는 고객 반응을 보다 정확하게 파악할 수 있는 사용자 반응 데이터 분석 방법 및 장치를 제공하는 것이다.therefore. SUMMARY OF THE INVENTION It is an object of the present invention to provide a user reaction data analysis method and apparatus capable of more accurately grasping a customer response.

나아가, 본 발명의 발명자들은 소셜 미디어들에 나타나는 텍스트들을 점수화하는데 있어서, 긍정 또는 부정의 감성을 점수로 예측하도록 머신러닝된 모델을 사용할 수 있다는 점을 인식하였다. 또한, 이러한 머신러닝된 모델을 사용하는데 있어서, 텍스트를 그대로 사용하기 보다는 텍스트를 수치화하여 사용하는 것이 보다 정확하고, 연산 속도에 있어서 향상된 효율을 가진다는 점을 인지하였다. 또한, 텍스트를 수치화하여 사용할 때, 너무 많은 변수가 있음에 따라 정확도가 떨어지거나 연산 속도가 떨어질 수 있다는 점도 인지하였다.Further, the inventors of the present invention have recognized that in scoring texts appearing in social media, a machine-runable model can be used to score positive or negative emotions as scores. Further, it has been recognized that, in using such a machine-run model, it is more accurate to use the text numerically than to use the text as it is, and has an improved efficiency in operation speed. In addition, when text is used numerically, it is recognized that too many variables can degrade the accuracy or reduce the operation speed.

이에, 본 발명의 해결하고자 하는 다른 과제는, 소셜 미디어들에 나타나는 텍스트들을 점수화하는데 있어서, 긍정 또는 부정의 감성을 점수로 예측하도록 머신러닝된 모델을 정확도와 연산 속도가 향상된 방식으로 사용하는 사용자 반응 데이터 분석 방법 및 장치를 제공하는 것이다.Another problem to be solved by the present invention is to provide a user-responding system that uses a machine-runable model in which the accuracy and speed of operation are improved in order to score positive or negative emotions in scoring texts displayed in social media And to provide a data analysis method and apparatus.

전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법이 제공된다. 상기 방법은 사용자 반응을 포함하는 적어도 하나의 텍스트를 수신하는 단계, 적어도 하나의 텍스트를 매트릭스로 수치화하는 단계, 적어도 하나의 텍스트에 대한 수치화된 매트릭스에 기초하여 텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어를 예측하도록 구성된 엔진을 이용하여, 적어도 하나의 텍스트에 대한 스코어를 결정하는 단계 및 결정된 스코어를 제공하는 단계를 포함한다.According to an aspect of the present invention, there is provided a method for analyzing user reaction data according to an embodiment of the present invention. The method includes receiving at least one text that includes a user response, quantifying the at least one text into a matrix, determining a tendency to affirm or deny the text based on the quantized matrix for the at least one text Using an engine configured to predict a score to be represented, determining a score for the at least one text, and providing the determined score.

본 발명의 다른 특징에 따르면, 적어도 하나의 텍스트를 매트릭스로 수치화하는 단계는, 텍스트에서 단어의 출연빈도수를 카운트하는 단계 및 텍스트에 대한 정보를 유지하면서 변수를 줄이기 위해 단어의 출연빈도수를 매트릭스로 처리하는 단계를 포함한다.According to another aspect of the present invention, the step of digitizing at least one text into a matrix comprises the steps of counting occurrence frequencies of words in the text, and processing the frequency of occurrences of words in a matrix to reduce variables while retaining information about the text .

본 발명의 또 다른 특징에 따르면, 단어의 출연빈도수를 매트릭스로 처리하는 단계는, 단어의 출연빈도수를 매트릭스로 치환하는 단계 및 매트릭스의 차원을 축소하는 단계를 포함한다.According to still another aspect of the present invention, the step of processing the appearance frequencies of the words into a matrix includes a step of replacing the occurrence frequency of words with a matrix and a step of reducing the dimension of the matrix.

본 발명의 또 다른 특징에 따르면, 단어의 출연빈도수를 매트릭스로 치환하는 단계는 tf -idf, word2vec, doc2vec 중 하나를 이용하여 단어의 출연빈도수를 매트릭스로 치환하는 단계일 수 있다.According to still another aspect of the present invention, the step of replacing the occurrence frequencies of words with a matrix may be a step of replacing the occurrence frequencies of words with a matrix using one of tf- idf, word2vec, and doc2vec.

본 발명의 또 다른 특징에 따르면, 매트릭스의 차원을 축소하는 단계는 truncated Singular Value Decomposition(SVD) 또는 Sufficient Reduction(SR)을 이용하여 차원을 축소하는 단계일 수 있다.According to another aspect of the present invention, the step of reducing the dimension of the matrix may be a step of reducing the dimension using truncated Singular Value Decomposition (SVD) or Sufficient Reduction (SR).

본 발명의 또 다른 특징에 따르면, 스코어를 제공하는 단계는 적어도 하나의 텍스트에 대한 스코어를 텍스트 작성자의 정보와 연관시켜 제공하는 단계를 포함한다.According to another aspect of the present invention, providing a score comprises providing a score for at least one text in association with information of a text creator.

본 발명의 또 다른 특징에 따르면, 스코어를 텍스트 작성자의 정보와 연관시켜 제공하는 단계는, 소셜 서비스에서 팔로워, 친구, 및 구독수 중 적어도 하나를 기초로 산출된 텍스트 작성자 영향력을 이용하여 적어도 하나의 텍스트에 대한 스코어를 보상하는 단계를 포함한다.In accordance with another aspect of the present invention, providing a score in association with information of a text creator comprises providing at least one of the at least one textual content using a textual creator influence computed based on at least one of a follower, a friend, And compensating for the score for the text.

본 발명의 또 다른 특징에 따르면, 스코어를 제공하는 단계는 적어도 하나의 텍스트를 스코어에 따라 2 이상의 식별자로 분류하는 단계 및 2 이상의 식별자를 시간대별로 시각적으로 제공하는 단계를 포함한다.According to another aspect of the present invention, the step of providing a score includes classifying at least one text into at least two identifiers according to a score and visually providing two or more identifiers in a time zone.

전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 장치가 제공된다. 상기 장치는 사용자 반응을 포함하는 적어도 하나의 텍스트를 수신하도록 구성된 통신부, 통신부와 동작가능하도록 연결되고, 통신부로부터 사용자 반응을 포함하는 적어도 하나의 텍스트를 획득하고, 적어도 하나의 텍스트를 매트릭스로 수치화하고, 적어도 하나의 텍스트에 대한 수치화된 매트릭스에 기초하여 텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어를 예측하도록 구성된 엔진을 이용하여, 적어도 하나의 텍스트에 대한 스코어를 결정하도록 구성된 프로세서 및 결정된 스코어를 제공하도록 구성된 출력부를 포함한다.In order to solve the above problems, an apparatus for analyzing user reaction data according to an embodiment of the present invention is provided. The apparatus comprising: a communication unit operatively coupled to receive at least one text including a user response; at least one textual unit coupled to the communication unit for obtaining a user response from the communication unit; A processor configured to determine a score for at least one text using an engine configured to predict a score indicative of a tendency for the text to be positive or negative based on a quantized matrix for at least one text and a determined score And an output unit configured to provide the output.

본 발명의 다른 특징에 따르면, 적어도 하나의 텍스트를 매트릭스로 수치화하는 것은, 텍스트에서 단어의 출연빈도수를 카운트하고, 단어의 출연빈도수를 매트릭스로 치환하고, 매트릭스의 차원을 축소하는 것을 포함한다.According to another aspect of the present invention, digitizing at least one text into a matrix includes counting occurrences of occurrences of words in the text, replacing occurrences of the occurrences of words with a matrix, and reducing the dimension of the matrix.

본 발명은, 고객 반응을 보다 정확하게 파악할 수 있는 사용자 반응 데이터 분석 방법 및 장치를 제공할 수 있는 효과가 있다.The present invention has the effect of providing a user reaction data analysis method and apparatus capable of more accurately grasping a customer response.

나아가, 본 발명은 소셜 미디어들에 나타나는 텍스트들을 점수화하는데 있어서, 긍정 또는 부정의 감성을 점수로 예측하도록 머신러닝된 모델을 정확도와 연산 속도가 향상된 방식으로 사용할 수 있다.Furthermore, the present invention can use a machine-run model in a way that improves accuracy and computation speed, in scoring text appearing in social media, to predict scores of positive or negative emotions.

본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.The effects according to the present invention are not limited by the contents exemplified above, and more various effects are included in the specification.

도 1은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법을 이용하는 서비스를 설명하기 위한 개략도이다.
도 2는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 장치를 설명하기 위한 개략적인 블록도이다.
도 3은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법을 설명하기 위한 개략적인 순서도이다.
도 4는 본 발명의 다른 실시예에 따른 사용자 반응 데이터 분석 방법을 설명하기 위한 개략적인 순서도이다.
도 5는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법과 종래의 분석 방법을 비교하기 위한 개략도이다.
도 6은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 감성 지수를 예시적으로 도시한 유저인터페이스를 설명하기 위한 개략도이다.
도 7은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 다양한 시각화 방식에 따라 소셜 미디어에서 언급된 버즈량을 비교하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 다양한 시각화 방식에 따라 스코어 분포를 나타내기 위한 도면이다.
도 9는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 다양한 시각화 방식에 따라 하위 스코어에서 언급되는 단어들을 나타내는 도면이다.
1 is a schematic diagram for explaining a service using a user response data analysis method according to an embodiment of the present invention.
2 is a schematic block diagram for explaining a user reaction data analysis apparatus according to an embodiment of the present invention.
3 is a schematic flowchart for explaining a method of analyzing user reaction data according to an embodiment of the present invention.
4 is a schematic flowchart for explaining a method of analyzing user reaction data according to another embodiment of the present invention.
5 is a schematic diagram for comparing a user reaction data analysis method and a conventional analysis method according to an embodiment of the present invention.
FIG. 6 is a schematic view for explaining a user interface illustrating an emotion index in the user reaction data analysis method according to an embodiment of the present invention. Referring to FIG.
FIG. 7 is a diagram for comparing the buzz amounts referred to in the social media according to various visualization methods in the user reaction data analysis method according to an embodiment of the present invention.
FIG. 8 is a diagram illustrating a score distribution according to various visualization methods in the method of analyzing user response data according to an exemplary embodiment of the present invention. Referring to FIG.
9 is a diagram illustrating words referred to in a lower score according to various visualization methods in the method of analyzing user reaction data according to an embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention, and the manner of achieving them, will be apparent from and elucidated with reference to the embodiments described hereinafter in conjunction with the accompanying drawings. It should be understood, however, that the invention is not limited to the disclosed embodiments, but is capable of many different forms and should not be construed as limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, To fully disclose the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims.

비록 제1, 제2 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.Although the first, second, etc. are used to describe various components, it goes without saying that these components are not limited by these terms. These terms are used only to distinguish one component from another. Therefore, it is needless to say that the first component mentioned below may be the second component within the technical spirit of the present invention.

명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Like reference numerals refer to like elements throughout the specification.

본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.It is to be understood that each of the features of the various embodiments of the present invention may be combined or combined with each other partially or entirely and technically various interlocking and driving is possible as will be appreciated by those skilled in the art, It may be possible to cooperate with each other in association.

이하, 첨부된 도면을 참조하여 본 발명의 다양한 실시예들을 상세히 설명한다.Various embodiments of the present invention will now be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 장치를 이용하는 시스템을 설명하기 위한 개략도이다. 사용자 반응 데이터 분석 장치(100)를 이용하는 시스템(1000)은 소셜 서비스 이용 디바이스(10), 소셜 서비스 서버(20), 사용자 반응 데이터 분석 장치(100) 및 사용자 반응 데이터 분석 이용 디바이스(30)를 포함할 수 있다. 본 명세서에서, 소셜 서비스 이용 디바이스(10) 및 사용자 반응 데이터 분석 이용 디바이스(30)는 제한되지 않고, 예를 들어, 범용 컴퓨터, 랩탑, 네트워크 연결형 저장소, 스트리밍 서버, 모바일 디바이스 (예: MP3 플레이어, 테블릿 디바이스, 스마트폰) 등을 포함할 수 있다. 1 is a schematic diagram for explaining a system using a user reaction data analysis apparatus according to an embodiment of the present invention. The system 1000 using the user reaction data analysis apparatus 100 includes a social service utilization device 10, a social service server 20, a user reaction data analysis device 100 and a user reaction data analysis utilization device 30 can do. In this specification, the social service utilizing device 10 and the user reaction data analysis utilizing device 30 are not limited and may be, for example, a general purpose computer, a laptop, a network-connected storage, a streaming server, Tablet devices, smart phones), and the like.

소셜 서비스 이용 디바이스(10)에서 사용자 반응 데이터가 생성된다. 소셜 서비스 데이터란 페이스북, 인스타그램, 블로그, 웹페이지형 소셜 서비스, 텀블러 등의 소셜 서비스 또는 소셜 미디어의 이용자가 작성한 모든 텍스트 데이터를 의미할 수 있다. 텍스트 데이터는 특정 서비스나 유무형의 상품에 대한 텍스트를 포함할 수 있다. 소셜 서비스 서버(20)는 소셜 서비스 이용 디바이스(10)에서 생성된 소셜 서비스 데이터를 저장하고 관리한다. 도 1에서는 소셜 서비스 서버(20)를 편의상 하나의 서버로 도시하였으나, 이에 제한되지 않고, 소셜 서비스 서버(20)는 운영 서버, 데이터베이스 등 다양한 구현 형태를 포함할 수 있다. 또한, 사용자 반응 데이터는 소셜 서비스로부터의 텍스트 데이터뿐만 아니라 인터넷에서 획득가능한 사용자 반응을 포함하는 텍스트 데이터를 모두 포함할 수 있다.User response data is generated in the social service utilizing device 10. [ Social service data may refer to any textual data created by users of social media or social media such as Facebook, Instagram, blog, web page-based social services, tumblers, and the like. The text data may include text for specific services or goods of the type. The social service server 20 stores and manages the social service data generated in the social service using device 10. [ In FIG. 1, the social service server 20 is shown as a single server for the sake of convenience. However, the present invention is not limited to this, and the social service server 20 may include various implementations such as an operation server and a database. In addition, the user response data may include both text data from a social service, as well as text data including user responses obtainable from the Internet.

본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 장치(100)는 소셜 서비스 서버(20)에 저장된 소셜 서비스 데이터를 수신하고, 소셜 서비스 데이터 또는 텍스트 데이터를 분석하도록 구성된다. 본 명세서에서, 텍스트 데이터의 분석은 특정 서비스나 유무형의 상품에 대한 텍스트에 대해 감성스코어를 결정하고, 감성스코어, 특정 범위의 감성스코어를 가지는 텍스트, 그 텍스트들의 공통점 및 감성 스코어를 이용하여 생성된 시각적인 표지들을 제공하는 일련의 모든 작업들을 제한하지 않고 포함할 수 있다. The user reaction data analysis apparatus 100 according to an embodiment of the present invention is configured to receive social service data stored in the social service server 20 and analyze social service data or text data. In the present specification, the analysis of the text data is performed by determining an emotion score for a text for a specific service or an item-type merchandise, and for generating the emotion score using the emotion score, text having a certain range of emotion scores, And may include, without limitation, all of a series of tasks that provide visual indicia.

사용자 반응 데이터 분석 장치(100)는 수신된 텍스트 데이터를 수치화하도록 변환시키고, 수치화된 텍스트 데이터에 바람직하게는 전처리를 수행한다. 나아가, 사용자 반응 데이터 분석 장치(100)는 수치화된 텍스트 데이터가 입력되는 경우 텍스트들의 감성스코어를 예측하도록 구성된 예측 모델을 이용하여 텍스트 데이터에 대한 감성스코어를 획득한다. 또한, 사용자 반응 데이터 분석 장치(100)는 획득된 감성스코어를 이용하여 사용자 반응 데이터 분석 이용 디바이스(30)의 요청에 대응한 사용자 반응 데이터 분석을 제공할 수 있다. 사용자 반응 데이터 분석 장치(100)가 텍스트 데이터를 처리하는 구체적인 방법들에 대해서는 도 3 및 4를 참조하여 후술한다.The user reaction data analysis apparatus 100 converts the received text data into numerical values, and preferably performs preprocessing on the digitized text data. Furthermore, the user reaction data analysis apparatus 100 acquires emotion scores for text data using a prediction model configured to predict emotion scores of texts when numerical text data is input. In addition, the user reaction data analysis apparatus 100 may provide the user reaction data analysis corresponding to the request of the user reaction data analysis utilizing device 30 using the obtained emotion score. Specific methods by which the user reaction data analysis apparatus 100 processes text data will be described later with reference to FIGS. 3 and 4. FIG.

사용자 반응 데이터 분석 이용 디바이스(30)는 사용자 반응 데이터 분석 장치(100)에 특정 서비스나 유무형 상품과 연관된 소셜 서비스 데이터의 분석을 요청할 수 있다. 사용자 반응 데이터 분석 이용 디바이스(30)는 상기 요청에 응답하여 사용자 반응 데이터 분석 장치(100)로부터 감성스코어를 포함하는 소셜 서비스 데이터에 대한 분석 결과를 수신하고 열람할 수 있다.The user reaction data analysis utilizing device 30 can request the user reaction data analysis apparatus 100 to analyze the social service data associated with the specific service or the non-goods item. In response to the request, the user reaction data analysis utilizing device 30 can receive and view the analysis result of the social service data including the emotion score from the user reaction data analysis apparatus 100.

도 2는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 장치를 설명하기 위한 개략적인 블록도이다. 2 is a schematic block diagram for explaining a user reaction data analysis apparatus according to an embodiment of the present invention.

사용자 반응 데이터 분석 장치(100)는 통신부(110), 사용자 입력부(120), 출력부(130), 메모리(140), 인터페이스부(150), 제어부(160) 및 전원 공급부(170) 등을 포함할 수 있다. 도 1에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 가지거나 그보다 적은 구성요소들을 갖는 장치가 구현될 수도 있다.The user reaction data analysis apparatus 100 includes a communication unit 110, a user input unit 120, an output unit 130, a memory 140, an interface unit 150, a control unit 160, and a power supply unit 170 can do. The components shown in Fig. 1 are not essential, and an apparatus having more or fewer components may be implemented.

통신부(110)는 장치와 장치가 위치한 네트워크 사이의 유무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 통신부(110)는, 인터넷 등의 통신망 상에서 외부의 장치 예를 들어, 소셜 서비스 서버와 신호를 송수신한다. 상기 신호는, 다양한 형태의 데이터를 포함할 수 있다. 예를 들어, 통신부(110)는 소셜 서비스 서버로부터 텍스트인 사용자 반응 데이터를 수신할 수 있다. 사용자 반응 데이터는 특정 서비스 또는 유무형 상품과 연관된 사용자 반응 데이터일 수 있다.The communication unit 110 may include one or more modules that enable wired / wireless communication between the device and the network in which the device is located. The communication unit 110 transmits / receives signals to / from an external device, for example, a social service server on a communication network such as the Internet. The signal may include various types of data. For example, the communication unit 110 may receive user response data, which is text, from the social service server. The user response data may be user response data associated with a particular service or item.

다양한 실시예에서, 사용자 반응 데이터 분석 장치(100)는 크롤러(crawler) 모듈을 포함할 수 있다. 크롤러 모듈은 다양한 소셜 서비스에 존재하는 사용자 반응 데이터를 수집하기 위한 모듈이다. 크롤러 모듈은 광고/스팸 등의 불필요한 텍스트 데이터를 필터링할 수 있다. 또한, 크롤러 모듈은 사용자 반응 데이터와 함께 데이터를 생산한 사용자에 대한 정보도 함께 수집할 수 있다. 함께 수집되는 사용자에 대한 정보는 예를 들어 인구통계학적 데이터일 수 있다. 크롤러 모듈은 서로 상이한 소셜 서비스로부터 텍스트 데이터를 수집할 수 있다. 이 경우, 크롤러 모듈은 사용자에 대한 정보를 변환하여 일정한 포맷으로 통일시킬 수 있다. 다양한 실시예에서, 크롤러 모듈은 사용자 반응 데이터 분석 장치(100)와 별도로 구현될 수 있으며, 사용자 반응 데이터 분석 장치(100)는 분리된 크롤러 모듈로부터 전술한 텍스트인 사용자 반응 데이터 (및 인구통계학적 데이터)를 수신할 수 있다.In various embodiments, the user reaction data analysis apparatus 100 may include a crawler module. The crawler module is a module for collecting user reaction data existing in various social services. The crawler module can filter unnecessary text data such as advertisement / spam. Also, the crawler module can collect user reaction data as well as information about the user who produced the data. Information about the users that are gathered together can be, for example, demographic data. The crawler module can collect text data from different social services. In this case, the crawler module can convert the information about the user and unify it into a certain format. In various embodiments, the crawler module may be implemented separately from the user response data analysis device 100, and the user reaction data analysis device 100 may receive user response data (and the demographic data Can be received.

사용자 입력부(120)는 사용자가 장치기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(120)는 키 패드(key pad) 돔 스위치 (domeswitch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다. The user input unit 120 generates input data for controlling the operation of the device. The user input unit 120 may include a key pad dome switch, a touch pad (static / static), a jog wheel, a jog switch, and the like.

출력부(130)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(131), 음향 출력 모듈(132) 등이 포함될 수 있다. 디스플레이부(131)는 장치에서 처리되는 정보를 표시(출력)한다. 예를 들어, 장치가 시스템과 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 디스플레이부(131)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다. 음향 출력 모듈(132)은 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(132)은 장치에서 수행되는 기능과 관련된 음향 신호를 출력하기도 한다. 다양한 실시예에서, 사용자 입력부(120)나 출력부(130)는 생략되도록 구현될 수도 있다.The output unit 130 is for generating output related to visual, auditory or tactile sense, and may include a display unit 131, an audio output module 132, and the like. The display unit 131 displays (outputs) information processed in the apparatus. For example, the device displays a user interface (UI) or a graphical user interface (GUI) associated with the system. The display unit 131 may be a liquid crystal display (LCD), a thin film transistor-liquid crystal display (TFT LCD), an organic light-emitting diode (OLED), a flexible display display, and a 3D display. The audio output module 132 may output audio data received from the communication unit 110 or stored in the memory 160. [ The sound output module 132 also outputs sound signals related to functions performed in the apparatus. In various embodiments, the user input 120 or the output 130 may be omitted.

메모리부(140)는 제어부(160)의 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 입/출력되는 데이터들의 임시 저장을 위한 기능을 수행할 수도 있다. 메모리(140)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 장치는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.The memory unit 140 may store a program for processing and control of the controller 160 or may perform a function for temporarily storing input / output data. The memory 140 may be a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (e.g., SD or XD memory), a RAM (Random Access Memory), SRAM (Static Random Access Memory), ROM (Read Only Memory), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM A disk, and / or an optical disk. The device may operate in association with a web storage that performs the storage function of the memory 160 on the Internet.

인터페이스부(150)는 장치에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(150)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 장치 내부의 각 구성 요소에 전달하거나, 장치 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(150)에 포함될 수 있다. The interface unit 150 serves as a pathway to all external devices connected to the device. The interface unit 150 receives data from an external device, supplies power to each component in the device, or allows data in the device to be transferred to an external device. For example, a wired / wireless headset port, an external charger port, a wired / wireless data port, a memory card port, a port for connecting a device having an identification module, an audio I / O port, A video input / output (I / O) port, an earphone port, and the like may be included in the interface unit 150.

제어부(controller, 160)는 통상적으로 장치의 전반적인 동작을 제어한다. 예를 들어 데이터의 처리나 처리된 데이터를 디스플레이하기 위한 관련된 제어 및 처리를 수행한다. 제어부(160)는 병렬 데이터 처리를 위한 그래픽 모듈(161)을 구비할 수도 있다. 그래픽 모듈(161)은 제어부(160) 내에 구현될 수도 있고, 제어부(160)와 별도로 구현될 수도 있다.A controller 160 typically controls the overall operation of the device. For example, processing of data or associated control and processing for displaying processed data. The control unit 160 may include a graphics module 161 for parallel data processing. The graphic module 161 may be implemented in the control unit 160 or separately from the control unit 160.

전원 공급부(170)는 제어부(160)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.The power supply unit 170 receives external power and internal power under the control of the controller 160 and supplies power necessary for operation of the respective components.

여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.The various embodiments described herein may be embodied in a recording medium readable by a computer or similar device using, for example, software, hardware, or a combination thereof.

하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs(application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시예들이 제어부(160) 자체로 구현될 수 있다.According to a hardware implementation, the embodiments described herein may be implemented as application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays May be implemented using at least one of a processor, controllers, micro-controllers, microprocessors, and other electronic units for performing other functions. In some cases, The embodiments described may be implemented by the control unit 160 itself.

소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(160)에 의해 실행될 수 있다.According to a software implementation, embodiments such as the procedures and functions described herein may be implemented with separate software modules. Each of the software modules may perform one or more of the functions and operations described herein. Software code can be implemented in a software application written in a suitable programming language. The software code is stored in the memory 160 and can be executed by the control unit 160. [

제어부(160)는 수신된 텍스트 데이터를 분석 전에 정제할 수 있다. 보다 구체적으로, 제어부(160)는 수신된 텍스트 데이터에 대해 텍스트 정규화, 스팸/광고 필터링 프로세스를 전처리 프로세스로 수행할 수 있다. 텍스트 정규화는 오탈자 수정, 인터넷 신조어 의미 파악 및 적용, 불필요한 문자 제거(특수기호, 특수문자), 신조어 추출을 포함할 수 있다.The control unit 160 may refine the received text data before analysis. More specifically, the control unit 160 may perform the text normalization and the spam / advertisement filtering process on the received text data as a preprocessing process. Text normalization can include misinterpretation, identification and application of newborn spoken words, elimination of unnecessary characters (special symbols, special characters), and cointegration.

제어부(160)는 전처리된 텍스트 데이터에 대해서 감성 스코어를 산출할 수 있다. 또한, 제어부(160)는 산출된 감성 스코어를 이용하여 연관어 분석을 통해 소비자 감성 분석. 오피니언 리더 분석 및 트렌드 분석 (트래픽, 언급량)을 수행할 수 있다. 예를 들어, 브랜드/키워드 트렌드 분석은 특정 사용자 반응 트래픽 분석, 특정 브랜드/키워드 언급량 분석 등을 포함할 수 있다. 제어부(160)는 산출된 감성 스코어와 오피니언 리더 스코어(OLS: Opinion Leader score)를 연관시켜 제공할 수 있다. OLS란 팔로워, 친구, 구독 수를 기반으로 산출될 수 있으며, 소셜 서비스 상에서 텍스트를 작성한 사용자가 가지는 영향력을 구체적으로 수치화하는 것을 의미한다.The control unit 160 can calculate the emotion score with respect to the preprocessed text data. In addition, the control unit 160 may use the calculated emotion score to analyze the associated sentences. Opinion leader analysis and trend analysis (traffic, referral). For example, brand / keyword trend analysis can include specific user response traffic analysis, specific brand / keyword referral volume analysis, and so on. The control unit 160 may provide the calculated emotion score and an Opinion Leader score (OLS) in association with each other. The OLS can be calculated based on the number of followers, friends, and subscriptions, which means that the influence of the user who created the text on the social service is quantified in detail.

다양한 실시예에서, 제어부(160)는 산출된 감성 스코어를 이용하여, 데이터 시각화를 수행할 수 있다. 데이터 시각화는 사용자들의 인구통계학적 특징에 따른 감성분포도 제시하는 것을 포함한다. 데이터 시각화는 또한 오피니언 리더 트랙, 저장된 데이터를 기반으로 인구통계학적 정보의 추출, 데이터 분석 결과와 결합하여 시각화하는 것, 다양한 SNS 채널 별로 특정 브랜드에 강한 영향력을 보유한 소비자 추적하는 것, 인구통계학적 정보(지역/연령/성별 등) 또한 표기하는 것을 포함한다.In various embodiments, the control unit 160 can perform data visualization using the calculated emotion score. Data visualization involves presenting emotional distributions according to demographic characteristics of users. Data visualization also includes opinion leader track, demographic information extraction based on stored data, visualization combined with data analysis results, consumer tracking with strong impact on specific brands across various SNS channels, demographic information (Area / age / sex, etc.).

제어부(160)는 데이터의 가공 및 시각화를 수행할 수 있다. 데이터의 가공은 텍스트 데이터 각각에 대해서 획득된 감성 스코어를 결합하는 작업을 포함할 수 있다. 다양한 실시예에서 제어부(160)는 감성 스코어의 분포도 도출을 위해 감성 스코어를 결합할 수 있으며, 감성 스코어 스펙트럼과 감성 스코어와 인구통계학적 데이터의 결합 및 감성 스코어에 따른 트렌드의 시계열분석 결과 등을 포함할 수 있다. 다양한 실시예에서, OLS가 높은 오피니언 리더가 개제한 텍스트에 대한 타 사용자들의 반응을 감성 스코어를 통해 나타낼 수 있다. 이에 따라, 거시적인 측면에서의 각 개개인의 영향력 (팔로워 수, 페이지 좋아요 수 등) 보다는 특정 서비스 또는 상품에 대한 소비자 의견의 영향력을 측정하고, 특정 서비스 또는 상품에 따라 가장 많은 공감을 얻고 있는 의견을 식별할 수 있다. The control unit 160 can perform data processing and visualization. The processing of the data may include combining the emotion scores obtained for each of the textual data. In various embodiments, the controller 160 may combine emotional scores to derive a distribution of emotional scores, including combinations of emotional score spectra, emotional scores and demographic data, and time series analysis of trends according to emotional scores can do. In various embodiments, an OLS high-opinion leader may indicate the response of other users to the restricted text through an emotional score. This allows us to measure the impact of consumer opinion on a particular service or product rather than the impact of each individual on the macroscopic side (number of followers, page thumbnails, etc.) Can be identified.

다양한 실시예에서, 제어부(160)는 텍스트로부터 획득된 감성 스코어를 스펙트럼으로 나타내어 특정 서비스 또는 유무형 상품에 대한 소비자 의견을 점수화하여 가장 높은 감성 스코어의 텍스트를 제공할 수 있다. In various embodiments, the controller 160 may spectrally display the emotion score obtained from the text to score the consumer's opinion on a particular service or non-product, to provide the text of the highest emotion score.

본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 장치(100)에 따르면, 마케터와 브랜드 매니저와 같은 사용자가 사용자 반응 데이터 분석 장치(100)의 결과물을 통해 상품 또는 서비스가 소비자들로부터 어떻게 평가를 받는지에 대한 정보를 광범위한 범위에서 수치화된 자료로 획득할 수 있다. 이에 따라, 본 사용자 반응 데이터 분석 장치(100)는 현재 서비스 또는 상품의 개량과 신상품의 개발에 대한 인사이트를 제공할 수 있다.According to the user reaction data analysis apparatus 100 according to the embodiment of the present invention, when a user such as a marketer and a brand manager receives an evaluation of a product or a service from consumers through the output of the user reaction data analysis apparatus 100 Can be obtained as numerical data from a wide range of sources. Accordingly, the present user reaction data analysis apparatus 100 can provide an insight into the improvement of the current service or product and the development of a new product.

이하에서는, 도 3을 참조하여, 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 감성 스코어를 획득 또는 산출하는 방식에 대해서 구체적으로 설명한다. 도 3은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법을 설명하기 위한 개략적인 순서도이다. 설명의 편의를 위해 도 2의 구성요소들을 참조하여 설명한다.Hereinafter, with reference to FIG. 3, a method of acquiring or calculating emotion score in the method of analyzing user reaction data according to an embodiment of the present invention will be described in detail. 3 is a schematic flowchart for explaining a method of analyzing user reaction data according to an embodiment of the present invention. For convenience of explanation, the components will be described with reference to FIG.

먼저, 제어부(160)는 통신부(110)를 통해 사용자 반응을 포함하는 적어도 하나의 텍스트를 수신한다(S110). 소셜 서비스에서 수집되는 텍스트는 특정 서비스 또는 상품과 연관된 사용자 반응을 포함하는 텍스트일 수 있다. 또한, 전술한 바와 같이 사용자 반응을 포함하는 텍스트는 소셜 서비스외의 다른 방식을 통해 획득될 수도 있다. 또한, 소셜 서비스에서 제한되지 않고 일정 기간 동안의 텍스트가 수집된 후 서비스 또는 상품과 연관된 텍스트가 필터링될 수도 있다. 텍스트는 복수의 소셜 서비스에서 수집될 수 있으며, 이 경우 텍스트의 포맷이 통일되도록 변환작업이 수반될 수도 있다. 또한, 다양한 실시예에서 OLS를 포함한 텍스트를 작성한 사용자의 정보가 함께 수신될 수도 있다. First, the control unit 160 receives at least one text including a user response through the communication unit 110 (S110). The text collected in a social service may be text containing user responses associated with a particular service or product. Further, as described above, the text including the user response may be obtained through a method other than the social service. In addition, the text associated with a service or product may be filtered after the text for a certain period of time has been collected without limitation in the social service. The text may be collected in a plurality of social services, in which case the conversion may be accompanied by a uniform formatting of the text. Also, in various embodiments, the information of the user who created the text including the OLS may be received together.

다음으로, 제어부(160)는 적어도 하나의 텍스트를 매트릭스의 형식으로 수치화한다(S120). 텍스트를 매트릭스의 형식으로 수치화하는 작업은 제한되지 않으며, 예를 들어, Document Term Matrix(DTM)을 생성하는 것을 포함할 수 있다. DTM이란 문장에서 용어의 출현빈도를 카운팅하여 수치화하는 것을 의미한다. DTM을 통해서 복수의 텍스트가 행렬로 나타내어질 수 있다. 복수의 텍스트가 입력되는 경우, 각각의 텍스트에 대해서 하나의 행을 가지게 되며, 각각의 용어에 대해서 하나의 열을 가지게 된다. Next, the controller 160 digitizes at least one text in the form of a matrix (S120). Quantifying text in the form of a matrix is not limited, and may include, for example, creating a Document Term Matrix (DTM). DTM means to quantify the frequency of occurrence of a term in a sentence. Through DTM, multiple texts can be represented by a matrix. When a plurality of texts are input, they have one row for each text, and one column for each term.

제어부(160)는, 적어도 하나의 텍스트에 대한 수치화된 매트릭스에 기초하여 텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어를 예측하도록 구성된 엔진을 이용하여, 적어도 하나의 텍스트에 대한 스코어를 결정한다(S130).The control unit 160 determines a score for the at least one text using an engine configured to predict a score indicative of a tendency toward positive or negative of the text based on the numerical matrix for the at least one text S130).

텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어(또는 감성 스코어)를 예측하도록 구성된 엔진은, 예를 들어, 텍스트 및 긍정 또는 부정에 대한 경향성을 스코어의 데이터 세트를 통해 텍스트의 감성 스코어를 예측하도록 학습된 엔진일 수 있다. 예를 들어, 엔진은 Recurrent Neural Network등 제한되지 않은 공지의 방법을 이용하여 구축될 수 있다. 엔진에서 각각의 수치화된 텍스트 데이터는 하나의 매트릭스로 표현될 수 있으며, 반복적인 학습을 통해 수치화된 텍스트 데이터가 가질 확률이 높은 감성 스코어가 예측될 수 있다. 제한되지 않으나, 텍스트 데이터가 가지는 용어들 각각이 가지는 긍정 또는 부정 경향성들이 스코어로 환산되고 학습된 확률 통계에 따라 텍스트가 가지는 감성 스코어가 예측 또는 결정될 수 있다. An engine configured to predict a score (or emotional score) indicative of a positive or negative tendency of the text may be configured to predict the emotional score of the text, for example, via text and a dataset of scores, It can be a learned engine. For example, the engine may be constructed using a known and unrestricted method such as Recurrent Neural Network. Each digitized text data in the engine can be represented by one matrix, and an emotion score having a high probability of having digitized text data through repetitive learning can be predicted. Although not limited, affirmative or negative tendencies of each of the terms of the text data are converted into scores, and the emotion score of the text may be predicted or determined according to the learned probability statistics.

결정된 스코어는 사용자 디바이스에 제공된다(S140). 예를 들어 결정된 스코어를 제공받는 사용자 디바이스는 결정된 스코어를 대응하는 텍스트와 함께 제공받을 수 있다. 다양한 실시예에서, 결정된 감성 스코어는 도 2와 함께 설명된 다양한 시각화 자료로 생성되어 제공될 수도 있다.The determined score is provided to the user device (S140). For example, a user device that is provided with a determined score may be provided with a corresponding score of the determined score. In various embodiments, the determined emotion score may be generated and provided with various visualization materials described in conjunction with FIG.

본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서는 텍스트 자체를 감성을 나타내는 스코어로 예측하거나 결정하지 않는다는 점에서 종래의 텍스트 데이터 분석 방법과 차이점이 있을 수 있다. 텍스트 자체를 감성 스코어 엔진과 유사한 예측 엔진에 학습시키고, 이러한 예측 엔진에 텍스트 자체를 입력하여 감성 스코어를 결정 또는 예측시킬 수 있다. 그러나, 텍스트 자체를 이용하는 경우, 텍스트 자체가 가지는 다양성 때문에, 수치화된 텍스트 데이터에 비해 데이터의 처리량이 상대적으로 클 수 있다. 데이터 처리량이 상대적으로 큰 경우 엔진의 정확도를 향상시키기 위한 학습량도 증가할 수 있다. 또는, 같은 학습량을 가진 엔진을 사용하는 경우 텍스트 자체를 입력으로 이용하는 경우에 예측 정확도가 수치화된 텍스트 데이터를 이용하는 것보다 낮을 수 있다. 결국, 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에 따르면 텍스트를 수치화한 데이터를 학습 가능한 감성 스코어 예측 엔진에 사용함으로써, 동일한 엔진 학습량에서 보다 정확한 예측 결과를 나타낼 수 있다.The method of analyzing user response data according to an embodiment of the present invention may differ from the conventional method of analyzing text data in that the text itself is not predicted or determined by a score indicating emotion. The text itself can be learned by a prediction engine similar to an emotion score engine, and the text itself can be input to the prediction engine to determine or predict the emotion score. However, when the text itself is used, the throughput of the data may be relatively large as compared with the numerical text data because of the diversity of the text itself. If the data throughput is relatively large, the amount of training to improve the accuracy of the engine may also increase. Or, if an engine with the same amount of training is used, the prediction accuracy may be lower than using text data that is numerically quantified when the text itself is used as input. As a result, according to the user response data analysis method according to an embodiment of the present invention, the empirical score prediction engine capable of learning can provide more accurate results in the same engine learning amount.

도 4는 본 발명의 다른 실시예에 따른 사용자 반응 데이터 분석 방법을 설명하기 위한 개략적인 순서도이다. 도 4에서 단계 S110, S130, S140은 도 3에서 전술한 동일한 부호의 단계들과 실질적으로 동일하므로, 중복 설명은 생략한다.4 is a schematic flowchart for explaining a method of analyzing user reaction data according to another embodiment of the present invention. In FIG. 4, steps S110, S130, and S140 are substantially the same as the steps of the same reference numerals shown in FIG. 3, and redundant explanations are omitted.

단계 S122, S124 및 S126은 도 3에서 설명된 적어도 하나의 텍스트를 매트릭스의 형식으로 수치화는 단계의 다른 실시예를 나타낼 수 있다. 도 4를 참조하면, 적어도 하나의 텍스트에서 단어의 출연빈도수가 카운트된다(S122). 예를 들어, 단계 S122는 Document Term Matrix(DTM)을 생성하는 것일 수 있다. Steps S122, S124 and S126 may represent another embodiment of the step of quantifying at least one text described in Fig. 3 in the form of a matrix. Referring to FIG. 4, the appearance frequencies of words in at least one text are counted (S122). For example, step S122 may be to generate a Document Term Matrix (DTM).

예를 들어, 하나의 텍스트(T1)가 “나는 홍길동이다”이고, 다른 하나의 텍스트(T2)가 “나는 김철수이다” 라고 하면, DTM을 통해 생성된 매트릭스는 아래의 매트릭스(표 1)와 같이 나타낼 수 있다.For example, if one text T1 is "I am Hong Kil-dong" and the other text T2 is "I am Kim Chul-soo", the matrix generated by the DTM is represented by the following matrix .

I The 홍길동Hong Gil Dong 이다to be 김철수Kim Cheol-Soo T1T1 1One 1One 1One 1One 00 T2T2 1One 1One 00 1One 1One

다만, 단어에서 일부의 단어들, 예를 들어 조사 등은 감성 스코어를 예측하거나 산출하는데 있어, 다른 단어들에 비해 상대적으로 중요하지 않을 수 있다. 즉, 텍스트는 상대적으로 중요성이 낮은 변수로 나타내어지는 단어를 포함할 수 있다. 그러나, 이러한 단어 또는 변수들을 제외하도록 처리한다면, 텍스트에서 누락이 발생되고 이러한 누락은 산출 또는 예측되는 감성 스코어의 정확성을 떨어뜨릴 수 있다. 이를 위해, DTM을 매트릭스로 변환한 후 차원 축소를 함으로써, 정확성을 유지하는 동시에 사용되는 변수를 감소시켜 데이터의 처리량을 감소시킨다. However, some words in a word, such as an investigation, may not be as important relative to other words in predicting or calculating emotional scores. That is, the text may include words represented by relatively less important variables. However, if you process them to exclude such words or variables, omissions will occur in the text and these omissions can degrade the accuracy of the emotion score being calculated or predicted. To do this, DTM is converted into a matrix and then reduced by dimensioning, which reduces the throughput of data by reducing the variables used while maintaining accuracy.

이를 위해, 단어의 출연빈도수는 매트릭스로 치환된다(S124). DTM을 매트릭스로 치환하는 방식은 제한되지 않으며, 예를 들어 tf-idf(Term Frequency - Inverse Document Frequency), word2vec, doc2vec 등의 방식이 사용될 수 있다. To this end, the occurrence frequency of words is replaced with a matrix (S124). The method of replacing the DTM with the matrix is not limited. For example, a method such as tf-idf (Term Frequency - Inverse Document Frequency), word2vec, and doc2vec may be used.

치환된 매트릭스의 차원이 축소된다(S126). 치환된 매트릭스의 차원 축소는 truncated Singular Value Decomposition(SVD) 또는 Sufficient Reduction(SR) 등의 방식이 사용될 수 있다. truncated SVD가 사용되는 경우, 하기의 수학식 1이 사용될 수 있다.The dimension of the substituted matrix is reduced (S126). For the dimensional reduction of the substituted matrix, a truncated singular value decomposition (SVD) or a sum reduction (SR) scheme may be used. When truncated SVD is used, the following equation 1 can be used.

[수학식 1][Equation 1]

Figure pat00001
Figure pat00001

여기서, X는 DTM으로 생성된 매트릭스이며, k는 X를 축소하고자 하는 차원의 크기이며,

Figure pat00002
는 truncated SVD를 통해 차원 축소된 X, 즉 SVD변환의 결과물이며,
Figure pat00003
는 SVD변환을 통해 구해진 오른쪽 eigenvector로 이루어진 매트릭스이며, ∑는 SVD변환을 통해 구해진 eigenvalue로 이루어진 대각행렬이며, V는 SVD변환을 통해 구해진 왼쪽 eigenvector로 이루어진 매트릭스이다. 여기서 차원의 크기 k를 조절함으로써 차원 축소를 통해 잃게 되는 정보량, 감성 스코어 예측과 학습에 용이한 데이터의 크기를 고려할 수 있다.Where X is a matrix generated by DTM, k is the size of the dimension for which X is to be reduced,
Figure pat00002
Is the result of a dimensionally reduced X, or SVD, transform through a truncated SVD,
Figure pat00003
Is a matrix of right eigenvectors obtained by SVD transform, Σ is a diagonal matrix of eigenvalues obtained by SVD transform, and V is a matrix of left eigenvectors obtained through SVD transform. By adjusting the size k of the dimension, it is possible to consider the amount of information lost through dimension reduction, the sensitivity score prediction, and the size of data that is easy to learn.

예를 들어, truncated SVD를 이용하여 치환된 매트릭스의 차원이 실질적으로 감소될 수 있다. 차원이 감소된 매트릭스에 기초하여, 텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어(또는 감성 스코어)를 예측하도록 구성된 엔진이 사용된다(S130). 차원이 감소된 매트릭스의 이용은 차원 감소 없는 수치화된 텍스트 데이터(또는 매트릭스)를 이용하는 것보다 더 빠른 감성 스코어 예측과 학습을 가능하게 할 수 있으며, 동시에 정확성이 유지될 수 있다.For example, the truncated SVD can be used to substantially reduce the size of the substituted matrix. An engine configured to predict a score (or emotion score) indicative of a tendency toward affirmation or negation of the text based on the reduced-size matrix is used (S130). The use of a diminished matrix can enable faster emotional score prediction and learning than using numerical text data (or a matrix) without diminishing dimensions, and accuracy can be maintained at the same time.

도 5는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법과 종래의 분석 방법을 비교하기 위한 개략도이다.5 is a schematic diagram for comparing a user reaction data analysis method and a conventional analysis method according to an embodiment of the present invention.

도 5의 (a)는 텍스트에 대한 종래의 이분법적인 분류를 개략적으로 나타낸다. 종래에는 소셜 서비스로부터 수집된 특정 서비스나 상품에 대한 텍스트 또는 소비자 반응을 긍정적인 반응 또는 부정적인 반응으로 나타내었다. 도 5의 (b)를 참조하면, 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법은 기존의 이분법적인 분류에 비교할 때, 고객 반응을 스펙트럼화할 수 있다. 이에 따라, 감성 스코어(도 5에서는 감성 지수로 표시)가 높은 텍스트를 통해서 충성도가 높은 소비자가 어떠한 점에서 서비스 또는 상품을 좋아하는지 알 수 있으며, 반대로 감성 스코어가 낮은 텍스트를 통해서 서비스 또는 상품에 어떠한 나아질 점이 있는지 알 수 있다. 예를 들어, 텍스트 작성자(204)는 감성 스코어가 높은 텍스트를 작성한 고객이며, 텍스트 작성자(206)은 감성 스코어가 낮은 텍스트를 작성한 고객일 수 있다. Figure 5 (a) schematically shows a conventional dichotomous classification of text. Traditionally, text or consumer responses to specific services or goods collected from social services have been expressed as positive or negative responses. Referring to FIG. 5 (b), the user response data analysis method according to an embodiment of the present invention can spectralize the customer response in comparison with the existing dichotomous classification. Accordingly, it is possible to know how the loyal consumer likes the service or the product through the text having the high emotional score (indicated by the emotion index in Fig. 5), and conversely, You can see if there is any improvement. For example, the text creator 204 may be a customer who created a text with a high emotion score, and the text creator 206 may be a customer who created text with a low emotional score.

또한, 종래의 이분법적 분류에서는 긍정적이지도 또는 부정적이지도 않은 집단이 관심있는 요소를 알기 어려웠다. 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법은 크게 높지도 낮지도 않은 감성 스코어를 가지는 집단이 어떠한 요소를 중요하게 생각하는지 파악할 수 있다. 예를 들어, 텍스트 작성자 (202, 208)은 감성 스코어가 크게 높지도 않고 낮지도 않은 텍스트를 작성한 고객들일 수 있다.Also, in the conventional dichotomous classification, it is difficult to know the elements that are of interest to a group that is not positive or negative. The user reaction data analysis method according to an embodiment of the present invention can grasp what factors are important to a group having a high or low emotional score. For example, the text creators 202 and 208 may be customers who have created a text that is not significantly high or low in emotional score.

도 6은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 감성 지수를 예시적으로 도시한 유저인터페이스를 설명하기 위한 개략도이다. 도 6은 스코어를 제공하는 예시적인 유저인터페이스를 나타낸다. 예시적인 유저인터페이스에서는 감성 스코어(도 6에서는 감성 지수로 표시)가 상위 30%인 그룹과 하위 30%인 그룹의 텍스트들이 표시된다. 텍스트(211)는 사용자가 작성한 서비스 또는 상품에 대한 피드백 텍스트이다. 반응 표시(212)는 텍스트(211)에 대해 얼마나 많은 타 사용자들이 호감을 나타내었는지 또는 얼마나 많이 텍스트(211)를 공유 했는지를 나타낸다. 아이콘(213)은 텍스트가 수집된 소셜 서비스를 나타낸다. 긍정 반응 표시(214)는 텍스트(211)가 긍정적인 반응으로 분류됨을 나타낸다. 감성 스코어(215)는 엔진에 의해 결정된 긍정 반응의 정도를 나타낸다. 부정 반응 표시(216)는 텍스트가 부정적인 반응으로 분류됨을 나타낸다. 감성 스코어(217)는 엔진에 의해 결정된 부정 반응의 정도를 나타낸다. 감성 스코어(215, 217)은 미리 결정된 최대 값 및 최소 값을 가질 수 있다. 제한되지 않으나, 감성 스코어(215, 217)는 0 내지 100의 값을 가질 수 있다. 전술한 바와 같이 감성 스코어(215, 217)에 대응하는 텍스트를 검토 할 수 있어, 긍정 반응 또는 부정 반응이 높은 소비자의 만족도 또는 니즈를 알 수 있다. 또한, 다양한 실시예에서 적어도 하나의 텍스트에 대한 감성 스코어가 텍스트 작성자의 정보와 연관시켜 제공될 수 있다. 예를 들어, 도 6에서 텍스트 작성자의 정보가 함께 표시될 수도 있다.FIG. 6 is a schematic view for explaining a user interface illustrating an emotion index in the user reaction data analysis method according to an embodiment of the present invention. Referring to FIG. Figure 6 shows an exemplary user interface that provides a score. In the exemplary user interface, texts of the group having the upper 30% and the group having the lower 30% of the emotion score (indicated by the emotion index in FIG. 6) are displayed. Text 211 is a feedback text for a service or product created by the user. The response indication 212 indicates how many other users were impressed or how much the text 211 was shared with respect to the text 211. The icon 213 indicates the social service in which the text is collected. The positive response indication 214 indicates that the text 211 is classified as a positive response. Emotion score 215 represents the degree of positive reaction determined by the engine. The negative indication (216) indicates that the text is classified as a negative response. Emotion score 217 represents the degree of negative reaction determined by the engine. Emotion scores 215 and 217 may have predetermined maximum and minimum values. Although not limited, emotion scores 215 and 217 may have a value from 0 to 100. [ The text corresponding to the emotion scores 215 and 217 can be reviewed as described above, and the satisfaction or need of the consumer with high positive or negative reaction can be known. Also, in various embodiments, an emotion score for at least one text may be provided in association with the information of the text creator. For example, the information of the text creator may be displayed together in Fig.

또한, 감성 스코어는 소셜 서비스에서 팔로워, 친구, 및 구독수 중 적어도 하나를 기초로 산출된 텍스트 작성자 영향력을 이용하여 보상될 수도 있다. 예를 들어, 객관적인 리뷰로 인기가 많은 소셜 서비스 사용자에게 가중치가 부여될 수도 있다. 또는, 텍스트 작성자 영향력이 높은 작성자가 서비스 또는 상품에 대해 텍스트를 작성하고, 상기 텍스트에 대해 댓글로 작성된 텍스트에 대해서는 그 반응이 원글 텍스트 작성자의 영향력에 의한 것으로 판단하여, 감성 스코어가 보정될 수 있다.The emotional score may also be compensated for using the text creator influence calculated based on at least one of followers, friends, and subscriptions in a social service. For example, social service users who are popular with objective reviews may be weighted. Alternatively, the emotional score may be corrected, as the creator with high influence of the text creator writes the text for the service or the product, and for the text commented on the text, the response is judged to be influenced by the creator of the text of the text .

이하에서는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 감성 스코어를 정제하고 시각화하여 제공되는 다양한 방식들을 설명한다. 상기 방법은 소셜 서비스 상의 고객 반응을 실시간으로 보여줄 수 있다. 이하의 실시예에서는 참조를 위해 소비자 평판에 민감한 산업인, 엔터테인먼트와 연관된 서비스를 선정하여 감성 스코어를 산출하였다.Hereinafter, various methods provided by refining and visualizing the emotion score in the user reaction data analysis method according to an embodiment of the present invention will be described. The above method can display the customer response on the social service in real time. In the following examples, emotional scores were calculated by selecting services related to entertainment, which is an industry sensitive to consumer reputation for reference.

도 7은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 다양한 시각화 방식에 따라 소셜 미디어에서 언급된 버즈량을 비교하기 위한 도면이다. 도 7을 참조하면, 가수 3명, X, Y, Z를 키워드로 하여 상기 키워드에 대한 소셜 미디어 버즈량(또는 텍스트 빈도수)이 표시된다. 텍스트가 수집된 소셜 서비스는 트위터, 유튜브, 인스타그램, 페이스북, 및 네이버 블로그를 포함한다. 다양한 실시예에서, 선택한 키워드에 대해 날짜별 버즈량이 조회될 수 있다. 이에 따라, 관련 서비스 또는 상품에 대한 전체 버즈량 및 세분화된 서비스의 트래픽량이 조회될 수 있다. 또한, 선택된 키워드 별 버즈량도 비교될 수 있다. 이에 따라, 집중적으로 비교하고자 하는 서비스 또는 상품을 선택하여 소셜 서비스 상에서의 인지도 및 잠재 시장이 파악될 수 있다. FIG. 7 is a diagram for comparing the buzz amounts referred to in the social media according to various visualization methods in the user reaction data analysis method according to an embodiment of the present invention. Referring to FIG. 7, the amount of social media buzz (or the number of text frequencies) for the keyword is displayed by using the keywords 3, X, Y, and Z as keywords. Social services that collect text include Twitter, YouTube, Instagram, Facebook, and Naver blogs. In various embodiments, the buzz amount by date for the selected keyword can be queried. Accordingly, the total amount of buzz for the related service or product and the traffic amount of the segmented service can be inquired. Also, the buzz amount for each selected keyword can be compared. Accordingly, the service or the product to be intensively selected can be selected, and the recognition and potential market on the social service can be grasped.

도 8은 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 다양한 시각화 방식에 따라 스코어 분포를 나타내기 위한 도면이다. 다양한 실시예에서 감성 스코어의 제공은 적어도 하나의 텍스트를 스코어에 따라 2 이상의 식별자로 분류하는 것을 포함할 수 있다. 예를 들어, 감성 스코어가 긍정 50 내지 100인 텍스트를 식별자(S1)으로 분류하고, 감정 스코어가 긍정 0 내지 긍정 50 그리고 부정 0 내지 부정 50인 텍스트를 식별자(S2)로 분류하고, 감성 스코어가 부정 50 내지 100인 텍스트를 식별자(S3)으로 분류할 수 있다. 물론, 분류를 위한 범위는 조정될 수 있다.FIG. 8 is a diagram illustrating a score distribution according to various visualization methods in the method of analyzing user response data according to an exemplary embodiment of the present invention. Referring to FIG. The provision of an emotional score in various embodiments may include classifying at least one text into two or more identifiers according to the score. For example, a text having an emotion score of 50 to 100 is classified into an identifier (S1), a text having an emotion score of 0 to 50, and a number of negative 0 to negative 50 is classified into an identifier (S2) The text having the negation of 50 to 100 can be classified into the identifier S3. Of course, the scope for classification can be adjusted.

도 8을 참조하면, 선택된 서비스 또는 상품의 시간대별 감성 스코어 분포가 도시된다. 식별자(S1)은 예를 들어 비방자(Detractor), 식별자(S2)는 잠재 수호자(Potential), 식별자(S3)은 수호자(Promoter)로 정의될 수도 있다. 이에 따라, 서비스에 대한 비방자, 잠재 수호자, 그리고 현재 수호자들의 수가 파악될 수 있다. 본 발명의 일 실시예에 따른 사용자 반응 데이터 부석 방법의 사용자들은 서비스 또는 상품에 대한 평판을 조회하고 지속 관리할 수 있으며, 비방자 수를 파악함으로써 빠른 위기 포착을 할 수 있다.Referring to FIG. 8, an emotional score distribution for a selected service or product is shown. The identifier S1 may be defined as, for example, a detractor, the identifier S2 as a potential guardian, and the identifier S3 as a protector. Thus, the number of defenders, potential guardians, and current guardians of the service can be grasped. Users of the method of pouring user reaction data according to an embodiment of the present invention can inquire and manage the reputation of a service or a product, and can grasp the crisis quickly by grasping the number of defects.

도 9는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 다양한 시각화 방식에 따라 하위 스코어에서 언급되는 단어들을 나타내는 도면이다. 도 9는 본 발명의 일 실시예에 따른 사용자 반응 데이터 분석 방법에서 감성 스코어에 따라 긍정적으로 반응한 내용과 그 키워드 그리고 부정적으로 반응한 내용과 그 키워드를 예시적으로 도시한 것이다. 도 9를 참조하면, 특정 서비스 또는 상품에 대한 텍스트에 대해서 감성 스코어를 획득하고, 식별자(S1)으로 분류된 그룹(227)에서 최다 언급 명사(229) Top 5를 추출 후, 그에 대한 수식어(230)를 조회할 수 있다. 또는, 식별자(S2)로 분류한 그룹(228)에서 최다 언급 명사(231) Top 5를 추출한 후 그에 대한 수식어(232)를 조회할 수도 있다. 이에 따라, 각 감성 스코어 구간 (Detractor, Potential, Promoter)에 따른 소비자들의 니즈에 대한 인사이트를 제공할 수 있다. 9 is a diagram illustrating words referred to in a lower score according to various visualization methods in the method of analyzing user reaction data according to an embodiment of the present invention. FIG. 9 is a diagram illustrating an example of contents responded positively according to emotion score, keywords thereof, negative contents and keywords of the user response data analysis method according to an embodiment of the present invention. Referring to FIG. 9, an emotion score is acquired for a text for a specific service or product, a most-referred noun 229 Top 5 is extracted from the group 227 classified by the identifier S 1, and a modifier 230 Can be inquired. Alternatively, the most-referenced noun 231, Top 5, may be extracted from the group 228 classified by the identifier S2, and the modifier 232 may be searched. Accordingly, it is possible to provide an insight on the needs of consumers according to each emotional score interval (Detractor, Potential, Promoter).

예를 들어, 워너원의 잠재 수호자(Potential)들은 현재 인기를 끌고 있는 멤버 강다니엘에 가장 많은 관심을 보이고 있으며, 마지막에 탈락한 정세운에 대한 아쉬움을 표출하고 있음을 파악할 수 있다. 이들이 주로 활동하는 사용자 반응을 파악해 강다니엘의 “섹시”한 “분량”을 많이 노출시킨다면 많은 잠재 고객이 워너원의 수호자가 될 가능성이 존재한다는 것을 의미할 수 있다.For example, Warner One's Potential Protectors are showing the greatest interest in the currently popular member Gang Daniel, and they can express their regrets about the missing Prince of Persia. Identifying the main user reactions to these activities and exposing many of Gang Daniel's "sexy" "amounts" could mean that there is a potential for many potential customers to become Warner One's protectors.

이상 첨부된 도면을 참조하여 본 발명의 실시예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.Although the embodiments of the present invention have been described in detail with reference to the accompanying drawings, it is to be understood that the present invention is not limited to those embodiments and various changes and modifications may be made without departing from the scope of the present invention. . Therefore, the embodiments disclosed in the present invention are intended to illustrate rather than limit the scope of the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. Therefore, it should be understood that the above-described embodiments are illustrative in all aspects and not restrictive. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents should be construed as falling within the scope of the present invention.

Claims (10)

사용자 반응을 포함하는 적어도 하나의 텍스트를 수신하는 단계;
상기 적어도 하나의 텍스트를 매트릭스로 수치화하는 단계;
상기 적어도 하나의 텍스트에 대한 수치화된 매트릭스에 기초하여 상기 텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어를 예측하도록 구성된 엔진을 이용하여, 상기 적어도 하나의 텍스트에 대한 상기 스코어를 결정하는 단계; 및
결정된 상기 스코어를 제공하는 단계를 포함하는, 사용자 반응 데이터 분석 방법.
Receiving at least one text including a user response;
Digitizing the at least one text into a matrix;
Determining the score for the at least one text using an engine configured to predict a score indicative of a tendency for the text to be positive or negative based on a numerical matrix for the at least one text; And
And providing the determined score.
제1항에 있어서,
상기 적어도 하나의 텍스트를 매트릭스로 수치화하는 단계는,
텍스트에서 단어의 출연빈도수를 카운트하는 단계; 및
상기 텍스트에 대한 정보를 유지하면서 변수를 줄이기 위해 상기 단어의 출연빈도수를 매트릭스로 처리하는 단계를 포함하는, 사용자 반응 데이터 분석 방법.
The method according to claim 1,
Wherein quantifying the at least one text into a matrix comprises:
Counting appearance frequencies of words in the text; And
And processing the frequency of occurrences of the words into a matrix to reduce variables while retaining information about the text.
제2항에 있어서,
상기 단어의 출연빈도수를 매트릭스로 처리하는 단계는,
상기 단어의 출연빈도수를 매트릭스로 치환하는 단계; 및
상기 매트릭스의 차원을 축소하는 단계를 포함하는, 사용자 반응 데이터 분석 방법.
3. The method of claim 2,
Wherein the step of processing the frequency of appearance of the word into a matrix comprises:
Replacing the occurrence frequency of the word with a matrix; And
And reducing the dimension of the matrix.
제3항에 있어서,
상기 단어의 출연빈도수를 매트릭스로 치환하는 단계는 tf -idf, word2vec, doc2vec 중 하나를 이용하여 상기 단어의 출연빈도수를 매트릭스로 치환하는 단계인, 사용자 반응 데이터 분석 방법.
The method of claim 3,
Wherein replacing the occurrence frequencies of the words with a matrix is a step of replacing the occurrence frequencies of the words with a matrix using one of tf- idf, word2vec, and doc2vec.
제3항에 있어서,
상기 매트릭스의 차원을 축소하는 단계는 truncated Singular Value Decomposition(SVD) 또는 Sufficient Reduction(SR)을 이용하여 차원을 축소하는 단계인, 사용자 반응 데이터 분석 방법.
The method of claim 3,
Wherein the step of reducing the dimension of the matrix is a step of reducing a dimension using truncated singular value decomposition (SVD) or a sum reduction (SR).
제1항에 있어서,
상기 스코어를 제공하는 단계는 상기 적어도 하나의 텍스트에 대한 상기 스코어를 상기 텍스트 작성자의 정보와 연관시켜 제공하는 단계를 포함하는, 사용자 반응 데이터 분석 방법.
The method according to claim 1,
Wherein providing the score comprises providing the score for the at least one text in association with the information of the text creator.
제6항에 있어서,
상기 스코어를 상기 텍스트 작성자의 정보와 연관시켜 제공하는 단계는, 상기 소셜 서비스에서 팔로워, 친구, 및 구독수 중 적어도 하나를 기초로 산출된 텍스트 작성자 영향력을 이용하여 상기 적어도 하나의 텍스트에 대한 스코어를 보상하는 단계를 포함하는, 사용자 반응 데이터 분석 방법.
The method according to claim 6,
The step of providing the score in association with the information of the text creator comprises: calculating a score for the at least one text using the text creator influence calculated based on at least one of follower, friend, and subscription in the social service And compensating the user response data.
제1항에 있어서,
상기 스코어를 제공하는 단계는 상기 적어도 하나의 텍스트를 상기 스코어에 따라 2 이상의 식별자로 분류하는 단계; 및
상기 2 이상의 식별자를 시간대별로 시각적으로 제공하는 단계를 포함하는, 사용자 반응 데이터 분석 방법.
The method according to claim 1,
Wherein providing the score comprises classifying the at least one text into at least two identifiers according to the score; And
And visually providing the at least two identifiers by time zone.
사용자 반응을 포함하는 적어도 하나의 텍스트를 수신하도록 구성된 통신부;
상기 통신부와 동작가능하도록 연결되고,
상기 통신부로부터 사용자 반응을 포함하는 적어도 하나의 텍스트를 획득하고,
상기 적어도 하나의 텍스트를 매트릭스로 수치화하고,
상기 적어도 하나의 텍스트에 대한 수치화된 매트릭스에 기초하여 상기 텍스트가 가지는 긍정 또는 부정에 대한 경향성을 나타내는 스코어를 예측하도록 구성된 엔진을 이용하여, 상기 적어도 하나의 텍스트에 대한 상기 스코어를 결정하도록 구성된 프로세서; 및
결정된 상기 스코어를 제공하도록 구성된 출력부를 포함한, 사용자 반응 데이터 분석 장치.
A communication unit configured to receive at least one text including a user response;
A communication unit operatively connected to the communication unit,
Acquiring at least one text including a user response from the communication unit,
Digitizing the at least one text into a matrix,
A processor configured to determine the score for the at least one text, using an engine configured to predict a score indicative of a tendency for the text to be positive or negative based on a numerical matrix for the at least one text; And
And an output configured to provide the determined score.
제9항에 있어서,
상기 적어도 하나의 텍스트를 매트릭스로 수치화하는 것은,
텍스트에서 단어의 출연빈도수를 카운트하고,
상기 단어의 출연빈도수를 매트릭스로 치환하고,
상기 매트릭스의 차원을 축소하는 것을 포함하는, 사용자 반응 데이터 분석 장치.
10. The method of claim 9,
Digitizing the at least one text into a matrix,
Count the frequency of occurrence of words in the text,
Replacing the occurrence frequency of the word with a matrix,
And reducing the dimension of the matrix.
KR1020170117662A 2017-08-11 2017-09-14 Method for analyzing social service data and apparatus using the same KR102023516B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170102555 2017-08-11
KR20170102555 2017-08-11

Publications (2)

Publication Number Publication Date
KR20190017597A true KR20190017597A (en) 2019-02-20
KR102023516B1 KR102023516B1 (en) 2019-09-20

Family

ID=65562312

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170117662A KR102023516B1 (en) 2017-08-11 2017-09-14 Method for analyzing social service data and apparatus using the same

Country Status (1)

Country Link
KR (1) KR102023516B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200137735A (en) * 2019-05-31 2020-12-09 주식회사 제이비스퀘어 Apparatus for Providing Information Based on Social Network Service
KR20210142787A (en) 2020-05-18 2021-11-26 주식회사 딥하이 Method and System for analyzing user response for each topic
KR20220013600A (en) * 2020-07-27 2022-02-04 권태완 Apparatus and method for processing information related to product in multimedia contents
KR20230013463A (en) * 2021-07-19 2023-01-26 최영진 Smart order bar online shopping cart payment system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030202A (en) * 2002-06-25 2004-01-29 Fujitsu Ltd System for sampling characteristic word
KR20150054355A (en) * 2013-11-12 2015-05-20 연세대학교 산학협력단 Apparatus and method for building up sentiment dictionary
KR20170042080A (en) * 2015-10-08 2017-04-18 삼성에스디에스 주식회사 Method and apparatus for providing personalized search results

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030202A (en) * 2002-06-25 2004-01-29 Fujitsu Ltd System for sampling characteristic word
KR20150054355A (en) * 2013-11-12 2015-05-20 연세대학교 산학협력단 Apparatus and method for building up sentiment dictionary
KR20170042080A (en) * 2015-10-08 2017-04-18 삼성에스디에스 주식회사 Method and apparatus for providing personalized search results

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200137735A (en) * 2019-05-31 2020-12-09 주식회사 제이비스퀘어 Apparatus for Providing Information Based on Social Network Service
KR20210142787A (en) 2020-05-18 2021-11-26 주식회사 딥하이 Method and System for analyzing user response for each topic
KR20220013600A (en) * 2020-07-27 2022-02-04 권태완 Apparatus and method for processing information related to product in multimedia contents
KR20230013463A (en) * 2021-07-19 2023-01-26 최영진 Smart order bar online shopping cart payment system

Also Published As

Publication number Publication date
KR102023516B1 (en) 2019-09-20

Similar Documents

Publication Publication Date Title
Mostafa Clustering halal food consumers: A Twitter sentiment analysis
US9799035B2 (en) Customer feedback analyzer
US10672012B2 (en) Brand personality comparison engine
US11935080B2 (en) Reinforcement machine learning for personalized intelligent alerting
He et al. A novel social media competitive analytics framework with sentiment benchmarks
US11315149B2 (en) Brand personality inference and recommendation system
Du et al. Feature selection for helpfulness prediction of online product reviews: An empirical study
Wang et al. Attribute embedding: Learning hierarchical representations of product attributes from consumer reviews
Hawkins Metaverse live shopping analytics: retail data measurement tools, computer vision and deep learning algorithms, and decision intelligence and modeling
KR102023516B1 (en) Method for analyzing social service data and apparatus using the same
US10395258B2 (en) Brand personality perception gap identification and gap closing recommendation generation
Rhyn et al. A machine learning approach for classifying textual data in crowdsourcing
US20190205793A1 (en) Building and matching electronic standards profiles using machine learning
Rathan et al. Every post matters: a survey on applications of sentiment analysis in social media
KR20150083165A (en) System and method for analyzing opinion time series
Thomas A Review paper on BIG Data
WO2014191996A1 (en) System and method for fast and nuanced sentiment evaluation
US11699177B1 (en) Systems and methods for automated modeling of quality for products and services based on contextual relevance
US11232325B2 (en) Data analysis system, method for controlling data analysis system, and recording medium
Sun et al. Customer emotion detection by emotion expression analysis on adverbs
KR102405503B1 (en) Method for creating predictive market growth index using transaction data and social data, system for creating predictive market growth index using the same and computer program for the same
Singh et al. Issue and challenges of online user generated reviews across social media and e-commerce website
KR20220118703A (en) Machine Learning based Online Shopping Review Sentiment Prediction System and Method
Dey et al. Applying Text Mining to Understand Customer Perception of Mobile Banking App
JP2019194793A (en) Information processing apparatus and program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant