KR101910424B1 - Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method - Google Patents

Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method Download PDF

Info

Publication number
KR101910424B1
KR101910424B1 KR1020160169464A KR20160169464A KR101910424B1 KR 101910424 B1 KR101910424 B1 KR 101910424B1 KR 1020160169464 A KR1020160169464 A KR 1020160169464A KR 20160169464 A KR20160169464 A KR 20160169464A KR 101910424 B1 KR101910424 B1 KR 101910424B1
Authority
KR
South Korea
Prior art keywords
rating
movie
information
analysis
emotional
Prior art date
Application number
KR1020160169464A
Other languages
Korean (ko)
Other versions
KR101910424B9 (en
KR20180067976A (en
Inventor
이수원
옥경림
김희찬
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020160169464A priority Critical patent/KR101910424B1/en
Publication of KR20180067976A publication Critical patent/KR20180067976A/en
Application granted granted Critical
Publication of KR101910424B1 publication Critical patent/KR101910424B1/en
Publication of KR101910424B9 publication Critical patent/KR101910424B9/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/27
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Analysis (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

태그의 감성 분석을 이용한 영화 평점 예측 방법은, 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 단계; 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출하는 단계; 상기 태그 정보를 이용하여 감성 분석을 수행하는 단계; 및 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측하는 단계를 포함한다. 이에 따라, 태그(tag) 정보를 이용한 감성 분석과 평점(rating) 정보를 통해 사용자가 아직 평가하지 않은 영화 평점을 예측할 수 있다. A method for predicting a movie score using emotion analysis of a tag comprises: constructing a neighboring group to use a user's rating for a movie to be evaluated as data to be predicted; Extracting tag information and rating information for the movie to be evaluated from the neighboring group; Performing emotional analysis using the tag information; And predicting a rating for the movie to be evaluated by the user using the emotional analysis result and the rating information. Accordingly, the emotional analysis using the tag information and the rating information can predict the movie rating that the user has not yet evaluated.

Description

태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치{METHOD FOR MOVIE RATINGS PREDICTION USING SENTIMENT ANALYSIS OF MOVIE TAGS, RECORDING MEDIUM AND DEVICE FOR PERFORMING THE METHOD}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for predicting movie scores using emotion analysis of a tag,

본 발명은 태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치에 관한 것으로서, 더욱 상세하게는 협업 필터링(Collaborative Filtering) 기법을 통해 태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치에 관한 것이다.[0001] The present invention relates to a movie rating prediction method using tag emotion analysis, a recording medium and an apparatus for performing the same, and more particularly, to a movie rating prediction method using tag emotion analysis through a collaborative filtering technique, And a recording medium and an apparatus for performing the same.

정보가 넘쳐나는 현대에 사용자들은 많은 정보들을 일일이 직접 판단하여 취사 선택하기에는 어려움이 있다. 이에 따라, 추천 시스템은 여러 가지 정보가 쏟아지는 현대에 사용자에게 꼭 필요한 정보를 제시해줄 수 있는 중요한 기술로 평가 받고 있다. In today's information-rich world, users have difficulty in judging and selecting a lot of information by themselves. Accordingly, the recommendation system is evaluated as an important technique for presenting information necessary for the user in the modern information which is pouring various information.

추천 시스템은 사용자들이 노력을 덜 들이고 필요한 정보를 얻게 해주며, 아울러 추천 시스템을 제공하는 기업의 입장에서는 상품의 판매를 통해 이윤을 얻게 한다. The recommendation system allows users to get less information and to get the information they need, and in the case of a company that provides a recommendation system, it makes a profit by selling the product.

추천 시스템은 크게 두 가지 정도로 나눌 수 있다. 협업 필터링(Collaborative Filtering) 기법과 내용기반 필터링(Content-based Filtering) 기법이 있다.Recommendation system can be roughly divided into two. There are Collaborative Filtering and Content-based Filtering.

MovieLens 등 영화 추천 시스템에서는 새로운 정보로 사용자가 직접 입력한 태그(tag) 정보를 활용한 사례는 많지 않으며, 사용하였더라도 태그 정보를 응용한 것이 아닌 그대로 연관성 측정에 사용한 것에 불과하다.In the movie recommendation system such as MovieLens, there are not many cases where the tag information inputted by the user is used as the new information. Even if the tag information is used, it is used only for the relevance measurement, not the application of the tag information.

선행기술문헌의 비특허문헌 1은 협업 필터링(Collaborative Filtering) 기법을 사용하였고, 적용하는 가중치(weight) 값을 다르게 하면서 유전자 알고리즘을 통해 가장 나은 가중치 등의 결과를 제시한다. 선행기술문헌의 비특허문헌 2는 MovieLens에서 새로 추가된 태그 정보를 포함하여 유저간 연관성을 계산한다. Non-Patent Document 1 of the prior art document uses a collaborative filtering technique and suggests the best weighting results through a genetic algorithm while applying different weight values. The non-patent document 2 of the prior art document includes the tag information newly added in the MovieLens to calculate the inter-user association.

그러나, 이러한 기존 기술의 경우 태그 정보를 또 다른 사용자간의 유사성을 판단하는데 그대로 사용될 뿐이다.However, in the case of this conventional technology, the tag information is used as it is for judging similarity among another users.

A genetic algorithm solution to the collaborative filtering problem-Yilmaz Ar, Erkan Bostanci Ankara A genetic algorithm solution to the collaborative filtering problem-Yilmaz Ar, Erkan Bostanci Ankara Improving Recommendation Accuracy Based on Item-Specific Tag Preferences-FATIH GEDIKLI and DIETMAR JANNACH Improving Recommendation Accuracy Based on Item-Specific Tag Preferences-FATIH GEDIKLI and DIETMAR JANNACH

이에, 본 발명의 기술적 과제는 이러한 점에서 착안된 것으로 본 발명의 목적은 태그의 감성 분석을 이용한 영화 평점 예측 방법을 제공하는 것이다.SUMMARY OF THE INVENTION Accordingly, the present invention has been made in view of the above problems, and it is an object of the present invention to provide a method for predicting a movie score using emotion analysis of a tag.

본 발명의 다른 목적은 상기 태그의 감성 분석을 이용한 영화 평점 예측 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 기록 매체를 제공하는 것이다.Another object of the present invention is to provide a recording medium on which a computer program for performing a movie rating prediction method using emotion analysis of the tag is recorded.

본 발명의 또 다른 목적은 상기 태그의 감성 분석을 이용한 영화 평점 예측 방법을 수행하기 위한 장치를 제공하는 것이다.It is still another object of the present invention to provide an apparatus for performing a method for predicting a movie score using emotion analysis of the tag.

상기한 본 발명의 목적을 실현하기 위한 일 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 방법은, 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 단계; 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출하는 단계; 상기 태그 정보를 이용하여 감성 분석을 수행하는 단계; 및 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측하는 단계를 포함한다.According to an embodiment of the present invention, there is provided a method for predicting a movie rating using tag emotional analysis, the method comprising: constructing a neighborhood group for utilizing a user's rating for a movie to be evaluated as data to be predicted; Extracting tag information and rating information for the movie to be evaluated from the neighboring group; Performing emotional analysis using the tag information; And predicting a rating for the movie to be evaluated by the user using the emotional analysis result and the rating information.

본 발명의 실시예에서, 상기 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 단계는, 비계층적 군집분석(k-means clustering)을 통해 상기 사용자와 비슷한 성향의 다른 사용자들의 집합을 구성할 수 있다.In the embodiment of the present invention, the step of constructing a neighboring group for use as data for predicting a user's rating on the movie to be evaluated may be performed by k-means clustering, You can configure a collection of other users.

본 발명의 실시예에서, 상기 태그 정보를 이용하여 감성 분석을 수행하는 단계는, 감성 분석기를 이용할 수 있다.In the embodiment of the present invention, the step of performing emotional analysis using the tag information may use an emotional analyzer.

본 발명의 실시예에서, 상기 감성 분석기를 통한 감성 분석의 결과는 긍정(positive), 부정(negative) 및 중립(objective)의 각 감성값으로 출력될 수 있다.In an embodiment of the present invention, the result of emotional analysis through the emotional analyzer may be output as each emotion value of positive, negative, and objective.

본 발명의 실시예에서, 상기 긍정(positive), 부정(negative) 및 중립(objective)의 감성값들의 합은 1일 수 있다.In an embodiment of the invention, the sum of the positive, negative and objective emotion values may be one.

본 발명의 실시예에서, 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평가를 예측하는 단계는, 5*(긍정 감성값-부정 감성값)의 값을 평점 정보와 1:1 비율로 통합하여 도출할 수 있다.In the embodiment of the present invention, the step of predicting the evaluation of the movie to be evaluated by the user using the result of the emotional analysis and the rating information may include: calculating a value of 5 * (positive emotion value - negative emotion value) 1: 1 ratio with the rating information.

상기한 본 발명의 다른 목적을 실현하기 위한 일 실시예에 따른 컴퓨터로 판독 가능한 저장 매체에는, 태그의 감성 분석을 이용한 영화 평점 예측 방법을 수행하기 위한 컴퓨터 프로그램이 기록되어 있다. According to another embodiment of the present invention, a computer-readable storage medium stores a computer program for performing a movie rating prediction method using emotion analysis of a tag.

상기한 본 발명의 또 다른 목적을 실현하기 위한 일 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 장치는, 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 이웃 집단 구성부; 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출하는 정보 추출부; 상기 태그 정보를 이용하여 감성 분석을 수행하는 감성 분석부; 및 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측하는 평점 예측부를 포함한다.According to another aspect of the present invention, there is provided an apparatus for predicting a movie score using a sensibility analysis of a tag, the apparatus comprising: Group organization; An information extraction unit for extracting tag information and rating information for the movie to be evaluated from the neighboring group; An emotional analysis unit for performing emotional analysis using the tag information; And a rating predicting unit for predicting a rating of a movie to be evaluated by the user using the result of the sensitivity analysis and the rating information.

본 발명의 실시예에서, 상기 감성 분석부는, 감성 분석기를 이용하여, 합이 1인 긍정(positive), 부정(negative) 및 중립(objective)의 각 감성값을 출력할 수 있다.In an embodiment of the present invention, the emotion analyzer may output emotion values of positive, negative, and objective with a sum of 1 using an emotion analyzer.

본 발명의 실시예에서, 상기 평가 예측부는, 5*(긍정 감성값-부정 감성값)의 값을 평점 정보와 1:1 비율로 통합하여 도출할 수 있다.In the embodiment of the present invention, the evaluation predicting unit may derive a value of 5 * (positive emotion value - negative emotion value) in a 1: 1 ratio with rating information.

이와 같은 태그의 감성 분석을 이용한 영화 평점 예측 방법에 따르면, 사용자들이 직접 작성한 영화와 관련된 단어들인 태그(tag) 정보를 감성 분석하여, 감성 분석 결과와 평점 정보를 통해 사용자가 아직 평가하지 않은 영화에 대한 평점을 예측할 수 있다. 이에 따라, 본 발명에서는 영화에 비슷한 호감을 느끼지만 사용한 단어가 다른 경우를 고려하여 감성 분석을 통해 더욱 정확한 평점 예측이 가능하다. According to the method for predicting the movie score using the emotional analysis of the tag, the emotional analysis of tag information, which is a word related to the movie created by the users, and the emotional analysis of the movie, Can be predicted. Accordingly, in the present invention, it is possible to predict a more accurate score through emotional analysis in consideration of a case in which the movie has similar appeal but the used word is different.

또한, 정보가 넘쳐나는 현대에 사용자들은 많은 정보들을 일일이 직접 판단하여 취사 선택하기에는 어려움이 있다. 추천 시스템은 사용자들이 노력을 덜 들이고 필요한 정보를 얻게 해주며, 아울러 추천 시스템을 제공하는 기업의 입장에서는 상품의 판매를 통해 이윤을 얻게 한다. 본 발명에 따른 영화 추천 시스템은 사용자가 만족할만한 영화를 추천해줌으로써 사용자와 기업 모두에게 이익을 줄 수 있다.In addition, in the information age, users have difficulty in judging the information by themselves. The recommendation system allows users to get less information and to get the information they need, and in the case of a company that provides a recommendation system, it makes a profit by selling the product. The movie recommendation system according to the present invention can provide a benefit to both the user and the enterprise by recommending a movie satisfactory to the user.

도 1은 본 발명에 따른 태그의 감성 분석을 이용한 영화 평점 예측의 개념도이다.
도 2는 본 발명의 일 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 장치의 블록도이다.
도 3은 본 발명의 다른 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 장치의 블록도이다.
도 4는 본 발명의 일 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 방법의 흐름도이다.
1 is a conceptual diagram of movie rating prediction using emotion analysis of a tag according to the present invention.
2 is a block diagram of an apparatus for predicting a movie score using emotion analysis of a tag according to an embodiment of the present invention.
3 is a block diagram of an apparatus for predicting a movie score using emotion analysis of a tag according to another embodiment of the present invention.
FIG. 4 is a flowchart illustrating a method of predicting a movie score using emotion analysis of a tag according to an exemplary embodiment of the present invention.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.The following detailed description of the invention refers to the accompanying drawings, which illustrate, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different, but need not be mutually exclusive. For example, certain features, structures, and characteristics described herein may be implemented in other embodiments without departing from the spirit and scope of the invention in connection with an embodiment. It is also to be understood that the position or arrangement of the individual components within each disclosed embodiment may be varied without departing from the spirit and scope of the invention. The following detailed description is, therefore, not to be taken in a limiting sense, and the scope of the present invention is to be limited only by the appended claims, along with the full scope of equivalents to which such claims are entitled, if properly explained. In the drawings, like reference numerals refer to the same or similar functions throughout the several views.

이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다. Hereinafter, preferred embodiments of the present invention will be described in more detail with reference to the drawings.

도 1은 본 발명에 따른 태그의 감성 분석을 이용한 영화 평점 예측의 개념도이다.1 is a conceptual diagram of movie rating prediction using emotion analysis of a tag according to the present invention.

본 발명은 영화 추천 서비스의 데이터를 추천 시스템의 데이터로 사용하며, 최근에 새로이 추가된 사용자가 직접 입력한 태그(tag) 정보를 단순히 연관성을 측정하는데 사용하는데 그치지 않고, 감성 분석을 통해 일종의 제2의 평점(rating) 정보로 사용한다. 예를 들어, 상기 데이터를 추출하는 영화 추천 서비스는 무비렌즈(MovieLens)일 수 있다. The present invention uses the data of a movie recommendation service as data of a recommendation system and does not simply use tag information directly input by a newly added user recently to measure relevance, As a rating information. For example, the movie recommendation service for extracting the data may be a MovieLens.

따라서, 종래의 평점(rating)과 태그(tag) 정보를 이용한 감성 분석 결과를 결합하여, 사용자가 아직 평가하지 않은 영화의 평점을 예측할 수 있다. 본 발명에서 태그란, 사용자들이 영화에 대해 직접 작성한 영화와 관련 있는 단어들이다.Therefore, it is possible to predict the rating of a movie that has not yet been evaluated by the user by combining the conventional rating and the emotion analysis result using the tag information. In the present invention, a tag is a word associated with a movie created by a user directly on a movie.

도 1 및 도 2를 참조하면, 본 발명의 일 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 장치(10, 이하 장치)는 이웃 집단 구성부(110), 정보 추출부(130), 감성 분석부(150) 및 평점 예측부(170)를 포함한다.1 and 2, a movie rating prediction apparatus 10 (hereinafter, referred to as a device) using emotion analysis of a tag according to an embodiment of the present invention includes a neighboring group constructing unit 110, an information extracting unit 130, An analysis unit 150 and a rating prediction unit 170.

본 발명의 상기 장치(10)는 태그의 감성 분석을 이용한 영화 평점 예측을 수행하기 위한 소프트웨어(애플리케이션)가 설치되어 실행될 수 있으며, 상기 이웃 집단 구성부(110), 상기 정보 추출부(130), 상기 감성 분석부(150) 및 상기 평점 예측부(170)의 구성은 상기 장치(10)에서 실행되는 상기 태그의 감성 분석을 이용한 영화 평점 예측을 수행하기 위한 소프트웨어에 의해 제어될 수 있다. The device 10 of the present invention may be implemented with software (application) for performing movie rating prediction using emotion analysis of a tag, and the neighbor group constructing unit 110, the information extracting unit 130, The configuration of the emotional analysis unit 150 and the evaluation unit 170 may be controlled by software for performing movie rating prediction using emotion analysis of the tag executed in the device 10. [

상기 장치(10)는 별도의 단말이거나 또는 단말의 일부 모듈일 수 있다. 또한, 상기 이웃 집단 구성부(110), 상기 정보 추출부(130), 상기 감성 분석부(150) 및 상기 평점 예측부(170)의 구성은 통합 모듈로 형성되거나, 하나 이상의 모듈로 이루어 질 수 있다. 그러나, 이와 반대로 각 구성은 별도의 모듈로 이루어질 수도 있다.The device 10 may be a separate terminal or some module of the terminal. The configuration of the neighboring group constructing unit 110, the information extracting unit 130, the emotional analyzing unit 150, and the predicting unit 170 may be an integrated module or may be composed of one or more modules. have. However, conversely, each configuration may be a separate module.

상기 장치(10)는 이동성을 갖거나 고정될 수 있다. 상기 장치(10)는, 서버(server) 또는 엔진(engine) 형태일 수 있으며, 디바이스(device), 기구(apparatus), 단말(terminal), UE(user equipment), MS(mobile station), 무선기기(wireless device), 휴대기기(handheld device) 등 다른 용어로 불릴 수 있다. The device 10 may be mobile or stationary. The device 10 may be in the form of a server or an engine and may be a device, an apparatus, a terminal, a user equipment (UE), a mobile station (MS) a wireless device, a handheld device, and the like.

상기 장치(10)는 운영체제(Operation System; OS), 즉 시스템을 기반으로 다양한 소프트웨어를 실행하거나 제작할 수 있다. 상기 운영체제는 소프트웨어가 장치의 하드웨어를 사용할 수 있도록 하기 위한 시스템 프로그램으로서, 안드로이드 OS, iOS, 윈도우 모바일 OS, 바다 OS, 심비안 OS, 블랙베리 OS 등 모바일 컴퓨터 운영체제 및 윈도우 계열, 리눅스 계열, 유닉스 계열, MAC, AIX, HP-UX 등 컴퓨터 운영체제를 모두 포함할 수 있다.The device 10 may execute or produce various software based on an operating system (OS), i.e., a system. The operating system is a system program for allowing software to use the hardware of a device. The operating system includes a mobile computer operating system such as Android OS, iOS, Windows Mobile OS, Sea OS, Symbian OS, Blackberry OS, MAC, AIX, and HP-UX.

상기 이웃 집단 구성부(110)는 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성한다. 상기 이웃 집단은 평점을 예측할 사용자와 유사한 성향을 가진 집단으로 구성하기 위해서 사용자들의 영화 관련 사이트에 게재한 텍스트, SNS 텍스트 등의 데이터를 활용할 수 있다.The neighboring group constructing unit 110 constitutes a neighboring group for utilizing the user's rating of the movie to be evaluated as data to be predicted. The neighboring group can utilize data such as text, SNS text, and the like displayed on the movie related sites of users in order to constitute a group having a similar tendency to the user who predicts the rating.

예를 들어, 상기 이웃 집단은 비계층적 군집분석(k-means clustering)을 통해 상기 사용자와 비슷한 성향의 다른 사용자들의 집합을 구성할 수 있다.For example, the neighbors can construct a set of other users with a similar tendency to the user through k-means clustering.

비계층적 군집분석(k-means clustering)은 n개의 객체를 g개의 클러스터(cluster, 군집)으로 나눌 수 있는 모든 가능한 방법을 점검해 최적화된 군집을 형성한다. Non-hierarchical clustering (k-means clustering) examines all possible ways to divide n objects into g clusters to form optimized clusters.

이는 데이터 포인트들이 있을 때 유사한 클러스터를 찾는데 사용하는 유용한 알고리즘으로서, 데이터 포인트들이 있을 때 임의로 k개의 센트로이드(중심)을 부여하여 각 데이터 포인트와 센트로이드 거리를 모두 계산한다. 그 후에 포인트들을 가장 가까운 센트로이드에 배정하고, 동일한 클러스터로 배정을 받은 포인트들의 평균을 구하여 센트로이드를 이동시킨다.This is a useful algorithm for finding similar clusters when there are data points, and arbitrarily assigns k centroids when there are data points to calculate each data point and centroid distance. Then assign the points to the nearest centroid, and average centroids assigned to the same cluster to move the centroid.

그 다음, 다시 모든 포인트들과 센트로이드들 간의 거리를 계산하여 다시 포인트들을 가장 가까운 센트로이드에 배정한다. 이 과정을 반복 수행하여 센트로이드에 배정받는 포인트들의 변화가 더 이상 없을 때 알고리즘을 중단한다.Then again calculate the distance between all the points and the centroids and assign the points to the nearest centroid again. This process is repeated to stop the algorithm when there are no more changes in the points assigned to centroid.

비계층적 군집분석은 주어진 데이터의 내부 구조에 대한 사전정보 없이 의미 있는 자료 구조를 찾을 수 있으며, 다양한 형태의 데이터에 적용이 가능하다는 장점을 갖는다.Non-hierarchical cluster analysis has the advantage that it can find a meaningful data structure and can be applied to various types of data without prior knowledge about the internal structure of given data.

이를 통해, 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 형성하게 된다. 이에 따라, 사용자와 비슷한 성향을 가진 사용자들로 구성된 이웃 집단의 데이터를 활용하므로, 사용자의 평점 예측의 정확도를 향상시킬 수 있다.Through this, a neighboring group is formed to utilize the user rating of the movie to be evaluated as data to be predicted. Accordingly, since the data of the neighboring group composed of users having a tendency similar to the user is utilized, the accuracy of the user's rating prediction can be improved.

상기 정보 추출부(130)는 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출한다. The information extracting unit 130 extracts tag information and rating information for the movie to be evaluated from the neighboring group.

태그란, 어떤 정보를 검색할 때 사용하기 위해 부여하는 단어 혹은 키워드를 의미하며, 꼬리표라고도 부른다. 인터넷 정보들 중에 사진이나 동영상과 같은 멀티미디어 정보의 등장에 따라 태그의 필요성이 늘어나게 되었다. 이러한 멀티미디어 정보들은 텍스트로 작성된 정보와 달리 키워드를 가지고 검색하는 것이 불가능하므로, 정보 검색을 위하여 계층적으로 분류(Taxonomy)하여 검색하기도 한다. A tag is a word or a keyword that is given for use in searching for information, and is also called a tag. The necessity of tag is increased according to the appearance of multimedia information such as a photograph or a video among Internet information. Unlike the information written in text, these multimedia information can not be searched with keywords. Therefore, the multimedia information can be searched by hierarchical classification (Taxonomy) for information search.

그러나 가령 여행 중에 촬영한 사진의 경우 '여행'이라는 분류도 가능하지만, 촬영한 도시에 따라서 분류할 수도 있고, 사진의 이벤트 종류에 따라서 분류할 수도 있으므로 하나의 정보가 여러 분야에 복수로 속하게 된다. 이러한 경우 계층적인 분류가 불가능하게 되며, 또한 분류체계가 방대해져서 검색에 많은 시간이 소요된다. 그래서 여러 개의 텍스트로 만든 태그를 부여하여 검색하는 데 사용한다. However, for example, photographs taken while traveling can be classified as 'travel', but they can be classified according to the city where they are taken, or classified according to the event type of a photograph, so that a single piece of information belongs to a plurality of fields. In this case, hierarchical classification becomes impossible, and the classification system becomes enormous and it takes much time to search. So we use it to search by assigning tags made up of several texts.

즉, 모든 사용자들에게 표준화된 분류체계를 유지하는 것이 실제로는 불가능한 현실에서, 특정한 정보에 적합한 단어(태그)들을 모두 나열하게 함으로써 태그의 집합으로 정보를 검색하고 분류하는 것이다. 웹 2.0의 중심 기능으로 사용자들의 참여에 의해서 중앙에서 통제되지 않고 분류된다고 해서, 이를 폭소노미(Folksonomy)라고 부르게 되었다. That is, in a reality where it is practically impossible to maintain a standardized classification system for all users, information is searched and classified into a set of tags by arranging all words (tags) suitable for specific information. As a central feature of Web 2.0, it is called Folksonomy because it is classified as not centralized by users' participation.

트위터, 페이스북, 인스타그램 등 소셜네트워크(SNS)에서 관심 있는 글을 검색하는 데 태그를 사용하기도 하고, 태그를 일종의 공동관심사를 표현하는 키워드로 간주하여 설정하기도 한다. 태그가 일종의 커뮤니티 역할을 맡고 있으며, 소셜네트워크에서 사진을 올리고 서로 공유하는 데 태그의 활용이 증대되고 있는 것이다. 또한, 2015년 출시된 네이버의 폴라(Pholar)에서는 친구를 팔로우하는 것이 아니라 취미에 해당하는 태그를 팔로우하는 시스템을 적용하여 태그의 활용이 더 높아졌다.Social networks such as Twitter, Facebook, and Instagrams use tags to search for articles of interest, and tags are used as keywords that represent a kind of common interest. Tags are a kind of community role, and the use of tags to upload and share photos on social networks is increasing. In addition, Naver's Pholar, launched in 2015, uses a system that follows tags that correspond to hobbies, rather than following friends.

본 발명에서 상기 태그 정보는 상기 이웃 집단에 속하는 사용자들이 영화에 대해 직접 작성한 영화와 관련 있는 단어들이다. 예를 들어, 영화 추천 서비스 중 하나인 무비렌즈(MovieLens)의 데이터를 활용하여 태그 정보를 추출할 수 있다.In the present invention, the tag information is related to a movie directly written by the users belonging to the neighbor group on the movie. For example, tag information can be extracted using data of a movie lens (MovieLens), which is one of movie recommendation services.

또한, 상기 정보 추출부(130)는 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 평점(rating) 정보를 추출한다. 상기 평점 정보는 예를 들어, 0부터 5 이하의 범위를 가질 수 있다.Also, the information extracting unit 130 extracts rating information on the movie to be evaluated from the neighboring group. The rating information may have a range from 0 to 5, for example.

상기 감성 분석부(150)는 상기 태그 정보를 이용하여 감성 분석을 수행한다. 본 발명은 사용자가 직접 입력한 태그 정보를 단순히 연관성을 측정하는데 사용하는 게 아니라 태그를 감성 분석을 사용한 결과를 예측하는데 활용하였다는데 의의가 있다.The emotional analysis unit 150 performs emotional analysis using the tag information. It is meaningful that the present invention utilizes the tag information directly input by the user to predict the result of using the emotional analysis rather than simply use it to measure the relevance.

MovieLens 등 영화 추천 사이트에 새로운 정보로 사용자가 직접 입력한 태그 정보를 활용한 사례는 많지 않으며, 사용하였더라도 태그 정보를 응용한 것이 아닌 그대로 연관성 측정에 사용하는데 그칠 뿐이다.There are not many cases where the user has directly used the tag information that is input by the user as the new information on the movie recommendation site such as MovieLens. Even if the tag information is used, it is used only for the correlation measurement, not the application of the tag information.

이와 같이, 기존의 경우 태그 정보를 또 다른 사용자간의 유사성을 판단하는데 그대로 사용되었으나, 본 발명에서는 태그 정보를 이용하여 감성 분석을 함으로써 영화에 비슷한 호감을 느끼지만 사용한 단어가 다른 경우를 고려하여 감성 분석을 통해 평점 예측을 할 수 있다. As described above, in the conventional case, the tag information is used to determine the similarity among other users. However, in the present invention, emotional analysis is performed by using the tag information. It is possible to make a predictive rating through.

상기 감성 분석부(150)는 감성 분석기를 이용하여 상기 태그 정보를 이용하여 감성 분석을 수행할 수 있다. 예를 들어, 상기 감성 분석기는 SentiWordNet을 이용할 수 있다. The emotional analysis unit 150 may perform emotional analysis using the tag information using an emotional analyzer. For example, the emotion analyzer can use SentiWordNet.

SentiWordNet은 최근 오피니언 마이닝(opinion mining)에 대한 관심이 급증하면서, 트위터와 같은 소셜 네트워크 상의 유저들이 직접 작성한 데이터들을 이용하여 감성 분석을 하는 대표적인 방법 중 하나인 감성사전을 이용한다.SentiWordNet recently used emotional dictionary, which is one of the representative methods of emotional analysis using data created by users on social networks such as Twitter, as interest in opinion mining is rapidly increasing.

SentiWordNet을 이용하여 감성 분석을 하는 경우, 긍정(positive), 부정(negative) 및 중립(objective)의 세 가지 감성값으로 출력된다. 이 세 가지 감성값의 합은 1이고, 또한 각 감성값의 범위는 0 내지 1이다.When emotion analysis is performed using SentiWordNet, it is output as three emotion values: positive, negative, and objective. The sum of the three emotion values is 1, and the range of each emotion value is 0 to 1.

상기 평점 예측부(170)는 상기 감성 분석부(150)의 감성 분석의 결과 및 상기 정보 추출부(130)로부터 출력되는 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측한다.The rating estimating unit 170 estimates a rating for the movie to be evaluated by the user using the emotion analysis result of the emotion analyzing unit 150 and the rating information output from the information extracting unit 130 do.

예를 들어, 상기 평점 예측부(170)는 5*(긍정 감성값-부정 감성값)의 값을 평점 정보와 1:1 비율로 통합하여 도출할 수 있다. 본 발명에서 MovieLens의 데이터를 이용하는 경우, 평점은 0부터 5 이하의 범위를 가지고, 긍정 감성 및 부정 감성값의 각 최대값은 1이므로, 5를 곱해서 정규화할 수 있다(normalize). For example, the rating estimator 170 may derive a value of 5 * (positive emotion value - negative emotion value) by integrating the rating information with the rating information at a ratio of 1: 1. In the present invention, when the data of MovieLens is used, the rating is in the range of 0 to 5 or less, and each maximum value of positive and negative sensibility values is 1, so that it can be normalized by multiplying by 5.

다른 실시예로, 상기 평점 계산식에 가중치(weight)를 부여할 수 있으며, 가중치의 경우는 EJC(Extended Jaccard Coefficient)를 사용할 수 있다. 또한, 상기 평점 계산식은 사용하는 데이터 및 감성 분석기의 특성에 따라 변경될 수 있다.In another embodiment, a weight may be assigned to the rating formula, and an EJC (Extended Jaccard Coefficient) may be used in the case of the weight. In addition, the rating formula may be changed depending on the data used and the characteristics of the emotion analyzer.

이에 따라, 사용자들이 직접 작성한 영화와 관련된 단어들인 태그(tag) 정보를 감성 분석하여, 감성 분석 결과와 평점 정보를 통해 사용자가 아직 평가하지 않은 영화에 대한 평점을 예측할 수 있다.Accordingly, emotional analysis is performed on tag information, which is a word related to a movie created by users, and ratings of a movie that the user has not yet evaluated through emotional analysis and rating information can be predicted.

도 3을 참조하면, 본 발명의 다른 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 장치(30)는 정보 추출부가 분리된 것을 제외하고, 도 2의 장치(10)와 실질적으로 동일한 구성에서 진행될 수 있다. 따라서, 도 2의 장치(10)와 동일한 구성요소는 동일한 도면부호를 부여하고, 반복되는 설명은 생략한다.Referring to FIG. 3, the movie rating predicting apparatus 30 using emotion analysis of a tag according to another embodiment of the present invention may have the same structure as that of the device 10 of FIG. 2 except that the information extracting unit is separated. Can proceed. Therefore, the same components as those of the device 10 of FIG. 2 are denoted by the same reference numerals, and repeated descriptions are omitted.

상기 장치(30)는 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보를 추출하는 태그 정보 추출부(330) 및 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 평점(rating) 정보를 평점 정보 추출부(340)를 별도로 포함한다.The apparatus 30 includes a tag information extracting unit 330 for extracting tag information about a movie to be evaluated from the neighboring group and rating information about ratings of the movie to be evaluated from the neighboring group, And an extracting unit 340 separately.

상기 태그 정보 추출부(330)로부터 추출된 태그 정보는 상기 감성 분석부(150)를 통해 감성 분석된 결과가 상기 평점 예측부(170)로 전달된다. 즉, 본 발명에서 태그 정보는 그대로 사용하는 것이 아닌 감성 분석을 통해 일종의 제2의 평점(rating) 정보로 사용된다.The tag information extracted from the tag information extracting unit 330 is transmitted to the rating predicting unit 170 through the emotional analysis unit 150. That is, in the present invention, the tag information is used as a kind of second rating information through emotion analysis rather than being used as it is.

반면, 상기 평점 정보 추출부(340)로부터 추출된 평점 정보는 상기 평점 예측부(170)로 전달되어 평점 예측의 정보로 활용된다.On the other hand, the rating information extracted from the rating information extracting unit 340 is transmitted to the rating predicting unit 170 and used as information of rating prediction.

이에 따라, 사용자들이 직접 작성한 영화와 관련된 단어들인 태그(tag) 정보를 감성 분석하여, 감성 분석 결과와 평점 정보를 통해 사용자가 아직 평가하지 않은 영화에 대한 평점을 예측할 수 있다.Accordingly, emotional analysis is performed on tag information, which is a word related to a movie created by users, and ratings of a movie that the user has not yet evaluated through emotional analysis and rating information can be predicted.

또한, 추천 시스템은 사용자들이 노력을 덜 들이고 필요한 정보를 얻게 해주며, 아울러 추천 시스템을 제공하는 기업의 입장에서는 상품의 판매를 통해 이윤을 얻게 한다. 본 발명에 따른 영화 추천 시스템은 사용자가 만족할만한 영화를 추천해줌으로써 사용자와 기업 모두에게 이익을 줄 수 있다.In addition, the recommendation system allows users to get less information and to obtain the necessary information, and in the case of a company that provides a recommendation system, it makes profit through the sale of goods. The movie recommendation system according to the present invention can provide a benefit to both the user and the enterprise by recommending a movie satisfactory to the user.

도 4는 본 발명의 일 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 방법의 흐름도이다.FIG. 4 is a flowchart illustrating a method of predicting a movie score using emotion analysis of a tag according to an exemplary embodiment of the present invention.

본 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 방법은, 도 2의 장치(10) 또는 도 3의 장치(30)와 실질적으로 동일한 구성에서 진행될 수 있다. 따라서, 도 2의 장치(10) 또는 도 3의 장치(30)와 동일한 구성요소는 동일한 도면부호를 부여하고, 반복되는 설명은 생략한다. The movie rating prediction method using the sensitivity analysis of the tag according to the present embodiment can be performed in substantially the same configuration as the device 10 of FIG. 2 or the device 30 of FIG. Therefore, the same components as those of the device 10 of Fig. 2 or the device 30 of Fig. 3 are denoted by the same reference numerals, and repeated descriptions are omitted.

또한, 본 실시예에 태그의 감성 분석을 이용한 영화 평점 예측을 수행하기 위한 소프트웨어(애플리케이션)에 의해 실행될 수 있다.Further, it can be executed by software (application) for performing movie rating prediction using emotion analysis of the tag in this embodiment.

도 4를 참조하면, 본 실시예에 따른 태그의 감성 분석을 이용한 영화 평점 예측 방법은, 먼저 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성한다(단계 S10). Referring to FIG. 4, the movie rating prediction method using the emotion analysis of the tag according to the embodiment of the present invention constructs a neighboring group for use as data for predicting a user's rating on a movie to be evaluated (step S10).

상기 이웃 집단은 평점을 예측할 사용자와 유사한 성향을 가진 집단으로 구성하기 위해서 사용자들의 영화 관련 사이트에 게재한 텍스트, SNS 텍스트 등의 데이터를 활용할 수 있다.The neighboring group can utilize data such as text, SNS text, and the like displayed on the movie related sites of users in order to constitute a group having a similar tendency to the user who predicts the rating.

예를 들어, 상기 이웃 집단은 비계층적 군집분석(k-means clustering)을 통해 상기 사용자와 비슷한 성향의 다른 사용자들의 집합을 구성할 수 있다.For example, the neighbors can construct a set of other users with a similar tendency to the user through k-means clustering.

이를 통해, 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 형성하게 된다. 이에 따라, 사용자와 비슷한 성향을 가진 사용자들로 구성된 이웃 집단의 데이터를 활용하므로 사용자의 평점 예측의 정확도를 향상시킬 수 있다.Through this, a neighboring group is formed to utilize the user rating of the movie to be evaluated as data to be predicted. Accordingly, the accuracy of the user's rating prediction can be improved by utilizing data of a neighboring group composed of users having a similar tendency to the user.

상기 이웃 집단이 구성되면, 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출한다(단계 S30).If the neighboring group is constructed, tag information and rating information for the movie to be evaluated are extracted from the neighboring group (step S30).

본 발명에서 상기 태그 정보는 상기 이웃 집단에 속하는 사용자들이 영화에 대해 직접 작성한 영화와 관련 있는 단어들이다. 예를 들어, 영화 추천 서비스 중 하나인 무비렌즈(MovieLens)의 데이터를 활용하여 태그 정보를 추출할 수 있다. 상기 평점 정보는 예를 들어, 0부터 5 이하의 범위를 가질 수 있다.In the present invention, the tag information is related to a movie directly written by the users belonging to the neighbor group on the movie. For example, tag information can be extracted using data of a movie lens (MovieLens), which is one of movie recommendation services. The rating information may have a range from 0 to 5, for example.

상기 태그 정보가 추출되면, 상기 태그 정보를 이용하여 감성 분석을 수행한다(단계 S50). 단계 S50는 감성 분석기를 이용하여 상기 태그 정보를 이용하여 감성 분석을 수행할 수 있다. 예를 들어, 상기 감성 분석기는 SentiWordNet을 이용할 수 있다.When the tag information is extracted, emotional analysis is performed using the tag information (step S50). In step S50, emotional analysis can be performed using the tag information using the emotion analyzer. For example, the emotion analyzer can use SentiWordNet.

본 발명은 사용자가 직접 입력한 태그 정보를 단순히 연관성을 측정하는데 사용하는게 아니라 태그를 감성 분석을 사용한 결과를 예측하는데 활용하였다는데 의의가 있다.It is meaningful that the present invention utilizes the tag information directly input by the user to predict the result of using the emotional analysis rather than merely to measure the relevance.

MovieLens 등 영화 추천 사이트에 새로운 정보로 사용자가 직접 입력한 태그 정보를 활용한 사례는 많지 않으며, 사용하였더라도 태그 정보를 응용한 것이 아닌 그대로 연관성 측정에 사용하는데 그칠 뿐이다.There are not many cases where the user has directly used the tag information that is input by the user as the new information on the movie recommendation site such as MovieLens. Even if the tag information is used, it is used only for the correlation measurement, not the application of the tag information.

이와 같이, 기존의 경우 태그 정보를 또 다른 사용자간의 유사성을 판단하는데 그대로 사용되었으나, 본 발명에서는 태그를 감성 분석을 함으로써 영화에 비슷한 호감을 느끼지만 사용한 단어가 다른 경우를 고려하여 감성 분석을 통해 평점 예측을 할 수 있다. In the present invention, tag information is used to determine similarity among other users. However, in the present invention, a similar feeling is felt in a movie by performing emotional analysis of a tag, can do.

상기 감성 분석의 결과가 도출되면, 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측한다(단계 S70).When the result of the emotional analysis is derived, the score of the movie to be evaluated by the user is predicted using the emotional analysis result and the rating information (step S70).

예를 들어, 5*(긍정 감성값-부정 감성값)의 값을 평점 정보와 1:1 비율로 통합하여 도출할 수 있다. 본 발명에서 MovieLens의 데이터를 이용하는 경우, 평점은 0부터 5 이하의 범위를 가지고, 긍정 감성 및 부정 감성값의 각 최대값은 1이므로, 5를 곱해서 정규화할 수 있다(normalize). For example, a value of 5 * (positive emotion value - negative emotion value) can be derived by integrating the rating information with a rating ratio of 1: 1. In the present invention, when the data of MovieLens is used, the rating is in the range of 0 to 5 or less, and each maximum value of positive and negative sensibility values is 1, so that it can be normalized by multiplying by 5.

다른 실시예로, 평점 계산식에 가중치(weight)를 부여할 수 있으며, 가중치의 경우는 EJC(Extended Jaccard Coefficient)를 사용할 수 있다. 또한, 상기 평점 계산식은 사용하는 데이터 및 감성 분석기의 특성에 따라 변경될 수 있다.In another embodiment, a weight may be assigned to the rating formula, and an EJC (Extended Jaccard Coefficient) may be used for the weight. In addition, the rating formula may be changed depending on the data used and the characteristics of the emotion analyzer.

이에 따라, 사용자들이 직접 작성한 영화와 관련된 단어들인 태그(tag) 정보를 감성 분석하여, 감성 분석 결과와 평점 정보를 통해 사용자가 아직 평가하지 않은 영화에 대한 평점을 예측할 수 있다.Accordingly, emotional analysis is performed on tag information, which is a word related to a movie created by users, and ratings of a movie that the user has not yet evaluated through emotional analysis and rating information can be predicted.

또한, 추천 시스템은 사용자들이 노력을 덜 들이고 필요한 정보를 얻게 해주며, 아울러 추천 시스템을 제공하는 기업의 입장에서는 상품의 판매를 통해 이윤을 얻게 한다. 본 발명에 따른 영화 추천 시스템은 사용자가 만족할만한 영화를 추천해줌으로써 사용자와 기업 모두에게 이익을 줄 수 있다.In addition, the recommendation system allows users to get less information and to obtain the necessary information, and in the case of a company that provides a recommendation system, it makes profit through the sale of goods. The movie recommendation system according to the present invention can provide a benefit to both the user and the enterprise by recommending a movie satisfactory to the user.

이와 같은, 태그의 감성 분석을 이용한 영화 평점 예측 방법은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. The movie rating prediction method using the emotion analysis of the tag may be implemented in an application or in the form of program instructions that can be executed through various computer components and recorded in a computer-readable recording medium. The computer-readable recording medium may include program commands, data files, data structures, and the like, alone or in combination.

상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. The program instructions recorded on the computer-readable recording medium may be ones that are specially designed and configured for the present invention and are known and available to those skilled in the art of computer software.

컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like.

프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of program instructions include machine language code such as those generated by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules for performing the processing according to the present invention, and vice versa.

이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the present invention as defined by the following claims. You will understand.

여러 가지 정보가 쏟아지는 현대에 추천 시스템은 사용자에게 꼭 필요한 정보를 제시해줄 수 있는 중요한 기술이다. 추천 시스템은 사용자들이 노력을 덜 들이고 필요한 정보를 얻게 해주며, 아울러 추천 시스템을 제공하는 기업의 입장에서는 상품의 판매를 통해 이윤을 얻게 한다. In today's world, where information is pouring out, the recommendation system is an important technology that can provide users with necessary information. The recommendation system allows users to get less information and to get the information they need, and in the case of a company that provides a recommendation system, it makes a profit by selling the product.

본 영화 추천 시스템은 사용자가 만족할만한 영화를 추천해줌으로써 사용자와 기업 모두에게 이익을 줄 수 있다. 본 발명은 영화 추천 시스템 기법으로 영화 혹은 다른 개인화 분야의 추천 시스템에 응용될 수 있을 것으로 예상된다.The Movie Recommendation System can benefit both users and businesses by recommending a movie that the user is satisfied with. It is expected that the present invention can be applied to a recommendation system of a movie or other personalization field by a movie recommendation system technique.

10, 30: 태그의 감성 분석을 이용한 영화 평점 예측 장치
110: 이웃 집단 구성부
130: 정보 추출부
330: 태그 정보 추출부
350: 평점 정보 추출부
150: 감성 분석부
170: 평점 예측부
10, 30: Movie rating system using emotion analysis of tag
110: Neighborhood group component
130:
330: Tag information extracting unit
350: rating information extracting unit
150: Emotional Analysis Department
170:

Claims (10)

영화 평점 예측 장치를 통해 수행하는, 태그의 감성 분석을 이용한 영화 평점 예측 방법에 있어서,
상기 영화 평점 예측 장치에 의해, 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 단계;
상기 영화 평점 예측 장치에 의해, 상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출하는 단계;
상기 영화 평점 예측 장치에 의해, 상기 태그 정보를 이용하여 감성 분석을 수행하는 단계; 및
상기 영화 평점 예측 장치에 의해, 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측하는 단계를 포함하되,
상기 평점 정보는 미리 정해지는 상수 범위 내의 상수값이고,
상기 영화 평점 예측 장치에 의해, 상기 태그 정보를 이용하여 감성 분석을 수행하는 단계는,
소셜 네트워크 상의 유저들이 직접 작성한 데이터들을 이용하는 감성 분석기를 이용하여, 감성 분석기를 통해 감성 분석의 결과를 긍정(positive), 부정(negative) 및 중립(objective)의 감성값으로 출력하는 것을 포함하고,
상기 긍정(positive), 부정(negative) 및 중립(objective)의 감성값들의 합은 1이고,
상기 영화 평점 장치에 의해, 상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평가를 예측하는 단계는,
상기 감성 분석의 결과로 출력되는 긍정 감성값 및 부정 감성값의 차이값을 연산하고, 상기 긍정 감성값 및 부정 감성값의 차이값과 상기 미리 정해지는 상수 범위의 최대값을 곱하여 정규화값을 연산하고, 상기 정규화값을 평점 정보와 1:1 비율로 통합하는 것을 포함하고,
상기 정규화값과 평점 정보의 통합시, 상기 평점 정보에 따라 상이한 가중치가 부여되는, 태그의 감성 분석을 이용한 영화 평점 예측 방법.
A method for predicting a movie score using emotion analysis of a tag, the method comprising:
Constructing a neighboring group for use as data for predicting a user's rating on a movie to be evaluated by the movie rating prediction device;
Extracting tag information and rating information for the movie to be evaluated from the neighboring group by the movie rating prediction device;
Performing emotional analysis using the tag information by the movie rating prediction device; And
And estimating a rating for the movie to be evaluated by the user using the result of the emotional analysis and the rating information by the movie rating prediction device,
Wherein the rating information is a constant value within a predetermined constant range,
Wherein the step of performing emotional analysis using the tag information by the movie rating prediction apparatus comprises:
Outputting emotional analysis results as positive, negative, and objective emotional values through an emotional analyzer using an emotional analyzer using data created by users on a social network,
The sum of the positive, negative and objective emotional values is 1,
Wherein the step of predicting an evaluation of the movie by the user using the result of the emotional analysis and the rating information by the movie rating apparatus comprises:
Calculating a difference value between the positive emotion value and the negative emotion value output as a result of the emotion analysis and multiplying the difference value between the positive emotion value and the negative emotion value by the maximum value of the predetermined constant range to calculate a normalization value , And integrating the normalization value with the rating information in a 1: 1 ratio,
Wherein a different weight is assigned according to the rating information when the normalization value and the rating information are combined.
제1항에 있어서, 상기 영화 평점 예측 장치에 의해, 상기 평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 단계는,
비계층적 군집분석(k-means clustering)을 통해 상기 사용자와 비슷한 성향의 다른 사용자들의 집합을 구성하는, 태그의 감성 분석을 이용한 영화 평점 예측 방법.
The method according to claim 1, wherein the step of constructing a neighboring group for use as data for predicting a user's rating on the movie to be evaluated by the movie rating prediction apparatus comprises:
A method for predicting movie rating using tag emotion analysis, comprising constructing a collection of other users with similar tendencies to the user through k-means clustering.
삭제delete 삭제delete 삭제delete 삭제delete 제1항 내지 제2항 중 어느 하나의 항에 따른 태그의 감성 분석을 이용한 영화 평점 예측 방법을 수행하기 위해 매체에 저장된 컴퓨터프로그램.
A computer program stored on a medium for performing a movie rating prediction method using emotional analysis of a tag according to any one of claims 1 to 2.
평가 대상인 영화에 대한 사용자의 평점을 예측할 데이터로 활용하기 위한 이웃 집단을 구성하는 이웃 집단 구성부;
상기 이웃 집단으로부터 상기 평가 대상인 영화에 대한 태그(tag) 정보와 평점(rating) 정보를 추출하는 정보 추출부;
상기 태그 정보를 이용하여 감성 분석을 수행하는 감성 분석부; 및
상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측하는 평점 예측부를 포함하되,
상기 평점 정보는 미리 정해지는 상수 범위 내의 상수값이고,
상기 태그 정보를 이용하여 감성 분석을 수행하는 것은,
소셜 네트워크 상의 유저들이 직접 작성한 데이터들을 이용하는 감성 분석기를 통해 감성 분석의 결과를 긍정(positive), 부정(negative) 및 중립(objective)의 감성값으로 출력하는 것이고,
상기 긍정(positive), 부정(negative) 및 중립(objective)의 감성값들의 합은 1이고,
상기 감성 분석의 결과 및 상기 평점 정보를 이용하여, 상기 사용자의 상기 평가 대상인 영화에 대한 평점을 예측하는 것은,
상기 감성 분석의 결과로 출력되는 긍정 감성값 및 부정 감성값의 차이값을 연산하고, 상기 긍정 감성값 및 부정 감성값의 차이값과 상기 미리 정해지는 상수 범위의 최대값을 곱하여 정규화값을 연산하고, 상기 정규화값을 평점 정보와 1:1 비율로 통합하고,
상기 정규화값과 평점 정보의 통합시, 상기 평점 정보에 따라 상이한 가중치가 부여되어 통합된 평점으로 예측하는 것인, 태그의 감성 분석을 이용한 영화 평점 예측 장치.
A neighbors group constituting a neighbors group to utilize a user 's rating for a movie to be evaluated as data to be predicted;
An information extraction unit for extracting tag information and rating information for the movie to be evaluated from the neighboring group;
An emotional analysis unit for performing emotional analysis using the tag information; And
And a rating prediction unit for predicting a rating of a movie to be evaluated by the user using the result of the sensitivity analysis and the rating information,
Wherein the rating information is a constant value within a predetermined constant range,
Performing emotional analysis using the tag information may include:
The result of emotional analysis is output as positive, negative, and objective emotional values through an emotional analyzer using data created by users on a social network,
The sum of the positive, negative and objective emotional values is 1,
Predicting a rating for a movie to be evaluated by the user using the emotional analysis result and the rating information,
Calculating a difference value between the positive emotion value and the negative emotion value output as a result of the emotion analysis and multiplying the difference value between the positive emotion value and the negative emotion value by the maximum value of the predetermined constant range to calculate a normalization value , Integrates the normalization value with the rating information at a 1: 1 ratio,
Wherein when the normalization value and the rating information are combined, a different weight is assigned according to the rating information, and the predicted score is predicted as an integrated rating.
삭제delete 삭제delete
KR1020160169464A 2016-12-13 2016-12-13 Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method KR101910424B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160169464A KR101910424B1 (en) 2016-12-13 2016-12-13 Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160169464A KR101910424B1 (en) 2016-12-13 2016-12-13 Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method

Publications (3)

Publication Number Publication Date
KR20180067976A KR20180067976A (en) 2018-06-21
KR101910424B1 true KR101910424B1 (en) 2018-10-22
KR101910424B9 KR101910424B9 (en) 2021-08-23

Family

ID=62806728

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160169464A KR101910424B1 (en) 2016-12-13 2016-12-13 Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method

Country Status (1)

Country Link
KR (1) KR101910424B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102084861B1 (en) * 2018-10-26 2020-03-04 한국과학기술원 System and method for analyzing and utilizing how authors refer to an event in a web document to predict the distribution of how much readers consider such document credible
KR20200120971A (en) 2019-04-03 2020-10-23 한밭대학교 산학협력단 Machine Learning Based Weekly Box Office Prediction System Using Variables Affecting Movie Performance
CN112182332A (en) * 2020-09-25 2021-01-05 科大国创云网科技有限公司 Emotion classification method and system based on crawler collection

Also Published As

Publication number Publication date
KR101910424B9 (en) 2021-08-23
KR20180067976A (en) 2018-06-21

Similar Documents

Publication Publication Date Title
Bozzon et al. Choosing the right crowd: expert finding in social networks
US11188830B2 (en) Method and system for user profiling for content recommendation
Fogli et al. Exploiting semantics for context-aware itinerary recommendation
US10395179B2 (en) Methods and systems of venue inference for social messages
US10685181B2 (en) Linguistic expression of preferences in social media for prediction and recommendation
US20160170982A1 (en) Method and System for Joint Representations of Related Concepts
US20170206416A1 (en) Systems and Methods for Associating an Image with a Business Venue by using Visually-Relevant and Business-Aware Semantics
CN103577549A (en) Crowd portrayal system and method based on microblog label
CN104077723B (en) A kind of social networks commending system and method
Chen et al. A context-aware recommendation approach based on feature selection
CN111444304A (en) Search ranking method and device
Aliannejadi et al. Personalized keyword boosting for venue suggestion based on multiple LBSNs
KR101910424B1 (en) Method for movie ratings prediction using sentiment analysis of movie tags, recording medium and device for performing the method
Xiong et al. Affective impression: Sentiment-awareness POI suggestion via embedding in heterogeneous LBSNs
JP2009205517A (en) Information processor and information processing method
Saraswathi et al. Deep Learning Enabled Social Media Recommendation Based on User Comments.
Rudinac et al. Multimodal classification of violent online political extremism content with graph convolutional networks
Sajeev et al. Effective web personalization system based on time and semantic relatedness
CN105786936A (en) Search data processing method and device
Wei et al. Online education recommendation model based on user behavior data analysis
CN112632275B (en) Crowd clustering data processing method, device and equipment based on personal text information
CN114490923A (en) Training method, device and equipment for similar text matching model and storage medium
Stankova et al. Classification over bipartite graphs through projection
Liang et al. Enhancing scenic recommendation and tour route personalization in tourism using ugc text mining
CN114880572B (en) Intelligent news client recommendation system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
G170 Publication of correction