KR102276353B1 - System and method for recommending movie based on embedding learning using fuzzy-ahp - Google Patents

System and method for recommending movie based on embedding learning using fuzzy-ahp Download PDF

Info

Publication number
KR102276353B1
KR102276353B1 KR1020200008718A KR20200008718A KR102276353B1 KR 102276353 B1 KR102276353 B1 KR 102276353B1 KR 1020200008718 A KR1020200008718 A KR 1020200008718A KR 20200008718 A KR20200008718 A KR 20200008718A KR 102276353 B1 KR102276353 B1 KR 102276353B1
Authority
KR
South Korea
Prior art keywords
movie
data
learning
user
word
Prior art date
Application number
KR1020200008718A
Other languages
Korean (ko)
Inventor
이상용
오재택
Original Assignee
공주대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 공주대학교 산학협력단 filed Critical 공주대학교 산학협력단
Priority to KR1020200008718A priority Critical patent/KR102276353B1/en
Application granted granted Critical
Publication of KR102276353B1 publication Critical patent/KR102276353B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/02Computing arrangements based on specific mathematical models using fuzzy logic
    • G06N7/023Learning or tuning the parameters of a fuzzy system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms

Abstract

The present invention relates to a system and method for recommending a movie based on a word-to-vector (Word2Vec) learning using a fuzzy-AHP. In particular, it relates to a system and method for recommending a movie based on a word-to-vector learning using a fuzzy-AHP that use the fuzzy-AHP to classify user's favorite movies, obtain movie-related text data by scraping movie-related review data and news articles on Twitter or portal sites, performs word-to-vector learning using the movie-related text data, and generate recommended movies and preference data by matching user's favorite movie classification data and a word-to-vector learning result. An object of the present invention is to objectively and accurately recommend user's favorite movies.

Description

퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템 및 방법{SYSTEM AND METHOD FOR RECOMMENDING MOVIE BASED ON EMBEDDING LEARNING USING FUZZY-AHP} SYSTEM AND METHOD FOR RECOMMENDING MOVIE BASED ON EMBEDDING LEARNING USING FUZZY-AHP

본 발명은 퍼지 계층 분석 과정(FUZZY-AHP)을 이용한 워드투벡터(Word2Vec) 학습 기반 영화 추천 시스템 및 방법에 관한 것으로서, 특히 퍼지 계측 분석 과정을 이용하여 사용자의 선호 영화를 분류하고, 트위터나 포털 사이트의 영화와 관련된 리뷰 데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하고, 영화 관련 텍스트 데이터를 이용하여 워드투벡터로 학습하며, 사용자가 선호하는 영화 분류 데이터와 워드투벡터 학습 결과를 매칭시켜 추천 영화 및 선호도 데이터를 생성하는, 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템 및 방법에 관한 것이다.The present invention relates to a word-to-vector (Word2Vec) learning-based movie recommendation system and method using a fuzzy hierarchical analysis process (FUZZY-AHP). Obtain movie-related text data by scraping movie-related review data and news articles on the site, learn word-to-vector using movie-related text data, and learn user's preferred movie classification data and word-to-vector learning results It relates to a word-to-vector learning-based movie recommendation system and method using a fuzzy hierarchical analysis process for generating recommended movies and preference data by matching .

최근 5G 시대의 시작과 동시에 데이터가 더욱더 폭발적으로 증가하고 있다. 이는 전 세계적으로 콘텐츠 클릭이나 좋아요 버튼 누르기 등 매일 1분마다 엄청난 데이터를 생성하는 결과를 가져오게 한다. 트위터는 1분마다 47만 건이 리트윗되고 있으며, 유튜브는 1분당 4백만명 이상이 여러 콘텐츠를 시청하고 있다. 또한 포털 사이트에서는 여러 언론사에서 분야별 기사들을 빠르게 보도하고 있다. 이러한 다양한 데이터를 효과적으로 활용할 수 있다면, 여러 분야에서 적용 중인 지능형 서비스의 성능이 향상될 것이다. Recently, with the onset of the 5G era, data is increasing exponentially. This results in the creation of huge amounts of data every minute of every day, whether it's content clicks or like button presses worldwide. Twitter has 470,000 retweets every minute, and YouTube has more than 4 million views per minute. In addition, on the portal site, various media companies are quickly reporting articles by field. If these various data can be effectively utilized, the performance of intelligent services applied in various fields will be improved.

생활문화 분야에 적용 중인 지능형 추천 서비스는 도서나 영화, 음악 분야에서 두각을 나타내고 있다. The intelligent recommendation service that is being applied in the field of life and culture stands out in the fields of books, movies, and music.

그러나 이러한 지능형 추천 서비스가 높은 성능을 보이기 위해서는 많은 양의 학습 데이터가 필요하며, 추론 기술이 보다 정확해야 한다는 문제점이 있었다. 또한 사용자마다 선호하는 정도가 주관적이고, 불확실하여 정확한 추천 서비스를 제공하기가 어렵다는 문제점이 있었다.However, in order for this intelligent recommendation service to show high performance, a large amount of training data is required, and there are problems that the inference technique needs to be more accurate. In addition, there is a problem in that it is difficult to provide an accurate recommendation service because the degree of preference for each user is subjective and uncertain.

F. T. S. Chan & N. Kumar. (2007). Global Supplier Development Considering Risk Factors using Fuzzy Extended AHP-based Approach. Original Research Article Omega, 35(4), 417-431. F. T. S. Chan & N. Kumar. (2007). Global Supplier Development Considering Risk Factors using Fuzzy Extended AHP-based Approach. Original Research Article Omega, 35(4), 417-431. C. Lin & P. J. Hsieh. (2004). A Fuzzy Decision Support System for Strategic Portfolio Management. Decision Support Systems, 38(2004), 383-398. C. Lin & P. J. Hsieh. (2004). A Fuzzy Decision Support System for Strategic Portfolio Management. Decision Support Systems, 38 (2004), 383-398.

따라서 본 발명은 상기와 같은 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 사용자가 선호하는 영화를 객관적이고 정확하게 추천할 수 있는,퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템 및 방법을 제공하는 데에 있다.Accordingly, the present invention has been made to solve the above problems, and an object of the present invention is to objectively and accurately recommend a user's preferred movie, a word-to-vector learning-based movie recommendation system and method using a fuzzy layer analysis process is to provide

상기의 목적을 달성하기 위해, 본 발명의 일 실시형태에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템은 사용자가 선호하는 영화의 선호도 데이터를 입력받아 퍼지 계층 분석 과정(Fuzzy-AHP)을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스(200)에 저장하도록 구성된 사용자 정보 수집부; SNS(Social Network Service)나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하도록 구성된 학습 데이터 수집부; 상기 학습 데이터 수집부에서 상기 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 상기 데이터베이스에 저장하도록 구성된 임베딩 학습부; 및 상기 데이터베이스에서 상기 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도의 데이터를 생성한 후, 상기 추전 영화 제목 및 이에 대응하는 선호도 데이터를 사용자 인터페이스에 제공함과 아울러 상기 데이터베이스에 저장하도록 구성된 영화 추천부를 포함하는 것을 특징으로 한다.In order to achieve the above object, a word-to-vector learning-based movie recommendation system using a fuzzy hierarchical analysis process according to an embodiment of the present invention receives preference data of a movie preferred by a user and performs a fuzzy hierarchical analysis process (Fuzzy-AHP). ), a user information collecting unit configured to classify a user's favorite movie using the user information and to store user information and user's preferred movie classification data in the database 200; a learning data collection unit configured to obtain movie-related text data by scraping movie-related review data and news articles of a social network service (SNS) or portal site; an embedding learning unit configured to read the movie-related text data from the learning data collection unit, learn word-to-vector, and store the word-to-vector learning result in the database; and reading the user's preferred movie classification data and word-to-vector learning result data from the database, matching the two data to generate a recommended movie title and corresponding preference data, and then generating the recommended movie title and corresponding information and a movie recommendation unit configured to provide preference data to the user interface and to store the preference data in the database.

상기 일실시 형태에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템에 있어서, 상기 선호도는 다음의 [수학식 1]을 이용하여 생성될 수 있다.In the word-to-vector learning-based movie recommendation system using the fuzzy hierarchical analysis process according to the embodiment, the preference may be generated using the following [Equation 1].

[수학식 1][Equation 1]

Figure 112020007699962-pat00001
Figure 112020007699962-pat00001

[여기서

Figure 112020007699962-pat00002
는 선호도를 나타내고,
Figure 112020007699962-pat00003
는 우선순위가 높은 종합 가중치를 나타내며,
Figure 112020007699962-pat00004
는 우선순위가 높은 상대적 가중치를 나타내며,
Figure 112020007699962-pat00005
는 세부 기준의 가중치를 보정하기 위한 실수를 나타냄][here
Figure 112020007699962-pat00002
represents the preference,
Figure 112020007699962-pat00003
represents the high-priority aggregate weight,
Figure 112020007699962-pat00004
represents the relative weight with high priority,
Figure 112020007699962-pat00005
represents a real number for correcting the weight of the detailed criteria]

상기의 목적을 달성하기 위해, 본 발명의 다른 실시형태에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 방법은 사용자 정보 수집부가 사용자가 선호하는 영화의 선호도 데이터를 입력받아 퍼지 계층 분석 과정(Fuzzy-AHP)을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스에 저장하는 단계; 학습 데이터 수집부가 SNS(Social Network Service)나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하는 단계; 임베딩 학습부가 앞서 획득한 상기 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 상기 데이터베이스에 저장하는 단계; 및 영화 추천부가 상기 데이터베이스에서 상기 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도의 데이터를 생성한 후, 상기 추전 영화 제목 및 이에 대응하는 선호도의 데이터를 사용자 인터페이스에 제공함과 아울러 상기 데이터베이스에 저장하는 단계;를 포함하는 것을 특징으로 한다.In order to achieve the above object, a word-to-vector learning-based movie recommendation method using a fuzzy layer analysis process according to another embodiment of the present invention is a fuzzy layer analysis process in which a user information collecting unit receives preference data of a movie preferred by a user. classifying a user's favorite movie using (Fuzzy-AHP), and storing user information and user's favorite movie classification data in a database; acquiring movie-related text data by scraping, by a learning data collection unit, movie-related review data and news articles of a social network service (SNS) or portal site; The embedding learning unit reads the movie-related text data obtained previously, learns word-to-vector, and stores the word-to-vector learning result in the database; and a movie recommendation unit reads the user's preferred movie classification data and word-to-vector learning result data from the database, matches the two data to generate a recommended movie title and corresponding preference data, and then selects the recommended movie title and and providing the corresponding preference data to the user interface and storing the data in the database.

본 발명의 실시형태들에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템 및 방법에 의하면, 사용자가 선호하는 영화의 선호도 데이터를 입력받아 퍼지 계층 분석 과정을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스에 저장하고; SNS나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하며; 앞서 획득한 상기 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 상기 데이터베이스에 저장하며; 상기 데이터베이스에서 상기 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도 데이터를 생성한 후, 상기 추전 영화 제목 및 이에 대응하는 선호도 데이터를 사용자 인터페이스에 제공함과 아울러 상기 데이터베이스에 저장하도록 구성됨으로써, 사용자가 선호하는 영화를 객관적이고 정확하게 추천할 수 있다는 뛰어난 효과가 있다.According to the word-to-vector learning-based movie recommendation system and method using the fuzzy hierarchical analysis process according to the embodiments of the present invention, the user's preferred movie is selected using the fuzzy hierarchical analysis process by receiving the user's preference data of the preferred movie. classify, and store user information and user's favorite movie classification data in a database; Scraping movie-related review data and news articles on SNS or portal sites to obtain movie-related text data; reading the previously obtained movie-related text data, learning word-to-vector, and storing the word-to-vector learning result in the database; After reading the user's preference movie classification data and word-to-vector learning result data from the database, and matching the two data to generate a recommended movie title and corresponding preference data, the recommended movie title and corresponding preference data is provided on the user interface and configured to be stored in the database, so that there is an excellent effect of objectively and accurately recommending a movie that the user prefers.

도 1은 본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템의 블록 구성도이다.
도 2는 본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 방법을 설명하기 위한 플로우 차트이다.
도 3은 도 1의 사용자 정보 수집부에 대한 계층 구조를 나타낸 도면이다.
1 is a block diagram of a movie recommendation system based on word-to-vector learning using a fuzzy layer analysis process according to an embodiment of the present invention.
2 is a flowchart for explaining a word-to-vector learning-based movie recommendation method using a fuzzy hierarchical analysis process according to an embodiment of the present invention.
FIG. 3 is a diagram illustrating a hierarchical structure of the user information collecting unit of FIG. 1 .

본 발명의 실시예를 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 본 발명의 실시예를 기술하기 위한 것이며, 결코 제한적으로 해석되어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하는 것으로 해석되어서는 안 된다.In describing the embodiments of the present invention, if it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, the terms described below are terms defined in consideration of functions in the present invention, which may vary according to intentions or customs of users and operators. Therefore, the definition should be made based on the content throughout this specification. The terminology used in the detailed description is for the purpose of describing embodiments of the present invention only, and should in no way be construed as limiting. Unless explicitly used otherwise, expressions in the singular include the meaning of the plural. In this description, expressions such as “comprising” or “comprising” are intended to indicate certain features, numbers, steps, acts, elements, some or a combination thereof, one or more other than those described. It should not be construed as excluding the presence or possibility of other features, numbers, steps, acts, elements, or any part or combination thereof.

도면에서 도시된 각 시스템에서, 몇몇 경우에서의 요소는 각각 동일한 참조 번호 또는 상이한 참조 번호를 가져서 표현된 요소가 상이하거나 유사할 수가 있음을 시사할 수 있다. 그러나 요소는 상이한 구현을 가지고 본 명세서에서 보여지거나 기술된 시스템 중 몇몇 또는 전부와 작동할 수 있다. 도면에서 도시된 다양한 요소는 동일하거나 상이할 수 있다. 어느 것이 제1 요소로 지칭되는지 및 어느 것이 제2 요소로 불리는지는 임의적이다.In each system shown in the figures, elements in some instances may each have the same reference number or a different reference number, suggesting that the represented element may be different or similar. However, elements may have different implementations and work with some or all of the systems shown or described herein. The various elements shown in the drawings may be the same or different. Which one is referred to as the first element and which is referred to as the second element is arbitrary.

본 명세서에서 어느 하나의 구성요소가 다른 구성요소로 자료 또는 신호를 '전송', '전달' 또는 '제공'한다 함은 어느 한 구성요소가 다른 구성요소로 직접 자료 또는 신호를 전송하는 것은 물론, 적어도 하나의 또 다른 구성요소를 통하여 자료 또는 신호를 다른 구성요소로 전송하는 것을 포함한다.In this specification, when any one component 'transmits', 'transfers' or 'provides' data or signal to another component, one component directly transmits data or signal to another component, as well as, and transmitting data or signals to the other component via at least one further component.

이하, 본 발명의 실시예를 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

도 1은 본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템의 블록 구성도이다.1 is a block diagram of a movie recommendation system based on word-to-vector learning using a fuzzy layer analysis process according to an embodiment of the present invention.

본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템은, 도 1에 도시된 바와 같이, 사용자 정보 수집부(100), 학습 데이터 수집부(110), 임베딩 학습부(120), 및 영화 추천부(300)를 포함한다.A movie recommendation system based on word-to-vector learning using a fuzzy layer analysis process according to an embodiment of the present invention, as shown in FIG. 1 , includes a user information collection unit 100 , a learning data collection unit 110 , and an embedding learning unit. 120 , and a movie recommendation unit 300 .

사용자 정보 수집부(100)는 사용자가 선호하는 영화의 선호도 데이터를 사용자 단말을 통해 입력받아 퍼지 계층 분석 과정(Fuzzy-AHP)을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스(200)에 저장하는 역할을 한다.The user information collection unit 100 receives the user's preference data of the preferred movie through the user terminal, classifies the user's preferred movie using a fuzzy hierarchical analysis process (Fuzzy-AHP), and uses the user information and the user's preferred movie. It serves to store classification data in the database 200 .

사용자 정보 수집부(100)는 도 3에 도시된 바와 같은 계층 구조를 통해 각 레벨 요소의 중요도를 파악하고, 진행된 결과의 정규화를 통해 사용자가 선호하는 영화의 종류를 알 수 있다.The user information collection unit 100 may determine the importance of each level element through the hierarchical structure as shown in FIG. 3 , and may know the type of movie preferred by the user through normalization of the progressed result.

퍼지 계층 분석 과정(Fuzzy-AHP)은 주관적이고, 불확실한 정보의 콘텐츠나 항목(Item)에 내재된 부정확성을 수학적으로 순위 화하여 정확한 의사결정을 진행하는 방법론이다. 퍼지 계층 분석 과정을 통해 감정적으로 판단하거나 주관적으로 평가한 정보나 선호도에 대해 객관적으로 표현할 수 있다. 본 발명에서는 사용자들이 선호하는 영화를 계층 구조로 구성하여 사용자의 선호도에 대해 종합적인 의사결정을 진행하였다. Fuzzy hierarchical analysis process (Fuzzy-AHP) is a methodology for making accurate decisions by mathematically ranking inaccuracies inherent in content or items of subjective and uncertain information. Through the fuzzy hierarchical analysis process, it is possible to objectively express information or preferences that are judged emotionally or subjectively evaluated. In the present invention, the user's preferred movies are configured in a hierarchical structure to make a comprehensive decision on the user's preferences.

학습 데이터 수집부(110)는 페이스북, 인스타그램, 트위터 등의 SNS(Social Network Service)나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑(Scraping)하여 영화 관련 텍스트 데이터를 획득하는 역할을 한다.The learning data collection unit 110 acquires movie-related text data by scraping movie-related review data and news articles from SNS (Social Network Service) or portal sites such as Facebook, Instagram, and Twitter. plays a role

스크레이핑은 웹 페이지에서 필요한 반정형 데이터를 추출하는 것을 말하며, 주로 웹 페이지에서 파싱(Parsing)이 가능한 라이브러리를 사용한다. 웹 상의 데이터는 보통 웹 페이지 형태로 이루어졌기 때문에 스크레이핑이나 크롤링(Crawling)을 이용하여 필요한 데이터를 획득할 수 있다. 본 발명에서는 스크레이핑을 통해 웹 데이터를 최대한 확보하여 영화 추천 성능을 높일 수 있다.Scraping refers to extracting necessary semi-structured data from a web page, and mainly uses a library capable of parsing from a web page. Since data on the web is usually in the form of a web page, necessary data can be obtained by scraping or crawling. In the present invention, it is possible to increase the movie recommendation performance by maximizing web data through scraping.

임베딩 학습부(120)는 학습데이터수집부(110)에서 스크레이핑한 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 데이터베이스(200)에 저장하는 역할을 한다. The embedding learning unit 120 reads the movie-related text data scraped by the learning data collection unit 110 , learns word-to-vector, and stores the word-to-vector learning result in the database 200 .

워드투벡터 학습 기법은 학습 기반 자연어 처리 방법론으로 주어진 영화 관련 텍스트 데이터의 단어들을 학습하여 토큰을 만들어 단어와 단어 사이의 유사성을 수학적으로 나타낸다. 본 발명에서는 워드투벡터 학습 기법을 통해 스크레이핑한 영화 관련 텍스트 데이터를 정확하게 분류할 수 있다.The word-to-vector learning technique is a learning-based natural language processing methodology that mathematically represents the similarity between words by learning words from movie-related text data and creating tokens. In the present invention, it is possible to accurately classify the scraped movie-related text data through the word-to-vector learning technique.

영화 추천부(300)는 데이터베이스(200)에서 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도의 데이터를 생성한 후, 추전 영화 제목 및 이에 대응하는 선호도의 데이터를 사용자 인터페이스에 제공함과 아울러 데이터베이스(200)에 저장하는 역할을 한다. The movie recommendation unit 300 reads the user's preference movie classification data and word-to-vector learning result data from the database 200 and matches the two data to generate a recommended movie title and corresponding preference data, and then recommends the movie. It serves to provide the movie title and corresponding preference data to the user interface and also to store it in the database 200 .

선호도는 다음의 [수학식 1]을 이용하여 생성된다.The preference is generated using the following [Equation 1].

[수학식 1][Equation 1]

Figure 112020007699962-pat00006
Figure 112020007699962-pat00006

[여기서

Figure 112020007699962-pat00007
는 선호도를 나타내고,
Figure 112020007699962-pat00008
는 우선순위가 높은 종합 가중치를 나타내며,
Figure 112020007699962-pat00009
는 우선순위가 높은 상대적 가중치를 나타내며,
Figure 112020007699962-pat00010
는 세부 기준의 가중치를 보정하기 위한 실수를 나타냄][here
Figure 112020007699962-pat00007
represents the preference,
Figure 112020007699962-pat00008
represents the high-priority aggregate weight,
Figure 112020007699962-pat00009
represents the relative weight with high priority,
Figure 112020007699962-pat00010
represents a real number for correcting the weight of the detailed criteria]

상기와 같이 구성된 본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템을 이용한 영화 추천 방법에 대해 도면을 참조하여 설명하기로 한다.A movie recommendation method using a word-to-vector learning-based movie recommendation system using a fuzzy hierarchical analysis process according to an embodiment of the present invention configured as described above will be described with reference to the drawings.

도 2는 본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 임베딩 학습 기반 영화 추천 방법을 설명하기 위한 플로우 차트로서, 여기서 S는 스텝(step)을 의미한다.2 is a flowchart for explaining a method for recommending a movie based on embedding learning using a fuzzy layer analysis process according to an embodiment of the present invention, where S means a step.

먼저, 사용자 정보 수집부(100)가 사용자 단말기를 통해 사용자가 선호하는 영화의 선호도 데이터를 입력받아 퍼지 계층 분석 과정을 이용하여 사용자의 선호 영화를 분류하고(S10), 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스(200)에 저장한다(S20).First, the user information collection unit 100 receives the user's preferred movie preference data through the user terminal and classifies the user's preferred movie using a fuzzy hierarchical analysis process (S10), and the user information and the user's preferred movie The classification data is stored in the database 200 (S20).

이어서, 학습 데이터 수집부(110)가 SNS나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득한다(S30).Then, the learning data collection unit 110 scrapes the review data and news articles related to the movie of the SNS or portal site to obtain the movie-related text data (S30).

다음, 임베딩 학습부(120)가 학습 데이터 수집부(110)에서 획득한 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 데이터베이스(200)에 저장한다(S40).Next, the embedding learning unit 120 reads the movie-related text data obtained from the learning data collection unit 110 to learn word-to-vector, and stores the word-to-vector learning result in the database 200 ( S40 ).

다음, 영화 추천부(300)가 데이터베이스(200)에서 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도 데이터를 생성한 후, 추전 영화 제목 및 이에 대응하는 선호도 데이터를 사용자 인터페이스에 제공함과 아울러 데이터베이스(200)에 저장한다(S50).Next, the movie recommendation unit 300 reads the user's favorite movie classification data and word-to-vector learning result data from the database 200 and matches the two data to generate a recommended movie title and corresponding preference data, The recommended movie title and corresponding preference data are provided to the user interface and stored in the database 200 (S50).

본 발명의 실시예에 의한 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템 및 방법에 의하면, 사용자가 선호하는 영화의 선호도 데이터를 입력받아 퍼지 계층 분석 과정을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스에 저장하고; SNS나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하며; 앞서 획득한 상기 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 상기 데이터베이스에 저장하며; 상기 데이터베이스에서 상기 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도 데이터를 생성한 후, 상기 추전 영화 제목 및 이에 대응하는 선호도 데이터를 사용자 인터페이스에 제공함과 아울러 상기 데이터베이스에 저장하도록 구성됨으로써, 사용자가 선호하는 영화를 객관적이고 정확하게 추천할 수 있다.According to the word-to-vector learning-based movie recommendation system and method using a fuzzy hierarchical analysis process according to an embodiment of the present invention, the user's preferred movie is classified using the fuzzy hierarchical analysis process by receiving the user's preference data of the preferred movie. and store user information and user's favorite movie classification data in a database; Scraping movie-related review data and news articles on SNS or portal sites to obtain movie-related text data; reading the previously obtained movie-related text data, learning word-to-vector, and storing the word-to-vector learning result in the database; After reading the user's preference movie classification data and word-to-vector learning result data from the database, and matching the two data to generate a recommended movie title and corresponding preference data, the recommended movie title and corresponding preference data is provided on the user interface and configured to be stored in the database, so that a user's preferred movie can be objectively and accurately recommended.

도면과 명세서에는 최적의 실시예가 개시되었으며, 특정한 용어들이 사용되었으나 이는 단지 본 발명의 실시형태를 설명하기 위한 목적으로 사용된 것이지 의미를 한정하거나 특허 청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 수 있을 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.In the drawings and specification, the best embodiment is disclosed, and specific terms are used, but these are used only for the purpose of describing the embodiments of the present invention, and are used to limit the meaning or limit the scope of the present invention described in the claims it didn't happen Therefore, it will be understood by those skilled in the art that various modifications and equivalent other embodiments are possible therefrom. Therefore, the true technical protection scope of the present invention should be determined by the technical spirit of the appended claims.

100: 사용자 정보 수집부
110: 학습 데이터 수집부
120: 임베딩 학습부
200: 데이터베이스
300: 영화 추천부
100: user information collection unit
110: learning data collection unit
120: embedding learning unit
200: database
300: movie recommendation book

Claims (4)

사용자가 선호하는 영화의 선호도 데이터를 사용자 단말을 통해 입력받아 퍼지 계층 분석 과정(Fuzzy-AHP)을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스(200)에 저장하도록 구성된 사용자 정보 수집부(100);
SNS(Social Network Service)나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하도록 구성된 학습 데이터 수집부(110);
상기 학습 데이터 수집부에서 스크레이핑된 상기 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하여서 상기 영화 관련 텍스트 데이터를 분류하고, 그 분류된 영화 관련 텍스트 데이터를 워드투벡터 학습 결과로서 상기 데이터베이스에 저장하도록 구성된 임베딩 학습부(120); 및
상기 데이터베이스에서 상기 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도의 데이터를 생성한 후, 상기 추천 영화 제목 및 이에 대응하는 선호도 데이터를 사용자 인터페이스에 제공함과 아울러 상기 데이터베이스에 저장하도록 구성됨으로써 사용자가 선호하는 영화를 객관적으로 추천할 수 있는 영화 추천부(300)를 포함하고,
상기 워드투벡터 학습은 학습 기반 자연어 처리 방법론으로 주어진 영화 관련 텍스트 데이터의 단어들을 학습하여 토큰을 만들어 단어와 단어 사이의 유사성을 수학적으로 나타내는 것이며,
상기 선호도는 다음의 [수학식 1]을 이용하여 생성되는, 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템.

[수학식 1]
Figure 112021027516705-pat00011

[여기서
Figure 112021027516705-pat00012
는 선호도를 나타내고,
Figure 112021027516705-pat00013
는 우선순위가 높은 종합 가중치를 나타내며,
Figure 112021027516705-pat00014
는 우선순위가 높은 상대적 가중치를 나타내며,
Figure 112021027516705-pat00015
는 세부 기준의 가중치를 보정하기 위한 실수를 나타냄]
The user's preference data of the preferred movie is received through the user terminal, the user's preferred movie is classified using a fuzzy hierarchical analysis process (Fuzzy-AHP), and the user information and the user's preferred movie classification data are stored in the database 200. a user information collection unit 100 configured to store;
a learning data collection unit 110 configured to obtain movie-related text data by scraping movie-related review data and news articles of a social network service (SNS) or portal site;
The movie-related text data scraped by the learning data collection unit is read and word-to-vector learns to classify the movie-related text data, and the classified movie-related text data is stored in the database as a word-to-vector learning result. an embedding learning unit 120 configured to store; and
After reading the user's preference movie classification data and word-to-vector learning result data from the database, and matching the two data to generate the recommended movie title and corresponding preference data, the recommended movie title and the corresponding preference and a movie recommendation unit 300 capable of objectively recommending a movie preferred by a user by providing data to the user interface and storing the data in the database;
The word-to-vector learning is a learning-based natural language processing methodology that mathematically represents the similarity between words by learning the words of movie-related text data and creating tokens,
The preference is generated using the following [Equation 1], a word-to-vector learning-based movie recommendation system using a fuzzy hierarchical analysis process.

[Equation 1]
Figure 112021027516705-pat00011

[here
Figure 112021027516705-pat00012
represents the preference,
Figure 112021027516705-pat00013
represents the aggregate weight with high priority
Figure 112021027516705-pat00014
represents the relative weight with high priority,
Figure 112021027516705-pat00015
represents a real number for correcting the weight of the detailed criteria]
삭제delete 제 1 항에 기재된 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 시스템을 이용한 영화 추천 방법으로서,
사용자 정보 수집부(100)가 사용자가 선호하는 영화의 선호도 데이터를 입력받아 퍼지 계층 분석 과정(Fuzzy-AHP)을 이용하여 사용자의 선호 영화를 분류하고, 사용자 정보 및 사용자의 선호 영화 분류 데이터를 데이터베이스(200)에 저장하는 단계;
학습 데이터 수집부(110)가 SNS(Social Network Service)나 포털사이트의 영화와 관련된 리뷰데이터 및 뉴스기사를 스크레이핑하여 영화 관련 텍스트 데이터를 획득하는 단계;
임베딩 학습부(120)가 상기 학습 데이터 수집부에서 상기 영화 관련 텍스트 데이터를 판독하여 워드투벡터로 학습하고, 워드투벡터 학습 결과를 상기 데이터베이스에 저장하는 단계; 및
영화 추천부(300)가 상기 데이터베이스에서 상기 사용자의 선호 영화 분류 데이터 및 워드투벡터 학습 결과 데이터를 판독하여 이 두 데이터를 매칭시켜서 추천 영화 제목 및 이에 대응하는 선호도 데이터를 생성한 후, 상기 추전 영화 제목 및 이에 대응하는 선호도 데이터를 사용자 인터페이스에 제공함과 아울러 상기 데이터베이스에 저장하는 단계;를 포함하는, 퍼지 계층 분석 과정을 이용한 워드투벡터 학습 기반 영화 추천 방법.
A movie recommendation method using the word-to-vector learning-based movie recommendation system using the fuzzy hierarchical analysis process according to claim 1,
The user information collection unit 100 receives the user's preference data of the preferred movie, classifies the user's preferred movie using a fuzzy hierarchical analysis process (Fuzzy-AHP), and stores user information and user's preferred movie classification data in a database. storing in (200);
obtaining, by the learning data collection unit 110, movie-related text data by scraping movie-related review data and news articles of a social network service (SNS) or portal site;
the embedding learning unit 120 reading the movie-related text data from the learning data collection unit, learning word-to-vector, and storing the word-to-vector learning result in the database; and
After the movie recommendation unit 300 reads the user's favorite movie classification data and word-to-vector learning result data from the database, matches the two data to generate a recommended movie title and corresponding preference data, the recommended movie A movie recommendation method based on word-to-vector learning using a fuzzy hierarchical analysis process, comprising: providing a title and preference data corresponding thereto to a user interface and storing the title in the database.
삭제delete
KR1020200008718A 2020-01-22 2020-01-22 System and method for recommending movie based on embedding learning using fuzzy-ahp KR102276353B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200008718A KR102276353B1 (en) 2020-01-22 2020-01-22 System and method for recommending movie based on embedding learning using fuzzy-ahp

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200008718A KR102276353B1 (en) 2020-01-22 2020-01-22 System and method for recommending movie based on embedding learning using fuzzy-ahp

Publications (1)

Publication Number Publication Date
KR102276353B1 true KR102276353B1 (en) 2021-07-12

Family

ID=76858924

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200008718A KR102276353B1 (en) 2020-01-22 2020-01-22 System and method for recommending movie based on embedding learning using fuzzy-ahp

Country Status (1)

Country Link
KR (1) KR102276353B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101465756B1 (en) * 2013-12-03 2014-12-03 주식회사 그리핀 Apparatus and method for analyzing emotion and method for recommending movice using the same
KR20150101341A (en) * 2014-02-26 2015-09-03 에스케이플래닛 주식회사 Apparatus and method for recommending movie based on distributed fuzzy association rules mining

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101465756B1 (en) * 2013-12-03 2014-12-03 주식회사 그리핀 Apparatus and method for analyzing emotion and method for recommending movice using the same
KR20150101341A (en) * 2014-02-26 2015-09-03 에스케이플래닛 주식회사 Apparatus and method for recommending movie based on distributed fuzzy association rules mining

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
C. Lin & P. J. Hsieh. (2004). A Fuzzy Decision Support System for Strategic Portfolio Management. Decision Support Systems, 38(2004), 383-398.
F. T. S. Chan & N. Kumar. (2007). Global Supplier Development Considering Risk Factors using Fuzzy Extended AHP-based Approach. Original Research Article Omega, 35(4), 417-431.

Similar Documents

Publication Publication Date Title
US9165060B2 (en) Content creation and management system
TWI636416B (en) Method and system for multi-phase ranking for content personalization
Sen et al. A total error framework for digital traces of human behavior on online platforms
Odić et al. Predicting and detecting the relevant contextual information in a movie-recommender system
US9396485B2 (en) Systems and methods for presenting content
KR101166130B1 (en) Method and apparatus for constructing user profile using contents tag, and method for contents recommendation using the constructed user profile
US8650149B2 (en) Portable inferred interest and expertise profiles
US20110202827A1 (en) Systems and Methods for Curating Content
US20110029509A1 (en) Best-Bet Recommendations
US8826125B2 (en) System and method for providing news articles
US20130060858A1 (en) Additional Systems and Methods for Curating Content
US20130166494A1 (en) Hierarchical behavioral profile
US20150207901A1 (en) Metadata prediction of objects in a social networking system using crowd sourcing
Manca et al. Behavioral data mining to produce novel and serendipitous friend recommendations in a social bookmarking system
US20110161091A1 (en) Systems and Methods for Connecting Entities Through Content
Garcia Esparza et al. Catstream: categorising tweets for user profiling and stream filtering
WO2013095901A1 (en) A hierarchical behavioral profile
CN110232126B (en) Hot spot mining method, server and computer readable storage medium
US20130346385A1 (en) System and method for a purposeful sharing environment
US20120124049A1 (en) Profile analysis system
JP4031264B2 (en) Filtering management method, filtering management program, filtering management method for filtering device, and filtering management program for filtering device
US9110998B2 (en) Hierarchical behavioral profile
KR20170114321A (en) Personalized news contents filtering system and method using the Keyword analysis
KR20140037534A (en) Method for providing sns information using intelligent categories
KR20150096024A (en) Social data analysis system for contents recommedation

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant