KR20220107399A - Apparatus for recommending movie - Google Patents

Apparatus for recommending movie Download PDF

Info

Publication number
KR20220107399A
KR20220107399A KR1020210009991A KR20210009991A KR20220107399A KR 20220107399 A KR20220107399 A KR 20220107399A KR 1020210009991 A KR1020210009991 A KR 1020210009991A KR 20210009991 A KR20210009991 A KR 20210009991A KR 20220107399 A KR20220107399 A KR 20220107399A
Authority
KR
South Korea
Prior art keywords
movie
learning
evaluation
user
unit
Prior art date
Application number
KR1020210009991A
Other languages
Korean (ko)
Other versions
KR102433804B1 (en
Inventor
이상용
오재택
Original Assignee
공주대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 공주대학교 산학협력단 filed Critical 공주대학교 산학협력단
Priority to KR1020210009991A priority Critical patent/KR102433804B1/en
Publication of KR20220107399A publication Critical patent/KR20220107399A/en
Application granted granted Critical
Publication of KR102433804B1 publication Critical patent/KR102433804B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/043Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
    • G06N3/0436
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms

Abstract

An apparatus for recommending a movie according to an embodiment of the present invention includes: a user information collection unit that analyzes preferences among a plurality of movie-related items transmitted from a user's terminal by using a fuzzy analytical hierarchy process (Fuzzy- AHP) to derive preference priorities of the movie-related items; a movie evaluation learning unit for collecting movie evaluation text data written by terminals of netizens, learning the movie evaluation text data with a long short term memory (LSTM) language model to derive learning result sequence data corresponding to the movie-related items; a movie recommendation unit for extracting a movie title from the learning result sequence data corresponding to the movie-related items according to the preference priorities and providing a movie recommendation result to the user's terminal; and a database for storing the user's personal information, the movie-related items, the preference priorities, the learning result sequence data, and the movie recommendation result. The present invention is to recommend movie contents that a user prefers.

Description

영화 추천 장치{APPARATUS FOR RECOMMENDING MOVIE}Movie recommendation device {APPARATUS FOR RECOMMENDING MOVIE}

본 발명은 영화 추천 장치에 관한 것이다.The present invention relates to a movie recommendation device.

현재 우리 사회는 인공지능 중심으로 변화하고 있다. 새로운 기술 트렌드 변화를 위해 다양한 기계학습 기법을 적용하고 있으며, 5G 시스템을 통해서 빠르게 접목할 수 있도록 개인화 서비스를 향상시키고 있다.Currently, our society is shifting towards artificial intelligence. Various machine learning techniques are being applied to change new technology trends, and personalized services are being improved so that they can be quickly integrated through the 5G system.

이러한 변화는 여러 사용자와 네트워크 서비스를 연결할 수 있게 오픈 그래프를 형성하게 되었으며, 사용자의 미디어 플랫폼 참여율을 높일 수 있었다. This change formed an open graph that could connect multiple users and network services, and it was possible to increase users' participation in the media platform.

추천 시스템은 사용자의 미디어 플랫폼 참여율을 높일 수 있는 대표적인 시스템으로, 사용자의 행동 패턴을 이용하여 맞춤형 콘텐츠 또는 연관성이 높은 콘텐츠를 추천하는 시스템을 말한다.The recommendation system is a representative system that can increase a user's participation rate in a media platform, and refers to a system that recommends customized content or highly related content using a user's behavior pattern.

현재 추천 시스템은 협업 필터링(Collaborative Filtering) 방식과 기계학습 방식을 결합하는 하이브리드 형태의 추천 시스템과 여러 상황에 따른 서비스를 제공하기 위한 상황 인식(Context-awareness) 방식의 추천 시스템을 제안하고 있다. Currently, the recommendation system proposes a hybrid type recommendation system that combines a collaborative filtering method and a machine learning method, and a context-awareness type recommendation system for providing services according to various situations.

영화 추천 시스템의 경우에는 협업 필터링 방식보단 기존의 방식에 기계학습 방식을 결합하여 영화를 추천하거나 영화 리뷰 데이터로 감성 분석을 적용하여 사용자가 선호하는 영화의 감성과 유사한 장르를 추천하는 시스템을 제안하고 있다.In the case of the movie recommendation system, we propose a system that recommends movies by combining machine learning methods with existing methods rather than collaborative filtering methods, or recommends genres similar to the emotions of movies that users prefer by applying sentiment analysis to movie review data. have.

그러나 현재 영화 추천 시스템의 방식은 사용자의 심리적인 고정관념을 증폭시켜 사용자가 선호하는 콘텐츠보단 시스템 공급자가 원하는 방향으로 콘텐츠를 추천하고 있다는 문제점이 있다. However, the current movie recommendation system has a problem in that it amplifies the user's psychological stereotypes and recommends content in the direction desired by the system provider rather than the content preferred by the user.

또한 사용자의 관심사와 취향이 변해도 추천 시스템에 반영하지 못하고 있으며, 사용자마다 콘텐츠를 선호하는 정도가 다르기 때문에 이를 명확하게 표현할 수 없어 사용자의 선호도에 대한 불확실성이 높다는 문제점이 있다.In addition, even if users' interests and tastes change, they are not reflected in the recommendation system, and since each user has a different degree of preference for content, it cannot be clearly expressed.

등록특허 10-1639987 (공고일 2016년07월18일)Registered patent 10-1639987 (published on July 18, 2016)

본 발명의 실시예에 따른 영화 추천 장치는 사용자가 선호하는 영화 콘텐츠를 추천하기 위한 것이다.A movie recommendation apparatus according to an embodiment of the present invention is for recommending a movie content preferred by a user.

본 발명의 실시예에 따른 영화 추천 장치는 사용자의 관심사와 취향의 변화를 반영하여 사용자에게 영화 콘텐츠를 추천하기 위한 것이다.A movie recommendation apparatus according to an embodiment of the present invention is for recommending movie content to a user by reflecting changes in the user's interests and tastes.

본 발명의 실시예에 따른 영화 추천 장치는 사용자에 따른 영화 콘텐츠의 선호 정도에 대한 불확실성을 낮추기 위한 것이다.A movie recommendation apparatus according to an embodiment of the present invention is to reduce uncertainty about a preference degree of movie content according to a user.

본 출원의 과제는 이상에서 언급한 과제로 제한되지 않으며, 언급되지 않는 또 다른 과제는 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The task of the present application is not limited to the task mentioned above, and another task that is not mentioned will be clearly understood by those skilled in the art from the following description.

본 발명의 일측면에 따르면, 사용자의 단말기로부터 전송된 복수의 영화 관련 항목 사이의 선호도를 Fuzzy-AHP(Analytical Hierarchy Process)를 이용하여 분석하여 상기 영화 관련 항목의 선호우선순위를 도출하는 사용자 정보 수집부; 네티즌들의 단말기들에 의하여 작성된 영화 평가 텍스트 데이터를 수집한 뒤 상기 영화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델로 학습하여 상기 영화 관련 항목에 해당되는 학습 결과 시퀀스 데이터(sequence data)를 도출하는 영화 평가 학습부; 상기 선호우선순위에 따른 상기 영화 관련 항목에 해당되는 상기 학습 결과 시퀀스 데이터로부터 영화 제목을 추출하여 상기 사용자의 단말기로 영화 추천 결과를 제공하는 영화 추천부; 및 상기 사용자의 개인정보, 상기 영화 관련 항목, 상기 선호우선순위, 상기 학습 결과 시퀀스 데이터 및 상기 영화 추천 결과를 저장하는 데이터베이스를 포함하는 영화 추천 장치가 제공된다.According to one aspect of the present invention, user information collection for deriving preference priority of movie-related items by analyzing preferences among a plurality of movie-related items transmitted from a user's terminal using Fuzzy-AHP (Analytical Hierarchy Process) wealth; After collecting the movie evaluation text data written by the terminals of netizens, the movie evaluation text data is learned with an LSTM (Long Short Term Memory) language model to derive the learning result sequence data corresponding to the movie related item film evaluation study department; a movie recommendation unit extracting a movie title from the learning result sequence data corresponding to the movie-related item according to the preference priority and providing a movie recommendation result to the user's terminal; and a database storing the user's personal information, the movie related items, the preference priority, the learning result sequence data, and the movie recommendation result.

상기 영화 평가 학습부는 상기 수집된 영화 평가 텍스트 데이터를 하나의 파일로 병합하고, 상기 병합된 파일에 존재하는 특수 문자를 제거하는 전처리를 수행할 수 있다.The movie evaluation learning unit may perform pre-processing of merging the collected movie evaluation text data into one file and removing special characters existing in the merged file.

상기 영화 평가 학습부는 상기 전처리된 영화 평가 텍스트 데이터를 문장의 구성단위인 토큰(token)으로 분리하고, 상기 토큰으로 분리된 영화 평가 텍스트 데이터를 고정 길이의 수치형 텐서(tensor)로 변환하며, 상기 LSTM 언어 모델을 통하여 상기 고정 길이의 수치형 텐서에 대한 학습을 수행할 수 있다.The movie evaluation learning unit separates the preprocessed movie evaluation text data into tokens, which are constituent units of sentences, and converts the movie evaluation text data separated by the tokens into a numerical tensor of a fixed length, and the Learning on the fixed-length numeric tensor may be performed through the LSTM language model.

상기 영화 평가 학습부는 상기 LSTM 언어 모델로 상기 영화 평가 텍스트 데이터의 현재 시퀀스의 단어를 학습하면서 통계적으로 다음 시퀀스의 단어를 예측하여 상기 학습 결과 시퀀스 데이터를 도출할 수 있다.The movie evaluation learning unit may derive the learning result sequence data by statistically predicting a word of the next sequence while learning the word of the current sequence of the movie evaluation text data using the LSTM language model.

상기 영화 평가 학습부는 상기 현재 시퀀스의 단어로서 상기 영화 관련 항목을 사용하고, 상기 영화 관련 항목의 다음 시퀀스의 단어를 통계적으로 예측하여 상기 학습 결과 시퀀스 데이터를 도출할 수 있다.The movie evaluation learning unit may derive the learning result sequence data by using the movie-related item as a word of the current sequence and statistically predicting a word of a next sequence of the movie-related item.

상기 영화 관련 항목의 단어들 중 적어도 하나가 상기 학습 결과 시퀀스 데이터의 첫번째 단어일 수 있다.At least one of the words of the movie-related item may be a first word of the learning result sequence data.

상기 영화 추천부는 상기 영화 제목에 링크된 영화 상세 정보를 상기 데이터베이스로부터 읽어들어 상기 사용자의 단말기로 제공할 수 있다.The movie recommendation unit may read detailed movie information linked to the movie title from the database and provide it to the user's terminal.

본 발명의 실시예에 따른 영화 추천 장치는 단순한 사용자의 행동 패턴이 아닌 관심사를 실시간으로 수집하여 이를 반영할 수 있는 Fuzzy-AHP(Fuzzy-Analytic Hierarchy Process)와 LSTM(Long-short Term Memory Network) 언어 모델을 이용한 영화 추천을 제공할 수 있다.A movie recommendation apparatus according to an embodiment of the present invention is a Fuzzy-Analytic Hierarchy Process (Fuzzy-Analytic Hierarchy Process) and LSTM (Long-Short Term Memory Network) language capable of collecting and reflecting interests in real time rather than a simple user behavior pattern. It is possible to provide movie recommendations using the model.

본 출원의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않는 또 다른 효과는 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effect of the present application is not limited to the above-mentioned effects, and another effect not mentioned will be clearly understood by those skilled in the art from the following description.

도 1 및 도 2는 본 발명의 실시예에 따른 영화 추천 장치를 나타낸다.
도 3은 사용자 정보 수집부의 Fuzzy-AHP를 위한 영화 관련 계층구조를 나타낸다.
도 4 및 도 5는 Fuzzy-AHP를 진행하기 위한 의사결정 단계를 설명하기 위한 것이다.
도 6은 LSTM의 구조를 나타낸다.
도 7은 LSTM 언어 모델이 단어를 예측하기 위하여 사용되는 통계적 방법의 수식을 나타낸다.
도 8은 LSTM 언어 모델을 사용하여 다음 시퀀스에 나올 단어들을 생성하는 과정을 나타낸다.
도 9는 LSTM 언어 모델로 학습한 결과의 일례를 나타낸다.
1 and 2 show a movie recommendation apparatus according to an embodiment of the present invention.
3 shows a movie-related hierarchical structure for Fuzzy-AHP of the user information collection unit.
4 and 5 are for explaining a decision-making step for performing Fuzzy-AHP.
6 shows the structure of an LSTM.
7 shows the formulas of the statistical method used by the LSTM language model to predict words.
8 shows a process of generating words to appear in the next sequence using the LSTM language model.
9 shows an example of a result of learning with an LSTM language model.

이하 본 발명의 실시예에 대하여 첨부한 도면을 참조하여 상세하게 설명하기로 한다. 다만, 첨부된 도면은 본 발명의 내용을 보다 쉽게 개시하기 위하여 설명되는 것일 뿐, 본 발명의 범위가 첨부된 도면의 범위로 한정되는 것이 아님은 이 기술분야의 통상의 지식을 가진 자라면 용이하게 알 수 있을 것이다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, the accompanying drawings are only described in order to more easily disclose the contents of the present invention, and the scope of the present invention is not limited to the scope of the accompanying drawings. you will know

또한, 본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. In addition, the terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. The singular expression includes the plural expression unless the context clearly dictates otherwise.

본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.In the present application, terms such as “comprise” or “have” are intended to designate that a feature, number, step, operation, component, part, or combination thereof described in the specification exists, but one or more other features It is to be understood that it does not preclude the possibility of the presence or addition of numbers, steps, operations, components, parts, or combinations thereof.

도 1은 본 발명의 실시예에 따른 영화 추천 장치를 나타낸다. 도 1에 도시된 바와 같이, 본 발명의 실시예에 따른 영화 추천 장치는 사용자 정보 수집부(100), 영화 평가 학습부(200), 영화 추천부(300) 및 데이터베이스(400)를 포함한다.1 shows a movie recommendation apparatus according to an embodiment of the present invention. As shown in FIG. 1 , the movie recommendation apparatus according to an embodiment of the present invention includes a user information collection unit 100 , a movie evaluation learning unit 200 , a movie recommendation unit 300 , and a database 400 .

이와같은 본 발명의 실시예에 따른 영화 추천 장치는 컴퓨팅 장치로서 하드웨어 및 소프트웨어에 의하여 구현될 수 있다. 본 발명의 실시예에 따른 영화 추천 장치는 프로세싱부, 메모리부, 표시부 및 통신부를 포함할 수 있다. The movie recommendation apparatus according to the embodiment of the present invention as described above may be implemented as a computing device by hardware and software. A movie recommendation apparatus according to an embodiment of the present invention may include a processing unit, a memory unit, a display unit, and a communication unit.

프로세싱부는 본 발명의 실시예에 따른 영화 추천 장치의 전반적인 동작을 제어하며, 사용자 정보 수집, 학습, 영화 추천 및 정보의 저장과 같은 영화 추천의 과정을 처리할 수 있다. 프로세싱부는 CPU(Central Processing Unit), AP(Application Processor) 및 마이크로프로세서일 수 있으나 이에 한정되는 것은 아니다.The processing unit may control the overall operation of the movie recommendation apparatus according to an embodiment of the present invention, and process a movie recommendation process such as user information collection, learning, movie recommendation, and storage of information. The processing unit may be a central processing unit (CPU), an application processor (AP), and a microprocessor, but is not limited thereto.

메모리부는 본 발명의 실시예에 따른 영화 추천 장치의 동작에 필요한 소프트웨어 및 데이터를 저장할 수 있다. 앞서 언급된 데이터베이스(400)는 메모리부에 저장될 수 있다. 메모리부는 버스(bus)를 통하여 프로세싱부와 통신을 수행할 수도 있고, 통신부를 통하여 원격에서 프로세싱부와 통신할 수도 있다. 메모리부는 비휘발성 메모리를 포함할 수 있다. 예를 들어, 메모리부는 ROM, 하드디스크, 광학디스크(예를 들어, DVD, Blu-ray disk 등), SSD(Solid State Disk), USB 메모리, SD 카드 메모리 등을 포함할 수 있으나 이에 한정되는 것은 아니다. 메모리부 외에 본 발명의 실시예에 따른 영화 추천 장치는 RAM과 같은 휘발성 메모리도 포함할 수 있다. The memory unit may store software and data necessary for the operation of the movie recommendation apparatus according to an embodiment of the present invention. The aforementioned database 400 may be stored in the memory unit. The memory unit may communicate with the processing unit through a bus, and may communicate with the processing unit remotely through the communication unit. The memory unit may include a non-volatile memory. For example, the memory unit may include a ROM, a hard disk, an optical disk (eg, DVD, Blu-ray disk, etc.), a solid state disk (SSD), a USB memory, an SD card memory, etc., but is limited thereto. not. In addition to the memory unit, the movie recommendation apparatus according to the embodiment of the present invention may also include a volatile memory such as RAM.

표시부는 본 발명의 실시예에 따른 영화 추천 장치의 동작을 표시할 수 있다. 표시부는 CRT, LCD, LED, OLED 등을 포함할 수 있으나 이에 한정되는 것은 아니다.The display unit may display the operation of the movie recommendation apparatus according to an embodiment of the present invention. The display unit may include, but is not limited to, CRT, LCD, LED, OLED, and the like.

통신부는 본 발명의 실시예에 따른 영화 추천 장치와 외부의 컴퓨팅 장치 사이의 유무선 통신을 수행할 수 있다. 통신부는 근거리 통신 모듈 및 원거리 통신모듈을 포함할 수 있다. 근거리 통신 모듈은 블루투스, NFC(Near Field Communication), UWB(Ultra Wide Band) 등일 수 있으나 이에 한정되는 것은 아니다. 원거리 통신 모듈은 인트라넷, 인터넷이나 이통통신망과 같은 유무선 네트워크에 접속하여 통신할 수 있다.The communication unit may perform wired/wireless communication between the movie recommendation device according to an embodiment of the present invention and an external computing device. The communication unit may include a short-range communication module and a long-distance communication module. The short-range communication module may be Bluetooth, Near Field Communication (NFC), Ultra Wide Band (UWB), or the like, but is not limited thereto. The telecommunication module can communicate by connecting to a wired/wireless network such as an intranet, the Internet, or a mobile communication network.

사용자 정보 수집부(100)는 도 2의 사용자의 단말기로부터 전송된 복수의 영화 관련 항목 사이의 선호도를 Fuzzy-AHP(Analytical Hierarchy Process)를 이용하여 분석하여 영화 관련 항목의 선호우선순위를 도출한다. 사용자의 단말기는 PC, 랩탑 컴퓨터, 스마트폰, 태블릿 PC 등일 수 있으나 이에 한정되는 것은 아니다.The user information collection unit 100 analyzes the preference among a plurality of movie-related items transmitted from the user's terminal of FIG. 2 using Fuzzy-AHP (Analytical Hierarchy Process) to derive the preference priority of the movie-related items. The user's terminal may be a PC, a laptop computer, a smart phone, a tablet PC, or the like, but is not limited thereto.

Fuzzy-AHP는 객관적으로 평가하기 위한 콘텐츠나 항목(Item)에 대해 여러 평가 기준을 적용하고, 이를 판단하는 의사결정 방법론을 말한다. 평가 기준을 평가하기 위한 명확한 수치나 언어적인 표현 방법은 애매하고, 부정확하며 주관적이기 때문에 Fuzzy 이론을 적용하여 이를 보완하고 있다.Fuzzy-AHP refers to a decision-making methodology that applies various evaluation criteria to contents or items for objective evaluation and judges them. Since clear numerical or verbal expression methods for evaluating evaluation criteria are ambiguous, inaccurate, and subjective, Fuzzy theory is applied to supplement them.

예를 들어 ‘이 영화의 평점이 좋다’라고 하면 얼마만큼 이 영화를 선호하는지 관객들마다 다르며, 이를 수치로 표현했을 때 ‘평점 4점’이라고 정의할 수도 있으며 ‘평점 3.5점’이라고 정의할 수도 있다. Fuzzy 이론은 이와 같은 문제점을 해결할 수 있는 주관성을 도입한 집합론이라고 표현하기도 한다. For example, if you say 'the rating of this movie is good', each audience differs in how much they prefer this movie. have. Fuzzy theory is sometimes expressed as a set theory that introduces subjectivity that can solve such problems.

Fuzzy-AHP를 진행하기 위한 의사결정 단계는 다음과 같다.The decision-making steps to proceed with Fuzzy-AHP are as follows.

(1) 평가하기 위한 콘텐츠나 항목에 대한 평가 기준을 통해 계층 구조를 구성한다.(1) Construct a hierarchical structure through evaluation criteria for contents or items to be evaluated.

계층 구조를 구성할 때 의사결정의 목표에 따라 평가 기준과 평가 요소 등을 계층구조에 종속시키며, 목표에 영향을 미치는 불확실한 정보나 부정확한 요인들로 계층을 도 3과 같은 형태로 구성할 수 있다.When constructing a hierarchical structure, the evaluation criteria and evaluation factors are subordinated to the hierarchical structure according to the goal of decision making, and the hierarchy can be configured in the form of FIG. 3 with uncertain information or inaccurate factors affecting the goal. .

도 3의 계층 구조는 사용자가 영화를 선택할 때 선호하는 요인들로 구성되었으며, 각 선호 기준은 영화가 흥행하기 위한 요소들로 구성되었다. 예를 들어, 선호 기준은 영화 흥행에 중요한 시놉시스, 예고편, 영화를 본 관객의 리뷰와 평점을 포함할 수 있다. The hierarchical structure of FIG. 3 is composed of factors that the user prefers when selecting a movie, and each preference criterion is composed of factors for the success of the movie. For example, the preference criterion may include a synopsis, a trailer, reviews and ratings of audiences who have seen the movie, which are important for the success of the movie.

또한 영화 장르와 국가별 영화에 따라 기호가 다르게 나타나므로 계층 구조에 영화의 국가와 장르가 포함될 수 있다. 박스 오피스의 순위 또한 사람들의 관심을 끌기 때문에 영화가 흥행하는데 영향이 크므로 .박스 오피스가 계층 구조에 포함되었다. Also, since symbols appear differently depending on the movie genre and country-specific movies, the hierarchical structure may include the country and genre of the movie. The box office ranking also attracts people's attention, so it has a big impact on the box office's box office success, so .box office is included in the hierarchy.

이와 같은 영화 관련 항목의 계층 구조는 도 3에 한정되는 것은 아니다.The hierarchical structure of such movie-related items is not limited to FIG. 3 .

(2) 평가 기준들과 평가 요소들 간의 쌍대비교를 진행하여 쌍대비교 행렬을 구성한다. 쌍대비교 행렬을 구성하기 위해서 각 계층에 있는 관련 평가 기준들과 평가 요소들 간의 일대일 평가가 진행된다. 이를 위하여 사용자의 단말기는 도 4의 (a)와 같은 사용자 인터페이스를 표시할 수 있다. 사용자의 단말기는 사용자의 조작에 따라 입력된 평가 요소들 사이의 선호도를 본 발명의 영화 추천 장치로 전송하며, 이에 따라 사용자 정보 수집부(100)는 상기 선호도를 수집할 수 있다. (2) A pairwise comparison matrix is constructed by performing a pairwise comparison between evaluation criteria and evaluation elements. In order to construct a pairwise comparison matrix, one-to-one evaluation is performed between the relevant evaluation criteria and evaluation elements in each layer. To this end, the user's terminal may display a user interface as shown in (a) of FIG. 4 . The user's terminal transmits the preference among evaluation elements input according to the user's manipulation to the movie recommendation apparatus of the present invention, and accordingly, the user information collection unit 100 may collect the preference.

본 발명에서 일대일 평가 방법은 9점 척도 방법을 따르며, 그 방법은 도 4의 (b)와 같다. 여기서 퍼지 수(Fuzzy Numbers)란 소속 정도에 따른 소속 함수를 근처의 수와 비슷하게 표현하는 방법을 말할 수 있다. 퍼지 수는 사다리꼴 형태, 가우스 분포 형태 등 여러 가지가 있는데 본 발명의 실시예에서는 삼각 퍼지 수(Triangular Fuzzy Numbers)가 사용되었으나 본 발명의 실시예가 삼각 퍼지 수에 한정되는 것은 아니다. 삼각 퍼지 수는 도 5의 (a)와 같이 소속 함수에 대하여 하한 값(l), 중앙 값(m), 상한값(n)으로 구성될 수 있다.In the present invention, the one-to-one evaluation method follows a 9-point scale method, and the method is as shown in FIG. 4(b). Here, the fuzzy number may refer to a method of expressing the membership function according to the degree of membership similarly to the neighboring number. There are various fuzzy numbers such as trapezoidal shape and Gaussian distribution shape. In the embodiment of the present invention, triangular fuzzy numbers are used, but the embodiment of the present invention is not limited to triangular fuzzy numbers. The triangular fuzzy number may be composed of a lower limit value (l), a median value (m), and an upper limit value (n) for the membership function as shown in FIG. 5A .

사용자 정보 수집부(100)는 일대일 평가를 진행한 후에 도 5의 (b)와 같은 쌍대비교 행렬을 작성할 수 있다. The user information collection unit 100 may create a pairwise comparison matrix as shown in FIG. 5B after performing one-to-one evaluation.

(3) 사용자 정보 수집부(100)는 구성된 쌍대비교 행렬로 퍼지 합성 확장 값(Value of Fuzzy Synthetic Extent, Si)을 계산한다. 사용자 정보 수집부(100)는 쌍대비교 행렬 A의 원소 aij의 속성 i번째의 퍼지 합성 확장 값을 도 5의 (c)와 같이 계산할 수 있다. (3) The user information collection unit 100 calculates a fuzzy synthesis extension value (Value of Fuzzy Synthetic Extent, Si) using the constructed pairwise comparison matrix. The user information collection unit 100 may calculate the fuzzy synthesis extension value of the i-th attribute of the element a ij of the pair comparison matrix A as shown in FIG. 5C .

(4) 사용자 정보 수집부(100)는 퍼지 합성 확장 값을 이용하여 삼각 퍼지수 S1=(l1,m1,u1)와 S2=(l2,m2,u2)의 S1≥S2일 가능성 정도(Degree of Possibility, d′)를 계산한다. 가능성 정도는 도 5의 (d)를 통하여 이루어질 수 있는데, 도 5의 (d)는 도 5의 (e)를 이용하여 계산될 수 있다. (4) The user information collection unit 100 uses the fuzzy synthesis extension value to obtain triangular fuzzy numbers S1=(l 1 ,m 1 ,u 1 ) and S2=(l 2 ,m 2 ,u 2 ) of S 1 ≥ Calculate the Degree of Possibility (d') to be S 2 . The degree of possibility can be made through (d) of FIG. 5 , and (d) of FIG. 5 can be calculated using (e) of FIG. 5 .

(5) 사용자 정보 수집부(100)는 가능성 정도를 이용하여 각 계층의 선호도의 합이 1이 되도록 정규화를 한다.(5) The user information collection unit 100 normalizes so that the sum of the preferences of each layer becomes 1 by using the degree of likelihood.

(6) 사용자 정보 수집부(100)는 각 계층별로 구한 선호도를 상위 계층과 종속된 하위 계층끼리 서로 곱하여 종합 선호도를 계산한다.(6) The user information collection unit 100 calculates the overall preference by multiplying the preference obtained for each layer by the upper layer and the subordinate lower layer.

(7) 사용자 정보 수집부(100)는 종합 선호도의 우선순위를 구하고, 우선순위가 높은 평가 기준이나 평가 요소를 선택한다.(7) The user information collection unit 100 obtains the priority of the overall preference, and selects an evaluation criterion or evaluation element having a high priority.

이와 같은 과정을 통하여 사용자 정보 수집부(100)는 도 3의 선호 기준 및 선호 요인에 대한 우선순위를 도출할 수 있다. 이에 따라 선호 기준 및 선호 요인가 우선순위에 따라 정렬될 수 있다. Through this process, the user information collection unit 100 may derive the priority for the preference criteria and preference factors of FIG. 3 . Accordingly, preference criteria and preference factors may be sorted according to priorities.

한편, 영화 평가 학습부(200)는 도 2의 네티즌들의 단말기들에 의하여 작성된 영화 평가 텍스트 데이터를 수집한 뒤 영화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델로 학습하여 영화 관련 항목에 해당되는 학습 결과 시퀀스 데이터(sequence data)를 도출한다. 네티즌의 단말기는 PC, 랩탑 컴퓨터, 스마트폰, 태블릿 PC 등일 수 있으나 이에 한정되는 것은 아니다.Meanwhile, the movie evaluation learning unit 200 collects movie evaluation text data written by the terminals of netizens of FIG. 2 , and then learns the movie evaluation text data using an LSTM (Long Short Term Memory) language model to correspond to movie related items. As a result of the learning, sequence data is derived. The netizen's terminal may be a PC, a laptop computer, a smart phone, a tablet PC, or the like, but is not limited thereto.

영화 평가 학습부(200)는 영화 평가 텍스트 데이터를 스크래핑(scraping)을 통하여 수집할 수 있다. 스크래핑은 웹 상의 데이터, 즉 HTML 형식의 공개된 데이터에서 필요한 정보를 추출하는 것을 말한다. 또는 영화 평가 학습부(200)는 크롤링(crawling)을 통하여 영화 평가 텍스트 데이터를 수집할 수 있다. 크롤링은 웹 사이트에서 하이퍼링크를 돌며 웹 페이지를 다운로드하는 방법을 말한다The movie evaluation learning unit 200 may collect movie evaluation text data through scraping. Scraping refers to extracting necessary information from data on the web, that is, open data in HTML format. Alternatively, the movie evaluation learning unit 200 may collect movie evaluation text data through crawling. Crawling is a method of downloading web pages by circulating hyperlinks on a website.

영화 평가 텍스트 데이터는 도 2의 영화 평가 기록 서버에 저장된 것으로 영화 관련 댓글, 영화 리뷰에 대한 댓글, SNS 리트윗 자료, 뉴스 기사 등을 포함하나 이에 한정되는 것은 아니다. 영화 평가 기록 서버는 네이버와 같은 포털 서비스 제공 회사, 트위터와 같은 SNS 회사, 신문과 같은 언론 회사의 서버일 수 있으나 이에 한정되는 것은 아니다. The movie evaluation text data is stored in the movie evaluation record server of FIG. 2 and includes, but is not limited to, movie-related comments, comments on movie reviews, SNS retweet data, news articles, and the like. The movie evaluation record server may be a server of a portal service provider such as Naver, an SNS company such as Twitter, or a media company such as a newspaper, but is not limited thereto.

영화 평가 학습부(200)는 영화 평가 텍스트 데이터를 수집한 뒤 수집된 영화 평가 데이터에 대한 전처리를 수행할 수 있다. 영화 평가 학습부(200)는 수집된 영화 평가 텍스트 데이터를 하나의 파일로 병합하고, 병합된 파일에 존재하는 특수 문자를 제거하는 전처리를 수행할 수 있다. The movie evaluation learning unit 200 may collect movie evaluation text data and then perform pre-processing on the collected movie evaluation data. The movie evaluation learning unit 200 may perform preprocessing of merging the collected movie evaluation text data into one file and removing special characters existing in the merged file.

특수 문자는 영화 평가 학습부(200)에서의 신경망 학습 단계에서 학습 저하를 일으킬 수 있으며, 영화를 예측할 때 올바르게 예측이 되지 않을 수 있다. 특수 문자의 제거를 통하여 이후 LSTM 언어 모델을 통한 학습의 저하를 방지할 수 있다. Special characters may cause learning degradation in the neural network learning step in the movie evaluation learning unit 200, and may not be correctly predicted when predicting a movie. Through the removal of special characters, it is possible to prevent the degradation of learning through the LSTM language model.

영화 평가 학습부(200)는 전처리된 영화 평가 텍스트 데이터를 문장의 구성단위인 토큰(token)으로 분리하고, 토큰으로 분리된 영화 평가 텍스트 데이터를 고정 길이의 수치형 텐서(tensor)로 변환하며, LSTM 언어 모델을 통하여 고정 길이의 수치형 텐서에 대한 학습을 수행할 수 있다. 본 발명의 경우, 단어 및 조사마다 토큰화될 수 있으나 이에 한정되는 것은 아니다. 예를 들어, 한글자마다 토큰화될 수도 있다.The movie evaluation learning unit 200 separates the preprocessed movie evaluation text data into tokens, which are constituent units of sentences, and converts the movie evaluation text data separated by tokens into a numerical tensor of a fixed length, Through the LSTM language model, learning can be performed on a numeric tensor of a fixed length. In the case of the present invention, each word and phrase may be tokenized, but is not limited thereto. For example, each Hangul character may be tokenized.

영화 평가 텍스트 데이터는 여러 단어의 구성으로 이루어져 있으므로 단어를 하나의 이야기(Discourse)로 구성할 수 있게 하는 구문론적 단위인 토큰으로 분리하여 영화 평가 텍스트 데이터의 정보를 인코딩할 수 있게 한다.Since the movie evaluation text data consists of several words, it is possible to encode the information of the movie evaluation text data by separating the words into tokens, which are syntactic units that can be composed of a discourse.

수치형 텐서는 임베딩(embedding) 방법에 의하여 이루어질 수 있다. 임베딩(embedding) 방법은 시퀀스 데이터를 고정된 길이로 일일이 변환하여 이진 표현이 아닌 실수 표현 방법으로 변환하는 방법을 말한다. A numeric tensor may be formed by an embedding method. The embedding method refers to a method of converting sequence data into a fixed length one by one and converting the sequence data to a real representation method instead of a binary representation.

임베딩 방법은 원-핫 인코딩 방법에 비해 저차원으로 구성되며, 특성 벡터를 다양하게 표현할 수 있어 이후 신경망으로 학습할 시 중요한 특성(정보)이 추출 또는 분리된다.Compared to the one-hot encoding method, the embedding method has a lower dimension and can express feature vectors in various ways, so that important features (information) are extracted or separated when learning with a neural network.

영화 평가 학습부(200)는 전처리 및 수치형 텐서로 변환된 영화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델을 통하여 학습할 수 있다.The movie evaluation learning unit 200 may learn the movie evaluation text data converted into a pre-processing and numerical tensor through a Long Short Term Memory (LSTM) language model.

LSTM(Long Short Term Memory) 언어 모델은 순환 신경망(Recurrent Neural Network)의 보완하기 위한 것이다. 순환 신경망은 순차적인 데이터, 즉 시퀀스 데이터(Sequential Data)를 순서대로 입력받아 얼마나 중요한지 판단하여 출력층으로 전달하는 신경망을 말한다. 시퀀스 데이터를 순서대로 입력받기 때문에 출력층으로 전달되기 전에 은닉층(셀, 순환층)을 순환하는 것처럼 보여 순환 신경망이라 불린다.The LSTM (Long Short Term Memory) language model is intended to complement the Recurrent Neural Network. The recurrent neural network refers to a neural network that receives sequential data, that is, sequential data, in order, determines how important it is, and delivers it to the output layer. Because sequence data is input in order, it looks like it circulates through the hidden layer (cell, cyclic layer) before being transmitted to the output layer, so it is called a recurrent neural network.

영화 평가 텍스트 데이터는 영화 관련 댓글, 영화 리뷰에 대한 댓글, SNS 리트윗 자료, 뉴스 기사와 같은 언어에 대한 텍스트 데이터이기 때문에 영화 평가 텍스트 데이터는 시퀀스 데이터가 될 수 있다. Since the movie evaluation text data is text data for languages such as movie-related comments, comments on movie reviews, SNS retweet materials, and news articles, the movie evaluation text data may be sequence data.

순환 신경망은 시퀀스 데이터가 길수록 셀이 더 깊게 펼쳐지기 때문에 셀에 곱해지는 가중치의 값이 지수적으로 증가하거나 감소하게 되어 기억된 시퀀스 데이터가 소실되거나 다른 형태로 변할 수 있다. 이러한 오류를 방지하기 위하여 LSTM은 셀이 오랜 시간 동안 정보를 기억할 수 있도록 하며, 긴 시퀀스 데이터를 효과적으로 처리할 수 있다.In the recurrent neural network, the longer the sequence data, the deeper the cell expands, so the value of the weight multiplied by the cell increases or decreases exponentially, so that the stored sequence data may be lost or changed in another form. In order to prevent such errors, LSTM allows the cell to store information for a long time and can effectively process long sequence data.

LSTM은 기억 메커니즘 즉, 메모리 셀(Memory Cell)을 이용하여 순환층의 셀이 오랜 시간 동안 정보를 잘 저장할 수 있으며, 각 메모리 셀에 적절한 가중치를 유지하는 순환루프를 포함할 수 있다. LSTM uses a memory mechanism, that is, a memory cell, so that cells of the cyclic layer can store information well for a long time, and may include a cyclic loop that maintains an appropriate weight for each memory cell.

도 6은 LSTM의 구조를 나타낸 것으로 도 6에 도시된 바와 같이, 메모리 셀의 흐름은 원소별 덧셈(

Figure pat00001
)과 원소별 곱셈(⊙)으로 제어할 수 있다. LSTM은 타임 스텝 t에서 현재 타임 스텝(h(t))의 시퀀스 데이터 출력은 시그모이드 함수(σ)나 하이퍼볼릭 탄젠트(tanh) 활성화 함수로 이전 타임 스텝(h(t-1))의 셀의 흐름을 설정하고, 기억할 정보와 삭제할 정보를 결정한 뒤 최종적으로 셀 상태를 업데이트한 후 출력할 수 있다.6 shows the structure of the LSTM. As shown in FIG. 6, the flow of the memory cell is elementwise addition (
Figure pat00001
) and element-wise multiplication (⊙). In LSTM, the sequence data output of the current time step (h (t) ) at time step t is a sigmoid function (σ) or hyperbolic tangent (tanh) activation function in the cell of the previous time step (h (t-1) ). You can set the flow of , decide what information to remember and what information to delete, and finally update the cell state and output it.

영화 평가 학습부(200)는 이러한 LSTM 언어 모델로 영화 평가 텍스트 데이터의 현재 시퀀스의 단어를 학습하면서 통계적으로 다음 시퀀스의 단어를 예측하여 학습 결과 시퀀스 데이터를 도출할 수 있다. The movie evaluation learning unit 200 may derive the learning result sequence data by statistically predicting the word of the next sequence while learning the word of the current sequence of the movie evaluation text data using the LSTM language model.

LSTM 언어 모델은 도 7의 수식을 통한 통계적인 방법으로 다음 시퀀스에 나올 단어를 예측하며, 샘플링 과정을 통해서 새로운 텍스트인 학습 결과 시퀀스 데이터를 생성할 수 있다. The LSTM language model predicts a word to appear in the next sequence by a statistical method through the equation shown in FIG. 7 , and may generate learning result sequence data, which is a new text, through a sampling process.

도 7의 수식에서 P(w1, …, wi)는 동시 확률을 말한다. 즉, 동시 확률로 구한 다음 시퀀스에 나올 단어들을 샘플링 과정을 통해 생성하게 된다.In the equation of FIG. 7 , P(w 1 , ..., w i ) refers to the simultaneous probability. That is, words to appear in a sequence after obtaining simultaneous probabilities are generated through a sampling process.

샘플링 과정은 탐욕적 샘플링(Greedy Sampling)과 확률적 샘플링(Stochastic Sampling)으로 나뉠 수 있다. 탐욕적 샘플링(Greedy Sampling)은 항상 높은 확률을 가진 단어를 선택하는 방법으로, 탐욕적 샘플링을 통해 생성된 단어들은 논리적이지 않을 수 있다는 단점이 있다. The sampling process can be divided into greedy sampling and stochastic sampling. Greedy sampling is a method of always selecting a word with a high probability, and has a disadvantage that words generated through greedy sampling may not be logical.

이에 비하여 확률적 샘플링(Stochastic Sampling)은 무작위 방법을 통해 단어들을 생성하는 방법으로 창의적으로 단어들을 생성할 수 있다는 장점이 있다. On the other hand, stochastic sampling is a method of generating words through a random method, and has an advantage in that words can be creatively generated.

즉, 샘플링 과정은 시퀀스 데이터의 양과 모델의 구성 방법(순환층의 깊이, 활성화 함수 선택)에 따라 다르게 선택될 수 있는데, 본 발명의 실시예에 따른 영화 예측 장치는 창의적 단어의 생성을 위하여 확률적 샘플링을 사용하였다.That is, the sampling process may be selected differently depending on the amount of sequence data and the method of constructing the model (depth of the circulating layer, selection of activation function). Sampling was used.

LSTM 언어 모델을 사용하여 다음 시퀀스에 나올 단어들을 생성하는 과정은 도 8과 같다. A process of generating words to appear in the next sequence using the LSTM language model is shown in FIG. 8 .

영화 평가 학습부(200)는 현재 시퀀스의 단어로서 영화 관련 항목을 사용하고, 영화 관련 항목의 다음 시퀀스의 단어를 통계적으로 예측하여 학습 결과 시퀀스 데이터를 도출할 수 있다.The movie evaluation learning unit 200 may derive the learning result sequence data by using the movie-related item as a word of the current sequence and statistically predicting the word of the next sequence of the movie-related item.

즉, 도 3에 도시된 영화를 선호하는 요인이 현재 시퀀스의 단어에 해당되고, 예측 함수를 통해 현재 학습 모델로 현재 단어를 고정된 길이로 변환하여 확률적 샘플링 방식으로 다음에 나올 단어들을 수십회 반복하여 시뮬레이션한 뒤 다음 시퀀스의 단어를 예측할 수 있다. 예측된 단어는 현재 시퀀스의 단어의 근거가 되며, 앞서 설명된 방법을 통하여 상기 예측된 단어 다음에 나올 단어가 예측될 수 있다. 이와 같은 과정이 반복됨으로써 도 9와 같은 영화 관련 항목에 대한 학습 결과 시퀀스 데이터가 도출될 수 있다. That is, the factor that favors the movie shown in FIG. 3 corresponds to the word in the current sequence, and the current word is converted to a fixed length with the current learning model through the prediction function, and the next word is repeated dozens of times in a probabilistic sampling method. After repeating the simulation, it is possible to predict the next sequence of words. The predicted word becomes the basis of the word of the current sequence, and the word that will appear after the predicted word can be predicted through the method described above. By repeating this process, sequence data as a result of learning for a movie-related item as shown in FIG. 9 may be derived.

이와같은 학습 결과 시퀀스 데이터는 영화 관련 항목을 현재 단어로 하여 학습이 시작되므로 도 9에 도시된 바와 같이, 영화 관련 항목의 단어들 중 적어도 하나가 학습 결과 시퀀스 데이터의 첫번째 단어일 수 있다.As such learning result sequence data starts with the movie-related item as the current word, at least one of the words of the movie-related item may be the first word of the learning result sequence data, as shown in FIG. 9 .

한편, 도 1의 영화 추천부(300)는 선호우선순위에 따른 영화 관련 항목에 해당되는 학습 결과 시퀀스 데이터로부터 영화 제목을 추출하여 사용자의 단말기로 영화 추천 결과를 제공할 수 있다.Meanwhile, the movie recommendation unit 300 of FIG. 1 may extract the movie title from the learning result sequence data corresponding to the movie-related item according to the preference priority and provide the movie recommendation result to the user's terminal.

앞서 설명된 바와 같이, 사용자 정보 수집부(100)를 통하여 도 3의 영화 관련 항목에 대한 사용자의 선호우선순위가 도출되고, 영화 평가 학습부(200)를 통하여 도 9에 도시된 바와 같이, 영화 관련 항목에 대한 학습 결과 시퀀스 데이터가 도출된다.As described above, the user's preference for the movie-related item of FIG. 3 is derived through the user information collecting unit 100 , and as shown in FIG. 9 through the movie evaluation learning unit 200 , the movie Sequence data is derived as a result of learning for related items.

영화 추천부(300)는 사용자의 선호우선순위에 따라 영화 관련 항목을 정렬할 수 있다. 영화 추천부(300)는 정렬 결과에 따라 사용자가 가장 크게 선호하는 영화 관련 항목의 학습 결과 시퀀스 데이터로부터 영화 제목을 추출할 수 있다.The movie recommendation unit 300 may sort movie related items according to the user's preference priority. The movie recommendation unit 300 may extract the movie title from the learning result sequence data of the movie-related item most preferred by the user according to the sorting result.

영화 추천부(300)는 상기 영화 제목에 해당되는 영화 정보를 데이터베이스(400)로부터 검색하여 상기 영화 정보를 사용자의 단말기로 제공할 수 있다. 즉, 영화 추천부(300)는 영화 제목에 링크된 영화 상세 정보를 데이터베이스(400)로부터 읽어들어 사용자의 단말기로 제공할 수 있다. The movie recommendation unit 300 may search for movie information corresponding to the movie title from the database 400 and provide the movie information to the user's terminal. That is, the movie recommendation unit 300 may read detailed movie information linked to the movie title from the database 400 and provide it to the user's terminal.

데이터베이스(400)는 사용자의 개인정보, 영화 관련 항목, 선호우선순위, 학습 결과 시퀀스 데이터, 영화 추천 결과 및 영화 상세 정보를 저장한다.The database 400 stores the user's personal information, movie related items, preference priority, learning result sequence data, movie recommendation result, and movie detailed information.

이상에서 설명된 바와 같이, 본 발명의 실시예에 따른 영화 추천 장치는 사용자가 영화를 선택할 때 선호하는 요인들의 계층 구조 구성을 통해 Fuzzy-AHP로 사용자마다 영화를 선호하는 정도가 다른 불확실한 정보를 반영하여 이를 객관적으로 표현할 수 있으며, 수집된 시퀀스 데이터를 이용하여 LSTM 언어 모델로 사용자가 선호하는 영화를 추천할 수 있다.As described above, the movie recommendation apparatus according to an embodiment of the present invention reflects uncertain information in which each user has a different degree of movie preference with Fuzzy-AHP through the hierarchical structure of factors that the user prefers when selecting a movie. Thus, it can be objectively expressed, and a user's preferred movie can be recommended using the LSTM language model using the collected sequence data.

이상과 같이 본 발명에 따른 실시예를 살펴보았으며, 앞서 설명된 실시예 이외에도 본 발명이 그 취지나 범주에서 벗어남이 없이 다른 특정 형태로 구체화 될 수 있다는 사실은 해당 기술에 통상의 지식을 가진 이들에게는 자명한 것이다. 그러므로, 상술된 실시예는 제한적인 것이 아니라 예시적인 것으로 여겨져야 하고, 이에 따라 본 발명은 상술한 설명에 한정되지 않고 첨부된 청구항의 범주 및 그 동등 범위 내에서 변경될 수도 있다.As described above, the embodiments according to the present invention have been reviewed, and the fact that the present invention can be embodied in other specific forms without departing from the spirit or scope of the present invention in addition to the above-described embodiments is recognized by those with ordinary skill in the art. It is self-evident to Therefore, the above-described embodiments are to be regarded as illustrative rather than restrictive, and accordingly, the present invention is not limited to the above description, but may be modified within the scope of the appended claims and their equivalents.

사용자 정보 수집부(100)
영화 평가 학습부(200)
영화 추천부(300)
데이터베이스(400)
User information collection unit 100
Film evaluation learning unit (200)
Movie Recommendation Unit (300)
database (400)

Claims (7)

사용자의 단말기로부터 전송된 복수의 영화 관련 항목 사이의 선호도를 Fuzzy-AHP(Analytical Hierarchy Process)를 이용하여 분석하여 상기 영화 관련 항목의 선호우선순위를 도출하는 사용자 정보 수집부;
네티즌들의 단말기들에 의하여 작성된 영화 평가 텍스트 데이터를 수집한 뒤 상기 영화 평가 텍스트 데이터를 LSTM(Long Short Term Memory) 언어 모델로 학습하여 상기 영화 관련 항목에 해당되는 학습 결과 시퀀스 데이터(sequence data)를 도출하는 영화 평가 학습부;
상기 선호우선순위에 따른 상기 영화 관련 항목에 해당되는 상기 학습 결과 시퀀스 데이터로부터 영화 제목을 추출하여 상기 사용자의 단말기로 영화 추천 결과를 제공하는 영화 추천부; 및
상기 사용자의 개인정보, 상기 영화 관련 항목, 상기 선호우선순위, 상기 학습 결과 시퀀스 데이터 및 상기 영화 추천 결과를 저장하는 데이터베이스
를 포함하는 영화 추천 장치.
a user information collecting unit for deriving a preference priority of the movie-related items by analyzing a preference among a plurality of movie-related items transmitted from the user's terminal using a Fuzzy-AHP (Analytical Hierarchy Process);
After collecting the movie evaluation text data written by the terminals of netizens, the movie evaluation text data is learned with an LSTM (Long Short Term Memory) language model to derive the learning result sequence data corresponding to the movie related item film evaluation study department;
a movie recommendation unit extracting a movie title from the learning result sequence data corresponding to the movie-related item according to the preference priority and providing a movie recommendation result to the user's terminal; and
A database for storing the user's personal information, the movie related items, the preference priority, the learning result sequence data, and the movie recommendation result
A movie recommendation device comprising a.
제1항에 있어서,
상기 영화 평가 학습부는
상기 수집된 영화 평가 텍스트 데이터를 하나의 파일로 병합하고, 상기 병합된 파일에 존재하는 특수 문자를 제거하는 전처리를 수행하는 것을 특징으로 하는 영화 추천 장치.
According to claim 1,
The movie evaluation learning unit
and merging the collected movie evaluation text data into one file and performing pre-processing of removing special characters existing in the merged file.
제2항에 있어서,
상기 영화 평가 학습부는
상기 전처리된 영화 평가 텍스트 데이터를 문장의 구성단위인 토큰(token)으로 분리하고,
상기 토큰으로 분리된 영화 평가 텍스트 데이터를 고정 길이의 수치형 텐서(tensor)로 변환하며,
상기 LSTM 언어 모델을 통하여 상기 고정 길이의 수치형 텐서에 대한 학습을 수행하는 것을 특징으로 하는 영화 추천 장치.
3. The method of claim 2,
The movie evaluation learning unit
Separating the preprocessed movie evaluation text data into tokens, which are constituent units of sentences,
Converting the movie evaluation text data separated by the token into a numerical tensor of a fixed length,
The movie recommendation apparatus of claim 1, wherein learning is performed on the fixed-length numeric tensor through the LSTM language model.
제1항에 있어서,
상기 영화 평가 학습부는
상기 LSTM 언어 모델로 상기 영화 평가 텍스트 데이터의 현재 시퀀스의 단어를 학습하면서 통계적으로 다음 시퀀스의 단어를 예측하여 상기 학습 결과 시퀀스 데이터를 도출하는 것을 특징으로 하는 영화 추천 장치.
According to claim 1,
The movie evaluation learning unit
The movie recommendation apparatus, characterized in that while learning the word of the current sequence of the movie evaluation text data with the LSTM language model, statistically predicting the word of the next sequence to derive the learning result sequence data.
제4항에 있어서,
상기 영화 평가 학습부는
상기 현재 시퀀스의 단어로서 상기 영화 관련 항목을 사용하고, 상기 영화 관련 항목의 다음 시퀀스의 단어를 통계적으로 예측하여 상기 학습 결과 시퀀스 데이터를 도출하는 것을 특징으로 하는 영화 추천 장치.
5. The method of claim 4,
The movie evaluation learning unit
The movie recommendation apparatus of claim 1, wherein the movie-related item is used as the word of the current sequence, and the learning result sequence data is derived by statistically predicting the word of the next sequence of the movie-related item.
제5항에 있어서,
상기 영화 관련 항목의 단어들 중 적어도 하나가 상기 학습 결과 시퀀스 데이터의 첫번째 단어인 것을 특징으로 하는 영화 추천 장치.
6. The method of claim 5,
At least one of the words of the movie related item is a first word of the learning result sequence data.
제1항에 있어서,
상기 영화 추천부는 상기 영화 제목에 링크된 영화 상세 정보를 상기 데이터베이스로부터 읽어들어 상기 사용자의 단말기로 제공하는 것을 특징으로 하는 영화 추천 장치.
According to claim 1,
The movie recommendation unit is a movie recommendation device, characterized in that reads the detailed movie information linked to the movie title from the database to provide to the terminal of the user.
KR1020210009991A 2021-01-25 2021-01-25 Apparatus for recommending movie KR102433804B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210009991A KR102433804B1 (en) 2021-01-25 2021-01-25 Apparatus for recommending movie

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210009991A KR102433804B1 (en) 2021-01-25 2021-01-25 Apparatus for recommending movie

Publications (2)

Publication Number Publication Date
KR20220107399A true KR20220107399A (en) 2022-08-02
KR102433804B1 KR102433804B1 (en) 2022-08-18

Family

ID=82846025

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210009991A KR102433804B1 (en) 2021-01-25 2021-01-25 Apparatus for recommending movie

Country Status (1)

Country Link
KR (1) KR102433804B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101341A (en) * 2014-02-26 2015-09-03 에스케이플래닛 주식회사 Apparatus and method for recommending movie based on distributed fuzzy association rules mining
KR101639987B1 (en) 2015-01-19 2016-07-18 배재대학교 산학협력단 Method and Apparatus for Movies Recommendation by Using Hybrid Filtering Based

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101341A (en) * 2014-02-26 2015-09-03 에스케이플래닛 주식회사 Apparatus and method for recommending movie based on distributed fuzzy association rules mining
KR101639987B1 (en) 2015-01-19 2016-07-18 배재대학교 산학협력단 Method and Apparatus for Movies Recommendation by Using Hybrid Filtering Based

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ho-Yeon Park et al. "Análisis de sentimiento de reseñas de películas usando el modelo combinado CNN-LSTM", J Intelll Inform Syst Diciembre: 25(4): 141~154, 2019-04-25 Parte 1.* *

Also Published As

Publication number Publication date
KR102433804B1 (en) 2022-08-18

Similar Documents

Publication Publication Date Title
Anastasopoulos et al. Machine learning for public administration research, with application to organizational reputation
Grimmer et al. Text as data: The promise and pitfalls of automatic content analysis methods for political texts
CN112131350B (en) Text label determining method, device, terminal and readable storage medium
Teso et al. Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective
CN111191092B (en) Label determining method and label determining model training method
CN104866557A (en) Customized just-in-time learning support system and method based on constructivist learning theory
Karasoy et al. Spam SMS detection for Turkish language with deep text analysis and deep learning methods
Shoukry et al. Attributes prediction from IoT consumer reviews in the hotel sectors using conventional neural network: deep learning techniques
Almuqren et al. Using deep learning networks to predict telecom company customer satisfaction based on Arabic tweets
Rahmawati et al. Hoax news detection analysis using indobert deep learning methodology
Humphreys Automated text analysis
Sharma et al. Movie buzz-movie success prediction system using machine learning model
Patil et al. Personality prediction using Digital footprints
KR102433804B1 (en) Apparatus for recommending movie
Gupta et al. Real-time sentiment analysis of tweets: A case study of Punjab elections
Pushpakumar For movie reviews, A sentiment analysis using long short term memory networks
Alorini et al. Machine learning enabled sentiment index estimation using social media big data
Abu-Salih et al. Predictive analytics using Social Big Data and machine learning
Sotirakou et al. Understanding the link between audience engagement metrics and the perceived quality of online news using machine learning
Kazim et al. Preprocessing of Drugs Reviews and Classification Techniques
Vaid et al. Sentiment analysis of Indian currency demonetization
Brito et al. Towards German word embeddings: A use case with predictive sentiment analysis
Mobasher et al. An enhanced personality detection system through user’s digital footprints
Samir et al. Sentiment analysis model for Airline customers’ feedback using deep learning techniques
Mednini et al. Natural language processing for detecting brand hate speech

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant