KR101575779B1 - Program rating prediction method and apparatus, and system based on sentiment analysis of viewers comments - Google Patents
Program rating prediction method and apparatus, and system based on sentiment analysis of viewers comments Download PDFInfo
- Publication number
- KR101575779B1 KR101575779B1 KR1020140097479A KR20140097479A KR101575779B1 KR 101575779 B1 KR101575779 B1 KR 101575779B1 KR 1020140097479 A KR1020140097479 A KR 1020140097479A KR 20140097479 A KR20140097479 A KR 20140097479A KR 101575779 B1 KR101575779 B1 KR 101575779B1
- Authority
- KR
- South Korea
- Prior art keywords
- emotion
- node
- dictionary
- audience rating
- calculated
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Graphics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 시청률 예측 방법 및 장치에 관한 것으로, 보다 상세하게는, 시청자의 의견에 대한 감성을 분석하여 시청률을 예측하는 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for predicting audience ratings, and more particularly, to a method and apparatus for predicting audience ratings by analyzing emotions on a viewer's opinion.
최근 시청률은 특정 TV 프로그램이 얼마나 시청되고 있는지를 나타내는 지표로써, TV 프로그램의 완성도 및 인지도 평가에 활용되고 있다. 그런데, TV 프로그램은 시청자의 해당 프로그램에 대한 몰입도에 따라 시청여부가 결정되기 때문에, 시청률은 시청자의 의견에 따라 변동이 심하다. 따라서, 이러한 시청률 예측은 시청자의 의견을 캐치하는 것으로 일반적으로 그 정확도를 확보하는 것은 굉장히 어렵다. 시청률을 예측하고자 하는 이유는, 광고 전략 수립 및 연예인 채용 등 여러가지 분야에 활용될 수 있기 때문이다. 실제로 이러한 시청률 예측을 위해 다양한 방법이 시도되고 있는데, 예측 정확도 측면에서 좋은 효율을 나타내지 못하고 있는 실정이다.Recently, audience ratings have been used to evaluate the completeness and awareness of TV programs as an indicator of how much a particular TV program is watched. However, since the TV program is determined depending on the degree of the viewer's immersion into the program, the viewer rating fluctuates greatly according to the viewer's opinion. Therefore, such audience rating prediction catches the opinion of the viewer, and it is extremely difficult to generally obtain the accuracy thereof. The reason for predicting the audience rating is that it can be applied to various fields such as advertising strategy establishment and recruitment of entertainers. Actually, various methods have been tried to predict the audience ratings, but they are not showing good efficiency in terms of prediction accuracy.
종래 연구는 시청률 예측을 위해 편집실 사용시간을 분석하는 방법, 광고 판매 금액을 기반으로 예측하는 방법, 방영 시간을 기준으로 예측하는 방법 등이 사용되고 있는데, 시청률 예측에 시청자의 의견이 반영되지 않고, 편집실 사용시간 정보와 같은 것은 접근성이 좋지 않기 때문에, 정보 확보에 어려움이 있다는 단점이 있다. Conventional researches have used a method of analyzing the use time of a editing room, a method of predicting based on an advertisement sales amount, a method of predicting based on a broadcasting time, etc. in order to predict audience ratings. Since accessibility information such as usage time information is not good, there is a disadvantage in that it is difficult to secure information.
상술한 문제점을 해결하기 위한 본 발명의 목적은, 빠르고 쉽게 접근할 수 있는 인터넷에서 해당 프로그램에 대한 시청자의 의견을 분석해 시청률을 예측하는 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법 및 장치를 제공하는 것이다.It is an object of the present invention to solve the above problems and provide a method and an apparatus for predicting a program audience rating through emotion analysis of a viewer's opinion that predicts an audience rating by analyzing a viewer's opinion on the program on a fast and easily accessible Internet will be.
상기한 목적을 달성하기 위한 본 발명의 대상 프로그램의 시청률 예측 방법은 대상 프로그램에 대한 복수 개의 회차에 대응되는 시청자의 의견이 포함된 게시글을 수집하는 단계, 상기 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하는 단계, 상기 산출되는 감성지수와 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하는 단계 및 상기 산출되는 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인공신경망 모델에 입력하여 최종 예측 시청률 값을 산출하는 단계를 포함할 수 있다.According to another aspect of the present invention, there is provided a method for predicting audience ratings of a target program, the method comprising the steps of: collecting posts containing opinions of viewers corresponding to a plurality of times of a target program; Generating an artificial neural network model by constructing learning data based on the calculated emotion index and past audience rating information, and inputting test data configured based on the calculated emotion index to the artificial neural network model And calculating a final predicted audience rating value.
상기 감성지수 산출 단계는 상기 게시글에 포함된 어휘에 강의어 감성 사전 - 강의어 감성 사전은 특정 값 이상의 강한 감정을 나타내는 단어를 중심으로 재구축한 감성 사전을 의미함 - 을 이용하여 감정지수를 산출하는 단계를 포함할 수 있다.The emotional index calculating step calculates the emotional index using the lecture-based emotion dictionary for the vocabulary included in the bulletin, and the emotion dictionary for lecture-based emotion dictionary means the emotional dictionary reconstructed based on the word indicating the strong emotion of a specific value or more .
상기 강의어 감성 사전은 감정의 긍정 및 부정 여부와 관련 없이, 감정이 나타나는 정도를 기반으로 재구축된 감성 사전일 수 있다.The linguistic dictionary of the lecture may be a reconstructed emotional dictionary based on the degree of emotion, irrespective of whether the emotion is affirmative or not.
상기 학습 데이터는 상기 대상 프로그램의 과거 회차 게시글로부터 산출된 감성지수를 포함하여 구성되고, 상기 테스트 데이터는 상기 대상 프로그램의 현재 회차 게시글로부터 산출된 감성지수를 포함하여 구성될 수 있다.Wherein the learning data includes an emotion index calculated from past past postings of the target program, and the test data may include an emotion index calculated from a current daily post of the target program.
상기 인공신경망은 학습을 통해 모델을 생성하고, 생성된 모델을 이용하여 최적 해를 예측하는 기법으로, 적어도 두 개의 과거 회차의 시청률 값과 대응하는 감성지수를 입력층에 입력하고, 상기 입력층 변수에 제 1 가중치를 기반으로 은닉층의 변수를 산출하며, 상기 은닉층 변수에 제 2 가중치를 곱하여 최종 출력층인 예측 시청률 값을 산출할 수 있다.The artificial neural network generates a model through learning and predicts an optimal solution using the generated model. The artificial neural network inputs the sensibility index corresponding to the audience rating value of at least two past episodes to the input layer, The hidden layer variable is calculated based on the first weight, and the hidden layer variable is multiplied by the second weight to calculate the predicted audience rating value, which is the final output layer.
상기 제 1 가중치는 (여기서, i는 입력층의 i번째 노드, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정될 수 있다.The first weight (Where, i is the i-th node of the input layers, j is the j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j are, t k value (output) of the hidden layer j-th node k < th > ( K) is the output of the output layer k, and k is the output of the k-th output layer.
상기 제 2 가중치는 (여기서, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정될 수 있다.The second weight (Where, j is a j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j is the value of hidden layer j-th node (output), t k is the k-th answer, o k is output layer k-th node, Quot; output ").
상기한 목적을 달성하기 위한 본 발명의 대상 프로그램의 시청률 예측 장치는 대상 프로그램에 대한 복수 개의 회차에 대응되는 시청자의 의견이 포함된 게시글을 수집하는 게시글 수집부, 상기 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하는 감성지수 산출부, 상기 산출된 감성지수와 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하는 인공신경망 모델 생성부 및 상기 산출된 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인공신경망 모델에 입력하여 최종 예측 시청률 값을 산출하는 예측 시청률 산출부를 포함할 수 있다.In order to achieve the above object, an apparatus for predicting audience ratings of a target program of the present invention includes: a bulletin collection unit for collecting bulletins including opinions of viewers corresponding to a plurality of bullet points for a target program; An artificial neural network model generation unit configured to construct learning data based on the calculated emotion index and past audience rating information to generate an artificial neural network model; and an artificial neural network model generation unit configured to generate artificial neural network models based on the calculated emotion index And inputting the test data to the artificial neural network model to calculate a final predicted audience rating value.
상기 감성지수 산출부는 상기 게시글에 포함된 어휘에 강의어 감성 사전 - 강의어 감성 사전은 특정 값 이상의 강한 감정을 나타내는 단어를 중심으로 재구축한 감성 사전을 의미함 - 을 이용하여 감정지수를 산출할 수 있다.The emotional index calculating unit calculates the emotional index using the lecture-based emotion dictionary for the vocabulary included in the bulletin, and the emotion dictionary for lecture-based emotion dictionary means the emotional dictionary reconstructed based on the word indicating a strong emotion of a specific value or more .
상기 강의어 감성 사전은 감정의 긍정 및 부정 여부와 관련 없이, 감정이 나타나는 정도를 기반으로 재구축된 감성 사전일 수 있다.The linguistic dictionary of the lecture may be a reconstructed emotional dictionary based on the degree of emotion, irrespective of whether the emotion is affirmative or not.
상기 학습 데이터는 상기 대상 프로그램의 과거 회차 게시글로부터 산출된 감성지수를 포함하여 구성되고, 상기 테스트 데이터는 상기 대상 프로그램의 현재 회차 게시글로부터 산출된 감성지수를 포함하여 구성될 수 있다.Wherein the learning data includes an emotion index calculated from past past postings of the target program, and the test data may include an emotion index calculated from a current daily post of the target program.
상기 인공신경망은 학습을 통해 모델을 생성하고, 생성된 모델을 이용하여 최적 해를 예측하는 기법으로, 적어도 두 개의 과거 회차의 시청률 값과 대응하는 감성지수를 입력층에 입력하고, 상기 입력층 변수에 제 1 가중치를 기반으로 은닉층의 변수를 산출하며, 상기 은닉층 변수에 제 2 가중치를 곱하여 최종 출력층인 예측 시청률 값을 산출할 수 있다.The artificial neural network generates a model through learning and predicts an optimal solution using the generated model. The artificial neural network inputs the sensibility index corresponding to the audience rating value of at least two past episodes to the input layer, The hidden layer variable is calculated based on the first weight, and the hidden layer variable is multiplied by the second weight to calculate the predicted audience rating value, which is the final output layer.
상기 제 1 가중치는 (여기서, i는 입력층의 i번째 노드, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정될 수 있다.The first weight (Where, i is the i-th node of the input layers, j is the j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j are, t k value (output) of the hidden layer j-th node k < th > ( K) is the output of the output layer k, and k is the output of the k-th output layer.
상기 제 2 가중치는 (여기서, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정될 수 있다.The second weight (Where, j is a j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j is the value of hidden layer j-th node (output), t k is the k-th answer, o k is output layer k-th node, Quot; output ").
상기한 목적을 달성하기 위한 본 발명의 대상 프로그램의 시청률 예측 시스템은 온라인 상에서 발생하는 대상 프로그램에 대한 복수 개의 회차에 대응되는 사용자의 의견을 포함하는 게시글을 게시하는 복수의 웹 서버, 상기 게시글을 수집하고, 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하여, 상기 산출된 감성지수와 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하고, 상기 산출된 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인공신경망 모델에 입력하여 최종 예측 시청률 값을 산출할 수 있다.To achieve the above object, an audience rating prediction system of a target program of the present invention includes: a plurality of web servers for posting a post including opinions of a user corresponding to a plurality of times for a target program generated on-line; Calculates an emotion index based on the vocabularies included in the collected posts, generates learning data based on the calculated emotion index and past audience rating information to generate an artificial neural network model, and based on the calculated emotion index And input the constructed test data to the artificial neural network model to calculate a final predicted audience rating value.
본 발명의 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법 및 장치에 따르면, 시청률 예측에 적합한 강의어 감성사전을 구축하고 인공신경망을 이용하여 시청률을 예측하기 때문에, 종래 감성 사전을 이용하는 것보다 성능이 월등히 향상되고 관련 정보의 확보도 용이하여 빠른 예측이 가능한 효과가 있다.According to the method and apparatus for predicting the program audience rating through analysis of emotion of the viewer's opinion of the present invention, the learner's emotional dictionary suitable for audience rating prediction is constructed and the audience rating is predicted using the artificial neural network. And the related information can be easily obtained, so that the prediction can be made quickly.
도 1은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법이 적용되는 시스템을 나타낸 블록도,
도 2는 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법을 개략적으로 나타낸 흐름도,
도 3은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법의 감성지수 계산 방법을 설명하기 위한 개념도,
도 4는 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법의 시청률 예측을 위해 사용되는 인공 신경망을 개략적으로 설명하기 위한 개념도,
도 5는 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법의 시청률 예측을 위해 사용되는 인공 신경망에서 수행되는 계산들을 구체적으로 설명하기 위한 도면,
도 6은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 장치를 개략적으로 나타낸 블록도,
도 7은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법에 따른 시청률 예측의 정확도를 나타내기 위한 그래프이다.FIG. 1 is a block diagram illustrating a system to which a method for predicting program audience rating through analysis of emotion of viewer's opinion according to an exemplary embodiment of the present invention is applied.
FIG. 2 is a flowchart schematically illustrating a method of predicting program rating through emotion analysis of a viewer's opinion according to an embodiment of the present invention.
FIG. 3 is a conceptual diagram for explaining a method of calculating the emotion index of the method for predicting the program audience rating through emotion analysis of viewer's opinion according to an exemplary embodiment of the present invention.
4 is a conceptual diagram schematically illustrating an artificial neural network used for predicting audience ratings of a program audience rating prediction method through emotion analysis of audience opinion according to an embodiment of the present invention.
FIG. 5 is a diagram for describing calculations performed in an artificial neural network used for predicting audience ratings of a program audience rating prediction method through emotion analysis of audience opinion according to an embodiment of the present invention; FIG.
FIG. 6 is a block diagram schematically showing an apparatus for predicting program audience rating through emotion analysis of a viewer's opinion according to an embodiment of the present invention.
FIG. 7 is a graph illustrating the accuracy of the audience rating prediction according to the program audience rating prediction method through emotion analysis of audience opinion according to an embodiment of the present invention.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.
"제 1, 제 2" 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. "및/또는" 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms "first, second," and the like can be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. The term "and / or" includes any combination of a plurality of related listed items or any of a plurality of related listed items.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprises" or "having" and the like are used to specify that there is a feature, a number, a step, an operation, an element, a component or a combination thereof described in the specification, But do not preclude the presence or addition of one or more other features, integers, steps, operations, elements, components, or combinations thereof.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the relevant art and are to be interpreted in an ideal or overly formal sense unless explicitly defined in the present application Do not.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In order to facilitate the understanding of the present invention, the same reference numerals are used for the same constituent elements in the drawings and redundant explanations for the same constituent elements are omitted.
시청률 예측 시스템Audience rating system
도 1은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법이 적용되는 시스템을 나타낸 블록도이다. 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 시스템은 웹 서버(110-1, 110-2, ..., 110-N), 통신망(120) 및 시청률 예측 장치(130)를 포함할 수 있다.FIG. 1 is a block diagram illustrating a system to which a method for predicting program rating through emotion analysis of a viewer's opinion according to an embodiment of the present invention is applied. 1, a system according to an embodiment of the present invention includes a web server 110-1, 110-2, ..., 110-N, a
도 1을 참조하면, 하나 이상의 웹 서버(110-1, 110-2, ..., 110-N)는 온라인 상에서 발생하는 사용자 의견 정보를 개시한다. 웹 서버(110-1, 110-2, ..., 110-N)는 특정 웹 사이트(방송국 사이트, 포털 사이트, 개인용 사이트 등), 게시판, 블로그, 카페 및 SNS(소셜 네트워크 서비스)를 지원하는 사이트 등의 온라인 채널일 수 있다.Referring to FIG. 1, one or more web servers 110-1, 110-2,..., 110-N initiate user feedback information that occurs on-line. The web servers 110-1, 110-2, ..., and 110-N may support specific web sites (broadcasting station sites, portal sites, personal sites, etc.), bulletin boards, blogs, cafes, and social network services And may be an online channel such as a site.
통신망(120)은 복수의 웹 서버(110-1, 110-2, ..., 110-N)와 시청률 예측 장치(130)간 상호 유무선으로 통신할 수 있도록 통신 서비스를 제공하는 네트워크를 의미한다. 즉, 통신망(120)은 유선 인터넷 망일 수 있고, 이동 통신망을 통해 연결되는 무선 데이터망일 수 있으며, 또는 와이-파이, 블루투스, 지그비와 같은 근거리 통신을 통해 연결되는 네트워크일 수 있다. The
시청률 예측 장치(130)는 상기 복수의 웹 서버(110-1, 110-2, ..., 110-N)에 게재된 사용자 의견 정보를 수집하여, 수집된 내용 중 감성을 나타내는 감성 단어만을 추출하고, 추출된 감성 단어를 기반으로 인공신경망을 이용하여 시청률을 예측하는 장치이다. 시청률 예측 장치(130)는 수집된 게시글에 포함된 어휘에서 감성지수를 산출하고, 산출된 감성지수와 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공 신경망 모델을 생성한다. 그리고는, 감성지수를 입력으로 하여 인공신경망 모델을 거쳐 출력되는 값을 최종 예측 시청률 값으로 산출할 수 있다.
The audience
시청률 예측 방법How to predict audience ratings
도 2는 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법을 개략적으로 나타낸 흐름도이다.FIG. 2 is a flowchart schematically illustrating a method of predicting a program rating through emotion analysis of a viewer's opinion according to an exemplary embodiment of the present invention.
도 2를 참조하면, 시청률 예측 장치(미도시)는 시청자 게시판의 게시글을 수집한다(S210). 수집되는 장소는 반드시 방송 프로그램과 관련된 시청자 게시판으로 한정되는 것은 아니고, 네트워크를 통해 접속 가능한 사이트, 카페, 블로그, SNS 내에 게시된 장소일 수 있다. 시청자 게시판에 개시된 게시글은 복수 개일 수 있고, 게시된 글 전체를 수집할 수도 있고, 이 중 일부만을 수집할 수도 있다. Referring to FIG. 2, an audience rating prediction apparatus (not shown) collects a bulletin of a viewer bulletin board (S210). The place to be collected is not necessarily limited to a viewer's bulletin board related to a broadcast program, but may be a place posted in a site, a cafe, a blog, or an SNS accessible via a network. There may be a plurality of posts disclosed on the viewer's bulletin board, collect all the posted articles, or collect only a part of them.
게시글을 수집한 후, 시청률 예측 장치는 게시글에 포함된 어휘를 추출한다(S220). 어휘 추출은 해당 게시글의 감성을 분석하기 위한 것이다. 따라서, 게시글과 추출된 어휘는 대응 관계를 가질 수 있다. 이때, 어휘 추출을 위해, 게시글을 분석하여 불필요한 불용어(예컨대, 의미를 부여받지 못하는 조사, 맺음말, 문장 부호 등)를 잘라내고, 의미를 갖는 순수 어휘만을 추출할 수 있다. After collecting the bulletin, the audience rating prediction device extracts the vocabulary included in the bulletin (S220). Vocabulary extraction is for analyzing the emotion of the corresponding post. Therefore, the article and the extracted vocabulary can have a corresponding relationship. At this time, in order to extract a vocabulary, it is possible to extract unnecessary abbreviations (for example, irrelevant surveys, closing words, punctuation marks, etc.) by analyzing the posts and extract only pure vocabularies having meaning.
그리고는, 추출된 어휘를 기반으로 감성지수를 산출한다(S230). 추출된 어휘 중 강의어 감성 사전(202)에 포함된 어휘에 감성 사전(202)에서 정의하고 있는 감성 지수 값이 부여된다. 여기서, 강의어 감성 사전(202)은 특정 단어들을 강의어를 중심으로 재구축한 새로운 개념의 감성 사전이다. 종래 사람들이 특정 단어에 대해 느끼는 감정의 정도를 수치화하여, 약간 긍정적이면 예컨대, +0.1을, 많이 긍정적이면 +1.0을, 약간 부정적이면, -0.1을, 많이 부정적이면 -1.0을 부여하듯이, 부정 및 긍정인지 여부에 따라 극성을 갖게 되고, 긍정 또는 부정의 정도에 따라 + 또는 - 에 대해 특정 수치를 갖는다. 이러한 사전은 베이스라인(baseline)으로 사용할 수 있다.Then, the emotion index is calculated based on the extracted vocabulary (S230). The emotion index values defined in the
강의어 감성 사전(202)에서 강의어는 강한 감정을 나타내는 단어로써, 단어가 글쓴이의 감정이나 주장(생각)을 나타내면 높은 점수를 부여받도록 구성되어 있다. 이러한 감성 사전을 통해 획득되는 점수가 낮으면 시청률을 낮아지는 것으로 예상될 수 있다. 즉, 강의어 감성 사전(202)은 긍정인지 부정인지를 나타내는 극성 정보를 포함하지 않고, 단지 감정의 정도가 강한지 여부만을 계층화시켜 분류해 놓은 사전으로, 시청률 예측에 특화된 사전이다. In the
도 3은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법의 감성지수 계산 방법을 설명하기 위한 개념도이다.3 is a conceptual diagram for explaining a method of calculating the emotion index of the method for predicting the program audience rating through emotion analysis of the viewer's opinion according to an embodiment of the present invention.
도 3을 참조하면, 기존 감성 사전으로, 게시글 1(310)의 감성지수를 산출하면, 드라마의 악역이 짜증난다고 표현한 경우, "태도"라는 어휘가 약간 부정적인 의미를 가지므로 -0.25점을, "짜증"이라는 어휘가 다소 흥분했을 때의 부정적인 의미를 가지므로, -0.5점을 갖게 되어, 모두 합하면 "-1"의 감성지수를 갖게 된다. 즉, 아주 부정적인 의미를 갖게 되어, 이러한 사전을 바로 시청률 예측에 연결하게 되면, 시청률에 부정적인 영향을 미치게 되어, 낮은 시청률의 프로그램일 것이라는 예측을 할 수 있다. 앞서 설명한 바와 같이, 이 글쓴이는 특정 드라마가 보기 싫어서 악역을 부정적으로 평가했다기 보다는 드라마에 너무 몰입하였기 때문에, 악역에 대한 강한 감정을 표출한 것으로 보는 것이 맞다. 따라서, 이렇게 일반 감성 사전의 경우, 시청률 예측에 대해 상반되는 결과를 예측하게 된다. Referring to FIG. 3, when the emotion index of the first 310 is calculated as an existing emotional dictionary, when the vocabulary of the drama is expressed as irritated, -0.25 points is used because the word "attitude" Irritation "has a negative meaning when it gets a little excited, so it has -0.5 points, and when combined, it has a sensitivity index of" -1 ". That is, it has a very negative meaning, and if such a dictionary is directly linked to the audience rating prediction, the audience rating will be negatively influenced, and it can be predicted that the program will be a program with a low audience rating. As I mentioned earlier, this writer is more interested in the drama than the negative evaluation of the villain because he does not want to see the specific drama. Thus, in the case of the general emotion dictionary, the contradictory result is predicted for the audience rating prediction.
반면, 강의어 감성 사전을 이용하는 경우, 게시글 1(310)과 동일한 게시글 2(320)의 산출 과정은 다음과 같다. "태도"라는 어휘는 감정을 나타내지 않는 단어로써 이 경우에는 0점으로 처리되고, "짜증"이라는 어휘는 흥분했을 때 사용하는 감정적인 단어로써, +0.5 점으로 처리된다. 따라서, 전체 점수는 0.5점이 나오게 된다. 시청률이라는 것은 시청자가 다소 부정적인 감정을 드러내고 있다고 하더라도, 이는 프로그램 속에 등장하는 캐릭터 또는 인물에 대한 감정이거나, 등장하는 대상이 아주 불쾌한 행동을 수행하기 때문에 나타나는 감정으로 오히려, 프로그램에 몰입하고 있다는 것을 나타낼 수 있고, 이러한 특성은 드라마 또는 스포츠와 같은 프로그램에서 더 잘 나타날 수 있다. On the other hand, in the case of using the linguistic emotion dictionary, the calculation process of the
그리고, 게시글 감성지수의 평균이 게시글의 전체 감성지수가 될 수 있다. 특정 도배성 글을 배제하기 위해, 그 다음 문장에서 설명된 게시글의 감성지수에 임계치를 두어 도배성 글을 배제할 수 있다.And the average of the post emotion index can be the total emotion index of the post. In order to exclude a specific domestication article, it is possible to exclude a domestication article by placing a threshold on the emotion index of the article described in the next sentence.
결론적으로, 극성 정보를 통해, + 또는 - 값으로 나타내어지는 일반 감성 사전을 이용하게 되면, 특정 캐릭터에 대한 감정이 바로 프로그램에 대한 태도를 나타내는 것으로 오용되게 되어, 부당한 결과가 나오게 된다. 따라서, 극성 정보를 포함하지 않고, 강한 감정을 나타내는지에 따라 재구축된 강의어 감성 사전을 이용하여야 보다 정확한 프로그램에 대한 시청자의 생각을 도출할 수 있다. In conclusion, if a general emotion dictionary represented by a + or - value is used through polarity information, the emotion for a specific character is misused as an indication of the attitude toward the program, resulting in an unreasonable result. Therefore, it is possible to derive the opinion of a viewer about a more accurate program by using the reconstructed linguistic dictionary in accordance with whether or not it contains strong polarity information and strong emotion.
강의어 감성 사전은 다음과 같은 기준을 통해 분류될 수 있다.The lecture sentence dictionary can be classified by the following criteria.
표 1과 같이, 감정을 나타내지 않으면 0을, 감정을 나타내지 않지만 긍정적이거나 부정적인 의미를 갖는 단어는 0.125를, 감정을 미약하게 나타내면 0.25를, 감정을 일반적으로 나타내면 0.375를, 흥분했을 때 사용되는 감정 단어는 0.5를, 극도로 흠분햇을 때 사용되는 감정 단어는 0.625를, 몰입했을 때 사용되는 감정 단어는 0.75를, 극도로 몰입했을 때 사용되는 감정 단어는 0.875로 분류될 수 있다. 이러한 강의어 감성 사전 정보는 특정 사용자에 의해 설정될 수 있고, 미리 시청률 예측 장치에 저장되어 있을 수 있다. As shown in Table 1, when the emotion is not expressed, 0 is used, while the word having no positive emotion but having a positive or negative meaning is 0.125, a weak emotion indicates 0.25, a emotion generally indicates 0.375, The emotional word used when immersed is 0.75, and the emotional word used when immersed extremely is 0.875. The emotional word used when immersion is extremely high is 0.625. Such linguistic emotional advance information may be set by a specific user and stored in advance in the audience rating prediction apparatus.
다시 도 2로 돌아가서, 수집한 게시글에 강의어 감성 사전을 적용해 감성지수를 계산하고 나면, 감성지수와 과거 시청률 정보를 기반으로 학습 데이터와 테스트 데이터를 구축할 수 있다(S240, 245). 여기서, 학습 데이터는 인공 신경망 모델을 생성하기 위한 데이터로, 대응되는 시청률 결과 정보를 갖는 데이터이고, 테스트 데이터는 생성된 인공 신경망 모델을 기반으로 최종 예측 시청률을 예측하기 위한 입력 데이터로, 대상 프로그램의 현재 회차의 감성 지수 정보가 될 수 있다.Referring back to FIG. 2, after calculating the emotion index by applying the learner emotion dictionary to the collected posts, the learning data and the test data can be constructed based on the emotion index and the past audience rating information (S240, 245). Here, the learning data is data for generating an artificial neural network model and is data having corresponding audience rating result information. The test data is input data for predicting the final predicted audience rating based on the generated artificial neural network model, It can be the emotion index information of the current turn.
학습 데이터는 대상 프로그램의 이전 회차의 게시글에 대한 감성지수 정보라고 볼 수 있다. 또한, 학습 데이터는 특정 회차의 게시글에 대한 감성지수 정보화 함께, 그에 대응되는 과거 시청률 정보를 확보해야 하기에, 과거 시청률 데이터베이스(204)로부터 이러한 정보를 획득한다. The learning data can be regarded as the emotion index information for the postings of the previous times of the target program. In addition, the learning data acquires such information from the past
그리고는, 과거 회차의 게시글로부터 획득된 감성 지수 정보와 과거 시청률 정보를 입력으로 하여 인공 신경망 모델을 생성한다(S250). 인경 신경망 모델 생성 과정은 이후 상세히 설명한다.Then, the artificial neural network model is generated by inputting the emotion index information and the past audience rating information obtained from the post of the past turn (S250). The process of creating the neural network model will be described in detail later.
인공 신경망 모델을 생성하고 나면, 현재 회차에 대한 게시글로부터 획득되는 감성 지수 정보를 생성된 인공 신경망에 입력으로 넣어, 최종 시청률 예측값을 획득할 수 있다(S255).After generating the artificial neural network model, the emotion index information obtained from the postings for the current times can be input to the generated artificial neural network to obtain the final audience rating predicted value (S255).
도 4는 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법의 시청률 예측을 위해 사용되는 인공 신경망을 개략적으로 설명하기 위한 개념도이다.FIG. 4 is a conceptual diagram for explaining an artificial neural network used for predicting audience ratings of a method of predicting a program audience rating through emotion analysis of a viewer's opinion according to an embodiment of the present invention.
도 4를 참조하면, 시청률 예측 장치는 시청률 예측을 위해 인공지능 분야에서 예측을 위해 일반적으로 사용되는 방법인 인공 신경망 기법을 사용한다. 본 발명의 일 실시예에 따른 시청률 예측 방법에서는, 이러한 인공 신경망을 시청률 예측에 적절하게 적용될 수 있도록, 입력값 및 그에 대한 가중치를 설정하여 사용할 수 있다. 학습 과정을 거쳐 모델을 생성하고, 모델을 통해 최적해, 즉, 시청률을 예측한다. Referring to FIG. 4, the audience rating prediction apparatus uses an artificial neural network technique, which is a method generally used for prediction in the artificial intelligence field, for predicting audience ratings. In the audience rating prediction method according to an embodiment of the present invention, the input values and the weights thereof may be set and used so that the artificial neural network can be appropriately applied to the audience rating prediction. Through the learning process, a model is created, and a model is used to predict an optimal solution, that is, an audience rating.
인공 신경망은 학습 과정을 거쳐, 입력층(410: Input Layer)과 중간층(또는 은닉층(420: Hidden Layer)) 및 출력층(430: Output Layer)를 이용한다. 입력층(410)에 입력되는 입력 값은 대상 프로그램의 이전 회차 시청률 정보 및 분석된 감성 지수 정보를 넣는다. 이때, 과거 2개 또는 3개의 이전 회차 시청률 및 감성 정보가 입력될 수 있는데, 보다 정확한 예측을 위해 더 많은 정보를 입력할 수 있다. 그리고는, 은닉층(420)은 입력층(410)에 입력된 정보에 제 1 가중치를 곱해 산출된 값으로 채워질 수 있다. 그리고는, 은닉층(420)의 값에 제 2 가중치를 곱해 최종 시청률 예측값을 획득할 수 있다. 인공신경망은 분류(Classification) 문제에 더 많이 사용되지만 회귀 분석(Regression)과 함께 예측 분야에서도 자주 쓰인다.The artificial neural network uses an
도 5는 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법의 시청률 예측을 위해 사용되는 인공 신경망에서 수행되는 계산들을 구체적으로 설명하기 위한 도면이다.FIG. 5 is a diagram for describing calculations performed in an artificial neural network used for predicting audience ratings of a program audience rating prediction method through emotion analysis of audience opinion according to an embodiment of the present invention.
도 5를 참조하면, 각각의 노드(node)는 하나의 뉴런(neuron)의 계산 과정을 나타낸 것으로, 하나의 뉴런이 x1, x2, ... 이라는 입력 값이면, 이를 w1, w2, ...라는 가중치(weight)로 받을 수 있고, 이를 통해 y라는 하나의 출력 값(output)이 도출되게 된다.Referring to FIG. 5, each node represents a calculation process of one neuron. If one neuron is an input value of x 1 , x 2 , ..., it is expressed as w 1 , w 2 , ..., so that one output value y is derived.
특히, 도 5에서, ∑ 부분까지의 계산은 로 계산되고, f에 sigmoid가 사용될 수 있다. 이에 따라 출력값은 로 산출될 수 있다.In particular, in Figure 5, the calculations up to the < RTI ID = 0.0 > , And sigmoid can be used for f. Accordingly, . ≪ / RTI >
노드들 간의 가중치와 관련하여, Error Back Propagation 방법에 의해 입력층-은닉층 및 은닉층-출력층의 가충치는 Δw에 의해 지속적으로 변경된다. 이를 표현하면 다음과 같다.With respect to the weight between nodes, the cavitation of the input layer-hidden layer and the hidden layer-output layer is continuously changed by? W by the Error Back Propagation method. This is expressed as follows.
즉, 최초 가중치에 Δw를 더하여 다음 계층의 가중치가 산출되는 구조를 갖는다. That is, the weight of the next layer is calculated by adding? W to the initial weight.
다만, 입력층-은닉층과 은닉층-출력층 사이의 Δw는 약간 다르다. However, Δw between the input layer-hidden layer and the hidden layer-output layer is slightly different.
입력층과 은닉층의 Δw 값은 로 계산되고, 은닉층과 출력층의 Δw 값은 로 계산될 수 있다. 여기서, i는 입력층의 i번째 노드이고, j는 은닉층의 j번째 노드를 나타내며, k는 출력층의 k번째 노드를 나타낸다. 또한, η은 학습률을 나타내고, hj는 은닉층 j번째 노드의 값이고, tk는 k번째 정답을 나타내며, ok는 출력층 k번째 노드의 값을 나타낸다. 이러한 연산을 통해 최초 xi 값으로 이전 회차의 시청률 정보 값 및 분석된 감성 지수 값이 입력되고, 이를 통해 입력층과 은닉층 간의 Δwij 산출하여, wij를 산출하고, 산출된 가중치와 입력 값의 곱들의 합으로 은닉층의 값을 산출하고, 은닉층과 출력층 간의 Δwjk 산출하여, wjk를 산출하고, 산출된 가중치와 은닉 값의 곱을 기반으로 하는 출력 산출 함수를 통해 최종 시청률 예측값을 산출할 수 있다.
The Δw values of the input layer and the hidden layer are And the? W values of the hidden layer and the output layer are Lt; / RTI > Here, i is the ith node of the input layer, j is the jth node of the hidden layer, and k is the kth node of the output layer. In addition, η denotes the learning rate, h j denotes the value of the jth node of the hidden layer, t k denotes the kth correct answer, and o k denotes the value of the kth node of the output layer. Through this calculation, the audience rating information value of the previous turn and the analyzed emotion index value are input to the initial x i value, and Δw ij between the input layer and the hidden layer is calculated to calculate w ij , and the calculated weight value and the input value It can be used to calculate the value of the hidden layer to the sum of the multiplication, and calculating Δw jk between the hidden layer and the output layer calculates the w jk, and calculates the final rating prediction value via the output calculating function according to the calculated weight and a product-based concealment value .
시청률 예측 장치Audience rating prediction device
도 6은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 장치를 개략적으로 나타낸 블록도이다. 도 6에 도시된 바와 같이, 본 발명의 일 실시예에 따른 시청률 예측 장치(600)는 게시글 수집부(610), 감성지수 산출부(620), 인공신경망 모델 생성부(630), 예측 시청률 산출부(640) 및 강의어 감성 사전(650)을 포함할 수 있다. FIG. 6 is a block diagram schematically illustrating an apparatus for predicting program rating through emotion analysis of a viewer's opinion according to an exemplary embodiment of the present invention. Referring to FIG. 6, the audience
도 6을 참조하면, 게시글 수집부(610)는 시청자 게시판의 게시글을 수집한다. 게시글 수집부(610)는 전술한 바와 같이, 네트워크를 통해 접속 가능한 사이트, 카페, 블로그, SNS 내에 게시된 장소로부터 게시글을 수집할 수 있다.Referring to FIG. 6, the bulletin
감성지수 산출부(620)는 게시글에 포함된 어휘를 추출한 후, 추출된 어휘를 기반으로 감성지수를 산출한다. 감성지수 산출부(620)는 해당 게시글의 감성을 분석하기 위해, 게시글과 추출된 어휘는 대응 관계를 고려하여 감성 분석을 수행한다. 이때, 게시글을 분석하여 불필요한 불용어(예컨대, 의미를 부여받지 못하는 조사, 맺음말, 문장 부호 등)를 잘라내고, 의미를 갖는 순수 어휘만을 추출할 수 있다. 그리고는, 추출된 어휘를 기반으로 감성지수를 산출한다. 추출된 어휘 중 강의어 감성 사전(650)에 포함된 어휘에 감성 사전(650)에서 정의하고 있는 감성 지수 값이 부여된다. 감성지수 산출부(620)는 게시글 감성지수의 평균을 게시글의 전체 감성지수로 산출할 수 있다. 이때, 0점은 삭제되고, 번역과정에서 뜻이 없는 것과 중복 단어를 삭제할 수 있다. 이는 특정 도배성 글을 배제하기 위한 것이다. 경우에 따라, 게시글의 감성지수에 임계치를 두어 특정 게시글에 의해 전체 감성지수 값이 편향되는 것을 방지할 수 있다. The emotion
인공신경망 모델 생성부(620)는 감성지수 산출부(620)통해 산출된 감성지수와 과거 시청률 정보를 기반으로 학습 데이터와 테스트 데이터를 구축할 수 있다. 여기서, 학습 데이터는 인공 신경망 모델을 생성하기 위한 데이터로, 대응되는 시청률 결과 정보를 갖는 데이터로써, 대상 프로그램의 이전 회차의 게시글에 대한 감성지수 정보라고 볼 수 있다. 학습 데이터는 특정 회차의 게시글에 대한 감성지수 정보화 함께, 그에 대응되는 과거 시청률 정보를 확보해야 하기에, 과거 시청률 데이터베이스(660)로부터 이러한 정보를 획득한다. 과거 시청률 데이터베이스(660)는 장치 내에 포함될 수도 있고, 외부 장치에 포함될 수도 있다. 인공신경망 모델 생성부(620)는 과거 회차의 게시글로부터 획득된 감성 지수 정보와 과거 시청률 정보를 입력으로 하여 인공 신경망 모델을 생성한다. The artificial neural
예측 시청률 산출부(640)는 현재 회차에 대한 게시글로부터 획득되는 감성 지수 정보를 생성된 인공 신경망에 입력으로 넣어, 최종 시청률 예측값을 획득할 수 있다.
The predictive
시뮬레이션 결과Simulation result
도 7은 본 발명의 일 실시예에 따른 시청자 의견의 감정 분석을 통한 프로그램 시청률 예측 방법에 따른 시청률 예측의 정확도를 나타내기 위한 그래프이다.FIG. 7 is a graph illustrating the accuracy of the audience rating prediction according to the program audience rating prediction method through emotion analysis of audience opinion according to an embodiment of the present invention.
도 7을 참조하면, y축은 시청률을, x축은 대상 프로그램(본 예시에서는 드라마)의 회차를 나타낸다. 여기서, 진한 실선이 예측해야할 시청률이며, 일점쇄선이 본 발명의 따른 예측 방법에 따른 예측값이고, 점선이 베이스라인인 일반 감성 사전을 통해 예측한 방법이다. 시청률을 예측하는데 있어서 중요한 것은 시청률의 등락, 즉, 경향을 잘 예측하는 것인데, 일점쇄선만이 진한 실선을 잘 따르고 있다는 것을 확인할 수 있다. 즉, 예를 들어, 118회에서 시청률이 급감하고 있는데, 일점쇄선만이 급감하는 시청률의 경향을 잘 따르고 있는 것을 알 수 있다. Referring to FIG. 7, the y-axis shows the audience rating, and the x-axis shows the turn of the target program (drama in this example). Here, the dark solid line is the predicted audience rating, the one-dot chain line is the predicted value according to the predictive method according to the present invention, and the dotted line is the baseline predicted through the general emotional dictionary. The important thing in predicting the audience rating is to predict the tendency of the audience to fluctuate, that is, the tendency, and it can be confirmed that only the one-dot chain line follows the thick solid line. That is, for example, in the 118th, the audience rate is rapidly decreasing, but it can be seen that only the one-dot chain line follows the tendency of the audience rate to decrease rapidly.
두 그래프간의 경향이 유사함을 나타내는 상관계수라는 지표가 있는데, 상관계수는 -1~1의 범위를 갖고, 가까울수록 실제 시청률과 유사함을 뜻한다. 강의어 감성 사전을 이용할 경우, 상관계수가 0.7을 넘고(통상적으로, 0.7이 넘으면 비교하는 대상, 즉 실제 시청률과 강한 관계가 있다고 말할 수 있음), 실제 시청률과의 오차를 나타내는 지수도 가장 낮게 나왔다.
There is an index of the correlation coefficient indicating that the trends between the two graphs are similar. The correlation coefficient has a range of -1 to 1, which means that the closer the similarity is to the actual audience rating. When using the linguistic emotional dictionary, the correlation coefficient is more than 0.7 (normally, when it is more than 0.7, it is said that there is a strong relation with the actual audience rating), and the index showing the error with the actual audience rating is also lowest .
이상 도면 및 실시예를 참조하여 설명하였지만, 본 발명의 보호범위가 상기 도면 또는 실시예에 의해 한정되는 것을 의미하지는 않으며 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the inventions as defined by the following claims It will be understood that various modifications and changes may be made thereto without departing from the spirit and scope of the invention.
Claims (16)
대상 프로그램에 대한 복수 개의 회차에 대응되는 시청자의 의견이 포함된 게시글을 수집하는 단계;
상기 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하는 단계;
상기 산출되는 감성지수와 적어도 하나의 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하는 단계; 및
상기 산출되는 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인공신경망 모델에 입력하여 최종 예측 시청률 값을 산출하는 단계를 포함하며,
상기 감성지수 산출 단계는
상기 게시글에 포함된 어휘에 강의어 감성 사전 - 상기 강의어 감성 사전은 특정 값 이상의 강한 감정을 나타내는 단어를 중심으로 재구축한 감성 사전을 의미함 - 을 이용하여 감정지수를 산출하는 단계를 포함하고,
상기 강의어 감성 사전은 감정의 긍정 및 부정 여부와 관련 없이, 감정이 나타나는 정도를 기반으로 재구축된 감성 사전인 것을 특징으로 하는 프로그램의 시청률 예측 방법.A method for predicting an audience rating of a target program,
Collecting a post including comments of a viewer corresponding to a plurality of times of the target program;
Calculating an emotion index based on the vocabularies included in the collected posts;
Constructing an artificial neural network model by constructing learning data based on the calculated emotion index and at least one past audience rating information; And
And inputting test data configured based on the calculated emotion index to the artificial neural network model to calculate a final predicted audience rating value,
The emotion index calculating step
The linguistic emotion dictionary for the vocabulary included in the bulletin, and the linguistic emotion dictionary for the linguistic emotion dictionary for the sentence, the emotion index is calculated using the emotional dictionary reconstructed around the word indicating strong emotion of a certain value or more ,
Wherein the linguistic dictionary of the lecture is a reconstructed emotional dictionary based on a degree of emotion, irrespective of whether the emotion is affirmative or negative.
상기 학습 데이터는 상기 대상 프로그램의 과거 회차 게시글로부터 산출된 감성지수를 포함하여 구성되고,
상기 테스트 데이터는 상기 대상 프로그램의 현재 회차 게시글로부터 산출된 감성지수를 포함하여 구성되는 것을 특징으로 하는 프로그램의 시청률 예측 방법.The method according to claim 1,
Wherein the learning data includes an emotion index calculated from past recurring posts of the target program,
Wherein the test data includes an emotion index calculated from a current time series of the target program.
상기 인공신경망은 학습을 통해 모델을 생성하고, 생성된 모델을 이용하여 최적 해를 예측하는 기법으로,
적어도 두 개의 과거 회차의 시청률 값과 대응하는 감성지수를 입력층에 입력하고, 상기 입력층 변수에 제 1 가중치를 기반으로 은닉층의 변수를 산출하며, 상기 은닉층 변수에 제 2 가중치를 곱하여 최종 출력층인 예측 시청률 값을 산출하는 것을 특징으로 하는 프로그램의 시청률 예측 방법.The method according to claim 1,
The artificial neural network generates a model through learning and predicts an optimal solution using the generated model.
Inputting a rating value corresponding to an audience rating value of at least two past ratings into an input layer, calculating a variable of the hidden layer based on the first weight on the input layer variable, multiplying the hidden variable by a second weight, And the predicted audience rating value is calculated.
(여기서, i는 입력층의 i번째 노드, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정되는 것을 특징으로 하는 프로그램의 시청률 예측 방법.6. The apparatus of claim 5, wherein the first weight
(Where, i is the i-th node of the input layers, j is the j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j are, t k value (output) of the hidden layer j-th node k < th > (K) is a value of the k-th node of the output layer, and k is an output of the k-th node of the output layer.
(여기서, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정되는 것을 특징으로 하는 프로그램의 시청률 예측 방법.6. The apparatus of claim 5, wherein the second weight
(Where, j is a j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j is the value of hidden layer j-th node (output), t k is the k-th answer, o k is output layer k-th node, Of the program. ≪ Desc / Clms Page number 20 >
대상 프로그램에 대한 복수 개의 회차에 대응 되는 시청자의 의견이 포함된 게시글을 수집하는 게시글 수집부;
상기 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하는 감성지수 산출부;
상기 산출된 감성지수와 적어도 하나의 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하는 인공신경망 모델 생성부; 및
상기 산출된 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인공신경망 모델에 입력하여 최종 예측 시청률 값을 산출하는 예측 시청률 산출부를 포함하며,
상기 감성지수 산출부는
상기 게시글에 포함된 어휘에 강의어 감성 사전 - 상기 강의어 감성 사전은 특정 값 이상의 강한 감정을 나타내는 단어를 중심으로 재구축한 감성 사전을 의미함 - 을 이용하여 감정지수를 산출하며,
상기 강의어 감성 사전은 감정의 긍정 및 부정 여부와 관련 없이, 감정이 나타나는 정도를 기반으로 재구축된 감성 사전인 것을 특징으로 하는 프로그램의 시청률 예측 장치.An audience rating prediction apparatus of a target program,
A posting collecting unit for collecting postings including opinions of viewers corresponding to a plurality of times of the target program;
An emotion index calculating unit for calculating an emotion index based on a vocabulary included in the collected posts;
An artificial neural network model generation unit configured to construct learning data based on the calculated emotion index and at least one past audience rating information to generate an artificial neural network model; And
And inputting the test data configured based on the calculated emotion index into the artificial neural network model to calculate a final predicted audience rating value,
The emotion index calculating unit
The emotion index is calculated using the lexical emotion dictionary in the above-mentioned vocabulary, and the linguistic emotion dictionary in the lecture refers to the emotion dictionary reconstructed based on the word indicating a strong emotion of a certain value or more.
Wherein the linguistic dictionary of the lecture is a reconstructed emotional dictionary based on a degree of emotion, irrespective of positive or negative affects of the lecture.
상기 학습 데이터는 상기 대상 프로그램의 과거 회차 게시글로부터 산출된 감성지수를 포함하여 구성되고,
상기 테스트 데이터는 상기 대상 프로그램의 현재 회차 게시글로부터 산출된 감성지수를 포함하여 구성되는 것을 특징으로 하는 프로그램의 시청률 예측 장치.9. The method of claim 8,
Wherein the learning data includes an emotion index calculated from past recurring posts of the target program,
Wherein the test data includes an emotion index calculated from a current time series of the target program.
상기 인공신경망은 학습을 통해 모델을 생성하고, 생성된 모델을 이용하여 최적 해를 예측하는 기법으로,
적어도 두 개의 과거 회차의 시청률 값과 대응하는 감성지수를 입력층에 입력하고, 상기 입력층 변수에 제 1 가중치를 기반으로 은닉층의 변수를 산출하며, 상기 은닉층 변수에 제 2 가중치를 곱하여 최종 출력층인 예측 시청률 값을 산출하는 것을 특징으로 하는 프로그램의 시청률 예측 장치.9. The method of claim 8,
The artificial neural network generates a model through learning and predicts an optimal solution using the generated model.
Inputting a rating value corresponding to an audience rating value of at least two past ratings into an input layer, calculating a variable of the hidden layer based on the first weight on the input layer variable, multiplying the hidden variable by a second weight, And calculates a predicted audience rating value.
(여기서, i는 입력층의 i번째 노드, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정되는 것을 특징으로 하는 프로그램의 시청률 예측 장치.13. The apparatus of claim 12, wherein the first weight
(Where, i is the i-th node of the input layers, j is the j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j are, t k value (output) of the hidden layer j-th node k < th > (K) denotes a value of the k-th node of the output layer, and k denotes an output value of the k-th node of the output layer.
(여기서, j는 은닉층의 j번째 노드, k는 출력층의 k번째 노드, η는 학습률, hj는 은닉층 j번째 노드의 값(output), tk는 k번째 정답, ok는 출력층 k번째 노드의 값(output)을 의미함)에 의해 결정되는 것을 특징으로 하는 프로그램의 시청률 예측 장치.13. The apparatus of claim 12, wherein the second weight
(Where, j is a j-th node in the hidden layer, k is the k-th node of the output layer, η is a learning rate, h j is the value of hidden layer j-th node (output), t k is the k-th answer, o k is output layer k-th node, (The output of the program).
온라인 상에서 발생하는 대상 프로그램에 대한 복수 개의 회차에 대응되는 사용자의 의견을 포함하는 게시글을 게시하는 복수의 웹 서버;
상기 게시글을 수집하고, 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하여, 상기 산출된 감성지수와 적어도 하나의 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하고, 상기 산출된 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인공신경망 모델에 입력하여 최종 예측 시청률 값을 산출하는 시청률 예측 장치를 포함하며,
상기 감성지수 산출은
상기 게시글에 포함된 어휘에 강의어 감성 사전 - 상기 강의어 감성 사전은 특정 값 이상의 강한 감정을 나타내는 단어를 중심으로 재구축한 감성 사전을 의미함 - 을 이용하여 감정지수를 산출하고,
상기 강의어 감성 사전은 감정의 긍정 및 부정 여부와 관련 없이, 감정이 나타나는 정도를 기반으로 재구축된 감성 사전인 것을 특징으로 하는 프로그램의 시청률 예측 시스템.A system for predicting audience ratings of a target program,
A plurality of web servers for posting a post including a user's opinion corresponding to a plurality of times of occurrence of a target program occurring on-line;
Generating an artificial neural network model by constructing learning data based on the calculated emotion index and at least one past audience rating information, And an audience prediction apparatus for inputting test data configured based on the calculated emotion index into the artificial neural network model to calculate a final predicted audience rating value,
The emotion index calculation
The emotion index is calculated using the lexical emotion dictionary in the vocabulary included in the above-mentioned lecture emotional dictionary, which means the emotional dictionary reconstructed based on the word indicating strong emotion of a certain value or more,
Wherein the linguistic dictionary of the lecture is a reconstructed emotional dictionary based on a degree of emotion, irrespective of whether the emotion is affirmative or negative.
대상 프로그램에 대한 복수 개의 회차에 대응되는 시청자의 의견이 포함된 게시글을 수집하는 단계;
상기 수집된 게시글에 포함된 어휘를 기반으로 감성지수를 산출하는 단계;
상기 산출된 감성지수와 적어도 하나의 과거 시청률 정보를 기반으로 학습 데이터를 구성하여 인공신경망 모델을 생성하는 단계; 및
상기 산출된 감성 지수를 기반으로 구성된 테스트 데이터를 상기 인 공신경망 모델에 입력하여 최종 예측 시청률 값을 산출하는 단계를 구현하는 명령어를 포함하며,
상기 감성지수 산출 단계는
상기 게시글에 포함된 어휘에 강의어 감성 사전 - 상기 강의어 감성 사전은 특정 값 이상의 강한 감정을 나타내는 단어를 중심으로 재구축한 감성 사전을 의미함 - 을 이용하여 감정지수를 산출하는 단계를 포함하고,
상기 강의어 감성 사전은 감정의 긍정 및 부정 여부와 관련 없이, 감정이 나타나는 정도를 기반으로 재구축된 감성 사전인 것을 특징으로 하는 프로그램의 시청률 예측 방법을 구현하는 프로그램이 기록된 기록 매체.A computer-readable recording medium on which a program for predicting an audience rating of a target program is recorded,
Collecting a post including comments of a viewer corresponding to a plurality of times of the target program;
Calculating an emotion index based on the vocabularies included in the collected posts;
Constructing an artificial neural network model by constructing learning data based on the calculated emotion index and at least one past audience rating information; And
And inputting test data configured based on the calculated emotion index to the neural network model to calculate a final predicted audience rating value,
The emotion index calculating step
The linguistic emotion dictionary for the vocabulary included in the bulletin, and the linguistic emotion dictionary for the linguistic emotion dictionary for the sentence means calculating the emotion index using the emotional dictionary reconstructed around the word indicating strong emotion of a certain value or more ,
Wherein the linguistic emotional dictionary of the lecture is a reconstructed emotional dictionary based on the degree of appearance of emotions regardless of whether the emotions are affirmative or negative.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140097479A KR101575779B1 (en) | 2014-07-30 | 2014-07-30 | Program rating prediction method and apparatus, and system based on sentiment analysis of viewers comments |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140097479A KR101575779B1 (en) | 2014-07-30 | 2014-07-30 | Program rating prediction method and apparatus, and system based on sentiment analysis of viewers comments |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101575779B1 true KR101575779B1 (en) | 2015-12-08 |
Family
ID=54873065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140097479A KR101575779B1 (en) | 2014-07-30 | 2014-07-30 | Program rating prediction method and apparatus, and system based on sentiment analysis of viewers comments |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101575779B1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993544A (en) * | 2017-12-29 | 2019-07-09 | 北京京东尚科信息技术有限公司 | Data processing method, system, computer system and computer readable storage medium |
KR20190136337A (en) * | 2018-05-30 | 2019-12-10 | 가천대학교 산학협력단 | Social Media Contents Based Emotion Analysis Method, System and Computer-readable Medium |
CN113821627A (en) * | 2020-06-17 | 2021-12-21 | 北京瀚海云星科技有限公司 | Neural network, method, device and program for predicting IP work index |
CN113821626A (en) * | 2020-06-17 | 2021-12-21 | 北京瀚海云星科技有限公司 | Neural network and method for predicting IP work index according to multi-source social short text |
US11743524B1 (en) | 2023-04-12 | 2023-08-29 | Recentive Analytics, Inc. | Artificial intelligence techniques for projecting viewership using partial prior data sources |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010130585A (en) * | 2008-11-28 | 2010-06-10 | Video Research:Kk | Viewer rating prediction apparatus and program |
-
2014
- 2014-07-30 KR KR1020140097479A patent/KR101575779B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010130585A (en) * | 2008-11-28 | 2010-06-10 | Video Research:Kk | Viewer rating prediction apparatus and program |
Non-Patent Citations (1)
Title |
---|
이경민, 인관호, 김응모, '오피니언 마이닝을 이용한 예상 시청률 분석', 한국정보과학회 2013년 한국컴퓨터종합학술대회 논문집, 2013년 6월, pp. 365-367* |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993544A (en) * | 2017-12-29 | 2019-07-09 | 北京京东尚科信息技术有限公司 | Data processing method, system, computer system and computer readable storage medium |
KR20190136337A (en) * | 2018-05-30 | 2019-12-10 | 가천대학교 산학협력단 | Social Media Contents Based Emotion Analysis Method, System and Computer-readable Medium |
KR102111672B1 (en) | 2018-05-30 | 2020-05-15 | 가천대학교 산학협력단 | Social Media Contents Based Emotion Analysis Method, System and Computer-readable Medium |
CN113821627A (en) * | 2020-06-17 | 2021-12-21 | 北京瀚海云星科技有限公司 | Neural network, method, device and program for predicting IP work index |
CN113821626A (en) * | 2020-06-17 | 2021-12-21 | 北京瀚海云星科技有限公司 | Neural network and method for predicting IP work index according to multi-source social short text |
US11743524B1 (en) | 2023-04-12 | 2023-08-29 | Recentive Analytics, Inc. | Artificial intelligence techniques for projecting viewership using partial prior data sources |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Roberts et al. | Investigating the emotional responses of individuals to urban green space using twitter data: A critical comparison of three different methods of sentiment analysis | |
Almansor et al. | Survey on intelligent chatbots: State-of-the-art and future research directions | |
Desai et al. | Techniques for sentiment analysis of Twitter data: A comprehensive survey | |
CN107220352A (en) | The method and apparatus that comment collection of illustrative plates is built based on artificial intelligence | |
Sharma et al. | A document-level sentiment analysis approach using artificial neural network and sentiment lexicons | |
KR101575779B1 (en) | Program rating prediction method and apparatus, and system based on sentiment analysis of viewers comments | |
Sampath et al. | Data set creation and empirical analysis for detecting signs of depression from social media postings | |
Herzig et al. | Predicting customer satisfaction in customer support conversations in social media using affective features | |
CN108021660B (en) | Topic self-adaptive microblog emotion analysis method based on transfer learning | |
Bilal et al. | Profiling users’ behavior, and identifying important features of review “helpfulness” | |
Al-Qurishi et al. | User profiling for big social media data using standing ovation model | |
Pekar et al. | Forecasting consumer spending from purchase intentions expressed on social media | |
Eliacik et al. | User-weighted sentiment analysis for financial community on Twitter | |
Kawintiranon et al. | PoliBERTweet: a pre-trained language model for analyzing political content on twitter | |
Gandhe et al. | Sentiment analysis of Twitter data with hybrid learning for recommender applications | |
Ogudo et al. | Sentiment analysis application and natural language processing for mobile network operators’ support on social media | |
Chaparro et al. | Sentiment analysis of social network content to characterize the perception of security | |
Joshi et al. | Modeling and detecting change in user behavior through his social media posting using cluster analysis | |
Wei et al. | Using network flows to identify users sharing extremist content on social media | |
Haripriya et al. | Real time analysis of top trending event on Twitter: Lexicon based approach | |
CN113704459A (en) | Online text emotion analysis method based on neural network | |
JP2019153013A (en) | Program, device and method for estimating influence of empathy of content on user | |
Zhang et al. | Probabilistic verb selection for data-to-text generation | |
Elalfy et al. | Predicting best answer in community questions based on content and sentiment analysis | |
Kovilpatti et al. | Analyzing social media data for understanding students learning experiences and predicting their psychological pressure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180917 Year of fee payment: 4 |