KR20200139965A - System for video channel diagnostics and method thereof - Google Patents

System for video channel diagnostics and method thereof Download PDF

Info

Publication number
KR20200139965A
KR20200139965A KR1020190066537A KR20190066537A KR20200139965A KR 20200139965 A KR20200139965 A KR 20200139965A KR 1020190066537 A KR1020190066537 A KR 1020190066537A KR 20190066537 A KR20190066537 A KR 20190066537A KR 20200139965 A KR20200139965 A KR 20200139965A
Authority
KR
South Korea
Prior art keywords
channel
data
video content
video
content
Prior art date
Application number
KR1020190066537A
Other languages
Korean (ko)
Inventor
강미나
김만준
Original Assignee
빅펄 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 빅펄 주식회사 filed Critical 빅펄 주식회사
Priority to KR1020190066537A priority Critical patent/KR20200139965A/en
Publication of KR20200139965A publication Critical patent/KR20200139965A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25816Management of client data involving client authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/443OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
    • H04N21/4431OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB characterized by the use of Application Program Interface [API] libraries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

The present invention relates to a method for diagnosing a video channel, including: (a) a step of performing user authentication through a video content platform that provides a channel for sharing the video content among a plurality of user terminals, when channel diagnosis request information is received from the user terminal; (b) a step of performing scraping on at least one channel operated by the user terminal using the user authentication information to obtain raw channel data, when the user authentication is completed; (c) a step of processing the raw channel data into image content data obtained by extracting text information from the moving image content and user response data for the moving image content and storing the data in a database; (d) a step of calculating a channel analysis result for video content for each channel through a content analysis model which performs index analysis using the video content data and user response data; and (e) a step of providing channel growth guide data of content for inducing a user response for each channel based on the calculated channel analysis result.

Description

동영상 채널 진단 시스템 및 그 방법{SYSTEM FOR VIDEO CHANNEL DIAGNOSTICS AND METHOD THEREOF}Video channel diagnosis system and its method {SYSTEM FOR VIDEO CHANNEL DIAGNOSTICS AND METHOD THEREOF}

본 발명은 동영상 콘텐츠의 내용과 사용자 반응에 대한 객관적인 분석을 수행하는 동영상 채널 진단 시스템 및 그 방법에 관한 것이다.The present invention relates to a video channel diagnosis system and method for performing objective analysis on the content of video content and user reaction.

최근 인터넷 등의 통신망을 통하여 UCC(User Created Contents)와 같은 동영상 콘텐츠 서비스를 하는 웹 사이트가 널리 활성화되고 있다. 기존에는 불특정 다수에게 일방적으로 정보를 전달하는 TV, 신문, 라디오, 잡지 등의 매스미디어(Mass Media)가 주를 이루었으나, 정보통신 기술의 발전으로 인터넷, 스마트폰 등을 활용하여 쌍방향으로 소통할 수 있는 뉴미디어(New Media))가 등장하면서 1인 미디어가 발전하고 있다.Recently, web sites that provide video content services such as User Created Contents (UCC) through communication networks such as the Internet have been widely activated. In the past, mass media such as TV, newspaper, radio, and magazines that unilaterally delivered information to an unspecified number of people were dominated. However, with the development of information and communication technology, interactive communication is possible using the Internet and smartphones. With the advent of new media), single-person media is developing.

여기서, 1인 미디어는 개인이 정보를 전달하는 매체로서 다양한 콘텐츠를 직접 생산하고, 공유할 수 있는 새로운 형태의 커뮤니케이션 플랫폼이며, 새로운 형태의 커뮤니케이션 채널을 의미한다. 1인 동영상 창작자 또는 크리에이터의 시장 규모가 커지면서 동영상의 제작 지원과 배급을 담당하고, 다양한 채널에서 수익을 창출하는 새로운 산업분야가 등장하고 있다. Here, one-person media is a new type of communication platform through which individuals can directly produce and share various contents as a medium for transmitting information, and refers to a new type of communication channel. As the market size of single-person video creators or creators grows, a new industrial field is emerging that is responsible for video production support and distribution, and generates revenue from various channels.

이러한 1인 미디어 산업은 다중 채널 네트워크(Multi-Channel Networks, MCN)의 형태로 발전하고 있으며, 유튜브, 아프리카TV, 트위치 등의 인터넷 기반 동영상 콘텐츠 플랫폼을 제공한다. 국내에서는 유튜브, 아프리카TV, 다음 TV팟(또는 카카오TV), V라이브 등이 있으며, 소규모 인터넷 개인방송사들도 다수 존재한다.This one-person media industry is developing in the form of Multi-Channel Networks (MCN) and provides Internet-based video content platforms such as YouTube, Africa TV, and Twitch. In Korea, there are YouTube, Afreeca TV, Daum TV pod (or Kakao TV), and V Live, and there are many small Internet private broadcasters.

크리에이터는 창의적인 동영상 콘텐츠를 제작하여 유튜브 등의 동영상 콘텐츠 플랫폼에 업로드하여 구독자를 확보하고, 동영상 콘텐츠 플랫폼 사업자와 광고 수익을 공유하는 직업군이다. 이러한 크리에이터들은 먹방(먹는 방송), 겜방(게임 중계방송), 뷰티, 쿡방(요리 방송) 등 지상파 방송에서 다루지 않았거나 다루기 힘들었던 영역을 콘텐츠화 하여 1020세대에게 폭발적인 반응을 이끌어 내고 있다.Creators are professions that create creative video content and upload it to video content platforms such as YouTube to secure subscribers and share advertising revenue with video content platform operators. These creators are eliciting explosive reactions to the 1020 generations by converting areas that were not covered or difficult to handle in terrestrial broadcasts, such as eating room (eating broadcast), game room (game broadcast), beauty, and cook room (cooking broadcast).

동영상 콘텐츠 플랫폼 사업자들은 유망한 크리에이터들을 발굴하여 지원을 하거나, 유명 크리에이터들과 협업하여 각종 광고, 유통 등의 수익 창출을 하면서 새로운 산업 형태로 부상하고 있다. 최근에는 MD 상품제작, 온라인 쇼핑몰 개설, 엔터테인먼트 등 부가가치를 창출하는 쪽으로 사업영역으로 확대되고 있다.Video content platform operators are emerging as a new industrial form by discovering and supporting promising creators, or by collaborating with famous creators to create various advertisements and distributions. In recent years, it is expanding into business areas to create added value such as MD product production, online shopping mall opening, and entertainment.

이와 같이, 누구나 제약 없이 자유롭게 동영상 콘텐츠를 만들고 유통, 소비할 수 있는 환경이 마련되면서, 크리에이터의 수나 개설 채널의 수가 기하급수적으로 늘어나고 있다. As described above, as an environment in which anyone can freely create, distribute, and consume video content without restrictions, the number of creators and opening channels is increasing exponentially.

크리에이터 중심의 콘텐츠 생산으로 발생될 수 있는 가장 큰 문제는 콘텐츠의 질적 수준 하락이나 채널 구독자수 하락으로 인한 수익 창출 제한 등이 있다.The biggest problem that can arise from creator-centered content production is the decline in the quality of the content or the reduction in the number of subscribers to the channel, resulting in restrictions on revenue generation.

그러나 현재 동영상 콘텐츠를 제작하기 위해 크리에이터에 대한 트레이닝 및 양성 기술들은 제공되고 있지만, 크리에이터들이 보유하고 있는 채널들, 각 채널에 업로드한 동영상 콘텐츠들에 대해 객관적이고 정량적인 진단이 이루어지지 않고 있다. 따라서, 유명 크리에이터들을 제외한 나머지 크리에이터들은 자신의 채널이나 동영상 콘텐츠에 대한 현재 상황을 파악할 수 없어 콘텐츠의 질적 향상이나 수익 창출이 어렵다는 문제점이 있다.However, training and training techniques for creators are currently being provided to produce video content, but objective and quantitative diagnosis has not been made on the channels that the creators have and the video content uploaded to each channel. Accordingly, creators other than famous creators cannot grasp the current status of their own channels or video content, and thus, it is difficult to improve the quality of content or generate revenue.

대한민국 등록특허 제10-1429446 호(발명의 명칭 : 콘텐츠 창작 시스템 및 그 방법)Korean Patent Registration No. 10-1429446 (Name of invention: Content creation system and method thereof)

본 발명은 전술한 문제점을 해결하기 위하여, 본 발명의 일 실시예에 따라 사용자 단말의 요청에 따라 사용자가 보유하고 있는 적어도 하나 이상의 채널에 업로드된 동영상 콘텐츠들을 영상 내용뿐만 아니라 사용자 반응을 나타내는 지표 데이터들을 이용하여 객관적이고 정량적으로 분석하여 채널 분석 결과를 제공할 수 있도록 하는 것에 목적이 있다.In order to solve the above-described problem, according to an embodiment of the present invention, in accordance with an embodiment of the present invention, video contents uploaded to at least one channel held by a user at a request of a user terminal, as well as video contents, are index data indicating user reaction. The purpose is to provide the channel analysis results by objective and quantitative analysis using the channels.

또한, 본 발명은 채널 분석 결과에 기초하여 사용자 반응을 더욱 유도하기 위한 콘텐츠의 기획, 제작, 편집, 노출 정보 등에 대한 채널 성장 가이드 데이터를 제공할 수 있도록 하는 것에 목적이 있다. In addition, an object of the present invention is to provide channel growth guide data for content planning, production, editing, exposure information, etc. to further induce user reaction based on the channel analysis result.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problem to be achieved by the present embodiment is not limited to the technical problem as described above, and other technical problems may exist.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서 본 발명의 일 실시예에 따른 동영상 채널 진단 방법은, 사용자 단말에 의해 적어도 하나의 채널 상에 배포된 동영상 콘텐츠를 분석하는 동영상 채널 진단 시스템에 의해 수행되는 동영상 채널 진단 방법에 있어서, a) 상기 사용자 단말로부터 채널 진단 요청 정보가 수신되면, 복수의 사용자 단말들 간에 상기 동영상 콘텐츠를 공유하기 위한 채널을 제공하는 동영상 콘텐츠 플랫폼을 통해 사용자 인증을 수행하는 단계; b) 상기 사용자 인증이 완료되면, 상기 사용자 인증 정보를 이용하여 상기 사용자 단말이 운영하는 적어도 하나 이상의 채널에 대한 스크래핑(Scraping)을 수행하여 원시 채널 데이터(Raw channel data)를 획득하는 단계; c) 상기 원시 채널 데이터에 포함된 상기 동영상 콘텐츠에서 텍스트 정보를 추출한 영상 내용 데이터와 상기 동영상 콘텐츠에 대한 조회 정보, 노출 정보, 시청 패턴 정보를 포함한 사용자 반응 데이터로 생성하여 데이터베이스에 저장하는 단계; d) 상기 영상 내용 데이터와 사용자 반응 데이터를 이용하여 지표 분석을 수행하는 콘텐츠 분석 모델을 통해 채널별 동영상 콘텐츠에 대한 채널 분석 결과를 산출하는 단계; 및 e) 상기 산출된 채널 분석 결과에 기초하여 채널별 사용자 반응 유도를 위한 콘텐츠의 기획, 제작, 편집, 노출 정보를 포함한 채널 성장 가이드 데이터를 제공하는 단계를 포함하되, 상기 콘텐츠 분석 모델은, 상기 영상 내용 데이터에 대한 콘텐츠 분류를 수행하고, 상기 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계를 분석하여 상기 동영상 콘텐츠별 사용자 반응에 따른 시청 패턴에 대한 채널 분석 결과를 제공하는 것이다.As a technical means for achieving the above technical problem, the video channel diagnosis method according to an embodiment of the present invention is performed by a video channel diagnosis system that analyzes video content distributed on at least one channel by a user terminal. A method for diagnosing a video channel, the method comprising the steps of: a) when receiving channel diagnosis request information from the user terminal, performing user authentication through a video content platform that provides a channel for sharing the video content between a plurality of user terminals; b) when the user authentication is complete, performing scraping on at least one channel operated by the user terminal using the user authentication information to obtain raw channel data; c) generating video content data obtained by extracting text information from the video content included in the raw channel data, user response data including inquiry information, exposure information, and viewing pattern information for the video content and storing it in a database; d) calculating a channel analysis result for video content for each channel through a content analysis model that performs index analysis using the video content data and user response data; And e) providing channel growth guide data including planning, production, editing, and exposure information for inducing user reactions for each channel based on the calculated channel analysis result, wherein the content analysis model comprises: Content classification is performed on video content data, and a correlation between the video content data and user response data is analyzed to provide a channel analysis result for a viewing pattern according to a user response for each video content.

또한, 본 발명의 다른 일 실시예에 따른 동영상 채널 진단 시스템은, 사용자 단말에 의해 적어도 하나의 채널 상에 배포된 동영상 콘텐츠를 분석하는 동영상 채널 진단 시스템에 있어서, 동영상 채널 진단 방법을 수행하기 위한 프로그램이 기록된 메모리; 및 상기 프로그램을 실행하기 위한 프로세서를 포함하며, 상기 프로세서는, 상기 프로그램의 실행에 의해, 상기 사용자 단말로부터 채널 진단 요청 정보가 수신되면, 복수의 사용자 단말들 간에 상기 동영상 콘텐츠를 공유하기 위한 채널을 제공하는 동영상 콘텐츠 플랫폼을 통해 사용자 인증을 수행하고, 상기 사용자 인증이 완료되면, 상기 사용자 인증 정보를 이용하여 상기 사용자 단말이 관리하는 적어도 하나 이상의 채널에 대한 스크래핑(Scraping)을 수행하여 원시 채널 데이터(Raw channel data)를 획득하고, 상기 원시 채널 데이터에 포함된 상기 동영상 콘텐츠에서 텍스트 정보를 추출한 영상 내용 데이터와 상기 동영상 콘텐츠에 대한 조회 정보, 노출 정보, 시청 패턴 정보를 포함한 사용자 반응 데이터로 생성하여 데이터베이스에 저장하고, 상기 영상 내용 데이터와 사용자 반응 데이터를 이용하여 지표 분석을 수행하는 콘텐츠 분석 모델을 통해 채널별 동영상 콘텐츠에 대한 채널 분석 결과를 산출하고, 상기 산출된 채널 분석 결과에 기초하여 사용자 반응 유도를 위한 콘텐츠의 기획, 제작, 편집, 노출 정보를 포함한 채널 성장 가이드 데이터를 제공하되, 상기 콘텐츠 분석 모델은, 상기 영상 내용 데이터에 대한 콘텐츠 분류를 수행하고, 상기 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계를 분석하여 상기 동영상 콘텐츠별 사용자 반응에 따른 시청 패턴에 대한 채널 분석 결과를 제공하는 것이다.In addition, a video channel diagnosis system according to another embodiment of the present invention is a program for performing a video channel diagnosis method in a video channel diagnosis system that analyzes video content distributed on at least one channel by a user terminal This recorded memory; And a processor for executing the program, wherein, when channel diagnosis request information is received from the user terminal by execution of the program, the processor provides a channel for sharing the video content between a plurality of user terminals. User authentication is performed through the provided video content platform, and when the user authentication is completed, scraping is performed on at least one channel managed by the user terminal using the user authentication information, and raw channel data ( Raw channel data), extracting text information from the video content included in the raw channel data, and generating user response data including inquiry information, exposure information, and viewing pattern information for the video content Stored in the image content data and user response data, the channel analysis result of the video content for each channel is calculated through a content analysis model that performs indicator analysis using the image content data and user response data, and induces a user response based on the calculated channel analysis result Provides channel growth guide data including planning, production, editing, and exposure information for content, wherein the content analysis model performs content classification on the video content data, and correlation between the video content data and user response data By analyzing the relationship, a channel analysis result for the viewing pattern according to the user reaction for each video content is provided.

전술한 본 발명의 과제 해결 수단에 의하면, 사용자는 자신이 운영하는 적어도 하나 이상의 채널에 업로드한 동영상 콘텐츠에 대한 부족한 부분을 확인하고, 동영상 콘텐츠 플랫폼 내 타 채널의 동영상 콘텐츠와의 비교를 통해 객관적으로 현재 자신의 채널 상황을 통계적으로 분석할 수 있다. 또한, 사용자는 채널 성장 가이드 데이터를 이용하여 콘텐츠의 질적 향상 및 그로 인한 시청자 수의 증대로 인한 수익 창출을 도모할 수 있다. According to the above-described problem solving means of the present invention, a user checks a lack of video content uploaded to at least one channel operated by the user, and objectively compares it with video content of other channels in the video content platform. You can statistically analyze your current channel situation. In addition, the user can use the channel growth guide data to improve the quality of the content and thereby create revenue by increasing the number of viewers.

본 발명은 채널 진단을 요청한 사용자에 대한 동영상 콘텐츠들을 동영상 콘텐츠 플랫폼 내의 다른 동영상 콘텐츠들과의 비교를 통해 콘텐츠의 퀄리티를 평가하고, 시청자들의 반응을 비교 분석할 수 있다.According to the present invention, the quality of the content may be evaluated by comparing the video content for the user who requested the channel diagnosis with other video content in the video content platform, and the reaction of viewers may be compared and analyzed.

도 1은 본 발명의 일 실시예에 따른 동영상 채널 진단 시스템의 전체적인 구성을 설명하는 도면이다.
도 2는 본 발명의 일 실시예에 따른 동영상 채널 진단 시스템의 상세 구성을 설명하는 도면이다.
도 3은 본 발명의 일 실시예에 따른 동영상 채널 진단 방법을 수행하기 위한 프로그램을 설명하는 도면이다.
도 4는 본 발명의 일 실시예에 따른 동영상 채널 진단 방법을 설명하는 순서도이다.
도 5는 본 발명의 일 실시예에 따른 영상 내용 데이터를 설명하는 예시도이다.
도 6은 본 발명의 일 실시예에 따른 단어 토큰화 과정을 설명하는 예시도이다.
도 7은 본 발명의 일 실시예에 따른 영상 내용 데이터의 말뭉치를 이용한 단어 문서 행렬을 설명하는 예시도이다.
도 8은 본 발명의 일 실시예에 따른 콘텐츠 분석 모델을 설명하는 예시도이다.
도 9는 본 발명의 일 실시예에 따른 채널 분석 결과에 대한 예시도이다.
도 10은 본 발명의 일 실시예에 따른 채널 성장 가이드 데이터의 가이드 콘텐츠 제공에 대한 예시도이다.
도 11 및 도 12는 본 발명의 일 실시예에 따른 채널 성장 가이드 데이터에 대한 예시도이다.
1 is a diagram illustrating the overall configuration of a video channel diagnosis system according to an embodiment of the present invention.
2 is a diagram illustrating a detailed configuration of a video channel diagnosis system according to an embodiment of the present invention.
3 is a diagram illustrating a program for performing a video channel diagnosis method according to an embodiment of the present invention.
4 is a flowchart illustrating a method of diagnosing a video channel according to an embodiment of the present invention.
5 is an exemplary diagram illustrating image content data according to an embodiment of the present invention.
6 is an exemplary diagram illustrating a word tokenization process according to an embodiment of the present invention.
7 is an exemplary diagram illustrating a word document matrix using a corpus of image content data according to an embodiment of the present invention.
8 is an exemplary diagram illustrating a content analysis model according to an embodiment of the present invention.
9 is an exemplary diagram for a channel analysis result according to an embodiment of the present invention.
10 is an exemplary diagram for providing guide contents of channel growth guide data according to an embodiment of the present invention.
11 and 12 are exemplary diagrams of channel growth guide data according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement the present invention. However, the present invention may be implemented in various different forms and is not limited to the embodiments described herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and similar reference numerals are assigned to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Throughout the specification, when a part is said to be "connected" to another part, this includes not only "directly connected" but also "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, it means that other components may be further included, and one or more other features, not excluding other components, unless specifically stated to the contrary. It is to be understood that it does not preclude the presence or addition of any number, step, action, component, part, or combination thereof.

본 명세서에서 ‘단말’은 휴대성 및 이동성이 보장된 무선 통신 장치일 수 있으며, 예를 들어 스마트폰, 태블릿 PC 또는 노트북 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치일 수 있다. 또한, ‘단말’은 네트워크를 통해 다른 단말 또는 서버 등에 접속할 수 있는 PC 등의 유선 통신 장치인 것도 가능하다. 또한, 네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. In the present specification, a'terminal' may be a wireless communication device with guaranteed portability and mobility, and may be any kind of handheld-based wireless communication device, such as a smartphone, a tablet PC, or a notebook. In addition, the'terminal' may be a wired communication device such as a PC that can access other terminals or servers through a network. In addition, a network refers to a connection structure in which information exchange is possible between nodes such as terminals and servers, and includes a local area network (LAN), a wide area network (WAN), and the Internet (WWW). : World Wide Web), wired and wireless data networks, telephone networks, wired and wireless television networks, etc.

무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.Examples of wireless data networks include 3G, 4G, 5G, 3rd Generation Partnership Project (3GPP), Long Term Evolution (LTE), World Interoperability for Microwave Access (WIMAX), Wi-Fi, Bluetooth communication, infrared communication, and ultrasound. Communication, Visible Light Communication (VLC), LiFi, etc. are included, but are not limited thereto.

이하의 실시예는 본 발명의 이해를 돕기 위한 상세한 설명이며, 본 발명의 권리 범위를 제한하는 것이 아니다. 따라서 본 발명과 동일한 기능을 수행하는 동일 범위의 발명 역시 본 발명의 권리 범위에 속할 것이다.The following examples are detailed descriptions to aid understanding of the present invention, and do not limit the scope of the present invention. Accordingly, the invention of the same scope performing the same function as the present invention will also belong to the scope of the present invention.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 동영상 채널 진단 시스템의 전체적인 구성을 설명하는 도면이고, 도 2는 본 발명의 일 실시예에 따른 동영상 채널 진단 시스템의 상세 구성을 설명하는 도면이며, 도 3은 본 발명의 일 실시예에 따른 동영상 채널 진단 방법을 수행하기 위한 프로그램을 설명하는 도면이다.1 is a view for explaining the overall configuration of a video channel diagnosis system according to an embodiment of the present invention, Figure 2 is a diagram illustrating a detailed configuration of a video channel diagnosis system according to an embodiment of the present invention, and FIG. Is a diagram illustrating a program for performing a video channel diagnosis method according to an embodiment of the present invention.

도 1 내지 도 3을 참조하면, 동영상 채널 진단 시스템(100)은 통신 모듈(110), 메모리(120), 프로세서(130), 데이터베이스(140) 및 표시 모듈(150)을 포함한다.1 to 3, a video channel diagnosis system 100 includes a communication module 110, a memory 120, a processor 130, a database 140, and a display module 150.

통신 모듈(110)은 통신망과 연동하여 동영상 채널 진단 시스템(100)이 사용자 단말(10), 동영상 콘텐츠 플랫폼(200)과의 송수신 신호를 패킷 데이터 형태로 제공하는 데 필요한 통신 인터페이스를 제공한다. 나아가, 통신 모듈(110)은 사용자 단말로부터 데이터 요청을 수신하고, 이에 대한 응답으로서 데이터를 송신하는 역할을 수행할 수 있다. 또한, 통신 모듈(110)은 동영상 콘텐츠 플랫폼(200)에 데이터 요청을 송신하고, 이에 대한 응답으로서 데이터를 수신하는 역할을 수행할 수 있다. The communication module 110 interworks with a communication network to provide a communication interface necessary for the video channel diagnosis system 100 to provide a transmission/reception signal between the user terminal 10 and the video content platform 200 in the form of packet data. Furthermore, the communication module 110 may perform a role of receiving a data request from a user terminal and transmitting data as a response thereto. Also, the communication module 110 may transmit a data request to the video content platform 200 and receive data as a response thereto.

여기서, 통신 모듈(110)은 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치일 수 있다.Here, the communication module 110 may be a device including hardware and software necessary for transmitting and receiving a signal such as a control signal or a data signal through a wired or wireless connection with another network device.

한편, 사용자 단말(10)은 1인 동영상 창작자 또는 크리에이터가 소지한 단말이고, 동영상 콘텐츠 플랫폼(200)은 다중 채널 네트워크(Multi-Channel Networks, MCN) 서비스를 제공하는 시스템 또는 사업자가 제공하는 유튜브, 아프리카 tv, 트위치, 인스타 그램 등이 될 수 있다. On the other hand, the user terminal 10 is a terminal possessed by a single video creator or creator, and the video content platform 200 is a system providing a multi-channel network (MCN) service or YouTube provided by a business operator, It could be African TV, Twitch, Instagram, etc.

메모리(120)는 동영상 채널 진단 방법을 수행하기 위한 프로그램이 기록된다. 또한, 메모리(120)는 프로세서(130)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행한다. 여기서, 메모리(120)는 휘발성 저장 매체(volatile storage media) 또는 비휘발성 저장 매체(non-volatile storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.In the memory 120, a program for performing a video channel diagnosis method is recorded. Also, the memory 120 performs a function of temporarily or permanently storing data processed by the processor 130. Here, the memory 120 may include a volatile storage medium or a non-volatile storage medium, but the scope of the present invention is not limited thereto.

프로세서(130)는 동영상 채널 진단 방법을 수행하기 위한 프로그램을 실행함으로써 동영상 콘텐츠를 공유하기 위한 채널에 대한 분석 결과를 사용자 단말(10)에 제공하는 전체 과정을 제어한다. 프로세서(130)가 수행하는 각각의 동작에 대해서는 추후 보다 상세히 살펴보기로 한다.The processor 130 controls the entire process of providing the analysis result of the channel for sharing the video content to the user terminal 10 by executing a program for performing the video channel diagnosis method. Each operation performed by the processor 130 will be described in more detail later.

동영상 채널 진단 시스템(100)은 적어도 하나의 기능(tasks)을 수행(perform)하기 위해 적어도 하나 이상의 프로그램 모듈을 포함할 수 있다. 즉, 도 3에 도시된 바와 같이, 동영상 채널 진단 방법을 수행하기 위한 프로그램(300)은 수집 모듈(310), 분석 모듈(320) 및 시각화 모듈(330)을 포함하여 이루어진다.The video channel diagnosis system 100 may include at least one program module to perform at least one task. That is, as shown in FIG. 3, a program 300 for performing a video channel diagnosis method includes a collection module 310, an analysis module 320, and a visualization module 330.

수집 모듈(310)은 API(Application Programming Interface)를 이용하여 동영상 콘텐츠 플랫폼(200)에서 제공하는 사용자 인증 정보, 채널별 스크래핑을 통해 추출된 원시 채널 데이터를 수집한다. 원시 채널 데이터는 전처리 과정을 거쳐 데이터베이스(240)에 저장된다. The collection module 310 collects user authentication information provided by the video content platform 200 using an application programming interface (API), and raw channel data extracted through scraping for each channel. The raw channel data is stored in the database 240 through a pre-processing process.

분석 모듈(320)은 콘텐츠 분석 모델을 통해 지표간 분석, 지표별 분석 등을 수행하고, 동영상 콘텐츠의 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계를 분석하여 분석 결과를 제공한다. The analysis module 320 performs analysis between indicators and analysis by indicators through a content analysis model, and provides an analysis result by analyzing a correlation between video content data of video content and user response data.

시각화 모듈(330)은 사용자 단말(10)의 채널 분석 요청 정보에 따른 채널 분석 결과를 시각화하는데 필요한 값들을 계산하거나, 그래프 등을 직접 렌더링한다. 만일, 사용자 단말(10)에서 웹기술 등을 이용하여 채널 분석 결과를 랜더링할 경우, 시각화 모듈(330)은 에이잭스(Asynchronous JavaScript and XML, Ajax) 응답으로 시각화에 필요한 채널 분석 결과 데이터만을 사용자 단말(10)로 전송함으로써 사용자 단말(10)에서 직접 시각화가 이루어지도록 한다. The visualization module 330 calculates values necessary to visualize the channel analysis result according to the channel analysis request information of the user terminal 10 or directly renders a graph or the like. If the user terminal 10 renders the channel analysis result using web technology, etc., the visualization module 330 responds with Asynchronous JavaScript and XML (Ajax) to only the channel analysis result data necessary for visualization. 10) so that the visualization is performed directly in the user terminal 10.

상술한 모듈들은 본 발명을 설명하기 위한 일 실시예일 뿐, 이에 한정되지 않고 다양한 변형으로 구현될 수 있다. 또한, 상술한 모듈들은 프로세서(130)에 의해 제어될 수 있는 컴퓨터로 판독 가능한 기록매체로서 메모리(120)에 저장된다. 또한, 프로그램(300)의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 구현될 수 있으며, 하나 이상의 기능을 수행하기 위한 모듈, 프로그램, 루틴, 명령어 세트 또는 프로세스를 포함할 수 있다.The above-described modules are only one embodiment for explaining the present invention, and are not limited thereto and may be implemented in various modifications. In addition, the above-described modules are stored in the memory 120 as a computer-readable recording medium that can be controlled by the processor 130. In addition, at least a portion of the program 300 may be implemented as software, firmware, hardware, or a combination of at least two or more thereof, and may include a module, program, routine, instruction set, or process for performing one or more functions. .

프로세서(130)는 프로세서(processor)와 같이 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 여기서, '프로세서(processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.The processor 130 may include all kinds of devices capable of processing data, such as a processor. Here, the'processor' may refer to a data processing device embedded in hardware having a circuit physically structured to perform a function represented by a code or instruction included in a program. As an example of a data processing device built into the hardware as described above, a microprocessor, a central processing unit (CPU), a processor core, a multiprocessor, and an application-specific integrated (ASIC) circuit) and processing devices such as field programmable gate arrays (FPGAs), but the scope of the present invention is not limited thereto.

데이터베이스(140)는 동영상 채널 진단 방법을 수행하면서 누적되는 데이터가 저장된다. 예컨대, 데이터베이스(140)에는 사용자 인증 정보, 원시 채널 정보, 영상 내용 데이터, 사용자 반응 데이터, 채널 분석 결과 데이터 등이 저장될 수 있다.The database 140 stores data accumulated while performing a video channel diagnosis method. For example, the database 140 may store user authentication information, raw channel information, image content data, user response data, channel analysis result data, and the like.

표시 모듈(150)은 프로세서(130)의 제어에 의해 사용자 단말(10)의 채널 진단 요청 정보에 따른 채널 분석 결과 데이터에 대한 텍스트, 테이블 또는 그래프 형태의 보고서를 화면 출력한다. The display module 150 displays a text, table, or graph report on the channel analysis result data according to the channel diagnosis request information of the user terminal 10 under the control of the processor 130.

도 4는 본 발명의 일 실시예에 따른 동영상 채널 진단 방법을 설명하는 순서도이다. 4 is a flowchart illustrating a method of diagnosing a video channel according to an embodiment of the present invention.

사용자 단말(10)이 동영상 콘텐츠 플랫폼(200)에서 운영하는 복수의 채널 중 적어도 하나 이상의 개인 채널을 만들어 동영상 콘텐츠들을 업로드하여 운영한다. The user terminal 10 creates at least one personal channel among a plurality of channels operated by the video content platform 200 and uploads and operates the video content.

동영상 채널 진단 시스템(100)은 사용자 단말(10)로부터 채널 진단 요청 정보를 수신하면(S1), 사용자 단말(10)에게 아이디/패스워드, 전화번호, 로그인 정보 등의 사용자 인증 정보를 요청한다(S2).When receiving the channel diagnosis request information from the user terminal 10 (S1), the video channel diagnosis system 100 requests user authentication information such as ID/password, phone number, and login information from the user terminal 10 (S2). ).

동영상 채널 진단 시스템(100)은 사용자 단말(10)로부터 사용자 인증 정보가 수신되면(S3), 동영상 콘텐츠 플랫폼(200)을 통해 사용자 인증 정보의 정당성 또는 유효성을 확인한다(S4). 이때, 동영상 채널 진단 시스템(100)은 사용자가 회원 가입 또는 소속된 동영상 콘텐츠 플랫폼(200)으로부터 사용자 인증 정보를 수신하기 위해 사용자 단말(10)을 통해 사용자 동의 절차를 진행한다. When the user authentication information is received from the user terminal 10 (S3), the video channel diagnosis system 100 checks the validity or validity of the user authentication information through the video content platform 200 (S4). At this time, the video channel diagnosis system 100 proceeds with a user consent procedure through the user terminal 10 to receive user authentication information from the video content platform 200 to which the user subscribes or belongs.

또한, 동영상 채널 진단 시스템(100)은 1회 이상 사용자 인증 절차가 진행된 사용자의 경우, 사용자 인증 정보를 데이터베이스(140)에 저장하고, 다음 번 사용자 인증시 데이터베이스에서 사용자 인증 정보를 불러와서 사용할 수 있다.In addition, the video channel diagnosis system 100 may store user authentication information in the database 140 in the case of a user who has undergone a user authentication procedure one or more times, and may retrieve and use user authentication information from the database at the time of next user authentication. .

사용자 단말(10)에 대한 사용자 인증이 기설정된 횟수 이내에서 실패한 경우에 인증 실패 메시지 또는 인증 재시도 요청 메시지를 사용자 단말(10)로 전송한다(S5, S6). When user authentication for the user terminal 10 fails within a preset number of times, an authentication failure message or an authentication retry request message is transmitted to the user terminal 10 (S5, S6).

그러나, 사용자 단말(10)의 사용자 인증 실패 횟수가 기설정된 횟수를 초과하는 경우에 동영상 콘텐츠 플랫폼(200)을 통해 유해 또는 불법 동영상 콘텐츠와 관련되어 접속이 차단된 블랙리스트 정보에 해당하는지를 확인한다. 동영상 채널 진단 시스템(100)은 사용자 단말(10)의 사용자 인증 정보가 블랙리스트 정보가 아닌 경우에 사용자 인증 정보의 기한 만료 또는 오류 입력에 대한 인증 정보 재확인 메시지를 출력하지만, 사용자 단말(10)의 사용자 인증 정보가 블랙리스트 정보에 해당하는 경우에 동영상 콘텐츠 플랫폼(200)과 연계하여 기설정된 기간 동안 채널 진단 요청 거부 메시지를 출력할 수 있다. However, when the number of user authentication failures of the user terminal 10 exceeds the preset number, it is checked through the video content platform 200 whether it corresponds to blacklist information that is blocked from access due to harmful or illegal video content. When the user authentication information of the user terminal 10 is not blacklist information, the video channel diagnosis system 100 outputs an authentication information reconfirmation message for expiration or error input of the user authentication information. When the user authentication information corresponds to the blacklist information, a channel diagnosis request rejection message may be output for a preset period in connection with the video content platform 200.

한편, 동영상 채널 진단 시스템(100)은 사용자 단말(10)에 대한 사용자 인증 정보를 확인하여 사용자 인증이 정상적으로 완료된 이후에, 동영상 콘텐츠 플랫폼(200)을 통해 사용자 단말의 개인 채널에 대한 원시 채널 데이터를 가져온다(S7). 즉, 사용자 인증 정보를 이용하여 동영상 콘텐츠 플랫폼(200)에서 채널 별로 스크래핑하여 가공되지 않은 원시 채널 데이터를 가져와 수집한다. On the other hand, the video channel diagnosis system 100 checks the user authentication information for the user terminal 10, and after the user authentication is normally completed, the raw channel data for the personal channel of the user terminal through the video content platform 200 Bring it (S7). That is, by using the user authentication information, the video content platform 200 scrapes for each channel to obtain and collect raw raw channel data.

동영상 채널 진단 시스템(100)은 사용자 인증 정보를 이용하여 동영상 콘텐츠 플랫폼(200)을 스크래핑하여 원시 채널 데이터를 가져오게 되는데, 스크래핑 시도가 실패한 경우에 사용자 인증 정보를 갱신하는 과정을 수행한다. The video channel diagnosis system 100 scrapes the video content platform 200 using user authentication information to obtain raw channel data, and performs a process of updating user authentication information when the scraping attempt fails.

사용자, 즉 크리에이터는 동영상 콘텐츠 플랫폼(200)에 복수의 채널을 보유할 수 있고, 각 채널마다 다수의 동영상 콘텐츠들이 존재할 수 있다. 따라서, 동영상 채널 진단 시스템(100)은 각 채널별로 전체적인 데이터와 채널에 존재하는 동영상 콘텐츠들에 대한 각각의 메타데이터들을 가져온다. A user, that is, a creator, may have a plurality of channels in the video content platform 200, and a plurality of video contents may exist for each channel. Accordingly, the video channel diagnosis system 100 fetches overall data for each channel and metadata for video contents existing in the channel.

원시 채널 데이터는 오디오, 비디오, 이미지, 메타 데이터, 제목, 설명 태그, 카테고리 등의 영상 내용 데이터를 포함한다. 또한, 영상 길이, 좋아요/싫어요 수, 시청 시간, 영상 구간별 시청자 수, 시청자 잔류율, 조회 수, 노출 수, 노출 대비 클릭 수, 시청자 인구통계 정보 등의 다양한 사용자 반응 데이터를 포함한다. 이때, 영상 내용 데이터에는 긍정 단어, 부정 단어 등의 사용자 반응 데이터가 포함될 수 있다. The raw channel data includes video content data such as audio, video, image, metadata, title, description tag, and category. In addition, it includes various user reaction data such as video length, number of likes/dislikes, viewing time, number of viewers by video section, viewer retention rate, number of views, number of impressions, number of clicks versus exposure, and viewer demographic information. In this case, the image content data may include user response data such as positive words and negative words.

동영상 채널 진단 시스템(100)은 원시 채널 데이터 또는 원시 채널 데이터를 전처리 가공한 데이터에 기초하여 콘텐츠 분석 모델을 통해 채널별 또는 동영상 콘텐츠별로 데이터 분석하여 채널 분석 결과를 산출한다(S8, S9). The video channel diagnosis system 100 calculates a channel analysis result by analyzing data for each channel or for each video content through a content analysis model based on the raw channel data or data preprocessed from the raw channel data (S8, S9).

또한, 동영상 채널 진단 시스템(100)은 채널 분석 결과뿐만 아니라 채널 분석 결과에 기초하여 트렌드에 맞춘 동영상 콘텐츠의 기획, 제작, 편집, 노출 등에 대한 채널 성장 가이드 데이터를 제공한다(S10). 채널 분석 결과에는 시청자별 연령대 분석 결과, 시간대별 영상 내용 변화 분석 결과, 클릭률이 최다인 영상 내용 데이터 분석 등을 포함할 수 있다. In addition, the video channel diagnosis system 100 provides channel growth guide data for planning, production, editing, exposure, etc. of moving video content according to trends based on the channel analysis result as well as the channel analysis result (S10). The channel analysis result may include an age group analysis result for each viewer, a video content change analysis result for each time period, a video content data analysis with the highest click rate, and the like.

도 5는 본 발명의 일 실시예에 따른 영상 내용 데이터를 설명하는 예시도이고, 도 6은 본 발명의 일 실시예에 따른 단어 토큰화 과정을 설명하는 예시도이다.5 is an exemplary diagram illustrating image content data according to an embodiment of the present invention, and FIG. 6 is an exemplary diagram illustrating a word tokenization process according to an exemplary embodiment of the present invention.

동영상 채널 진단 시스템(100)은 원시 채널 데이터를 수집한 후 전처리 가공하여 영상 내용 데이터와 사용자 반응 데이터로 데이터베이스(140)에 저장한다.The video channel diagnosis system 100 collects raw channel data, pre-processes it, and stores it in the database 140 as image content data and user response data.

이때, 영상 내용 데이터에 대한 전처리 과정은 크게 개별 단어를 분석하기 위해 단어를 추출하는 과정과 딥러닝 기반의 콘텐츠 분석 모델을 위한 단어 토큰화 과정으로 이루어질 수 있다.In this case, the pre-processing process for the image content data may consist of a process of extracting words to analyze individual words and a process of tokenizing words for a content analysis model based on deep learning.

먼저, 개별 단어를 분석하기 위해 단어를 추출하는 과정은 TF-IDF(Term Frequency-Inverse Document Frequency), LDA(Latent Dirichlet Allocation, LDA) 또는 hLDA(Hierarchical LDA)를 포함한 토픽 모델링(Topic Modeling) 알고리즘을 이용하여 영상 내용 데이터에서 기설정된 빈도수 이상의 단어들을 텍스트 정보로 추출한다.First, the process of extracting words to analyze individual words is a topic modeling algorithm including TF-IDF (Term Frequency-Inverse Document Frequency), LDA (Latent Dirichlet Allocation, LDA), or hLDA (Hierarchical LDA). By using, words with a preset frequency or more are extracted as text information from the image content data.

일례로, 도 5에 도시된 바와 같이, 영상 내용 데이터에서 명사들을 추출하고, TF-IDF 등의 토픽 모델링 알고리즘을 이용하여 '꼬꼬(크리에이터 고유 이름)', '팁핑', '꼬야(구독자 애칭)' 등의 중요한 단어들을 추출한다. 이렇게 추출된 단어들은 다른 영상 내용 데이터에서 거의 사용되지 않지만, 해당 영상 내용 데이터에서 많이 사용되기 때문에 비중을 높게 책정한다. 또한, 말뭉치(Bag of words, BOW) 등의 단어들에 대한 통계값을 이용할 수도 있는데, '어플' 3회, '오늘' 5회 등 영상 내용 데이터의 단어 빈도 횟수에 대한 데이터를 이용한다. As an example, as shown in FIG. 5, nouns are extracted from image content data, and'Kokko (creator's unique name)','Tipping', and'Kokoya (subscriber nickname)' using a topic modeling algorithm such as TF-IDF. Extract important words such as'. Words extracted in this way are rarely used in other video content data, but they are heavily used in the video content data, so the weight is given high. In addition, statistical values for words such as a bag of words (BOW) can be used, and data on the frequency of words in the video content data such as 3'applications' and 5'today' are used.

한편, 딥러닝 기반의 콘텐츠 분석 모델을 위한 단어 토큰화 과정은 영상 내용 데이터에서 추출되는 자연어 데이터에서 노이즈를 제거하고, 어간 추출(Stemming) 또는 표제어 추출(Lemmatization)을 통해 추출된 단어들을 기설정된 규칙에 기반한 단어 토큰화(Word Tokenization)하여 텍스트 정보를 추출한다.On the other hand, the word tokenization process for a content analysis model based on deep learning removes noise from natural language data extracted from image content data, and sets words extracted through stemming or lemmatization. Text information is extracted by word tokenization based on.

영상 내용 데이터에서 사용되고 있는 자연어에는 한국어, 외국어, 외래어, 특수문자, 변형된 단어 등이 많이 사용되고 있으므로, 노이즈를 제거하는 정제 작업과 여러 표현 방식의 단어들을 통합시키는 정규화 작업을 수행하게 된다.Since Korean, foreign languages, foreign languages, special characters, and transformed words are widely used in natural language used in image content data, a refinement operation to remove noise and a normalization operation to integrate words of various expression methods are performed.

도 6에 도시된 바와 같이, 영상 내용 데이터의 일부 문장을 정규화 및 어간 추출 작업을 거쳐 단어 토큰화를 수행하고, 토큰화가 완료되면 단어 토큰들을 이용하여 자연어 분석을 수행한다. As shown in FIG. 6, word tokenization is performed through normalization and stem extraction of some sentences of image content data, and natural language analysis is performed using word tokens when tokenization is completed.

도 7은 본 발명의 일 실시예에 따른 영상 내용 데이터의 말뭉치를 이용한 단어 문서 행렬을 설명하는 예시도이고, 도 8은 본 발명의 일 실시예에 따른 콘텐츠 분석 모델을 설명하는 예시도이다.7 is an exemplary diagram illustrating a word document matrix using a corpus of image content data according to an exemplary embodiment of the present invention, and FIG. 8 is an exemplary diagram illustrating a content analysis model according to an exemplary embodiment of the present invention.

콘텐츠 분석 모델은 영상 내용 데이터에 대한 콘텐츠 분류를 수행하고, 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계를 분석하여 동영상 콘텐츠별 반응도에 따른 시청 패턴에 대한 채널 분석 결과를 도출한다. 이러한 콘텐츠 분석 모델은 회귀 모델에 기반한 기본 분석 방식이나 딥러닝을 활용한 자연어 분석방식을 사용할 수 있다. The content analysis model derives a channel analysis result for the viewing pattern according to the response level of each video content by analyzing the correlation between the video content data and the user response data, performing content classification on the video content data. Such a content analysis model can use a basic analysis method based on a regression model or a natural language analysis method using deep learning.

회귀 모델에 기반한 기본 분석 방식은 전처리 과정을 통해 영상 내용 데이터에서 추출된 토픽 단어들 또는 말뭉치 데이터를 수집하여 영상 내용 데이터(또는 문서 데이터)별 단어 빈도 횟수 집합을 생성하고, 복수의 영상 내용 데이터에 대해 단어 문서 행렬(Term Document Matrix, TDM)을 생성할 수 있다. 단어 문서 행렬은 고차원 행렬이므로 차원 축소 기법을 적용할 수 있다. 단어 문서 행렬은 TF-IDF 알고리즘을 통해 거친 후에, 코사인 유사도를 통해 영상간 유사도를 구한다. 또한, 각 영상 내용 데이터와 지표 사이의 상관관계를 분석하는 회귀 모델을 수립하고, 회귀 모델을 통해 다수의 영상 내용 데이터에 대한 학습 과정을 수행한다. The basic analysis method based on the regression model collects topic words or corpus data extracted from image content data through a pre-processing process to generate a set of word frequency counts for each image content data (or document data), and For example, a Term Document Matrix (TDM) can be generated. Since the word document matrix is a high-dimensional matrix, a dimension reduction technique can be applied. After the word document matrix is passed through the TF-IDF algorithm, the similarity between images is obtained through the cosine similarity. In addition, a regression model to analyze the correlation between each image content data and an index is established, and a learning process for a plurality of image content data is performed through the regression model.

이때, 영상 간의 유사도는 코사인 유사도뿐만 아니라 L1 거리(L1 Distance or Manhattan Distance), L2 거리(L2 Distance or Euclidean Distance) 등의 다양한 벡터 간의 유사도 계산 방식을 사용하여 계산될 수 있다. In this case, the similarity between images may be calculated using a similarity calculation method between various vectors such as an L1 distance (L1 Distance or Manhattan Distance) and an L2 distance (L2 Distance or Euclidean Distance) as well as cosine similarity.

한편, 딥러닝을 활용한 자연어 분석 방식은 영상 내용 데이터를 벡터로 변경하는 문서 임베딩(document embedding) 방식의 doc2vec의 PV-DM(Paragraph Vector with Distributed Memory) 또는 PV-DBOW(Paragraph Vector with Distributed bag of words Memory) 알고리즘을 이용하여 영상 내용 벡터를 산출한다. Meanwhile, the natural language analysis method using deep learning is doc2vec's Paragraph Vector with Distributed Memory (PV-DM) or PV-DBOW (Paragraph Vector with Distributed Bag of), which is a document embedding method that converts image content data into vectors. words Memory) algorithm is used to calculate the image content vector.

도 8에 도시된 바와 같이, 딥러닝을 활용한 자연어 분석 방식은 1~3개 층으로 이루어진 은닉층을 포함하는 뉴럴 네트워크 모델을 이용한 학습을 통해 대량의 동영상 콘텐츠에 대해 지표 값을 예측할 수 있다. As shown in FIG. 8, the natural language analysis method using deep learning can predict an index value for a large amount of video content through learning using a neural network model including a hidden layer composed of 1 to 3 layers.

즉, 뉴럴 네트워크 모델에 대량의 자연어 말뭉치를 이용하여 자연어 데이터를 학습시킨 후, 영상 내용 데이터를 추가로 학습시킴으로써 동영상 콘텐츠에 대한 의미론적인 내용을 담은 벡터를 추출할 수 있을 뿐만 아니라 자연어 이해 성능을 높일 수 있다. 이와 같이, 딥러닝을 활용한 자연어 분석 방식은 회귀 모델에 기반한 분석 방식에 비해 대량의 단어 문서 행렬을 얻을 수 있고, BERT(Bidirectional Encoder Representations from Transformers) 알고리즘 등의 자연어 처리 모델을 사용하여 각 단어 토큰 사이의 관련성을 고려한 분석을 수행할 수 있다.In other words, after learning natural language data using a large amount of natural language corpus in the neural network model, it is possible to extract a vector containing semantic content for video content by additionally learning the video content data, and improve natural language understanding performance. I can. As described above, the natural language analysis method using deep learning can obtain a large number of word document matrices compared to the analysis method based on a regression model, and each word token using a natural language processing model such as BERT (Bidirectional Encoder Representations from Transformers) algorithm. You can perform an analysis considering the relationship between them.

회귀 모델이나 뉴럴 네트워크 모델 등을 이용한 콘텐츠 분석 모델은 채널별로 동영상 콘텐츠들의 영상 내용 데이터를 이용하여 콘텐츠 분류를 수행하여 각 동영상 콘텐츠의 카테고리를 선정할 수 있다.A content analysis model using a regression model or a neural network model may select a category of each video content by performing content classification using video content data of video content for each channel.

예를 들어, 동영상 콘텐츠의 카테고리는 ①TV 짤방(짧게 편집한 방송 영상), ②각종 교육, 정보성 콘텐츠 등 교육 콘텐츠, ③연예인, 가수, 공연 관련 영상, ④먹방/쿡방, ⑤스포츠, ⑤게임방송, ⑥웹드라마, 웹예능, 토크쇼 등 모바일 영상, ⑦브이로그, ⑧뉴스, ⑨동물, ⑩뷰티, ⑪언박싱, ⑫사용후기 등 상품 리뷰, ⑬키즈, ⑭ASMR 등으로 설정될 수 있다. For example, the categories of video content are ① TV Jalbang (shortly edited broadcast video), ② Educational contents such as various education and informational contents, ③ Celebrity, singer, performance related videos, ④ Meokbang/Cookbang, ⑤ Sports, ⑤ Game broadcasting. , ⑥ web drama, web entertainment, talk show, mobile video, ⑦ vlog, ⑧ news, ⑨ animals, ⑩ beauty, ⑪ unboxing, ⑫ product reviews such as user reviews, ⑬Kids, ⑭ASMR, etc.

콘텐츠 분석 모델은 원시 채널 데이터 또는 원시 채널 데이터를 전처리 가공한 영상 내용 데이터와 사용자 반응 데이터를 입력 데이터로 하고, 스크래핑을 통해 추출된 사용자 반응 데이터, 가공된 데이터(또는 지표 데이터), 레이블 데이터 등을 출력 데이터로 할 수 있다. 표 1은 원시 채널 데이터와 가공된 데이터를 설명하는 것이다. The content analysis model uses raw channel data or video content data pre-processed from raw channel data and user response data as input data, and extracts user response data, processed data (or indicator data), label data, etc., extracted through scraping. You can do it with output data. Table 1 describes raw channel data and processed data.

원시 채널 데이터Raw channel data 가공된 데이터(또는 지표 데이터)Processed data (or indicator data) 좋아요 수, 싫어요 수Number of likes, number of dislikes 좋아요(긍정)/싫어요(부정) 비율Like (positive)/dislike (negative) ratio 영상 길이, 영상 진행률 (단위: %) 대비 시청자 잔류율Viewer retention rate compared to video length and video progress (unit: %) 영상 진행 시간 (단위: 초) 대비 시청자 잔류율Percentage of viewers remaining compared to video duration (unit: seconds) 조회수, 좋아요 수Views, likes 조회수 대비 좋아요(긍정) 비율Likes (positive) ratio to views 영상의 음성 데이터Audio data of video 음성에 대한 텍스트 데이터Text data for speech 영상 데이터Video data 1FPS 수준의 압축된 영상 프레임Compressed video frame at 1FPS level

특히, 콘텐츠 분석 모델의 출력 데이터로 레이블 데이터를 설정한 경우, 긍정/부정 반응, 재미, 공감을 포함한 사용자 반응 데이터에 레이블 데이터를 지정하여 동영상 콘텐츠를 시청한 시청자들에 의한 긍정/부정 반응 점수, 재미 점수, 공감 점수를 포함한 점수 매기기를 통해 해당 동영상 콘텐츠에 대한 레이블 데이터로 학습하고, 이렇게 학습된 레이블 데이터를 이용하여 동영상 콘텐츠에 대한 퀄리티를 평가할 수 있다. In particular, when label data is set as the output data of the content analysis model, the positive/negative reaction score by viewers who watched the video content by assigning the label data to user reaction data including positive/negative reactions, fun, and empathy, and fun. Through scoring including scores and empathy scores, it is possible to learn the label data for the corresponding video content, and evaluate the quality of the video content by using the learned label data.

도 9는 본 발명의 일 실시예에 따른 채널 분석 결과에 대한 예시도이다.9 is an exemplary diagram for a channel analysis result according to an embodiment of the present invention.

도 9에 도시된 바와 같이, 동영상 채널 진단 시스템(100)은 개별 채널에 대한동영상 콘텐츠 종류, 즉 카테고리에 따라 지표 데이터를 분석할 수 있다. 여기서, 지표 데이터는 사용자 인구 통계 정보, 시청 시간, 클릭률, 조회수, 좋아요(긍정) 비율 등의 사용자 반응 데이터가 될 수 있다. As shown in FIG. 9, the video channel diagnosis system 100 may analyze indicator data according to the type of video content for an individual channel, that is, a category. Here, the indicator data may be user response data such as user demographic information, viewing time, click-through rate, views, and likes (positive) ratio.

채널 분석 결과는 동영상 콘텐츠의 내용 분석 결과, 각 카테고리별 평균 시청 시간, 평균 영상 길이, 시청 시간에 따른 잔류율을 그래프 형태로 제공될 수 있다. 시청 시간에 따른 잔류율은 영상 전체 길이 대비 평균 시청 시간 등의 데이터를 지표로 하고 있어 동영상 콘텐츠의 퀄리티, 시청자들의 실제 선호하는 영상에 대한 분석을 가능하도록 한다. The channel analysis result may provide a result of analyzing the contents of the video content, an average viewing time for each category, an average video length, and a residual rate according to the viewing time in a graph form. The retention rate according to the viewing time is based on data such as the average viewing time compared to the total length of the video, so that the quality of the video content and the actual preferred video of the viewers can be analyzed.

예를 들어, 크리에이터 B의 개인 채널에 업로드된 동영상 콘텐츠들 중 음식 콘텐츠의 조회 수가 일상 콘텐츠의 조회 수보다 많은 경우, 채널 분석 결과에는 음식 콘텐츠에 대한 시청 패턴의 긍정 평가를 포함하게 되므로, 크리에이터 B는 채널 분석 결과에 기초하여 음식 콘텐츠와 지표 데이터(즉 사용자 반응 데이터) 사이의 상관관계를 통해 자신의 채널 성장을 위해 음식 콘텐츠를 업로드하는 전략을 수립할 수 있다.For example, if the number of views of food content among video contents uploaded to Creator B's personal channel is greater than the number of views of daily content, the channel analysis result includes a positive evaluation of the viewing pattern for food content. May establish a strategy of uploading food content for growth of its own channel through correlation between food content and indicator data (ie, user response data) based on the channel analysis result.

또는, 채널 분석 결과에는 개인 채널별로 각 동영상 콘텐츠에 대한 사용자 반응 데이터의 변화 추이를 시계열로 분석한 결과를 포함할 수 있다. 따라서, 크리에이터 B의 개인 채널에 동영상 콘텐츠가 주기적으로 업로드 되는 경우, 크리에이터 B는 채널 분석 결과를 통해 어떤 콘텐츠가 최근 사용자 반응 데이터(예를 들어, 조회수 등)가 높은지를 확인할 수 있다. Alternatively, the channel analysis result may include a result of analyzing a change trend of user reaction data for each video content for each individual channel in a time series. Accordingly, when the video content is periodically uploaded to the creator B's personal channel, the creator B can determine which content has the highest recent user response data (eg, views, etc.) through the channel analysis result.

채널 분석 결과에는 동영상 콘텐츠별 시청자 인구 통계 데이터를 분석하여 연령대 또는 성별 사용자 반응 데이터의 반응도가 최대값을 갖는 동영상 콘텐츠를 선정하여 제공할 수 있다. 따라서, 크리에이터 B는 자신이 타겟팅하고자 하는 성별 또는 연령대의 타겟 대상을 선정하고, 채널 분석 결과에 기초하여 타겟 대상에 부합되는 동영상 콘텐츠를 확인한 후 영상 기획, 제작 등에 적용할 수 있다. The channel analysis result may be provided by analyzing viewer demographic data for each video content to select and provide a video content having a maximum responsiveness of user response data by age or gender. Accordingly, the creator B may select a target target of the gender or age group he/she wants to target, check the video content matching the target target based on the channel analysis result, and apply it to image planning and production.

도 10은 본 발명의 일 실시예에 따른 채널 성장 가이드 데이터의 가이드 콘텐츠 제공에 대한 예시도이고, 도 11 및 도 12는 본 발명의 일 실시예에 따른 채널 성장 가이드 데이터에 대한 예시도이다. 10 is an exemplary diagram for providing guide content of channel growth guide data according to an embodiment of the present invention, and FIGS. 11 and 12 are exemplary diagrams for channel growth guide data according to an embodiment of the present invention.

도 10에 도시된 바와 같이, 채널 성장 가이드 데이터는 채널 분석 결과에 기초하여 채널 성장에 필요한 동영상 기획, 제작, 편집, 노출 정보(예를 들어, 썸네일, 제목 등)를 포함한 가이드 라인을 제공할 수 있다. As shown in FIG. 10, the channel growth guide data may provide a guideline including video planning, production, editing, and exposure information (e.g., thumbnails, titles, etc.) necessary for channel growth based on the channel analysis result. have.

동영상 채널 진단 시스템(100)은 콘텐츠 분석 모델을 통해 학습된 타 채널의 동영상 콘텐츠들의 학습된 채널 분석 결과와 사용자 단말(10)의 개인 채널에 해당되는 동영상 콘텐츠의 채널 분석 결과 간의 영상 유사도를 산출하고, 산출된 영상 유사도 중 최상위의 유사 동영상 콘텐츠들을 추출한 후 추출된 유사 동영상 콘텐츠들을 이용한 비교 학습을 통해 동영상 콘텐츠의 기획, 제작, 편집, 노출 정보를 포함한 채널 성장 가이드 데이터를 제공할 수 있다.The video channel diagnosis system 100 calculates an image similarity between the learned channel analysis result of the video contents of other channels learned through the content analysis model and the channel analysis result of the video content corresponding to the personal channel of the user terminal 10. , Channel growth guide data including planning, production, editing, and exposure information of the video content may be provided through comparative learning using the extracted similar video content after extracting the highest similar video content among the calculated image similarities.

도 10에 도시된 바와 같이, 채널 성장 가이드 데이터는 크리에이터 A에 대한 채널 분석 결과를 통해 '중국 음식 먹방' 및 '강아지'에 대한 영상 내용을 업로드하는 것이 확인되면, 유사 동영상 콘텐츠들 중 중국 음식 먹방 콘텐츠의 인기 영상들, 강아지 콘텐츠의 인기 영상들을 가이드라인에 노출함으로써 사용자 반응을 분석할 수 있도록 한다.As shown in FIG. 10, when it is confirmed that the video content of'Chinese food eating' and'dog' is uploaded through the channel analysis result of creator A, the channel growth guide data is Chinese food eating among similar video contents. The user's reaction can be analyzed by exposing popular videos of content and popular videos of dog content to guidelines.

이때, 가이드라인에 노출되는 영상들을 가이드 콘텐츠라고 하고, 동영상 콘텐츠의 카테고리별로 적어도 하나 이상의 가이드 콘텐츠를 제공할 수 있는데, 이때, 유사 동영상 콘텐츠들에 대한 사용자 반응 데이터를 이용한 트렌드 분석을 통해 가이드 콘텐츠를 선별한다.At this time, the images exposed to the guideline are referred to as guide content, and at least one guide content may be provided for each category of video content. In this case, guide content is analyzed through trend analysis using user response data for similar video content. Select.

한편, 유사 동영상 콘텐츠들을 조회수, 시청 시간, 좋아요(긍정) 비율을 포함한 인기 지표를 이용하여 인기 순서를 결정하고, 결정된 인기 순서로 가이드 콘텐츠들을 정렬하여 인기 영상으로 제공한다. Meanwhile, the popularity order of similar video contents is determined using a popularity index including views, viewing time, and like (positive) ratio, and guide contents are arranged in the determined popularity order and provided as popular videos.

도 11 및 도 12에 도시된 바와 같이, 채널 성장 가이드 데이터는 채널 타겟팅 대상에 따른 사용자 반응 유도 정보, 영상 평균 시청 시간에 따른 영상 몰입 시간 정보, 영상 재생 시간대별 시청자 잔류 및 이탈에 대한 현재 상황과 채널 성장에 필요한 요소들, 타 채널의 인기 동영상 콘텐츠와의 비교 정보를 포함하고 있다. 또한, 꿀팁 부분에는 동영상 콘텐츠의 초반 영역, 중반 영역, 후반 영역에 따라 시청자 수를 증대시키기 위한 콘텐츠 요소 정보를 제공한다. As shown in FIGS. 11 and 12, the channel growth guide data includes information on inducing user reactions according to the target of the channel, information on the video immersion time according to the average viewing time of the video, and the current situation of viewer retention and departure by video playback time It contains elements necessary for channel growth and comparison information with popular video contents of other channels. In addition, content element information for increasing the number of viewers according to the early, mid, and late regions of the video content is provided in the tip part.

따라서, 크리에이터 1은 채널 성장 가이드 데이터를 통해 사용자 반응 유도를 위한 썸네일, 제목 등에 대해 추천받을 수 있고, 유사 동영상 콘텐츠들과의 비교 학습을 통해 객관적으로 자신의 동영상 콘텐츠에 대한 부족한 부분을 확인할 수 있다. Therefore, Creator 1 can receive recommendations for thumbnails and titles for inducing user reactions through channel growth guide data, and can objectively identify insufficient parts of his or her video content through comparative learning with similar video contents. .

이상에서 설명한 본 발명의 실시예에 따른 동영상 채널 진단 방법은, 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 이러한 기록 매체는 컴퓨터 판독 가능 매체를 포함하며, 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함하며, 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.The video channel diagnosis method according to the embodiment of the present invention described above may be implemented in the form of a recording medium including instructions executable by a computer such as a program module executed by a computer. Such recording media include computer-readable media, and computer-readable media may be any available media that can be accessed by a computer, and include both volatile and nonvolatile media, and removable and non-removable media. In addition, computer-readable media includes computer storage media, which are volatile and nonvolatile embodied in any method or technology for storage of information such as computer-readable instructions, data structures, program modules or other data. , Removable and non-removable media.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above description of the present invention is for illustrative purposes only, and those of ordinary skill in the art to which the present invention pertains will be able to understand that other specific forms can be easily modified without changing the technical spirit or essential features of the present invention will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not limiting. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present invention. do.

100: 동영상 채널 진단 시스템
110: 통신 모듈 120: 메모리
130: 프로세서 140: 데이터베이스
150: 표시 모듈
100: video channel diagnosis system
110: communication module 120: memory
130: processor 140: database
150: display module

Claims (22)

사용자 단말에 의해 적어도 하나의 채널 상에 배포된 동영상 콘텐츠를 분석하는 동영상 채널 진단 시스템에 의해 수행되는 동영상 채널 진단 방법에 있어서,
a) 상기 사용자 단말로부터 채널 진단 요청 정보가 수신되면, 복수의 사용자 단말들 간에 상기 동영상 콘텐츠를 공유하기 위한 채널을 제공하는 동영상 콘텐츠 플랫폼을 통해 사용자 인증을 수행하는 단계;
b) 상기 사용자 인증이 완료되면, 상기 사용자 인증 정보를 이용하여 상기 사용자 단말이 운영하는 적어도 하나 이상의 채널에 대한 스크래핑(Scraping)을 수행하여 원시 채널 데이터(Raw channel data)를 획득하는 단계;
c) 상기 원시 채널 데이터에 포함된 상기 동영상 콘텐츠에서 텍스트 정보를 추출한 영상 내용 데이터와 상기 동영상 콘텐츠에 대한 조회 정보, 노출 정보, 시청 패턴 정보를 포함한 사용자 반응 데이터로 생성하여 데이터베이스에 저장하는 단계;
d) 상기 영상 내용 데이터와 사용자 반응 데이터를 이용하여 지표 분석을 수행하는 콘텐츠 분석 모델을 통해 채널별 동영상 콘텐츠에 대한 채널 분석 결과를 산출하는 단계; 및
e) 상기 산출된 채널 분석 결과에 기초하여 채널별 사용자 반응 유도를 위한 콘텐츠의 기획, 제작, 편집, 노출 정보를 포함한 채널 성장 가이드 데이터를 제공하는 단계를 포함하되,
상기 콘텐츠 분석 모델은, 상기 영상 내용 데이터에 대한 콘텐츠 분류를 수행하고, 상기 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계를 분석하여 상기 동영상 콘텐츠별 사용자 반응에 따른 시청 패턴에 대한 채널 분석 결과를 제공하는 것인, 동영상 채널 진단 방법.
In the video channel diagnosis method performed by a video channel diagnosis system for analyzing video content distributed on at least one channel by a user terminal,
a) when channel diagnosis request information is received from the user terminal, performing user authentication through a video content platform that provides a channel for sharing the video content between a plurality of user terminals;
b) when the user authentication is complete, performing scraping on at least one channel operated by the user terminal using the user authentication information to obtain raw channel data;
c) generating video content data obtained by extracting text information from the video content included in the raw channel data, user response data including inquiry information, exposure information, and viewing pattern information for the video content and storing it in a database;
d) calculating a channel analysis result for video content for each channel through a content analysis model that performs index analysis using the video content data and user response data; And
e) comprising the step of providing channel growth guide data including planning, production, editing, and exposure information for inducing user reactions for each channel based on the calculated channel analysis result,
The content analysis model performs content classification on the video content data, analyzes a correlation between the video content data and user response data, and provides a channel analysis result for a viewing pattern according to a user response for each video content. That, video channel diagnosis method.
제 1 항에 있어서,
상기 a) 단계는,
a-1) 상기 사용자 단말에 대한 사용자 인증이 기설정된 횟수 이내에서 실패한 경우에 인증 실패 메시지 또는 인증 재시도 요청 메시지를 출력하고,
a-2) 상기 사용자 단말의 사용자 인증 실패 횟수가 기설정된 횟수를 초과하는 경우에 상기 동영상 콘텐츠 플랫폼을 통해 유해 또는 불법 동영상 콘텐츠와 관련되어 접속이 차단된 블랙리스트 정보에 해당하는지를 확인하는 단계를 더 포함하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
The step a),
a-1) If user authentication for the user terminal fails within a preset number of times, an authentication failure message or an authentication retry request message is output,
a-2) If the number of user authentication failures of the user terminal exceeds a preset number, confirming whether it corresponds to blacklist information that is blocked from access related to harmful or illegal video content through the video content platform. That includes, video channel diagnosis method.
제 2 항에 있어서,
상기 a-2) 단계는
상기 사용자 단말의 사용자 인증 정보가 블랙리스트 정보가 아닌 경우, 상기 사용자 인증 정보의 기한 만료 또는 오류 입력에 대한 인증 정보 재확인 메시지를 출력하고,
상기 사용자 단말의 사용자 인증 정보가 블랙리스트 정보에 해당하는 경우, 상기 동영상 콘텐츠 플랫폼과 연계하여 기설정된 기간 동안 채널 진단 요청 거부 메시지를 출력하는 것인, 동영상 채널 진단 방법.
The method of claim 2,
Step a-2)
If the user authentication information of the user terminal is not blacklist information, an authentication information reconfirmation message for the expiration of the user authentication information or error input is output, and
When the user authentication information of the user terminal corresponds to blacklist information, outputting a channel diagnosis request rejection message for a predetermined period in connection with the video content platform.
제 1 항에 있어서,
상기 b) 단계는,
상기 스크래핑이 실패한 경우에 상기 사용자 인증 정보를 갱신하고, 상기 갱신된 사용자 인증 정보를 이용하여 상기 동영상 콘텐츠 플랫폼에 스크래핑을 요청하는 단계를 더 포함하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step b),
If the scraping has failed, updating the user authentication information, and requesting scraping from the video content platform using the updated user authentication information.
제 1 항에 있어서,
상기 c) 단계는
상기 동영상 콘텐츠에서 비디오, 오디오, 메타 데이터, 제목, 설명, 태그, 댓글 또는 카테고리를 포함한 텍스트 정보를 추출하여 상기 영상 내용 데이터를 생성하고,
상기 동영상 콘텐츠에 대한 긍정/부정 평가수, 조회수, 노출 수, 노출 대비 클릭 수, 시청자 잔류율, 시청 시간 또는 시청자 인구 통계 정보를 포함한 사용자 반응을 나타내는 사용자 반응 데이터를 생성하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step c)
Extracting text information including video, audio, metadata, title, description, tag, comment, or category from the video content to generate the video content data,
To generate user response data representing user reactions, including positive/negative ratings, views, impressions, clicks versus impressions, viewer retention rate, viewing time, or viewer demographic information for the video content. Way.
제 1 항에 있어서,
상기 c) 단계는
TF-IDF (Term Frequency-Inverse Document Frequency), LDA(Latent Dirichlet Allocation, LDA) 또는 hLDA(Hierarchical LDA)를 포함한 토픽 모델링(Topic Modeling) 알고리즘을 이용하여 상기 동영상 콘텐츠에서 기설정된 빈도수 이상의 단어들을 텍스트 정보로 추출하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step c)
Text information of words with a preset frequency or more in the video content using a topic modeling algorithm including TF-IDF (Term Frequency-Inverse Document Frequency), LDA (Latent Dirichlet Allocation, LDA), or hLDA (Hierarchical LDA). That is, the video channel diagnosis method.
제 1 항에 있어서,
상기 c) 단계는
상기 동영상 콘텐츠에서 추출되는 자연어 데이터에서 노이즈를 제거하고, 어간 추출(Stemming) 또는 표제어 추출(Lemmatization)을 통해 추출된 단어들을 기설정된 규칙에 기반한 단어 토큰화(Word Tokenization)를 수행하여 텍스트 정보를 추출하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step c)
Text information is extracted by removing noise from the natural language data extracted from the video content, and performing word tokenization based on preset rules on words extracted through stemming or Lemmatization. That is, how to diagnose a video channel.
제 1 항에 있어서,
상기 d) 단계는
상기 콘텐츠 분석 모델에 복수의 동영상 콘텐츠의 원시 채널 데이터 또는 상기 영상 내용 데이터 내의 자연어 단어 정보를 이용하여 상기 사용자 반응 데이터와 연관된 지표 데이터를 학습하고,
상기 학습된 콘텐츠 분석 모델을 통해 채널별로 동영상 콘텐츠들의 영상 내용 데이터를 이용하여 콘텐츠의 카테고리를 분류를 수행한 후, 상기 분류된 콘텐츠들의 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계 분석 결과에 기초하여 상기 사용자 반응 데이터의 반응도가 최대값을 갖는 콘텐츠의 카테고리를 선정하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step d)
In the content analysis model, using raw channel data of a plurality of video content or natural language word information in the video content data to learn indicator data associated with the user response data,
After classifying a content category using video content data of video content for each channel through the learned content analysis model, based on the correlation analysis result between the video content data of the classified content and user response data, the The method for diagnosing a video channel to select a content category having a maximum value of user response data.
제 1 항에 있어서,
상기 d) 단계는
상기 콘텐츠 분석 모델에 복수의 동영상 콘텐츠의 원시 채널 데이터 또는 상기 영상 내용 데이터 내의 자연어 단어 정보를 이용하여 상기 사용자 반응 데이터와 연관된 지표 데이터를 학습하고,
상기 학습된 콘텐츠 분석 모델을 통해 채널별로 각 동영상 콘텐츠에 대한 사용자 반응 데이터의 변화 추이를 시계열로 분석하여, 상기 사용자 반응 데이터의 반응도가 최대값을 갖는 시간대와 동영상 콘텐츠를 선정하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step d)
In the content analysis model, using raw channel data of a plurality of video content or natural language word information in the video content data to learn indicator data associated with the user response data,
A video channel that analyzes a change trend of user response data for each video content for each channel through the learned content analysis model in a time series, and selects a time zone and video content having a maximum responsiveness of the user response data Diagnostic method.
제 1 항에 있어서,
상기 d) 단계는
상기 콘텐츠 분석 모델에 복수의 동영상 콘텐츠의 원시 채널 데이터 또는 상기 영상 내용 데이터 내의 자연어 단어 정보를 이용하여 상기 사용자 반응 데이터와 연관된 지표 데이터를 학습하고,
상기 학습된 콘텐츠 분석 모델을 통해 동영상 콘텐츠별로 시청자 인구 통계 데이터를 분석하여 연령대 또는 성별 사용자 반응 데이터의 반응도가 최대값을 갖는 동영상 콘텐츠를 선정하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step d)
In the content analysis model, using raw channel data of a plurality of video content or natural language word information in the video content data to learn indicator data associated with the user response data,
By analyzing viewer demographic data for each video content through the learned content analysis model, video content having a maximum reactivity of user response data by age or gender is selected.
제 1 항에 있어서,
상기 e) 단계는
상기 콘텐츠 분석 모델을 통해 학습된 타 채널의 동영상 콘텐츠들의 학습된 채널 분석 결과와 상기 사용자 단말의 채널에 해당되는 동영상 콘텐츠의 채널 분석 결과 간의 영상 유사도를 산출하고, 상기 산출된 영상 유사도 중 최상위의 유사 동영상 콘텐츠들을 추출하며, 상기 추출된 유사 동영상 콘텐츠들을 이용한 비교 학습을 통해 동영상 콘텐츠의 기획, 제작, 편집, 노출 정보를 포함한 채널 성장 가이드 데이터를 제공하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step e)
The image similarity between the channel analysis result of the video content of the other channel learned through the content analysis model and the channel analysis result of the video content corresponding to the channel of the user terminal is calculated, and the highest similarity among the calculated image similarity To extract video contents and provide channel growth guide data including planning, production, editing, and exposure information of video contents through comparative learning using the extracted similar video contents.
제 11 항에 있어서,
상기 영상 유사도는 코사인 유사도, L1 거리(L1 Distance or Manhattan Distance), L2 거리(L2 Distance or Euclidean Distance) 중 어느 하나를 이용하여 계산하는 것인, 동영상 채널 진단 방법.
The method of claim 11,
The image similarity is calculated by using any one of cosine similarity, L1 distance (L1 Distance or Manhattan Distance), and L2 distance (L2 Distance or Euclidean Distance).
제 11 항에 있어서,
상기 e) 단계는
상기 유사 동영상 콘텐츠들 중 적어도 하나 이상의 동영상 콘텐츠를 가이드 콘텐츠로 제공하되, 상기 동영상 콘텐츠의 카테고리별로 상기 가이드 콘텐츠를 제공하는 것인, 동영상 채널 진단 방법.
The method of claim 11,
Step e)
A method for diagnosing a video channel by providing at least one video content among the similar video content as guide content, and providing the guide content for each category of the video content.
제 13 항에 있어서,
상기 유사 동영상 콘텐츠들에 대한 사용자 반응 데이터를 이용한 트렌드 분석을 통해 가이드 콘텐츠를 선별하는 것인, 동영상 채널 진단 방법.
The method of claim 13,
A method for diagnosing a video channel, wherein guide content is selected through trend analysis using user response data for the similar video content.
제 11 항에 있어서,
상기 e) 단계는
상기 유사 동영상 콘텐츠들에 대한 사용자 반응 데이터 중 조회수, 시청 시간, 긍정 비율을 포함한 인기 지표를 이용하여 인기 순서를 결정하고, 상기 결정된 인기 순서로 상기 유사 동영상 콘텐츠들을 정렬하고, 것인, 동영상 채널 진단 방법.
The method of claim 11,
Step e)
A popularity order is determined by using a popularity index including views, viewing time, and affirmative ratio among user reaction data for the similar video contents, and the similar video contents are arranged in the determined popularity order, and video channel diagnosis Way.
제 1 항에 있어서,
상기 e) 단계는,
상기 동영상 콘텐츠에 대한 긍정/부정 반응, 재미, 공감을 포함한 사용자 반응 데이터에 레이블 데이터를 지정하고, 해당 동영상 콘텐츠를 시청한 시청자들에 의한 긍정/부정 반응 점수, 재미 점수, 공감 점수를 포함한 점수 매기기를 통해 동영상 콘텐츠에 대한 레이블 데이터로 학습하고, 학습된 레이블 데이터를 이용하여 동영상 콘텐츠를 평가하는 것인, 동영상 채널 진단 방법.
The method of claim 1,
Step e),
Label data is assigned to user reaction data including positive/negative reactions, fun, and empathy for the video content, and score including positive/negative reaction scores, fun scores, and empathy scores by viewers who watched the video content A method for diagnosing a video channel, which is to learn as label data for video content through and evaluate the video content using the learned label data.
사용자 단말에 의해 적어도 하나의 채널 상에 배포된 동영상 콘텐츠를 분석하는 동영상 채널 진단 시스템에 있어서,
동영상 채널 진단 방법을 수행하기 위한 프로그램이 기록된 메모리; 및
상기 프로그램을 실행하기 위한 프로세서를 포함하며,
상기 프로세서는, 상기 프로그램의 실행에 의해,
상기 사용자 단말로부터 채널 진단 요청 정보가 수신되면, 복수의 사용자 단말들 간에 상기 동영상 콘텐츠를 공유하기 위한 채널을 제공하는 동영상 콘텐츠 플랫폼을 통해 사용자 인증을 수행하고,
상기 사용자 인증이 완료되면, 상기 사용자 인증 정보를 이용하여 상기 사용자 단말이 관리하는 적어도 하나 이상의 채널에 대한 스크래핑(Scraping)을 수행하여 원시 채널 데이터(Raw channel data)를 획득하고,
상기 원시 채널 데이터에 포함된 상기 동영상 콘텐츠에서 텍스트 정보를 추출한 영상 내용 데이터와 상기 동영상 콘텐츠에 대한 조회 정보, 노출 정보, 시청 패턴 정보를 포함한 사용자 반응 데이터로 생성하여 데이터베이스에 저장하고,
상기 영상 내용 데이터와 사용자 반응 데이터를 이용하여 지표 분석을 수행하는 콘텐츠 분석 모델을 통해 채널별 동영상 콘텐츠에 대한 채널 분석 결과를 산출하고,
상기 산출된 채널 분석 결과에 기초하여 사용자 반응 유도를 위한 콘텐츠의 기획, 제작, 편집, 노출 정보를 포함한 채널 성장 가이드 데이터를 제공하되,
상기 콘텐츠 분석 모델은, 상기 영상 내용 데이터에 대한 콘텐츠 분류를 수행하고, 상기 영상 내용 데이터와 사용자 반응 데이터 간의 상관관계를 분석하여 상기 동영상 콘텐츠별 사용자 반응에 따른 시청 패턴에 대한 채널 분석 결과를 제공하는 것인, 동영상 채널 진단 시스템.
In the video channel diagnosis system for analyzing video content distributed on at least one channel by a user terminal,
A memory in which a program for performing a video channel diagnosis method is recorded; And
And a processor for executing the program,
The processor, by executing the program,
When channel diagnosis request information is received from the user terminal, user authentication is performed through a video content platform that provides a channel for sharing the video content between a plurality of user terminals,
When the user authentication is completed, scraping is performed on at least one channel managed by the user terminal using the user authentication information to obtain raw channel data,
Generated as image content data extracted from the text information from the video content included in the raw channel data and user response data including inquiry information, exposure information, and viewing pattern information for the video content, and stored in a database,
Calculate a channel analysis result for video content for each channel through a content analysis model that performs index analysis using the video content data and user response data,
Provide channel growth guide data including planning, production, editing, and exposure information for content planning, production, editing, and exposure information for inducing user reaction based on the calculated channel analysis result,
The content analysis model performs content classification on the video content data, analyzes a correlation between the video content data and user response data, and provides a channel analysis result for a viewing pattern according to a user response for each video content. That, video channel diagnosis system.
제 17 항에 있어서,
상기 프로세서의 제어에 의해 텍스트, 테이블 또는 그래프 형태의 채널 분석 결과 보고서를 화면 출력하는 표시 모듈을 더 포함하는 것인, 동영상 채널 진단 시스템.
The method of claim 17,
The video channel diagnosis system further comprising a display module for outputting a channel analysis result report in the form of a text, a table, or a graph under the control of the processor.
제 18 항에 있어서,
상기 프로세서는,
상기 채널 분석 결과의 시각화 값들을 계산하고, 상기 채널 분석 결과 보고서를 렌더링하여 상기 표시 모듈에 출력하는 것인, 동영상 채널 진단 시스템.
The method of claim 18,
The processor,
Computing visualization values of the channel analysis result, rendering the channel analysis result report, and outputting it to the display module.
제 18 항에 있어서,
상기 프로세서는,
상기 사용자 단말 상에서 상기 채널 분석 결과 보고서가 화면 출력되도록 에이잭스(Asynchronous JavaScript and XML, Ajax) 응답으로 시각화에 필요한 채널 분석 결과 데이터를 추출하여 상기 사용자 단말에 전송하는 것인, 동영상 채널 진단 시스템.
The method of claim 18,
The processor,
A video channel diagnosis system to extract the channel analysis result data required for visualization in response to Asynchronous JavaScript and XML (Ajax) so that the channel analysis result report is displayed on the user terminal and transmit it to the user terminal.
제 17 항에 있어서,
상기 프로세서는
API(Application Programming Interface)를 이용하여 상기 동영상 콘텐츠 플랫폼을 통해 사용자 인증 정보, 채널별 스크래핑을 통한 원시 채널 데이터를 가져오고,
상기 스크래핑이 실패한 경우 상기 사용자 인증 정보를 갱신한 후 상기 갱신된 사용자 인증 정보를 이용하여 상기 동영상 콘텐츠 플랫폼에 스크래핑을 요청하는 것인, 동영상 채널 진단 시스템.
The method of claim 17,
The processor is
Using API (Application Programming Interface), user authentication information and raw channel data through channel-specific scraping are imported through the video content platform,
When the scraping fails, the user authentication information is updated and then the video content platform is requested to scrape using the updated user authentication information.
제 17 항에 있어서,
상기 채널 성장 가이드 데이터는,
상기 채널 분석 결과에 기초하여 타겟팅 대상에 따른 사용자 반응 유도 정보, 영상 평균 시청 시간에 따른 영상 몰입 시간 정보, 영상 재생 시간대별 시청자 잔류 및 이탈 정보 또는 타 채널의 동영상 콘텐츠와의 비교 정보 중 적어도 하나 이상을 포함하는 것인, 동영상 채널 진단 시스템.
The method of claim 17,
The channel growth guide data,
Based on the channel analysis result, at least one of information on inducing user reactions according to targeting targets, information on video immersion time according to average video viewing time, information on viewer retention and departure by video playback time slot, or comparison information with video content of other channels That includes, video channel diagnosis system.
KR1020190066537A 2019-06-05 2019-06-05 System for video channel diagnostics and method thereof KR20200139965A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190066537A KR20200139965A (en) 2019-06-05 2019-06-05 System for video channel diagnostics and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190066537A KR20200139965A (en) 2019-06-05 2019-06-05 System for video channel diagnostics and method thereof

Publications (1)

Publication Number Publication Date
KR20200139965A true KR20200139965A (en) 2020-12-15

Family

ID=73780490

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190066537A KR20200139965A (en) 2019-06-05 2019-06-05 System for video channel diagnostics and method thereof

Country Status (1)

Country Link
KR (1) KR20200139965A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102421022B1 (en) * 2022-04-12 2022-07-14 김보라 Method and apparatus for providing automatic subscriber selection service

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101429446B1 (en) 2013-12-03 2014-08-14 컬처코리아(주) System for creating contents and the method thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101429446B1 (en) 2013-12-03 2014-08-14 컬처코리아(주) System for creating contents and the method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102421022B1 (en) * 2022-04-12 2022-07-14 김보라 Method and apparatus for providing automatic subscriber selection service

Similar Documents

Publication Publication Date Title
Ziegele et al. Linking news value theory with online deliberation: How news factors and illustration factors in news articles affect the deliberative quality of user discussions in SNS’comment sections
US20200074322A1 (en) Methods and systems for using machine-learning extracts and semantic graphs to create structured data to drive search, recommendation, and discovery
US20180082313A1 (en) Systems and methods for prioritizing user reactions to content for response on a social-media platform
CN110012356A (en) Video recommendation method, device and equipment and computer storage medium
US8578415B2 (en) Information providing method, content display terminal, portable terminal, server device, information providing system and program
CA2952465A1 (en) Methods and systems for identifying media assets
US9602886B2 (en) Methods and systems for displaying contextually relevant information from a plurality of users in real-time regarding a media asset
US10986064B2 (en) Ascertaining events in media
CN110248246B (en) Data analysis method and device, computer equipment and computer readable storage medium
KR20210017778A (en) Advertising progress sever, system for progress of advertising service and method thereof
Cheng et al. Television meets facebook: The correlation between tv ratings and social media
JP2018032213A (en) Information processor, information processing system, information processing method and program
Orellana-Rodriguez et al. Mining affective context in short films for emotion-aware recommendation
Mondragon et al. Adaptive contents for interactive TV guided by machine learning based on predictive sentiment analysis of data
Lewis et al. White sportscasters, Black athletes: Race and ESPN’s coverage of college football’s national signing day
CN110489747A (en) A kind of image processing method, device, storage medium and electronic equipment
KR101269205B1 (en) Multilanguage information offer system of one - website
Miller et al. Exploring social television, opinion leaders, and Twitter audience reactions to Diane Sawyer's coming out interview with Caitlyn Jenner
Wang et al. Mind the gap! Confronting the challenges of translational communication research in entertainment-education
JP6059493B2 (en) Information generation system, information generation method, and information generation program
Yoon et al. What content and context factors lead to selection of a video clip? The heuristic route perspective
Rumpf et al. The role of context intensity and working memory capacity in the consumer's processing of brand information in entertainment media
Leppänen et al. Finding and expressing news from structured data
Zhang et al. Seeker: Topic-aware viewing pattern prediction in crowdsourced interactive live streaming
KR20200139965A (en) System for video channel diagnostics and method thereof

Legal Events

Date Code Title Description
E601 Decision to refuse application