WO2021118050A1 - 하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램 - Google Patents

하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램 Download PDF

Info

Publication number
WO2021118050A1
WO2021118050A1 PCT/KR2020/014636 KR2020014636W WO2021118050A1 WO 2021118050 A1 WO2021118050 A1 WO 2021118050A1 KR 2020014636 W KR2020014636 W KR 2020014636W WO 2021118050 A1 WO2021118050 A1 WO 2021118050A1
Authority
WO
WIPO (PCT)
Prior art keywords
real
user
time content
data
content
Prior art date
Application number
PCT/KR2020/014636
Other languages
English (en)
French (fr)
Inventor
강동기
박영근
강화수
박찬우
이진은
전민관
김규환
Original Assignee
강동기
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강동기 filed Critical 강동기
Publication of WO2021118050A1 publication Critical patent/WO2021118050A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments

Definitions

  • the present disclosure relates to automatic highlight image editing, and more particularly, to a computer program for automatically editing highlight images using an artificial neural network.
  • a single creator creates and provides a highlight video by collecting, editing, and summarizing only the interesting parts (highlight parts) from the original video in order to attract the attention of the viewers.
  • interesting parts highlight parts
  • a separate professional editor is employed to produce a highlight video, manpower costs may occur.
  • the criteria for selecting the highlight section from the original content may lack objectivity because the editor's subjective criteria are applied, and the quality of the highlight video generated may vary depending on the editor's competence.
  • the present disclosure has been made in response to the above-described background art, and is intended to provide a computer program for automatically editing a highlight image.
  • a computer program stored in a computer-readable storage medium is disclosed in an embodiment of the present disclosure for solving the above-described problems.
  • the one or more processors When the computer program is executed on one or more processors, the one or more processors cause the one or more processors to perform the following operations for automatically editing a highlight image, the operations comprising: the real-time content from one or more user terminals viewing the real-time content Receiving one or more user reaction data for , identifying one or more highlight sections in the real-time content based on an analysis result of the user reaction data, and generating highlight content based on the one or more highlight sections may include.
  • the user reaction data may be based on at least one of a natural language input or an action input of a user viewing the real-time content, and each user reaction data may be associated with at least a portion of the real-time content. .
  • an operation of receiving external reaction data for at least one of the real-time content or the relevant information of the real-time content, and user reaction data for the real-time content and the external reaction data to the relevant information of the real-time content may further include generating a knowledge base for the related parties of the real-time content by storing in association with the .
  • the external reaction data may be reaction data for at least one of the real-time content or a person concerned with the real-time content, and may be data received through a different channel from the user reaction data for the real-time content.
  • the operation of generating a knowledge base for the related party of the real-time content by storing the user reaction data and the external reaction data for the real-time content in association with the related party information of the real-time content includes the external reaction
  • the knowledge base is created by extracting external narrative information related to the real-time content or related party information of the real-time content from data, and extracting internal narrative information related to the real-time content or related party information of the real-time content from the user response data. It may include an action to create.
  • the knowledge base is generated for each of the parties of the real-time content, and is used to identify a user reaction unique to each of the parties, and a semantic analysis of the externally narrated information or the internally narrated information. or based on at least one of quantitative analysis.
  • the identifying one or more highlight sections in the real-time content based on the analysis result of the user reaction data includes the real-time based on at least one of semantic analysis or quantitative analysis of the user reaction data. It may include the operation of identifying one or more highlight sections in the content.
  • the quantitative analysis may be performed based on a threshold determined based at least in part on the number of one or more user terminals viewing the real-time content.
  • the method may further include the operation of pre-processing the user response data based on a knowledge base on the related information of the real-time content.
  • the user reaction data further includes user reaction user identification information related to the user terminal that has transmitted the user reaction data, and based on a result of analysis of the user reaction data, one or more items in the real-time content
  • the operation of identifying the highlight section includes an operation of assigning a weight to each user reaction data based on the user reaction user identification information and an analysis result of the user reaction data based on a weight assigned to each user reaction data. and identifying one or more highlight sections in the real-time content based on the analysis result.
  • the operation of assigning a weight to each user reaction data based on the user reaction user identification information includes a highlight section prediction contribution rate for real-time content of the user who generated the user reaction data, the user's and assigning the weight to each of the user response data based on at least one of a viewing contribution rate for the content matched with the related information of the real-time content and a matching rate for the knowledge base of the user response data.
  • the highlight section prediction contribution rate for the real-time content is information on whether user reaction data is included in the pre-produced highlight content in relation to the related party of the real-time content, and is included in the pre-produced highlight content. It may be calculated based on at least one of quantitative analysis and semantic analysis of the included user response data.
  • the viewing contribution rate for the content matched with the relevant information of the real-time content is information about the participation history of each of the one or more user terminals for the content matched with the relevant information of the real-time content, wherein the matching It may be calculated based on the number of contents and the participation history.
  • the matching rate of the user reaction data to the knowledge base may be calculated based on determination of a similarity between the user reaction data and at least one of external and internal narration information included in the knowledge base. .
  • a method of automatically editing a highlight image performed by one or more processors of a computing device includes receiving one or more user response data for the real-time content from one or more user terminals viewing the real-time content, and identifying one or more highlight sections in the real-time content based on an analysis result of the user reaction data. and generating highlight content based on the one or more highlight sections.
  • a server for automatically editing a highlight image includes a processor including one or more cores, a memory including program codes executable in the processor, and a network unit for transmitting and receiving data to and from a user terminal and an external server, and the processor is one for viewing real-time content Receive one or more user reaction data for the real-time content from the user terminal, identify one or more highlight sections in the real-time content based on an analysis result of the user reaction data, and based on the one or more highlight sections You can create highlight content.
  • the present disclosure may provide a computer program for automatically editing a highlight image.
  • FIG. 1 is a block diagram of a computing device for automatically editing a highlight image according to an embodiment of the present disclosure.
  • FIG. 2 is an exemplary diagram for explaining a method of identifying a highlight section based on user reaction data related to real-time content related to an embodiment of the present disclosure.
  • FIG. 3 is an exemplary diagram for explaining a method of identifying a highlight section based on user reaction data related to real-time content related to an embodiment of the present disclosure related to another embodiment of the present disclosure.
  • FIG. 4 is a diagram exemplarily illustrating a method of allocating different weights to each of user response data related to an embodiment of the present disclosure.
  • FIG. 5 is a schematic diagram illustrating a network function according to an embodiment of the present disclosure.
  • FIG. 6 is a flowchart for generating highlight content related to an embodiment of the present disclosure.
  • FIG. 7 is a diagram illustrating logic for implementing a method for generating highlight content related to an embodiment of the present disclosure.
  • FIG. 8 depicts a simplified, general schematic diagram of an exemplary computing environment in which embodiments of the present disclosure may be implemented.
  • a component can be, but is not limited to being, a process running on a processor, a processor, an object, a thread of execution, a program, and/or a computer.
  • an application running on a computing device and the computing device may be a component.
  • One or more components may reside within a processor and/or thread of execution.
  • a component may be localized within one computer.
  • a component may be distributed between two or more computers.
  • these components can execute from various computer readable media having various data structures stored therein.
  • Components may communicate via a network such as the Internet with another system, for example via a signal having one or more data packets (eg, data and/or signals from one component interacting with another component in a local system, distributed system, etc.) may communicate via local and/or remote processes depending on the data being transmitted).
  • a network such as the Internet with another system
  • one or more data packets eg, data and/or signals from one component interacting with another component in a local system, distributed system, etc.
  • the network function of the present disclosure and an artificial neural network and a neural network may be used interchangeably.
  • the streaming server, one or more user terminals and one or more streamer terminals and computing device 100 may transmit and receive data through an interconnection through a wireless and/or wired connection. have.
  • the user terminal may be a terminal related to a plurality of users viewing real-time content transmitted from the streamer terminal.
  • the user terminal may access the streaming server to view real-time content transmitted from the streamer terminal, and may transmit user response data related to the real-time content to the streaming server.
  • the streamer terminal may be a terminal related to a streamer for transmitting real-time content to a plurality of user terminals.
  • the streamer terminal may transmit various real-time content such as video content and audio content through a streaming server.
  • the user terminal and the streamer terminal may include a personal computer (PC), a notebook (note book), a mobile terminal, a smart phone, a tablet PC, etc., It may include all types of terminals capable of accessing a wired/wireless network.
  • PC personal computer
  • notebook note book
  • mobile terminal a smart phone
  • tablet PC etc.
  • It may include all types of terminals capable of accessing a wired/wireless network.
  • the detailed description of the user terminal and the streamer terminal described above is only an example, and the present disclosure is not limited thereto.
  • the streaming server may be a server that provides a service for transmitting and viewing real-time content through the Internet that interconnects real-time content related to each of one or more streamer terminals to each of one or more user terminals related to content viewing.
  • the streaming server may receive user response data related to the corresponding real-time content from each user terminal in relation to the real-time content viewed by each of one or more user terminals and transmit it to the computing device 100 .
  • the streaming server and the computing device 100 may include a streaming server in the computing device 100 according to an embodiment of the present disclosure to perform content transmission and highlight editing image providing functions in one integrated device.
  • the computing device 100 may receive user response data for real-time content from one or more user terminals.
  • the computing device 100 may generate a highlight edited image of the streamer's real-time content.
  • the computing device 100 may identify highlight sections of interest to viewers in the streamer's real-time content, and generate a highlight edited image based on the identified highlight sections.
  • the computing device 100 of the present disclosure may include all kinds of computing devices capable of calculating data in electronic form, for example, general computing devices such as personal computers, server computers, and mobile terminals (smartphones (smartphones) It may include a computing device having limited computing power, such as a smartphone), a tablet (tablet), and the like.
  • a detailed description of a method in which the computing device 100 generates a highlight edited image from real-time content will be described later with reference to the following drawings.
  • the computing device 100 may include a network unit 150 , a processor 110 , and a memory 130 .
  • the above-described components are exemplary, and the scope of the present disclosure is not limited to the above-described components. That is, additional components may be included or some of the above-described components may be omitted depending on implementation aspects for the embodiments of the present disclosure.
  • the computing device 100 may include a network unit 150 for transmitting and receiving data.
  • the network unit 150 may transmit and receive information on real-time content and highlight content according to an embodiment of the present disclosure with at least one of one or more user terminals, a plurality of streamer terminals, and a streaming server.
  • the computing device 100 may receive real-time content and user reaction data related to reactions of a plurality of user terminals viewing real-time content from a streaming server or a streamer terminal through the network unit 150 .
  • the computing device 100 may transmit the highlight content generated in response to the real-time content to the streamer terminal through the network unit 150 .
  • the detailed description of the information transmitted and received by the above-described network unit is only an example, and the present disclosure is not limited thereto.
  • the memory 130 of the computing device 100 may store any type of information generated or determined by the processor 110 and any type of information received by the network unit 150 . Also, the memory 130 may store data supporting various functions of the computing device 100 . The memory 130 may store a plurality of application programs and commands driven by the computing device 100 . At least one of these applications may exist in the computing device 100 from the time of release. For example, the memory 130 may store real-time content and application programs for identifying a highlight section based on user reaction data related to the real-time content. As another example, the memory 130 may store a pre-trained neural network for generating a personalized knowledge base for each streamer of the computing device 100 . The description of the information stored in the above-described memory is only an example, and the present disclosure is not limited thereto.
  • the present disclosure may consist of one or more cores, and a central processing unit (CPU) of a computing device, a general purpose graphics processing unit (GPGPU), a tensor processing unit ( It may include a processor for data analysis and deep learning, such as a tensor processing unit (TPU).
  • the processor 120 may read a computer program stored in the memory 130 and perform data processing for machine learning according to an embodiment of the present disclosure.
  • the processor 120 may perform an operation for learning the neural network.
  • the processor 120 is for learning of a neural network such as processing input data for learning in deep learning (DL), extracting features from input data, calculating an error, and updating the weight of the neural network using backpropagation. calculations can be performed.
  • DL deep learning
  • At least one of a CPU, a GPGPU, and a TPU of the processor 120 may process learning of a network function.
  • the CPU and the GPGPU can process learning of a network function and data classification using the network function together.
  • learning of a network function and data classification using the network function may be processed by using the processors of a plurality of computing devices together.
  • the computer program executed in the computing device according to an embodiment of the present disclosure may be a CPU, GPGPU, or TPU executable program.
  • the computing device 100 may distribute and process a network function using at least one of a CPU, a GPGPU, and a TPU. Also, in an embodiment of the present disclosure, the computing device 100 may distribute and process a network function together with other computing devices. Descriptions of specific details regarding network function distributed processing of the computing device 100 are provided in US patent applications US15/161080 (filed on May 20, 2016) and US15/217475 (filed on July 22, 2016), which are incorporated herein by reference in their entireties. specifically discussed.
  • the processor 120 may typically process the overall operation of the computing device 100 .
  • the processor 120 processes signals, data, information, etc. input or output through the above-described components, or by driving an application program stored in the memory 130, to provide or process appropriate information or functions to the user terminal. have.
  • the processor 110 may receive one or more user reaction data for the real-time content from one or more user terminals viewing the real-time content.
  • the user response data may be based on at least one of a natural language input of a user of a user terminal viewing real-time content or an action input.
  • the user reaction data may include user reaction user identification information related to the user terminal that has transmitted the user reaction data.
  • the user response user identification information may be identification information for distinguishing each of one user terminal viewing real-time content.
  • the user response data may be based on at least one of a natural language input input from a user of the user terminal in association with a part of real-time content, or an action input.
  • the natural language input of the user response data may include a chatting input input from a user of one or more user terminals through a chat window related to real-time content.
  • the action input of the user response data may mean an emoticon input, a donation input (eg, super chat, star balloon, etc.) input from a user of one or more user terminals, and a voice input.
  • the user response data may be a chat input received from the first user terminal through a chat window in association with a first time point in the game content transmitted in real time by the first streamer terminal.
  • the user response data may be a donation input received from the second user terminal in association with the second time point in the communication content transmitted in real time by the second streamer terminal.
  • the processor 110 may receive user response data associated with a portion of the real-time content from each of one or more user terminals viewing the real-time content. In other words, the processor 110 identifies a point in time at which the user reaction data is received in the real-time content through the user reaction data having time correlation with the real-time content, and whether the user reaction data is received from any user terminal. can be identified.
  • the processor 110 may receive external reaction data.
  • the processor 110 may receive external response data related to a post posted in relation to real-time content by one or more user terminals from an external server.
  • the external server is a server that posts information posted through one or more user terminals, and may be, for example, an SNS, a blog, an Internet broadcasting bulletin board, or the like.
  • the detailed description of the above-described external server is only an example, and the present disclosure is not limited thereto.
  • the processor 110 may receive external response data for at least one of real-time content and related information of real-time content from an external server. That is, the external reaction data is reaction data for at least one of real-time content or related information of real-time content, and a user's reaction input through a different channel (eg, a chat window of real-time content) from user reaction data for real-time content. data received over a different channel than the data).
  • a different channel eg, a chat window of real-time content
  • the related party information of real-time content is information for identifying each of a plurality of real-time content exposed to one or more user terminals, and may include, for example, at least one of broadcast content information and streamer identification information.
  • the broadcast content information is information about a category of a broadcast transmitted by a corresponding streamer, and may include, for example, game broadcast content, eating broadcast content, outdoor broadcast content, communication broadcast content, and the like.
  • the streamer identification information is information for identifying the streamer who transmits the content and the performer appearing in the content, information about the name, age, and gender of the streamer and the performer, ID, nickname, nickname of the streamer and the performer may include information about
  • the detailed description of the broadcast content information and the streamer identification information included in the related information of the real-time content described above is only an example, and the present disclosure is not limited thereto.
  • the related information of real-time content includes information that the streamer related to real-time content is 'A streamer', category information related to real-time content is 'invited singer live broadcast', and performer information related to real-time content is ' Singer Hong Gil-dong' may include information.
  • the detailed description of the relationship information of the real-time content described above is only an example, and the present disclosure is not limited thereto.
  • the processor 110 may use real-time content or relevant information of the real-time content as an input to the natural language processing model to determine the meaning and form of a sentence corresponding to the real-time content and the relevant information of the real-time content.
  • the natural language processing model may be composed of one or more network functions learned through a training data set, and may be a model that performs semantic analysis and shape analysis on the input sentence by taking the input sentence as an input.
  • the processor 110 may crawl the real-time content and related information of the real-time content as external response data from an external server based on the meaning and form of a sentence output in response to the real-time content and related information of the real-time content.
  • the processor 110 when the related information of real-time content includes information that the streamer related to the real-time content is 'A streamer' and the performer information related to the real-time content is 'Singer Gil-dong Hong', the processor 110 provides the information These are input to the natural language processing model, and the meaning and form of the sentence corresponding to the corresponding information can be grasped. In this case, the processor 110 may receive, from an external server, a post written in relation to 'A streamer' or 'Hong Gil-dong' corresponding to the meaning and form of the sentence corresponding to the related information of the real-time content.
  • the detailed description of the related information of the real-time content described above is only an example, and the present disclosure is not limited thereto.
  • the processor 110 may obtain external response data corresponding to specific real-time content by selecting and crawling only real-time content from an external server through a natural language processing model or external user reaction data corresponding to relevant information of real-time content. have.
  • the processor 110 may determine the user's reaction of the user terminal to the real-time content based on the external reaction data. Specifically, the processor 110 acquires external response data for at least one of real-time content or related information of real-time content, and grasps the meaning of the external response data through a natural language processing model, so as to obtain one or more real-time content viewers. It may be determined whether the user terminals have a positive or negative response to the real-time content.
  • the processor 110 processes the sentence as an input of the natural language processing model, so that the sentence is It can be determined that the evaluation of Hong Gil-dong contains a negative meaning.
  • Specific description of the above-described external reaction data is only an example, and the present disclosure is not limited thereto.
  • the processor 110 may provide feedback information to a terminal concerned with real-time content corresponding to the external reaction data based on the external reaction data. Specifically, the processor 110 determines whether the user's response to the real-time content of the user terminal is positive or negative through the external reaction data, and provides feedback information to the terminal concerned with the real-time content based on the determined reaction. You can decide to send it.
  • the processor 110 when receiving external response data 'These days, BJ true content is not interesting..' in relation to the second real-time content on SNS, the processor 110 processes the sentence as an input of the natural language processing model, It can be determined that the viewer's reaction to the recent content of BJ True (ie, the streamer) is negative. The processor 110 generates feedback information indicating that there is a need for improvement because the viewer's reaction to the latest content is negative based on the determined reaction, and the terminal concerned with the real-time content (eg, a terminal of BJ True that transmits real-time content) ) can be determined to be transmitted.
  • the terminal concerned with the real-time content eg, a terminal of BJ True that transmits real-time content
  • the processor 110 receives, from an external server, external reaction data related to a post posted in relation to the real-time content by users of one or more user terminals who have viewed the real-time content, thereby reacting the user terminals who have viewed the real-time content. can detect In addition, the processor 110 transmits feedback information to the relevant terminal of the corresponding real-time content based on the external reaction data of the user terminals who have viewed the real-time content, thereby allowing the person concerned with the real-time content to see the viewers' reaction to their content. By making it easy to recognize, it is possible to suggest the direction of improvement for the content. That is, the processor 110 may provide a streamer management effect for managing the streamer through feedback information based on external reaction data.
  • the processor 110 may generate a knowledge base for a person concerned with real-time content. Specifically, the processor 110 may generate a knowledge base for the related party of the real-time content by storing the user reaction data and the external reaction data for the real-time content in association with the related information of the real-time content.
  • a knowledge base is created corresponding to each stakeholder of the real-time content, and the relationship can be used to identify a user response unique to each.
  • the knowledge base may be generated based on at least one of semantic analysis or quantitative analysis of external narration information or internal narration information. That is, the knowledge base may be a combination of keywords reflecting the individual characteristics of each streamer terminal that transmits a real-time video.
  • the processor 110 extracts internal narrative information related to real-time content or relevant information of real-time content from the user reaction data based on at least one of semantic analysis or quantitative analysis of the user reaction data, and the extracted internal A knowledge base can be created by matching the narration information with the relevant information of the real-time content.
  • the processor 110 is a natural language
  • ' ⁇ ' may be a neologism with a negative connotation for the streamer wile (eg, a list of consonants in the sentence 'wield away').
  • the processor 110 extracts internal narration information from the user response data through semantic analysis of the user response data, and matches the extracted internal narration information with the related information of the first real-time content, thereby providing information to the related party of the first real-time content.
  • the detailed description of the above-described user reaction data and internal narrative information extracted from the user reaction data is an example, and the present disclosure is not limited thereto.
  • user reaction data including information on the subject information of the first real-time content as “streamer wilde” and information on the word ‘godweil’ among a plurality of user reaction data received from each of one or more user terminals.
  • the processor 110 determines that a plurality of user reaction data related to real-time content is more exposed through the chat window, and 'God Weil' corresponding to the user reaction data is internally descriptive information can be extracted as
  • the processor 110 may generate a knowledge base on the related party of the first real-time content by matching the extracted internal narration information with the related party information of the first real-time content and storing the same.
  • the processor 110 extracts text semantically suitable to the person concerned with the real-time content as internal narrative information through semantic analysis of a plurality of user response data received from one or more user terminals through a real-time chatting window related to the real-time content. to create a knowledge base.
  • the processor 110 extracts the text frequently exposed in the real-time content as internal narrative information through quantitative analysis of a plurality of user response data received from one or more user terminals through a real-time chat window related to the real-time content as internal narrative information. You can create a base.
  • the processor 110 extracts external narration information related to real-time content or related information of real-time content from the external reaction data based on at least one of semantic analysis or quantitative analysis of the external response data, and extracts the extracted external narration information.
  • a knowledge base can be created by matching with the relevant information of real-time content.
  • the processor 110 may extract external description information of 'Dr ⁇ '.
  • 't ⁇ ' may be a buzzword with a positive meaning for BJ true (eg, 'true up'). That is, the processor 110 extracts external narration information from the external response data through semantic analysis of the external response data, and matches the extracted external narration information with the related information of the second real-time content, thereby providing information to the related party of the second real-time content.
  • the processor 110 extracts a text semantically suitable for a person concerned with the real-time content as external narration information through semantic analysis of a plurality of external response data posted through one or more user terminals in relation to the real-time content, thereby extracting the knowledge base can create
  • the processor 110 displays text frequently exposed in the external server in relation to the real-time content through quantitative analysis of a plurality of external reaction data posted through one or more user terminals to the external server related to the real-time content as external narrative information. can be extracted to create a knowledge base.
  • the processor 110 receives user reaction data and external reaction data from each of the postings of the real-time chat window and the external server in relation to specific real-time content, and performs semantic analysis and quantitative analysis for each of the user reaction data and the external reaction data.
  • the processor 110 extracts internal narration information and external narration information from user response data and external response data, respectively, it is possible to generate a knowledge base corresponding to a person concerned with a specific real-time content.
  • the processor 110 may identify one or more highlight sections in real-time content based on the analysis result of the user reaction data. Specifically, the processor 110 may identify one or more highlight sections in the real-time content based on at least one of semantic analysis or quantitative analysis of the user reaction data.
  • the processor 110 may generate one or more real-time sub-contents by dividing the real-time content into predetermined time intervals. Also, the processor 110 may identify one or more highlight sections in the real-time content based on the semantic analysis of the user response data received in response to each real-time sub content. The processor 110 performs semantic analysis on one or more user response data included in each of the one or more real-time sub-contents, and as a result of the semantic analysis, corresponds to the sub-content with the maximum number of user response data including a positive meaning in each sub-content. The point of view can be identified as a highlight section.
  • the processor 110 divides the first real-time content into five periods and divides the first real-time content into five real-time content.
  • Sub-contents ie, first to fifth real-time sub-contents may be generated.
  • the processor 110 may identify a time point (ie, 1 to 2 minutes) corresponding to the first real-time sub-content as a highlight section. have.
  • a time point ie, 1 to 2 minutes
  • the detailed description of the above-described real-time content, the predetermined time period, and the number of user reaction data is merely an example, and the present disclosure is not limited thereto.
  • the processor 110 may identify one or more highlight sections in real-time content based on quantitative analysis of user reaction data. Specifically, the processor 110 may perform quantitative analysis on the number of user response data received in association with the real-time content, and identify one or more highlight sections in the real-time content based on the quantitative analysis result. The quantitative analysis may be performed based on a threshold determined based at least in part on the number of one or more user terminals viewing the real-time content.
  • the processor 110 may generate one or more real-time sub-contents by dividing the real-time content into predetermined time intervals. Also, the processor 110 may identify one or more real-time sub-contents in which the number of user response data received corresponding to each real-time sub-content exceeds a threshold value among the one or more real-time sub-contents as a highlight section.
  • a threshold value serving as a criterion for identifying a highlight section through quantitative analysis based on the number of user reaction data may be determined based at least in part on the number of one or more user terminals viewing real-time content.
  • the threshold value may have a positive correlation with the number of user terminals viewing the real-time content at a time point corresponding to each real-time sub-content.
  • the threshold which is a criterion for identifying a highlight section through quantitative analysis based on the number of user response data, can be variably adjusted based on the number of user terminals viewing real-time content at a time point corresponding to each sub-content.
  • the threshold may be preset to 50% of the number of user terminals viewing real-time content at a time point corresponding to each real-time sub-content.
  • the threshold value may be 50, and the second real-time content is a time period of 2-3 minutes.
  • the threshold value may be 25. That is, the threshold value was 50 as there were 100 viewers in the 1 to 2 minute interval of the real-time content, but the threshold value can be adjusted to 25 as the number of viewers decreases to 50 in the 2-3 minute interval, which is a later point in time. .
  • the above-described real-time content, sub-content, and specific values of the threshold value and the number of user terminals viewed at a time corresponding to the sub-content are merely examples, and the present disclosure is not limited thereto.
  • the processor 110 converts the first real-time content to the real-time sub content of 14 sections. (that is, the first real-time sub-contents to the fourteenth real-time sub-contents).
  • the number of one or more user terminals viewing the real-time content at a time point corresponding to each of the first to fourth real-time sub-contents may be flexibly changed.
  • a threshold value for each real-time sub-content may be variably adjusted according to a fluid change in the number of user terminals viewing the real-time content at a time point corresponding to each real-time sub-content.
  • the number of a plurality of user response data received from one or more user terminals during the time period corresponding to the A section 210 is 90, and the corresponding section
  • the processor 110 determines that the number of user response data received in the corresponding section exceeds the threshold value
  • Section A 210 may be identified as a highlight section.
  • the processor 110 controls the user received in the corresponding section. It is determined that the number of response data is less than or equal to the threshold value, so that section B 220 may not be identified as a highlight section.
  • the number of a plurality of user response data received from one or more user terminals during the time period corresponding to the C section 230 is 32
  • the processor 110 determines that the number of user response data received in the section exceeds the threshold value. It is determined that the section C 230 can be identified as a highlight section.
  • the B section 220 may not be included in the highlight section despite receiving relatively more user response data compared to the A section 210 and the C section 230 .
  • the processor 110 does not simply identify a section with a large number of user response data received from one or more user terminals as a highlight section, but identifies a section with a high number of user response data compared to the viewer as a highlight section in each section. can That is, even though relatively little user response data is received in section C 230 , the processor 110 may determine that a large amount of user response data has been received in relation to the number of viewers at that time, and may identify it as a highlight section.
  • the processor 110 identifies a change amount of user reaction data for each section of real-time content, and identifies a highlight section based on a point in time when the identified change amount of user reaction data exceeds a threshold change amount.
  • the threshold change amount may be determined based at least in part on the change amount of the number of one or more user terminals viewing the real-time content.
  • the processor 110 may generate one or more real-time sub-contents by dividing the real-time content into predetermined time intervals.
  • the processor 110 may identify one or more real-time sub-contents in which a change amount of user response data received corresponding to each real-time sub-content among one or more real-time sub content exceeds a threshold change amount as one or more highlight sections.
  • the processor 110 converts the second real-time content into real-time sub-contents of 14 sections. (that is, the first real-time sub-contents to the fourteenth real-time sub-contents).
  • the processor 110 may calculate a change amount of the user reaction data based on the user reaction data received from each of the real-time sub-contents.
  • the threshold change amount in each section may be variably adjusted.
  • the processor 110 determines the user corresponding to the section It is determined that the amount of change in the response data exceeds the threshold change amount, so that the A section 310 and the B section 320 can be identified as the highlight section. In an additional embodiment, the processor 110 may identify only the section B 320 as the highlight section.
  • the amount of change in the plurality of user response data received from one or more user terminals during the time period corresponding to the C section 330 and the D section 340 is 2
  • the processor 110 determines that the change amount of the user response data at the time point corresponding to the section is less than the threshold change amount C section 330 and D section 340 ) may not be identified as a highlight section.
  • the highlight It may not be included in the section.
  • the processor 110 does not identify a highlight section based on the number of user response data in each section, but identifies a section in which the amount of change in the user response data is large in each section as a highlight section in relation to the amount of change of the viewer in each section.
  • a different number of viewers may be retained depending on the awareness of the streamer. For example, when user A, a popular streamer, transmits real-time content, an average of 3,000 user terminals can view the content, while user B, an unpopular streamer, receives an average of 50 when sending real-time content. A corresponding user terminal may view the corresponding content. Accordingly, when identifying a highlight section based on the number of user response data received from a user terminal that simply watches real-time content, the highlight section is identified from the real-time content of each streamer as each streamer has a different number of viewers. There is a possibility that the standards for doing so may differ.
  • the processor 110 identifies the highlight section through the amount of change in user response data at each point in time of the real-time content, so that the same criterion for identifying the highlight section from each of the real-time contents of a plurality of streamers having different numbers of viewers is used. can present Accordingly, the processor 110 may identify the highlight section with the same reference for each of the real-time contents of various streamers such as popular streamers and unpopular streamers.
  • the processor 110 may perform pre-processing on user response data received in response to real-time content.
  • the preprocessing of the user reaction data may mean assigning different weights to the user reaction data received from each of one or more user terminals through a chat window related to real-time content.
  • the processor 110 may assign a weight to each user reaction data based on the user reaction user identification information.
  • the processor 110 determines at least one of a highlight section prediction contribution rate for the real-time content of the user who generated the user reaction data, a viewing contribution rate for the content matched with the related information of the user's real-time content, and a matching rate for the knowledge base of the viewer reaction data.
  • a weight may be assigned to each user response data based on one.
  • the highlight section prediction contribution rate for real-time content is information on whether user reaction data is included in the pre-produced highlight content in relation to the person involved in the real-time content, and quantitative analysis of the user reaction data included in the pre-produced highlight content and semantic analysis.
  • the processor 110 controls the first user terminal.
  • a higher weight may be given to the first user response data of the first user terminal to the first real-time content based on the identification information.
  • the process of generating a highlight image by identifying a highlight section from the real-time content pre-produced at the previous time point of the streamer A, including the user reaction data of the first user terminal means that the user reaction data of the first user terminal is the previous real-time It may contribute to identifying a highlight section in the content.
  • the processor 110 determines that the user of the first user terminal is a user who contributes a lot to detecting an interesting part in the real-time content, so that the user reaction data related to the first user terminal is more than the user reaction data related to other user terminals.
  • a relatively high weight can be assigned.
  • the degree of weight given to the user response data related to the first user terminal may be based on at least one of quantitative analysis and semantic analysis.
  • the processor 110 may assign different weights to each of the user reaction data through semantic analysis of each user reaction data.
  • the processor 110 may perform semantic analysis on the first response data of the first user terminal, and as a result of the semantic analysis, the content included in the first response data (ie, 'aaaaaaaa') is real-time content.
  • a weight of '0' may be assigned to the first response data 410 by identifying it as a meaningless sentence not related to . That is, the processor 110 determines that the meaning of the first reaction data 410 is not related to the real-time content, and assigns a weight of '0' to the first reaction data 410 to remove it as noise. By doing so, it is possible to prevent the first reaction data from being counted in the quantitative analysis process.
  • the processor 110 may perform semantic analysis on the second reaction data 420 of the second user terminal, and as a result of the semantic analysis, the content included in the second reaction data 420 (that is, 'this is a highlight') 'Wow') means that the highlight section is more appropriately predicted, and a relatively high weight of '3' may be assigned to the second response data 420 .
  • the processor 110 may perform semantic analysis on the third reaction data 430 of the third user terminal, and as a result of the semantic analysis, the content included in the third reaction data 430 (ie, 'Awesome! !') may be identified as contributing to the highlight section identification, and a weight of '2.5' may be assigned to the third response data 430 .
  • the processor 110 may perform semantic analysis on the fourth reaction data 440 of the fourth user terminal, and as a result of the semantic analysis, the content included in the fourth reaction data 440 (ie, 'What is it? ') may be identified as having a meaning opposite to the highlight section prediction, and a weight of '-1' may be assigned to the fourth response data 440 .
  • the processor 110 may perform semantic analysis on the fifth response data 450 of the fifth user terminal, and as a result of the semantic analysis, the contents included in the fifth response data 450 (that is, 'that is what anyone is doing') ') as having the opposite meaning to the highlight section prediction, so that a weight of '-1' may be assigned to the fifth response data 450 .
  • the processor 110 may remove meaningless user reaction data as noise based on the result of semantic analysis of each of a plurality of user reaction data corresponding to each user terminal included in the pre-made highlight image.
  • a relatively high weight may be given to a user terminal that has predicted more clearly, and a negative weight may be given to user response data having a meaning opposite to that of the highlight section.
  • the detailed description of the above-described user response data of each user terminal and a weight given corresponding thereto is only an example, and the present disclosure is not limited thereto.
  • the processor 110 may Through quantitative analysis of the reaction data, a higher weight may be given to the user reaction data of the fourth user terminal, to which the user reaction data of the third user terminal is inputted more times in the highlight section than the user reaction data of the third user terminal. That is, user reaction data of a user terminal that has inputted user reaction data a greater number of times at a time point corresponding to the highlight section through quantitative analysis of a plurality of user reaction data corresponding to each user terminal included in the pre-produced highlight image. can be given a relatively high weight.
  • the detailed description of the above-described user response data of each user terminal and a weight given corresponding thereto is only an example, and the present disclosure is not limited thereto.
  • the viewing contribution rate for the content matched with the related information of the real-time content is information about the participation history of each of one or more user terminals for the content matched with the relationship between the real-time content information, and is based on the number of matched content and the participation history can be calculated by
  • a user terminal that frequently views content related to a specific streamer may be more likely to recognize an interesting part in a real-time content image of the streamer. Accordingly, the processor 110 determines that each of the plurality of user terminals views the real-time content through the viewing contribution rate for the content matched with the relevant information (ie, information for identifying a particular streamer) of the particular real-time content by each user terminal. Different weights can be given to the user response data of .
  • the processor 110 may give a relatively high weight to the first user terminal. That is, a different weight may be assigned to the user response data of each user terminal based on the degree of the participation history of each user terminal for the content of the previous point in time related to the streamer A.
  • the participation history of the user terminal for the contents matched with the related information of the specific real-time content may be based on whether the user reaction data received from each user terminal is included in the content that was matched with the A streamer and transmitted at the previous point in time. have.
  • the user terminal that has performed chatting input or action input corresponding to user response data in the previous content transmission process related to streamer A has a history of participating in content matched with streamer A by the processor 110 .
  • the detailed description of the content matched to the above-described specific streamer and the participation history of the specific user terminal is merely an example, and the present disclosure is not limited thereto.
  • the matching rate of the viewer reaction data to the knowledge base may be calculated based on the determination of a similarity between the user reaction data and at least one of external narration information and internal narration information included in the knowledge base.
  • the processor 110 may generate a personalized knowledge base for the person concerned with the real-time content, and view the real-time content with at least one of external narration information and internal narration information included in the knowledge base for the person concerned with the real-time content.
  • a different weight may be assigned to each of the plurality of user response data received from each of the one or more user terminals viewing real-time content based on the similarity determination of each of the plurality of user response data received from the one or more user terminals.
  • the knowledge base of the person concerned with the first real-time content includes internal narration information of “Godweil” and external narration information of “T ⁇ ”
  • a plurality of pieces received from one or more user terminals viewing the first real-time content A high weight may be given to user terminals that have inputted user response data including information such as “Godweil” or “Duh” among the user response data of .
  • the knowledge base personalized for each streamer may be composed of buzzwords or new words corresponding to the streamer, the user terminal that has input chatting input and action input related to internal narrative information and external narrative information included in the knowledge base
  • the user may be a user with a high degree of understanding of the content of the corresponding streamer.
  • the processor 110 may give a high weight to the user reaction data of the user terminals that input the user reaction data included in the knowledge base of the person concerned with the real-time content in the process of watching the real-time content.
  • a personalized knowledge base is used for each of the stakeholders of a plurality of real-time contents
  • the specific user reaction data is not valid as user reaction data of the first real-time content, but as user reaction data of the second real-time content can be determined to be valid.
  • each streamer may use a personalized knowledge base to give different weights to each of a plurality of user reaction data.
  • the detailed description of the knowledge base of each person concerned is merely an example, and the present disclosure is not limited thereto.
  • the processor 110 performs pre-processing of adjusting the weights for the user reaction data received in relation to the real-time content and assigns different weights to each of the plurality of user reaction data for identifying the highlight section, thereby making it more sophisticated than the highlight section. can be clearly identified.
  • the processor 110 generates an analysis result for the user reaction data based on a weight assigned to each user reaction data, and selects one or more highlight sections in real-time content based on the analysis result. can be identified. Specifically, the processor 110 assigns different weights to each of the user reaction data through pre-processing of the user reaction data, and generates an analysis result for each of the user reaction data to which the different weights have been given, so as to highlight one or more highlights in real-time content. section can be identified.
  • the first user reaction data and the second user reaction data are received from each of the first user terminal and the second user terminal in relation to the first real-time content, and a weight assigned to each received user reaction data is '
  • the processor 110 may perform quantitative analysis based on user reaction data based on a weight assigned to each user reaction data. That is, a plurality of user reaction data received in the real-time content viewing environment may be recognized as different weights according to weights assigned to each user reaction data in the quantitative analysis process. For example, in the quantitative analysis process, as the weight given to the second user response data is '2', the second user response data may be recognized as having a weight twice that of the first user response data with a weight of '1'. have.
  • each user reaction data is different in the quantitative analysis process according to the weight assigned to each user reaction data. can be recognized as a proportion.
  • the processor 110 may generate highlight content based on one or more highlight sections. Specifically, the processor 110 may generate highlight content including one or more highlight sections identified in the real-time content.
  • the first real-time content corresponds to 5 minutes, and the predetermined time interval is 1 minute
  • the first real-time content includes five real-time sub-contents (that is, the first real-time sub-content to the fifth real-time sub content).
  • the processor 110 corresponds to the first real-time sub content and the fourth real-time sub content. It is possible to create highlight content including a time period. That is, the highlight content generated by the processor 110 may be composed of content at points in time corresponding to 0 to 1 minute and 3 to 4 minutes in the real-time content.
  • the description of specific times of the above-described real-time content and real-time sub content is merely an example, and the present disclosure is not limited thereto.
  • the processor 110 may generate highlight content including at least partially the identified one or more highlight sections. Specifically, the processor 110 may generate highlight content by removing at least a portion of one or more highlight sections identified based on the reproduction time setting information or adding one or more supplementary highlight sections.
  • the reproduction time setting information is information for limiting the reproduction time of the highlight content generated from the real-time content, and may be predetermined based on a user's input requesting the production of the highlight content for the real-time content. For example, when the reproduction time setting information is predetermined by the user as 5 minutes, the processor 110 may generate highlight content having a reproduction time of 5 minutes from the real-time content. That is, the reproduction time setting information may be predetermined in response to a user's request to produce highlight content having a specific reproduction time in relation to the real-time content.
  • the processor 110 removes at least some sections from the identified one or more highlight sections based on the comparison of the play time information of the identified one or more highlight sections and the predetermined play time setting information, or adds a supplementary highlight section You can create highlight content.
  • the processor Step 110 may generate highlight content by removing at least some of the identified three highlight sections.
  • the highlighted section partially removed from among the identified three highlight sections may be based on at least one of semantic analysis and quantitative analysis of user response data corresponding to each section.
  • the processor 110 may generate highlight content in which at least some of the three highlight sections are removed based on the results of semantic analysis and quantitative analysis on a plurality of user response data corresponding to each of the identified three highlight sections. .
  • the processor 110 controls the user from among the identified three highlight sections.
  • the highlight content may be generated by removing the section C (ie, the section corresponding to the eighth real-time sub-content) that is the section in which the reception of response data is least.
  • the processor 110 may identify a supplementary highlight section in sections other than the four identified highlight sections among the second real-time contents.
  • a section identified as a supplementary highlight section in a section other than the identified highlight section may be based on at least one of semantic analysis and quantitative analysis of user response data corresponding to each section. That is, the processor 110 may identify the supplementary highlight section based on the results of semantic analysis and quantitative analysis on a plurality of user response data corresponding to each of the identified four highlight sections. For example, as a result of quantitative analysis of user response data corresponding to each of the identified sections other than the four highlighted sections, the first real-time sub content is the section in which the number of user response data is the largest in sections other than the identified four highlight sections.
  • the processor 110 When it is determined as section A corresponding to , the processor 110 identifies section A as a supplementary highlight section, and adds the supplementary highlight section to the four highlight sections to generate highlight content.
  • the supplemental highlight section may be added to the four highlight sections based on the viewpoint in the real-time content. That is, the processor 110 generates a section A (ie, a section corresponding to the first real-time sub-content), a section D (a section corresponding to the second real-time sub-content), and section E (a section corresponding to the fourth real-time sub-content).
  • section F section corresponding to the fifth real-time sub content
  • section H section corresponding to the ninth real-time sub content
  • the description of specific numerical values for the above-described one or more highlight sections, the predetermined reproduction time setting information, and the number of user response data is merely an example, and the present disclosure is not limited thereto.
  • the processor 110 may generate highlight content by removing or adding a specific section from the identified highlight section, it may be possible to produce highlight content having a specific reproduction time that meets the user's needs. That is, since it is possible to reproduce the highlight content corresponding to the playback time length desired by the user in the real-time content, the convenience of the user who wants to produce a highlight image may be increased.
  • FIG. 5 is a schematic diagram illustrating a network function related to an embodiment of the present disclosure.
  • a neural network may be composed of a set of interconnected computational units, which may generally be referred to as nodes. These nodes may also be referred to as neurons.
  • a neural network is configured by including at least one or more nodes. Nodes (or neurons) constituting the neural networks may be interconnected by one or more links.
  • one or more nodes connected through a link may relatively form a relationship between an input node and an output node.
  • the concepts of an input node and an output node are relative, and any node in an output node relationship with respect to one node may be in an input node relationship in a relationship with another node, and vice versa.
  • an input node-to-output node relationship may be created around a link.
  • One or more output nodes may be connected to one input node through a link, and vice versa.
  • the value of the output node may be determined based on data input to the input node.
  • a node interconnecting the input node and the output node may have a weight.
  • the weight may be variable, and may be changed by the user or algorithm in order for the neural network to perform a desired function. For example, when one or more input nodes are interconnected to one output node by respective links, the output node sets values input to input nodes connected to the output node and links corresponding to the respective input nodes. An output node value may be determined based on the weight.
  • one or more nodes are interconnected through one or more links to form an input node and an output node relationship within the neural network.
  • the characteristics of the neural network may be determined according to the number of nodes and links in the neural network, the correlation between the nodes and the links, and the value of a weight assigned to each of the links. For example, when the same number of nodes and links exist and there are two neural networks having different weight values between the links, the two neural networks may be recognized as different from each other.
  • a neural network may include one or more nodes. Some of the nodes constituting the neural network may configure one layer based on distances from the initial input node. For example, a set of nodes having a distance n from the initial input node may constitute n layers. The distance from the initial input node may be defined by the minimum number of links that must be traversed to reach the corresponding node from the initial input node. However, the definition of such a layer is arbitrary for description, and the order of the layer in the neural network may be defined in a different way from the above. For example, a layer of nodes may be defined by a distance from the final output node.
  • the initial input node may refer to one or more nodes to which data is directly input without going through a link in a relationship with other nodes among nodes in the neural network.
  • it may mean nodes that other input nodes connected by a link do not have.
  • the final output node may refer to one or more nodes that do not have an output node in relation to other nodes among nodes in the neural network.
  • the hidden node may mean nodes constituting the neural network other than the first input node and the last output node.
  • the neural network according to an embodiment of the present disclosure may be a neural network in which the number of nodes in the input layer may be the same as the number of nodes in the output layer, and the number of nodes decreases and then increases again as progresses from the input layer to the hidden layer.
  • the neural network according to another embodiment of the present disclosure may be a neural network in which the number of nodes in the input layer may be less than the number of nodes in the output layer, and the number of nodes decreases as the number of nodes progresses from the input layer to the hidden layer. have.
  • the neural network according to another embodiment of the present disclosure may be a neural network in which the number of nodes in the input layer may be greater than the number of nodes in the output layer, and the number of nodes increases as the input layer progresses to the hidden layer.
  • the neural network according to another embodiment of the present disclosure may be a neural network in a combined form of the aforementioned neural networks.
  • a deep neural network may refer to a neural network including a plurality of hidden layers in addition to an input layer and an output layer.
  • Deep neural networks can be used to identify the latent structures of data. In other words, it can identify the potential structure of photos, texts, videos, voices, and music (for example, what objects are in the photos, what the text and emotions are, what the texts and emotions are, etc.) .
  • Deep neural networks include convolutional neural networks (CNNs), recurrent neural networks (RNNs), auto encoders, generative adversarial networks (GANs), and restricted Boltzmann machines (RBMs). boltzmann machine), a deep belief network (DBN), a Q network, a U network, a Siamese network, and the like.
  • CNNs convolutional neural networks
  • RNNs recurrent neural networks
  • GANs generative adversarial networks
  • RBMs restricted Boltzmann machines
  • the network function may include an auto-encoder.
  • the auto-encoder may be a kind of artificial neural network for outputting output data similar to input data.
  • the auto encoder may include at least one hidden layer, and an odd number of hidden layers may be disposed between the input/output layers.
  • the number of nodes in each layer may be reduced from the number of nodes of the input layer to an intermediate layer called the bottleneck layer (encoding), and then expanded symmetrically with reduction from the bottleneck layer to the output layer (symmetrically with the input layer).
  • the nodes of the dimension reduction layer and the dimension reconstruction layer may or may not be symmetrical.
  • the auto-encoder can perform non-linear dimensionality reduction.
  • the number of input layers and output layers may correspond to the number of sensors remaining after pre-processing of input data.
  • the number of nodes of the hidden layer included in the encoder may have a structure that decreases as the distance from the input layer increases. If the number of nodes in the bottleneck layer (the layer with the fewest nodes between the encoder and the decoder) is too small, a sufficient amount of information may not be conveyed, so a certain number or more (e.g., more than half of the input layer, etc.) ) may be maintained.
  • the neural network may be trained by at least one of supervised learning, unsupervised learning, and semi-supervised learning.
  • the training of the neural network is to minimize the error in the output.
  • iteratively inputs the training data to the neural network, calculates the output of the neural network and the target error for the training data, and calculates the error of the neural network from the output layer of the neural network to the input layer in the direction to reduce the error. It is a process of updating the weight of each node in the neural network by backpropagation in the direction.
  • teacher learning learning data in which the correct answer is labeled in each learning data is used (ie, labeled learning data), and in the case of comparative learning, the correct answer may not be labeled in each learning data.
  • learning data in the case of teacher learning related to data classification may be data in which categories are labeled in each of the learning data.
  • Labeled training data is input to the neural network, and an error can be calculated by comparing the output (category) of the neural network with the label of the training data.
  • an error may be calculated by comparing the input training data with the neural network output. The calculated error is back propagated in the reverse direction (ie, from the output layer to the input layer) in the neural network, and the connection weight of each node of each layer of the neural network may be updated according to the back propagation.
  • a change amount of the connection weight of each node to be updated may be determined according to a learning rate.
  • the computation of the neural network on the input data and the backpropagation of errors can constitute a learning cycle (epoch).
  • the learning rate may be applied differently according to the number of repetitions of the learning cycle of the neural network. For example, a high learning rate can be used at the early stage of training of a neural network to increase efficiency by allowing the neural network to quickly acquire a certain level of performance, and a low learning rate can be used to increase accuracy at a later stage of learning.
  • the training data may be a subset of real data (that is, data to be processed using the trained neural network), and thus the error on the training data is reduced, but the error on the real data is reduced.
  • Overfitting is a phenomenon in which errors on actual data increase by over-learning on training data as described above. For example, a phenomenon in which a neural network that has learned a cat by showing a yellow cat does not recognize that it is a cat when it sees a cat other than yellow may be a type of overfitting. Overfitting can act as a cause of increasing errors in machine learning algorithms. In order to prevent such overfitting, various optimization methods can be used. In order to prevent overfitting, methods such as increasing training data, regularization, and dropout in which a part of nodes in the network are omitted in the process of learning may be applied.
  • a computer-readable medium storing a data structure is disclosed according to an embodiment of the present disclosure.
  • the data structure may refer to the organization, management, and storage of data that enables efficient access and modification of data.
  • a data structure may refer to an organization of data to solve a specific problem (eg, data retrieval, data storage, and data modification in the shortest time).
  • a data structure may be defined as a physical or logical relationship between data elements designed to support a particular data processing function.
  • the logical relationship between data elements may include a connection relationship between data elements that a user thinks.
  • Physical relationships between data elements may include actual relationships between data elements physically stored on a computer-readable storage medium (eg, a hard disk).
  • a data structure may specifically include a set of data, relationships between data, and functions or instructions applicable to data.
  • a computing device can perform an operation while using the resources of the computing device to a minimum.
  • the computing device may increase the efficiency of operations, reads, insertions, deletions, comparisons, exchanges, and searches through effectively designed data structures.
  • a data structure may be classified into a linear data structure and a non-linear data structure according to the type of the data structure.
  • the linear data structure may be a structure in which only one piece of data is connected after one piece of data.
  • the linear data structure may include a list, a stack, a queue, and a deck.
  • a list may mean a set of data in which an order exists internally.
  • the list may include a linked list.
  • the linked list may be a data structure in which data is linked in such a way that each data is linked in a line with a pointer. In a linked list, a pointer may contain information about a link with the next or previous data.
  • a linked list may be expressed as a single linked list, a doubly linked list, or a circularly linked list according to a shape.
  • a stack can be a data enumeration structure with limited access to data.
  • a stack can be a linear data structure in which data can be processed (eg, inserted or deleted) at only one end of the data structure.
  • the data stored in the stack may be a data structure LIFO-Last in First Out.
  • a queue is a data listing structure that allows limited access to data. Unlike a stack, the queue may be a data structure that comes out later (FIFO-First in First Out) as data stored later.
  • a deck can be a data structure that can process data at either end of the data structure.
  • the nonlinear data structure may be a structure in which a plurality of data is connected after one data.
  • the nonlinear data structure may include a graph data structure.
  • a graph data structure may be defined as a vertex and an edge, and the edge may include a line connecting two different vertices.
  • a graph data structure may include a tree data structure.
  • the tree data structure may be a data structure in which one path connects two different vertices among a plurality of vertices included in the tree. That is, it may be a data structure that does not form a loop in the graph data structure.
  • the data structure may include a neural network.
  • the data structure including the neural network may be stored in a computer-readable medium.
  • Data structures, including neural networks may also include data input to the neural network, weights of the neural network, hyperparameters of the neural network, data obtained from the neural network, activation functions associated with each node or layer of the neural network, and loss functions for learning the neural network.
  • a data structure comprising a neural network may include any of the components disclosed above.
  • the data structure including the neural network includes all or all of the data input to the neural network, the weights of the neural network, hyperparameters of the neural network, data obtained from the neural network, the activation function associated with each node or layer of the neural network, and the loss function for training the neural network may be configured including any combination of
  • a data structure including a neural network may include any other information that determines a characteristic of a neural network.
  • the data structure may include all types of data used or generated in the operation process of the neural network, and is not limited to the above.
  • Computer-readable media may include computer-readable recording media and/or computer-readable transmission media.
  • a neural network may be composed of a set of interconnected computational units, which may generally be referred to as nodes. These nodes may also be referred to as neurons.
  • a neural network is configured by including at least one or more nodes.
  • the data structure may include data input to the neural network.
  • a data structure including data input to the neural network may be stored in a computer-readable medium.
  • the data input to the neural network may include learning data input in a neural network learning process and/or input data input to the neural network in which learning is completed.
  • Data input to the neural network may include pre-processing data and/or pre-processing target data.
  • the preprocessing may include a data processing process for inputting data into the neural network.
  • the data structure may include data to be pre-processed and data generated by pre-processing.
  • the above-described data structure is merely an example, and the present disclosure is not limited thereto.
  • the data structure may include the weights of the neural network.
  • a weight and a parameter may be used interchangeably.
  • a data structure including a weight of a neural network may be stored in a computer-readable medium.
  • the neural network may include a plurality of weights.
  • the weight may be variable, and may be changed by the user or algorithm in order for the neural network to perform a desired function. For example, when one or more input nodes are interconnected to one output node by respective links, the output node sets values input to input nodes connected to the output node and links corresponding to the respective input nodes. An output node value may be determined based on the parameter.
  • the above-described data structure is merely an example, and the present disclosure is not limited thereto.
  • the weight may include a weight variable in a neural network learning process and/or a weight in which neural network learning is completed.
  • the variable weight in the neural network learning process may include a weight at the start of the learning cycle and/or a variable weight during the learning cycle.
  • the weight for which neural network learning is completed may include a weight for which a learning cycle is completed.
  • the data structure including the weight of the neural network may include a data structure including the weight variable in the neural network learning process and/or the weight in which the neural network learning is completed. Therefore, it is assumed that the above-described weights and/or combinations of weights are included in the data structure including the weights of the neural network.
  • the above-described data structure is merely an example, and the present disclosure is not limited thereto.
  • the data structure including the weights of the neural network may be stored in a computer-readable storage medium (eg, memory, hard disk) after being serialized.
  • Serialization can be the process of converting a data structure into a form that can be reconstructed and used later by storing it on the same or a different computing device.
  • the computing device may serialize the data structure to send and receive data over the network.
  • a data structure including weights of the serialized neural network may be reconstructed in the same computing device or in another computing device through deserialization.
  • the data structure including the weights of the neural network is not limited to serialization.
  • the data structure including the weights of the neural network is a data structure to increase the efficiency of computation while using the resources of the computing device to a minimum (e.g., B-Tree, Trie, m-way search tree, AVL tree, Red-Black Tree).
  • a minimum e.g., B-Tree, Trie, m-way search tree, AVL tree, Red-Black Tree.
  • the data structure may include hyper-parameters of the neural network.
  • the data structure including the hyperparameters of the neural network may be stored in a computer-readable medium.
  • the hyperparameter may be a variable variable by a user. Hyperparameters are, for example, learning rate, cost function, number of iterations of the learning cycle, weight initialization (e.g., setting the range of weight values subject to weight initialization), Hidden Unit The number (eg, the number of hidden layers, the number of nodes of the hidden layer) may be included.
  • the above-described data structure is merely an example, and the present disclosure is not limited thereto.
  • FIG. 6 is a flowchart for generating highlight content related to an embodiment of the present disclosure.
  • the computing device 100 may receive one or more user response data to the real-time content from one or more user terminals viewing the real-time content ( 510 ).
  • the computing device 100 may identify one or more highlight sections in real-time content based on the analysis result of the user reaction data ( 520 ).
  • the computing device 100 may generate highlight content based on one or more highlight sections ( 530 ).
  • FIG. 7 is a diagram illustrating logic for implementing a method for generating highlight content related to an embodiment of the present disclosure.
  • the computing device 100 may be implemented by the following logic.
  • the computing device 100 includes a logic 610 for receiving one or more user reaction data for real-time content from one or more user terminals viewing real-time content, and an analysis result of the user reaction data and logic 620 for identifying one or more highlight sections in the real-time content based on , and logic 630 for generating highlight content based on one or more highlight sections.
  • the user reaction data may be based on at least one of a natural language input or an action input of a user viewing the real-time content, and each user reaction data may be associated with at least a portion of the real-time content. .
  • logic for receiving external reaction data for at least one of the real-time content or related party information of the real-time content, and user reaction data and the external reaction data for the real-time content are related to the real-time content person By storing in association with the information, it may further include logic for generating a knowledge base for the related parties of the real-time content.
  • the external reaction data may be reaction data for at least one of the real-time content or a person concerned with the real-time content, and may be data received through a different channel from the user reaction data for the real-time content.
  • the logic for generating the knowledge base for the relevant person of the real-time content may include: The knowledge base by extracting external narrative information related to the real-time content or related party information of the real-time content from reaction data, and extracting internal narrative information related to the real-time content or related party information of the real-time content from the user reaction data It may include logic for creating
  • the knowledge base is generated for each of the parties of the real-time content, and is used to identify a user reaction unique to each of the parties, and a semantic analysis of the externally narrated information or the internally narrated information. or based on at least one of quantitative analysis.
  • the logic for identifying one or more highlight sections in the real-time content based on an analysis result of the user reaction data may include: based on at least one of a semantic analysis or a quantitative analysis of the user reaction data. It may include logic for identifying one or more highlight sections in real-time content.
  • the quantitative analysis may be performed based on a threshold determined based at least in part on the number of one or more user terminals viewing the real-time content.
  • a logic for pre-processing the user reaction data based on a knowledge base of related information of the real-time content may be further included.
  • the user reaction data further includes user reaction user identification information related to the user terminal that has transmitted the user reaction data, and based on a result of analysis of the user reaction data, one or more items in the real-time content
  • the logic for identifying the highlight section includes logic for assigning a weight to each user reaction data based on the user reaction user identification information and an analysis of the user reaction data based on a weight assigned to each of the user reaction data and logic for generating a result and identifying one or more highlight sections in the real-time content based on the analysis result.
  • the logic for assigning a weight to each user reaction data based on the user reaction user identification information may include a highlight section prediction contribution rate for real-time content of the user who generated the user reaction data, the user and logic for assigning the weight to each of the user reaction data based on at least one of a viewing contribution rate for content matched with the related information of the real-time content and a matching rate for the knowledge base of the user reaction data. can do.
  • the highlight section prediction contribution rate for the real-time content is information on whether user reaction data is included in the pre-produced highlight content in relation to the related party of the real-time content, and is included in the pre-produced highlight content. It may be calculated based on at least one of quantitative analysis and semantic analysis of the included user response data.
  • the viewing contribution rate for the content matched with the relevant information of the real-time content is information about the participation history of each of the one or more user terminals for the content matched with the relevant information of the real-time content, wherein the matching It may be calculated based on the number of contents and the participation history.
  • the matching rate of the user reaction data to the knowledge base may be calculated based on determination of a similarity between the user reaction data and at least one of external and internal narration information included in the knowledge base. .
  • logic for implementing the computing device may be implemented by a module, circuit, or means for implementing the computing device.
  • FIG. 8 shows a simplified, general schematic diagram of an exemplary computing environment in which one embodiment of the present disclosure may be implemented, in conjunction with one embodiment of the present disclosure.
  • program modules include routines, procedures, programs, components, data structures, etc. that perform particular tasks or implement particular abstract data types.
  • methods of the present disclosure are suitable for single-processor or multiprocessor computer systems, minicomputers, mainframe computers as well as personal computers, handheld computing devices, microprocessor-based or programmable consumer electronics, etc. (each of which is It will be appreciated that other computer system configurations may be implemented, including those that may operate in connection with one or more associated devices.
  • the described embodiments of the present disclosure may also be practiced in distributed computing environments where certain tasks are performed by remote processing devices that are linked through a communications network.
  • program modules may be located in both local and remote memory storage devices.
  • Computers typically include a variety of computer-readable media. Any medium accessible by a computer may be a computer-readable medium, and the computer-readable medium may include a computer-readable storage medium and a computer-readable transmission medium. Such computer-readable storage media includes volatile and nonvolatile media, removable and non-removable media. Computer readable storage media includes volatile and nonvolatile media, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
  • a computer-readable storage medium may be RAM, ROM, EEPROM, flash memory or other memory technology, CD-ROM, digital video disk (DVD) or other optical disk storage device, magnetic cassette, magnetic tape, magnetic disk storage device, or other magnetic storage device. device, or any other medium that can be accessed by a computer and used to store the desired information.
  • Computer-readable transmission media typically embody computer-readable instructions, data structures, program modules, or other data in a modulated data signal, such as a carrier wave or other transport mechanism. information delivery media.
  • modulated data signal means a signal in which one or more of the characteristics of the signal is set or changed so as to encode information in the signal.
  • computer-readable transmission media includes wired media such as a wired network or direct-wired connection, and wireless media such as acoustic, RF, infrared, and other wireless media. Combinations of any of the above are also intended to be included within the scope of computer-readable transmission media.
  • An example environment 1100 implementing various aspects of the disclosure is shown including a computer 1102 , the computer 1102 including a processing unit 1104 , a system memory 1106 , and a system bus 1108 . do.
  • the system bus 1108 couples system components, including but not limited to system memory 1106 , to the processing device 1104 .
  • the processing device 1104 may be any of a variety of commercially available processors. Dual processor and other multiprocessor architectures may also be used as processing unit 1104 .
  • the system bus 1108 may be any of several types of bus structures that may further interconnect a memory bus, a peripheral bus, and a local bus using any of a variety of commercial bus architectures.
  • System memory 1106 includes read only memory (ROM) 1110 and random access memory (RAM) 1112 .
  • ROM read only memory
  • RAM random access memory
  • a basic input/output system (BIOS) is stored in non-volatile memory 1110, such as ROM, EPROM, EEPROM, etc., which is the basic input/output system (BIOS) that helps transfer information between components within computer 1102, such as during startup. contains routines.
  • BIOS basic input/output system
  • RAM 1112 may also include high-speed RAM, such as static RAM, for caching data.
  • the computer 1102 may also be configured with an internal hard disk drive (HDD) 1114 (eg, EIDE, SATA) - this internal hard disk drive 1114 may also be configured for external use within a suitable chassis (not shown).
  • HDD hard disk drive
  • FDD magnetic floppy disk drive
  • optical disk drive 1120 eg, a CD-ROM
  • the hard disk drive 1114 , the magnetic disk drive 1116 , and the optical disk drive 1120 are connected to the system bus 1108 by the hard disk drive interface 1124 , the magnetic disk drive interface 1126 , and the optical drive interface 1128 , respectively.
  • the interface 1124 for implementing an external drive includes at least one or both of Universal Serial Bus (USB) and IEEE 1394 interface technologies.
  • drives and their associated computer-readable media provide non-volatile storage of data, data structures, computer-executable instructions, and the like.
  • drives and media correspond to storing any data in a suitable digital format.
  • computer readable media refers to HDDs, removable magnetic disks, and removable optical media such as CDs or DVDs, those skilled in the art will use zip drives, magnetic cassettes, flash memory cards, cartridges, etc. It will be appreciated that other tangible computer-readable media such as etc. may also be used in the exemplary operating environment and any such media may include computer-executable instructions for performing the methods of the present disclosure.
  • a number of program modules may be stored in the drive and RAM 1112 , including an operating system 1130 , one or more application programs 1132 , other program modules 1134 , and program data 1136 . All or portions of the operating system, applications, modules, and/or data may also be cached in RAM 1112 . It will be appreciated that the present disclosure may be implemented in various commercially available operating systems or combinations of operating systems.
  • a user may enter commands and information into the computer 1102 via one or more wired/wireless input devices, for example, a pointing device such as a keyboard 1138 and a mouse 1140 .
  • Other input devices may include a microphone, IR remote control, joystick, game pad, stylus pen, touch screen, and the like.
  • these and other input devices are often connected to the processing unit 1104 through an input device interface 1142 that is connected to the system bus 1108, parallel ports, IEEE 1394 serial ports, game ports, USB ports, IR interfaces, It may be connected by other interfaces, etc.
  • a monitor 1144 or other type of display device is also coupled to the system bus 1108 via an interface, such as a video adapter 1146 .
  • the computer typically includes other peripheral output devices (not shown), such as speakers, printers, and the like.
  • Computer 1102 may operate in a networked environment using logical connections to one or more remote computers, such as remote computer(s) 1148 via wired and/or wireless communications.
  • Remote computer(s) 1148 may be workstations, server computers, routers, personal computers, portable computers, microprocessor-based entertainment devices, peer devices, or other common network nodes, and are generally Although including many or all of the components described, only memory storage device 1150 is shown for simplicity.
  • the logical connections shown include wired/wireless connections to a local area network (LAN) 1152 and/or a larger network, eg, a wide area network (WAN) 1154 .
  • LAN and WAN networking environments are common in offices and companies, and facilitate enterprise-wide computer networks, such as intranets, all of which can be connected to a worldwide computer network, for example, the Internet.
  • the computer 1102 When used in a LAN networking environment, the computer 1102 is connected to the local network 1152 through a wired and/or wireless communication network interface or adapter 1156 .
  • Adapter 1156 may facilitate wired or wireless communication to LAN 1152 , which also includes a wireless access point installed therein for communicating with wireless adapter 1156 .
  • the computer 1102 may include a modem 1158 , connected to a communication server on the WAN 1154 , or otherwise establishing communications over the WAN 1154 , such as over the Internet. have the means
  • a modem 1158 which may be internal or external and a wired or wireless device, is coupled to the system bus 1108 via a serial port interface 1142 .
  • program modules described for computer 1102 may be stored in remote memory/storage device 1150 . It will be appreciated that the network connections shown are exemplary and other means of establishing a communication link between the computers may be used.
  • Computer 1102 may be associated with any wireless device or object that is deployed and operates in wireless communication, for example, printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communications satellites, wireless detectable tags. It operates to communicate with any device or place, and phone. This includes at least Wi-Fi and Bluetooth wireless technologies. Accordingly, the communication may be a predefined structure as in a conventional network or may simply be an ad hoc communication between at least two devices.
  • PDAs portable data assistants
  • communications satellites for example, printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communications satellites, wireless detectable tags. It operates to communicate with any device or place, and phone. This includes at least Wi-Fi and Bluetooth wireless technologies. Accordingly, the communication may be a predefined structure as in a conventional network or may simply be an ad hoc communication between at least two devices.
  • Wi-Fi Wireless Fidelity
  • Wi-Fi is a wireless technology such as cell phones that allows these devices, eg, computers, to transmit and receive data indoors and outdoors, ie anywhere within range of a base station.
  • Wi-Fi networks use a radio technology called IEEE 802.11 (a, b, g, etc.) to provide secure, reliable, and high-speed wireless connections.
  • Wi-Fi can be used to connect computers to each other, to the Internet, and to wired networks (using IEEE 802.3 or Ethernet).
  • Wi-Fi networks may operate in unlicensed 2.4 and 5 GHz radio bands, for example, at 11 Mbps (802.11a) or 54 Mbps (802.11b) data rates, or in products that include both bands (dual band). have.
  • the various embodiments presented herein may be implemented as methods, apparatus, or articles of manufacture using standard programming and/or engineering techniques.
  • article of manufacture includes a computer program, carrier, or media accessible from any computer-readable device.
  • computer-readable media include magnetic storage devices (eg, hard disks, floppy disks, magnetic strips, etc.), optical disks (eg, CDs, DVDs, etc.), smart cards, and flash memory. devices (eg, EEPROMs, cards, sticks, key drives, etc.).
  • various storage media presented herein include one or more devices and/or other machine-readable media for storing information.
  • machine-readable medium includes, but is not limited to, wireless channels and various other media capable of storing, holding, and/or carrying instruction(s) and/or data.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

전술한 과제를 해결하기 위한 본 개시의 일 실시예에서, 하나 이상의 프로세서들에 의해 실행 가능한 컴퓨턴 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 상기 하나 이상의 프로세서들로 하여금 하이라이트 영상 자동 편집을 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은: 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하는 동작, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작 및 상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하는 동작을 포함할 수 있다.

Description

하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램
본 개시는 하이라이트 영상 자동 편집에 관한 것으로, 보다 구체적으로 인공 신경망을 활용하여 하이라이트 영상을 자동 편집하기 위한 컴퓨터 프로그램에 관한 것이다.
오늘날, 정보통신 기술의 발달과 함께 인터넷이 대중화되면서 사용자들은 인터넷 환경을 통해 다른 사용자들에게 다양한 정보들을 공유할 수 있게 되었다. 이러한 환경에서 스마트폰의 등장으로 다양한 컨텐츠를 손쉽게 소비할 수 있는 환경이 마련됨에 따라 1인 미디어 기반의 플랫폼이 확산되어 가고 있다.
미디어 플랫폼의 성장에 따라, 인터넷을 통해 개인 방송을 송출하는 1인 크리에이터(또는, 스트리머) 또한 점차 증가하는 추세이다. 이러한 미디어 플랫폼의 성장 및 1인 크리에이터의 증가로, 미디어 컨텐츠의 양이 폭발적으로 증가하였다. 비디오 컨텐츠의 양이 폭발적으로 증가하고 다양한 매체에서 비디오 컨텐츠를 제공함에 따라 시청자는 선호하는 컨텐츠를 선택하여 시청하는 경향이 점점 더 강해지고 있다. 또한, 짧은 시간에 원하는 영상을 선택하여 시청하기 위해서 전체 컨텐츠 중에서 원하는 장면을 하이라이트 표시하는 짧은 비디오 클립을 선호하는 경향 또한 증가하는 추세이다.
이에 따라, 1인 크리에이터는 시청자의 이목을 끌기 위해 원본 영상에서 흥미있는 부분(하이라이트 부분)만을 모아서 편집하여 요약함으로써 하이라이트 영상을 제작하여 제공한다. 하지만, 원본 컨텐츠로부터 하이라이트 영상을 제작하기 위해서는 해당 원본 컨텐츠를 모두 탐색하므로 많은 시간이 소요되며, 컨텐츠에 대한 전문적인 편집 기술을 가지고 있지 않은 크리에이터에게는 하이라이트 영상을 자체 제작하기 어려울 수 있다. 또한, 하이라이트 영상 제작을 위해, 별도의 전문 편집자를 두는 경우, 인력 비용이 발생할 수 있다. 이와 더불어, 원본 컨텐츠에서 하이라이트 구간을 선별하는 기준은 편집자의 주관적인 기준이 적용되어 객관성이 결여될 우려가 있으며, 편집자의 역량에 따라 생성되는 하이라이트 영상의 품질이 달라질 수 있다.
다양한 형태의 미디어에 대한 욕구가 팽창하고 있는 시기에 맞춰, 변화되는 미디어 환경에 대응하여 크리에이터의 원본 컨텐츠에서 하이라이트 구간을 자동으로 식별하여 하이라이트 편집 영상을 자동 생성하는 기술에 대한 수요가 존재할 수 있다.
본 개시는 전술한 배경기술에 대응하여 안출된 것으로, 하이라이트 영상을 자동 편집하기 위한 컴퓨터 프로그램을 제공하기 위한 것이다.
전술한 과제를 해결하기 위한 본 개시의 일 실시예에 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 하나 이상의 프로세서에서 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 하이라이트 영상 자동 편집을 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은: 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하는 동작, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작 및 상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터는, 상기 실시간 컨텐츠를 시청하는 사용자의 자연어 입력, 또는 액션 입력 중 적어도 하나에 기초하며, 각각의 사용자 반응 데이터는 상기 실시간 컨텐츠의 적어도 일부와 연관될 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 정보 중 적어도 하나에 대한 외부 반응 데이터를 수신하는 동작 및 상기 실시간 컨텐츠에 대한 사용자 반응 데이터 및 상기 외부 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 상기 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성하는 동작을 더 포함할 수 있다.
대안적인 실시예에서, 상기 외부 반응 데이터는, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 중 적어도 하나에 대한 반응 데이터로, 상기 실시간 컨텐츠에 대한 사용자 반응 데이터와 상이한 채널을 통해 수신되는 데이터일 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠에 대한 사용자 반응 데이터 및 상기 외부 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 상기 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성하는 동작은, 상기 외부 반응 데이터에서, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 정보와 관련한 외부 서술 정보를 추출하고, 상기 사용자 반응 데이터에서 상기 실시간 컨텐츠 또는 상기 실시간 컨텐츠의 관계자 정보와 관련한 내부 서술 정보를 추출함으로써 상기 지식 베이스를 생성하는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 지식 베이스는, 상기 실시간 컨텐츠의 관계자 각각에 대하여 생성되며, 상기 관계자 각각에 고유한 사용자 반응을 식별하기 위하여 사용되며, 상기 외부 서술 정보 또는 상기 내부 서술 정보에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 생성될 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작은, 상기 사용자 반응 데이터에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 정량 분석은, 상기 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수에 적어도 부분적으로 기초하여 결정되는 임계값에 기초하여 수행될 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보에 대한 지식 베이스에 기초하여 전처리하는 동작을 더 포함할 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터는, 상기 사용자 반응 데이터를 전송한 사용자 단말에 관련한 사용자 반응 사용자 식별 정보를 더 포함하고, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작은, 상기 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여하는 동작 및 사용자 반응 데이터 각각에 부여된 가중치에 기초하여 상기 사용자 반응 데이터에 대한 분석 결과를 생성하고, 상기 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여하는 동작은, 상기 사용자 반응 데이터를 생성한 사용자의 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율, 상기 사용자의 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율 및 상기 사용자 반응 데이터의 지식 베이스에 대한 매칭률 중 적어도 하나에 기초하여 상기 각각의 사용자 반응 데이터에 대한 상기 가중치가 부여되는 동작을 포함할 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율은, 상기 실시간 컨텐츠의 관계자에 관련하여 사전 제작된 하이라이트 컨텐츠에서 사용자 반응 데이터가 포함되는지 여부에 관한 정보이며, 상기 사전 제작된 하이라이트 컨텐츠에 포함된 사용자 반응 데이터에 대한 정량 분석 및 의미 분석 중 적어도 하나에 기초하여 산출될 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율은, 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 상기 하나 이상의 사용자 단말 각각의 참여 이력에 관한 정보로, 상기 매칭된 컨텐츠의 개수 및 상기 참여 이력에 기초하여 산출될 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터의 지식 베이스에 대한 매칭률은, 상기 지식 베이스에 포함된 외부 서술 정보 및 내부 서술 정보 중 적어도 하나와 상기 사용자 반응 데이터의 유사도 판별에 기초하여 산출될 수 있다.
본 개시의 다른 일 실시예에서 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 하이라이트 영상을 자동 편집하는 방법이 개시된다. 상기 방법은, 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하는 단계, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 단계 및 상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하는 단계를 포함할 수 있다.
본 개시의 또 다른 일 실시예에서 하이라이트 영상을 자동 편집하는 서버가 개시된다. 상기 서버는, 하나 이상의 코어를 포함하는 프로세서, 상기 프로세서에서 실행가능한 프로그램 코드들을 포함하는 메모리 및 사용자 단말 및 외부 서버와 데이터를 송수신하는 네트워크부를 포함하고, 그리고 상기 프로세서는, 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하고, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하고, 그리고 상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성할 수 있다.
본 개시는 하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램을 제공할 수 있다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다.
도 1은 본 개시의 일 실시예에 따른 하이라이트 영상을 자동 편집하기 위한 컴퓨팅 장치의 블록 구성도를 도시한다.
도 2는 본 개시의 일 실시예와 관련된 실시간 컨텐츠와 연관된 사용자 반응 데이터에 기초하여 하이라이트 구간을 식별하는 방법을 설명하기 위한 예시적인 도면이다.
도 3은 본 개시의 다른 실시예와 관련된 본 개시의 일 실시예와 관련된 실시간 컨텐츠와 연관된 사용자 반응 데이터에 기초하여 하이라이트 구간을 식별하는 방법을 설명하기 위한 예시적인 도면이다.
도 4는 본 개시의 일 실시예와 관련된 사용자 반응 데이터 각각에 상이한 가중치를 할당하는 방법을 예시적으로 나타낸 도면이다.
도 5는 본 개시의 일 실시예에 따른 네트워크 함수를 나타낸 개략도이다.
도 6은 본 개시의 일 실시예와 관련된 하이라이트 컨텐츠를 생성하기 위한 순서도를 도시한다.
도 7은 본 개시의 일 실시예와 관련된 하이라이트 컨텐츠 생성 방법을 구현하기 위한 로직을 도시한 도면이다.
도 8은 본 개시의 일 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
다양한 실시예들이 이제 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시의 이해를 제공하기 위해서 제시된다. 그러나, 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시 적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시 적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
본 개시의 네트워크 함수와 인공 신경망 및 뉴럴 네트워크(neural network)는 상호 교환 가능하게 사용될 수 있다.
본 개시의 일 실시예에 따르면, 스트리밍 서버, 하나 이상의 사용자 단말 및 하나 이상의 스트리머 단말 및 컴퓨팅 장치(100)는 무선 및/또는 유선을 통한 상호 연결을 통해 데이터를 전송할 수 있고, 그리고 수신할 수 있다.
사용자 단말은, 스트리머 단말로부터 송출되는 실시간 컨텐츠를 시청하는 복수의 사용자와 관련한 단말일 수 있다. 사용자 단말은 스트리밍 서버에 접속하여 스트리머 단말로부터 송출되는 실시간 컨텐츠를 시청할 수 있으며, 실시간 컨텐츠에 연관되는 사용자 반응 데이터를 스트리밍 서버로 송신할 수 있다.
스트리머 단말은, 복수의 사용자 단말에게 실시간 컨텐츠를 송출하기 위한 스트리머에 관련한 단말일 수 있다. 스트리머 단말은, 스트리밍 서버를 통해 비디오 컨텐츠 및 오디오 컨텐츠 등 다양한 실시간 컨텐츠를 송출할 수 있다.
예를 들어, 사용자 단말 및 스트리머 단말은 PC(personal computer), 노트북(note book), 모바일 단말기(mobile terminal), 스마트 폰(smart phone), 태블릿 PC(tablet pc) 등을 포함할 수 있으며, 유/무선 네트워크에 접속할 수 있는 모든 종류의 단말을 포함할 수 있다. 전술한 사용자 단말 및 스트리머 단말에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
스트리밍 서버는 하나 이상의 스트리머 단말 각각에 관련한 실시간 컨텐츠를 컨텐츠 시청에 관련한 하나 이상의 사용자 단말 각각에 상호 연계하는 인터넷을 통해 실시간 컨텐츠 송출 및 시청 서비스를 제공하는 서버일 수 있다. 또한, 스트리밍 서버는 하나 이상의 사용자 단말 각각이 시청하는 실시간 컨텐츠에 관련하여 각 사용자 단말들로부터 해당 실시간 컨텐츠에 연관된 사용자 반응 데이터를 수신하여 컴퓨팅 장치(100)로 전송할 수 있다. 스트리밍 서버 및 컴퓨팅 장치(100)는 본 개시의 일 실시예에 따라서 스트리밍 서버가 컴퓨팅 장치(100) 내에 포함되어, 컨텐츠 송출 및 하이라이트 편집 영상 제공 기능을 하나의 통합 장치에서 수행할 수도 있다. 이러한 예시에서 스트리밍 서버 및 컴퓨팅 장치(100)가 하나의 통합 장치로 구현되는 경우, 컴퓨팅 장치(100)는 하나 이상의 사용자 단말로부터 실시간 컨텐츠에 대한 사용자 반응 데이터를 수신할 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 스트리머의 실시간 컨텐츠에 대한 하이라이트 편집 영상을 생성할 수 있다. 컴퓨팅 장치(100)는 스트리머의 실시간 컨텐츠에서 시청자들의 흥미를 가지는 하이라이트 구간들을 식별하고, 식별된 하이라이트 구간들에 기초하여 하이라이트 편집 영상을 생성할 수 있다. 본 개시의 컴퓨팅 장치(100)는 전자 형태의 데이터를 연산할 수 있는 모든 종류의 컴퓨팅 장치를 포함할 수 있으며, 예를 들어, 퍼스널 컴퓨터, 서버 컴퓨터 등의 일반 컴퓨팅 장치 및 모바일 단말(스마트폰(smartphone), 태블릿(tablet)) 등의 제한된 연산 능력을 가진 컴퓨팅 장치 등을 포함할 수 있다. 본 개시에서 컴퓨팅 장치(100)가 실시간 컨텐츠로부터 하이라이트 편집 영상을 생성하는 구체적인 방법에 대한 설명은 이하의 도면들을 참조하여 후술하도록 한다.
도 1은 본 개시의 일 실시예의 하이라이트 영상 자동 편집 서비스를 제공하기 위한 컴퓨팅 장치의 블록 구성도이다. 도 1에 도시된 바와 같이, 컴퓨팅 장치(100)는 네트워크부(150), 프로세서(110) 및 메모리(130)를 포함할 수 있다. 전술한 컴포넌트들은 예시적인 것으로, 본 개시내용의 권리범위가 전술한 컴포넌트들로 제한되지 않는다. 즉, 본 개시내용의 실시예들에 대한 구현 양태에 따라서 추가적인 컴포넌트들이 포함되거나 또는 전술한 컴포넌트들 중 일부가 생략될 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 데이터를 송수신하는 네트워크부(150)를 포함할 수 있다. 구체적으로, 네트워크부(150)는 본 개시의 일 실시예에 따른 실시간 컨텐츠 및 하이라이트 컨텐츠에 대한 정보를 하나 이상의 사용자 단말, 복수의 스트리머 단말 및 스트리밍 서버 중 적어도 하나와 송수신할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 네트워크부(150)를 통해 스트리밍 서버 또는, 스트리머 단말로부터 실시간 컨텐츠 및 실시간 컨텐츠를 시청하는 복수의 사용자 단말의 반응과 관련된 사용자 반응 데이터를 수신할 수 있다. 다른 예를 들어, 컴퓨팅 장치(100)는 네트워크부(150)를 통해 실시간 컨텐츠에 대응하여 생성된 하이라이트 컨텐츠를 스트리머 단말로 전송할 수 있다. 전술한 네트워크부가 송수신하는 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
컴퓨팅 장치(100)의 메모리(130)는 프로세서(110)가 생성하거나 결정한 임의의 형태의 정보 및 네트워크부(150)가 수신한 임의의 형태의 정보를 저장할 수 있다. 또한, 메모리(130)는 컴퓨팅 장치(100)의 다양한 기능을 지원하는 데이터들을 저장할 수 있다. 메모리(130)는 컴퓨팅 장치(100)에서 구동되는 다수의 응용 프로그램, 명령어를 저장할 수 있다. 이러한 응용 프로그램 중 적어도 하나는 출시 당시부터 컴퓨팅 장치(100)에 존재할 수 있다. 예를 들어, 메모리(130)는 실시간 컨텐츠 및 실시간 컨텐츠에 연관된 사용자 반응 데이터에 기초하여 하이라이트 구간을 식별하기 위한 응용 프로그램들을 저장하고 있을 수 있다. 다른 예를 들어, 메모리(130)는 컴퓨팅 장치(100)의 스트리머 각각에게 개인화된 지식 베이스를 생성하기 위한 사전 학습된 신경망을 저장하고 있을 수 있다. 전술한 메모리가 저장하는 정보들에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 하나 이상의 코어로 구성될 수 있으며, 컴퓨팅 장치의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치 (GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석, 딥러닝을 위한 프로세서를 포함할 수 있다. 프로세서(120)는 메모리(130)에 저장된 컴퓨터 프로그램을 판독하여 본 개시의 일 실시예에 따른 기계 학습을 위한 데이터 처리를 수행할 수 있다. 본 개시의 일실시예에 따라 프로세서(120)는 신경망의 학습을 위한 연산을 수행할 수 있다. 프로세서(120)는 딥러닝(DL: deep learning)에서 학습을 위한 입력 데이터의 처리, 입력 데이터에서의 피처 추출, 오차 계산, 역전파(backpropagation)를 이용한 신경망의 가중치 업데이트 등의 신경망의 학습을 위한 계산을 수행할 수 있다. 프로세서(120)의 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에서 복수의 컴퓨팅 장치의 프로세서를 함께 사용하여 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에 따른 컴퓨팅 장치에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.
본 개시의 일 실시예에서 컴퓨팅 장치(100)는 CPU, GPGPU, 및 TPU 중 적어도 하나를 이용하여 네트워크 함수를 분산하여 처리할 수 있다. 또한 본 개시의 일 실시예에서 컴퓨팅 장치(100)는 다른 컴퓨팅 장치와 함께 네트워크 함수를 분산하여 처리할 수도 있다. 컴퓨팅 장치(100)의 네트워크 함수 분산 처리에 관한 구체적인 내용에 대한 설명은 본 출원에서 전체가 참조로서 통합되는 미국 특허 출원 US15/161080(출원일 2016.05.20) 및 US15/217475(출원일 2016.07.22)에서 구체적으로 논의된다.
본 개시의 일 실시예에 따르면, 프로세서(120)는 통상적으로 컴퓨팅 장치(100)의 전반적인 동작을 처리할 수 있다. 프로세서(120)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(130)에 저장된 응용 프로그램을 구동함으로써, 사용자 단말에게 적절한 정보 또는, 기능을 제공하거나 처리할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신할 수 있다. 사용자 반응 데이터는 실시간 컨텐츠를 시청하는 사용자 단말의 사용자의 자연어 입력 또는, 액션 입력 중 적어도 하나에 기초한 것일 수 있다. 또한, 사용자 반응 데이터는, 사용자 반응 데이터를 전송한 사용자 단말에 관련한 사용자 반응 사용자 식별 정보를 포함할 수 있다. 사용자 반응 사용자 식별 정보는 실시간 컨텐츠를 시청하는 하나의 사용자 단말 각각을 구별하기 위한 식별 정보일 수 있다.
구체적으로, 사용자 반응 데이터는, 실시간 컨텐츠의 일부와 연관되어 사용자 단말의 사용자로부터 입력된 자연어 입력, 또는 액션 입력 중 적어도 하나에 기초한 것일 수 있다. 예를 들어, 사용자 반응 데이터의 자연어 입력은 실시간 컨텐츠와 관련한 채팅창을 통해 하나 이상의 사용자 단말의 사용자로부터 입력되는 채팅 입력을 포함할 수 있다. 또한, 사용자 반응 데이터의 액션 입력은, 하나 이상의 사용자 단말의 사용자로부터 입력되는 이모티콘 입력, 도네이션(donation) 입력(예컨대, 슈퍼챗, 별풍선 등) 및 음성 입력 등을 의미할 수 있다.
구체적인 예를 들어, 사용자 반응 데이터는 제 1 스트리머 단말이 실시간 송출하는 게임 컨텐츠에서의 제 1 시점에 연관되어 제 1 사용자 단말로부터 채팅창을 통해 수신되는 채팅 입력일 수 있다. 다른 예를 들어, 사용자 반응 데이터는 제 2 스트리머 단말이 실시간 송출하는 소통 컨텐츠에서의 제 2 시점에 연관되어 제 2 사용자 단말로부터 수신되는 도네이션 입력일 수 있다. 전술한 스트리머 단말이 송출하는 컨텐츠 및 이에 대응하는 사용자 반응 데이터에 대한 구체적인 기재는 예시일 뿐, 본 개시의 스트리머가 송출하는 컨텐츠는 이에 제한되지 않으며, 사용자 반응 데이터는, 컨텐츠를 시청하는 사용자 단말로부터 수신할 수 있는 사용자의 반응에 관련한 다양한 정보들을 포함할 수 있다.
즉, 프로세서(110)는 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말 각각으로부터 실시간 컨텐츠의 일부와 연관된 사용자 반응 데이터를 수신할 수 있다. 다시 말해, 프로세서(110)는 실시간 컨텐츠와 시간 연관성을 갖는 사용자 반응 데이터를 통해 실시간 컨텐츠 내에서 사용자 반응 데이터가 수신되는 시점을 식별하고, 그리고 해당 사용자 반응 데이터가 어떠한 사용자 단말로부터 수신되는 데이터인지 여부를 식별할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 외부 반응 데이터를 수신할 수 있다. 프로세서(110)는 하나 이상의 사용자 단말이 실시간 컨텐츠에 관련하여 게시한 게시물에 관련한 외부 반응 데이터를 외부 서버로부터 수신할 수 있다. 외부 서버는 하나 이상의 사용자 단말을 통해 게시되는 정보들을 게시하는 서버로서, 예를 들어, SNS, 블로그, 인터넷 방송 게시판 등일 수 있다. 전술한 외부 서버의 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
구체적으로, 프로세서(110)는 실시간 컨텐츠 또는, 실시간 컨텐츠의 관계자 정보 중 적어도 하나에 대한 외부 반응 데이터를 외부 서버로부터 수신할 수 있다. 즉, 외부 반응 데이터는, 실시간 컨텐츠 또는, 실시간 컨텐츠의 관계자 정보 중 적어도 하나에 대한 반응 데이터로, 실시간 컨텐츠에 대한 사용자 반응 데이터와 상이한 채널(예컨대, 실시간 컨텐츠의 채팅창을 통해 입력되는 사용자의 반응 데이터와 상이한 채널)을 통해 수신되는 데이터일 수 있다.
실시간 컨텐츠의 관계자 정보는, 하나 이상의 사용자 단말들에게 노출되는 복수의 실시간 컨텐츠 각각을 식별하기 위한 정보로, 예를 들어, 방송 컨텐츠 정보 및 스트리머 식별 정보 중 적어도 하나를 포함할 수 있다. 방송 컨텐츠 정보는, 해당 스트리머가 송출하는 방송의 카테고리에 관한 정보로, 예를 들어, 게임 방송 컨텐츠, 먹는 방송 컨텐츠, 야외 방송 컨텐츠, 소통 방송 컨텐츠 등을 포함할 수 있다. 스트리머 식별 정보는, 컨텐츠를 송출하는 스트리머 및 해당 컨텐츠에 출연하는 출연자를 식별하기 위한 정보로, 스트리머 및 출연자의 이름, 나이, 성별에 관한 정보, 스티리머 및 출연자의 ID, 닉네임, 별칭에 관한 정보 등을 포함할 수 있다. 전술한 실시간 컨텐츠의 관계자 정보에 포함된 방송 컨텐츠 정보 및 스트리머 식별 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
구체적인 예를 들어, 실시간 컨텐츠의 관계자 정보는, 실시간 컨텐츠에 관련한 스트리머가 'A 스트리머'라는 정보, 실시간 컨텐츠에 관련한 카테고리 정보가 '초대 가수 라이브 방송'이라는 정보 및 실시간 컨텐츠에 관련한 출연자 정보가 '가수 홍길동'이라는 정보를 포함할 수 있다. 전술한 실시간 컨텐츠의 관계가 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
프로세서(110)는 실시간 컨텐츠, 또는 실시간 컨텐츠의 관계자 정보를 자연어 처리 모델의 입력으로 하여 실시간 컨텐츠 및 실시간 컨텐츠의 관계자 정보에 대응하는 문장의 의미 및 형태를 파악할 수 있다. 자연어 처리 모델은, 학습 데이터 세트를 통해 학습된 하나 이상의 네트워크 함수로 구성될 수 있으며, 입력 문장을 입력으로 하여 입력 문장에 대한 의미 분석 및 형태 분석을 수행하는 모델일 수 있다. 또한, 프로세서(110)는 실시간 컨텐츠 및 실시간 컨텐츠의 관계자 정보에 대응하여 출력된 문장의 의미 및 형태에 기초하여 외부 서버에서 실시간 컨텐츠의 관련된 정보들을 외부 반응 데이터로써 크롤링(crawling)할 수 있다.
구체적인 예를 들어, 실시간 컨텐츠의 관계자 정보가 실시간 컨텐츠에 관련한 스트리머가 'A 스트리머'라는 정보 및 실시간 컨텐츠에 관련한 출연자 정보가 '가수 홍길동'이라는 정보를 포함하는 경우, 프로세서(110)는 해당 정보들을 자연어 처리 모델의 입력으로 하여 해당 정보들에 대응하는 문장의 의미 및 형태를 파악할 수 있다. 이 경우, 프로세서(110)는 외부 서버로부터 실시간 컨텐츠의 관계자 정보에 대응하는 문장의 의미 및 형태와 대응하는 'A 스트리머' 또는, '홍길동'에 관련하여 작성된 게시글을 수신할 수 있다. 전술한 실시간 컨텐츠의 관계자 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(110)는 자연어 처리 모델을 통해 외부 서버로부터 실시간 컨텐츠 또는, 실시간 컨텐츠의 관계자 정보에 대응하는 외부 사용자 반응 데이터 만을 선별하여 크롤링함으로써, 특정 실시간 컨텐츠에 대응하는 외부 반응 데이터를 획득할 수 있다.
또한, 프로세서(110)는 외부 반응 데이터에 기초하여 실시간 컨텐츠에 대한 사용자 단말의 사용자의 반응을 파악할 수 있다. 구체적으로, 프로세서(110)는 실시간 컨텐츠 또는, 실시간 컨텐츠의 관계자 정보 중 적어도 하나에 대한 외부 반응 데이터를 획득하고 자연어 처리 모델을 통해 외부 반응 데이터에 대한 의미를 파악함으로써, 실시간 컨텐츠를 시청한 하나 이상의 사용자 단말들의 실시간 컨텐츠에 대한 반응이 긍정적인지 또는 부정적인지 여부를 판별할 수 있다.
예를 들어, 인터넷 방송 게시판에 제 1 실시간 컨텐츠에 관련하여 '홍길동 노래 못하네'라는 외부 반응 데이터를 수신한 경우, 프로세서(110)는 해당 문장을 자연어 처리 모델의 입력으로 처리함으로써, 해당 문장이 홍길동에 대한 평가가 부정적인 의미를 포함하는 것으로 판별할 수 있다. 전술한 외부 반응 데이터에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
또한, 프로세서(110)는 외부 반응 데이터에 기초하여 해당 외부 반응 데이터에 대응하는 실시간 컨텐츠의 관계자 단말에 피드백 정보를 제공할 수 있다. 구체적으로, 프로세서(110)는 외부 반응 데이터를 통해 사용자 단말의 사용자의 실시간 컨텐츠에 대한 반응이 긍정적인지 또는 부정적인지 여부를 판별하고, 그리고 판별된 반응에 기초하여 실시간 컨텐츠의 관계자 단말에 피드백 정보를 전송할 것을 결정할 수 있다.
구체적인 예를 들어, SNS에 제 2 실시간 컨텐츠에 관련하여 '요즘 BJ 트루 컨텐츠 재미없음..'이라는 외부 반응 데이터를 수신한 경우, 프로세서(110)는 해당 문장을 자연어 처리 모델의 입력으로 처리함으로써, BJ 트루(즉, 스트리머)의 최근 컨텐츠에 대한 시청자들의 반응이 부정적인 것으로 판별할 수 있다. 프로세서(110)는 판별된 반응에 기초하여 최근 컨텐츠에 대한 시청자들의 반응이 부정적이므로, 개선의 여지가 필요하다는 피드백 정보를 생성하여 실시간 컨텐츠의 관계자 단말(예컨대, 실시간 컨텐츠를 송출하는 BJ 트루의 단말)에 전송할 것을 결정할 수 있다. 전술한 외부 반응 데이터 및 피드백 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
다시 말해, 프로세서(110)는 실시간 컨텐츠를 시청한 하나 이상의 사용자 단말의 사용자가 실시간 컨텐츠에 관련하여 게시한 게시물과 관련된 외부 반응 데이터를 외부 서버로부터 수신함으로써, 실시간 컨텐츠를 시청한 사용자 단말들의 반응을 감지할 수 있다. 또한, 프로세서(110)는 실시간 컨텐츠를 시청한 사용자 단말들의 외부 반응 데이터에 기초하여 해당 실시간 컨텐츠의 관계자 단말에 피드백 정보를 전송함으로써, 실시간 컨텐츠의 관계자로 하여금 자신의 컨텐츠에 대한 시청자들의 반응을 보다 용이하게 인지하도록 하여 컨텐츠에 대한 개선의 방향성을 제시할 수 있다. 즉, 프로세서(110)는 외부 반응 데이터에 기초한 피드백 정보를 통해 스트리머를 관리하기 위한 스트리머 매니지먼트 효과를 제공할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성할 수 있다. 구체적으로, 프로세서(110)는 실시간 컨텐츠에 대한 사용자 반응 데이터 및 외부 반응 데이터를 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성할 수 있다.
지식 베이스는 실시간 컨텐츠의 관계자 각각에 대응하여 생성되며, 관계가 각각에 고유한 사용자 반응을 식별하기 위하여 사용될 수 있다. 또한, 지식 베이스는, 외부 서술 정보 또는 내부 서술 정보에 대한 의미 분석 또는, 정량 분석 중 적어도 하나에 기초하여 생성될 수 있다. 즉, 지식 베이스는, 실시간 영상을 송출하는 스트리머 단말 각각의 개인 특성이 반영된 키워드의 조합일 수 있다.
보다 자세히 설명하면, 프로세서(110)는 사용자 반응 데이터에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 사용자 반응 데이터에서 실시간 컨텐츠 또는 실시간 컨텐츠의 관계자 정보와 관련한 내부 서술 정보를 추출하고, 추출된 내부 서술 정보에 대한 실시간 컨텐츠의 관계자 정보에 매칭함으로써 지식 베이스를 생성할 수 있다.
구체적인 예를 들어, 제 1 실시간 컨텐츠의 관계자 정보가 '스트리머 와일'이라는 정보를 포함하며, 사용자 반응 데이터가 '뭐야 엄청 못하네, ㅇㅇㅂㄹ'라는 정보를 포함하는 경우, 프로세서(110)는 자연어 처리 모델을 통해 사용자 반응 데이터에 대한 의미 분석을 수행함으로써, 'ㅇㅇㅂㄹ'라는 내부 서술 정보를 추출할 수 있다. 이 경우, 'ㅇㅇㅂㄹ'는 스트리머 와일에 대한 부정적인 의미를 가진 신조어(예컨대, '와일버려'이라는 문장에서의 자음 나열)일 수 있다. 즉, 프로세서(110)는 사용자 반응 데이터에 대한 의미 분석을 통해 사용자 반응 데이터에서 내부 서술 정보를 추출하고, 추출한 내부 서술 정보를 제 1 실시간 컨텐츠의 관계자 정보에 매칭함으로써, 제 1 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성할 수 있다. 다시 말해, 제 1 실시간 컨텐츠의 관계자의 지식 베이스에는 “ㅇㅇㅂㄹ”라는 부정적인 의미를 포함하는 내부 서술 정보가 매칭되어 저장되어 있을 수 있다. 전술한 사용자 반응 데이터 및 해당 사용자 반응 데이터에서 추출된 내부 서술 정보에 대한 구체적인 기재는 예시일 분, 본 개시는 이에 제한되지 않는다.
다른 예를 들어, 제 1 실시간 컨텐츠의 관계자 정보가 “스트리머 와일”이라는 정보를 포함하며, 하나 이상의 사용자 단말 각각으로부터 수신한 복수의 사용자 반응 데이터 중 '갓와일'라는 정보를 포함하는 사용자 반응 데이터가 사전 설정된 임계 횟수 이상 존재하는 경우, 프로세서(110)는 실시간 컨텐츠와 연관된 복수의 사용자 반응 데이터가 채팅창을 통해 보다 많이 노출되었다고 판단하여 해당 사용자 반응 데이터에 대응하는 '갓와일'을 내부 서술 정보로써 추출할 수 있다. 또한, 프로세서(110)는 추출한 내부 서술 정보를 제 1 실시간 컨텐츠의 관계자 정보에 매칭하여 저장함으로써, 제 1 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성할 수 있다. 다시 말해, 제 1 실시간 컨텐츠의 관계자의 지식 베이스에는 “갓와일”이라는 내부 서술 정보가 매칭되어 저장되어 있을 수 있다. 전술한 사용자 반응 데이터 및 해당 사용자 반응 데이터에서 추출된 내부 서술 정보에 대한 구체적인 기재는 예시일 분, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(110)는 실시간 컨텐츠에 관련한 실시간 채팅창을 통해 하나 이상의 사용자 단말로부터 수신하는 복수의 사용자 반응 데이터에 대한 의미 분석을 통해 해당 실시간 컨텐츠의 관계자에게 의미상 적합한 텍스트를 내부 서술 정보로써 추출하여 지식 베이스를 생성할 수 있다. 또한, 프로세서(110)는 실시간 컨텐츠에 관련한 실시간 채팅창을 통해 하나 이상의 사용자 단말로부터 수신하는 복수의 사용자 반응 데이터에 대한 정량 분석을 통해 해당 실시간 컨텐츠에서 자주 노출되는 텍스트를 내부 서술 정보로써 추출하여 지식 베이스를 생성할 수 있다.
또한, 프로세서(110)는 외부 반응 데이터에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 외부 반응 데이터에서 실시간 컨텐츠 또는 실시간 컨텐츠의 관계자 정보와 관련한 외부 서술 정보를 추출하고, 추출된 외부 서술 정보를 실시간 컨텐츠의 관계자 정보에 매칭함으로써 지식 베이스를 생성할 수 있다.
구체적인 예를 들어, 제 2 실시간 컨텐츠의 관계자 정보가 스트리머가 'BJ 트루'라는 정보를 포함하며, 외부 반응 데이터가 '오늘 트루 방송 대박이였음 ㅋㅋ ㅌㄹㅇ!!!'라는 정보를 포함하는 경우, 프로세서(110)는 자연어 처리 모델을 통해 외부 반응 데이터 대한 의미 분석을 수행함으로써, 'ㅌㄹㅇ'이라는 외부 서술 정보를 추출할 수 있다. 이 경우, 'ㅌㄹㅇ'은 BJ 트루에 대한 긍정적인 의미를 가진 유행어(예컨대, '트루업')일 수 있다. 즉, 프로세서(110)는 외부 반응 데이터에 대한 의미 분석을 통해 외부 반응 데이터에서 외부 서술 정보를 추출하고, 추출한 외부 서술 정보를 제 2 실시간 컨텐츠의 관계자 정보에 매칭함으로써, 제 2 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성할 수 있다. 다시 말해, 제 2 실시간 컨텐츠의 관계자의 지식 베이스에는 'ㅌㄹㅇ'이라는 긍정적인 의미를 포함하는 외부 서술 정보가 매칭되어 저장되어 있을 수 있다. 전술한 외부 반응 데이터 및 해당 외부 반응 데이터에서 추출된 외부 서술 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(110)는 실시간 컨텐츠에 관련하여 하나 이상의 사용자 단말을 통해 게시된 복수의 외부 반응 데이터에 대한 의미 분석을 통해 해당 실시간 컨텐츠의 관계자에게 의미상 적합한 텍스트를 외부 서술 정보로써 추출하여 지식 베이스를 생성할 수 있다. 또한, 프로세서(110)는 실시간 컨텐츠에 관련한 외부 서버에 하나 이상의 사용자 단말을 통해 게시된 복수의 외부 반응 데이터에 대한 정량 분석을 통해 해당 실시간 컨텐츠에 관련하여 외부 서버에서 자주 노출되는 텍스트를 외부 서술 정보로써 추출하여 지식 베이스를 생성할 수 있다.
따라서, 프로세서(110)는 특정 실시간 컨텐츠와 관련하여 실시간 채팅창 및 외부 서버의 게시글 각각에서 사용자 반응 데이터 및 외부 반응 데이터를 수신하고, 사용자 반응 데이터 및 외부 반응 데이터 각각에 대한 의미 분석 및 정량 분석을 통해 사용자 반응 데이터 및 외부 반응 데이터 각각으로부터 내부 서술 정보 및 외부 서술 정보를 추출함으로써, 특정 실시간 컨텐츠의 관계자에 대응하는 지식 베이스를 생성할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 사용자 반응 데이터에 대한 분석 결과에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다. 구체적으로, 프로세서(110)는 사용자 반응 데이터에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다.
자세히 설명하면, 프로세서(110)는 실시간 컨텐츠를 사전 결정된 시간 구간으로 분할하여 하나 이상의 실시간 서브 컨텐츠를 생성할 수 있다. 또한, 프로세서(110)는 각각의 실시간 서브 컨텐츠에 대응하여 수신한 사용자 반응 데이터에 대한 의미 분석에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다. 프로세서(110)는 하나 이상의 실시간 서브 컨텐츠 각각에 포함된 하나 이상의 사용자 반응 데이터에 대응 의미 분석을 수행하고, 의미 분석 결과 각 서브 컨텐츠 내에 긍정적 의미를 포함하는 사용자 반응 데이터의 수가 최대인 서브 컨텐츠에 대응하는 시점을 하이라이트 구간으로 식별할 수 있다.
구체적인 예를 들어, 프로세서(110) 제 1 실시간 컨텐츠가 5분에 대응하는 컨텐츠이며, 사전 결정된 시간 구간이 1분인 경우, 프로세서(110)는 제 1 실시간 컨텐츠를 5개의 구간으로 분할하여 5개의 실시간 서브 컨텐츠(즉, 제 1 실시간 서브 컨텐츠 내지 제 5 실시간 서브 컨텐츠)를 생성할 수 있다. 또한, 제 1 실시간 서브 컨텐츠 내지 제 5 실시간 서브 컨텐츠에 대응하여 1분 동안 수신한 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터에 대한 의미 분석 결과 각각의 실시간 서브 컨텐츠 내에 긍정적 의미를 포함하는 사용자 반응 데이터의 수가 68개, 157개, 23개, 14개, 66개 인 경우, 프로세서(110)는 제 1 실시간 서브 컨텐츠에 대응하는 시점(즉, 1~2분)을 하이라이트 구간으로 식별할 수 있다. 전술한 실시간 컨텐츠, 사전 결정된 시간 구간 및 사용자 반응 데이터의 수에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 사용자 반응 데이터에 대한 정량 분석에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다. 구체적으로, 프로세서(110)는 실시간 컨텐츠와 연관되어 수신한 사용자 반응 데이터의 수에 대한 정량 분석을 수행하고, 정량 분석 결과에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다. 정량 분석은, 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수에 적어도 부분적으로 기초하여 결정되는 임계값에 기초하여 수행될 수 있다.
자세히 설명하면, 프로세서(110)는 실시간 컨텐츠를 사전 결정된 시간 구간으로 분할하여 하나 이상의 실시간 서브 컨텐츠를 생성할 수 있다. 또한, 프로세서(110)는 하나 이상의 실시간 서브 컨텐츠 중 각각의 실시간 서브 컨텐츠에 대응하여 수신한 사용자 반응 데이터의 수가 임계값을 초과하는 하나 이상의 실시간 서브 컨텐츠를 하이라이트 구간으로 식별할 수 있다. 이 경우, 사용자 반응 데이터의 수에 기초한 정량 분석을 통해 하이라이트 구간을 식별하기 위한 기준이 되는 임계값은, 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수에 적어도 부분적으로 기초하여 결정될 수 있다. 임계값은, 각 실시간 서브 컨텐츠에 대응하는 시점에 실시간 컨텐츠를 시청하는 사용자 단말의 수와 양의 상관 관계를 가질 수 있다. 다시 말해, 사용자 반응 데이터의 수에 기초한 정량 분석을 통해 하이라이트 구간을 식별하기 위한 기준이 되는 임계값은 각 서브 컨텐츠에 대응하는 시점에 실시간 컨텐츠를 시청하는 사용자 단말의 수에 기초하여 가변적으로 조정될 수 있다. 예를 들어, 임계값은 각 실시간 서브 컨텐츠에 대응하는 시점에 실시간 컨텐츠를 시청하는 사용자 단말의 수에 50%로 사전 설정될 수 있다. 1~2분의 시간 구간인 제 1 실시간 서브 컨텐츠에 대응하는 시점에 실시간 컨텐츠를 시청하는 사용자 단말의 수가 100명인 경우, 임계값은 50일 수 있으며, 2~3분의 시간 구간인 제 2 실시간 서브 컨텐츠에 대응하는 시점에 실시간 컨텐츠를 시청하는 사용자 단말의 수가 50명인 경우, 임계값은 25일 수 있다. 즉, 실시간 컨텐츠의 1~2분 구간에는 시청자가 100명임에 따라 임계값은 50이였으나, 이후 시점인 2~3분 구간에는 시청자가 수가 50명으로 감소함에 따라 임계값은 25로 조정될 수 있다. 전술한 실시간 컨텐츠, 서브 컨텐츠, 서브 컨텐츠에 대응하는 시점에 시청하는 사용자 단말의 수 및 임계값의 구체적인 수치에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
구체적인 예를 들어, 도 2를 참조하면, 제 1 실시간 컨텐츠가 7분에 대응하는 컨텐츠이며, 사전 결정된 시간 구간이 30초인 경우, 프로세서(110)는 제 1 실시간 컨텐츠를 14개 구간의 실시간 서브 컨텐츠(즉, 제 1 실시간 서브 컨텐츠 내지 제 14 실시간 서브 컨텐츠)로 분할할 수 있다. 또한, 제 1 실시간 서브 컨텐츠 내지 제 14 실시간 서브 컨텐츠 각각에 대응하는 시점에 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수는 유동적으로 변화할 수 있다. 각 실시간 서브 컨텐츠에 대응하는 시점에 실시간 컨텐츠를 시청하는 사용자 단말의 수의 유동적인 변화에 따라 각 실시간 서브 컨텐츠에 대한 임계값이 가변적으로 조정될 수 있다. A 구간(210)(즉, 제 4 실시간 서브 컨텐츠)에 대응하는 시점 구간 동안(즉, 1분 30초 ~ 2분) 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터의 수가 90이며, 해당 구간에 대응하는 시점에 실시간 컨텐츠를 시청한 하나 이상의 사용자 단말의 수가 165임에 따라 임계값이 82인 경우, 프로세서(110)는 해당 구간에서 수신한 사용자 반응 데이터의 수가 임계값을 초과하는 것으로 판단하여 A 구간(210)을 하이라이트 구간으로 식별할 수 있다. 또한, B 구간(220)(즉, 제 10 실시간 서브 컨텐츠)에 대응하는 시점 구간 동안(즉, 4분 30초 ~ 5분) 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터의 수가 142이며, 해당 구간에 대응하는 시점에 실시간 컨텐츠를 시청한 하나 이상의 사용자 단말의 수가 350임에 따라 임계값이 175인(예컨대, 사용자 단말의 수 50%) 경우, 프로세서(110)는 해당 구간에서 수신한 사용자 반응 데이터의 수가 임계값 이하인 것으로 판단하여 B 구간(220)을 하이라이트 구간으로 식별하지 않을 수 있다. 또한, C 구간(230)(즉, 제 12 실시간 서브 컨텐츠)에 대응하는 시점 구간 동안(즉, 5분 30초 ~ 6분) 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터의 수가 32이며, 해당 구간에 대응하는 시점에 실시간 컨텐츠를 시청한 하나 이상의 사용자 단말의 수가 42임에 따라, 임계값이 21인 경우, 프로세서(110)는 해당 구간에서 수신한 사용자 반응 데이터의 수가 임계값을 초과하는 것으로 판단하여 C 구간(230)을 하이라이트 구간으로 식별할 수 있다.
즉, B 구간(220)은 A 구간(210) 및 C 구간(230) 대비 비교적 많은 사용자 반응 데이터를 수신하였음에도 불구하고, 하이라이트 구간에 포함되지 않을 수 있다. 다시 말해, 프로세서(110)는 단순히 하나 이상의 사용자 단말로부터 수신한 사용자 반응 데이터 수에 많은 구간을 하이라이트 구간으로 식별하는 것이 아닌, 각 구간에서 시청자 대비 사용자 반응 데이터의 수가 높은 구간을 하이라이트 구간으로 식별할 수 있다. 즉, C 구간(230)에서는 비교적 적은 사용자 반응 데이터를 수신하였음에도 불구하고, 프로세서(110)는 해당 시점에 시청자 수에 대비하여 많은 사용자 반응 데이터를 수신한 것으로 판별하여 하이라이트 구간으로 식별할 수 있다.
따라서, 1인 미디어의 환경에서 컨텐츠를 시청하는 시청자의 수의 변화에 대응하여 각 구간에 상이한 임계값을 설정하고, 각 구간에 대응하는 상이한 임계값을 기준으로 사용자 반응 데이터의 수에 기초한 정량 분석 결과를 산출함으로써, 하이라이트 구간의 식별 정확도가 향상될 수 있다. 다시 말해, 실시간 컨텐츠에서 시청자들의 반응을 이끄는 주요한 부분이 아닌, 단순히 시청자 수의 증가에 따라 채팅창을 통해 수신되는 사용자 반응 데이터가 많아지는 구간을 하이라이트 구간으로 오 식별하는 우려를 방지할 수 있다. 전술한 도 2를 참조한 하이라이트 구간 식별 방법에 대한 구체적인 기재들은, 본 개시의 이해를 돕기 위한 예시적인 설명일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 다른 실시예에 따르면, 프로세서(110)는 실시간 컨텐츠의 구간 별 사용자 반응 데이터의 변화량을 식별하고, 식별된 사용자 반응 데이터의 변화량이 임계 변화량을 초과하는 시점에 기초하여 하이라이트 구간을 식별할 수 있다. 이 경우, 임계 변화량은 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수의 변화량에 적어도 부분적으로 기초하여 결정될 수 있다.
보다 자세히 설명하면, 프로세서(110)는 실시간 컨텐츠를 사전 결정된 시간 구간으로 분할하여 하나 이상의 실시간 서브 컨텐츠를 생성할 수 있다. 또한, 프로세서(110)는 하나 이상의 실시간 서브 컨텐츠 중 각각의 실시간 서브 컨텐츠에 대응하여 수신한 사용자 반응 데이터의 변화량이 임계 변화량을 초과하는 하나 이상의 실시간 서브 컨텐츠를 하나 이상의 하이라이트 구간으로 식별할 수 있다.
구체적인 예를 들어, 도 3을 참조하면, 제 2 실시간 컨텐츠가 7분에 대응하는 컨텐츠이며, 사전 결정된 시간 구간이 30초인 경우, 프로세서(110)는 제 2 실시간 컨텐츠를 14개 구간의 실시간 서브 컨텐츠(즉, 제 1 실시간 서브 컨텐츠 내지 제 14 실시간 서브 컨텐츠)로 분할할 수 있다. 이 경우, 프로세서(110)는 실시간 서브 컨텐츠 각각에서 수신되는 사용자 반응 데이터에 기초하여 사용자 반응 데이터 변화량을 산출할 수 있다.
예를 들어, A 구간(310)에 대응하여 하나 이상의 사용자 단말로부터 수신한 사용자 반응 데이터가 20이며, B 구간(320)에 대응하여 하나 이상의 사용자 단말로부터 수신한 사용자 반응 데이터가 40인 경우, A 구간(310) 및 B 구간(320)에 대응하는 사용자 반응 데이터의 변화량은 0.67(즉, 도 3의 그래프에서 A 구간(310) 및 B 구간(320)에 대응하는 기울기((40-20)/30))일 수 있다. 또한, 제 1 실시간 서브 컨텐츠 내지 제 14 실시간 서브 컨텐츠 각각에 대응하는 시점에 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수는 유동적으로 변화할 수 있다. 이 경우, 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수가 시점에 따라 유동적으로 변화함에 따라, 각 구간에서의 임계 변화량은 가변적으로 조정될 수 있다.
구체적으로, A 구간(310) 및 B 구간(320)(즉, 제 2 실시간 서브 컨텐츠 및 제 3 실시간 서브 컨텐츠)에 대응하는 시점 구간 동안 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터의 변화량이 0.67((40-20)/30)이며, 해당 구간에 대응하는 시점에 임계 변화량이 0.33인(예컨대, 사용자 단말의 수의 변화량의 50%) 경우, 프로세서(110)는 해당 구간에 대응하는 사용자 반응 데이터의 변화량이 임계 변화량을 초과하는 것으로 판단하여 A 구간(310) 및 B 구간(320)을 하이라이트 구간으로 식별할 수 있다. 추가적인 실시예에서 프로세서(110)는 B 구간(320)만을 하이라이트 구간으로 식별할 수도 있다. 또한, C 구간(330) 및 D 구간(340)(즉, 제 9 실시간 서브 컨텐츠 및 제 10 실시간 서브 컨텐츠)에 대응하는 시점 구간 동안 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터의 변화량이 2이며, 해당 구간에 대응하는 시점에 임계 변화량이 5인 경우, 프로세서(110)는 해당 구간에 대응하는 시점에 사용자 반응 데이터의 변화량이 임계 변화량 미만인 것으로 판단하여 C 구간(330) 및 D 구간(340)을 하이라이트 구간으로 식별하지 않을 수 있다.
즉, C 구간(330) 및 D 구간(340)에 대응하는 시점 구간이 A 구간(310) 및 B 구간(320)에 대응하는 시점 구간 대비 사용자 반응 데이터의 큰 상승 폭이 있었음에도 불구하고, 하이라이트 구간에 포함되지 않을 수 있다. 다시 말해, 프로세서(110)는 각 구간의 사용자 반응 데이터의 수에 기초하여 하이라이트 구간을 식별하는 것이 아닌, 각 구간에서 시청자의 변화량에 대비하여 사용자 반응 데이터의 변화량이 큰 구간을 하이라이트 구간으로 식별할 수 있다. 전술한 도 3을 참조한 하이라이트 구간 식별 방법에 대한 구체적인 기재들은, 본 개시의 이해를 돕기 위한 예시적인 설명일 뿐, 본 개시는 이에 제한되지 않는다.
1인 미디어 컨텐츠 방송 환경에서는 스트리머의 인지도에 따라 상이한 수에 시청자를 보유할 수 있다. 예를 들어, 인기 스트리머인 A 사용자는 실시간 컨텐츠 송출 시, 평균적으로 3천명에 대응하는 사용자 단말이 해당 컨텐츠를 시청할 수 있으며, 비인기 스트리머인 B 사용자는 실시간 컨텐츠 송출 시, 평균적으로 50명에 대응하는 사용자 단말이 해당 컨텐츠를 시청할 수 있다. 이에 따라, 단순히 실시간 컨텐츠를 시청하는 사용자 단말로부터 수신한 사용자 반응 데이터의 수에 기초하여 하이라이트 구간을 식별하는 경우, 스트리머 별로 상이한 시청자 수를 보유함에 따라 각 스트리머의 실시간 컨텐츠로부터 하이라이트 구간을 식별하는 기준이 상이해질 우려가 있다.
즉, 프로세서(110)는 실시간 컨텐츠의 각 시점에서의 사용자 반응 데이터의 변화량을 통해 하이라이트 구간을 식별함으로써, 상이한 시청자 수를 보유한 복수의 스트리머의 실시간 컨텐츠 각각으로부터 하이라이트 구간을 식별하기 위한 동일한 기준을 제시할 수 있다. 따라서, 프로세서(110)는 인기 스트리머 및 비인기 스트리머 등 다양한 스트리머의 실시간 컨텐츠 각각에 대하여 동일한 기준으로 하이라이트 구간을 식별할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 실시간 컨텐츠에 대응하여 수신한 사용자 반응 데이터에 대한 전처리를 수행할 수 있다. 사용자 반응 데이터에 대한 전처리는, 실시간 컨텐츠와 관련한 채팅창을 통해 하나 이상의 사용자 단말 각각으로부터 수신한 사용자 반응 데이터에 상이한 가중치를 할당하는 것을 의미할 수 있다.
구체적으로, 프로세서(110)는 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여할 수 있다. 프로세서(110)는 사용자 반응 데이터를 생성한 사용자의 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율, 사용자의 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율 및 시청자 반응 데이터의 지식 베이스에 대한 매칭률 중 적어도 하나에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여할 수 있다.
실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율은, 실시간 컨텐츠의 관계자에 관련하여 사전 제작된 하이라이트 컨텐츠에서 사용자 반응 데이터가 포함되는지 여부에 관한 정보이며, 사전 제작된 하이라이트 컨텐츠에 포함된 사용자 반응 데이터에 대한 정량 분석 및 의미 분석 중 적어도 하나에 기초하여 산출될 수 있다.
예를 들어, 제 1 실시간 컨텐츠의 관계자인 A 스트리머에 관련하여 이전 시점에 사전 제작된 하이라이트 편집 영상에 제 1 사용자 단말의 사용자 반응 데이터가 포함된 경우, 프로세서(110)는 제 1 사용자 단말의 식별 정보에 기초하여 제 1 실시간 컨텐츠에 대한 제 1 사용자 단말의 제 1 사용자 반응 데이터에 보다 높은 가중치를 부여할 수 있다. A 스트리머의 이전 시점에 사전 제작된 실시간 컨텐츠로부터 하이라이트 구간을 식별하여 하이라이트 영상을 생성하는 과정에서, 제 1 사용자 단말의 사용자 반응 데이터가 포함된다는 것은, 제 1 사용자 단말의 사용자 반응 데이터가 이전 실시간 컨텐츠에서 하이라이트 구간을 식별하는데 기여한 것일 수 있다. 즉, 프로세서(110)는 제 1 사용자 단말의 사용자가 실시간 컨텐츠에서 흥미로운 부분을 감지하는데 많은 기여를 하는 사용자로 판단하여 해당 제 1 사용자 단말에 관련한 사용자 반응 데이터에 다른 사용자 단말에 관련한 사용자 반응 데이터 보다 비교적 높은 가중치를 부여할 수 있다. 이 경우, 제 1 사용자 단말에 관련한 사용자 반응 데이터 부여되는 가중치의 정도는 정량 분석 및 의미 분석 중 적어도 하나에 기초한 것일 수 있다.
구체적인 예를 들어, 도 4를 참조하면, 이전 시점의 실시간 컨텐츠에 대응하여 사전 제작된 하이라이트 편집 영상에 제 1 사용자 단말 내지 제 5 사용자 단말 각각으로부터 채팅창(400)에 대한 채팅 입력을 통해 수신한 5개의 사용자 반응 데이터(제 1 반응 데이터(410), 제 2 반응 데이터(420), 제 3 반응 데이터(430), 제 4 반응 데이터(440) 및 제 5 반응 데이터(450))를 포함하는 경우, 프로세서(110)는 각 사용자 반응 데이터에 대한 의미 분석을 통해 사용자 반응 데이터 각각에 상이한 가중치를 부여할 수 있다. 구체적으로, 프로세서(110)는 제 1 사용자 단말의 제 1 반응 데이터에 대한 의미 분석을 수행할 수 있으며, 의미 분석 결과 제 1 반응 데이터에 포함된 내용(즉, 'ㅏㅏㅏㅏㅏㅏㅏㅏㅏㅏㅏ')이 실시간 컨텐츠와는 관련이 없는 의미 없는 문장으로 식별하여 제 1 반응 데이터(410)에 '0'의 가중치를 부여할 수 있다. 즉, 프로세서(110)는 제 1 반응 데이터(410)가 의미하는 바가, 실시간 컨텐츠와는 관련이 없는 내용인 것으로 판별하여 제 1 반응 데이터(410)에 '0'의 가중치를 부여하여 노이즈로써 제거함으로써, 제 1 반응 데이터가 정량 분석 과정에서 카운팅되지 않도록 할 수 있다. 또한, 프로세서(110)는 제 2 사용자 단말의 제 2 반응 데이터(420)에 대한 의미 분석을 수행할 수 있으며, 의미 분석 결과 제 2 반응 데이터(420)에 포함된 내용(즉, '이건 하이라이트다 우와')이 의미하는 바가 하이라이트 구간을 보다 적절히 예측한 것으로 식별하여 제 2 반응 데이터(420)에 비교적 높은 가중치인 '3'을 부여할 수 있다. 또한, 프로세서(110)는 제 3 사용자 단말의 제 3 반응 데이터(430)에 대한 의미 분석을 수행할 수 있으며, 의미 분석 결과 제 3 반응 데이터(430)에 포함된 내용(즉, '대박!!!!!!!!')이 의미하는 바가 하이라이트 구간 식별에 기여한 것으로 식별하여 제 3 반응 데이터(430)에 '2.5'의 가중치를 부여할 수 있다. 또한, 프로세서(110)는 제 4 사용자 단말의 제 4 반응 데이터(440)에 대한 의미 분석을 수행할 수 있으며, 의미 분석 결과 제 4 반응 데이터(440)에 포함된 내용(즉, '별론데?')이 하이라이트 구간 예측과는 상반되는 의미를 포함하는 것으로 식별하여 제 4 반응 데이터(440)에 '-1'의 가중치를 부여할 수 있다. 또한, 프로세서(110)는 제 5 사용자 단말의 제 5 반응 데이터(450)에 대한 의미 분석을 수행할 수 있으며, 의미 분석 결과 제 5 반응 데이터(450)에 포함된 내용(즉, '저거 누구나 하는거 아님?')이 하이라이트 구간 예측과는 상반되는 의미를 포함하는 것으로 식별하여 제 5 반응 데이터(450)에 '-1'의 가중치를 부여할 수 있다.
즉, 프로세서(110)는 사전 제작된 하이라이트 영상에 포함된 각 사용자 단말에 대응하는 복수의 사용자 반응 데이터 각각에 대한 의미 분석 결과에 기초하여 의미 없는 사용자 반응 데이터를 노이즈로써 제거할 수 있으며, 하이라이트 구간을 보다 명확히 예측한 사용자 단말에 비교적 높은 가중치를 부여할 수 있고, 그리고 하이라이트 구간과 상반되는 의미를 포함하는 사용자 반응 데이터에 음의 가중치를 부여할 수 있다. 전술한 각 사용자 단말의 사용자 반응 데이터 및 이에 대응하여 부여되는 가중치에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
다른 예를 들어, 이전 시점의 실시간 컨텐츠에 대응하여 사전 제작된 하이라이트 컨텐츠에 A 사용자 단말 및 B 사용자 단말로부터 수신한 사용자 반응 데이터가 각각 2회 및 6회 포함되는 경우, 프로세서(110)는 각 사용자 반응 데이터에 대한 정량 분석을 통해 하이라이트 구간에 보다 많은 횟수의 사용자 반응 데이터를 입력한 제 4 사용자 단말의 사용자 반응 데이터에 제 3 사용자 단말의 사용자 반응 데이터 보다 높은 가중치를 부여할 수 있다. 즉, 사전 제작된 하이라이트 영상에 포함된 각 사용자 단말에 대응하는 복수의 사용자 반응 데이터에 대한 정량 분석을 통해 하이라이트 구간에 대응하는 시점에 보다 많은 횟수의 사용자 반응 데이터를 입력한 사용자 단말의 사용자 반응 데이터에 비교적 높은 가중치를 부여할 수 있다. 전술한 각 사용자 단말의 사용자 반응 데이터 및 이에 대응하여 부여되는 가중치에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율은, 실시간 컨텐츠의 관계가 정보와 매칭된 컨텐츠에 대한 하나 이상의 사용자 단말 각각의 참여 이력에 관한 정보로, 매칭된 컨텐츠의 개수 및 참여 이력에 기초하여 산출될 수 있다.
예를 들어, 특정 스트리머에 관련한 컨텐츠를 자주 시청하는 사용자 단말은 해당 스트리머의 실시간 컨텐츠 영상에서 흥미있는 부분을 보다 잘 인지할 가능성이 높을 수 있다. 이에 따라, 프로세서(110)는 각 사용자 단말이 특정 실시간 컨텐츠의 관계자 정보(즉, 특정 스트리머를 식별하기 위한 정보)와 매칭된 컨텐츠에 대한 시청 기여율을 통해 실시간 컨텐츠를 시청하는 복수의 사용자 단말 각각의 사용자 반응 데이터에 상이한 가중치를 부여할 수 있다.
구체적인 예를 들어, A 스트리머에 매칭되어 이전 시점에 송출된 컨텐츠가 30개이며, 제 1 사용자 단말이 A 스트리머에 매칭된 30개의 실시간 컨텐츠 중 27개의 컨텐츠에 대한 참여 이력(또는, 시청 이력)이 존재하는 경우, 프로세서(110)는 제 1 사용자 단말에 비교적 높은 가중치를 부여할 수 있다. 즉, A 스트리머와 관련한 이전 시점의 컨텐츠에 대한 각 사용자 단말의 참여 이력 정도에 기초하여 각 사용자 단말의 사용자 반응 데이터에 상이한 가중치가 할당될 수 있다. 특정 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠들에 대한 사용자 단말의 참여 이력은, A 스트리머에 매칭되어 이전 시점에 송출된 컨텐츠에 각 사용자 단말로부터 수신한 사용자 반응 데이터가 포함되었는지 여부에 기초한 것일 수 있다. 즉, A 스트리머에 관련한 이전 컨텐츠 송출 과정에서 사용자 반응 데이터에 대응하는 채팅 입력 또는, 액션 입력을 수행한 사용자 단말은 프로세서(110)에 의해 A 스트리머와 매칭된 컨텐츠에 대한 참여 이력이 존재하는 것으로 판단될 수 있다. 전술한 특정 스트리머에 매칭된 컨텐츠 및 특정 사용자 단말의 참여 이력에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
시청자 반응 데이터의 지식 베이스에 대한 매칭률은, 지식 베이스에 포함된 외부 서술 정보 및 내부 서술 정보 중 적어도 하나와 사용자 반응 데이터의 유사도 판별에 기초하여 산출될 수 있다.
구체적으로, 프로세서(110)는 실시간 컨텐츠의 관계자에게 개인화된 지식 베이스를 생성할 수 있으며, 실시간 컨텐츠의 관계자에 대한 지식 베이스에 포함된 외부 서술 정보 및 내부 서술 정보 중 적어도 하나와 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 수신하는 복수의 사용자 반응 데이터 각각의 유사도 판별에 기초하여 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말 각각으로부터 수신한 복수의 사용자 반응 데이터 각각에 상이한 가중치를 부여할 수 있다.
예를 들어, 제 1 실시간 컨텐츠의 관계자의 지식 베이스에 “갓와일”이라는 내부 서술 정보 및 “ㅌㄹㅇ”이라는 외부 서술 정보가 포함되는 경우, 제 1 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 수신한 복수의 사용자 반응 데이터 중 “갓와일” 또는, “ㅌㄹㅇ”이라는 정보를 포함하는 사용자 반응 데이터를 입력한 사용자 단말들에게 높은 가중치를 부여할 수 있다. 각 스트리머에게 개인화된 지식 베이스는 스트리머에 대응하는 유행어, 또는 신조어 등으로 구성될 수 있으므로, 지식 베이스에 포함된 내부 서술 정보 및 외부 서술 정보와 관련한 채팅 입력 및 액션 입력을 입력한 사용자 단말의 사용자는, 해당 스트리머의 컨텐츠에 대한 이해도가 높은 사용자일 수 있다. 즉, 프로세서(110)는 실시간 컨텐츠를 시청하는 과정에서 실시간 컨텐츠의 관계자의 지식 베이스에 포함된 사용자 반응 데이터를 입력한 사용자 단말들의 사용자 반응 데이터에 높은 가중치를 부여할 수 있다. 다시 말해, 복수의 실시간 컨텐츠의 관계자 각각에게 개인화된 지식 베이스를 활용하여 특정 실시간 컨텐츠의 관계자에게 유효한 사용자 반응 데이터에 대하여 높은 가중치를 부여할 수 있다. 예를 들어, 복수의 실시간 컨텐츠의 관계자 각각에게 개인화된 지식 베이스를 활용하는 경우, 특정 사용자 반응 데이터가 제 1 실시간 컨텐츠의 사용자 반응 데이터로는 유효하지 않으나, 제 2 실시간 컨텐츠의 사용자 반응 데이터로는 유효하다고 판별할 수 있다. 즉, 스트리머 각각에서 개인화된 지식 베이스를 활용하여 복수의 사용자 반응 데이터 각각에 상이한 가중치를 부여할 수 있다. 전술한 각 관계자의 지식 베이스에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
따라서, 프로세서(110)는 실시간 컨텐츠에 관련하여 수신한 사용자 반응 데이터에 대한 가중치를 조정하는 전처리를 수행하여 하이라이트 구간을 식별하기 위한 복수의 사용자 반응 데이터 각각에 상이한 가중치를 부여함으로써, 하이라이트 구간 보다 정교하게 식별할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 사용자 반응 데이터 각각에 부여된 가중치에 기초하여 사용자 반응 데이터에 대한 분석 결과를 생성하고, 그리고 분석 결과에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다. 구체적으로, 프로세서(110)는 사용자 반응 데이터에 대한 전처리를 통해 사용자 반응 데이터 각각에 상이한 가중치를 부여하고, 그리고 상이한 가중치가 부여된 사용자 반응 데이터 각각에 대한 분석 결과를 생성하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다.
예를 들어, 제 1 실시간 컨텐츠에 관련하여 제 1 사용자 단말 및 제 2 사용자 단말 각각으로부터 제 1 사용자 반응 데이터 및 제 2 사용자 반응 데이터를 수신하고, 그리고 수신한 각 사용자 반응 데이터에 부여된 가중치가 '1' 및 '2'인 경우, 프로세서(110)는 각 사용자 반응 데이터에 부여된 가중치에 기초하여 사용자 반응 데이터에 기초한 정량 분석을 수행할 수 있다. 즉, 실시간 컨텐츠 시청 환경에서 수신한 복수의 사용자 반응 데이터는 정량 분석 과정에서 각 사용자 반응 데이터에 부여된 가중치에 따라 상이한 비중으로 인식될 수 있다. 예를 들어, 정량 분석 과정에서 제 2 사용자 반응 데이터에 부여된 가중치가 '2'임에 따라 제 2 사용자 반응 데이터는, 가중치가 '1' 제 1 사용자 반응 데이터 보다 2배의 비중으로 인식될 수 있다. 다시 말해, 실시간 컨텐츠 시청 환경에서 제 1 사용자 단말 및 제 2 사용자 단말 각각으로부터 하나의 사용자 반응 데이터를 수신할지라도, 각각의 사용자 반응 데이터에 부여된 가중치에 따라 정량 분석 과정에서 각 사용자 반응 데이터가 상이한 비중으로 인식될 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(110)는 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성할 수 있다. 구체적으로, 프로세서(110)는 실시간 컨텐츠에서 식별된 하나 이상의 하이라이트 구간을 포함하는 하이라이트 컨텐츠를 생성할 수 있다.
예를 들어, 제 1 실시간 컨텐츠가 5분에 대응하는 컨텐츠이며, 사전 결정된 시간 구간이 1분임에 따라 제 1 실시간 컨텐츠가 5개의 실시간 서브 컨텐츠(즉, 제 1 실시간 서브 컨텐츠 내지 제 5 실시간 서브 컨텐츠)로 분할되며, 실시간 컨텐츠 중 제 1 실시간 서브 컨텐츠 및 제 4 실시간 서브 컨텐츠에 대응하는 시간 구간이 하이라이트 구간으로 식별된 경우, 프로세서(110)는 제 1 실시간 서브 컨텐츠 및 제 4 실시간 서브 컨텐츠에 대응하는 시간 구간을 포함하는 하이라이트 컨텐츠를 생성할 수 있다. 즉, 프로세서(110)에 의해 생성된 하이라이트 컨텐츠는 실시간 컨텐츠에서 0~1분 및 3~4분에 대응하는 시점의 컨텐츠로 구성될 수 있다. 전술한 실시간 컨텐츠 및 실시간 서브 컨텐츠의 구체적인 시간에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
또한, 프로세서(110)는 식별된 하나 이상의 하이라이트 구간을 적어도 부분적으로 포함하는 하이라이트 컨텐츠를 생성할 수 있다. 구체적으로, 프로세서(110)는 재생 시간 설정 정보에 기초하여 식별된 하나 이상의 하이라이트 구간에서 적어도 일부를 제거하거나, 하나 이상의 보충 하이라이트 구간을 추가하여 하이라이트 컨텐츠를 생성할 수 있다. 재생 시간 설정 정보는, 실시간 컨텐츠로부터 생성되는 하이라이트 컨텐츠의 재생 시간을 한정하기 위한 정보로, 실시간 컨텐츠에 대한 하이라이트 컨텐츠 제작을 요청하는 사용자의 입력에 기초하여 사전 결정될 수 있다. 예를 들어, 재생 시간 설정 정보가 사용자에 의해 5분으로 사전 결정되는 경우, 프로세서(110)는 실시간 컨텐츠로부터 5분의 재생 시간을 가진 하이라이트 컨텐츠를 생성할 수 있다. 즉, 실시간 컨텐츠에 관련하여 특정 재생 시간을 가지는 하이라이트 컨텐츠를 제작하고자 하는 사용자의 요구에 대응하여 재생 시간 설정 정보가 사전 결정될 수 있다.
이에 따라, 프로세서(110)는 식별된 하나 이상의 하이라이트 구간의 재생 시간 정보와 사전 결정된 재생 시간 설정 정보의 비교에 기초하여 식별된 하나 이상의 하이라이트 구간에서 적어도 일부 구간 제거하거나 또는, 보충 하이라이트 구간을 추가하여 하이라이트 컨텐츠를 생성할 수 있다.
예를 들어, 제 1 실시간 컨텐츠에서 프로세서(110)에 의해 식별된 3개의 하이라이트 구간(예컨대, 제 1 실시간 서브 컨텐츠에 대응하는 A 구간, 제 4 실시간 서브 컨텐츠에 대응하는 B 구간 및 제 8 실시간 서브 컨텐츠에 대응하는 C 구간)의 재생 시간 정보가 3분(즉, 3개의 하이라이트 구간의 재생 시간의 총합이 3분)이며, 제 1 실시간 컨텐츠에 대한 사전 결정된 재생 시간 설정 정보가 2분인 경우, 프로세서(110)는 식별된 3개의 하이라이트 구간 중 적어도 일부를 제거하여 하이라이트 컨텐츠를 생성할 수 있다. 이 경우, 식별된 3개의 하이라이트 구간 중 일부 제거되는 하이라이트 구간은, 각 구간에 대응하는 사용자 반응 데이터에 대한 의미 분석 및 정량 분석 중 적어도 하나에 기초한 것일 수 있다. 즉, 프로세서(110)는 식별된 3개의 하이라이트 구간 각각에 대응하는 복수의 사용자 반응 데이터에 대한 의미 분석 및 정량 분석의 결과에 기초하여 3개의 하이라이트 구간 중 적어도 일부를 제거한 하이라이트 컨텐츠를 생성할 수 있다. 예를 들어, 정량 분석의 결과 A 구간, B 구간 및 C 구간 각각에 대응하여 수신한 사용자 반응 데이터의 수 각각이 67, 35, 21인 경우, 프로세서(110)는 식별된 3개의 하이라이트 구간 중 사용자 반응 데이터의 수신이 가장 적은 구간인 C 구간(즉, 제 8 실시간 서브 컨텐츠에 대응하는 구간)을 제거하여 하이라이트 컨텐츠를 생성할 수 있다. 전술한 하나 이상의 하이라이트 구간, 사전 결정된 재생 시간 설정 정보 및 사용자 반응 데이터 수에 대한 구체적인 수치의 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
다른 예를 들어, 제 2 실시간 컨텐츠에서 프로세서(110)에 의해 식별된 4개의 하이라이트 구간(예컨대, 제 2 실시간 서브 컨텐츠에 대응하는 D 구간, 제 4 실시간 서브 컨텐츠에 대응하는 E 구간, 제 5 실시간 서브 컨텐츠에 대응하는 F 구간 및 제 9 실시간 서브 컨텐츠에 대응하는 H 구간)의 재생 시간 정보가 4분(즉, 4개의 하이라이트 구간의 재생 시간의 총합이 4분)이며, 제 2 실시간 컨텐츠에 대한 사전 결정된 재생 시간 설정 정보가 5분인 경우, 프로세서(110)는 제 2 실시간 컨텐츠 중에서 식별된 4개의 하이라이트 구간 이외의 구간에서 보충 하이라이트 구간을 식별할 수 있다. 이 경우, 식별된 하이라이트 구간 이외의 구간에서 보충 하이라이트 구간으로 식별되는 구간은, 각 구간에 대응하는 사용자 반응 데이터에 대한 의미 분석 및 정량 분석 중 적어도 하나에 기초한 것일 수 있다. 즉, 프로세서(110)는 식별된 4개의 하이라이트 구간 각각에 대응하는 복수의 사용자 반응 데이터에 대한 의미 분석 및 정량 분석의 결과에 기초하여 보충 하이라이트 구간을 식별할 수 있다. 예를 들어, 식별된 4개의 하이라이트 구간 이외의 구간들 각각에 대응하는 사용자 반응 데이터의 정량 분석 결과, 식별된 4개의 하이라이트 구간 이외의 구간에서 사용자 반응 데이터의 수가 최대인 구간으로 제 1 실시간 서브 컨텐츠에 대응하는 A 구간으로 결정된 경우, 프로세서(110)는 A 구간을 보충 하이라이트 구간으로 식별하고, 그리고 보충 하이라이트 구간을 4개의 하이라이트 구간에 추가하여 하이라이트 컨텐츠를 생성할 수 있다. 이 경우, 보충 하이라이트 구간은 실시간 컨텐츠에서의 시점에 기초하여 4개의 하이라이트 구간에 추가될 수 있다. 즉, 프로세서(110)는 A 구간(즉, 제 1 실시간 서브 컨텐츠에 대응하는 구간), D 구간(제 2 실시간 서브 컨텐츠에 대응하는 구간), E 구간(제 4 실시간 서브 컨텐츠에 대응하는 구간), F 구간(제 5 실시간 서브 컨텐츠에 대응하는 구간) 및 H 구간(제 9 실시간 서브 컨텐츠에 대응하는 구간) 순으로 배치하여 하이라이트 컨텐츠를 생성할 수 있다. 전술한 하나 이상의 하이라이트 구간, 사전 결정된 재생 시간 설정 정보 및 사용자 반응 데이터 수에 대한 구체적인 수치의 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
따라서, 프로세서(110)는 식별된 하이라이트 구간에서 특정 구간을 제거하거나 추가하여 하이라이트 컨텐츠를 생성할 수 있으므로, 사용자의 요구에 맞는 특정 재생 시간을 가지는 하이라이트 컨텐츠의 제작이 가능해질 수 있다. 즉, 실시간 컨텐츠에서 사용자가 원하는 재생 시간 길이에 대응하는 하이라이트 컨텐츠의 재생이 가능해지므로 하이라이트 영상을 제작하고자 하는 사용자의 편의성이 증대될 수 있다.
도 5는 본 개시의 일 실시예에 관련된 네트워크 함수를 나타낸 개략도이다.
본 명세서에 걸쳐, 연산 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network)는 동일한 의미로 사용될 수 있다. 신경망은 일반적으로 노드라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 노드들은 뉴런(neuron)들로 지칭될 수도 있다. 신경망은 적어도 하나 이상의 노드들을 포함하여 구성된다. 신경망들을 구성하는 노드(또는 뉴런)들은 하나 이상의 링크에 의해 상호 연결될 수 있다.
신경망 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 상술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.
하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호 연결하는 노드는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변 될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.
상술한 바와 같이, 신경망은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호 연결되어 신경망 내에서 입력 노드 및 출력 노드 관계를 형성한다. 신경망 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들 사이의 가중치 값이 상이한 두 신경망이 존재하는 경우, 두 개의 신경망들은 서로 상이한 것으로 인식될 수 있다.
신경망은 하나 이상의 노드들을 포함하여 구성될 수 있다. 신경망을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다. 예를 들어, 최초 입력` 노드로부터 거리가 n인 노드들의 집합은, n 레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 신경망 내에서 레이어의 차수는 상술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.
최초 입력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 신경망 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들이 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 신경망을 구성하는 노드들을 의미할 수 있다. 본 개시의 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수와 동일할 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하다가 다시 증가하는 형태의 신경망일 수 있다. 또한, 본 개시의 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수 보다 적을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하는 형태의 신경망일 수 있다. 또한, 본 개시의 또 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수보다 많을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 증가하는 형태의 신경망일 수 있다. 본 개시의 또 다른 일 실시예에 따른 신경망은 상술한 신경망들의 조합된 형태의 신경망일 수 있다.
딥 뉴럴 네트워크(DNN: deep neural network, 심층신경망)는 입력 레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 신경망을 의미할 수 있다. 딥 뉴럴 네트워크를 이용하면 데이터의 잠재적인 구조(latent structures)를 파악할 수 있다. 즉, 사진, 글, 비디오, 음성, 음악의 잠재적인 구조(예를 들어, 어떤 물체가 사진에 있는지, 글의 내용과 감정이 무엇인지, 음성의 내용과 감정이 무엇인지 등)를 파악할 수 있다. 딥 뉴럴 네트워크는 컨벌루셔널 뉴럴 네트워크(CNN: convolutional neural network), 리커런트 뉴럴 네트워크(RNN: recurrent neural network), 오토 인코더(auto encoder), GAN(Generative Adversarial Networks), 제한 볼츠만 머신(RBM: restricted boltzmann machine), 심층 신뢰 네트워크(DBN: deep belief network), Q 네트워크, U 네트워크, 샴 네트워크 등을 포함할 수 있다. 전술한 딥 뉴럴 네트워크의 기재는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에서 네트워크 함수는 오토 인코더를 포함할 수도 있다. 오토 인코더는 입력 데이터와 유사한 출력 데이터를 출력하기 위한 인공 신경망의 일종일 수 있다. 오토 인코더는 적어도 하나의 히든 레이어를 포함할 수 있으며, 홀수 개의 히든 레이어가 입출력 레이어 사이에 배치될 수 있다. 각각의 레이어의 노드의 수는 입력 레이어의 노드의 수에서 병목 레이어(인코딩)라는 중간 레이어로 축소되었다가, 병목 레이어에서 출력 레이어(입력 레이어와 대칭)로 축소와 대칭되어 확장될 수도 있다. 이 경우, 차원 감소 레이어와 차원 복원 레이어의 노드는 대칭일 수도 있고 아닐 수도 있다. 오토 인코더는 비선형 차원 감소를 수행할 수 있다. 입력 레이어 및 출력 레이어의 수는 입력 데이터의 전처리 이후에 남은 센서들의 수와 대응될 수 있다. 오토 인코더 구조에서 인코더에 포함된 히든 레이어의 노드의 수는 입력 레이어에서 멀어질수록 감소하는 구조를 가질 수 있다. 병목 레이어(인코더와 디코더 사이에 위치하는 가장 적은 노드를 가진 레이어)의 노드의 수는 너무 작은 경우 충분한 양의 정보가 전달되지 않을 수 있으므로, 특정 수 이상(예를 들어, 입력 레이어의 절반 이상 등)으로 유지될 수도 있다.
뉴럴 네트워크는 교사 학습(supervised learning), 비교사 학습(unsupervised learning), 및 반교사학습(semi supervised learning) 중 적어도 하나의 방식으로 학습될 수 있다. 뉴럴 네트워크의 학습은 출력의 오류를 최소화하기 위한 것이다. 뉴럴 네트워크의 학습에서 반복적으로 학습 데이터를 뉴럴 네트워크에 입력시키고 학습 데이터에 대한 뉴럴 네트워크의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 뉴럴 네트워크의 에러를 뉴럴 네트워크의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 뉴럴 네트워크의 각 노드의 가중치를 업데이트 하는 과정이다. 교사 학습의 경우 각각의 학습 데이터에 정답이 라벨링되어있는 학습 데이터를 사용하며(즉, 라벨링된 학습 데이터), 비교사 학습의 경우는 각각의 학습 데이터에 정답이 라벨링되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 교사 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링 된 데이터 일 수 있다. 라벨링된 학습 데이터가 뉴럴 네트워크에 입력되고, 뉴럴 네트워크의 출력(카테고리)과 학습 데이터의 라벨을 비교함으로써 오류(error)가 계산될 수 있다. 다른 예로, 데이터 분류에 관한 비교사 학습의 경우 입력인 학습 데이터가 뉴럴 네트워크 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 뉴럴 네트워크에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 뉴럴 네트워크의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 뉴럴 네트워크의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 뉴럴 네트워크의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 뉴럴 네트워크의 학습 초기에는 높은 학습률을 사용하여 뉴럴 네트워크가 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.
뉴럴 네트워크의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 뉴럴 네트워크를 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 뉴럴 네트워크가 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다. 과적합은 머신러닝 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 레귤라이제이션(regularization), 학습의 과정에서 네트워크의 노드 일부를 생략하는 드롭아웃(dropout) 등의 방법이 적용될 수 있다.
본 개시의 일 실시예에 따라 데이터 구조를 저장한 컴퓨터 판독가능 매체가 개시된다.
데이터 구조는 데이터에 효율적인 접근 및 수정을 가능하게 하는 데이터의 조직, 관리, 저장을 의미할 수 있다. 데이터 구조는 특정 문제(예를 들어, 최단 시간으로 데이터 검색, 데이터 저장, 데이터 수정) 해결을 위한 데이터의 조직을 의미할 수 있다. 데이터 구조는 특정한 데이터 처리 기능을 지원하도록 설계된, 데이터 요소들 간의 물리적이거나 논리적인 관계로 정의될 수도 있다. 데이터 요소들 간의 논리적인 관계는 사용자가 생각하는 데이터 요소들 간의 연결관계를 포함할 수 있다. 데이터 요소들 간의 물리적인 관계는 컴퓨터 판독가능 저장매체(예를 들어, 하드 디스크)에 물리적으로 저장되어 있는 데이터 요소들 간의 실제 관계를 포함할 수 있다. 데이터 구조는 구체적으로 데이터의 집합, 데이터 간의 관계, 데이터에 적용할 수 있는 함수 또는 명령어를 포함할 수 있다. 효과적으로 설계된 데이터 구조를 통해 컴퓨팅 장치는 컴퓨팅 장치의 자원을 최소한으로 사용하면서 연산을 수행할 수 있다. 구체적으로 컴퓨팅 장치는 효과적으로 설계된 데이터 구조를 통해 연산, 읽기, 삽입, 삭제, 비교, 교환, 검색의 효율성을 높일 수 있다.
데이터 구조는 데이터 구조의 형태에 따라 선형 데이터 구조와 비선형 데이터 구조로 구분될 수 있다. 선형 데이터 구조는 하나의 데이터 뒤에 하나의 데이터만이 연결되는 구조일 수 있다. 선형 데이터 구조는 리스트(List), 스택(Stack), 큐(Queue), 데크(Deque)를 포함할 수 있다. 리스트는 내부적으로 순서가 존재하는 일련의 데이터 집합을 의미할 수 있다. 리스트는 연결 리스트(Linked List)를 포함할 수 있다. 연결 리스트는 각각의 데이터가 포인터를 가지고 한 줄로 연결되어 있는 방식으로 데이터가 연결된 데이터 구조일 수 있다. 연결 리스트에서 포인터는 다음이나 이전 데이터와의 연결 정보를 포함할 수 있다. 연결 리스트는 형태에 따라 단일 연결 리스트, 이중 연결 리스트, 원형 연결 리스트로 표현될 수 있다. 스택은 제한적으로 데이터에 접근할 수 있는 데이터 나열 구조일 수 있다. 스택은 데이터 구조의 한 쪽 끝에서만 데이터를 처리(예를 들어, 삽입 또는 삭제)할 수 있는 선형 데이터 구조일 수 있다. 스택에 저장된 데이터는 늦게 들어갈수록 빨리 나오는 데이터 구조(LIFO-Last in First Out)일 수 있다. 큐는 제한적으로 데이터에 접근할 수 있는 데이터 나열 구조로서, 스택과 달리 늦게 저장된 데이터일수록 늦게 나오는 데이터 구조(FIFO-First in First Out)일 수 있다. 데크는 데이터 구조의 양 쪽 끝에서 데이터를 처리할 수 있는 데이터 구조일 수 있다.
비선형 데이터 구조는 하나의 데이터 뒤에 복수개의 데이터가 연결되는 구조일 수 있다. 비선형 데이터 구조는 그래프(Graph) 데이터 구조를 포함할 수 있다. 그래프 데이터 구조는 정점(Vertex)과 간선(Edge)으로 정의될 수 있으며 간선은 서로 다른 두개의 정점을 연결하는 선을 포함할 수 있다. 그래프 데이터 구조 트리(Tree) 데이터 구조를 포함할 수 있다. 트리 데이터 구조는 트리에 포함된 복수개의 정점 중에서 서로 다른 두개의 정점을 연결시키는 경로가 하나인 데이터 구조일 수 있다. 즉 그래프 데이터 구조에서 루프(loop)를 형성하지 않는 데이터 구조일 수 있다.
본 명세서에 걸쳐, 연산 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network)는 동일한 의미로 사용될 수 있다. (이하에서는 신경망으로 통일하여 기술한다.) 데이터 구조는 신경망을 포함할 수 있다. 그리고 신경망을 포함한 데이터 구조는 컴퓨터 판독가능 매체에 저장될 수 있다. 신경망을 포함한 데이터 구조는 또한 신경망에 입력되는 데이터, 신경망의 가중치, 신경망의 하이퍼 파라미터, 신경망으로부터 획득한 데이터, 신경망의 각 노드 또는 레이어와 연관된 활성 함수, 신경망의 학습을 위한 손실 함수를 포함할 수 있다. 신경망을 포함한 데이터 구조는 상기 개시된 구성들 중 임의의 구성 요소들을 포함할 수 있다. 즉 신경망을 포함한 데이터 구조는 신경망에 입력되는 데이터, 신경망의 가중치, 신경망의 하이퍼 파라미터, 신경망으로부터 획득한 데이터, 신경망의 각 노드 또는 레이어와 연관된 활성 함수, 신경망의 트레이닝을 위한 손실 함수 등 전부 또는 이들의 임의의 조합을 포함하여 구성될 수 있다. 전술한 구성들 이외에도, 신경망을 포함한 데이터 구조는 신경망의 특성을 결정하는 임의의 다른 정보를 포함할 수 있다. 또한, 데이터 구조는 신경망의 연산 과정에 사용되거나 발생되는 모든 형태의 데이터를 포함할 수 있으며 전술한 사항에 제한되는 것은 아니다. 컴퓨터 판독가능 매체는 컴퓨터 판독가능 기록 매체 및/또는 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 신경망은 일반적으로 노드라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 노드들은 뉴런(neuron)들로 지칭될 수도 있다. 신경망은 적어도 하나 이상의 노드들을 포함하여 구성된다.
데이터 구조는 신경망에 입력되는 데이터를 포함할 수 있다. 신경망에 입력되는 데이터를 포함하는 데이터 구조는 컴퓨터 판독가능 매체에 저장될 수 있다. 신경망에 입력되는 데이터는 신경망 학습 과정에서 입력되는 학습 데이터 및/또는 학습이 완료된 신경망에 입력되는 입력 데이터를 포함할 수 있다. 신경망에 입력되는 데이터는 전처리(pre-processing)를 거친 데이터 및/또는 전처리 대상이 되는 데이터를 포함할 수 있다. 전처리는 데이터를 신경망에 입력시키기 위한 데이터 처리 과정을 포함할 수 있다. 따라서 데이터 구조는 전처리 대상이 되는 데이터 및 전처리로 발생되는 데이터를 포함할 수 있다. 전술한 데이터 구조는 예시일 뿐 본 개시는 이에 제한되지 않는다.
데이터 구조는 신경망의 가중치를 포함할 수 있다. (본 명세서에서 가중치, 파라미터는 동일한 의미로 사용될 수 있다.) 그리고 신경망의 가중치를 포함한 데이터 구조는 컴퓨터 판독가능 매체에 저장될 수 있다. 신경망은 복수개의 가중치를 포함할 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변 될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 파라미터에 기초하여 출력 노드 값을 결정할 수 있다. 전술한 데이터 구조는 예시일 뿐 본 개시는 이에 제한되지 않는다.
제한이 아닌 예로서, 가중치는 신경망 학습 과정에서 가변되는 가중치 및/또는 신경망 학습이 완료된 가중치를 포함할 수 있다. 신경망 학습 과정에서 가변되는 가중치는 학습 사이클이 시작되는 시점의 가중치 및/또는 학습 사이클 동안 가변되는 가중치를 포함할 수 있다. 신경망 학습이 완료된 가중치는 학습 사이클이 완료된 가중치를 포함할 수 있다. 따라서 신경망의 가중치를 포함한 데이터 구조는 신경망 학습 과정에서 가변되는 가중치 및/또는 신경망 학습이 완료된 가중치를 포함한 데이터 구조를 포함할 수 있다. 그러므로 상술한 가중치 및/또는 각 가중치의 조합은 신경망의 가중치를 포함한 데이터 구조에 포함되는 것으로 한다. 전술한 데이터 구조는 예시일 뿐 본 개시는 이에 제한되지 않는다.
신경망의 가중치를 포함한 데이터 구조는 직렬화(serialization) 과정을 거친 후 컴퓨터 판독가능 저장 매체(예를 들어, 메모리, 하드 디스크)에 저장될 수 있다. 직렬화는 데이터 구조를 동일하거나 다른 컴퓨팅 장치에 저장하고 나중에 다시 재구성하여 사용할 수 있는 형태로 변환하는 과정일 수 있다. 컴퓨팅 장치는 데이터 구조를 직렬화하여 네트워크를 통해 데이터를 송수신할 수 있다. 직렬화된 신경망의 가중치를 포함한 데이터 구조는 역직렬화(deserialization)를 통해 동일한 컴퓨팅 장치 또는 다른 컴퓨팅 장치에서 재구성될 수 있다. 신경망의 가중치를 포함한 데이터 구조는 직렬화에 한정되는 것은 아니다. 나아가 신경망의 가중치를 포함한 데이터 구조는 컴퓨팅 장치의 자원을 최소한으로 사용하면서 연산의 효율을 높이기 위한 데이터 구조(예를 들어, 비선형 데이터 구조에서 B-Tree, Trie, m-way search tree, AVL tree, Red-Black Tree)를 포함할 수 있다. 전술한 사항은 예시일 뿐 본 개시는 이에 제한되지 않는다.
데이터 구조는 신경망의 하이퍼 파라미터(Hyper-parameter)를 포함할 수 있다. 그리고 신경망의 하이퍼 파라미터를 포함한 데이터 구조는 컴퓨터 판독가능 매체에 저장될 수 있다. 하이퍼 파라미터는 사용자에 의해 가변되는 변수일 수 있다. 하이퍼 파라미터는 예를 들어, 학습률(learning rate), 비용 함수(cost function), 학습 사이클 반복 횟수, 가중치 초기화(Weight initialization)(예를 들어, 가중치 초기화 대상이 되는 가중치 값의 범위 설정), Hidden Unit 개수(예를 들어, 히든 레이어의 개수, 히든 레이어의 노드 수)를 포함할 수 있다. 전술한 데이터 구조는 예시일 뿐 본 개시는 이에 제한되지 않는다.
도 6은 본 개시의 일 실시예와 관련된 하이라이트 컨텐츠를 생성하기 위한 순서도를 도시한다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신할 수 있다(510).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 사용자 반응 데이터에 대한 분석 결과에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별할 수 있다(520).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성할 수 있다(530).
전술한 도 6의 도시된 단계들은 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 즉, 전술한 단계는 본 개시의 실시예에 불과할 뿐, 본 개시의 권리 범위는 이에 제한되지 않는다.
도 7은 본 개시의 일 실시예와 관련된 하이라이트 컨텐츠 생성 방법을 구현하기 위한 로직을 도시한 도면이다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 다음과 같은 로직에 의해 구현될 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하기 위한 로직(610), 사용자 반응 데이터에 대한 분석 결과에 기초하여 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하기 위한 로직(620) 및 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하기 위한 로직(630)을 포함할 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터는, 상기 실시간 컨텐츠를 시청하는 사용자의 자연어 입력, 또는 액션 입력 중 적어도 하나에 기초하며, 각각의 사용자 반응 데이터는 상기 실시간 컨텐츠의 적어도 일부와 연관될 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 정보 중 적어도 하나에 대한 외부 반응 데이터를 수신하기 위한 로직 및 상기 실시간 컨텐츠에 대한 사용자 반응 데이터 및 상기 외부 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 상기 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성하기 위한 로직을 더 포함할 수 있다.
대안적인 실시예에서, 상기 외부 반응 데이터는, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 중 적어도 하나에 대한 반응 데이터로, 상기 실시간 컨텐츠에 대한 사용자 반응 데이터와 상이한 채널을 통해 수신되는 데이터일 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠에 대한 사용자 반응 데이터 및 상기 외부 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 상기 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성하기 위한 로직은, 상기 외부 반응 데이터에서, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 정보와 관련한 외부 서술 정보를 추출하고, 상기 사용자 반응 데이터에서 상기 실시간 컨텐츠 또는 상기 실시간 컨텐츠의 관계자 정보와 관련한 내부 서술 정보를 추출함으로써 상기 지식 베이스를 생성하기 위한 로직을 포함할 수 있다.
대안적인 실시예에서, 상기 지식 베이스는, 상기 실시간 컨텐츠의 관계자 각각에 대하여 생성되며, 상기 관계자 각각에 고유한 사용자 반응을 식별하기 위하여 사용되며, 상기 외부 서술 정보 또는 상기 내부 서술 정보에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 생성될 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하기 위한 로직은, 상기 사용자 반응 데이터에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하기 위한 로직을 포함할 수 있다.
대안적인 실시예에서, 상기 정량 분석은, 상기 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수에 적어도 부분적으로 기초하여 결정되는 임계값에 기초하여 수행될 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보에 대한 지식 베이스에 기초하여 전처리하기 위한 로직을 더 포함할 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터는, 상기 사용자 반응 데이터를 전송한 사용자 단말에 관련한 사용자 반응 사용자 식별 정보를 더 포함하고, 상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하기 위한 로직은, 상기 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여하기 위한 로직 및 사용자 반응 데이터 각각에 부여된 가중치에 기초하여 상기 사용자 반응 데이터에 대한 분석 결과를 생성하고, 상기 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하기 위한 로직을 포함할 수 있다.
대안적인 실시예에서, 상기 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여하기 위한 로직은, 상기 사용자 반응 데이터를 생성한 사용자의 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율, 상기 사용자의 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율 및 상기 사용자 반응 데이터의 지식 베이스에 대한 매칭률 중 적어도 하나에 기초하여 상기 각각의 사용자 반응 데이터에 대한 상기 가중치가 부여되기 위한 로직을 포함할 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율은, 상기 실시간 컨텐츠의 관계자에 관련하여 사전 제작된 하이라이트 컨텐츠에서 사용자 반응 데이터가 포함되는지 여부에 관한 정보이며, 상기 사전 제작된 하이라이트 컨텐츠에 포함된 사용자 반응 데이터에 대한 정량 분석 및 의미 분석 중 적어도 하나에 기초하여 산출될 수 있다.
대안적인 실시예에서, 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율은, 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 상기 하나 이상의 사용자 단말 각각의 참여 이력에 관한 정보로, 상기 매칭된 컨텐츠의 개수 및 상기 참여 이력에 기초하여 산출될 수 있다.
대안적인 실시예에서, 상기 사용자 반응 데이터의 지식 베이스에 대한 매칭률은, 상기 지식 베이스에 포함된 외부 서술 정보 및 내부 서술 정보 중 적어도 하나와 상기 사용자 반응 데이터의 유사도 판별에 기초하여 산출될 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치를 구현하기 위한 로직은, 컴퓨팅 장치를 구현하기 위한 모듈, 회로 또는 수단에 의하여 구현될 수도 있다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있으나, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
도 8은 본 개시의 일 실시예와 관련된 본 개시의 일 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
본 개시가 일반적으로 하나 이상의 컴퓨터 상에서 실행될 수 있는 컴퓨터 실행가능 명령어와 관련하여 전술되었지만, 당업자라면 본 개시가 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다는 것을 잘 알 것이다.
일반적으로, 프로그램 모듈은 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조, 기타 등등을 포함한다. 또한, 당업자라면 본 개시의 방법이 단일-프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알 것이다.
본 개시의 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.
컴퓨터는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 이러한 컴퓨터 판독가능 저장 매체는 휘발성 및 비휘발성 매체, 이동식 및 비-이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터등을 구현하는 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.
컴퓨터(1102)를 포함하는 본 개시의 여러가지 측면들을 구현하는 예시적인 환경(1100)이 나타내어져 있으며, 컴퓨터(1102)는 처리 장치(1104), 시스템 메모리(1106) 및 시스템 버스(1108)를 포함한다. 시스템 버스(1108)는 시스템 메모리(1106)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(1104)에 연결시킨다. 처리 장치(1104)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(1104)로서 이용될 수 있다.
시스템 버스(1108)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(1106)는 판독 전용 메모리(ROM)(1110) 및 랜덤 액세스 메모리(RAM)(1112)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(1110)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(1102) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(1112)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.
컴퓨터(1102)는 또한 내장형 하드 디스크 드라이브(HDD)(1114)(예를 들어, EIDE, SATA)―이 내장형 하드 디스크 드라이브(1114)는 또한 적당한 섀시(도시 생략) 내에서 외장형 용도로 구성될 수 있음―, 자기 플로피 디스크 드라이브(FDD)(1116)(예를 들어, 이동식 디스켓(1118)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), 및 광 디스크 드라이브(1120)(예를 들어, CD-ROM 디스크(1122)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(1114), 자기 디스크 드라이브(1116) 및 광 디스크 드라이브(1120)는 각각 하드 디스크 드라이브 인터페이스(1124), 자기 디스크 드라이브 인터페이스(1126) 및 광 드라이브 인터페이스(1128)에 의해 시스템 버스(1108)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(1124)는 USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘다를 포함한다.
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(1102)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 개시의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.
운영 체제(1130), 하나 이상의 애플리캐이션 프로그램(1132), 기타 프로그램 모듈(1134) 및 프로그램 데이터(1136)를 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(1112)에 저장될 수 있다. 운영 체제, 애플리캐이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(1112)에 캐싱될 수 있다. 본 개시가 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(1138) 및 마우스(1140) 등의 포인팅 장치를 통해 컴퓨터(1102)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(1108)에 연결되어 있는 입력 장치 인터페이스(1142)를 통해 처리 장치(1104)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.
모니터(1144) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(1146) 등의 인터페이스를 통해 시스템 버스(1108)에 연결된다. 모니터(1144)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.
컴퓨터(1102)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(1148) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1148)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(1102)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(1150)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(1152) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(1154)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(1156)를 통해 로컬 네트워크(1152)에 연결된다. 어댑터(1156)는 LAN(1152)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(1152)은 또한 무선 어댑터(1156)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 모뎀(1158)을 포함할 수 있거나, WAN(1154) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(1154)을 통해 통신을 설정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(1158)은 직렬 포트 인터페이스(1142)를 통해 시스템 버스(1108)에 연결된다. 네트워크화된 환경에서, 컴퓨터(1102)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(1150)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.
컴퓨터(1102)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.
Wi-Fi(Wireless Fidelity)는 유선 없이도 인터넷 등으로의 연결을 가능하게 해준다. Wi-Fi는 이러한 장치, 예를 들어, 컴퓨터가 실내에서 및 실외에서, 즉 기지국의 통화권 내의 아무 곳에서나 데이터를 전송 및 수신할 수 있게 해주는 셀 전화와 같은 무선 기술이다. Wi-Fi 네트워크는 안전하고 신뢰성있으며 고속인 무선 연결을 제공하기 위해 IEEE 802.11(a,b,g, 기타)이라고 하는 무선 기술을 사용한다. 컴퓨터를 서로에, 인터넷에 및 유선 네트워크(IEEE 802.3 또는 이더넷을 사용함)에 연결시키기 위해 Wi-Fi가 사용될 수 있다. Wi-Fi 네트워크는 비인가 2.4 및 5 GHz 무선 대역에서, 예를 들어, 11Mbps(802.11a) 또는 54 Mbps(802.11b) 데이터 레이트로 동작하거나, 양 대역(듀얼 대역)을 포함하는 제품에서 동작할 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리캐이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리캐이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 레이어 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 레이어 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 레이어 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

Claims (16)

  1. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에서 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 하이라이트 영상 자동 편집을 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은:
    실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하는 동작;
    상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작; 및
    상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  2. 제 1 항에 있어서,
    상기 사용자 반응 데이터는,
    상기 실시간 컨텐츠를 시청하는 사용자의 자연어 입력, 또는 액션 입력 중 적어도 하나에 기초하며, 각각의 사용자 반응 데이터는 상기 실시간 컨텐츠의 적어도 일부와 연관되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  3. 제 1 항에 있어서,
    상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 정보 중 적어도 하나에 대한 외부 반응 데이터를 수신하는 동작; 및
    상기 실시간 컨텐츠에 대한 사용자 반응 데이터 및 상기 외부 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 상기 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성하는 동작;
    을 더 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  4. 제 3 항에 있어서,
    상기 외부 반응 데이터는,
    상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 중 적어도 하나에 대한 반응 데이터로, 상기 실시간 컨텐츠에 대한 사용자 반응 데이터와 상이한 채널을 통해 수신되는 데이터인,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  5. 제 3 항에 있어서,
    상기 실시간 컨텐츠에 대한 사용자 반응 데이터 및 상기 외부 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보와 연관하여 저장함으로써, 상기 실시간 컨텐츠의 관계자에 대한 지식 베이스를 생성하는 동작은,
    상기 외부 반응 데이터에서, 상기 실시간 컨텐츠, 또는 상기 실시간 컨텐츠의 관계자 정보와 관련한 외부 서술 정보를 추출하고, 상기 사용자 반응 데이터에서 상기 실시간 컨텐츠 또는 상기 실시간 컨텐츠의 관계자 정보와 관련한 내부 서술 정보를 추출함으로써 상기 지식 베이스를 생성하는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  6. 제 5 항에 있어서,
    상기 지식 베이스는,
    상기 실시간 컨텐츠의 관계자 각각에 대하여 생성되며, 상기 관계자 각각에 고유한 사용자 반응을 식별하기 위하여 사용되며, 상기 외부 서술 정보 또는 상기 내부 서술 정보에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 생성되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  7. 제 1 항에 있어서,
    상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작은,
    상기 사용자 반응 데이터에 대한 의미 분석 또는 정량 분석 중 적어도 하나에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  8. 제 7 항에 있어서,
    상기 정량 분석은,
    상기 실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말의 수에 적어도 부분적으로 기초하여 결정되는 임계값에 기초하여 수행되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  9. 제 1 항에 있어서,
    상기 사용자 반응 데이터를 상기 실시간 컨텐츠의 관계자 정보에 대한 지식 베이스에 기초하여 전처리하는 동작;
    을 더 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  10. 제 1 항에 있어서,
    상기 사용자 반응 데이터는, 상기 사용자 반응 데이터를 전송한 사용자 단말에 관련한 사용자 반응 사용자 식별 정보를 더 포함하고,
    상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작은,
    상기 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여하는 동작; 및
    사용자 반응 데이터 각각에 부여된 가중치에 기초하여 상기 사용자 반응 데이터에 대한 분석 결과를 생성하고, 상기 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  11. 제 10 항에 있어서,
    상기 사용자 반응 사용자 식별 정보에 기초하여 각각의 사용자 반응 데이터에 대한 가중치를 부여하는 동작은,
    상기 사용자 반응 데이터를 생성한 사용자의 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율, 상기 사용자의 상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율 및 상기 사용자 반응 데이터의 지식 베이스에 대한 매칭률 중 적어도 하나에 기초하여 상기 각각의 사용자 반응 데이터에 대한 상기 가중치가 부여되는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  12. 제 11 항에 있어서,
    상기 실시간 컨텐츠에 대한 하이라이트 구간 예측 기여율은,
    상기 실시간 컨텐츠의 관계자에 관련하여 사전 제작된 하이라이트 컨텐츠에서 사용자 반응 데이터가 포함되는지 여부에 관한 정보이며, 상기 사전 제작된 하이라이트 컨텐츠에 포함된 사용자 반응 데이터에 대한 정량 분석 및 의미 분석 중 적어도 하나에 기초하여 산출되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  13. 제 11 항에 있어서,
    상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 시청 기여율은,
    상기 실시간 컨텐츠의 관계자 정보와 매칭된 컨텐츠에 대한 상기 하나 이상의 사용자 단말 각각의 참여 이력에 관한 정보로, 상기 매칭된 컨텐츠의 개수 및 상기 참여 이력에 기초하여 산출되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  14. 제 11 항에 있어서,
    상기 사용자 반응 데이터의 지식 베이스에 대한 매칭률은,
    상기 지식 베이스에 포함된 외부 서술 정보 및 내부 서술 정보 중 적어도 하나와 상기 사용자 반응 데이터의 유사도 판별에 기초하여 산출되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  15. 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 하이라이트 영상을 자동 편집하는 방법으로,
    실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하는 단계;
    상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하는 단계; 및
    상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하는 단계;
    를 포함하는,
    컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 하이라이트 영상을 자동 편집하는 방법.
  16. 하이라이트 영상을 자동 편집하는 서버로서,
    하나 이상의 코어를 포함하는 프로세서;
    상기 프로세서에서 실행가능한 프로그램 코드들을 포함하는 메모리; 및
    사용자 단말 및 외부 서버와 데이터를 송수신하는 네트워크부;
    를 포함하고, 그리고
    상기 프로세서는,
    실시간 컨텐츠를 시청하는 하나 이상의 사용자 단말로부터 상기 실시간 컨텐츠에 대한 하나 이상의 사용자 반응 데이터를 수신하고,
    상기 사용자 반응 데이터에 대한 분석 결과에 기초하여 상기 실시간 컨텐츠에서 하나 이상의 하이라이트 구간을 식별하고, 그리고
    상기 하나 이상의 하이라이트 구간에 기초하여 하이라이트 컨텐츠를 생성하는,
    하이라이트 영상을 자동 편집하는 서버.
PCT/KR2020/014636 2019-12-10 2020-10-26 하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램 WO2021118050A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0163539 2019-12-10
KR1020190163539A KR102286638B1 (ko) 2019-12-10 2019-12-10 하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
WO2021118050A1 true WO2021118050A1 (ko) 2021-06-17

Family

ID=76330510

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/014636 WO2021118050A1 (ko) 2019-12-10 2020-10-26 하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램

Country Status (2)

Country Link
KR (1) KR102286638B1 (ko)
WO (1) WO2021118050A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230126907A (ko) 2022-02-24 2023-08-31 명지대학교 산학협력단 연합학습을 이용한 비디오 영상의 특정 구간 추출 방법 및 시스템
KR102593762B1 (ko) * 2023-05-23 2023-10-26 주식회사 스푼라디오 보이스 인식 기반의 라이브 인터넷 방송에 대한 하이라이트 콘텐츠를 생성하는 방법 및 이를 위한 서버
KR102678303B1 (ko) 2023-11-27 2024-06-25 주식회사엠제이에스파트너스 시청자 반응 데이터 분석을 기반으로 한 영상 콘텐츠 기획 및 자동 편집 솔루션 제공 방법, 장치 및 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150030387A (ko) * 2013-09-12 2015-03-20 엠랩 주식회사 스트리밍 동영상에 대한 코멘트 태깅 시스템 및 그 제공방법
KR20170029933A (ko) * 2015-09-08 2017-03-16 네이버 주식회사 동영상 컨텐츠의 하이라이트 영상을 추출하여 제공하는 방법과 시스템 및 기록 매체
KR20180017821A (ko) * 2016-08-11 2018-02-21 한화테크윈 주식회사 실시간 시청자 반응을 전달하는 방송 서비스 장치
KR101867082B1 (ko) * 2017-08-23 2018-06-12 서울과학기술대학교 산학협력단 하이라이트 영상 생성 장치 및 방법
KR101957807B1 (ko) * 2018-05-30 2019-03-14 (주) 비투아이 다인칭 시점의 sns 라이브 방송을 위한 오디오 중계 방법 및 시스템

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101628237B1 (ko) 2009-01-21 2016-06-22 삼성전자주식회사 하이라이트 영상 구성 방법 및 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150030387A (ko) * 2013-09-12 2015-03-20 엠랩 주식회사 스트리밍 동영상에 대한 코멘트 태깅 시스템 및 그 제공방법
KR20170029933A (ko) * 2015-09-08 2017-03-16 네이버 주식회사 동영상 컨텐츠의 하이라이트 영상을 추출하여 제공하는 방법과 시스템 및 기록 매체
KR20180017821A (ko) * 2016-08-11 2018-02-21 한화테크윈 주식회사 실시간 시청자 반응을 전달하는 방송 서비스 장치
KR101867082B1 (ko) * 2017-08-23 2018-06-12 서울과학기술대학교 산학협력단 하이라이트 영상 생성 장치 및 방법
KR101957807B1 (ko) * 2018-05-30 2019-03-14 (주) 비투아이 다인칭 시점의 sns 라이브 방송을 위한 오디오 중계 방법 및 시스템

Also Published As

Publication number Publication date
KR102286638B1 (ko) 2021-08-05
KR20210073077A (ko) 2021-06-18

Similar Documents

Publication Publication Date Title
WO2021118050A1 (ko) 하이라이트 영상 자동 편집을 위한 컴퓨터 프로그램
US20230015606A1 (en) Named entity recognition method and apparatus, device, and storage medium
US20190124020A1 (en) Chatbot Skills Systems And Methods
US20190103111A1 (en) Natural Language Processing Systems and Methods
WO2019172656A1 (en) System and method for language model personalization
WO2022250439A1 (ko) 스트리밍 데이터 기반 영상 편집점 추천 방법, 서버 및 컴퓨터프로그램
WO2019124647A1 (ko) 대화형 ai 에이전트 시스템을 위한 계층적 대화 흐름 관리 모델을 자동으로 구축 또는 갱신하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
EP3545487A1 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
WO2020182123A1 (zh) 用于推送语句的方法和装置
WO2018174443A1 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
WO2018174397A1 (ko) 전자 장치 및 제어 방법
CN112489676B (zh) 模型训练方法、装置、设备及存储介质
WO2021075658A1 (en) System and method for prediction and recommendation using collaborative filtering
US20240064348A1 (en) Image analysis system
JP7337172B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
CN111753126B (zh) 用于视频配乐的方法和装置
WO2019156536A1 (ko) 학습 데이터 중 식별 가능하지만 학습 가능성이 없는 데이터의 레이블화를 통한, 대화형 ai 에이전트 시스템을 위한 지식베이스 모델의 구축 또는 갱신 방법, 컴퓨터 장치, 및 컴퓨터 판독 가능 기록 매체
JP2024012152A (ja) テキスト情報の中からターゲット単語と対応する単語を識別する方法(method for identify a word corresponding to a target word in text information)
WO2023000782A1 (zh) 获取视频热点的方法、装置、可读介质和电子设备
CN111339770B (zh) 用于输出信息的方法和装置
CA3217258A1 (en) Systems and methods to increase viewership of online content
WO2020055173A1 (en) Method and system for audio content-based recommendations
Bhatti et al. LSTM-based Siamese neural network for Urdu news story segmentation
WO2024111803A1 (ko) 실시간 영상 콘텐츠 생성 방법 및 시스템
WO2022086063A1 (ko) 소셜 네트워크 서비스 계정의 스타일 정보를 산출하는 방법 및 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20897767

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20897767

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 14/12/2022)

122 Ep: pct application non-entry in european phase

Ref document number: 20897767

Country of ref document: EP

Kind code of ref document: A1