WO2018016760A1 - Electronic device and control method thereof - Google Patents

Electronic device and control method thereof Download PDF

Info

Publication number
WO2018016760A1
WO2018016760A1 PCT/KR2017/006790 KR2017006790W WO2018016760A1 WO 2018016760 A1 WO2018016760 A1 WO 2018016760A1 KR 2017006790 W KR2017006790 W KR 2017006790W WO 2018016760 A1 WO2018016760 A1 WO 2018016760A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
short
server
short clip
received
Prior art date
Application number
PCT/KR2017/006790
Other languages
French (fr)
Korean (ko)
Inventor
송영석
김한기
임동현
박해광
손준호
이우정
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to US16/319,545 priority Critical patent/US10957321B2/en
Priority to EP17831233.6A priority patent/EP3438852B1/en
Publication of WO2018016760A1 publication Critical patent/WO2018016760A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/30User interface
    • G08C2201/31Voice input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Definitions

  • the present invention relates to an electronic device and a control method thereof, and more particularly, to an electronic device providing a short clip and a control method thereof.
  • multimedia devices such as TVs, PCs, laptop computers, tablet PCs, smartphones, and the like are widely used in most homes.
  • a search result when a search result includes video or audio content, the content is provided as it is.
  • the original content contains a large number of irrelevant parts of the user's question, so that the search results that are meaningless to the user are accepted.
  • the present invention has been made to solve the above-described problem, and an object of the present invention is to provide an electronic device and a control method thereof for providing a short clip for original content based on a keyword.
  • An electronic device provides a communication unit, an output unit, an input unit, and an input unit for communicating with a server that stores information about a plurality of short clips and keywords for each of the plurality of short clips.
  • a short clip request signal is transmitted to the server based on a keyword included in the received speech voice and information on the content output from the output unit, and the server according to the request signal.
  • a processor configured to output the short clip through the output unit based on the information about the short clip received from the controller.
  • the information on the plurality of short clips includes at least one of information on a time interval including the location where the plurality of short clips are stored and the keyword, and the processor is further configured to transmit information from the server according to the request signal.
  • the short clip may be output based on the received information.
  • each of the plurality of short clips may be video content or sound content generated by editing a portion including a specific keyword in specific content.
  • the processor may provide additional information about the short clip when additional information about the short clip is received.
  • the additional information about the short clip may include a title, a genre, and a broadcast time of the original content. And at least one of a generation time of the short clip, broadcasting station information of the original content, and the keyword.
  • the output unit may include at least one of a display and a speaker.
  • the output unit is implemented to include only a speaker, and the processor may provide additional information about the short clip as audio through the speaker.
  • the output unit may include at least one of a display and a speaker, and the processor may be configured to generate a short associated with the keyword to the server based on a keyword that is repeated a predetermined number of times for a predetermined time in the audio output through the speaker.
  • the clip request signal may be additionally transmitted to the server.
  • the processor may provide additional response information for the spoken voice together with the short clip based on the keyword included in the received spoken voice.
  • the processor may transmit the request signal including the keyword and the user information to the server, and receive a short clip associated with the keyword and the user information from the server.
  • the processor transmits the received spoken voice to a voice recognition server or the server and shortens based on the information about the keyword and the content received from the voice recognition server or the server.
  • the clip request signal may be transmitted to the server.
  • the method may include outputting content and generating a voice of a user. Receiving, when the spoken voice is received, transmitting a short clip request signal to the server based on a keyword included in the received spoken voice and information on the content, and receiving from the server according to the request signal. Outputting the short clip based on the information about the short clip.
  • the information on the plurality of short clips may include at least one of information on a location where the plurality of short clips are stored and information on a time interval including the keyword, and the transmitting may include: When the information about the short clip is received from the server, the short clip may be output based on the received information.
  • each of the plurality of short clips may be video content or sound content generated by editing a portion including a specific keyword in specific content.
  • the outputting of the short clip may include providing additional information about the short clip when additional information about the short clip is received, and the additional information about the short clip may include title, genre, and original content. At least one of a broadcast time of the original content, a time of generating the short clip, broadcast station information of the original content, and the keyword.
  • the outputting of the short clip may provide additional information about the short clip as audio through a speaker.
  • the electronic device may include at least one of a display and a speaker, and the transmitting of the keyword may include the keyword to the server based on a keyword that is repeated at least a predetermined number of times for a predetermined time in the audio output through the speaker.
  • the short clip request signal associated with may be additionally transmitted to the server.
  • the outputting of the short clip may provide additional response information for the spoken voice together with the short clip based on a keyword included in the received spoken voice.
  • the transmitting may include transmitting the request signal including the keyword and the user information to the server, and outputting the short clip, receiving the short clip associated with the keyword and the user information from the server. Can be output.
  • the transmitting may include transmitting the received spoken voice to a voice recognition server or the server and generating a short clip request signal based on the keyword and the information about the content received from the voice recognition server or the server. Can be sent to the server.
  • a system including an electronic device and a server generates information on a plurality of short clips based on keywords of a plurality of original contents, and generates a plurality of short clips.
  • a server for storing information and keywords for each of the plurality of short clips and a spoken voice of a user are received, a short clip request signal is generated based on the keyword included in the received spoken voice and information about the content output by the electronic device.
  • an electronic device for transmitting to the server and outputting a short clip based on information about the short clip received from the server according to the request signal.
  • FIG. 1 is a view for explaining a system for providing a short clip according to an embodiment of the present invention.
  • FIGS. 2A and 2B are block diagrams illustrating a configuration of an electronic device according to an embodiment of the present disclosure.
  • FIG. 3 is a block diagram illustrating a configuration of a server according to an exemplary embodiment.
  • FIG. 4 is a diagram for describing a method of outputting a short clip associated with a keyword according to an exemplary embodiment.
  • FIG. 5 is a diagram for describing a method of outputting a short clip associated with output content according to an exemplary embodiment.
  • FIG. 6 is a diagram for describing a method of obtaining a keyword by analyzing an audio signal according to an exemplary embodiment.
  • FIG. 7 is a diagram for describing additional information about a short clip according to one embodiment of the present invention.
  • FIG. 8 is a diagram for describing additional response information provided with a short clip according to an exemplary embodiment.
  • FIG. 9 is a flowchart illustrating a short clip providing method according to an exemplary embodiment.
  • FIG. 10 is a flowchart illustrating a system for providing a short clip according to an exemplary embodiment.
  • FIG. 11 is a diagram for describing a method of providing a short clip through an speaker according to another embodiment of the present disclosure.
  • FIG. 1 is a view for explaining a system for providing a short clip according to an embodiment of the present invention.
  • the electronic device 100 may be implemented as various types of devices that output content using at least one of a display and a speaker. Accordingly, the electronic device 100 may be implemented as a digital TV, but is not limited thereto.
  • the electronic device 100 may be implemented as various types of devices having a display function such as a PC, a mobile phone, a tablet PC, a PMP, a PDA, a navigation device, and the like.
  • the electronic device 100 may be implemented as a sound output device having no display function. In this case, the content may be output as an audio signal through the speaker.
  • the electronic device 100 is implemented as a digital TV for convenience of description. An embodiment in which the electronic device 100 includes only a speaker without a display function will be described in detail with reference to FIG. 10.
  • the electronic device 100 may receive a spoken voice of a user and obtain a keyword included in the received spoken voice.
  • the electronic device 100 may transmit the received spoken voice to a voice recognition server (not shown) and receive a keyword included in the spoken voice from the voice recognition server.
  • the present invention is not limited thereto, and the electronic device 100 may obtain a keyword by analyzing a user's spoken voice.
  • the server 200 may be used as a voice recognition server for providing a short clip and analyzing a spoken voice and transmitting a keyword included in the spoken voice to the electronic device 100.
  • a voice recognition server for providing a short clip and analyzing a spoken voice and transmitting a keyword included in the spoken voice to the electronic device 100.
  • the electronic device 100 may transmit a short clip request signal to the server 200 based on the keyword included in the received speech voice and information on the content output by the electronic device 100.
  • the electronic device 100 may receive information about the short clip from the server 200 in response to the request signal, and output the short clip based on the received information.
  • the information about the short clip may be at least one of information about a time clip including a short clip, a location where the short clip is stored, and a keyword.
  • the electronic device 100 may reproduce and output only a time section including a specific keyword in the content based on this.
  • the server 200 may store information about the plurality of short clips and keywords for each of the plurality of short clips.
  • the server 200 may receive content from the content provider 300 and generate a short clip from the received content.
  • the server 200 may receive broadcast content from a broadcaster and generate a plurality of short clips from the received broadcast content.
  • the content received from the content provider 300 is referred to as the original content.
  • the short clip refers to an image obtained by editing a specific portion or part of the received original content, and in some cases, a plurality of contents may be combined. For example, a specific part or part may be obtained from each of the plurality of contents, and the obtained parts may be combined to generate a short clip.
  • the server 200 may analyze the audio signal of the original content and edit the original content in units of endpoint detection (EPD).
  • EPD refers to an algorithm that detects a start point and an end point of a voice in real time by analyzing an audio signal of an original content.
  • the server 200 may obtain a keyword by analyzing the voice included in each of the edited images in EPD units. Accordingly, the server 200 may obtain and store a plurality of edited images and keywords corresponding to each of the plurality of edited images edited in EPD units from one original content. Here, at least one keyword matching the edited video may be provided.
  • the server 200 when the server 200 acquires a plurality of keywords by analyzing an audio signal included in the edited video, the plurality of keywords may be matched to one edited video and stored in the server.
  • the original content is not necessarily edited in EPD units, and the server 200 may generate a plurality of short clips by editing the original content based on various voice detection algorithms.
  • the short clip and the keyword generation method for each short clip of the server 200 will be described in detail with reference to FIG. 3.
  • an edited video obtained from original content is referred to as a short clip for convenience of description.
  • the short clip may be an image in which a specific part of the original content, for example, a part including a specific keyword, is edited within a predetermined time (for example, within 3 minutes).
  • a predetermined time for example, within 3 minutes.
  • the short clip is not limited to the image content, of course, can be generated by editing the audio content.
  • the playback time of the short clip may be changed according to a setting and a voice detection algorithm, it is of course not limited to within 3 minutes.
  • the server 200 may generate and store information about the short clip at the time of generating the short clip.
  • the information on the short clip may include at least one of information on a location where the short clip is stored and information on a time interval including a specific keyword.
  • the server 200 may obtain a keyword by analyzing an audio signal included in the short clip, and store the short clip and a keyword matching the short clip. Therefore, the server 200 may store a plurality of short clips and keywords for each of the plurality of short clips.
  • the server 200 may display the title, genre, broadcast time of the original content, creation time of the short clip, broadcast station information of the original content, and the like based on metadata about the original content. Can be saved with a short clip.
  • the electronic device 100 analyzes a user's spoken voice and transmits a short clip request signal related to a keyword included in the spoken voice to a server, and the server 200 transmits the received request signal to the server.
  • the short clip for the included keyword may be transmitted to the electronic device 100.
  • the electronic device 100 may display the received short clip and provide it to the user.
  • the electronic device 100 may transmit a user's spoken voice to a voice recognition server and receive a keyword included in the spoken voice from the voice recognition server.
  • the server 200 providing the short clip may be configured to receive the user's spoken voice and transmit the keyword included in the spoken voice to the electronic device 100. That is, the voice recognition server or the server 200 may be implemented to perform voice recognition of converting the received voice into text and acquiring a keyword from the converted text when the user's spoken voice is received.
  • FIGS. 2A and 2B are block diagrams illustrating a configuration of a display apparatus according to an exemplary embodiment.
  • the electronic device 100 includes a communication unit 110, an input unit 120, an output unit 130, and a processor 140.
  • the communication unit 110 communicates with an external device according to various types of communication methods.
  • the communication unit 110 may communicate with the server 200 which stores a plurality of short clips and keywords for each of the plurality of short clips using at least one wired / wireless method.
  • the communication unit 110 may communicate with the voice recognition server.
  • the communication unit 110 may include various communication chips such as a Wi-Fi chip, a Bluetooth chip, a wireless communication chip, an NFC chip.
  • the communicator 110 may transmit the received spoken voice to the voice recognition server and receive a keyword included in the spoken voice.
  • the communication unit 110 may transmit the received spoken voice to the server 200 and receive a keyword from the server 200.
  • the present invention is not limited thereto, and the electronic device 100 may obtain a keyword by performing voice recognition on the spoken voice of the user without performing communication with the voice recognition server or the server 200.
  • the communication unit 110 may transmit a signal for requesting a short clip to the server 200, and receives a short clip according to the request signal from the server 200.
  • the request signal is a signal based on information on keywords and content included in the user's spoken voice.
  • the request signal may be a signal including a keyword and information on content being output by the electronic device 100.
  • the request signal may be transmitted to the server 200 continuously or simultaneously with a separate signal including a keyword and information on content being output by the electronic device 100.
  • the request signal may be a signal including information on content displayed on the electronic device 100, a keyword repeatedly output from the content, information on a user of the electronic device 100, and the like.
  • the keyword repeatedly output from the content may mean a keyword that is repeated more than a predetermined number of times during a predetermined time in the content output from the electronic device 100.
  • output content the content displayed on the electronic device 100 or the output content will be referred to as output content.
  • the communication unit 110 may receive a short clip from the server 200 in response to the above-described request signal.
  • the server 200 may transmit a short clip corresponding to the request signal to the electronic device 100.
  • the server 200 may store information on a location where original content corresponding to the request signal is stored and time information corresponding to a short clip among the original content.
  • the server 200 may transmit the web address for playing the original content and the time information corresponding to the short clip among the original content to the electronic device 100.
  • the electronic device 100 may access the server where the original content is stored based on the received web address, and play the section corresponding to the time information.
  • the electronic device 100 may receive a web address for receiving specific content from the server 200 and time information on a section including a corresponding keyword in the specific content.
  • the electronic device 100 may access the received web address to receive specific content, and reproduce and output only a specific section of the specific content based on time information.
  • the input unit 120 is a component for receiving a spoken voice of a user and converting it into audio data.
  • the input unit 120 may be implemented as a microphone to receive a spoken voice of a user.
  • the present invention is not limited thereto, and the input unit 120 may be provided in a remote control device (not shown) for controlling the electronic device 100 instead of the electronic device 100 to receive a spoken voice of a user.
  • the input unit 120 may be implemented in the form of a touch screen that forms a mutual layer structure with the touch pad. In this case, the input unit 120 may receive a keyword input through a touch screen in addition to the spoken voice.
  • the output unit 130 may output at least one of various contents and short clips.
  • the output unit 130 may include at least one of a display and a speaker.
  • the output unit 130 may include various content playback screens such as images, videos, texts, music, etc., application execution screens including various contents, web browser screens, and graphical user interfaces (GUIs). ) Screen, etc. can be displayed.
  • GUIs graphical user interfaces
  • the display may be implemented as a liquid crystal display panel (LCD), organic light emitting diodes (OLED), or the like, but is not limited thereto.
  • the display may be implemented as a flexible display or a transparent display.
  • the display may display the short clip received from the server 200.
  • the output unit 130 may provide the received short clip as audio through the speaker.
  • the output unit 130 may provide additional information about the received short clip as audio and an audio signal of the short clip. You can also provide only.
  • the processor 140 controls the overall operation of the electronic device 100.
  • the processor 140 sends a signal through the communication unit 110 to request a short clip based on information on keywords and contents included in the received spoken voice.
  • the server 200 may transmit the data.
  • the short clip received from the server 200 according to the request signal may be output through the output unit 130.
  • the processor 140 may transmit information on the output content to the server 200.
  • the information on the output content may include a title, genre, broadcast time, broadcasting station information, and the like of the output content. Therefore, when the processor 140 transmits a short clip request signal to the server 200 based on at least one of the information about the keyword and the output content, the processor 140 receives and provides the short clip associated with the keyword and the output content. can do.
  • the processor 140 when the processor 140 transmits the short clip request signal to the server 200, the processor 140 may be provided with the short clip previously generated.
  • the pre-generated short clip may be a short clip generated from content different from the output content.
  • the content may be pre-generated content that is broadcast before the output content broadcast time.
  • the present invention is not limited thereto, and a short clip generated from the corresponding output content may also be received.
  • the server 200 may also receive the broadcast content.
  • the processor 140 transmits a request signal, a short clip of the output content is output. If created, the short clip can also be the target. For example, if the corresponding output content is earlier than a preset time when the broadcast start time is requested by the user, the short clip for the corresponding output content may be generated.
  • the processor 140 may receive additional information about the short clip.
  • the processor 140 may receive and provide a short clip and additional information about the short clip from the server 200.
  • the additional information about the short clip may be information including at least one of a title, a genre of the original content of the short clip, a broadcast time of the original content, a creation time of the short clip, a broadcaster of the original content, and a keyword.
  • the processor 140 may analyze the audio signal of the output content and transmit a signal for requesting a short clip associated with the keyword to the server 200 based on a keyword that is repeated more than a predetermined number of times for a predetermined time. Accordingly, the processor 140 may obtain a word repeated in the output content as a keyword, and transmit the keyword to the server 200 to receive a short clip associated with the keyword.
  • the electronic device 100 may include a storage unit (not shown) for storing user information, and the processor 140 may transmit a request signal including the user information stored in the storage unit to the server 200. .
  • the processor 140 may receive and display a short clip associated with user information.
  • the user information is information about a user of the electronic device 100 and may include information including an age group, a favorite genre, a preferred content, a preferred broadcasting station, and the like. Therefore, when the electronic device 100 receives a plurality of short clips from the server 200, the electronic device 100 may receive and display a short clip more suitable for the user based on the keyword and the user information.
  • FIG. 2B is a block diagram illustrating a detailed configuration of an electronic device 100 according to another embodiment of the present disclosure.
  • the electronic device 100 uses the communication unit 110, the input unit 120, the output unit 130, the processor 140, the storage unit 150, the audio processor 160, and the video processor 170. Include. A detailed description of parts overlapping with those shown in FIG. 2A among the elements shown in FIG. 2B will be omitted.
  • the processor 140 controls overall operations of the electronic device 100 using various programs stored in the storage 150.
  • the processor 140 may be one or more of a central processing unit (CPU), a controller, an application processor (AP), a communication processor (CP), and an ARM processor. It may include or may be defined in the corresponding terms.
  • the processor 140 may be implemented as a digital signal processor (DSP), may be implemented as an SoC incorporating a content processing algorithm, or may be implemented in the form of a field programmable gate array (FPGA). .
  • DSP digital signal processor
  • SoC SoC incorporating a content processing algorithm
  • FPGA field programmable gate array
  • the processor 140 may access the RAM 141, the ROM 142, the main CPU 143, the graphics processor 144, the first to n interfaces 145-1 to 145-n, and the bus 146. Include.
  • the RAM 141, the ROM 142, the main CPU 143, the graphics processor 144, the first to nth interfaces 145-1 to 145-n, and the like may be connected to each other through the bus 136.
  • the first to n interfaces 145-1 to 145-n are connected to the various components described above.
  • One of the interfaces may be a network interface connected to an external device via a network.
  • the main CPU 143 accesses the storage 150 and performs booting using the operating system stored in the storage 150. Then, various operations are performed using various programs, contents, data, etc. stored in the storage 150.
  • the ROM 142 stores a command set for system booting.
  • the main CPU 143 copies the O / S stored in the storage unit 150 to the RAM 141 according to the command stored in the ROM 142 and executes O / S.
  • the main CPU 143 copies various application programs stored in the storage unit 150 to the RAM 141 and executes the application programs copied to the RAM 141 to perform various operations.
  • the graphic processor 144 generates a screen including various objects such as an icon, an image, and a text by using a calculator (not shown) and a renderer (not shown).
  • An operation unit (not shown) calculates attribute values such as coordinate values, shapes, sizes, colors, and the like in which objects are displayed according to the layout of the screen based on the received control command.
  • the renderer generates a screen having various layouts including objects based on the attribute values calculated by the calculator.
  • the screen generated by the renderer (not shown) is displayed in the display area of the outputter 130.
  • the storage unit 150 stores various data such as an operating system (O / S) software module for driving the electronic device 100, various multimedia contents, various applications, various contents input or set during application execution, and the like.
  • the storage unit 150 may store user information, for example, user preference information, age group, user profile information, and the like.
  • the audio processor 160 is a component that performs processing on audio data.
  • the audio processor 160 may perform various processing such as decoding, amplification, noise filtering, and the like on the audio data.
  • the audio processor 160 may generate and provide a feedback sound corresponding to a case where the user preference information displayed at the channel zapping satisfies a predetermined criterion.
  • the video processor 170 is a component that performs processing on video data.
  • the video processor 170 may perform various image processing such as decoding, scaling, noise filtering, frame rate conversion, resolution conversion, and the like on the video data.
  • FIG. 3 is a block diagram showing the configuration of a server 200 according to an embodiment of the present invention.
  • the server 200 includes a communication unit 210, a storage unit 220, and a processor 230.
  • the communication unit 210 communicates with an external device according to various types of communication methods.
  • the communication unit 210 may communicate with the content provider 300 using at least one of the wired and wireless methods.
  • the communication unit 210 may receive content from the content provider 300.
  • the communicator 210 may include various communication chips such as a Wi-Fi chip, a Bluetooth chip, a wireless communication chip, an NFC chip, and a tuner.
  • the communication unit 210 may communicate with the electronic device 100.
  • the communication unit 210 may receive a short clip request signal transmitted by the electronic device 100 and transmit a short clip to the electronic device 100 in response thereto.
  • the storage unit 220 stores various data such as an operating system (O / S) software module for driving the server 200, various multimedia contents, various applications, various contents input or set during application execution, and the like.
  • O / S operating system
  • the storage unit 220 may store original content, a plurality of short clips generated from the original content, and a plurality of keywords for each of the short clips.
  • the server 200 when the server 200 edits original content to generate a plurality of short clips, the server 200 may obtain at least one keyword according to audio signals included in the plurality of short clips.
  • the server 200 may store the short clip and a keyword obtained from the short clip in the storage 220.
  • the server 200 may store the first and second keywords together with the first short clip.
  • the server 200 may group and store a short clip for each keyword.
  • the short clips including the audio signal corresponding to the first keyword may be grouped and stored in the storage 220. Therefore, if the first keyword is included in the short clip request signal received from the electronic device 100, the server 200 may transmit a plurality of short clips grouped to the first keyword to the electronic device 100. .
  • the processor 230 controls the overall operation of the server 200.
  • the processor 230 analyzes a spoken voice received from the electronic device 100 and obtains a keyword included in the spoken voice. can do.
  • the server 200 may transmit a keyword to the electronic device 100.
  • the processor 230 may edit the received original content to generate a plurality of short clips.
  • the processor 230 may edit only a specific section of the original content based on the voice detection algorithm.
  • the voice detection algorithm refers to an algorithm for detecting an audio signal including at least one keyword.
  • the processor 230 may analyze the audio signal of the original content to detect a start point and an end point of the voice, and edit a section (EPD unit) between the start point and the end point to generate a short clip.
  • a section EPD unit
  • the server 200 may be based on a preset time interval, a specific interval set by the content provider, a time interval set by the server 200 administrator, and a user request time interval included in the short clip request signal. You can also edit the original content to create a short clip.
  • the processor 230 may generate a short clip by editing the corresponding section in real time. In this case, the processor 230 may determine that the voice is terminated when the voice is not detected for more than a preset time or when a machine sound or noise is detected for more than the preset time. Thereafter, the processor 230 may store the generated short clip and the acquired keyword together in the storage 220. Therefore, the processor 230 may transmit a short clip to the electronic device 100 in response to the short clip request signal received from the electronic device 100.
  • the server 200 may store time information on a section including a web address and a specific keyword that can receive the original content, as a database, without generating a short clip from the original content. have.
  • the server 200 may receive a web address corresponding to the short clip request signal and section information including a specific keyword in the original content. May be transmitted to the electronic device 100. Therefore, the electronic device 100 may provide the short clip by outputting only a section including a specific keyword in the original content based on the web address and time information, instead of receiving the short clip from the server 200. .
  • 4 to 8 illustrate an embodiment in which the electronic device 100 includes a display for convenience of description, and output content and a short clip are output through the display.
  • FIG. 4 is a diagram for describing a method of displaying a short clip associated with a keyword according to an exemplary embodiment.
  • the electronic device 100 may receive a spoken voice of a user.
  • the electronic device 100 may analyze the spoken voice of the user and obtain a keyword included in the spoken voice. For example, if the received speech of the user is 'tell me the current traffic information', the electronic device 100 may obtain 'traffic information' as a keyword.
  • the electronic device 100 according to another embodiment of the present invention can also obtain a keyword included in the spoken voice by communicating with the voice recognition server or server 200.
  • the electronic device 100 may transmit a signal for requesting a short clip for the acquired keyword to the server 200.
  • the server 200 may transmit a short clip for the keyword to the electronic device 100.
  • the server 200 may transmit the specific short clip to the electronic device 100 based on the short clip generated from the original content and the keyword for each short clip until the request signal is received from the electronic device 100. For example, if the keyword included in the short clip request signal is 'traffic information', the server 200 transmits only the short clip having 'traffic information' as a keyword to the electronic device 100.
  • the electronic device 100 may be generated by editing a specific section of a news program transmitted from a content provider, that is, a broadcaster, and may receive a short clip having 'traffic information' as a keyword. Therefore, the received short clip may be image content including an audio signal corresponding to 'traffic information'.
  • the electronic device 100 may transmit a short clip request signal including user information to the server 200.
  • the server 200 may transmit a short clip related to the keyword and the user information to the electronic device 100. For example, if the location of the electronic device 100 corresponds to 'Seoul' according to the user information, the server 200 may select 'traffic information' and 'Seoul from a plurality of short clips having' traffic information 'as a keyword. The short clip satisfying both 'may be transmitted to the electronic device 100. Therefore, the electronic device 100 may display the short clip optimized to the user among the short clips generated in real time.
  • the electronic device 100 may provide an output mode and a short clip mode.
  • the output mode may be a mode for continuously outputting only output content regardless of whether a short clip is received from the server 200.
  • the short clip mode may be a mode for displaying a short clip received from the server 200.
  • the electronic device 100 may display the short clip by switching from the output mode to the short clip mode at the end of the output content (for example, during CF broadcasting).
  • the present invention is not limited thereto, and the switching between the output mode and the short clip mode may be performed in response to a user input. For example, when the user's spoken voice is received in the output mode, the user may automatically switch to the short clip mode and display the short clip received from the server 200.
  • the output mode and the short clip mode may be executed at the same time. For example, when a short clip is received from the server 200, the received short clip may be displayed on a portion of the output unit 130 by overlapping the output content.
  • FIG. 5 is a diagram illustrating a method of displaying a short clip associated with output content according to an exemplary embodiment.
  • the electronic device 100 may include information about the output content in the short clip request signal and transmit the information to the server 200.
  • the server 200 may transmit the specific short clip to the electronic device 100 based on the keyword and the short clip request signal.
  • the information about the output content means information about the content that is output to the electronic device 100 and may be obtained from metadata about the output content.
  • the information on the output content may include a title, genre, broadcast time, broadcast station information, and the like of the output content.
  • the present invention is not limited thereto, and the information on the content may be obtained through various methods. For example, additional information may be obtained by receiving information on content from an external server or performing OCR on a screen.
  • the electronic device 100 may obtain at least one of “Team A” and “the batter” as keywords.
  • the electronic device 100 may display information (eg, 'sports', 'baseball') and keywords (eg, 'Team A' and 'hitter') about the output content.
  • the short clip request signal may be transmitted to the server 200.
  • the server 200 may transmit a short clip to the electronic device 100 that keyword 'sports', 'baseball', 'Team A' and 'batter' among the plurality of short clips.
  • the electronic device 100 may receive and display the interview image of the other person of Team A, the sports news about Team A, and the like from the server 200. Meanwhile, as described above, the plurality of short clips received by the electronic device 100 may be image contents generated by editing a specific section of the original content received by the broadcaster and received by the server 200.
  • FIG. 6 is a diagram for describing a method of obtaining a keyword by analyzing an audio signal according to an exemplary embodiment.
  • the electronic device 100 may transmit the word repeatedly output from the output content to the server 200 by including the short clip request signal.
  • the electronic device 100 may transmit a keyword, which is repeated more than a predetermined number of times for a predetermined time, from the audio output through the speaker provided in the electronic device 100 to the server 200.
  • the electronic device 100 may obtain 'Spain', 'Barcelona', and the like, which are repeatedly output by analyzing an audio signal of the output content as a keyword. .
  • the server 200 may transmit a short clip matching 'Spain' and 'Barcelona' among the plurality of short clips to the electronic device 100.
  • the electronic device 100 may receive and display short clips of 'Spain' and 'Barcelona' from the server 200.
  • the electronic device 100 may include the information on the output content in the short clip request information and transmit the information to the server 200.
  • the electronic device 100 may receive a short clip generated by editing a specific section of the travel information program for 'Spain' and 'Barcelona'.
  • the electronic device 100 may display the short clip received from the server 200 as a thumbnail image.
  • the short clip corresponding to the thumbnail image selected according to the user's input may be played.
  • FIG. 7 is a diagram for describing additional information about a short clip according to one embodiment of the present invention.
  • the electronic device 100 may additionally receive information on the short clip from the server 200 and provide the received information together with the short clip.
  • the additional information about the short clip includes at least one of the title 710 of the original content, the genre, the broadcast time 720 of the original content, the station information 730 of the original content, the creation time of the short clip, and a keyword.
  • the broadcast time of the original content may mean a time when the server 200 receives the content from the content provider 300, a time for generating the original content, a time when the broadcast station transmits the original content, and the like.
  • the keyword of the short clip may mean a keyword that matches a keyword included in the short clip request signal among at least one keyword matched with the corresponding short clip.
  • additional information about the short clip may be displayed when the selected short clip is reproduced according to a user input.
  • the present invention is not limited thereto, and the electronic device 100 may display a plurality of short clips received from the server 200 as thumbnail images and simultaneously display additional information on the short clips.
  • FIG. 8 is a diagram for describing additional response information provided with a short clip according to an exemplary embodiment.
  • the electronic device 100 may receive additional response information about a keyword acquired in the spoken voice of the user from an external server and display the additional response information together with the short clip.
  • the additional response information may include a search result 810 for the keyword, information on the keyword, and the like.
  • the present invention is not limited thereto, and of course, additional response information regarding at least one of information on output content, user information, and a keyword repeated in the output content may be received and displayed from an external server.
  • a search result of a genre of output content as a search word can be received from an external server and displayed together with a short clip. Can also be received by an external server and displayed.
  • FIG. 9 is a flowchart illustrating a short clip providing method according to an exemplary embodiment.
  • content is output (S910).
  • the short clip request signal is transmitted to the server based on the information about the keyword and the content included in the received spoken voice (S930).
  • the short clip is output based on the information about the short clip received from the server according to the request signal (S940).
  • the information on the short clip includes at least one of information on a time interval including a location where the short clip is stored and a keyword.
  • the received clip is received.
  • a short clip can be output based on the information.
  • each of the plurality of short clips may be video content or sound content generated by editing a portion including a specific keyword in specific content.
  • additional information about the short clip when additional information about the short clip is received, additional information about the short clip is provided, wherein the information about the short clip includes a title, a genre of the original content, a broadcast time of the original content, and a short clip. May include at least one of a generation time, broadcast station information of original content, and a keyword.
  • additional information about the short clip may be provided as audio through a speaker.
  • the electronic device may include at least one of a display and a speaker.
  • a short clip associated with the keyword is sent to the server based on a keyword that is repeated at least a predetermined number of times for a predetermined time in the audio output through the speaker.
  • the request signal can be additionally transmitted to the server.
  • additional response information regarding the spoken voice may be provided together with the short clip based on the keyword included in the received spoken voice.
  • the request signal including the keyword and the user information may be transmitted to the server.
  • a short clip related to the keyword and the user information may be received from the server and output.
  • the received spoken voice may be transmitted to the voice recognition server or the server described above, and the short clip request signal may be transmitted to the server based on the information about the keyword and the content received from the voice recognition server or the server.
  • FIG. 10 is a flowchart illustrating a system for providing a short clip according to an exemplary embodiment.
  • the server 200 receives content from the content provider 300 (S1010).
  • the content received from the content provider 300 will be referred to as the original content.
  • the server 200 may receive the content from the content provider 300 in real time. If the content provider 300 is a broadcast station, the server 200 may receive a broadcast program broadcast in real time from the broadcast station as original content.
  • the server 200 generates a plurality of short clips based on the keywords of each of the received original contents (S1020).
  • the server 200 stores a plurality of generated short clips and keywords for each of the plurality of short clips (S1030).
  • the electronic device 100 receives a user spoken voice.
  • the short clip request signal associated with the keyword included in the received speech voice is transmitted to the server 200 (S1050).
  • the electronic device 100 receives a short clip from the server (S1060).
  • the electronic device 100 outputs the received short clip (S1070).
  • FIG. 11 is a diagram for describing a method of providing a short clip through an speaker according to another embodiment of the present disclosure. Referring to FIG. 11
  • the electronic device 100 may include only a speaker and no display as an output unit.
  • the electronic device 100 may output and provide an audio signal of a short clip from the server 200.
  • the short clip includes both a video signal and an audio signal as moving image content
  • the electronic device 100 may provide only an audio signal in the received short clip.
  • a short clip may be provided that uses 'current weather' as a keyword.
  • the location clip of the electronic device 100 may be additionally received to provide a short clip of the current weather (for example, the current weather in New York) of a specific region. Also, since the electronic device 100 may not have a display, only the audio signal of the received short clip may be output.
  • the additional information on the short clip may be converted into an audio signal and provided.
  • the additional information about the short clip and the short clip may be received from the server 200, the additional information about the short clip may be output first, and the audio signal included in the short clip may be sequentially output.
  • the electronic device 100 may output only partial information of additional information about the received short clip as audio. For example, when the title, genre, broadcast time, etc. of the original content are received as additional information about the short clip, the electronic device 100 provides only the title of the original content as an audio signal and then supplies the audio signal of the received short clip. You can also output
  • the electronic device 100 may sequentially provide a plurality of short clips based on a predetermined priority.
  • the electronic device 100 may output audio signals included in the plurality of short clips through the speaker in the order of generating the short clips.
  • the user may receive the short clip and additional information about the short clip as an audio signal.
  • the above-described methods according to various embodiments of the present disclosure may be implemented in the form of software, a program, or an application that can be installed in an existing electronic device, a server, or the like.
  • control method of an electronic device may be implemented by computer executable program code to be executed by a processor in a state stored in various non-transitory computer readable mediums. It may be provided to each server or devices.
  • the method for controlling an electronic device may include a computer program product including a computer readable medium including a computer readable program executed by a computer device. It can be performed by.
  • the computer readable program may be stored in a computer readable storage medium in a server, and the program may be implemented in a form downloadable to a computer device through a network.
  • the non-transitory readable medium refers to a medium that stores data semi-permanently and is readable by a device, not a medium storing data for a short time such as a register, a cache, a memory, and the like.
  • a non-transitory readable medium such as a CD, a DVD, a hard disk, a Blu-ray disk, a USB, a memory card, a ROM, or the like.

Abstract

An electronic device is disclosed. The electronic device comprises: a communication unit for communicating with a server storing information on a plurality of short clips and storing keywords by the plurality of short clips; an output unit; an input unit; and a processor which, when a voice uttered by a user is received via the input unit, transmits a short clip request signal to the server, on the basis of a keyword included in the received uttered voice and information on content outputted from the output unit, and outputs a short clip via the output unit, on the basis of information on the short clip received from the server in response to the request signal.

Description

전자 장치 및 그의 제어 방법Electronic device and its control method
본 발명은 전자 장치 및 그의 제어 방법에 관한 것으로, 더욱 상세하게는 쇼트 클립을 제공하는 전자 장치 및 그의 제어 방법에 관한 것이다.The present invention relates to an electronic device and a control method thereof, and more particularly, to an electronic device providing a short clip and a control method thereof.
최근 전자 기술의 발달에 힘입어 다양한 유형의 멀티미디어 장치가 개발되고 있다. 특히, TV, PC, 랩탑 컴퓨터, 태블릿 PC, 스마트폰 등과 같은 멀티미디어 장치들은 대부분의 가정에서 사용될 정도로 보급율이 높다.Recently, with the development of electronic technology, various types of multimedia devices have been developed. In particular, multimedia devices such as TVs, PCs, laptop computers, tablet PCs, smartphones, and the like are widely used in most homes.
이와 함께, 다양한 기능을 원하는 사용자의 니즈(needs)에 부합하기 위하여, 멀티미디어 장치에 음성 인식을 결합한 개인 비서 서비스(Smart Assistant)를 좀 더 새로운 형태로 개발하기 위한 노력이 이루어지고 있다.In addition, in order to meet the needs of users who desire various functions, efforts are being made to develop a new type of personal assistant service (Smart Assistant) incorporating speech recognition into a multimedia device.
하지만, 종래 기술에 따르면, 사용자의 질문에 대한 텍스트 기반의 검색 결과를 TTS를 이용하여 부자연스러운 음성으로 제공하는데 그치고 있다.However, according to the related art, text-based search results for a user's question are merely provided in an unnatural voice using a TTS.
또한, 검색 결과에 영상 또는 음성 콘텐츠가 포함된 경우, 콘텐츠를 원본 그대로 제공하고 있다. 이 경우, 원본 콘텐츠는 사용자의 질문과 관계없는 부분이 다수 포함되어 있어 사용자에게 무의미한 검색 결과를 받아들여지는 문제가 있었다.In addition, when a search result includes video or audio content, the content is provided as it is. In this case, the original content contains a large number of irrelevant parts of the user's question, so that the search results that are meaningless to the user are accepted.
따라서, 원본 콘텐츠에서 사용자의 질문과 관계되는 구간만이 검색 결과로 제공될 필요성이 대두되었다.Therefore, the necessity for providing only the section related to the user's question in the original content as a search result.
본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 키워드에 기초하여 원본 콘텐츠에 대한 쇼트 클립을 제공하는 전자 장치 및 그의 제어 방법을 제공함에 있다.SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problem, and an object of the present invention is to provide an electronic device and a control method thereof for providing a short clip for original content based on a keyword.
상술한 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 전자 장치는, 복수의 쇼트 클립에 대한 정보 및 상기 복수의 쇼트 클립 별 키워드를 저장하는 서버와 통신하는 통신부, 출력부, 입력부 및 상기 입력부를 통해 사용자 발화 음성이 수신되면, 상기 수신된 발화 음성에 포함된 키워드 및 상기 출력부에서 출력되는 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송하고, 상기 요청 신호에 따라 상기 서버로부터 수신된 쇼트 클립에 대한 정보에 기초하여 쇼트 클립을 상기 출력부를 통해 출력하는 프로세서를 포함한다.An electronic device according to an embodiment of the present disclosure provides a communication unit, an output unit, an input unit, and an input unit for communicating with a server that stores information about a plurality of short clips and keywords for each of the plurality of short clips. When a user speech is received through the unit, a short clip request signal is transmitted to the server based on a keyword included in the received speech voice and information on the content output from the output unit, and the server according to the request signal. And a processor configured to output the short clip through the output unit based on the information about the short clip received from the controller.
여기서, 상기 복수의 쇼트 클립에 대한 정보는, 상기 복수의 쇼트 클립이 저장된 위치 및 상기 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나를 포함하며, 상기 프로세서는, 상기 요청 신호에 따라 상기 서버로부터 쇼트 클립에 대한 정보가 수신되면, 수신된 정보에 기초하여 상기 쇼트 클립을 출력할 수 있다.Here, the information on the plurality of short clips includes at least one of information on a time interval including the location where the plurality of short clips are stored and the keyword, and the processor is further configured to transmit information from the server according to the request signal. When the information about the short clip is received, the short clip may be output based on the received information.
또한, 상기 복수의 쇼트 클립 각각은, 특정 콘텐츠에서 특정 키워드를 포함하는 부분을 편집하여 생성된 동영상 콘텐츠 또는 음향 콘텐츠일 수 있다.In addition, each of the plurality of short clips may be video content or sound content generated by editing a portion including a specific keyword in specific content.
또한, 상기 프로세서는, 상기 쇼트 클립에 대한 추가 정보가 수신되면, 상기 쇼트 클립에 대한 추가 정보를 제공하며, 상기 쇼트 클립에 대한 추가 정보는, 원본 콘텐츠의 타이틀, 장르, 상기 원본 콘텐츠의 방송 시간, 상기 쇼트 클립의 생성 시간, 상기 원본 콘텐츠의 방송국 정보, 상기 키워드 중 적어도 하나를 포함할 수 있다.The processor may provide additional information about the short clip when additional information about the short clip is received. The additional information about the short clip may include a title, a genre, and a broadcast time of the original content. And at least one of a generation time of the short clip, broadcasting station information of the original content, and the keyword.
한편, 상기 출력부는, 디스플레이 및 스피커 중 적어도 하나를 포함할 수 있다.The output unit may include at least one of a display and a speaker.
본 발명의 다른 실시 예에 따른 전자 장치에 있어서, 상기 출력부는, 스피커만을 포함하도록 구현되며, 상기 프로세서는, 상기 쇼트 클립에 대한 추가 정보를 상기 스피커를 통해 오디오로 제공할 수 있다.In an electronic device according to another embodiment of the present disclosure, the output unit is implemented to include only a speaker, and the processor may provide additional information about the short clip as audio through the speaker.
또한, 상기 출력부는, 디스플레이 및 스피커 중 적어도 하나를 포함하며, 상기 프로세서는, 상기 스피커를 통해 출력되는 오디오에서 기설정된 시간 동안 기설정된 횟수 이상 반복되는 키워드에 기초하여 상기 서버로 상기 키워드와 관련된 쇼트 클립 요청 신호를 상기 서버로 추가적으로 전송할 수 있다.The output unit may include at least one of a display and a speaker, and the processor may be configured to generate a short associated with the keyword to the server based on a keyword that is repeated a predetermined number of times for a predetermined time in the audio output through the speaker. The clip request signal may be additionally transmitted to the server.
또한, 상기 프로세서는, 상기 수신된 발화 음성에 포함된 키워드에 기초하여 상기 쇼트 클립과 함께 상기 발화 음성에 대한 추가 응답 정보를 함께 제공할 수 있다.In addition, the processor may provide additional response information for the spoken voice together with the short clip based on the keyword included in the received spoken voice.
한편, 상기 프로세서는, 상기 키워드 및 사용자 정보를 포함하는 상기 요청 신호를 상기 서버로 전송하고, 상기 서버로부터 상기 키워드 및 상기 사용자 정보와 관련된 쇼트 클립을 수신할 수 있다.The processor may transmit the request signal including the keyword and the user information to the server, and receive a short clip associated with the keyword and the user information from the server.
또한, 상기 프로세서는, 상기 발화 음성이 수신되면, 상기 수신된 발화 음성을 음성 인식 서버 또는 상기 서버로 전송하고 상기 음성 인식 서버 또는 상기 서버로부터 수신된 상기 키워드 및 상기 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송할 수 있다.In addition, when the spoken voice is received, the processor transmits the received spoken voice to a voice recognition server or the server and shortens based on the information about the keyword and the content received from the voice recognition server or the server. The clip request signal may be transmitted to the server.
한편, 본 발명의 일 실시 예에 따른 복수의 쇼트 클립에 대한 정보 및 상기 복수의 쇼트 클립 별 키워드를 저장하는 서버와 통신하는 전자 장치의 제어 방법은, 콘텐츠를 출력하는 단계, 사용자의 발화 음성을 수신하는 단계, 상기 발화 음성이 수신되면, 상기 수신된 발화 음성에 포함된 키워드 및 상기 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송하는 단계 및 상기 요청 신호에 따라 상기 서버로부터 수신된 쇼트 클립에 대한 정보에 기초하여 쇼트 클립을 출력하는 단계를 포함한다.On the other hand, in a control method of an electronic device that communicates with a server that stores information about a plurality of short clips and keywords for each of the plurality of short clips according to an embodiment of the present disclosure, the method may include outputting content and generating a voice of a user. Receiving, when the spoken voice is received, transmitting a short clip request signal to the server based on a keyword included in the received spoken voice and information on the content, and receiving from the server according to the request signal. Outputting the short clip based on the information about the short clip.
여기서, 상기 복수의 쇼트 클립에 대한 정보는, 상기 복수의 쇼트 클립이 저장된 위치 및 상기 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나를 포함하며, 상기 전송하는 단계는, 상기 요청 신호에 따라 상기 서버로부터 쇼트 클립에 대한 정보가 수신되면, 수신된 정보에 기초하여 상기 쇼트 클립을 출력할 수 있다.The information on the plurality of short clips may include at least one of information on a location where the plurality of short clips are stored and information on a time interval including the keyword, and the transmitting may include: When the information about the short clip is received from the server, the short clip may be output based on the received information.
또한, 상기 복수의 쇼트 클립 각각은, 특정 콘텐츠에서 특정 키워드를 포함하는 부분을 편집하여 생성된 동영상 콘텐츠 또는 음향 콘텐츠일 수 있다.In addition, each of the plurality of short clips may be video content or sound content generated by editing a portion including a specific keyword in specific content.
또한, 상기 쇼트 클립을 출력하는 단계는, 상기 쇼트 클립에 대한 추가 정보가 수신되면, 상기 쇼트 클립에 대한 추가 정보를 제공하며, 상기 쇼트 클립에 대한 추가 정보는, 원본 콘텐츠의 타이틀, 장르, 상기 원본 콘텐츠의 방송 시간, 상기 쇼트 클립의 생성 시간, 상기 원본 콘텐츠의 방송국 정보, 상기 키워드 중 적어도 하나를 포함할 수 있다.The outputting of the short clip may include providing additional information about the short clip when additional information about the short clip is received, and the additional information about the short clip may include title, genre, and original content. At least one of a broadcast time of the original content, a time of generating the short clip, broadcast station information of the original content, and the keyword.
여기서, 상기 쇼트 클립을 출력하는 단계는, 상기 쇼트 클립에 대한 추가 정보를 스피커를 통해 오디오로 제공할 수 있다.The outputting of the short clip may provide additional information about the short clip as audio through a speaker.
한편, 상기 전자 장치는, 디스플레이 및 스피커 중 적어도 하나를 포함하며, 상기 전송하는 단계는, 상기 스피커를 통해 출력되는 오디오에서 기설정된 시간 동안 기설정된 횟수 이상 반복되는 키워드에 기초하여 상기 서버로 상기 키워드와 관련된 쇼트 클립 요청 신호를 상기 서버로 추가적으로 전송할 수 있다.The electronic device may include at least one of a display and a speaker, and the transmitting of the keyword may include the keyword to the server based on a keyword that is repeated at least a predetermined number of times for a predetermined time in the audio output through the speaker. The short clip request signal associated with may be additionally transmitted to the server.
또한, 상기 쇼트 클립을 출력하는 단계는, 상기 수신된 발화 음성에 포함된 키워드에 기초하여 상기 쇼트 클립과 함께 상기 발화 음성에 대한 추가 응답 정보를 함께 제공할 수 있다.The outputting of the short clip may provide additional response information for the spoken voice together with the short clip based on a keyword included in the received spoken voice.
또한, 상기 전송하는 단계는, 상기 키워드 및 사용자 정보를 포함하는 상기 요청 신호를 상기 서버로 전송하고, 상기 쇼트 클립을 출력하는 단계는, 상기 서버로부터 상기 키워드 및 상기 사용자 정보와 관련된 쇼트 클립을 수신하여 출력할 수 있다.The transmitting may include transmitting the request signal including the keyword and the user information to the server, and outputting the short clip, receiving the short clip associated with the keyword and the user information from the server. Can be output.
한편, 상기 전송하는 단계는, 상기 수신된 발화 음성을 음성 인식 서버 또는 상기 서버로 전송하고, 상기 음성 인식 서버 또는 상기 서버로부터 수신된 상기 키워드 및 상기 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송할 수 있다.The transmitting may include transmitting the received spoken voice to a voice recognition server or the server and generating a short clip request signal based on the keyword and the information about the content received from the voice recognition server or the server. Can be sent to the server.
한편, 본 발명의 일 실시 예에 따른 전자 장치 및 서버를 포함하는 시스템은, 복수의 원본 콘텐츠 각각의 키워드에 기초하여 복수의 쇼트 클립에 대한 정보를 생성하고, 상기 생성된 복수의 쇼트 클립에 대한 정보 및 상기 복수의 쇼트 클립 별 키워드를 저장하는 서버 및 사용자의 발화 음성이 수신되면, 상기 수신된 발화 음성에 포함된 키워드 및 상기 전자 장치가 출력하는 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송하고, 상기 요청 신호에 따라 상기 서버로부터 수신된 쇼트 클립에 대한 정보에 기초하여 쇼트 클립을 출력하는 전자 장치를 포함한다.Meanwhile, a system including an electronic device and a server according to an embodiment of the present disclosure generates information on a plurality of short clips based on keywords of a plurality of original contents, and generates a plurality of short clips. When a server for storing information and keywords for each of the plurality of short clips and a spoken voice of a user are received, a short clip request signal is generated based on the keyword included in the received spoken voice and information about the content output by the electronic device. And an electronic device for transmitting to the server and outputting a short clip based on information about the short clip received from the server according to the request signal.
이상과 같은 본 발명의 다양한 실시 예에 따르면, 사용자의 발화 음성에 포함된 키워드에 기초하여 원본 콘텐츠에 대한 쇼트 클립을 제공하므로, 사용자의 편의성이 증대될 수 있다.According to various embodiments of the present disclosure as described above, since a short clip for the original content is provided based on a keyword included in the spoken voice of the user, user convenience may be increased.
도 1은 본 발명의 일 실시 예에 따른 쇼트 클립을 제공하는 시스템을 설명하기 위한 도면이다.1 is a view for explaining a system for providing a short clip according to an embodiment of the present invention.
도 2a 및 도 2b는 본 발명의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.2A and 2B are block diagrams illustrating a configuration of an electronic device according to an embodiment of the present disclosure.
도 3은 본 발명의 일 실시 예에 따른 서버의 구성을 나타내는 블럭도이다.3 is a block diagram illustrating a configuration of a server according to an exemplary embodiment.
도 4는 본 발명의 일 실시 예에 따른 키워드와 관련된 쇼트 클립을 출력하는 방법을 설명하기 위한 도면이다. 4 is a diagram for describing a method of outputting a short clip associated with a keyword according to an exemplary embodiment.
도 5는 본 발명의 일 실시 예에 따른 출력 콘텐츠와 관련된 쇼트 클립을 출력하는 방법을 설명하기 위한 도면이다.5 is a diagram for describing a method of outputting a short clip associated with output content according to an exemplary embodiment.
도 6은 본 발명의 일 실시 예에 따른 오디오 신호를 분석하여 키워드를 획득하는 방법을 설명하기 위한 도면이다.6 is a diagram for describing a method of obtaining a keyword by analyzing an audio signal according to an exemplary embodiment.
도 7은 본 발명의 일 실시 예에 따른 쇼트 클립에 대한 추가 정보를 설명하기 위한 도면이다.7 is a diagram for describing additional information about a short clip according to one embodiment of the present invention.
도 8은 본 발명의 일 실시 예에 따른 쇼트 클립과 함께 제공되는 추가 응답 정보를 설명하기 위한 도면이다.FIG. 8 is a diagram for describing additional response information provided with a short clip according to an exemplary embodiment.
도 9는 본 발명의 일 실시 예에 따른 쇼트 클립 제공 방법을 설명하기 위한 흐름도이다.9 is a flowchart illustrating a short clip providing method according to an exemplary embodiment.
도 10은 본 발명의 일 실시 예에 따른 쇼트 클립을 제공하는 시스템을 설명하기 위한 흐름도이다.10 is a flowchart illustrating a system for providing a short clip according to an exemplary embodiment.
도 11은 본 발명의 다른 실시 예에 따른 전자 장치가 스피커를 통해 쇼트 클립을 제공하는 방법을 설명하기 위한 도면이다.11 is a diagram for describing a method of providing a short clip through an speaker according to another embodiment of the present disclosure.
--
이하에서는 도면을 참조하여 본 발명을 더욱 상세하게 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다. 덧붙여, 하기 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 개시의 기술적 사상의 범위가 하기 실시 예에 한정되는 것은 아니다. 오히려, 이들 실시 예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 개시의 기술적 사상을 완전하게 전달하기 위하여 제공되는 것이다.Hereinafter, with reference to the drawings will be described the present invention in more detail. In describing the present invention, when it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. In addition, the following examples may be modified in many different forms, and the scope of the technical spirit of the present disclosure is not limited to the following examples. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the inventive concept to those skilled in the art.
또한, 어떤 구성요소를 '포함'한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 나아가, 도면에서의 다양한 요소와 영역은 개략적으로 그려진 것이다. 따라서, 본 개시의 기술적 사상은 첨부한 도면에 그려진 상대적인 크기나 간격에 의해 제한되지 않는다.In addition, the term 'comprising' of an element means that the element may further include other elements, not to exclude other elements unless specifically stated otherwise. Furthermore, various elements and regions in the drawings are schematically drawn. Therefore, the technical spirit of the present disclosure is not limited by the relative size or the interval drawn in the accompanying drawings.
도 1은 본 발명의 일 실시 예에 따른 쇼트 클립을 제공하는 시스템을 설명하기 위한 도면이다.1 is a view for explaining a system for providing a short clip according to an embodiment of the present invention.
전자 장치(100)는 디스플레이 및 스피커 중 적어도 하나를 이용하여 콘텐츠를 출력하는 다양한 유형의 장치로 구현될 수 있다. 따라서, 전자 장치(100)는 디지털 TV로 구현될 수 있으나, 이에 한정되는 것은 아니며 PC, 휴대폰, 태블릿 PC, PMP, PDA, 네비게이션 등과 같이 디스플레이 기능을 갖춘 다양한 유형의 장치로 구현될 수 있다. 또한, 전자 장치(100)는 디스플레이 기능을 구비하지 않은 음향 출력 장치로 구현될 수 있음은 물론이다. 이 경우, 콘텐츠는 스피커를 통해 오디오 신호로 출력될 수 있다. 다만, 이하에서는 설명의 편의를 위하여 전자 장치(100)가 디지털 TV로 구현되는 경우를 상정하여 설명하도록 한다. 전자 장치(100)가 디스플레이 기능을 구비하지 않고 스피커만을 포함하는 실시 예에 대해서는 도 10에서 구체적으로 설명하도록 한다.The electronic device 100 may be implemented as various types of devices that output content using at least one of a display and a speaker. Accordingly, the electronic device 100 may be implemented as a digital TV, but is not limited thereto. The electronic device 100 may be implemented as various types of devices having a display function such as a PC, a mobile phone, a tablet PC, a PMP, a PDA, a navigation device, and the like. In addition, the electronic device 100 may be implemented as a sound output device having no display function. In this case, the content may be output as an audio signal through the speaker. However, hereinafter, it is assumed that the electronic device 100 is implemented as a digital TV for convenience of description. An embodiment in which the electronic device 100 includes only a speaker without a display function will be described in detail with reference to FIG. 10.
본 발명의 일 실시 예에 따른 전자 장치(100)는 사용자의 발화 음성을 수신하고, 수신된 발화 음성에 포함된 키워드를 획득할 수 있다. 구체적으로, 전자 장치(100)는 수신된 발화 음성을 음성 인식 서버(미도시)로 전송하고, 음성 인식 서버로부터 발화 음성에 포함된 키워드를 수신할 수 있다. 다만, 이에 한정되는 것은 아니며, 전자 장치(100)가 사용자의 발화 음성을 분석하여 키워드를 획득할 수도 있다.The electronic device 100 according to an embodiment of the present disclosure may receive a spoken voice of a user and obtain a keyword included in the received spoken voice. In detail, the electronic device 100 may transmit the received spoken voice to a voice recognition server (not shown) and receive a keyword included in the spoken voice from the voice recognition server. However, the present invention is not limited thereto, and the electronic device 100 may obtain a keyword by analyzing a user's spoken voice.
또한, 본 발명의 일 실시 예에 따른 서버(200)가 쇼트 클립 제공과 함께, 발화 음성을 분석하여 발화 음성에 포함된 키워드를 전자 장치(100)로 전송하는 음성 인식 서버로 활용될 수 있음은 물론이다.In addition, the server 200 according to an embodiment of the present disclosure may be used as a voice recognition server for providing a short clip and analyzing a spoken voice and transmitting a keyword included in the spoken voice to the electronic device 100. Of course.
전자 장치(100)는 수신된 발화 음성에 포함된 키워드 및 전자 장치(100)가 출력하는 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 서버(200)로 전송할 수 있다. 이 경우, 전자 장치(100)는 서버(200)로부터 요청 신호에 대응하여 쇼트 클립에 대한 정보를 수신하고, 수신된 정보에 기초하여 쇼트 클립을 출력할 수 있다. 여기서, 쇼트 클립에 대한 정보는 쇼트 클립, 쇼트 클립이 저장된 위치 및 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나 일 수 있다. 일 예로, 키워드를 포함하는 시간 구간이 수신되면, 전자 장치(100)는 이에 기초하여 콘텐츠에서 특정 키워드를 포함하는 시간 구간만을 재생하여 출력할 수도 있다.The electronic device 100 may transmit a short clip request signal to the server 200 based on the keyword included in the received speech voice and information on the content output by the electronic device 100. In this case, the electronic device 100 may receive information about the short clip from the server 200 in response to the request signal, and output the short clip based on the received information. Here, the information about the short clip may be at least one of information about a time clip including a short clip, a location where the short clip is stored, and a keyword. As an example, when a time section including a keyword is received, the electronic device 100 may reproduce and output only a time section including a specific keyword in the content based on this.
서버(200)는 복수의 쇼트 클립에 대한 정보 및 복수의 쇼트 클립 별 키워드를 저장할 수 있다. 구체적으로, 서버(200)는 콘텐츠 제공자(300)로부터 콘텐츠를 수신하고, 수신된 콘텐츠로부터 쇼트 클립을 생성할 수 있다. 예를 들어, 서버(200)는 방송사로부터 방송 콘텐츠를 수신하고, 수신된 방송 콘텐츠로부터 복수의 쇼트 클립을 생성할 수 있다. 이하에서는 설명의 편의를 위하여, 콘텐츠 제공자(300)로부터 수신된 콘텐츠를 원본 콘텐츠로 명명한다. The server 200 may store information about the plurality of short clips and keywords for each of the plurality of short clips. In detail, the server 200 may receive content from the content provider 300 and generate a short clip from the received content. For example, the server 200 may receive broadcast content from a broadcaster and generate a plurality of short clips from the received broadcast content. Hereinafter, for convenience of description, the content received from the content provider 300 is referred to as the original content.
쇼트 클립은 수신된 원본 콘텐츠의 특정 부분 또는 일부를 편집한 영상을 의미하며, 경우에 따라 복수 개의 콘텐츠가 결합된 형태로 될 수 도 있다. 예를 들어, 복수 개의 컨텐츠 각각에서 특정 부분 또는 일부를 획득하고, 획득된 부분들을 결합하여 쇼트 클립을 생성할 수 있다. The short clip refers to an image obtained by editing a specific portion or part of the received original content, and in some cases, a plurality of contents may be combined. For example, a specific part or part may be obtained from each of the plurality of contents, and the obtained parts may be combined to generate a short clip.
본 발명의 일 실시 예에 따라 서버(200)는 원본 콘텐츠의 오디오 신호를 분석하고, EPD(Endpoint Detection) 단위로 원본 콘텐츠를 편집할 수 있다. 여기서, EPD는 원본 콘텐츠의 오디오 신호를 분석하여 실시간으로 음성의 시작점과 종료점을 검출하는 알고리즘을 의미한다.According to an embodiment of the present invention, the server 200 may analyze the audio signal of the original content and edit the original content in units of endpoint detection (EPD). Here, EPD refers to an algorithm that detects a start point and an end point of a voice in real time by analyzing an audio signal of an original content.
또한, 서버(200)는 EPD 단위로 편집된 영상 각각에 포함된 음성을 분석하여 키워드를 획득할 수 있다. 따라서, 서버(200)는 하나의 원본 콘텐츠로부터 EPD 단위로 편집된, 복수의 편집 영상 및 복수의 편집 영상 각각에 매칭되는 키워드를 획득하여 저장할 수 있다. 여기서, 편집 영상에 매칭되는 키워드는 적어도 하나 이상일 수 있다. In addition, the server 200 may obtain a keyword by analyzing the voice included in each of the edited images in EPD units. Accordingly, the server 200 may obtain and store a plurality of edited images and keywords corresponding to each of the plurality of edited images edited in EPD units from one original content. Here, at least one keyword matching the edited video may be provided.
본 발명의 일 실시 예에 따라 서버(200)가 편집 영상에 포함된 오디오 신호를 분석하여 복수의 키워드를 획득한 경우, 하나의 편집 영상에 복수의 키워드가 매칭되어 서버에 저장될 수 있다. 한편, 원본 콘텐츠는 반드시 EPD 단위로 편집되는 것은 아니며, 서버(200)는 다양한 음성 검출 알고리즘에 기초하여 원본 콘텐츠를 편집하여 복수의 쇼트 클립을 생성할 수도 있다. 서버(200)의 쇼트 클립 및 쇼트 클립 별 키워드 생성 방법은 도 3에서 상세히 설명하도록 한다. 이하에서는, 설명의 편의를 위하여 원본 콘텐츠로부터 획득한 편집 영상을 쇼트 클립으로 명명한다.According to an embodiment of the present disclosure, when the server 200 acquires a plurality of keywords by analyzing an audio signal included in the edited video, the plurality of keywords may be matched to one edited video and stored in the server. Meanwhile, the original content is not necessarily edited in EPD units, and the server 200 may generate a plurality of short clips by editing the original content based on various voice detection algorithms. The short clip and the keyword generation method for each short clip of the server 200 will be described in detail with reference to FIG. 3. In the following description, an edited video obtained from original content is referred to as a short clip for convenience of description.
쇼트 클립은 원본 콘텐츠의 특정 부분, 예를 들어 특정 키워드를 포함하는 부분을 기설정된 시간 이내(예를 들어, 3분 이내)로 편집한 영상일 수 있다. 다만, 쇼트 클립은 영상 콘텐츠에 한정되지 않으며, 음향 콘텐츠를 편집하여 생성될 수 있음은 물론이다. 또한, 쇼트 클립의 재생 시간은 설정 및 음성 검출 알고리즘에 따라 변경될 수 있으므로, 3분 이내로 제한되지 않음은 물론이다. The short clip may be an image in which a specific part of the original content, for example, a part including a specific keyword, is edited within a predetermined time (for example, within 3 minutes). However, the short clip is not limited to the image content, of course, can be generated by editing the audio content. In addition, since the playback time of the short clip may be changed according to a setting and a voice detection algorithm, it is of course not limited to within 3 minutes.
한편, 서버(200)는 쇼트 클립 생성시에, 쇼트 클립에 대한 정보를 함께 생성하여 저장할 수 있다. 여기서, 쇼트 클립에 대한 정보는 쇼트 클립이 저장된 위치 및 특정 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나를 포함할 수 있다. 구체적으로, 서버(200)는 쇼트 클립에 포함된 오디오 신호 분석하여 키워드를 획득하고, 쇼트 클립 및 쇼트 클립과 매칭되는 키워드를 저장할 수 있다. 따라서, 서버(200)는 복수의 쇼트 클립 및 복수의 쇼트 클립 별 키워드를 저장할 수 있다. 또한, 본 발명의 일 실시 예에 따른 서버(200)는 원본 콘텐츠에 대한 메타데이터에 기초하여 원본 콘텐츠의 타이틀, 장르, 원본 콘텐츠의 방송 시간, 쇼트 클립의 생성시간, 원본 콘텐츠의 방송국 정보 등을 쇼트 클립과 함께 저장할 수 있다.Meanwhile, the server 200 may generate and store information about the short clip at the time of generating the short clip. Here, the information on the short clip may include at least one of information on a location where the short clip is stored and information on a time interval including a specific keyword. In detail, the server 200 may obtain a keyword by analyzing an audio signal included in the short clip, and store the short clip and a keyword matching the short clip. Therefore, the server 200 may store a plurality of short clips and keywords for each of the plurality of short clips. In addition, the server 200 according to an embodiment of the present invention may display the title, genre, broadcast time of the original content, creation time of the short clip, broadcast station information of the original content, and the like based on metadata about the original content. Can be saved with a short clip.
본 발명의 일 실시 예에 따른 전자 장치(100)는 사용자의 발화 음성을 분석하여, 발화 음성에 포함된 키워드와 관련된 쇼트 클립 요청 신호를 서버로 전송하고, 서버(200)는 수신된 요청 신호에 포함된 키워드에 대한 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 또한, 전자 장치(100)는 수신된 쇼트 클립을 디스플레이하여 사용자에게 제공할 수 있다.The electronic device 100 according to an embodiment of the present disclosure analyzes a user's spoken voice and transmits a short clip request signal related to a keyword included in the spoken voice to a server, and the server 200 transmits the received request signal to the server. The short clip for the included keyword may be transmitted to the electronic device 100. In addition, the electronic device 100 may display the received short clip and provide it to the user.
한편, 상술한 바와 같이 본 발명의 일 실시 예에 따른 전자 장치(100)는 사용자의 발화 음성을 음성 인식 서버로 전송하고, 음성 인식 서버로부터 발화 음성에 포함된 키워드를 수신할 수도 있다. 또한, 쇼트 클립을 제공하는 서버(200)가 사용자의 발화 음성을 수신하고, 발화 음성에 포함된 키워드를 전자 장치(100)로 전송하도록 구현할 수도 있다. 즉, 음성 인식 서버 또는 서버(200)는 사용자의 발화 음성이 수신되면, 수신된 음성을 텍스트로 변환하고, 변환된 텍스트에서 키워드를 획득하는 과정의 음성 인식을 수행하도록 구현될 수 있다.Meanwhile, as described above, the electronic device 100 according to an embodiment of the present disclosure may transmit a user's spoken voice to a voice recognition server and receive a keyword included in the spoken voice from the voice recognition server. In addition, the server 200 providing the short clip may be configured to receive the user's spoken voice and transmit the keyword included in the spoken voice to the electronic device 100. That is, the voice recognition server or the server 200 may be implemented to perform voice recognition of converting the received voice into text and acquiring a keyword from the converted text when the user's spoken voice is received.
이하에서는, 전자 장치(100)의 구체적 구성을 나타내는 블럭도를 참고하여 본 발명의 다양할 실시 예에 대해 설명하도록 한다. Hereinafter, various embodiments of the present disclosure will be described with reference to a block diagram illustrating a specific configuration of the electronic device 100.
도 2a 및 도 2b는 본 발명의 일 실시 예에 따른 디스플레이 장치의 구성을 나타내는 블록도이다.2A and 2B are block diagrams illustrating a configuration of a display apparatus according to an exemplary embodiment.
도 2a에 따르면, 전자 장치(100)는 통신부(110), 입력부(120), 출력부(130) 및 프로세서(140)를 포함한다.According to FIG. 2A, the electronic device 100 includes a communication unit 110, an input unit 120, an output unit 130, and a processor 140.
통신부(110)는 다양한 유형의 통신방식에 따라 외부기기와 통신을 수행한다.The communication unit 110 communicates with an external device according to various types of communication methods.
특히, 통신부(110)는 유/무선 방식 적어도 하나를 이용하여 복수의 쇼트 클립 및 복수의 쇼트 클립 별 키워드를 저장하는 서버(200)와 통신을 수행할 수 있다. 또한, 통신부(110)는 음성 인식 서버와 통신을 수행할 수 있다. 여기서, 통신부(110)는 와이파이칩, 블루투스 칩, 무선 통신 칩, NFC 칩 등 다양한 통신 칩을 포함할 수 있다.In particular, the communication unit 110 may communicate with the server 200 which stores a plurality of short clips and keywords for each of the plurality of short clips using at least one wired / wireless method. In addition, the communication unit 110 may communicate with the voice recognition server. Here, the communication unit 110 may include various communication chips such as a Wi-Fi chip, a Bluetooth chip, a wireless communication chip, an NFC chip.
통신부(110)는 후술하는 바와 같이 입력부(120)를 통해 사용자의 발화 음성이 수신되면, 음성 인식 서버로 수신된 발화 음성을 전송하고, 발화 음성에 포함된 키워드를 수신할 수 있다. 한편, 서버(200)가 음성 인식 서버로 활용되는 경우, 통신부(110)는 수신된 발화 음성을 서버(200)로 전송하고, 서버(200)로부터 키워드를 수신할 수도 있다. 다만, 이에 한정되는 것은 아니며, 음성 인식 서버 또는 서버(200)와 통신을 수행하지 않고, 전자 장치(100)가 사용자의 발화 음성에 대한 음성 인식을 수행하여 키워드를 획득할 수도 있음은 물론이다.When the user's spoken voice is received through the input unit 120 as described below, the communicator 110 may transmit the received spoken voice to the voice recognition server and receive a keyword included in the spoken voice. Meanwhile, when the server 200 is used as a voice recognition server, the communication unit 110 may transmit the received spoken voice to the server 200 and receive a keyword from the server 200. However, the present invention is not limited thereto, and the electronic device 100 may obtain a keyword by performing voice recognition on the spoken voice of the user without performing communication with the voice recognition server or the server 200.
한편, 본 발명의 일 실시 예에 따른 통신부(110)는 쇼트 클립을 요청하는 신호를 서버(200)로 전송하고, 요청 신호에 따른 쇼트 클립을 서버(200)로부터 수신할 수 있다. 여기서, 요청 신호는 사용자의 발화 음성에 포함된 키워드 및 콘텐츠에 대한 정보에 기초한 신호이다. 일 예로, 요청 신호는 키워드 및 전자 장치(100)가 출력 중인 컨텐츠에 대한 정보를 포함하는 신호가 될 수 있다. 다른 예로, 요청 신호는 키워드 및 전자 장치(100)가 출력 중인 컨텐츠에 대한 정보를 포함하는 별도의 신호와 연속하여 또는 동시에 서버(200)로 전송될 수 있다.On the other hand, the communication unit 110 according to an embodiment of the present invention may transmit a signal for requesting a short clip to the server 200, and receives a short clip according to the request signal from the server 200. Here, the request signal is a signal based on information on keywords and content included in the user's spoken voice. For example, the request signal may be a signal including a keyword and information on content being output by the electronic device 100. As another example, the request signal may be transmitted to the server 200 continuously or simultaneously with a separate signal including a keyword and information on content being output by the electronic device 100.
본 발명의 일 실시 예에 따른 요청 신호는 전자 장치(100)에 디스플레이되고 있는 콘텐츠에 대한 정보, 콘텐츠에서 반복하여 출력되는 키워드, 전자 장치(100)의 사용자에 대한 정보 등을 포함하는 신호일 수 있다. 여기서, 콘텐츠에서 반복하여 출력되는 키워드는, 전자 장치(100)가 출력하는 콘텐츠에서 기설정된 시간 동안에 기설정된 횟수 이상 반복되는 키워드를 의미할 수 있다. 이하에서는, 설명의 편의를 위하여 전자 장치(100)에 디스플레이하고 있는 콘텐츠 또는 출력하고 있는 콘텐츠를 출력 콘텐츠로 명명한다.The request signal according to an embodiment of the present disclosure may be a signal including information on content displayed on the electronic device 100, a keyword repeatedly output from the content, information on a user of the electronic device 100, and the like. . Here, the keyword repeatedly output from the content may mean a keyword that is repeated more than a predetermined number of times during a predetermined time in the content output from the electronic device 100. Hereinafter, for the convenience of description, the content displayed on the electronic device 100 or the output content will be referred to as output content.
또한, 통신부(110)는 상술한 요청 신호에 대한 응답으로, 서버(200)로부터 쇼트 클립을 수신할 수 있다.In addition, the communication unit 110 may receive a short clip from the server 200 in response to the above-described request signal.
구체적으로, 서버(200)는 전자 장치(100)로부터 쇼트 클립 요청 신호가 수신되면, 요청 신호에 대응하는 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 다만, 이에 한정되는 것은 아니며, 서버(200)는 요청 신호에 대응하는 원본 콘텐츠가 저장된 위치에 대한 정보 및 해당 원본 컨텐츠 중 쇼트 클립에 해당하는 시간 정보를 저장할 수 있다. 예를 들어, 서버(200)는 원본 컨텐츠를 재생하는 웹 주소 및 해당 원본 컨텐츠 중 쇼트 클립에 해당하는 시간 정보를 전자 장치(100)로 전송할 수도 있다. 이 경우, 전자 장치(100)는 수신된 웹 주소에 기초하여 원본 콘텐츠가 저장된 서버에 접속하고, 해당 시간 정보에 대응하는 구간을 재생할 수 있다. In detail, when the short clip request signal is received from the electronic device 100, the server 200 may transmit a short clip corresponding to the request signal to the electronic device 100. However, the present invention is not limited thereto, and the server 200 may store information on a location where original content corresponding to the request signal is stored and time information corresponding to a short clip among the original content. For example, the server 200 may transmit the web address for playing the original content and the time information corresponding to the short clip among the original content to the electronic device 100. In this case, the electronic device 100 may access the server where the original content is stored based on the received web address, and play the section corresponding to the time information.
일 예로, 전자 장치(100)는 서버(200)로부터 특정 콘텐츠를 수신할 수 있는 웹 주소 및 특정 콘텐츠에서 해당 키워드가 포함된 구간에 대한 시간 정보 수신할 수 있다. 이 경우, 전자 장치(100)는 수신된 웹 주소에 접속하여 특정 콘텐츠를 수신하고, 시간 정보에 기초하여 특정 콘텐츠의 특정 구간만을 재생하여 출력할 수 있다.For example, the electronic device 100 may receive a web address for receiving specific content from the server 200 and time information on a section including a corresponding keyword in the specific content. In this case, the electronic device 100 may access the received web address to receive specific content, and reproduce and output only a specific section of the specific content based on time information.
입력부(120)는 사용자의 발화 음성을 수신하여 오디오 데이터로 변환하기 위한 구성이다. 구체적으로, 입력부(120)는 마이크로 구현되어 사용자의 발화 음성을 수신할 수 있다. 다만, 이에 한정되는 것은 아니며, 입력부(120)는 전자 장치(100)가 아닌 전자 장치(100)를 제어하기 위한 원격 제어 장치(미도시)에 구비되어 사용자의 발화 음성을 수신할 수도 있다.The input unit 120 is a component for receiving a spoken voice of a user and converting it into audio data. In detail, the input unit 120 may be implemented as a microphone to receive a spoken voice of a user. However, the present invention is not limited thereto, and the input unit 120 may be provided in a remote control device (not shown) for controlling the electronic device 100 instead of the electronic device 100 to receive a spoken voice of a user.
또한, 전자 장치(100)가 터치 기반의 전자 장치로 구현되는 경우 입력부(120)는 터치패드와 상호 레이어 구조를 이루는 터치 스크린 형태로 구현될 수도 있다. 이 경우, 입력부(120)는 발화 음성 외에도 터치 스크린을 통한 키워드 입력을 수신할 수도 있다.In addition, when the electronic device 100 is implemented as a touch-based electronic device, the input unit 120 may be implemented in the form of a touch screen that forms a mutual layer structure with the touch pad. In this case, the input unit 120 may receive a keyword input through a touch screen in addition to the spoken voice.
출력부(130)는 다양한 콘텐츠 및 쇼트 클립 중 적어도 하나를 출력할 수 있다. 구체적으로 출력부(130)는 디스플레이 및 스피커 중 적어도 하나를 포함할 수 있다. 출력부(130)가 디스플레이를 포함하는 경우, 출력부(130)는 이미지, 동영상, 텍스트, 음악 등과 같은 다양한 콘텐츠 재생 화면, 다양한 콘텐츠를 포함하는 어플리케이션 실행 화면, 웹 브라우저 화면, GUI(Graphic User Interface) 화면 등을 디스플레이할 수 있다. The output unit 130 may output at least one of various contents and short clips. In more detail, the output unit 130 may include at least one of a display and a speaker. When the output unit 130 includes a display, the output unit 130 may include various content playback screens such as images, videos, texts, music, etc., application execution screens including various contents, web browser screens, and graphical user interfaces (GUIs). ) Screen, etc. can be displayed.
이 경우, 디스플레이는 LCD(Liquid Crystal Display Panel), OLED(Organic Light Emitting Diodes) 등으로 구현될 수 있으나, 이에 한정되는 것은 아니다. 또한, 디스플레이는 경우에 따라 플렉서블 디스플레이, 투명 디스플레이 등으로 구현되는 것도 가능하다. In this case, the display may be implemented as a liquid crystal display panel (LCD), organic light emitting diodes (OLED), or the like, but is not limited thereto. In some cases, the display may be implemented as a flexible display or a transparent display.
특히, 디스플레이는 서버(200)로부터 수신된 쇼트 클립을 디스플레이할 수 있다.In particular, the display may display the short clip received from the server 200.
한편, 본 발명의 다른 실시 예에 따른 출력부(130)가 스피커만을 포함하도록 구현되면, 출력부(130)는 수신된 쇼트 클립을 스피커를 통해 오디오로 제공할 수도 있다. 일 예로, 전자 장치(100)가 디스플레이 기능을 구비하지 않은 음향 출력 장치로 구현되는 경우, 출력부(130)는 수신된 쇼트 클립에 대한 추가 정보를 오디오로 제공할 수 있고, 쇼트 클립의 오디오 신호만을 제공할 수도 있다.Meanwhile, when the output unit 130 according to another embodiment of the present invention is implemented to include only a speaker, the output unit 130 may provide the received short clip as audio through the speaker. For example, when the electronic device 100 is implemented as a sound output device that does not have a display function, the output unit 130 may provide additional information about the received short clip as audio and an audio signal of the short clip. You can also provide only.
프로세서(140)는 전자 장치(100)의 전반적인 동작을 제어한다.The processor 140 controls the overall operation of the electronic device 100.
특히, 프로세서(140)는 입력부(120)를 통해 사용자의 발화 음성이 수신되면, 수신된 발화 음성에 포함된 키워드 및 콘텐츠에 대한 정보에 기초하여 쇼트 클립을 요청하는 신호를 통신부(110)를 통해 서버(200)로 전송할 수 있다. 또한, 요청 신호에 따라 서버(200)로부터 수신된 쇼트 클립을 출력부(130)를 통해 출력할 수 있다.In particular, when the user's spoken voice is received through the input unit 120, the processor 140 sends a signal through the communication unit 110 to request a short clip based on information on keywords and contents included in the received spoken voice. The server 200 may transmit the data. In addition, the short clip received from the server 200 according to the request signal may be output through the output unit 130.
구체적으로, 프로세서(140)는 출력 콘텐츠에 대한 정보를 서버(200)로 전송할 수 있다. 여기서, 출력 콘텐츠에 대한 정보는 출력 콘텐츠의 타이틀, 장르, 방송 시간, 방송국 정보 등을 포함할 수 있다. 따라서, 프로세서(140)가 키워드 및 출력 콘텐츠에 대한 정보 중 적어도 하나에 기초하여 쇼트 클립 요청 신호를 서버(200)로 전송하면, 프로세서(140)는 키워드 및 출력 콘텐츠와 관련된 쇼트 클립을 수신하여 제공할 수 있다. In detail, the processor 140 may transmit information on the output content to the server 200. Here, the information on the output content may include a title, genre, broadcast time, broadcasting station information, and the like of the output content. Therefore, when the processor 140 transmits a short clip request signal to the server 200 based on at least one of the information about the keyword and the output content, the processor 140 receives and provides the short clip associated with the keyword and the output content. can do.
이 경우, 프로세서(140)가 쇼트 클립 요청 신호를 서버(200)로 전송한 시점에 서버(200)에서 기 생성된 쇼트 클립을 제공받을 수 있게 된다. 여기서, 기 생성된 쇼트 클립은 출력 콘텐츠와 상이한 콘텐츠로부터 생성된 쇼트 클립이 될 수 있다. 예를 들어, 출력 콘텐츠 방송 시간 이전에 방송되어 기 생성된 콘텐츠가 될 수 있다. In this case, when the processor 140 transmits the short clip request signal to the server 200, the processor 140 may be provided with the short clip previously generated. Here, the pre-generated short clip may be a short clip generated from content different from the output content. For example, the content may be pre-generated content that is broadcast before the output content broadcast time.
다만, 이에 한정되는 것은 아니며 해당 출력 콘텐츠에서 생성된 쇼트 클립도 수신할 수 있다. 일 실시 예에 따라, 출력 콘텐츠가 실시간으로 수신되는 방송 콘텐츠인 경우 서버(200) 또한 해당 방송 콘텐츠를 수신할 수 있는데 프로세서(140)가 요청 신호를 전송한 시점에 해당 출력 콘텐츠에 대한 쇼트 클립이 생성되어 있다면, 해당 쇼트 클립도 그 대상이 될 수 있다. 예를 들어, 해당 출력 콘텐츠가 방송 시작 시점이 사용자가 쇼트 클립을 요청한 시점보다 기설정된 시간 이전인 경우, 해당 출력 콘텐츠에 대한 쇼트 클립이 기 생성되어 있을 수 있기 때문이다.However, the present invention is not limited thereto, and a short clip generated from the corresponding output content may also be received. According to an embodiment of the present disclosure, when the output content is broadcast content received in real time, the server 200 may also receive the broadcast content. When the processor 140 transmits a request signal, a short clip of the output content is output. If created, the short clip can also be the target. For example, if the corresponding output content is earlier than a preset time when the broadcast start time is requested by the user, the short clip for the corresponding output content may be generated.
한편, 프로세서(140)는 쇼트 클립에 대한 추가 정보를 수신할 수 있다. 구체적으로, 프로세서(140)는 서버(200)로부터 쇼트 클립 및 쇼트 클립에 대한 추가 정보를 수신하여 제공할 수 있다. 여기서, 쇼트 클립에 대한 추가 정보는 쇼트 클립의 원본 콘텐츠의 타이틀, 장르, 원본 콘텐츠의 방송 시간, 쇼트 클립의 생성 시간, 원본 콘텐츠의 방송국, 키워드 중 적어도 하나를 포함하는 정보일 수 있다.Meanwhile, the processor 140 may receive additional information about the short clip. In detail, the processor 140 may receive and provide a short clip and additional information about the short clip from the server 200. Here, the additional information about the short clip may be information including at least one of a title, a genre of the original content of the short clip, a broadcast time of the original content, a creation time of the short clip, a broadcaster of the original content, and a keyword.
또한, 프로세서(140)는 출력 콘텐츠의 오디오 신호를 분석하여 기설정된 시간동안 기설정된 횟수 이상 반복되는 키워드에 기초하여 서버(200)로 해당 키워드와 관련된 쇼트 클립을 요청하는 신호를 전송할 수 있다. 따라서, 프로세서(140)는 출력 콘텐츠에서 반복되는 단어를 키워드로 획득하고, 해당 키워드를 서버(200)로 전송하여 이와 관련된 쇼트 클립을 수신할 수 있다.In addition, the processor 140 may analyze the audio signal of the output content and transmit a signal for requesting a short clip associated with the keyword to the server 200 based on a keyword that is repeated more than a predetermined number of times for a predetermined time. Accordingly, the processor 140 may obtain a word repeated in the output content as a keyword, and transmit the keyword to the server 200 to receive a short clip associated with the keyword.
또한, 전자 장치(100)는 사용자 정보를 저장하는 저장부(미도시)를 포함할 수 있고, 프로세서(140)는 저장부에 저장된 사용자 정보를 포함하는 요청 신호를 서버(200)로 전송할 수 있다. 이 경우, 프로세서(140)는 사용자 정보와 관련된 쇼트 클립을 수신하여 디스플레이할 수 있다. 여기서, 사용자 정보는 전자 장치(100)의 사용자에 대한 정보로서, 연령대, 선호 장르, 선호 콘텐츠, 선호 방송국 등을 포함하는 정보일 수 있다. 따라서, 전자 장치(100)가 서버(200)로부터 복수의 쇼트 클립을 수신하는 경우, 키워드 및 사용자 정보에 기초하여 사용자에게 보다 적합한 쇼트 클립을 수신하여 디스플레이할 수 있다.In addition, the electronic device 100 may include a storage unit (not shown) for storing user information, and the processor 140 may transmit a request signal including the user information stored in the storage unit to the server 200. . In this case, the processor 140 may receive and display a short clip associated with user information. In this case, the user information is information about a user of the electronic device 100 and may include information including an age group, a favorite genre, a preferred content, a preferred broadcasting station, and the like. Therefore, when the electronic device 100 receives a plurality of short clips from the server 200, the electronic device 100 may receive and display a short clip more suitable for the user based on the keyword and the user information.
도 2b는 본 발명의 다른 실시 예에 따른 전자 장치(100)의 세부 구성을 나타내는 블럭도이다. 도 2b에 따르면, 전자 장치(100)는 통신부(110), 입력부(120), 출력부(130), 프로세서(140), 저장부(150), 오디오 처리부(160), 비디오 처리부(170) 를 포함한다. 도 2b에 도시된 구성요소들 중 도 2a에 도시된 구성요소와 중복되는 부분에 대해서는 자세한 설명을 생략하도록 한다.  2B is a block diagram illustrating a detailed configuration of an electronic device 100 according to another embodiment of the present disclosure. According to FIG. 2B, the electronic device 100 uses the communication unit 110, the input unit 120, the output unit 130, the processor 140, the storage unit 150, the audio processor 160, and the video processor 170. Include. A detailed description of parts overlapping with those shown in FIG. 2A among the elements shown in FIG. 2B will be omitted.
프로세서(140)는 저장부(150)에 저장된 각종 프로그램을 이용하여 전자 장치(100)의 동작을 전반적으로 제어한다. 프로세서(140)는 중앙처리장치(central processing unit(CPU)), 컨트롤러(controller), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(140)는 디지털 시그널 프로세서(digital signal processor(DSP))로 구현될 수 있고, 콘텐츠 프로세싱 알고리즘이 내장된 SoC로 구현될 수도 있고, FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.The processor 140 controls overall operations of the electronic device 100 using various programs stored in the storage 150. The processor 140 may be one or more of a central processing unit (CPU), a controller, an application processor (AP), a communication processor (CP), and an ARM processor. It may include or may be defined in the corresponding terms. In addition, the processor 140 may be implemented as a digital signal processor (DSP), may be implemented as an SoC incorporating a content processing algorithm, or may be implemented in the form of a field programmable gate array (FPGA). .
구체적으로, 프로세서(140)는 RAM(141), ROM(142), 메인 CPU(143), 그래픽 처리부(144), 제1 내지 n 인터페이스(145-1 ~ 145-n), 버스(146)를 포함한다.In detail, the processor 140 may access the RAM 141, the ROM 142, the main CPU 143, the graphics processor 144, the first to n interfaces 145-1 to 145-n, and the bus 146. Include.
RAM(141), ROM(142), 메인 CPU(143), 그래픽 처리부(144), 제1 내지 n 인터페이스(145-1 ~ 145-n) 등은 버스(136)를 통해 서로 연결될 수 있다. The RAM 141, the ROM 142, the main CPU 143, the graphics processor 144, the first to nth interfaces 145-1 to 145-n, and the like may be connected to each other through the bus 136.
제1 내지 n 인터페이스(145-1 내지 145-n)는 상술한 각종 구성요소들과 연결된다. 인터페이스들 중 하나는 네트워크를 통해 외부 장치와 연결되는 네트워크 인터페이스가 될 수도 있다.The first to n interfaces 145-1 to 145-n are connected to the various components described above. One of the interfaces may be a network interface connected to an external device via a network.
메인 CPU(143)는 저장부(150)에 액세스하여, 저장부(150)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고, 저장부(150)에 저장된 각종 프로그램, 콘텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다. The main CPU 143 accesses the storage 150 and performs booting using the operating system stored in the storage 150. Then, various operations are performed using various programs, contents, data, etc. stored in the storage 150.
ROM(142)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴온 명령이 입력되어 전원이 공급되면, 메인 CPU(143)는 ROM(142)에 저장된 명령어에 따라 저장부(150)에 저장된 O/S를 RAM(141)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, 메인 CPU(143)는 저장부(150)에 저장된 각종 어플리케이션 프로그램을 RAM(141)에 복사하고, RAM(141)에 복사된 어플리케이션 프로그램을 실행시켜 각종 동작을 수행한다. The ROM 142 stores a command set for system booting. When the turn-on command is input and power is supplied, the main CPU 143 copies the O / S stored in the storage unit 150 to the RAM 141 according to the command stored in the ROM 142 and executes O / S. Boot the system. When booting is completed, the main CPU 143 copies various application programs stored in the storage unit 150 to the RAM 141 and executes the application programs copied to the RAM 141 to perform various operations.
그래픽 처리부(144)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성한다. 연산부(미도시)는 수신된 제어 명령에 기초하여 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부(미도시)는 연산부(미도시)에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부(미도시)에서 생성된 화면은 출력부(130)의 디스플레이 영역 내에 표시된다.The graphic processor 144 generates a screen including various objects such as an icon, an image, and a text by using a calculator (not shown) and a renderer (not shown). An operation unit (not shown) calculates attribute values such as coordinate values, shapes, sizes, colors, and the like in which objects are displayed according to the layout of the screen based on the received control command. The renderer generates a screen having various layouts including objects based on the attribute values calculated by the calculator. The screen generated by the renderer (not shown) is displayed in the display area of the outputter 130.
저장부(150)는 전자 장치(100)를 구동시키기 위한 O/S(Operating System) 소프트웨어 모듈, 각종 멀티미디어 콘텐츠, 각종 어플리케이션, 어플리케이션 실행 중에 입력되거나 설정되는 각종 콘텐츠 등과 같이 다양한 데이터를 저장한다. 특히, 저장부(150)는 사용자 정보, 예를 들어, 사용자 선호도 정보, 연령대, 사용자 프로파일 정보 등을 저장할 수 있다.The storage unit 150 stores various data such as an operating system (O / S) software module for driving the electronic device 100, various multimedia contents, various applications, various contents input or set during application execution, and the like. In particular, the storage unit 150 may store user information, for example, user preference information, age group, user profile information, and the like.
오디오 처리부(160)는 오디오 데이터에 대한 처리를 수행하는 구성요소이다. 오디오 처리부(160)에서는 오디오 데이터에 대한 디코딩이나 증폭, 노이즈 필터링 등과 같은 다양한 처리가 수행될 수 있다. 예를 들어, 오디오 처리부(160)는 채널 재핑시 표시되는 사용자 선호도 정보가 기설정된 기준을 만족하는 경우 등에 대응되는 피드백 사운드를 생성하여 제공할 수 있다. The audio processor 160 is a component that performs processing on audio data. The audio processor 160 may perform various processing such as decoding, amplification, noise filtering, and the like on the audio data. For example, the audio processor 160 may generate and provide a feedback sound corresponding to a case where the user preference information displayed at the channel zapping satisfies a predetermined criterion.
비디오 처리부(170)는 비디오 데이터에 대한 처리를 수행하는 구성요소이다. 비디오 처리부(170)에서는 비디오 데이터에 대한 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환 등과 같은 다양한 이미지 처리를 수행할 수 있다. The video processor 170 is a component that performs processing on video data. The video processor 170 may perform various image processing such as decoding, scaling, noise filtering, frame rate conversion, resolution conversion, and the like on the video data.
도 3은 본 발명의 일 실시 예에 따른 서버(200)의 구성을 나타내는 블럭도이다.3 is a block diagram showing the configuration of a server 200 according to an embodiment of the present invention.
도 3에 따르면, 서버(200)는 통신부(210), 저장부(220) 및 프로세서(230)를 포함한다.According to FIG. 3, the server 200 includes a communication unit 210, a storage unit 220, and a processor 230.
통신부(210)는 다양한 유형의 통신방식에 따라 외부기기와 통신을 수행한다.The communication unit 210 communicates with an external device according to various types of communication methods.
특히, 통신부(210)는 유/무선 방식 중 적어도 하나를 이용하여 콘텐츠 제공자(300)와 통신을 수행할 수 있다. 구체적으로, 통신부(210)는 콘텐츠 제공자(300)로부터 콘텐츠를 수신할 수 있다. 여기서, 통신부(210)는 와이파이칩, 블루투스 칩, 무선 통신 칩, NFC 칩, 튜너 등 다양한 통신 칩을 포함할 수 있다.In particular, the communication unit 210 may communicate with the content provider 300 using at least one of the wired and wireless methods. In detail, the communication unit 210 may receive content from the content provider 300. Here, the communicator 210 may include various communication chips such as a Wi-Fi chip, a Bluetooth chip, a wireless communication chip, an NFC chip, and a tuner.
또한, 본 발명의 일 실시 예에 따른 통신부(210)는 전자 장치(100)와 통신을 수행할 수 있다. 구체적으로, 통신부(210)는 전자 장치(100)가 전송한 쇼트 클립 요청 신호를 수신하고, 이에 대응하여 쇼트 클립을 전자 장치(100)로 전송할 수 있다.In addition, the communication unit 210 according to an embodiment of the present disclosure may communicate with the electronic device 100. In detail, the communication unit 210 may receive a short clip request signal transmitted by the electronic device 100 and transmit a short clip to the electronic device 100 in response thereto.
저장부(220)는 서버(200)를 구동시키기 위한 O/S(Operating System) 소프트웨어 모듈, 각종 멀티미디어 콘텐츠, 각종 어플리케이션, 어플리케이션 실행 중에 입력되거나 설정되는 각종 콘텐츠 등과 같이 다양한 데이터를 저장한다.The storage unit 220 stores various data such as an operating system (O / S) software module for driving the server 200, various multimedia contents, various applications, various contents input or set during application execution, and the like.
특히, 저장부(220)는 원본 콘텐츠, 원본 콘텐츠로부터 생성된 복수의 쇼트 클립 및 복수의 쇼트 클립 별 키워드를 저장할 수 있다. In particular, the storage unit 220 may store original content, a plurality of short clips generated from the original content, and a plurality of keywords for each of the short clips.
본 발명의 일 실시 예에 따라 서버(200)가 원본 콘텐츠를 편집하여 복수의 쇼트 클립을 생성하면, 복수의 쇼트 클립에 포함된 오디오 신호에 따라 적어도 하나의 키워드를 획득할 수 있다. 이 경우, 서버(200)는 쇼트 클립 및 해당 쇼트 클립에서 획득된 키워드를 저장부(220)에 저장할 수 있다. 예를 들어, 제1 쇼트 클립에 포함된 오디오 신호를 분석하여 제1 및 제2 키워드를 획득한 경우, 서버(200)는 제1 쇼트 클립과 함께 제1 및 제2 키워드를 저장할 수 있다.According to an embodiment of the present invention, when the server 200 edits original content to generate a plurality of short clips, the server 200 may obtain at least one keyword according to audio signals included in the plurality of short clips. In this case, the server 200 may store the short clip and a keyword obtained from the short clip in the storage 220. For example, when the first and second keywords are obtained by analyzing audio signals included in the first short clip, the server 200 may store the first and second keywords together with the first short clip.
본 발명의 일 실시 예에 따라 서버(200)는 키워드 별 쇼트 클립을 그룹화하여 저장할 수도 있다. 이 경우, 제1 키워드에 대응하는 오디오 신호를 포함하는 쇼트 클립이 그룹화되어 저장부(220)에 저장될 수 있다. 따라서, 전자 장치(100)로부터 수신된 쇼트 클립 요청 신호에 제1 키워드가 포함되어 있으면, 서버(200)는 제1 키워드에 대응하여 그룹핑된 복수의 쇼트 클립을 전자 장치(100)로 전송할 수 있다.According to an embodiment of the present invention, the server 200 may group and store a short clip for each keyword. In this case, the short clips including the audio signal corresponding to the first keyword may be grouped and stored in the storage 220. Therefore, if the first keyword is included in the short clip request signal received from the electronic device 100, the server 200 may transmit a plurality of short clips grouped to the first keyword to the electronic device 100. .
프로세서(230)는 서버(200)의 전반적인 동작을 제어한다.The processor 230 controls the overall operation of the server 200.
우선, 본 발명의 일 실시 예에 따른 서버(200)가 음성 인식 기능을 수행하는 경우, 프로세서(230)는 전자 장치(100)로부터 수신된 발화 음성을 분석하고, 발화 음성에 포함된 키워드를 획득할 수 있다. 서버(200)는 키워드를 전자 장치(100)로 전송할 수 있다.First, when the server 200 according to an embodiment of the present invention performs a voice recognition function, the processor 230 analyzes a spoken voice received from the electronic device 100 and obtains a keyword included in the spoken voice. can do. The server 200 may transmit a keyword to the electronic device 100.
또한, 프로세서(230)는 통신부(210)를 통해 원본 콘텐츠가 수신되면, 수신된 원본 콘텐츠를 편집하여 복수의 쇼트 클립을 생성할 수 있다. 구체적으로, 프로세서(230)는 음성 검출 알고리즘에 기초하여 원본 콘텐츠의 특정 구간만을 편집할 수 있다. 여기서, 음성 검출 알고리즘은 적어도 하나의 키워드를 포함하는 오디오 신호를 검출하는 알고리즘을 의미한다. In addition, when the original content is received through the communication unit 210, the processor 230 may edit the received original content to generate a plurality of short clips. In detail, the processor 230 may edit only a specific section of the original content based on the voice detection algorithm. Here, the voice detection algorithm refers to an algorithm for detecting an audio signal including at least one keyword.
예를 들어, 프로세서(230)는 원본 콘텐츠의 오디오 신호를 분석하여 음성의 시작점과 종료점을 검출하고, 시작점과 종료점의 사이 구간(EPD 단위)을 편집하여 쇼트 클립을 생성할 수 있다. For example, the processor 230 may analyze the audio signal of the original content to detect a start point and an end point of the voice, and edit a section (EPD unit) between the start point and the end point to generate a short clip.
다만, 이에 한정되는 것은 아니며, 서버(200)는 기설정된 시간 구간, 콘텐츠 제공자에 의해 설정된 특정 구간, 서버(200) 관리자에 의해 설정된 시간 구간, 쇼트 클립 요청 신호에 포함된 사용자 요청 시간 구간 등에 기초하여 원본 콘텐츠를 편집하여 쇼트 클립을 생성할 수도 있다.However, the present disclosure is not limited thereto, and the server 200 may be based on a preset time interval, a specific interval set by the content provider, a time interval set by the server 200 administrator, and a user request time interval included in the short clip request signal. You can also edit the original content to create a short clip.
일 실시 예에 따라 프로세서(230)는 실시간으로 수신되는 방송 콘텐츠에서 음성의 최초로 검출된 후 음성이 종료되었다고 판단되면, 해당 구간을 실시간으로 편집하여 쇼트 클립을 생성할 수 있다. 이 경우, 프로세서(230)는 음성이 기설정된 시간 이상 검출되지 않거나, 기계음이나, 잡음 등이 기설정된 시간 이상 검출되면 음성이 종료되었다고 판단할 수 있다. 이 후 프로세서(230)는 생성된 쇼트 클립 및 획득된 키워드를 저장부(220)에 함께 저장할 수 있다. 따라서, 프로세서(230)는 전자 장치(100)로부터 수신된 쇼트 클립 요청 신호에 대응하여, 전자 장치(100)로 쇼트 클립을 전송할 수 있다.According to an embodiment, if it is determined that the voice is terminated after the first detection of the voice in the broadcast content received in real time, the processor 230 may generate a short clip by editing the corresponding section in real time. In this case, the processor 230 may determine that the voice is terminated when the voice is not detected for more than a preset time or when a machine sound or noise is detected for more than the preset time. Thereafter, the processor 230 may store the generated short clip and the acquired keyword together in the storage 220. Therefore, the processor 230 may transmit a short clip to the electronic device 100 in response to the short clip request signal received from the electronic device 100.
한편, 본 발명의 일 실시 예에 따른 서버(200)는 원본 콘텐츠로부터 쇼트 클립을 생성하지 않고, 원본 콘텐츠를 수신할 수 있는 웹 주소 및 특정 키워드를 포함하는 구간에 대한 시간 정보를 데이터베이스로 저장할 수도 있다. 이 경우, 전자 장치(100)로부터 쇼트 클립 요청 신호가 수신되면, 서버(200)는 쇼트 클립 요청 신호에 대응하는 원본 콘텐츠를 수신할 수 있는 웹 주소 및 해당 원본 콘텐츠에서 특정 키워드를 포함하는 구간 정보를 전자 장치(100)로 전송할 수 있다. 따라서, 전자 장치(100)는 서버(200)로부터 쇼트 클립을 수신받는 것이 아니라, 웹 주소 및 시간 정보에 기초하여 원본 콘텐츠에서 특정 키워드를 포함하는 구간만을 출력하는 방법으로 쇼트 클립을 제공할 수도 있다.Meanwhile, the server 200 according to an embodiment of the present invention may store time information on a section including a web address and a specific keyword that can receive the original content, as a database, without generating a short clip from the original content. have. In this case, when the short clip request signal is received from the electronic device 100, the server 200 may receive a web address corresponding to the short clip request signal and section information including a specific keyword in the original content. May be transmitted to the electronic device 100. Therefore, the electronic device 100 may provide the short clip by outputting only a section including a specific keyword in the original content based on the web address and time information, instead of receiving the short clip from the server 200. .
이하에서는, 본 발명의 다양한 실시 예에 따른 쇼트 클립 제공에 대하여 설명하도록 한다. 한편, 도 4 내지 도 8에서는 설명의 편의를 위하여 전자 장치(100)가 디스플레이를 포함하도록 구현되고, 출력 콘텐츠 및 쇼트 클립이 디스플레이를 통해 출력되는 실시 예를 설명하도록 한다.Hereinafter, to provide a short clip according to various embodiments of the present invention. 4 to 8 illustrate an embodiment in which the electronic device 100 includes a display for convenience of description, and output content and a short clip are output through the display.
도 4는 본 발명의 일 실시 예에 따른 키워드와 관련된 쇼트 클립을 디스플레이하는 방법을 설명하기 위한 도면이다.4 is a diagram for describing a method of displaying a short clip associated with a keyword according to an exemplary embodiment.
도 4에 따르면, 전자 장치(100)는 사용자의 발화 음성을 수신할 수 있다. 이 경우, 전자 장치(100)는 사용자의 발화 음성을 분석하고, 발화 음성에 포함된 키워드를 획득할 수 있다. 예를 들어, 수신된 사용자의 발화 음성이 '현재 교통 정보를 말해줘'이면, 전자 장치(100)는, '교통 정보'을 키워드로 획득할 수 있다. 한편, 본 발명의 다른 실시 예에 따른 전자 장치(100)는 발화 음성에 포함된 키워드를 음성 인식 서버 또는 서버(200)와 통신을 수행하여 획득할 수도 있음은 물론이다.According to FIG. 4, the electronic device 100 may receive a spoken voice of a user. In this case, the electronic device 100 may analyze the spoken voice of the user and obtain a keyword included in the spoken voice. For example, if the received speech of the user is 'tell me the current traffic information', the electronic device 100 may obtain 'traffic information' as a keyword. On the other hand, the electronic device 100 according to another embodiment of the present invention can also obtain a keyword included in the spoken voice by communicating with the voice recognition server or server 200.
또한, 전자 장치(100)는 획득된 키워드에 대한 쇼트 클립을 요청하는 신호를 서버(200)로 전송할 수 있다. 이 경우, 서버(200)는 키워드에 대한 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 구체적으로, 서버(200)는 전자 장치(100)로부터 요청 신호를 수신하기 전까지 원본 콘텐츠로부터 생성된 쇼트 클립 및 쇼트 클립 별 키워드에 기초하여, 특정 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 예를 들어, 쇼트 클립 요청 신호에 포함된 키워드가 '교통 정보'이면, 서버(200)는 '교통 정보'를 키워드로 하는 쇼트 클립만을 전자 장치(100)로 전송한다. 이 경우, 전자 장치(100)는 콘텐츠 제공자 즉, 방송사로부터 송출된 뉴스 프로그램의 특정 구간을 편집하여 생성되고, '교통 정보'를 키워드로하는 쇼트 클립을 수신할 수 있다. 따라서, 수신된 쇼트 클립은 '교통 정보'에 대응하는 오디오 신호를 포함하는 영상 콘텐츠 일 수 있다.In addition, the electronic device 100 may transmit a signal for requesting a short clip for the acquired keyword to the server 200. In this case, the server 200 may transmit a short clip for the keyword to the electronic device 100. In detail, the server 200 may transmit the specific short clip to the electronic device 100 based on the short clip generated from the original content and the keyword for each short clip until the request signal is received from the electronic device 100. For example, if the keyword included in the short clip request signal is 'traffic information', the server 200 transmits only the short clip having 'traffic information' as a keyword to the electronic device 100. In this case, the electronic device 100 may be generated by editing a specific section of a news program transmitted from a content provider, that is, a broadcaster, and may receive a short clip having 'traffic information' as a keyword. Therefore, the received short clip may be image content including an audio signal corresponding to 'traffic information'.
한편, 본 발명의 일 실시 예에 따르면, 전자 장치(100)는 사용자 정보를 포함하는 쇼트 클립 요청 신호를 서버(200)로 전송할 수 있다. 이 경우, 서버(200)는 키워드 및 사용자 정보에 관련된 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 예를 들어, 사용자 정보에 따라, 전자 장치(100)의 위치가 '서울'에 해당하는 경우, 서버(200)는 '교통 정보'를 키워드로 하는 복수의 쇼트 클립 중에서 '교통 정보' 및 '서울'을 모두 만족하는 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 따라서, 전자 장치(100)는 실시간으로 생성된 쇼트 클립 중에서 사용자에게 최적화된 쇼트 클립을 디스플레이할 수 있다.Meanwhile, according to an embodiment of the present disclosure, the electronic device 100 may transmit a short clip request signal including user information to the server 200. In this case, the server 200 may transmit a short clip related to the keyword and the user information to the electronic device 100. For example, if the location of the electronic device 100 corresponds to 'Seoul' according to the user information, the server 200 may select 'traffic information' and 'Seoul from a plurality of short clips having' traffic information 'as a keyword. The short clip satisfying both 'may be transmitted to the electronic device 100. Therefore, the electronic device 100 may display the short clip optimized to the user among the short clips generated in real time.
한편, 본 발명의 일 실시 예에 따르면, 전자 장치(100)는 출력 모드와 쇼트 클립 모드를 제공할 수 있다. 출력 모드는 서버(200)로부터 쇼트 클립 수신에 여부에 관계 없이 출력 콘텐츠만을 지속적으로 출력하는 모드일 수 있다. 또한, 쇼트 클립 모드는 서버(200)로부터 수신된 쇼트 클립을 디스플레이하는 모드일 수 있다. 전자 장치(100)는 출력 콘텐츠의 종료 시(예를 들어, CF 방송 중)에 출력 모드에서 쇼트 클립 모드로 전환하여 쇼트 클립을 디스플레이할 수 있다. 다만, 이에 한정되는 것은 아니며 사용자 입력에 대응하여 출력 모드 및 쇼트 클립 모드의 전환이 수행될 수 있다. 예를 들어, 출력 모드에서 사용자의 발화 음성이 수신되면 자동으로 쇼트 클립 모드로 전환하여, 서버(200)로부터 수신된 쇼트 클립을 디스플레이할 수 있다. 또한, 출력 모드 및 쇼트 클립 모드가 동시에 실행될 수도 있다. 예를 들어, 서버(200)로부터 쇼트 클립이 수신되면, 수신된 쇼트 클립은 출력 콘텐츠에 오버랩되어 출력부(130)의 일부 영역에 디스플레이될 수도 있다.Meanwhile, according to an embodiment of the present disclosure, the electronic device 100 may provide an output mode and a short clip mode. The output mode may be a mode for continuously outputting only output content regardless of whether a short clip is received from the server 200. In addition, the short clip mode may be a mode for displaying a short clip received from the server 200. The electronic device 100 may display the short clip by switching from the output mode to the short clip mode at the end of the output content (for example, during CF broadcasting). However, the present invention is not limited thereto, and the switching between the output mode and the short clip mode may be performed in response to a user input. For example, when the user's spoken voice is received in the output mode, the user may automatically switch to the short clip mode and display the short clip received from the server 200. Also, the output mode and the short clip mode may be executed at the same time. For example, when a short clip is received from the server 200, the received short clip may be displayed on a portion of the output unit 130 by overlapping the output content.
이하에서는, 출력 콘텐츠에 기초하여 쇼트 클립을 수신하는 방법에 대하여 설명하도록 한다.Hereinafter, a method of receiving a short clip based on the output content will be described.
도 5는 본 발명의 일 실시 예에 따른 출력 콘텐츠와 관련된 쇼트 클립을 디스플레이하는 방법을 설명하기 위한 도면이다.5 is a diagram illustrating a method of displaying a short clip associated with output content according to an exemplary embodiment.
도 5에 따르면, 전자 장치(100)는 사용자의 발화 음성에서 획득한 키워드에 더하여, 출력 콘텐츠에 대한 정보를 쇼트 클립 요청 신호에 포함하여 서버(200)로 전송할 수 있다. 이 경우, 서버(200)는 키워드 및 쇼트 클립 요청 신호에 기초하여 특정 쇼트 클립을 전자 장치(100)로 전송할 수 있다.According to FIG. 5, in addition to a keyword obtained from a spoken voice of a user, the electronic device 100 may include information about the output content in the short clip request signal and transmit the information to the server 200. In this case, the server 200 may transmit the specific short clip to the electronic device 100 based on the keyword and the short clip request signal.
구체적으로, 출력 콘텐츠에 대한 정보는 전자 장치(100)에 출력되고 있는 콘텐츠에 대한 정보를 의미하며, 출력 콘텐츠에 대한 메타데이터로부터 획득할 수 있다. 일 예로, 출력 콘텐츠에 대한 정보는 출력 콘텐츠의 타이틀, 장르, 방송 시간, 방송국 정보 등을 포함할 수 있다. 다만, 이에 한정되는 것은 아니며, 콘텐츠에 대한 정보는 다양한 방법을 통해 획득할 수 있다. 예를 들어, 외부 서버로부터 콘텐츠에 대한 정보를 수신하거나, 화면에 OCR을 수행하여 추가적인 정보를 획득할 수 있다.Specifically, the information about the output content means information about the content that is output to the electronic device 100 and may be obtained from metadata about the output content. For example, the information on the output content may include a title, genre, broadcast time, broadcast station information, and the like of the output content. However, the present invention is not limited thereto, and the information on the content may be obtained through various methods. For example, additional information may be obtained by receiving information on content from an external server or performing OCR on a screen.
도 5에 도시된 바와 같이, 사용자의 발화 음성이 'Team A의 타자에 대해 알려줘'이면, 전자 장치(100)는 'Team A' 및 '타자' 중 적어도 하나를 키워드로 획득할 수 있다. 또한, 출력 콘텐츠가 야구 경기이면, 전자 장치(100)는 출력 콘텐츠에 대한 정보(예를 들어, '스포츠', '야구') 와 키워드(예를 들어, 'Team A' 및 '타자')를 쇼트 클립 요청 신호로 서버(200)에 전송할 수 있다. 이 경우, 서버(200)는 복수의 쇼트 클립 중에서 '스포츠', '야구', 'Team A' 및 '타자' 등을 키워드하는 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 따라서, 전자 장치(100)는 Team A의 타자의 인터뷰 영상, Team A에 대한 스포츠 뉴스 등을 서버(200)로부터 수신하여 디스플레이할 수 있다. 한편, 상술한 바와 같이 전자 장치(100)가 수신한 복수의 쇼트 클립은 방송사에서 송출하여 서버(200)가 수신한 원본 콘텐츠의 특정 구간을 편집하여 생성된 영상 콘텐츠일 수 있다.As illustrated in FIG. 5, when the user's spoken voice is “tell me about the batter of Team A,” the electronic device 100 may obtain at least one of “Team A” and “the batter” as keywords. In addition, if the output content is a baseball game, the electronic device 100 may display information (eg, 'sports', 'baseball') and keywords (eg, 'Team A' and 'hitter') about the output content. The short clip request signal may be transmitted to the server 200. In this case, the server 200 may transmit a short clip to the electronic device 100 that keyword 'sports', 'baseball', 'Team A' and 'batter' among the plurality of short clips. Accordingly, the electronic device 100 may receive and display the interview image of the other person of Team A, the sports news about Team A, and the like from the server 200. Meanwhile, as described above, the plurality of short clips received by the electronic device 100 may be image contents generated by editing a specific section of the original content received by the broadcaster and received by the server 200.
이하에서는, 전자 장치(100)가 출력하는 오디오 신호로부터 키워드를 획득하고, 획득된 키워드에 대한 쇼트 클립을 수신하는 방법을 설명하도록 한다.Hereinafter, a method of obtaining a keyword from an audio signal output by the electronic device 100 and receiving a short clip for the acquired keyword will be described.
도 6은 본 발명의 일 실시 예에 따른 오디오 신호를 분석하여 키워드를 획득하는 방법을 설명하기 위한 도면이다.6 is a diagram for describing a method of obtaining a keyword by analyzing an audio signal according to an exemplary embodiment.
도 6에 따르면, 전자 장치(100)가 출력 중인 콘텐츠가 특정 단어를 반복하여 출력하는 경우를 상정할 수 있다. 이 경우, 전자 장치(100)는 사용자의 발화 음성에서 획득한 키워드에 더하여, 출력 콘텐츠에서 반복하여 출력되는 단어를 쇼트 클립 요청 신호에 포함하여 서버(200)로 전송할 수 있다.According to FIG. 6, it may be assumed that the content being output by the electronic device 100 repeatedly outputs a specific word. In this case, in addition to the keyword obtained from the spoken voice of the user, the electronic device 100 may transmit the word repeatedly output from the output content to the server 200 by including the short clip request signal.
구체적으로, 전자 장치(100)는 전자 장치(100)에 구비된 스피커를 통해 출력되는 오디오에서 기설정된 시간 동안 기설정된 횟수 이상 반복되는 키워드를 서버(200)로 전송할 수 있다.In detail, the electronic device 100 may transmit a keyword, which is repeated more than a predetermined number of times for a predetermined time, from the audio output through the speaker provided in the electronic device 100 to the server 200.
예를 들어, 출력 콘텐츠가 'Spain'에 대한 여행 정보 프로그램이면, 전자 장치(100)는 출력 콘텐츠의 오디오 신호를 분석하여 반복하여 출력되는 'Spain', 'Barcelona' 등을 키워드로 획득할 수 있다. 이 경우, 서버(200)는 복수의 쇼트 클립 중에서 'Spain', 'Barcelona'에 매칭되는 쇼트 클립을 전자 장치(100)로 전송할 수 있다. 따라서, 전자 장치(100)는 'Spain', 'Barcelona'에 대한 쇼트 클립을 서버(200)로부터 수신하여 디스플레이할 수 있다. 한편, 상술한 바와 같이 전자 장치(100)는 쇼트 클립 요청 정보에 출력 콘텐츠에 대한 정보를 포함하여 서버(200)로 전송할 수 있다. 이 경우, 전자 장치(100)는 'Spain', 'Barcelona'에 대한 여행 정보 프로그램의 특정 구간을 편집하여 생성된 쇼트 클립을 수신할 수 있다.For example, if the output content is a travel information program for 'Spain', the electronic device 100 may obtain 'Spain', 'Barcelona', and the like, which are repeatedly output by analyzing an audio signal of the output content as a keyword. . In this case, the server 200 may transmit a short clip matching 'Spain' and 'Barcelona' among the plurality of short clips to the electronic device 100. Accordingly, the electronic device 100 may receive and display short clips of 'Spain' and 'Barcelona' from the server 200. Meanwhile, as described above, the electronic device 100 may include the information on the output content in the short clip request information and transmit the information to the server 200. In this case, the electronic device 100 may receive a short clip generated by editing a specific section of the travel information program for 'Spain' and 'Barcelona'.
한편, 본 발명의 일 실시 예에 따른 전자 장치(100)는 서버(200)로부터 수신된 쇼트 클립을 썸네일 이미지로 디스플레이할 수 있다. 이 경우, 사용자의 입력에 따라 선택된 썸네일 이미지에 대응하는 쇼트 클립이 재생될 수 있다.Meanwhile, the electronic device 100 according to an embodiment of the present disclosure may display the short clip received from the server 200 as a thumbnail image. In this case, the short clip corresponding to the thumbnail image selected according to the user's input may be played.
이하에서는, 전자 장치(100)에 쇼트 클립을 디스플레이하는 구체적인 방법을 설명하도록 한다.Hereinafter, a specific method of displaying a short clip on the electronic device 100 will be described.
도 7은 본 발명의 일 실시 예에 따른 쇼트 클립에 대한 추가 정보를 설명하기 위한 도면이다.7 is a diagram for describing additional information about a short clip according to one embodiment of the present invention.
도 7에 따르면, 전자 장치(100)는 서버(200)로부터 쇼트 클립에 대한 정보를 추가적으로 수신하고, 수신된 정보를 쇼트 클립과 함께 제공할 수 있다.According to FIG. 7, the electronic device 100 may additionally receive information on the short clip from the server 200 and provide the received information together with the short clip.
구체적으로, 쇼트 클립에 대한 추가 정보는 원본 콘텐츠의 타이틀(710), 장르, 원본 콘텐츠의 방송 시간(720), 원본 콘텐츠의 방송국 정보(730), 쇼트 클립의 생성 시간, 키워드 중 적어도 하나를 포함할 수 있다. 여기서, 원본 콘텐츠의 방송 시간은 서버(200)가 콘텐츠 제공자(300)로부터 콘텐츠를 수신한 시간, 원본 콘텐츠의 생성 시간, 방송국에서 원본 콘텐츠를 송출한 시간 등을 의미할 수 있다. 또한, 쇼트 클립의 키워드는 해당 쇼트 클립에 매칭된 적어도 하나의 키워드 중에서 쇼트 클립 요청 신호에 포함된 키워드와 일치하는 키워드를 의미할 수 있다. Specifically, the additional information about the short clip includes at least one of the title 710 of the original content, the genre, the broadcast time 720 of the original content, the station information 730 of the original content, the creation time of the short clip, and a keyword. can do. Here, the broadcast time of the original content may mean a time when the server 200 receives the content from the content provider 300, a time for generating the original content, a time when the broadcast station transmits the original content, and the like. Also, the keyword of the short clip may mean a keyword that matches a keyword included in the short clip request signal among at least one keyword matched with the corresponding short clip.
한편, 도 7에 도시된 바와 같이, 쇼트 클립에 대한 추가 정보는 사용자의 입력에 따라 선택된 쇼트 클립이 재생되는 경우에 디스플레이될 수 있다. 다만, 이에 한정되는 것은 아니며, 전자 장치(100)가 서버(200)로부터 수신된 복수의 쇼트 클립을 썸네일 이미지로 디스플레이함과 동시에 쇼트 클립에 대한 추가 정보를 함께 디스플레이 할 수도 있음은 물론이다. Meanwhile, as illustrated in FIG. 7, additional information about the short clip may be displayed when the selected short clip is reproduced according to a user input. However, the present invention is not limited thereto, and the electronic device 100 may display a plurality of short clips received from the server 200 as thumbnail images and simultaneously display additional information on the short clips.
이하에서는, 사용자의 발화 음성에 포함된 키워드에 대한 추가 응답 정보를 디스플레이하는 방법을 설명하도록 한다.Hereinafter, a method of displaying additional response information about a keyword included in a user's spoken voice will be described.
도 8은 본 발명의 일 실시 예에 따른 쇼트 클립과 함께 제공되는 추가 응답 정보를 설명하기 위한 도면이다.FIG. 8 is a diagram for describing additional response information provided with a short clip according to an exemplary embodiment.
도 8에 따르면, 전자 장치(100)는 사용자의 발화 음성에서 획득된 키워드에 대한 추가 응답 정보를 외부 서버로부터 수신하여 쇼트 클립과 함께 디스플레이 할 수 있다. 여기서, 추가 응답 정보는 키워드에 대한 검색 결과(810), 키워드에 대한 정보 등을 포함할 수 있다. 다만, 이에 한정되는 것은 아니며, 출력 콘텐츠에 대한 정보, 사용자 정보, 출력 콘텐츠에서 반복되는 키워드 중 적어도 하나에 대한 추가 응답 정보를 외부 서버로부터 수신하여 디스플레이할 수 있음은 물론이다.According to FIG. 8, the electronic device 100 may receive additional response information about a keyword acquired in the spoken voice of the user from an external server and display the additional response information together with the short clip. Here, the additional response information may include a search result 810 for the keyword, information on the keyword, and the like. However, the present invention is not limited thereto, and of course, additional response information regarding at least one of information on output content, user information, and a keyword repeated in the output content may be received and displayed from an external server.
예를 들어, 출력 콘텐츠의 장르를 검색어로 한 검색 결과를 외부 서버로부터 수신하여 쇼트 클립과 함께 디스플레이할 수 있으며, 사용자의 발화 음성에서 획득된 키워드 및 출력 콘텐츠의 장르를 조합하여 검색어로 한 검색 결과를 외부 서버로 수신하여 디스플레이할 수도 있다.For example, a search result of a genre of output content as a search word can be received from an external server and displayed together with a short clip. Can also be received by an external server and displayed.
도 9는 본 발명의 일 실시 예에 따른 쇼트 클립 제공 방법을 설명하기 위한 흐름도이다.9 is a flowchart illustrating a short clip providing method according to an exemplary embodiment.
도 9에 도시된 전자 장치의 제어 방법에 따르면, 우선 콘텐츠를 출력한다(S910).According to the control method of the electronic device illustrated in FIG. 9, first, content is output (S910).
이어서, 사용자의 발화 음성을 수신한다 (S920).Subsequently, the user's spoken voice is received (S920).
이어서, 발화 음성이 수신되면, 수신된 발화 음성에 포함된 키워드 및 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 서버로 전송한다 (S930).Subsequently, when the spoken voice is received, the short clip request signal is transmitted to the server based on the information about the keyword and the content included in the received spoken voice (S930).
이어서, 요청 신호에 따라 서버로부터 수신된 쇼트 클립에 대한 정보에 기초하여 쇼트 클립을 출력한다(S940).Subsequently, the short clip is output based on the information about the short clip received from the server according to the request signal (S940).
여기서 쇼트 클립에 대한 정보는 쇼트 클립이 저장된 위치 및 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나를 포함하며, S940 단계에서는, 요청 신호에 따라 서버로부터 쇼트 클립에 대한 정보가 수신되면, 수신된 정보에 기초하여 쇼트 클립을 출력할 수 있다.Here, the information on the short clip includes at least one of information on a time interval including a location where the short clip is stored and a keyword. In operation S940, when information about the short clip is received from the server according to a request signal, the received clip is received. A short clip can be output based on the information.
또한, 복수의 쇼트 클립 각각은, 특정 콘텐츠에서 특정 키워드를 포함하는 부분을 편집하여 생성된 동영상 콘텐츠 또는 음향 콘텐츠일 수 있다In addition, each of the plurality of short clips may be video content or sound content generated by editing a portion including a specific keyword in specific content.
또한, S940단계에서는, 쇼트 클립에 대한 추가 정보가 수신되면, 쇼트 클립에 대한 추가 정보를 제공하며, 여기서, 쇼트 클립에 대한 정보는, 원본 콘텐츠의 타이틀, 장르, 원본 콘텐츠의 방송 시간, 쇼트 클립의 생성 시간, 원본 콘텐츠의 방송국 정보, 키워드 중 적어도 하나를 포함할 수 있다.In addition, in operation S940, when additional information about the short clip is received, additional information about the short clip is provided, wherein the information about the short clip includes a title, a genre of the original content, a broadcast time of the original content, and a short clip. May include at least one of a generation time, broadcast station information of original content, and a keyword.
또한, S940 단계에서는, 쇼트 클립에 대한 추가 정보를 스피커를 통해 오디오로 제공할 수 있다.In operation S940, additional information about the short clip may be provided as audio through a speaker.
또한, 전자 장치는 디스플레이 및 스피커 중 적어도 하나를 포함할 수 있으며, S930단계에서는, 스피커를 통해 출력되는 오디오에서 기설정된 시간 동안 기설정된 횟수 이상 반복되는 키워드에 기초하여 서버로 키워드와 관련된 쇼트 클립을 요청하는 신호를 서버로 추가적으로 전송할 수 있다.Also, the electronic device may include at least one of a display and a speaker. In operation S930, a short clip associated with the keyword is sent to the server based on a keyword that is repeated at least a predetermined number of times for a predetermined time in the audio output through the speaker. The request signal can be additionally transmitted to the server.
또한, S940 단계에서는, 수신된 발화 음성에 포함된 키워드에 기초하여 쇼트 클립과 함께 발화 음성에 대한 추가 응답 정보를 함께 제공할 수 있다.In operation S940, additional response information regarding the spoken voice may be provided together with the short clip based on the keyword included in the received spoken voice.
또한, S930 단계에서는, 키워드 및 사용자 정보를 포함하는 요청 신호를 서버로 전송하고, S940 단계에서는, 서버로부터 키워드 및 상시 사용자 정보와 관련된 쇼트 클립을 수신하여 출력하는 것도 가능하다.In operation S930, the request signal including the keyword and the user information may be transmitted to the server. In operation S940, a short clip related to the keyword and the user information may be received from the server and output.
한편, S930단계에서는, 수신된 발화 음성을 음성 인식 서버 또는 상술한 서버로 전송하고, 음성 인식 서버 또는 서버로부터 수신된 키워드 및 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 서버로 전송할 수 있다.In operation S930, the received spoken voice may be transmitted to the voice recognition server or the server described above, and the short clip request signal may be transmitted to the server based on the information about the keyword and the content received from the voice recognition server or the server.
도 10는 본 발명의 일 실시 예에 따른 쇼트 클립을 제공하는 시스템을 설명하기 위한 흐름도이다.10 is a flowchart illustrating a system for providing a short clip according to an exemplary embodiment.
도 10에 따르면, 우선 서버(200)는 콘텐츠 제공자(300)로부터 콘텐츠를 수신한다(S1010). 이하에서는 콘텐츠 제공자(300)로부터 수신된 콘텐츠를 원본 콘텐츠로 명명한다. 한편, 서버(200)는 콘텐츠 제공자(300)로부터 콘텐츠를 실시간으로 수신할 수 있다. 콘텐츠 제공자(300)가 방송국이면, 서버(200)는 방송국에서 실시간으로 송출되는 방송 프로그램을 원본 콘텐츠로 수신할 수 있다.According to FIG. 10, first, the server 200 receives content from the content provider 300 (S1010). Hereinafter, the content received from the content provider 300 will be referred to as the original content. Meanwhile, the server 200 may receive the content from the content provider 300 in real time. If the content provider 300 is a broadcast station, the server 200 may receive a broadcast program broadcast in real time from the broadcast station as original content.
이어서, 서버(200)는 수신된 원본 콘텐츠 각각의 키워드에 기초하여 복수의 쇼트 클립을 생성한다(S1020).Subsequently, the server 200 generates a plurality of short clips based on the keywords of each of the received original contents (S1020).
이어서, 서버(200)는 생성된 복수의 쇼트 클립 및 복수의 쇼트 클립 별 키워드를 저장한다(S1030).Subsequently, the server 200 stores a plurality of generated short clips and keywords for each of the plurality of short clips (S1030).
한편, 전자 장치(100)는 사용자 발화 음성을 수신한다(S1040).In operation S1040, the electronic device 100 receives a user spoken voice.
이어서, 수신된 발화 음성에 포함된 키워드와 관련된 쇼트 클립 요청 신호를 서버(200)로 전송한다(S1050).Subsequently, the short clip request signal associated with the keyword included in the received speech voice is transmitted to the server 200 (S1050).
이어서, 전자 장치(100)는 서버로부터 쇼트 클립을 수신한다(S1060).Subsequently, the electronic device 100 receives a short clip from the server (S1060).
이어서, 전자 장치(100)는 수신된 쇼트 클립을 출력한다(S1070).Subsequently, the electronic device 100 outputs the received short clip (S1070).
이하에서는, 전자 장치(100)가 디스플레이 기능을 구비하지 않은 경우, 스피커를 통해 쇼트 클립을 제공하는 방법에 대해 설명하도록 한다.Hereinafter, when the electronic device 100 does not have a display function, a method of providing a short clip through a speaker will be described.
도 11는 본 발명의 다른 실시 예에 따른 전자 장치가 스피커를 통해 쇼트 클립을 제공하는 방법을 설명하기 위한 도면이다.FIG. 11 is a diagram for describing a method of providing a short clip through an speaker according to another embodiment of the present disclosure. Referring to FIG.
도 11에 따르면, 전자 장치(100)는 출력부로서, 스피커만을 구비하고 디스플레이는 구비하지 않을 수 있다. 이 경우, 전자 장치(100)는 서버(200)로부터 쇼트 클립의 오디오 신호를 출력하여 제공할 수 있다. 일 예로, 쇼트 클립이 동영상 콘텐츠로서 비디오 신호 및 오디오 신호를 모두 포함하고 있는 경우, 전자 장치(100)는 수신된 쇼트 클립에서 오디오 신호만을 제공할 수도 있다.According to FIG. 11, the electronic device 100 may include only a speaker and no display as an output unit. In this case, the electronic device 100 may output and provide an audio signal of a short clip from the server 200. For example, when the short clip includes both a video signal and an audio signal as moving image content, the electronic device 100 may provide only an audio signal in the received short clip.
도 11에 도시된 바와 같이, ‘현재 날씨를 알려줘’가 발화 음성으로 수신되면, ‘현재 날씨’를 키워드로 하는 쇼트 클립이 제공될 수 있다. 이 경우, 상술한 바와 같이 전자 장치(100)의 위치 정보를 추가적으로 수신하여 구체적인 지역의 현재 날씨(예를 들어, 뉴욕의 현재 날씨)에 대한 쇼트 클립이 제공될 수 있다. 또한, 전자 장치(100)는 디스플레이를 구비하지 않을 수 있으므로, 수신된 쇼트 클립의 오디오 신호만이 출력될 수 있다. As illustrated in FIG. 11, when 'tell me the current weather' is received as a spoken voice, a short clip may be provided that uses 'current weather' as a keyword. In this case, as described above, the location clip of the electronic device 100 may be additionally received to provide a short clip of the current weather (for example, the current weather in New York) of a specific region. Also, since the electronic device 100 may not have a display, only the audio signal of the received short clip may be output.
또한, 상술한 바와 같이 쇼트 클립에 대한 추가 정보가 수신되면, 쇼트 클립에 대한 추가 정보를 오디오 신호로 변환하여 제공할 수 있다. 일 예로, 서버(200)로부터 쇼트 클립 및 쇼트 클립에 대한 추가 정보가 수신되면 쇼트 클립에 대한 추가 정보를 먼저 출력하고, 쇼트 클립에 포함된 오디오 신호를 순차적으로 출력할 수 있다.In addition, when the additional information on the short clip is received as described above, the additional information on the short clip may be converted into an audio signal and provided. For example, when additional information about the short clip and the short clip is received from the server 200, the additional information about the short clip may be output first, and the audio signal included in the short clip may be sequentially output.
본 발명의 일 실시 예에 따른 전자 장치(100)는 수신된 쇼트 클립에 대한 추가 정보 중 일부 정보만을 오디오로 출력할 수도 있다. 일 예로, 쇼트 클립에 대한 추가 정보로서 원본 콘텐츠의 타이틀, 장르, 방송 시간 등이 수신되면, 전자 장치(100)는 원본 콘텐츠의 타이틀만을 오디오 신호로 제공한 뒤에, 수신된 쇼트 클립의 오디오 신호를 출력할 수도 있다.According to an embodiment of the present disclosure, the electronic device 100 may output only partial information of additional information about the received short clip as audio. For example, when the title, genre, broadcast time, etc. of the original content are received as additional information about the short clip, the electronic device 100 provides only the title of the original content as an audio signal and then supplies the audio signal of the received short clip. You can also output
또한, 본 발명의 일 실시 예에 따른 전자 장치(100)는 서버(200)로부터 복수의 쇼트 클립이 수신되면, 기설정된 우선 순위에 기초하여 복수의 쇼트 클립을 순차적으로 제공할 수 있다. 일 예로, 전자 장치(100)는 복수의 쇼트 클립에 포함된 오디오 신호를 쇼트 클립의 생성 순서에 따라 스피커를 통해 출력할 수 있다. In addition, when a plurality of short clips are received from the server 200, the electronic device 100 according to an embodiment of the present disclosure may sequentially provide a plurality of short clips based on a predetermined priority. For example, the electronic device 100 may output audio signals included in the plurality of short clips through the speaker in the order of generating the short clips.
따라서, 사용자는 전자 장치(100)가 디스플레이 기능을 구비하지 않은 경우에도, 쇼트 클립 및 쇼트 클립에 대한 추가 정보를 오디오 신호로 제공받을 수 있다.Therefore, even if the electronic device 100 does not have a display function, the user may receive the short clip and additional information about the short clip as an audio signal.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치, 서버 등에 설치 가능한 소프트웨어, 프로그램 또는 어플리케이션 형태로 구현될 수 있다. Meanwhile, the above-described methods according to various embodiments of the present disclosure may be implemented in the form of software, a program, or an application that can be installed in an existing electronic device, a server, or the like.
또한, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치 또는 서버 등에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드 만으로도 구현될 수 있다.In addition, the above-described methods according to various embodiments of the present disclosure may be implemented by software upgrade or hardware upgrade of an existing electronic device or server.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 전자 장치의 제어 방법은 컴퓨터로 실행가능한 프로그램 코드로 구현되어 다양한 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장된 상태로 프로세서에 의해 실행되도록 각 서버 또는 기기들에 제공될 수 있다.Meanwhile, the above-described control method of an electronic device according to various embodiments of the present disclosure may be implemented by computer executable program code to be executed by a processor in a state stored in various non-transitory computer readable mediums. It may be provided to each server or devices.
또한, 상술한 본 발명의 다양한 실시 예에 따른 전자 장치의 제어 방법은 컴퓨터 장치에 의해 실행되는 컴퓨터 판독 가능 프로그램을 포함하는 검퓨터 기록매체(computer readable medium)를 포함하는 컴퓨터 프로그램 장치(computer program product)에 의해 수행될 수 있다. 또한, 컴퓨터 판독 가능 프로그램은, 서버에서 컴퓨터 판독 가능 저장 매체에 저장될 수 있으며, 해당 프로그램은 네트워크를 통하여 컴퓨터 장치로 다운로드 가능한 형태로 구현될 수 있다. In addition, the method for controlling an electronic device according to various embodiments of the present disclosure described above may include a computer program product including a computer readable medium including a computer readable program executed by a computer device. It can be performed by. In addition, the computer readable program may be stored in a computer readable storage medium in a server, and the program may be implemented in a form downloadable to a computer device through a network.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.The non-transitory readable medium refers to a medium that stores data semi-permanently and is readable by a device, not a medium storing data for a short time such as a register, a cache, a memory, and the like. Specifically, the various applications or programs described above may be stored and provided in a non-transitory readable medium such as a CD, a DVD, a hard disk, a Blu-ray disk, a USB, a memory card, a ROM, or the like.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.In addition, although the preferred embodiment of the present invention has been shown and described above, the present invention is not limited to the above-described specific embodiment, the technical field to which the invention belongs without departing from the spirit of the invention claimed in the claims. Of course, various modifications can be made by those skilled in the art, and these modifications should not be individually understood from the technical spirit or the prospect of the present invention.

Claims (15)

  1. 전자 장치에 있어서,In an electronic device,
    복수의 쇼트 클립에 대한 정보 및 상기 복수의 쇼트 클립 별 키워드를 저장하는 서버와 통신하는 통신부;A communication unit communicating with a server that stores information about a plurality of short clips and keywords for each of the plurality of short clips;
    출력부;An output unit;
    입력부; 및An input unit; And
    상기 입력부를 통해 사용자 발화 음성이 수신되면, 상기 수신된 발화 음성에 포함된 키워드 및 상기 출력부에서 출력되는 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송하고, 상기 요청 신호에 따라 상기 서버로부터 수신된 쇼트 클립에 대한 정보에 기초하여 쇼트 클립을 상기 출력부를 통해 출력하는 프로세서;를 포함하는 전자 장치.When a user spoken voice is received through the input unit, a short clip request signal is transmitted to the server based on a keyword included in the received spoken voice and information on content output from the output unit, and according to the request signal. And a processor configured to output the short clip through the output unit based on the information about the short clip received from the server.
  2. 제1항에 있어서,The method of claim 1,
    상기 복수의 쇼트 클립에 대한 정보는,Information about the plurality of short clips,
    상기 복수의 쇼트 클립이 저장된 위치 및 상기 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나를 포함하며,At least one of a location where the plurality of short clips are stored and information on a time interval including the keyword,
    상기 프로세서는,The processor,
    상기 요청 신호에 따라 상기 서버로부터 쇼트 클립에 대한 정보가 수신되면, 수신된 정보에 기초하여 상기 쇼트 클립을 출력하는, 전자 장치.And outputting the short clip based on the received information when the information on the short clip is received from the server according to the request signal.
  3. 제1항에 있어서,The method of claim 1,
    상기 복수의 쇼트 클립 각각은,Each of the plurality of short clips,
    특정 콘텐츠에서 특정 키워드를 포함하는 부분을 편집하여 생성된 동영상 콘텐츠 또는 음향 콘텐츠인, 전자 장치.An electronic device, which is video content or sound content generated by editing a portion of a specific content including a specific keyword.
  4. 제1항에 있어서,The method of claim 1,
    상기 프로세서는,The processor,
    상기 쇼트 클립에 대한 추가 정보가 수신되면, 상기 쇼트 클립에 대한 추가 정보를 제공하며,When additional information about the short clip is received, additional information about the short clip is provided.
    상기 쇼트 클립에 대한 추가 정보는,Additional information about the short clip,
    원본 콘텐츠의 타이틀, 장르, 상기 원본 콘텐츠의 방송 시간, 상기 쇼트 클립의 생성 시간, 상기 원본 콘텐츠의 방송국 정보, 상기 키워드 중 적어도 하나를 포함하는, 전자 장치.And at least one of a title, a genre of original content, a broadcast time of the original content, a creation time of the short clip, broadcaster information of the original content, and the keyword.
  5. 제1항에 있어서,The method of claim 1,
    상기 출력부는,The output unit,
    디스플레이 및 스피커 중 적어도 하나를 포함하는, 전자 장치.At least one of a display and a speaker.
  6. 제4항에 있어서,The method of claim 4, wherein
    상기 출력부는, 스피커만을 포함하도록 구현되며,The output unit is implemented to include only a speaker,
    상기 프로세서는,The processor,
    상기 쇼트 클립에 대한 추가 정보를 상기 스피커를 통해 오디오로 제공하는, 전자 장치.And provide additional information about the short clip as audio through the speaker.
  7. 제1항에 있어서,The method of claim 1,
    상기 출력부는,The output unit,
    디스플레이 및 스피커 중 적어도 하나를 포함하며,At least one of a display and a speaker,
    상기 프로세서는,The processor,
    상기 스피커를 통해 출력되는 오디오에서 기설정된 시간 동안 기설정된 횟수 이상 반복되는 키워드에 기초하여 상기 서버로 상기 키워드와 관련된 쇼트 클립 요청 신호를 상기 서버로 추가적으로 전송하는, 전자 장치.And transmitting a short clip request signal associated with the keyword to the server based on the keyword repeated more than a preset number of times for a predetermined time in the audio output through the speaker.
  8. 제1항에 있어서,The method of claim 1,
    상기 프로세서는,The processor,
    상기 수신된 발화 음성에 포함된 키워드에 기초하여 상기 쇼트 클립과 함께 상기 발화 음성에 대한 추가 응답 정보를 함께 제공하는, 전자 장치.And providing additional response information about the spoken voice together with the short clip based on a keyword included in the received spoken voice.
  9. 제1항에 있어서, The method of claim 1,
    상기 프로세서는,The processor,
    상기 키워드 및 사용자 정보를 포함하는 상기 요청 신호를 상기 서버로 전송하고, 상기 서버로부터 상기 키워드 및 상기 사용자 정보와 관련된 쇼트 클립을 수신하는, 전자 장치.Transmitting the request signal including the keyword and the user information to the server, and receiving a short clip associated with the keyword and the user information from the server.
  10. 제1항에 있어서,The method of claim 1,
    상기 프로세서는,The processor,
    상기 발화 음성이 수신되면, 상기 수신된 발화 음성을 음성 인식 서버 또는 상기 서버로 전송하고 상기 음성 인식 서버 또는 상기 서버로부터 수신된 상기 키워드 및 상기 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송하는, 전자 장치.When the spoken voice is received, the received spoken voice is transmitted to a voice recognition server or the server, and the short clip request signal is transmitted to the server based on the information about the keyword and the content received from the voice recognition server or the server. To the electronic device.
  11. 복수의 쇼트 클립에 대한 정보 및 상기 복수의 쇼트 클립 별 키워드를 저장하는 서버와 통신하는 전자 장치의 제어 방법에 있어서,A control method of an electronic device communicating with a server that stores information on a plurality of short clips and keywords for each of the plurality of short clips, the method comprising:
    콘텐츠를 출력하는 단계;Outputting content;
    사용자의 발화 음성을 수신하는 단계;Receiving a spoken voice of a user;
    상기 발화 음성이 수신되면, 상기 수신된 발화 음성에 포함된 키워드 및 상기 콘텐츠에 대한 정보에 기초하여 쇼트 클립 요청 신호를 상기 서버로 전송하는 단계; 및When the spoken voice is received, transmitting a short clip request signal to the server based on a keyword included in the received spoken voice and information on the content; And
    상기 요청 신호에 따라 상기 서버로부터 수신된 쇼트 클립에 대한 정보에 기초하여 쇼트 클립을 출력하는 단계;를 포함하는 제어 방법.And outputting a short clip based on the information about the short clip received from the server according to the request signal.
  12. 제11항에 있어서,The method of claim 11,
    상기 복수의 쇼트 클립에 대한 정보는,Information about the plurality of short clips,
    상기 복수의 쇼트 클립이 저장된 위치 및 상기 키워드를 포함하는 시간 구간에 대한 정보 중 적어도 하나를 포함하며,At least one of a location where the plurality of short clips are stored and information on a time interval including the keyword,
    상기 출력하는 단계는,The outputting step,
    상기 요청 신호에 따라 상기 서버로부터 쇼트 클립에 대한 정보가 수신되면, 수신된 정보에 기초하여 상기 쇼트 클립을 출력하는, 제어 방법.And when the information on the short clip is received from the server according to the request signal, outputting the short clip based on the received information.
  13. 제11항에 있어서,The method of claim 11,
    상기 복수의 쇼트 클립 각각은,Each of the plurality of short clips,
    특정 콘텐츠에서 특정 키워드를 포함하는 부분을 편집하여 생성된 동영상 콘텐츠 또는 음향 콘텐츠인, 제어 방법.A control method, which is video content or sound content generated by editing a portion containing a specific keyword in specific content.
  14. 제11항에 있어서,The method of claim 11,
    상기 쇼트 클립을 출력하는 단계는,Outputting the short clip,
    상기 쇼트 클립에 대한 추가 정보가 수신되면, 상기 쇼트 클립에 대한 추가 정보를 제공하며,When additional information about the short clip is received, additional information about the short clip is provided.
    상기 쇼트 클립에 대한 추가 정보는,Additional information about the short clip,
    원본 콘텐츠의 타이틀, 장르, 상기 원본 콘텐츠의 방송 시간, 상기 쇼트 클립의 생성 시간, 상기 원본 콘텐츠의 방송국 정보, 상기 키워드 중 적어도 하나를 포함하는, 제어 방법.And at least one of a title, a genre of original content, a broadcast time of the original content, a creation time of the short clip, broadcasting station information of the original content, and the keyword.
  15. 제14항에 있어서,The method of claim 14,
    상기 쇼트 클립을 출력하는 단계는,Outputting the short clip,
    상기 쇼트 클립에 대한 추가 정보를 스피커를 통해 오디오로 제공하는, 제어 방법.Providing additional information about the short clip as audio through a speaker.
PCT/KR2017/006790 2016-07-21 2017-06-27 Electronic device and control method thereof WO2018016760A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US16/319,545 US10957321B2 (en) 2016-07-21 2017-06-27 Electronic device and control method thereof
EP17831233.6A EP3438852B1 (en) 2016-07-21 2017-06-27 Electronic device and control method thereof

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662365076P 2016-07-21 2016-07-21
US62/365,076 2016-07-21
KR10-2017-0036304 2017-03-22
KR1020170036304A KR102403149B1 (en) 2016-07-21 2017-03-22 Electric device and method for controlling thereof

Publications (1)

Publication Number Publication Date
WO2018016760A1 true WO2018016760A1 (en) 2018-01-25

Family

ID=60993116

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/006790 WO2018016760A1 (en) 2016-07-21 2017-06-27 Electronic device and control method thereof

Country Status (2)

Country Link
KR (1) KR102403149B1 (en)
WO (1) WO2018016760A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021073161A1 (en) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 Elderly people registration method, apparatus and device based on voice recognition, and storage medium
CN114466223A (en) * 2022-04-12 2022-05-10 深圳市天兴诚科技有限公司 Video data processing method and system for coding technology

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066226A1 (en) * 2010-09-10 2012-03-15 Verizon Patent And Licensing, Inc. Social media organizer for instructional media
KR20120038654A (en) * 2010-10-14 2012-04-24 엘지전자 주식회사 Method for providing service for recognizing voice in broadcast and network tv/server for controlling the method
US20130282713A1 (en) * 2003-09-30 2013-10-24 Stephen R. Lawrence Personalization of Web Search Results Using Term, Category, and Link-Based User Profiles
KR20140028540A (en) * 2012-08-29 2014-03-10 엘지전자 주식회사 Display device and speech search method thereof
KR20150077580A (en) * 2013-12-27 2015-07-08 주식회사 케이티 Method and apparatus for providing of service based speech recognition

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830321B2 (en) * 2014-09-30 2017-11-28 Rovi Guides, Inc. Systems and methods for searching for a media asset

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130282713A1 (en) * 2003-09-30 2013-10-24 Stephen R. Lawrence Personalization of Web Search Results Using Term, Category, and Link-Based User Profiles
US20120066226A1 (en) * 2010-09-10 2012-03-15 Verizon Patent And Licensing, Inc. Social media organizer for instructional media
KR20120038654A (en) * 2010-10-14 2012-04-24 엘지전자 주식회사 Method for providing service for recognizing voice in broadcast and network tv/server for controlling the method
KR20140028540A (en) * 2012-08-29 2014-03-10 엘지전자 주식회사 Display device and speech search method thereof
KR20150077580A (en) * 2013-12-27 2015-07-08 주식회사 케이티 Method and apparatus for providing of service based speech recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3438852A4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021073161A1 (en) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 Elderly people registration method, apparatus and device based on voice recognition, and storage medium
CN114466223A (en) * 2022-04-12 2022-05-10 深圳市天兴诚科技有限公司 Video data processing method and system for coding technology
CN114466223B (en) * 2022-04-12 2022-07-12 深圳市天兴诚科技有限公司 Video data processing method and system for coding technology

Also Published As

Publication number Publication date
KR20180010955A (en) 2018-01-31
KR102403149B1 (en) 2022-05-30

Similar Documents

Publication Publication Date Title
WO2015099276A1 (en) Display apparatus, server apparatus, display system including them, and method for providing content thereof
WO2017082519A1 (en) User terminal device for recommending response message and method therefor
WO2013012107A1 (en) Electronic device and method for controlling same
WO2014073823A1 (en) Display apparatus, voice acquiring apparatus and voice recognition method thereof
WO2016076540A1 (en) Electronic apparatus of generating summary content and method thereof
WO2014092476A1 (en) Display apparatus, remote control apparatus, and method for providing user interface using the same
WO2014007502A1 (en) Display apparatus, interactive system, and response information providing method
WO2019139270A1 (en) Display device and content providing method thereof
WO2018008823A1 (en) Electronic apparatus and controlling method thereof
WO2019112342A1 (en) Voice recognition apparatus and operation method thereof cross-reference to related application
WO2015002384A1 (en) Server, control method thereof, image processing apparatus, and control method thereof
WO2014069820A1 (en) Broadcast receiving apparatus, server and control methods thereof
WO2015020288A1 (en) Display apparatus and the method thereof
WO2017135776A1 (en) Display apparatus, user terminal apparatus, system, and controlling method thereof
WO2019039739A1 (en) Display apparatus and control method thereof
WO2019135553A1 (en) Electronic device, control method thereof, and computer readable recording medium
WO2016024824A1 (en) Display apparatus and method of controlling the same
WO2018080176A1 (en) Image display apparatus and method of displaying image
WO2019184436A1 (en) Video pushing method and apparatus, and computer-readable storage medium
WO2020071870A1 (en) Image display device and method of providing broadcast program information
WO2018016760A1 (en) Electronic device and control method thereof
WO2017146518A1 (en) Server, image display apparatus, and method of operating the image display apparatus
WO2018128343A1 (en) Electronic apparatus and method of operating the same
WO2021040180A1 (en) Display device and method for controlling same
WO2015190780A1 (en) User terminal and control method therefor

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2017831233

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017831233

Country of ref document: EP

Effective date: 20181031

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17831233

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE