KR20210022360A - A method and apparatus for automatically converting web content to video content - Google Patents

A method and apparatus for automatically converting web content to video content Download PDF

Info

Publication number
KR20210022360A
KR20210022360A KR1020190101770A KR20190101770A KR20210022360A KR 20210022360 A KR20210022360 A KR 20210022360A KR 1020190101770 A KR1020190101770 A KR 1020190101770A KR 20190101770 A KR20190101770 A KR 20190101770A KR 20210022360 A KR20210022360 A KR 20210022360A
Authority
KR
South Korea
Prior art keywords
video
timeline
content
web page
automatically
Prior art date
Application number
KR1020190101770A
Other languages
Korean (ko)
Other versions
KR102274313B1 (en
Inventor
서원석
박수영
김양준
조정일
Original Assignee
주식회사 곰앤컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 곰앤컴퍼니 filed Critical 주식회사 곰앤컴퍼니
Priority to KR1020190101770A priority Critical patent/KR102274313B1/en
Publication of KR20210022360A publication Critical patent/KR20210022360A/en
Application granted granted Critical
Publication of KR102274313B1 publication Critical patent/KR102274313B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234336Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4318Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4782Web browsing, e.g. WebTV
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Abstract

An embodiment of the present invention discloses a method and device for automatically converting web content on the Internet, such as a news web page, consisting of images and texts, into video content for easy use by a user. The disclosed device comprises: a web page search module fetching a web page to be converted through the Internet; a video component selection module selecting a component to be converted into a video by analyzing a DOM model of a filtered target web page component; a subtitle conversion module converting text into subtitles among the selected components; a timeline configuration module automatically composing a video timeline with images and subtitles of selected components; a timeline editing module automatically editing the composed video timeline according to subtitles or user needs; and a video creation module creating a video of the edited components of the timeline. According to the present embodiment, since a process of configuring and arranging the timeline, which is the most difficult part in producing a video, is automatically performed, content on the web can be conveniently and easily produced as the video.

Description

웹 콘텐츠를 동영상으로 자동으로 변환하는 방법 및 장치{A method and apparatus for automatically converting web content to video content}A method and apparatus for automatically converting web content to video content

본 발명은 웹 콘텐츠 변환 기술에 관한 것으로, 더욱 상세하게는 뉴스 웹 페이지와 같이 이미지와 텍스트로 이루어진 인터넷상의 웹 콘텐츠를 사용자가 이용하기 쉽도록 동영상 콘텐츠로 자동으로 변환해주는 방법 및 장치에 관한 것이다.The present invention relates to a web content conversion technology, and more particularly, to a method and apparatus for automatically converting web content on the Internet consisting of images and texts, such as news web pages, into video content for easy use by users.

일반적으로, 월드 와이드 웹(WWW: World Wide Web) 상에는 무수히 많은 멀티미디어 웹 콘텐츠들이 제공되어 노트북이나 개인용 컴퓨터 뿐만 아니라 스마트 폰 및 타블릿 PC 등과 같은 다양한 모바일 기기들로도 웹 서핑을 통해 웹 콘텐츠를 이용하고 있다.In general, numerous multimedia web contents are provided on the World Wide Web (WWW), and web contents are used by various mobile devices such as smart phones and tablet PCs as well as laptops and personal computers through web surfing.

통상 웹 콘텐츠는 텍스트와 이미지, 동영상 등 멀티미디어 방식으로 구현될 수 있는데, 스마트 폰 등의 사용이 증가하면서 최근에는 동영상 형태의 콘텐츠들이 널리 이용되고 있다.In general, web content may be implemented in a multimedia manner such as text, image, and video. As the use of smart phones increases, content in the form of video has been widely used in recent years.

따라서 신문사의 뉴스 웹 페이지 등과 같이 주로 텍스트와 이미지로 이루어진 웹 콘텐츠의 경우에는 사용자들이 동영상 형태로 볼 수 있도록 동영상 콘텐츠로 변환하여 제공할 필요가 있다.Therefore, in the case of web content mainly composed of text and images, such as news web pages of newspapers, it is necessary to convert and provide video content so that users can view it in the form of a video.

그런데 종래에 텍스트와 이미지로 이루어진 웹 콘텐츠를 동영상 콘텐츠로 제공하기 위해서는 콘텐츠 제공자가 직접 인터넷상의 이미지나 텍스트를 동영상 제작 툴에 입력하여 동영상 콘텐츠 형태로 제작한 후 제공하는 방식이므로, 그 작업이 번거롭고 시간이 걸리는 문제점이 있다.However, in order to provide web content consisting of text and images as video content, the content provider directly inputs an image or text on the Internet into a video production tool, produces it in the form of video content, and provides it, which is cumbersome and time-consuming. There is a problem with this.

대한민국특허청 등록특허공보에 등록번호 제10-1607084호로 공고된 '정지 이미지를 이용한 스마트 TV용 동영상 제공장치 및 방법'은 사용자의 정지 이미지를 서버가 전송받은 후, 동영상 편집툴부를 통한 사용자 동영상 편집 명령에 따라 스마트 TV 용 동영상을 생성하여 스마트 TV에서 재생될 수 있도록 제공하는 것이다.'Apparatus and method for providing a video for smart TV using still images' announced in the Korean Intellectual Property Office as registration number 10-1607084 is an instruction to edit the user's video through the video editing tool unit after the server receives the user's still image. According to this, a video for a smart TV is generated and provided so that it can be played on a smart TV.

또한 공개특허공보에 공개번호 제10-2015-0093263호로 공개된 '개인 콘텐츠에 기반하여 동영상을 생성하는 콘텐츠 생성 서비스 장치, 개인 콘텐츠에 기반하여 동영상을 생성하는 방법'은 미리 저장된 템플릿과 사용자 장치로부터 전송된 개인 콘텐츠를 결합하여 사용자에게 맞추어진 맞춤형 동영상을 생성하는 기술이다.In addition, the'content creation service device that generates a video based on personal content, a method of generating a video based on personal content' disclosed in Korean Patent Application Publication No. 10-2015-0093263 is from a pre-stored template and a user device. It is a technology that creates customized videos tailored to users by combining transmitted personal contents.

그리고 등록특허공보에 등록번호 제10-1498233호로 공고된 '웹 기반 동영상 생성 장치 및 방법'은 사용자 위치기반 지도정보 및 사용자 관련 정보를 이용하여 사용자의 의사나 감정을 표현할 수 있는 개인화 영상을 웹 기반으로 생성하도록 지원하는 기술이다.In addition, the'web-based video generation apparatus and method' announced in the registered patent publication as registration number 10-1498233 is a web-based personalized video that can express the user's intentions or emotions using user location-based map information and user-related information. It is a technology that supports to be created.

본 발명의 목적은 뉴스 웹 페이지와 같이 이미지와 텍스트로 이루어진 인터넷 상의 웹 콘텐츠를 자동으로 분석하여 사용자가 이용하기 쉽도록 동영상 콘텐츠로 자동으로 변환해주는 방법 및 장치를 제공하는 것이다.It is an object of the present invention to provide a method and apparatus for automatically analyzing web contents made of images and texts on the Internet, such as news web pages, and automatically converting them into moving picture contents so that users can easily use them.

본 발명의 다른 목적은 인터넷상의 웹 콘텐츠를 동영상 콘텐츠로 자동으로 변환해주는 기술을 SaaS(Software as a service) 방식으로 제공하는 것이다.Another object of the present invention is to provide a technology for automatically converting web content on the Internet into video content in a software as a service (SaaS) method.

본 발명의 또다른 목적은 웹 페이지의 관심영역(ROI)을 자동으로 분석하여 영상 편집의 타임라인을 자동으로 구성하는 방법을 제공하는 것이다.Another object of the present invention is to provide a method of automatically configuring an image editing timeline by automatically analyzing a region of interest (ROI) of a web page.

본 발명의 또다른 목적은 텍스트의 길이와 화면상에 노출될 수 있는 자막의 길이를 계산하여 자동으로 자막을 구성해 주는 방법을 제공하는 것이다.Another object of the present invention is to provide a method of automatically configuring a caption by calculating the length of a text and the length of a caption that can be exposed on a screen.

본 발명의 또다른 목적은 TTS(Text-to-Speech)를 이용해 수집된 텍스트를 자동으로 음성으로 변환하여 영상에 포함시키고, TTS에서 생성된 음성과 자막간의 동기를 자동으로 맞춰주는 방법을 제공하는 것이다.Another object of the present invention is to provide a method of automatically converting text collected using TTS (Text-to-Speech) into voice and including it in an image, and automatically matching the synchronization between the voice generated in TTS and the subtitle. will be.

본 구현예는 뉴스 웹 페이지와 같이 이미지와 텍스트로 이루어진 인터넷 상의 웹 콘텐츠를 자동으로 분석하여 동영상 콘텐츠로 자동으로 변환해주는 장치를 개시한다.The present embodiment discloses an apparatus for automatically analyzing web content made of an image and text on the Internet, such as a news web page, and automatically converting it into video content.

개시된 장치는 인터넷을 통해 변환할 웹 페이지를 가져오는 웹 페이지 탐색모듈과, 필터링된 대상 웹 페이지 구성요소의 DOM(Document Object Model) 모델을 분석하여 동영상으로 변환할 구성요소를 선택하는 동영상 구성요소 선택모듈과, 선택된 구성요소들 중 텍스트를 자막으로 변환하는 자막변환모듈과, 선택된 구성요소의 이미지와 자막으로 동영상 타임라인을 자동으로 구성하는 타임라인 구성모듈과, 구성된 동영상 타임라인을 자막이나 사용자의 요구에 따라 자동으로 편집하는 타임라인 편집모듈과, 타임라인 편집된 구성요소들을 동영상으로 생성하는 동영상 생성모듈을 포함한다.The disclosed device includes a web page navigation module that retrieves a web page to be converted through the Internet, and a video component selection that selects a component to be converted into a video by analyzing a document object model (DOM) model of the filtered target web page component. The module, a subtitle conversion module that converts text from among the selected components into subtitles, a timeline configuration module that automatically configures a video timeline with images and subtitles of the selected components, and It includes a timeline editing module that automatically edits according to a request, and a video generation module that generates a moving picture of the timeline-edited components.

상기 장치는, 탐색된 웹 페이지에서 광고영역을 필터링하기 위한 광고 필터링 모듈이나 자막을 음성으로 변환하는 TTS 모듈을 더 포함할 수 있다.The apparatus may further include an advertisement filtering module for filtering an advertisement area on the searched web page or a TTS module for converting subtitles into voice.

본 다른 구현예는 뉴스 웹 페이지와 같이 이미지와 텍스트로 이루어진 인터넷 상의 웹 콘텐츠를 자동으로 분석하여 동영상 콘텐츠로 자동으로 변환해주는 방법을 개시한다.Another embodiment of the present invention discloses a method of automatically analyzing web content on the Internet consisting of images and text, such as a news web page, and automatically converting it into video content.

개시된 방법은 동영상으로 변환할 웹 페이지를 탐색하는 단계와, 탐색된 웹 페이지를 분석하여 동영상 구성요소를 선택하는 단계와, 선택된 구성요소들로 동영상 타임라인을 구성하는 단계와, 구성된 동영상 타임라인을 편집하는 단계와, 편집된 동영상 타임라인에 따라 동영상을 생성하는 단계를 포함한다.The disclosed method includes the steps of searching for a web page to be converted to a video, selecting a video component by analyzing the searched web page, constructing a video timeline with the selected components, and constructing a configured video timeline. And editing, and generating a video according to the edited video timeline.

상기 구현예의 장치나 방법은 콘텐츠 제공자나 콘텐츠 이용자에게 SaaS(Software as a Service) 방식으로 제공할 수도 있다.The device or method of the above embodiment may be provided to a content provider or a content user in a software as a service (SaaS) method.

본 발명의 실시예에 따르면, 동영상을 제작하는 데 있어서 가장 어려운 부분인 타임라인을 구성하고 배치하는 과정이 자동으로 이루어짐에 따라 웹 상의 콘텐츠를 간편하고 쉽게 동영상으로 제작할 수 있다.According to an embodiment of the present invention, as the process of configuring and arranging a timeline, which is the most difficult part in producing a video, is automatically performed, content on the web can be produced simply and easily into a video.

또한 본 발명의 실시예에 따르면 웹 페이지별 관심영역의 선호도 등을 관리하여 선호도가 높은 관심영역을 중심으로 자동으로 타임라인을 구성할 수 있고, 텍스트의 길이와 화면상에 노출될 수 있는 자막의 길이를 계산하여 자동으로 자막을 구성해 사용이 편리한 장점이 있다.In addition, according to an embodiment of the present invention, it is possible to automatically configure a timeline centering on a region of interest with a high preference by managing the preference of the region of interest for each web page, and the length of the text and the subtitles that can be exposed on the screen. It is easy to use as it automatically composes subtitles by calculating the length.

또한 본 발명의 실시예에 따르면, 뉴스사와 같은 미디어 분야에서 본 발명의 서비스를 이용할 경우 웹 상으로 배포하는 미디어 콘텐트를 손쉽게 동영상으로 전환하여 배포할 수 있고, 개인이 이용할 경우에는 자기가 게시한 게시물이나 사진, 이미지들을 간편한 방법으로 동영상으로 변환하여 소장하거나 배포할 수 있다.In addition, according to an embodiment of the present invention, when the service of the present invention is used in a media field such as a news agency, media content distributed on the web can be easily converted and distributed, and when used by an individual, the self-published post , Photos, images can be converted into videos in an easy way to be owned or distributed.

도 1은 본 발명의 실시예에 따른 서비스 시스템의 개략도,
도 2는 본 발명의 실시예에 따른 콘텐츠 자동 변환 서비스 서버의 구성 블럭도,
도 3은 본 발명의 실시예에 따라 콘텐츠 제공자가 콘텐츠 배포를 위해 웹 페이지를 자동으로 변환하는 절차를 도시한 순서도,
도 4는 본 발명의 실시예에 따라 콘텐츠 이용자가 웹페이지를 자동으로 변환하여 이용하는 절차를 도시한 순서도,
도 5는 본 발명의 실시예에 따른 콘텐츠 변환 절차를 도시한 순서도,
도 6은 도 5에서의 동영상 구성요소 선택 단계를 자동으로 수행하는 절차를 도시한 순서도,
도 7은 도 5에서의 동영상 구성요소 선택 단계를 수동으로 수행하면서 관심영역의 사용자 경험을 수집하는 절차를 도시한 순서도,
도 8은 도 5에서의 동영상 구성요소 선택 단계를 관심영역의 선호도를 이용하여 자동으로 수행하는 절차를 도시한 순서도,
도 9는 도 5에서의 동영상 타임라인 구성 단계를, 자막 생성을 통해 자동으로 수행하는 절차를 도시한 순서도,
도 10은 도 5에서의 동영상 타임라인 구성 단계를, TTS를 이용하여 자동으로 수행하는 절차를 도시한 순서도,
도 11은 본 발명의 다른 실시예에서 텍스트 파일을 이용하여 동영상 타임라인을 자동으로 구성하는 절차를 도시한 순서도,
도 12는 본 발명의 실시예에서 영상 편집을 위한 동영상 타임라인 구성화면의 예,
도 13은 본 발명의 실시예에서 텍스트 편집 화면의 예,
도 14는 본 발명의 실시예에서 배경이미지 편집 화면의 예,
도 15는 본 발명의 실시예에서 장면전환 효과 설정화면의 예이다.
1 is a schematic diagram of a service system according to an embodiment of the present invention;
2 is a block diagram showing the configuration of an automatic content conversion service server according to an embodiment of the present invention;
3 is a flow chart showing a procedure for automatically converting a web page for content distribution by a content provider according to an embodiment of the present invention;
4 is a flow chart showing a procedure for automatically converting and using a web page by a content user according to an embodiment of the present invention;
5 is a flow chart showing a content conversion procedure according to an embodiment of the present invention;
6 is a flow chart showing a procedure for automatically performing the step of selecting a video component in FIG. 5;
FIG. 7 is a flow chart showing a procedure for collecting user experience of an ROI while manually performing the step of selecting a video component in FIG. 5;
FIG. 8 is a flow chart showing a procedure for automatically performing the step of selecting a video component in FIG. 5 using a preference of an ROI;
9 is a flow chart showing a procedure of automatically performing the step of configuring a video timeline in FIG. 5 through caption generation;
10 is a flow chart showing a procedure for automatically performing the step of configuring a video timeline in FIG. 5 using TTS;
11 is a flow chart showing a procedure for automatically configuring a video timeline using a text file in another embodiment of the present invention;
12 is an example of a video timeline configuration screen for video editing in an embodiment of the present invention;
13 is an example of a text editing screen in an embodiment of the present invention;
14 is an example of a background image editing screen in an embodiment of the present invention;
15 is an example of a scene change effect setting screen in an embodiment of the present invention.

본 발명과 본 발명의 실시에 의해 달성되는 기술적 과제는 다음에서 설명하는 본 발명의 바람직한 실시예들에 의하여 보다 명확해질 것이다. 다음의 실시예들은 단지 본 발명을 설명하기 위하여 예시된 것에 불과하며, 본 발명의 범위를 제한하기 위한 것은 아니다.The present invention and the technical problems achieved by the implementation of the present invention will become more apparent by the preferred embodiments of the present invention described below. The following examples are merely illustrative for explaining the present invention, and are not intended to limit the scope of the present invention.

도 1은 본 발명의 실시예에 따른 서비스 시스템의 개략도이고, 도 2는 본 발명의 실시예에 따른 콘텐츠 자동 변환 서비스 서버의 구성 블럭도이다. 도 3은 본 발명의 실시예에 따라 콘텐츠 제공자가 콘텐츠 배포를 위해 웹 페이지를 자동으로 변환하는 절차를 도시한 순서도이고, 도 4는 본 발명의 실시예에 따라 콘텐츠 이용자가 웹페이지를 자동으로 변환하여 이용하는 절차를 도시한 순서도이다.1 is a schematic diagram of a service system according to an embodiment of the present invention, and FIG. 2 is a block diagram of a configuration of an automatic content conversion service server according to an embodiment of the present invention. 3 is a flow chart showing a procedure for a content provider to automatically convert a web page for content distribution according to an embodiment of the present invention, and FIG. 4 is a content user automatically converts a web page according to an embodiment of the present invention. It is a flow chart showing the procedure to be used.

본 발명의 실시예에 따른 서비스 시스템(100)은 도 1에 도시된 바와 같이, 본 발명의 실시예에 따른 콘텐츠 변환 서비스를 제공하는 서비스 서버(110)와, 인터넷(102)을 통해 콘텐츠를 배포하는 개인이나 기업들에 해당하는 콘텐츠 제공자(CP; 120), 본 발명의 서비스에 따라 변환된 동영상 콘텐츠를 인터넷(102)을 통해 이용하는 콘텐츠 이용자 단말기들(130)로 구성된다. 콘텐츠 제공자(120)나 콘텐츠 이용자 단말기들(130)에는 본 발명에 따른 서비스를 위한 클라이언트(140-1, 140-2)가 실행될 수 있다.The service system 100 according to an embodiment of the present invention distributes content through the service server 110 and the Internet 102 providing a content conversion service according to an embodiment of the present invention, as shown in FIG. 1. It is composed of a content provider (CP) 120 corresponding to an individual or a company, and content user terminals 130 that use the video content converted according to the service of the present invention through the Internet 102. Clients 140-1 and 140-2 for a service according to the present invention may be executed in the content provider 120 or the content user terminals 130.

서비스 서버(110)는 도 2에 도시된 바와 같이, 웹 페이지 탐색모듈(111), 광고필터링 모듈(112), 구성요소 선택모듈(113), ROI관리모듈(114), 자막생성모듈(115), TTS모듈(116), 타임라인 구성모듈(117), 타임라인 편집모듈(118), 동영상 생성모듈(119)을 포함할 수 있다.As shown in FIG. 2, the service server 110 includes a web page search module 111, an advertisement filtering module 112, a component selection module 113, an ROI management module 114, and a caption generation module 115. , A TTS module 116, a timeline configuration module 117, a timeline editing module 118, and a video generation module 119.

도 2를 참조하면, 웹 페이지 탐색모듈(111)은 웹 크롤링 등을 통해 인터넷(102)을 통해 변환할 웹 페이지를 가져오고, 광고 필터링 모듈(112)은 웹 상에서 공통적으로 제공하는 광고의 형태나 패턴을 미리 등록하여 광고 이미지 같은 요소들이 자동적으로 타임라인에 포함되지 않도록 필터링한다.Referring to FIG. 2, the web page search module 111 retrieves a web page to be converted through the Internet 102 through web crawling, and the advertisement filtering module 112 is a form of advertisement commonly provided on the web. By registering patterns in advance, elements such as advertisement images are automatically filtered so that they are not included in the timeline.

구성요소 선택모듈(113)은 필터링된 대상 웹 페이지 구성요소의 DOM 모델을 분석하여 동영상으로 변환할 구성요소를 선택한다. 이때 구성요소 선택모듈(113)은 대상 웹 페이지 구성요소의 DOM 모델을 분석하거나 이전에 변환정보로부터 획득된 관심영역(ROI)의 선호도에 따라 동영상으로 변환할 구성요소를 선택할 수 있다.The component selection module 113 analyzes the DOM model of the filtered target web page component and selects a component to be converted into a video. In this case, the component selection module 113 may analyze the DOM model of the target web page component or select a component to be converted into a video according to a preference of a region of interest (ROI) previously obtained from the conversion information.

ROI관리모듈(114)은 과거의 콘텐츠 변환 정보 등으로부터 변환할 웹 페이지들에 대한 관심영역(ROI : Region Of Interest)의 선호도 정보를 저장하여 관리하고 있고, 자막생성모듈(115)은 선택된 구성요소들 중 텍스트를 자막으로 변환하며, TTS(Text-to-Speech) 모듈(116)은 자막을 음성으로 변환한다. 여기서, 관심영역(ROI)이란 변환 대상인 웹페이지에 있는 이미지나 텍스트 중에서 '변환할 구성요소로 선택된 이미지나 텍스트'로서, 사용자 경험의 축적에 의해 선호도로 레벨화될 수 있다. 즉, '관심영역(ROI)의 선호도'는 해당 관심영역에 대한 사용자들의 선택 빈도로서, 자주 선택된 관심영역은 선호도가 높게 나타난다. The ROI management module 114 stores and manages preference information of a region of interest (ROI) for web pages to be converted from past content conversion information, and the caption generation module 115 is a selected component. Among them, text is converted into subtitles, and the text-to-speech (TTS) module 116 converts the subtitles into speech. Here, the ROI is an image or text selected as an element to be converted from among images or texts on a web page to be converted, and may be leveled as a preference by accumulation of user experience. That is, the'region of interest (ROI) preference' is the frequency of users' selection for the corresponding region of interest, and the frequently selected region of interest has a high preference.

타임라인 구성모듈(117)은 선택된 구성요소의 이미지나 자막 혹은 TTS로 동영상 타임라인을 구성한다. 여기서, 자막은 선택된 구성요소의 텍스트를 동영상 콘텐츠에 표시하기 위해 편집한 것이고, TTS는 자막을 음성으로 변환한 것이다. 타임라인 구성모듈(117)은 텍스트 파일과 같이 사용자가 지정한 자료(104)를 이용하여 타임라인을 자동으로 구성할 수도 있다.The timeline configuration module 117 configures a video timeline with images or subtitles or TTS of the selected component. Here, the subtitle is edited to display the text of the selected component on the video content, and the TTS is converted from the subtitle to audio. The timeline configuration module 117 may automatically configure a timeline using data 104 designated by the user, such as a text file.

타임라인 편집모듈(118)은 타임라인 구성모듈(117)에 의해 구성된 동영상 타임라인을 자막이나 TTS의 길이 혹은 사용자의 요구에 따라 자동으로 편집하고, 동영상 생성모듈(119)은 편집된 타임라인의 구성요소들을 동영상 콘텐츠로 생성한다.The timeline editing module 118 automatically edits the video timeline configured by the timeline configuration module 117 according to the length of a subtitle or TTS or a user's request, and the video generation module 119 The components are created as video content.

도 1을 참조하면, 콘텐츠 제공자(Content Provider(CP);120)는 뉴스 웹페이지 등과 같은 상업용 웹페이지를 제공하는 기업 사이트와, SNS를 통해 개인용 웹 페이지를 제공하는 개인 등으로 이루어질 수 있으며, 도 3에 도시된 바와 같이, SaaS 방식으로 본 발명의 서비스를 이용하여 자신의 웹페이지를 동영상 콘텐츠로 변환한 후 해당 콘텐츠 제공자(120)의 웹 사이트나 포탈, SNS 등을 통해 배포할 수 있다.Referring to FIG. 1, a content provider (CP) 120 may be composed of a corporate site that provides commercial web pages such as news web pages, and an individual who provides personal web pages through SNS. As shown in Fig. 3, after converting one's web page into video content using the service of the present invention in a SaaS method, it can be distributed through a web site, portal, or SNS of the content provider 120.

도 3을 참조하면, 콘텐츠 제공자(120)는 서비스 서버(110)에 등록하여 본 실시예의 서비스를 SaaS 방식으로 이용한다(S11,S12). 본 발명의 서비스를 이용하여 콘텐츠 변환을 요청할 경우 서비스 서버(110)는 콘텐츠 제공자(120)가 요청한 웹 페이지를 소정의 절차에 따라 자동으로 동영상 콘텐츠로 변환하여 콘텐츠 제공자(120)에게 전달하고, 이에 따라 콘텐츠 제공자(120)는 변환된 동영상 콘텐츠를 게시한다(S13~S15). 이후 콘텐츠 이용자(110)는 콘텐츠 제공자(120)가 배포한 변환 콘텐츠를 이용할 수 있다.Referring to FIG. 3, the content provider 120 registers with the service server 110 and uses the service of this embodiment in a SaaS method (S11, S12). When a content conversion is requested by using the service of the present invention, the service server 110 automatically converts the web page requested by the content provider 120 into video content according to a predetermined procedure and delivers it to the content provider 120, thereby Accordingly, the content provider 120 posts the converted video content (S13 to S15). Thereafter, the content user 110 may use the converted content distributed by the content provider 120.

다시 도 1을 참조하면, 콘텐츠 이용자(110)는 도 3에 도시된 바와 같이, 콘텐츠 제공자(120)가 변환하여 제공하는 동영상 콘텐츠를 이용하거나 도 4에 도시된 바와 같이 콘텐츠 제공자(120)가 제공하는 웹페이지를 서비스 서버(110)를 통해 동영상 콘텐츠로 변환하여 이용할 수 있다.Referring back to FIG. 1, the content user 110 uses video content that is converted and provided by the content provider 120, as shown in FIG. 3, or provided by the content provider 120, as shown in FIG. The web page to be converted into video content through the service server 110 may be used.

도 4를 참조하면, 콘텐츠 제공자(120)는 자신의 웹페이지를 게시하고 있다(S21). 서비스 서버(110)는 각 웹 페이지들에 대한 과거의 변환정보로부터 웹 페이지별 관심영역(ROI)의 선호도를 데이터베이스로 관리하고 있다(S22). 콘텐츠 이용자(130)가 본 발명의 서비스를 이용하여 콘텐츠 제공자(120)가 배포한 웹페이지를 보고자 할 경우에 콘텐츠 이용자(130)는 서비스 서버(110)에 해당 웹 페이지 변환을 요청한다(S23). 서비스 서버(110)는 해당 웹페이지에 대한 이전의 관심영역(ROI)의 선호도 등을 참고하여 해당 웹 페이지를 자동으로 동영상 콘텐츠로 변환한 후 변환된 동영상 콘텐츠를 콘텐츠 이용자(130)에게 제공한다(S24~S26). 이에 따라 콘텐츠 이용자(130)는 변환된 동영상 콘텐츠를 이용할 수 있다(S27).4, the content provider 120 is posting its own web page (S21). The service server 110 manages the preference of a region of interest (ROI) for each web page as a database from past conversion information for each web page (S22). When the content user 130 wants to view the web page distributed by the content provider 120 using the service of the present invention, the content user 130 requests the service server 110 to convert the web page (S23). . The service server 110 automatically converts the web page to video content by referring to the preference of the previous ROI for the web page, and then provides the converted video content to the content user 130 ( S24~S26). Accordingly, the content user 130 may use the converted video content (S27).

도 5는 본 발명의 실시예에 따른 콘텐츠 변환 절차를 도시한 순서도이다.5 is a flowchart illustrating a content conversion procedure according to an embodiment of the present invention.

본 발명의 실시예에 따라 웹페이지를 동영상 콘텐츠로 변환하는 절차는 도 5에 도시된 바와 같이, 웹페이지를 탐색하는 단계(S1)와, 웹 페이지 내에서 동영상 구성요소를 선택하는 단계(S2), 동영상 타임라인을 구성하는 단계(S3), 동영상 타임라인을 편집하는 단계(S4), 동영상을 생성하는 단계(S5)로 구성된다.As shown in FIG. 5, the procedure of converting a web page to video content according to an embodiment of the present invention includes a step of searching a web page (S1) and a step of selecting a video component within the web page (S2). , Comprising a step of constructing a video timeline (S3), a step of editing the video timeline (S4), and a step of generating a video (S5).

도 5를 참조하면, 웹페이지를 탐색하는 단계(S1)는 서비스 이용자가 변환을 원하는 웹페이지를 탐색하여 웹 페이지 데이터를 가져오는 단계이다. 통상 웹 페이지(Web page)는 월드 와이드 웹 상에 있는 개개의 문서로서, 책에서의 페이지와는 달리 두 개 이상의 웹 페이지들을 서로 하이퍼링크로 연결시킬 수 있다. 대부분의 웹 페이지는 웹 서버에 저장되며 HTML(또는 XHTML), CSS, 자바스크립트, 그림, 플래시와 같은 동영상이나 텍스트, 이미지로 구성되어 있고, 이러한 웹 페이지들은 HTTP를 통해 전송할 수 있고, 웹 브라우저를 통해 웹 페이지들을 읽을 수 있다. 이러한 웹 페이지들은 문서 객체 모델(DOM; Document Object Model)의 구조화된 문서로 표현되는데, DOM은 플랫폼/언어 중립적으로 구조화된 문서를 표현하는 W3C의 공식 표준이고, 웹 페이지는 DOM을 사용하여 트리 구조를 얻어낼 수 있다.Referring to FIG. 5, the step of searching for a web page (S1) is a step of searching for a web page for which a service user wants to be converted, and obtaining web page data. In general, a web page is an individual document on the world wide web, and unlike a page in a book, two or more web pages may be linked to each other by hyperlinks. Most web pages are stored on a web server and consist of videos, text and images such as HTML (or XHTML), CSS, JavaScript, pictures, and Flash. These web pages can be sent via HTTP, and can be sent via a web browser. Web pages can be read through. These web pages are expressed as a structured document of the Document Object Model (DOM). DOM is the W3C's official standard for expressing a structured document that is platform/language neutral, and web pages are tree-structured using DOM. Can be obtained.

웹 페이지 내에서 동영상 구성요소를 선택하는 단계(S2)는 도 6에 도시된 바와 같이 자동으로 선택하는 방식과, 도 7에 도시된 바와 같이 수동으로 선택하는 방식, 및 도 8에 도시된 바와 같이 관심영역(ROI)의 선호도에 따라 자동으로 선택하는 방식으로 구분할 수 있다.In the step (S2) of selecting a video component within a web page, as shown in FIG. 6, an automatic selection method, a manual selection method as shown in FIG. 7, and as shown in FIG. 8 It can be classified in a manner that is automatically selected according to the preference of the region of interest (ROI).

도 6은 도 5에서의 동영상 구성요소 선택 단계를 자동으로 수행하는 절차를 도시한 순서도이다.6 is a flowchart illustrating a procedure of automatically performing the step of selecting a video component in FIG. 5.

도 6을 참조하면, 먼저 웹 페이지를 탐색한 후 탐색된 웹페이지의 구성요소를 검사하는 과정에서 구성요소의 DOM모델을 분석하고, 미리 설정된 조건에 맞는 구성요소인지를 판단하여 설정된 조건에 맞는 구성요소이면 해당 구성요소를 '선택 구성요소' 목록에 추가하여 동영상 구성요소의 자동 선택을 완료한다(S101~S105).Referring to FIG. 6, in the process of first searching for a web page and then checking the components of the searched web page, the DOM model of the component is analyzed, and it is determined whether the component meets a preset condition, and the composition meets the set condition. If it is an element, the component is added to the'selection component' list to complete automatic selection of the video component (S101 to S105).

도 7은 도 5에서의 동영상 구성요소 선택 단계를 수동으로 수행하면서 관심영역(ROI)의 사용자 경험을 수집하는 절차를 도시한 순서도이다.FIG. 7 is a flowchart illustrating a procedure of collecting user experience of a region of interest (ROI) while manually performing the step of selecting a video component in FIG. 5.

도 7을 참조하면, 탐색된 웹 페이지에서 동영상 구성요소를 사용자가 수동으로 선택하면, 클라이언트(140-1, 140-2)가 선택된 구성요소의 DOM 속성을 분석하여 서비스 서버(110)로 DOM 속성과 페이지 주소를 전송함과 아울러 선택된 구성요소의 목록을 생성하여 동영상 구성요소 수동선택을 완료한다(S201~S206). Referring to FIG. 7, when a user manually selects a video component from a searched web page, the clients 140-1 and 140-2 analyze the DOM property of the selected component and transmit the DOM property to the service server 110. In addition to transmitting the and page address, a list of the selected components is generated to complete the manual selection of the video component (S201 to S206).

서비스 서버(110)는 클라이언트(140-1, 140-2)로부터 수신된 웹페이지 주소와 구성요소의 DOM 속성을 데이터베이스에 저장하고, 페이지 주소에 대한 구성요소의 누적 경험을 이용해 관심영역(ROI)의 선호도를 산출한 후, 해당 사이트(웹페이지)에 대한 ROI의 선호도 데이터를 생성한다(S207~S209). 여기서, ROI의 선호도 데이터란 관심영역(ROI)에 대한 사용자들의 선택 빈도를 계량화(혹은 레벨화)한 데이터이다.The service server 110 stores the web page address received from the clients 140-1 and 140-2 and the DOM properties of the components in a database, and uses the cumulative experience of the components with respect to the page address to create a region of interest (ROI). After calculating the preference of, ROI preference data for the site (web page) is generated (S207 to S209). Here, the ROI preference data is data obtained by quantifying (or leveling) the frequency of users' selection for the ROI.

도 8은 도 5에서의 동영상 구성요소 선택 단계를 관심영역(ROI)의 선호도를 이용하여 자동으로 수행하는 절차를 도시한 순서도이다.FIG. 8 is a flowchart illustrating a procedure for automatically performing the step of selecting a video component in FIG. 5 using a preference of a region of interest (ROI).

도 8을 참조하면, 웹페이지 탐색 후 클라이언트(140-1, 140-2)가 서비스 서버(110)에 동영상 구성요소 검색을 요청한다(S301, S302).Referring to FIG. 8, after searching for a web page, the clients 140-1 and 140-2 request the service server 110 to search for a video component (S301 and S302 ).

동영상 구성요소 검색이 요청되면, 서비스 서버(110)는 해당 사이트에 대한 ROI의 선호도 데이터를 조회한 후, 해당 페이지내의 ROI에 대한 DOM 구성요소 내역을 클라이언트(140-1, 140-2)측으로 반환한다(S303, S304).When a video component search is requested, the service server 110 inquires the ROI preference data for the site, and then returns the DOM component details for the ROI in the page to the client (140-1, 140-2). Do (S303, S304).

이에 따라 클라이언트(140-1, 140-2)는 ROI 선호도에 의해 자동 선택 구성요소가 존재하면, 자동 선택된 구성요소를 선택 구성요소 목록에 추가하고, ROI 선호도에 의해 자동 선택 구성요소가 존재하지 않으면, 동영상 구성요소를 수동으로 선택한 후 선택구성요소 목록을 생성하여 동영상 구성요소의 자동 및 수동선택을 완료한다(S301~S309).Accordingly, the clients 140-1 and 140-2 add the automatically selected component to the list of selected components if there is an automatically selected component based on the ROI preference, and if the automatically selected component does not exist according to the ROI preference, , After manually selecting a video component, a list of selected components is generated to complete automatic and manual selection of the video component (S301 to S309).

이와 같이 본 발명의 실시예에서는 사용자가 웹 상의 콘텐츠에서 자신이 가져다 쓸 영상의 소재(이미지, 텍스트와 같은 구성요소)를 손쉽게 가져올 수 있는 유저 인터페이스를 제공하고, 유저 인터페이스에서 선택된 영상 소재의 DOM모델을 분석하여 각 사이트의 구성에 따른 사용자들의 ROI를 수집한 후 각 사이트 별로 사용자의 ROI 선호도를 데이터화해서 서비스 서버(110)에 저장한다. 또한 사용자의 수가 많아질수록 정확도를 높이기 위해 사용자가 이용한 객체에 대해 가중치를 부여해 사용자에게 의미 있는 구성요소를 높은 확률로 제시할 수도 있고, 많은 사용자들이 사용하는 알려진 서비스에 대해서는 미리 ROI의 선호도를 설정하여 자동으로 영상 구성요소들이 선택될 수 있도록 할 수 있다.As described above, in an embodiment of the present invention, a user interface is provided that allows a user to easily import a video material (elements such as images and text) to be drawn from content on the web, and a DOM model of the video material selected from the user interface. After analyzing and collecting the ROI of users according to the configuration of each site, the ROI preference of each site is converted into data and stored in the service server 110. In addition, as the number of users increases, weights are assigned to objects used by users to increase accuracy, and components that are meaningful to users can be presented with a high probability, and for known services used by many users, preference of ROI is set in advance. Thus, image elements can be automatically selected.

또한 엔드유저가 개인이 아닌 기업인 경우, 자신의 웹 콘텐츠를 동영상으로 변환하고자 하는 용도로 사용한다면 미리 해당 웹 사이트를 분석하여 동영상 구성요소를 구성할 수 있도록 미리 설정된 ROI 선호도 데이터를 사용할 수도 있다.In addition, if the end user is a company other than an individual, if the end user is using their web content for the purpose of converting their web content into a video, it is possible to use preset ROI preference data to configure the video component by analyzing the web site in advance.

이와 같이 본 발명의 실시예에 따르면, 사용자가 해당 웹 페이지를 사용한 경험이 없더라도 미리 설정된 ROI 선호도와 다른 사용자의 이용 경험에 따라 축적된 데이터에 기반한 ROI 선호도를 이용해서 타임라인을 자동으로 구성할 수 있다. 이때, ROI에 의해 선택되지 않은 구성요소도 모두 나열한 유저 인터페이스를 제공하여 사용자가 직접 구성요소를 선택하게 할 수도 있다.As described above, according to an embodiment of the present invention, even if a user has no experience using the web page, a timeline can be automatically configured using a preset ROI preference and an ROI preference based on accumulated data according to the user experience of other users. have. In this case, a user interface listing all components not selected by the ROI may be provided to allow the user to directly select the components.

다시 도 5를 참조하면, 동영상 타임라인 구성 단계(S3)에서는 도 6 내지 도 8 중 어느 한 방식으로 동영상 구성요소를 선택한 후, 도 9에 도시된 바와 같이 선택된 구성요소를 바탕으로 이미지와 자막의 타임라인을 생성한다.Referring back to FIG. 5, in the video timeline construction step (S3), after selecting a video component in any one of FIGS. 6 to 8, an image and a subtitle are displayed based on the selected component as shown in FIG. 9. Create a timeline.

도 9를 참조하면, 동영상 구성요소 선택이 완료되면, 선택된 구성요소 중에서 이미지 순서를 정렬하고, 웹 페이지의 텍스트를 문단별로 구분하여 목록을 작성한다(S401~S403). 이어 화면 해상도 및 자막표시 옵션 설정을 로드함과 아울러, 자막 표시 속도(글자당 노출속도) 설정을 로드한 후 문단별 자막 데이터를 생성한다(S404, S405).Referring to FIG. 9, when the selection of the video component is completed, an image order is arranged among the selected components, and a list is created by dividing the text of the web page by paragraph (S401 to S403). Next, the screen resolution and subtitle display option settings are loaded, and the subtitle display speed (exposure speed per character) setting is loaded, and then subtitle data for each paragraph is generated (S404, S405).

동영상 타임라인 구성 단계(S3)의 문단별 자막 데이터 생성절차에서는 ① 자막생성을 통해 영상 편집을 위한 타임라인을 자동으로 생성하거나 ② TTS를 통해 타임라인을 자동으로 생성한다.In the process of creating caption data for each paragraph in the video timeline configuration step (S3), either: ① Automatically create a timeline for video editing through caption generation, or ② automatically generate a timeline through TTS.

자막생성을 통해 타임라인을 자동으로 생성할 경우에는 도 9에 도시된 바와 같이, 각 문단이 한 화면에 보여질 수 있는가를 판단하여 자막을 생성하고 시간을 설정한다(S406, S407). In the case of automatically generating a timeline through subtitle generation, as shown in FIG. 9, it is determined whether each paragraph can be displayed on one screen to generate a subtitle and set a time (S406, S407).

이어 문장 구분기호 존재여부를 판단하여 문장 구분기호로 분할하거나 단어 단위로 시분할하여 자막을 분할한 후, 설정에 의해 각 자막의 시간을 설정하고, 자막 목록에 추가한 후, 이미지와 자막의 타임라인을 생성한다(S408~S413).Then, after determining whether there is a sentence separator and dividing it into sentence separators or time division by word unit to divide subtitles, the time of each subtitle is set by setting, added to the subtitle list, and then the timeline of the image and subtitle Generates (S408 to S413).

이와 같이 본 발명의 실시예에서는 텍스트는 자동으로 미리 설정된 값에 따라 한 화면에서 보여질 수 있는 길이의 자막으로 잘려지게 되고, 자막은 자막의 길이를 통해 읽기 쉬운 속도의 노출 시간을 가지도록 계산된 시간만큼 노출된다.As described above, in the embodiment of the present invention, text is automatically cut into a caption having a length that can be viewed on one screen according to a preset value, and the caption is calculated to have an easy-to-read exposure time through the length of the caption. It is exposed for as long as time.

한편, TTS를 통한 타임라인 자동 구성의 경우에는 도 10에 도시된 바와 같이, TTS를 이용하여 이미지와 자막 및 음성의 타임라인을 생성한다.Meanwhile, in the case of automatic timeline configuration through TTS, as shown in FIG. 10, timelines of images, captions, and audio are generated using TTS.

도 10을 참조하면, 동영상 구성요소의 선택이 완료되면, 선택된 구성요소 중에서 이미지 순서를 정렬하고, 웹 페이지의 텍스트를 문단별로 구분하여 목록을 작성한다(S501~S503). 이어 화면 해상도 및 자막표시 옵션 설정을 로드함과 아울러 자막 표시 속도(글자당 노출속도) 설정을 로드한 후 문단별 자막 데이터를 생성한다(S501~S505).Referring to FIG. 10, when the selection of the video component is completed, the image order is arranged among the selected components, and a list is created by dividing the text of the web page by paragraph (S501 to S503). Next, the screen resolution and subtitle display option settings are loaded, and the subtitle display speed (exposure speed per character) setting is loaded, and then subtitle data for each paragraph is generated (S501 to S505).

이어 각 문단이 한 화면에 보여질 수 있는가를 판단하여 자막을 생성하고 시간을 설정한(S506, S507) 후, 문장 구분기호 존재여부를 판단하여 문장 구분기호가 있으면 문장 구분기호로 분할한다. 이어, 단어 단위로 시분할하여 자막을 분할한 후 분할된 자막을 TTS를 이용해 음성으로 변환하고, 변환된 음성을 기준으로 자막 시간을 설정하며, 자막 목록에 추가한 후 이미지와 자막 및 음성의 타임라인을 생성한다(S508~S514). 이때 음성과 자막은 동기화될 필요가 있다.Subsequently, it is determined whether each paragraph can be displayed on one screen, a subtitle is generated, and a time is set (S506, S507), and then the existence of a sentence separator is determined, and if there is a sentence separator, it is divided into a sentence separator. Then, after dividing the subtitles by time division by word unit, the divided subtitles are converted to voice using TTS, the subtitle time is set based on the converted voice, and after adding it to the subtitle list, the timeline of the image, subtitle and voice Generates (S508 to S514). At this time, the audio and subtitles need to be synchronized.

이와 같이 본 발명의 실시예에서는 TTS(Text To Speech)를 이용해 자막을 음성으로 변환해서 영상에 포함시키는 경우, TTS에서 한 화면에 노출될 길이만큼 음성으로 변환하고, 그 시간 길이를 분석하여 자막의 노출 시간을 결정하게 된다.As described above, in an embodiment of the present invention, when subtitles are converted to voice using TTS (Text To Speech) and included in the video, the TTS converts the subtitle into voice as much as the length to be exposed on one screen, and analyzes the time length of the subtitle. You will determine the exposure time.

도 11은 본 발명의 다른 실시예로서, 텍스트 파일과 같은 사용자 지정 자료를 이용하여 영상 편집을 위한 타임라인을 자동으로 구성하는 절차를 도시한 순서도이다.11 is a flowchart illustrating a procedure for automatically configuring a timeline for image editing using user-specified data such as a text file, according to another embodiment of the present invention.

본 발명의 다른 실시예는 웹 페이지 이외의 사용자 지정 콘텐츠(예컨대, 텍스트 파일)를 자동으로 영상으로 변환하는 실시예이다. 즉, 본 발명의 다른 실시예는 웹 페이지로부터 동영상으로 변환하는 방법뿐만 아니라 PDF, 파워포인트, 텍스트 등의 소스에서 동영상 구성요소를 선택하여 타임라인을 구성하여 동영상을 제작하는 것이다.Another embodiment of the present invention is an embodiment of automatically converting user-specified content (eg, text file) other than a web page into an image. That is, another embodiment of the present invention is to produce a video by configuring a timeline by selecting a video component from a source such as PDF, PowerPoint, and text, as well as a method of converting a video from a web page.

도 11을 참조하면, 텍스트 파일을 통해 타임라인을 자동으로 구성하는 경우에는 텍스트 파일을 문단별로 구분하여 목록을 작성한다(S601, S602). 이어 화면 해상도 및 자막표시 옵션 설정을 로드함과 아울러, 자막 표시 속도(글자당 노출속도) 설정을 로드한 후 문단별 자막 데이터를 생성한다(S603, S604).Referring to FIG. 11, in the case of automatically configuring a timeline through a text file, a list is created by dividing the text file by paragraph (S601, S602). Next, the screen resolution and subtitle display option settings are loaded, and the subtitle display speed (exposure speed per character) setting is loaded, and then subtitle data for each paragraph is generated (S603, S604).

문단별 자막 데이터 생성 중에는 각 문단이 한 화면에 보여질 수 있는가를 판단하여 한 화면에 보여질 수 있는 경우에는 자막을 생성하고 시간을 설정한다(S605, S606).While generating subtitle data for each paragraph, it is determined whether each paragraph can be displayed on one screen, and if it can be displayed on one screen, a subtitle is generated and a time is set (S605 and S606).

문단의 길이가 한 화면을 넘어가면 문단을 분할할 필요가 있는데, 문장 구분 기호 존재여부를 판단하여 문장 구분기호가 있으면 문장 구분 기호로 분할하고, 이어 단어 단위로 시분할하여 자막을 분할한다(S607~S609). 이어 분할된 자막을 TTS를 이용해 음성으로 변환하고, 자막 목록에 추가한 후 이미지와 자막의 타임라인을 생성한다(S610~S612).If the length of a paragraph exceeds one screen, it is necessary to divide the paragraph. If there is a sentence separator, it is determined whether there is a sentence separator, and if there is a sentence separator, the subtitle is divided by time division by word units (S607~ S609). Subsequently, the divided subtitles are converted into audio using TTS, added to the subtitle list, and then a timeline of images and subtitles is generated (S610 to S612).

이와 같이 본 발명의 다른 실시예에서는 사용자가 자신이 가지고 있는 다른 자료(텍스트나 이미지)를 삽입하거나 자막을 입력할 수 있는 기능도 제공할 수 있다.As described above, in another embodiment of the present invention, a function of inserting other data (text or image) that the user has or inputting a caption may also be provided.

다시 도 5를 참조하면, 동영상 타임라인 편집 단계(S4)에서는 도 12 내지 도 15에 도시된 바와 같이, 타임라인 구성화면에서 텍스트나 영상을 편집하고, 장면전환 효과를 설정할 수 있다.Referring back to FIG. 5, in the video timeline editing step (S4), as illustrated in FIGS. 12 to 15, text or video may be edited on a timeline configuration screen and a scene change effect may be set.

도 12는 본 발명의 실시예에서 타임라인 구성을 편집하는 화면의 예이다.12 is an example of a screen for editing a timeline configuration in an embodiment of the present invention.

도 12를 참조하면, 동영상 생성을 위한 타임라인 구성의 편집화면은 편집된 영상을 미리보기 위한 재생영역(M6)과 구성요소들의 타임라인영역(M5), 텍스트 편집영역(M1), 이미지 편집영역(M2), 전환효과 설정영역(M3), 인코딩 시작버튼(M4)을 포함하고 있다. 타임라인 영역(M5)에는 텍스트와, 배경이미지, 오디오, 로고를 위한 타임라인이 표시되어 있다.Referring to FIG. 12, the editing screen of the timeline configuration for creating a video includes a playback area M6 for previewing an edited image, a timeline area M5 of components, a text editing area M1, and an image editing area. It includes (M2), transition effect setting area (M3), and encoding start button (M4). A timeline for text, background image, audio, and logo is displayed in the timeline area M5.

도 13은 본 발명의 실시예에서 텍스트를 편집하기 위한 화면의 예이다.13 is an example of a screen for editing text in an embodiment of the present invention.

도 13을 참조하면, 텍스트 편집 화면에는 텍스트의 글꼴이나 여백, 위치, 크기 등을 설정하기 위한 항목들이 있고, 편집중인 텍스트가 표시된다.Referring to FIG. 13, there are items for setting the font, margin, position, size, etc. of the text on the text editing screen, and the text being edited is displayed.

도 14는 본 발명의 실시예에서 이미지를 편집하기 위한 화면의 예이다.14 is an example of a screen for editing an image in an embodiment of the present invention.

도 14를 참조하면, 이미지 편집화면에는 추출된 이미지나 추가한 이미지, 로드된 이미지 등이 배경이미지로서 등록되어 있고, 이중에서 원하는 이미지를 선택하여 동영상 구성요소로 사용할 수 있다.Referring to FIG. 14, an extracted image, an added image, a loaded image, etc. are registered as a background image on the image editing screen, and a desired image may be selected from among them and used as a video component.

도 15는 본 발명의 실시예에서 장면전환 효과를 설정하기 위한 화면의 예이다.15 is an example of a screen for setting a scene change effect in an embodiment of the present invention.

도 15를 참조하면, 장면전환 효과는 효과없음, 사라지기, 오른쪽 밀어내기, 왼쪽 밀어내기, 아래로 밀어내기, 위로 밀어내기, 왼쪽으로 덮기, 오른쪽으로 덮기, 위로 덮기, 아래로 덮기 등 중 어느 하나의 방식으로 설정할 수 있다.Referring to Figure 15, the scene change effect is no effect, disappear, push right, push left, push down, push up, cover left, cover right, cover up, cover down, etc. It can be set in one way.

다시 도 5를 참조하면, 편집화면에서 타임라인 구성을 편집한 후 인코딩 시작버튼(M4)을 누르면 편집에 따른 동영상 콘텐츠가 생성된다(S5). 이와 같이 본 발명의 실시예에서는 영상 제작시에는 미리 구성된 타임라인대로 영상을 그대로 제작할 수도 있고, 타임라인 편집을 통해 재구성해 영상을 제작할 수도 있다.Referring back to FIG. 5, after editing the timeline configuration on the editing screen, if the encoding start button M4 is pressed, video content according to the editing is generated (S5). As described above, in the embodiment of the present invention, when the video is produced, the video may be produced as it is according to a pre-configured timeline, or the video may be produced by reconfiguring through timeline editing.

이상에서 본 발명은 도면에 도시된 일 실시예를 참고로 설명되었으나, 본 기술분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.In the above, the present invention has been described with reference to an embodiment shown in the drawings, but those of ordinary skill in the art will understand that various modifications and other equivalent embodiments are possible therefrom.

102: 인터넷 104: 클라이언트 지정자료
110: 서비스 서버 111: 웹페이지 탐색모듈
112: 광고 필터링 모듈 113: 구성요소 선택모듈
114: ROI 관리모듈 115: 자막생성모듈
116: TTS 모듈 117: 타임라인 구성모듈
118: 타임라인 편집모듈 119: 동영상 생성모듈
120: 콘텐츠 제공자 130: 콘텐츠 이용자
140-1, 140-2: 클라이언트
102: Internet 104: Client designated data
110: service server 111: web page navigation module
112: advertisement filtering module 113: component selection module
114: ROI management module 115: caption generation module
116: TTS module 117: Timeline configuration module
118: timeline editing module 119: video generation module
120: content provider 130: content user
140-1, 140-2: client

Claims (5)

인터넷을 통해 변환할 웹 페이지를 가져오는 웹 페이지 탐색모듈;
필터링된 대상 웹 페이지 구성요소의 DOM 모델을 분석하여 동영상으로 변환할 구성요소를 선택하는 동영상 구성요소 선택모듈;
선택된 구성요소들 중 텍스트를 자막으로 변환하는 자막변환모듈;
선택된 구성요소의 이미지와 자막으로 동영상 타임라인을 자동으로 구성하는 타임라인 구성모듈;
구성된 동영상 타임라인을 자막이나 사용자의 요구에 따라 자동으로 편집하는 타임라인 편집모듈; 및
타임라인 편집된 구성요소들을 동영상으로 생성하는 동영상 생성모듈을 포함하는 웹 콘텐츠를 동영상으로 자동으로 변환하는 장치.
A web page search module for fetching a web page to be converted through the Internet;
A video component selection module that analyzes a DOM model of the filtered target web page component and selects an component to be converted into a video;
A caption conversion module for converting text from among the selected components into captions;
A timeline configuration module for automatically configuring a video timeline with images and subtitles of the selected component;
A timeline editing module for automatically editing the configured video timeline according to subtitles or a user's request; And
A device that automatically converts web content into a video, including a video generation module that generates timeline-edited components into video.
제1항에 있어서, 상기 장치는,
탐색된 웹 페이지에서 광고영역을 필터링하기 위한 광고 필터링 모듈을 더 포함하는 웹 콘텐츠를 동영상으로 자동으로 변환하는 장치.
The method of claim 1, wherein the device,
A device for automatically converting web content to video, further comprising an advertisement filtering module for filtering an advertisement area in the searched web page.
제1항에 있어서, 상기 장치는,
자막을 음성으로 변환하는 TTS 모듈을 더 포함하는 웹 콘텐츠를 동영상으로 자동으로 변환하는 장치.
The method of claim 1, wherein the device,
A device that automatically converts web content to video, which further includes a TTS module that converts subtitles to audio.
동영상으로 변환할 웹 페이지를 탐색하는 단계;
탐색된 웹 페이지를 분석하여 동영상 구성요소를 선택하는 단계;
선택된 구성요소들로 동영상 타임라인을 구성하는 단계;
구성된 동영상 타임라인을 편집하는 단계; 및
편집된 동영상 타임라인에 따라 동영상을 생성하는 단계를 포함하는 웹 콘텐츠를 동영상으로 자동으로 변환하는 방법.
Searching for a web page to be converted into a video;
Analyzing the searched web page and selecting a video component;
Configuring a video timeline with the selected components;
Editing the configured video timeline; And
A method of automatically converting web content to video, comprising generating a video according to the edited video timeline.
제1항의 장치나 제4항의 방법을 콘텐츠 제공자나 콘텐츠 이용자에게 SaaS(Software as a Service) 방식으로 제공하는 것을 특징으로 하는 웹 콘텐츠를 동영상으로 자동으로 변환하는 서비스 방법.A service method for automatically converting web content to video, characterized in that the device of claim 1 or the method of claim 4 are provided to content providers or content users in a SaaS (Software as a Service) method.
KR1020190101770A 2019-08-20 2019-08-20 A method and apparatus for automatically converting web content to video content KR102274313B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190101770A KR102274313B1 (en) 2019-08-20 2019-08-20 A method and apparatus for automatically converting web content to video content

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190101770A KR102274313B1 (en) 2019-08-20 2019-08-20 A method and apparatus for automatically converting web content to video content

Publications (2)

Publication Number Publication Date
KR20210022360A true KR20210022360A (en) 2021-03-03
KR102274313B1 KR102274313B1 (en) 2021-07-07

Family

ID=75151202

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190101770A KR102274313B1 (en) 2019-08-20 2019-08-20 A method and apparatus for automatically converting web content to video content

Country Status (1)

Country Link
KR (1) KR102274313B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114363701A (en) * 2021-12-29 2022-04-15 四川启睿克科技有限公司 Method for converting web page into short video

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080010564A (en) * 2006-07-27 2008-01-31 주식회사 와이즌와이드 System for multimedia naration using 3d virtual agent and method thereof
KR20090090053A (en) * 2008-02-20 2009-08-25 (주)아이유노글로벌 Method of processing subtitles data for edited video product using synchronizing video data and subtitles data
JP2011040134A (en) * 2009-08-11 2011-02-24 Sony Corp Recording medium producing method, recording medium, and reproducing device for recording medium
KR20120034600A (en) * 2009-03-20 2012-04-12 에이디 밴티지 네트웍스 엘엘씨 Methods and systems for searching, selecting, and displaying content

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080010564A (en) * 2006-07-27 2008-01-31 주식회사 와이즌와이드 System for multimedia naration using 3d virtual agent and method thereof
KR20090090053A (en) * 2008-02-20 2009-08-25 (주)아이유노글로벌 Method of processing subtitles data for edited video product using synchronizing video data and subtitles data
KR20120034600A (en) * 2009-03-20 2012-04-12 에이디 밴티지 네트웍스 엘엘씨 Methods and systems for searching, selecting, and displaying content
JP2011040134A (en) * 2009-08-11 2011-02-24 Sony Corp Recording medium producing method, recording medium, and reproducing device for recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114363701A (en) * 2021-12-29 2022-04-15 四川启睿克科技有限公司 Method for converting web page into short video

Also Published As

Publication number Publication date
KR102274313B1 (en) 2021-07-07

Similar Documents

Publication Publication Date Title
US10412142B2 (en) Video-production system with social-media features
CN103124968B (en) For the Content Transformation of back-tilting type amusement
US20120253795A1 (en) Audio commenting and publishing system
KR20070005671A (en) Method and system for editing a multimedia message
CN103246710A (en) Method and device for automatically generating multimedia travel notes
US20180018078A1 (en) Video-Production System With Social-Media Features
KR101245665B1 (en) Search system for providing integrated multimedia contents and method thereof
US20190342361A1 (en) Video-Production System With Social-Media Features
KR102358855B1 (en) Method and apparatus for generating web page
KR20100044875A (en) Integrating sponsored media with user-generated content
JP6322629B2 (en) Information display method and program
JP2007013819A (en) Screen changing method, screen generating device, program and recording medium
KR20170040148A (en) Method and apparatus for providing contents through network, and method and apparatus for receiving contents through network
KR102274313B1 (en) A method and apparatus for automatically converting web content to video content
JP2008072396A (en) Information presentation system, server equipment, terminal device, information presenting method, etc.
JP2008123425A (en) Web document data providing device, method, and system
CN114691926A (en) Information display method and electronic equipment
EP2294812B1 (en) Method for outputting electronic program guide and broadcasting receiver enabling of the method
Fels et al. Sign language online with Signlink Studio 2.0
KR20090114908A (en) Web page server and web page editing method thereof
KR20120075510A (en) A method for providing contents and an apparatus therefor
KR101498233B1 (en) Apparatus and method for creating moving picture based on web
JP5255333B2 (en) Broadcast program information transmitter
JP5288569B2 (en) Electronic publication processing apparatus, electronic publication processing method, and program
KR20150087861A (en) System and method for e-book service

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant