KR101746165B1 - 동영상 화면의 처리 방법 및 장치 - Google Patents

동영상 화면의 처리 방법 및 장치 Download PDF

Info

Publication number
KR101746165B1
KR101746165B1 KR1020157035232A KR20157035232A KR101746165B1 KR 101746165 B1 KR101746165 B1 KR 101746165B1 KR 1020157035232 A KR1020157035232 A KR 1020157035232A KR 20157035232 A KR20157035232 A KR 20157035232A KR 101746165 B1 KR101746165 B1 KR 101746165B1
Authority
KR
South Korea
Prior art keywords
key
screen
moving picture
caption
sequence
Prior art date
Application number
KR1020157035232A
Other languages
English (en)
Other versions
KR20160010507A (ko
Inventor
징 장
단단 샤오
젠후아 ?
젠후아 o
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201310646783.6 priority Critical
Priority to CN201310646783.6A priority patent/CN103634605B/zh
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority to PCT/CN2014/089946 priority patent/WO2015081776A1/zh
Publication of KR20160010507A publication Critical patent/KR20160010507A/ko
Application granted granted Critical
Publication of KR101746165B1 publication Critical patent/KR101746165B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6131Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via a mobile phone network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4332Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4333Processing operations in response to a pause request
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams

Abstract

본 발명은 동영상 화면의 처리 방법 및 장치를 제공한다. 여기서, 동영상 화면의 처리 방법은, 현재 동영상의 정보를 획득하는 것; 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면-키 화면은 완전한 자막이 있는 동영상 프레임 화면을 포함함-을 캡처하는 것; 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하는 것; 및 플레이 청구를 수신하고, 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것, 을 포함한다. 본 발명의 실시예는 현재 동영상의 정보를 획득하는 것을 통하여, 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하고, 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하고, 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것으로, 트래픽을 절약하는 동시에 인터넷 멈춤의 상황에서 사용자가 동영상에 대해 미리보기를 행할 수 있게 하고, 사용자가 신속하고도 편리하게, 그리고 완전하게 줄거리를 이해할 수 있도록 보장함으로써, 사용자가 모바일 동영상 멈춤 상황에서의 반송률을 줄이고 사용자 체험 만족도를 향상시킨다.

Description

동영상 화면의 처리 방법 및 장치{METHOD AND APPARATUS FOR PROCESSING VIDEO IMAGES}
본 출원은 바이두 온라인 인터넷 테크놀러지(베이징)리미티드 컴퍼니가 2013년 12월 04일에 제출한, 발명의 명칭이 "동영상 화면의 처리 방법 및 장치"인, 중국 특허 출원 번호가 "201310646783.6"인 우선권을 요구한다.
본 발명은 통신 기술 분야에 관한 것으로, 특히 동영상 화면의 처리 방법 및 장치에 관한 것이다.
단말 기술의 신속한 발전과 더불어, 다양한 기능의 애플리케이션도 점점 더 다원화 되고, 사용자 또한 점점 단말에 다른 애플리케이션을 장착하는 것을 통해 보조적으로 비지니스, 엔터테인먼트, 생활 등 여러가지 활동을 행하고 있는 추세이다.
현재, 많은 사용자들이 모바일 단말에서 온라인 동영상을 관람하기를 좋아한다. 하지만 온라인 동영상을 관람하는 것은 모바일 트래픽을 상당히 소모하게 되는데, 평균 1분간 휴대폰 동영상을 관람하는데 일반 화질 자원 소모 트래픽이 4M 좌우이고, 고화질 자원 소모 트래픽이 20M좌우로, 겨우 백메가 트래픽밖에 없는 대부분 사용자에게 있어서, 온라인 동영상을 관람하는데는 큰 장벽이 존재한다.
이 외에, 인터넷 속도, 동영상 자원, 휴대폰 성능 등 요소의 영향으로 사용자가 모바일 동영상을 관람하는 과정에서 자주 동영상이 멈추는 경우에 부딪치게 된다. 동영상이 멈출 경우, 절반에 근접하는 사용자가 직접 페이지를 퇴출하거나 그 제품화면을 떠나게 되는바, 사용자의 동영상 관람 요구를 만족시키지 못한다.
인터넷 환경이 동영상자원의 전송속도에 대해 크게 영향주고 있으므로, 사용자는 오직 조용하고 모바일 인터넷이 아주 좋은 환경에서만 온라인 동영상을 관람할 수 있고, 상대적으로 그다지 좋지 못한 인터넷 환경, 예를 들어 지하철에서는 흔히 관람할 수 없으며, 조각 시간에 관람을 행하는 것에도 적합하지 않다.
이로부터 알 수 있는바, 현재의 온라인 동영상을 관람하는 것은 아래와 같은 문제점이 존재한다: 즉, 1. 모바일 트래픽 소모가 크고; 2. 동영상 멈춤 현상이 심각하며; 3. 관람 장소, 시간이 제한을 받는다.
첫번째 문제점에 대하여, 현재는 유창한 코드 전환을 제공하는 것을 통하여 해결하고; 두번째 문제점에 대하여, 프레임 수를 감소하는 것을 통하여 해결하는데 최저로 초당 24프레임으로 감소할 수 있고, 사용자 신고를 받은 후 피동적으로 동영상 자원을 대체하거나 또는 사용자가 동영상 노드를 교체하도록 격려하여 멈춤 토막을 건너뛰도록 할 수 있다; 세번째 문제점에 대하여 현재까지는 아직 해결 방안이 없다.
하지만, 상기 유창한 코드 전환과 프레임 수 감소의 방식은 동영상이 트래픽을 소모하는 것과 멈춤 상황에 대해 개선이 있으나 기존의 문제점이 여전히 심각하고; 사용자 신고 또는 사용자더러 노드를 교체하게 하는 것은 피동적인 방식으로 사후에야 멈춤 문제점을 해결할 수 있다.
본 발명은 적어도 상기 기술 문제점의 하나를 해결하고자 한다.
이를 위하여, 본 발명의 첫번째 목적은 동영상 화면의 처리 방법을 제공하는데 있다. 당해 방법은 현재 동영상의 키 화면 캡처를 통하여 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하고, 화면 베이스 중의 키 화면에 대해 플레이를 행하여, 트래픽을 절약하고, 사용자가 신속하고도 편리하게 동영상 내용을 요해할 수 있도록 한다.
본 발명의 두번째 목적은 동영상 화면의 처리장치를 제공하는데 있다.
상기 목적을 실현하기 위하여, 본 발명의 제1 측면의 실시예의 동영상 화면의 처리 방법은: 현재 동영상의 정보를 획득하는 단계; 상기 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면 - 상기 키 화면에는 완전한 자막이 있는 동영상 프레임 화면이 포함됨 -을 캡처하는 단계; 상기 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하는 단계; 및 플레이 청구를 수신하고, 상기 플레이 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 단계를 포함한다
본 발명의 실시예의 동영상 화면의 처리 방법은, 현재 동영상의 정보를 획득하고, 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하고, 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하며, 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것을 통하여, 트래픽을 절약하는 동시에, 인터넷 멈춤의 상황에서 사용자가 신속히 동영상에 대해 미리보기를 행하여, 사용자가 신속하고 편리하게 줄거리를 이해할 수 있도록 보장함으로써 사용자가 모바일 동영상 멈춤 상황에 부딪쳤을 때의 반송률을 줄이고, 사용자 체험 만족도를 향상시킨다.
상기 목적을 실현하기 위하여, 본 발명의 제2 측면의 실시예의 동영상 화면의 처리 장치는, 획득 모듈, 캡처 모듈, 생성 모듈 및 플레이 모듈을 포함한다.
본 발명의 실시예의 동영상 화면의 처리 장치는 현재 동영상의 정보를 획득하고, 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하고, 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하며, 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것을 통하여, 트래픽을 절약하는 동시에 인터넷 멈춤의 상황에서 사용자가 신속히 동영상에 대해 미리보기를 행할 수 있도록 보장하여 사용자가 신속하고 편리하게 줄거리를 이해할 수 있도록 하고, 사용자가 모바일 동영상 멈춤 상황에 부딪쳤을 때의 반송률을 줄이고 사용자 체험 만족도를 향상시킨다.
상기 목적을 실현하기 위하여, 본 발명의 제3 측면의 실시예의 저장 매체는 본 발명의 제1 측면의 실시예의 상기한 동영상 화면의 처리 방법을 수행하는데 사용되는 애플리케이션을 저장하는데 사용된다.
본 발명의 부가된 방면과 장점은 아래의 설명에서 부분적으로 제시되고 일부는 아래의 설명에서 뚜렷해지거나 본 발명의 실천을 통하여 요해되게 될것이다.
본 발명의 상기 및/또는 부가된 방면과 장점은 아래에서 첨부된 도면을 결부하여 실시예에 대해 설명하는 과정에서 뚜렷해지거나 이해하기 용이해진다. 여기서,
도 1은 본 발명의 일 실시예에 따른 동영상 화면의 처리 방법의 플로 차트이다;
도 2는 본 발명의 일 실시예에 따른 동영상 플레이 과정의 플로 차트이다;
도 3은 본 발명의 일 구체적인 실시예에 따른 현재 동영상의 키 화면을 캡처하는 플로 차트이다;
도 4는 본 발명의 다른 한 실시예에 따른 키 자막 시점 서열에 대해 프레임 보충을 행하는 설명도이다;
도 5는 본 발명의 일 실시예에 따른 동영상 화면의 처리 장치의 구조 설명도이다;
도 6은 본 발명의 일 구체적인 실시예에 따른 동영상 화면의 처리 장치의 구조 설명도이다;
도 7은 본 발명의 일 구체적인 실시예에 따른 동영상 화면의 처리 장치의 다른 하나의 구조 설명도이다.
아래에서는 상세하게 본 발명의 실시예를 설명하기로 한다. 상기 실시예의 예시는 첨부된 도면에서 도시되고, 여기서 처음부터 끝가지 동일하거나 또는 유사한 번호는 동일하거나 또는 유사한 소자 또는 동일하거나 또는 유사한 기능을 갖는 소자를 나타낸다. 아래에서 첨부된 도면을 참조하는 것을 통하여 설명되는 실시예는 예시적인 것으로, 단지 본 발명을 해석하기 위한 것일 뿐, 본 발명에 대한 제한으로 이해해서는 안된다. 반대로, 본 발명의 실시예는 첨부된 특허 청구 범위의 취지와 내용 범위내에 놓이는 모든 변화, 보정 및 균등물을 포함한다.
본 발명의 설명에서 용어 "제1", "제2"는 설명을 하기 위한 것 일 뿐, 상대적인 중요성을 가리키거나 암시하는 것으로 이해해서는 안됨으로 이해하여야 한다. 본 발명의 설명에서 별도로 명확한 규정이나 한정을 하지 않는 한, 용어 "연접", "연결"은 넓은 의미로 이해되어야 한다. 예를 들면, 고정 연결일 수 있고 탈착 연결일 수도 있고 또는 일체적인 연결일 수도 있으며; 기계적 연결일 수 있고 전기 연결일 수도 있다. 직접 연결일 수 있고 중간 매체를 통한 간접 연결일 수도 있다. 본 분야의 통상의 지식을 가진 기술자들은 구체적인 상황에 따라 상술한 용어가 본 발명에서의 구체적인 함의를 이해할 수 있다. 이 외에 본 발명의 설명에서, 별도로 명확하게 구체적인 한정을 하지 않는 한, "복수개"의 의미는 두개 또는 두개 이상이다.
플로 차트에서 또는 여기서 기타 방식으로 설명되는 그 어떤 과정 또는 방법 설명은 하나의 또는 더 많은 특정 로직 기능 또는 과정의 단계를 실현하기 위한 수행 가능한 명령의 코드의 모듈, 단락 또는 부분을 포함함을 나타내는 것으로 이해할 수 있다. 아울러, 본 발명의 바람직한 실시 방식의 범위는 별도의 실현을 포함하고 여기서 제시되거나 토론된 순서에 따른 것이 아닌 관련된 기능에 의하여 거의 동시의 방식 또는 상반되는 순서를 포함한 순서에 따라 기능을 수행할 수 있는바 이는 마땅히 본 발명의 실시예가 속하는 기술분야의 통상의 지식을 가진 자들에 의하여 이해되어야 한다.
아래에서는 명세서에 첨부된 도면을 결부하여 본 발명의 실시예의 동영상 화면의 처리 방법 및 장치에 대해 상세하게 해석하기로 한다.
현재 존재하는 온라인 동영상을 관람하는 과정에서 존재하는 모바일 트래픽 소모양이 크고 동영상 멈춤 상황이 심각하고 관람 장소, 시간이 제한받는 문제점을 해결하기 위하여 본 발명은 일종 동영상 화면의 처리 방법을 제공한다.
도 1은 본 발명의 일 실시예에 따른 동영상 화면의 처리 방법의 플로 차트이다. 도 1이 도시하는 바와 같이, 당해 동영상 화면의 처리 방법은 아래와 같은 단계S101 내지 S104를 포함한다.
S101: 현재 동영상의 정보를 획득한다.
먼저 동영상 자원 베이스에서 현재 동영상의 정보를 획득하는데, 당해 정보는 동영상 소스 경로, 자막 파일 경로 등을 포함할 수 있다.
S102: 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하는데, 당해 키 화면에는 완전한 자막이 있는 동영상 프레임 화면이 포함된다.
현재 동영상의 키 화면을 캡처하는 것은 아래 단계를 통하여 완성할 수 있다: 먼저 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득하고, 키 자막 시점 서열을 획득한 후 키 자막 시점 서열에 대해 프레임 보충 처리를 행할 수 있고, 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행할 수도 있으며, 나중에 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처할 수 있다. 해석드려야 할 바는, 프레임 보충 처리와 오프셋 교정에는 엄격한 수행 순서가 없는바, 먼저 프레임 보충을 행하고 나서 오프셋 교정을 행할 수도 있고, 또는 먼저 오프셋 교정을 행하고 나서 프레임 보충을 행할 수도 있다. 이 외에, 상기 오프셋 교정과 프레임 보충을 행하는 것은 옵션 단계로서, 만약 프레임 보충 처리를 행하였다면 상기 키 화면은 간격 시간에 의거하여 프레임 보충을 행하는 화면을 더 포함한다.
S103: 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성한다.
본 실시예에서, 캡처해낸 현재 동영상의 키 화면에 대해 동영상에서의 플레이 순서에 따라 순서 배열을 행하여 현재 동영상의연속 그림모드의 화면 베이스를 구성한다. 여기서, 연속 그림 모드는 바로 동영상의 키 줄거리 화면들을 캡처하여 일련의 플레이 시간에 따라 순서를 배열한 그림들을 구성하는 것으로써 키 줄거리를 관람하는 수요를 만족시키는 것이다.
S104: 플레이 청구를 수신하고 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행한다.
본 실시예에서 동영상 내용에는 연속 그림 모드와 정상적인 동영상 모드가 있다. 사용자는 동영상을 관람하는 것을 선택할 수 있고, 연속 그림 모드의 화면 베이스를 관람하는 것을 통하여 줄거리를 일람할 수도 있다. 이 두가지 모드는 서로 전환될 수 있으며, 동영상 멈춤에 부딪쳤을 경우, 자동적으로 연속 그림 모드로 전환될 수 있다. 구체적으로, 동영상 플레이 과정에서 자동적으로 동영상 또는 키 화면을 프리로딩하는데, 미리 설치한 로딩량이 미리 설치한 역치보다 낮을 때(예를 들어, 프리로딩량이 5s의 연속 플레이를 지지하지 못할 때) 자동적으로 연속 그림 모드로 전환되어 우선적으로 사용자가 줄거리를 보는 것을 보장하게 된다. 아울러, 사용자는 수동으로 동영상 모드로 전환하여 계속 프리로딩을 대기할 수도 있다. 예를 들어, 도 2가 도시하는 바와 같이, 동영상 파일을 여러 유닛으로 나눠 유닛을 단위로 삼아 동영상 파일에 대해 프리로딩을 행하고 플레이한다. 구체적으로 아래 단계S201 내지S204를 포함한다:
S201: 한개 유닛에 대해 프리로딩을 마친 후 현재 유닛의 동영상을 플레이한다.
S202: 0.75개 유닛까지 플레이했을 때, 다음의 유닛에 대해 프리로딩을 마쳤는지를 판단하여, 만약 프리로딩을 마쳤으면 단계 S203을 수행하고, 만약 로딩을 마치지 않았으면 단계 S204를 수행한다.
S203: 계속하여 다음 유닛의 동영상을 플레이하고, 조작이 끝난다.
S204: 사용자가 제때에 줄거리를 일람하도록 연속 그림 모드로 전환시키고, 다음 유닛의 연속 그림을 프리로딩한 후, 단계 S202로 전환하게 하여, 동영상 프리로딩이 끝난 후 다시 동영상 모드로 전환시켜 대응 유닛의 동영상을 플레이할 수 있게 한다.
본 실시예에서, 연속 그림 모드에서 플레이를 행할 때 자동 방식을 통하여 플레이를 행할 수 있고, 수동 방식을 통하여 플레이를 행할 수도 있다. 자동 플레이 방식을 통하여 플레이를 행할 때, 자동 플레이 청구에 의거하여 순서에 따라 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하고, 예정 시간 간격으로, 예를 들어 3초당 1프레임의 속도로 순서에 따라 자동적으로 화면 베이스를 플레이한다. 이렇게 함으로써, 사용자가 순조롭게 자막을 열독하게 하고, 플레이속도가 사용자가 정상으로 동영상을 관람하는 플레이속도와 일치하게 유지할 수 있도록 보장할 수 있어 사용자가 정상적으로 동영상을 관람하는 체험을 얻게 한다. 플레이속도는 사용자가 자신의 수요에 의거하여 사전에 설정할수 있다는 것으로 이해될 수 있다. 수동 또는 자동으로 플레이할 때, 호출 청구(call request)에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행할 수 있다. 예를 들어, 프리로딩량이 5s의 연속 플레이를 지지하지 못할 때, 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하게 되고, 얼마간의 시간동안 플레이를 행한 후에 만약 프리로딩량이 5s의 연속 플레이를 지지할 수 있으면, 화면 베이스에서 키 화면을 판독하는 것을 정지하고 정상적인 동영상으로 회복하여 플레이할 수 있다.
상기 연속 그림 모드를 적용하면, 트래픽을 절약할 수 있는데, 예를 들어, 한토막의 30분간의 일반 화질 동영상이 소모하는 트래픽 소모양은 100M이지만, 연속 그림 모드는 오직 약9M정도만 소요되는바 90%의 트래픽을 절약할 수 있다. 이에 따라, 사용자가 극히 적은 트래픽으로도 드라마를 팔로우할 수 있도록 보장하여 방문 빈도와 사용자의 만족도를 향상시킨다.
연속 그림 모드의 매 프레임 화면에서, 사용자 컴뮤니케이션과 인터랙션을 지지하는 기능을 더 제공한다. 사용자는 키 줄거리에 대해 컴뮤니케이션과 인터랙션을 행하여 풍부한 사용자 생성 내용을 창조할 수 있다. 아울러, 동영상과 이미지 형식의 광고는 모두 이미지 형식으로 화면 베이스에 삽입될 수 있어 사용자에게 더 많은 정보를 제공한다. 또 사용자는 조각시간을 이용하여 소설을 보거나 이미지를 보는 것처럼 언제 어디서나 드라마를 팔로우할 수 있는바, 환경, 인터넷의 엄격한 제한을 받을 필요가 없다.
본 발명의 실시예의 동영상 화면의 처리 방법은, 현재 동영상의 정보를 획득하고, 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하며, 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하고, 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것을 통하여, 트래픽을 절약하는 동시에 인터넷 멈춤의 상황에서 사용자가 신속히 동영상에 대해 미리보기를 행할 수 있도록 보장하여 사용자가 신속하고도 편리하게 줄거리를 이해할 수 있도록 하고, 사용자가 모바일 동영상 멈춤 상황에 부딪쳤을 때의 반송률을 줄이고 사용자 체험 만족도를 향상시킨다.
현재 동영상의 키 화면을 캡처하여 사용자가 동영상에 대해 미리보기를 행하고, 더 신속하고도 편리하게, 그리고 완전하게 줄거리를 이해할 수 있도록 하기 위하여, 본 실시예는 현재 동영상의 키 화면을 캡처하는 방법을 제공하는바, 도 3이 도시하는 바와 같이, 당해 방법은 아래 단계 S301내지S304를 포함할 수 있다:
S301: 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득한다.
본 실시예에서, 인터넷, 음성 인식 또는 이미지 인식 등 기술을 통하여 현재 동영상에서의 매 토막의 음성 자막의 시작 시점과 종료 시점을 획득하고, 매 토막의 음성 자막의 종료 시점에서 하나의 프레임 화면을 캡처하여 오직 화면을 캡처하는 것만으로도 완전하게 모든 자막을 다 볼 수 있도록 보장할 수 있다.
구체적으로, 자막 파일에 기초하여 키 자막 시점 서열을 획득할 수 있고 - 여기서, 영화 자막은 통상적으로 이미지 유형의 자막 파일과 텍스트 형식의 자막 파일로 나뉨 -; 이미지 유형의 자막 파일에 대하여 그의 인덱스 파일을 분석하는 것을 통하여 동영상 중 대화가 있는 "자막 시간 범위" 서열을 획득할 수 있으며; 텍스트 형식에 대한 자막 파일, 예를 들어 .srt, .ass포맷의 자막 파일은 기존의 프로그램을 자동적으로 분석하는 것을 통하여 그중의 "자막 시간 범위" 서열을 획득하고; 나중에 이 서열 중의 각각의 "자막 시간 범위" 멤버의 중간값 또는 기타값에 의거하여 "키 자막 시점" 서열을 생성할 수 있다. 물론, 상기 중간값 또는 기타값의 설정은 모두 완전한 자막이 있는 동영상 프레임을 획득하는 것을 보장할 수 있다.
자막 파일에 기초하여 키 자막 시점 서열을 획득할 수 있는 것 외에, 음성 분석의 방식을 사용하여, 즉 음성 인식에 기초하여 사람의 음성 부분을 구분해내어 음성 자막의 시작 시점과 종료 시점을 획득함으로써 키 자막 시점을 획득할 수도 있다. 또한 이미지 인식의 방식을 적용할 수도 있다. 즉, 예정시간을 간격으로 동영상을 연속된 프레임으로 전환하고, 다시 이미지 인식의 형식으로 특정 지역의 완전한 자막이 있는 프레임을 인식해내어, 중복 제거를 한 후에 직접 최종 이미지 프레임 서열을 획득. 이런 이미지 프레임 서열에 대응되는 시간이 바로 키 자막 시점 서열이다.
여기서, 상기 예정시간은 1/24초보다 큰 것이 바람직한바, 그 이유는 이렇게 하면 동영상의 샘플링률이 초당 24프레임이기 때문이다.
S302: 키 자막 시점 서열에 대해 프레임 보충 처리를 행한다.
당해 단계는 옵션 단계로서, 두 프레임 화면 간격 시간이 지나치게 길면, 예를 들어 예정시간 5초를 초과하면, 5초마다 한폭의 "프레임 보충"을 캡처하는데 이는 이 기간에 비록 음성은 없으나 사용자가 줄거리를 이해하는데 영향줄 수도 있는동작 장면이 발생할 수 있기 때문이다. 이에 따라, 1분간의 동영상은 스크린샷을 약 15번 하여 줄거리의 연관성을 보장하는바 이미지당 크기는 20k이고, 현재 동영상에 대응되는 모든 이미지 파일은 총 300k에 달할 수 있게 된다.
구체적으로, 프레임 보충 과정은: 인접한 두개의 키 자막 시점사이의 시간 간격이 예정값보다 큰가를 판단하여, 만약 크면 인접한 두개의 키 자막 시점사이에서 새로 증가된 키 자막 시점을 획득하고, 새로 증가된 키 자막 시점을 키 자막 시점 서열에 삽입한다. 예를 들어, 인접한 두 "키 자막 시점"간의 차이가4s를 초과하면 그 사이에 중간값 시점에서의 스크린샷을 삽입하는데, 도 4가 도시하는 바와 같이, 3.484와 20.196사이의 시간 간격이 4s의 4배보다 크므로 양자사이에 4프레임을 삽입한다. 여기서, "-tween" 표기가 있는 프레임은 삽입한 프레임이고; 20.196과 28.887사이의 시간 간격은 4s의 2배보다 크므로 양자사이에 두개의 프레임을 삽입한다. 이러한 방식으로 유추하면, 평균4s내에 적어도 하나의 이미지가 있음을 보장함으로써 줄거리의 연관성을 보장할 수 있다.
여기서, 상기 프레임 보충 과정을 계산법으로 실현하는 결과의 예시는 아래와 같다:
[
{
ROW: "00:00:23,450 --> 00:00:29,387 ",
ROW_START: 23.45,
ROW_END: 29.387,
KEY: 26.4185,
KEY_OFFSET_THIS: 17.4185,
KEY_OFFSET_PREV: 0,
KEY_ORDERS: [
3.484,
6.967,
10.451,
13.935,
17.419
]
},
{
ROW: "00:00:31,417 --> 00:00:38,087 ",
ROW_START: 31.417,
ROW_END: 38.087,
KEY: 34.752,
KEY_OFFSET_THIS: 25.752,
KEY_OFFSET_ PREV: 17.4185,
KEY_ORDERS: [
20.196,
22.974,
25.752
]
},
{......},
{......},
여기서, 줄임표는 후속으로 약간의 키 시점 서열 대상을 생락함을 나타낸다.
S303: 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행한다.
당해 단계도 옵션 단계이다. 자막 파일에는 통상적으로 오차가 있으므로 자막 파일에 의거하여 획득한 "키 자막 시점"은 오프셋 교정을 통해 자동적으로 수정해야 하는데, 그의 수정 프로그램은 처음 10개 "자막 시간 범위"의 시작 시간을 검증하는 것을 통하여 오프셋 파라미터를 확정할 수 있다. 당해 오프셋 파라미터는 이미지 인식 또는 음성 인식 방식으로 획득한 시작 시점과 자막 파일 중의 자막의 시작 시간을 대비하는 것을 통하여 자동적으로 획득할 수 있고, 기타 방법을 통하여 획득할 수도 있다. 당해 오프셋 파라미터를 통하여 "키 자막 시점" 서열에 대해 오프셋 교정을 행한다.
해석드려야 할 바로는, 상기 단계 S302과 S303은 엄격한 수행 순서가 없으며, 먼저 프레임 보충을 행한 후 오프셋 교정을 행할 수 있고, 먼저 오프셋 교정을 행한 후 프레임 보충을 행할 수도 있다.
S304: 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처한다.
본 실시예에서 오픈소스, 프리 앤 크로스 플랫폼의 동영상과 오디오 스트림 솔루션 FFmpeg(하나의 AV 처리 프로그램)을 통해 키 자막 시점 서열에 의거하여 현재 동영상의 키 화면을 캡처할 수 있다.
본 실시예에서, 캡처한 현재 동영상의 키 화면에 대해 동영상 중의 플레이 순서에 따라 순서 배열을 행하여 현재 동영상의 연속 그림 모드의 화면 베이스를 구성한다. 여기서, 연속 그림 모드, 즉 동영상의 키 줄거리 화면을 캡처하여 일련의 플레이 시간에 따라 순서 배열한 그림을 구성하는 것으로 키 줄거리를 관람하는 수요를 만족시킨다. 연속 그림 모드는 모바일 환경에서 뛰어난 우세를 갖는바 업로딩 트래픽이 적고 속도도 빠르다. 1분간의 고화질 동영상 크기는 약 20M이고, 일반 화질 버전은 약 4M이지만 연속 그림 모드에서의 화면 베이스는 300k만 소요된다. 사용자의 인터넷 속도가 10k/s라고 가설하면, 고화질 동영상을 업로딩하는데는 34분동안 대기해야 하고, 일반 화질 동영상을 업로딩하는데는 7분동안 대기해야 하지만, 연속 그림 모드에서의 화면 베이스를 업로딩하는데는 30초만 소요된다.
본 발명의 실시예는, 키 자막 시점 서열에 대해 프레임 보충 처리를 행하고, 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행하하는 것을 통하여 캡처한 키 화면이 보다 연관적이고 정확하게, 그리고 전면적이게 함으로써 사용자가 신속히 동영상에 대해 미리보기를 행하고, 보다 신속하고 편리하며, 완전하게 줄거리를 이해할 수 있도록 하여 사용자 체험 만족도를 향상시킨다.
도 5는 본 발명의 일 실시예에 따른 동영상 화면의 처리 장치의 구조 설명도이다. 도 5가 도시하는 바와 같이, 동영상 화면의 처리 장치는 획득 모듈(100), 캡처 모듈(200), 생성 모듈(300) 및 플레이 모듈(400)을 포함한다.
획득 모듈(100)은 현재 동영상의 정보를 획득하는데 사용된다.
본 실시예에서, 획득 모듈(100)은 동영상 자원 베이스에서 현재 동영상의 정보를 획득하는데 당해 정보는 동영상 소스 경로, 자막 파일 경로 등을 포함할 수 있다.
캡처 모듈(200)은 획득 모듈(100)이 획득한 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하는데 사용되고, 키 화면은 완전한 자막이 있는 동영상 프레임 화면을 포함한다.
본 실시예에서, 캡처 모듈(200)은 획득 모듈(100)이 획득한 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득할 수 있다. 키 자막 시점 서열을 획득한 후 캡처 모듈(200)은 키 자막 시점 서열에 대해 프레임 보충 처리를 행할 수 있고, 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행할 수도 있으며, 나중에 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처할 수 있다. 해석드려야 할 바로는, 프레임 보충 처리와 오프셋 교정은 엄격한 수행 순서가 없으며, 먼저 프레임 보충을 행하고 다음 오프셋 교정을 행할 수 있고, 먼저 오프셋 교정을 행하고 다음 프레임 보충을 행할 수도 있다.
생성 모듈(300)은 캡처 모듈(200)이 캡처한 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하는데 사용된다.
본 실시예에서, 생성 모듈(300)은 캡처한 현재 동영상의 키 화면에 대해 동영상중의 플레이 순서에 따라 순서 배열을 행하여 현재 동영상의 연속 그림 모드의 화면 베이스를 구성한다. 여기서, 연속 그림 모드, 즉 동영상의 키 줄거리 화면들을 캡처하여 일련의 플레이 시간에 따라 순서 배열한 그림들을 구성하는 것으로 키 줄거리를 관람하는 수요를 만족시킨다.
플레이 모듈(400)은 플레이 청구를 수신하고, 플레이 청구에 의거하여 생성 모듈이 생성한 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는데 사용된다.
본 실시예에서, 동영상 내용은 연속 그림 모드와 정상적인 동영상 모드를 구비한다. 사용자는 동영상을 관람하는 것을 선택할 수 있고, 연속 그림 모드의 화면 베이스를 관람하는 것을 통하여 줄거리를 일람할 수도 있다. 이 두가지 모드는 서로 전환될 수 있으며, 동영상 멈춤에 부딪쳤을 경우, 자동적으로 연속 그림 모드로 전환될 수 있다. 구체적으로, 동영상 플레이과정에서 자동적으로 동영상 또는 키 화면을 프리로딩하는데, 미리 설치한 로딩량이 미리 설치한 역치 보다 낮을 때(예를 들어, 프리로딩량이 5s의 연속 플레이를 지지하지 못할 때) 자동적으로 연속 그림 모드로 전환되어 우선적으로 사용자가 줄거리를 보는 것을 보장한다. 아울러 사용자는 수동으로 동영상 모드로 전환하여 계속 프리로딩을 대기할 수도 있다.
본 실시예에서, 연속 그림 모드에서 플레이를 행할 때 자동 방식을 통하여 플레이를 행할 수 있고, 수동 방식을 통하여 플레이를 행할 수도 있다. 자동 플레이 방식을 통하여 플레이를 행할 때, 플레이 모듈(400)은 자동 플레이 청구에 의거하여 순서에 따라 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하고, 3초당 1프레임의 속도로 순서에 따라 자동적으로 화면 베이스를 플레이한다. 이렇게 함으로써, 사용자가 순조롭게 자막을 열독하고, 아울러 통상적인 드라마 동영상의 플레이 시간과 일치함을 보장할 수 있다. 플레이 속도는 사용자가 자신의 수요에 의거하여 사전에 설정할 수 있다는 것으로 이해될 수 있다. 수동 또는 자동을 통하여 플레이할 때, 플레이 모듈(400)은 호출 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행할 수 있다. 예를 들어, 프리로딩량이 5s의 연속 플레이를 지지하지 못할 때, 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하게 되는데, 얼마간의 시간동안 플레이를 행한 후, 만약 프리로딩량이 5s의 연속 플레이를 지지할 수 있으면, 화면 베이스에서 키 화면을 판독하는 것을 정지하고 정상적인 동영상으로 회복하여 플레이할 수 있다.
상기 연속 그림 모드를 적용하면 트래픽을 절약할 수 있는바, 예를 들어, 한토막의 30분간의 일반 화질 동영상이 소모하는 트래픽은 100M이상이지만, 연속 그림 모드는 겨우 9M정도만 소요되는바 90%의 트래픽을 절약할 수 있다. 이에 따라, 사용자가 극히 적은 트래픽으로도 드라마를 팔로우할 수 있도록 보장함으로써 방문 빈도와 사용자의 만족도를 향상시킨다.
연속 그림 모드의 매 프레임 화면에서, 사용자 컴뮤니케이션과 인터랙션의 을 지지하는기능을 더 제공한다. 사용자는 키 줄거리에 대해 컴뮤니케이션과 인터랙션을 행하여 풍부한 사용자 생성 내용을 창조할 수 있다. 아울러, 동영상과 이미지 형식의 광고는 모두 이미지 형식으로 화면 베이스에 삽입될 수 있어 사용자에게 더 많은 정보를 제공한다. 또 사용자는 조각 시간을 이용하여 소설을 읽고, 이미지를 보는 것처럼 언제 어디서나 드라마를 팔로우할 수 있는바 환경, 인터넷의 엄격한 제한을 받을 필요가 없다.
본 발명의 실시예의 동영상 화면의 처리 장치는, 현재 동영상의 정보를 획득하고, 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하며, 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하고, 및 플레이 청구에 의거하여 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것을 통하여, 트래픽을 절약하는 동시에 인터넷 멈춤의 상황에서 사용자가 신속히 동영상에 대해 미리보기를 행할 수 있도록 보장하여 사용자가 신속하고도 편리하게 줄거리를 이해할 수 있도록 하고, 사용자가 모바일 동영상 멈춤 상황에 부딪쳤을 때의 반송률을 줄이고 사용자 체험 만족도를 향상시킨다.
도 6은 본 발명의 일 구체적인 실시예에 따른 동영상 화면의 처리 장치의 구조 설명도이고; 도 7은 본 발명의 일 구체적인 실시예에 따른 동영상 화면의 처리 장치의 다른 하나의 구조 설명도이다. 도 6, 도 7이 도시하는 바와 같이, 동영상 화면의 처리 장치는 획득 모듈(100), 캡처 모듈(200), 생성 모듈(300) 및 플레이 모듈(400)을 포함한다. 여기서, 캡처 모듈(200)은 구체적으로 시점 서열 획득 유닛(210), 캡처 유닛(220), 프레임 보충 유닛(230) 및 교정 유닛(240)을 포함한다.
시점 서열 획득 유닛(210)은 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득하는데 사용된다.
본 실시예에서, 시점 서열 획득 유닛(210)은 인터넷, 음성 인식 또는 이미지 인식 등 기술을 통하여 현재 동영상에서의 매 토막의 음성 자막의 시작 시점과 종료 시점을 획득하고, 매 토막의 음성 자막의 종료 시점에서 하나의 프레임 화면을 캡처하여 화면을 캡처하는 것만으로도 완전하게 모든 자막을 다 볼수 있도록 보장한다.
구체적으로, 시점 서열 획득 유닛(210)은 자막 파일에 기초하여 키 자막 시점 서열을 획득할 수 있고 - 여기서, 영화 자막은 통상적으로 이미지 유형의 자막 파일과 텍스트 형식의 자막 파일로 나뉨 -, 이미지 유형의 자막 파일에 대하여, 시점 서열 획득 유닛(210)은 그의 인덱스 파일을 분석하는 것을 통하여 동영상에서 대화가 있는 "자막 시간 범위" 서열을 획득할 수 있으며; 텍스트 형식의 자막 파일, 예를 들어 .srt, .ass 포맷의 자막 파일에 대하여, 시점 서열 획득 유닛(210)은 기존의 프로그램을 자동적으로 분석하는 것을 통하여 그중의 "자막 시간 범위" 서열을 획득하고; 나중에 이 서열 중 각각의 "자막 시간 범위 " 멤버의 중간값 또는 기타값에 의거하여 "키 자막 시점" 서열을 생성할 수 있다. 물론, 상기 중간값 또는 기타값의 설정은 모두 완전한 자막이 있는 동영상 프레임을 획득하는 것을 보장할 수 있다.
자막 파일에 기초하여 키 자막 시점 서열을 획득할 수 있는 것 외에, 시점 서열 획득 유닛(210)은 음성 분석의 방식을 사용하여, 즉 음성 인식에 기초하여 사람의 음성 부분을 구분해내어 음성 자막의 시작 시점과 종료 시점을 획득함으로써 키 자막 시점을 획득할 수 있다. 시점 서열 획득 유닛(210)은 이미지 인식의 방식을 적용할 수도 있다. 즉, 0.5s를 간격으로 동영상을 연속된 프레임으로 전환시키고, 다시 이미지 인식의 형식으로 특정 지역의 완전한 자막이 있는 프레임을 인식해내어, 중복 제거를 한 후에 직접 최종 이미지 프레임 서열을 획득한다. 이런 이미지 프레임 서열에 대응되는 시간은 바로 키 자막 시점 서열이다.
캡처 유닛(220)은 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처하는데 사용된다.
프레임 보충 유닛(230)은 시점 서열 획득 유닛(210)이 획득한 또는 교정 유닛(240)이 교정한 후의 키 자막 시점 서열 중의 인접한 두개의 키 자막 시점사이의 시간 간격이 예정값보다 큰지를 판단하는데 사용되는데, 만약 크면 인접한 두개의 키 자막 시점사이에서 새로 증가된 키 자막 시점을 획득하고, 새로 증가된 키 자막 시점을 키 자막 시점 서열에 삽입한다.
두 프레임 화면 간격 시간이 지나치게 길면, 예를 들어 예정시간 5초를 초과하면, 5초마다 한폭의 "프레임 보충"을 캡처하는데, 이는 이 기간에 비록 음성은 없었으나 사용자가 줄거리를 이해하는데 영향을 줄 수도 있는동작 장면이 발생할 수 있기 때문이다. 이에 따라, 1분간의 동영상은 스크린샷을 약 15번 하여 줄거리의 연관성을 보장하는바, 이미지당 크기는 20k이고, 현재 동영상에 대응되는 모든 이미지 파일은 총 300k에 달할 수 있게 된다.
구체적으로, 프레임 보충 유닛(230)은 인접한 두개의 키 자막 시점사이의 시간 간격이 예정값보다 큰가를 판단하여, 만약 크면 인접한 두개의 키 자막 시점사이에서 새로 증가된 키 자막 시점을 획득하고, 새로 증가된 키 자막 시점을 키 자막 시점 서열에 삽입한다. 예를 들어, 인접한 두 "키 자막 시점" 차이가5s를 초과하면, 그 사이에 하나의 중간값 시점에서의 스크린샷을 삽입하고, 6s를 초과하면 두개의 스크린샷을 삽입한다. 이러한 방식으로 유추하면, 평균 4s내에 적어도 하나의 이미지가 있음을 보장함으로써 줄거리의 연관성을 보장할 수 있다.
교정 유닛(240)은 시점 서열 획득 유닛(210) 또는 프레임 보충 유닛(230)이 획득한 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행하는데 사용된다.
자막 파일에는 통상적으로 오차가 있으므로, 자막 파일에 의거하여 획득한 "키 자막 시점"은 오프셋 교정을 통하여 자동적으로 수정해야 하는데, 교정 유닛(240)은 처음 10개의 "자막 시간 범위"의 시작 시간을 검증하는 것을 통하여 오프셋 파라미터를 확정할 수 있고, 당해 오프셋 파라미터는 이미지 인식 또는 음성 인식 방식으로 획득한 시작 시점과 자막 파일 중의 자막의 시작 시간을 대비하는 것을 통하여 자동적으로 획득할 수 있고, 기타 방법을 통하여 획득할 수도 있다. 교정 유닛(240)은 당해 오프셋 파라미터를 통하여 "키 자막 시점" 서열에 대해 오프셋 교정을 행한다.
해석드려야 할 바로는, 프레임 보충 유닛(230)이 행하는 프레임 보충 처리와 교정 유닛(240)의 오프셋 교정은 엄격한 수행 순서가 없으며, 먼저 프레임 보충을 행하고 다음 오프셋 교정을 행할 수 있고, 먼저 오프셋 교정을 행하고 다음 프레임 보충을 행할 수도 있다.
본 발명의 실시예의 동영상 화면의 처리 장치는 키 자막 시점 서열에 대해 프레임 보충 처리를 행하고 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행하는 것을 통하여 캡처한 키 화면이 보다 연관적이고 정확하게 함으로써 사용자가 신속히 동영상에 대해 미리보기를 행하고 보다 신속하고 편리하게 줄거리를 이해할 수 있게 함으로써 사용자 체험 만족도를 향상시킨다.
상기 실시예를 실현하기 위하여, 본 발명은 본 발명의 어느 한 실시예에서 전술한 동영상 화면의 처리 방법을 수행하기 위한 애플리케이션 프로그램을 저장하기 위한 저장 매체를 더 제공한다.
본 발명의 각 부분은 하드웨어, 소프트웨어, 펌웨어 또는 그들의 조합으로 실현될 수 있다는 것으로 이해될 것이다. 상술한 실시 방식에서, 복수개의 단계나 방법은 메모리에 저장된, 적합한 명령으로 시스템 실행을 실행하는 소프트웨어 또는 펌웨어로 실현할 수 있다. 예를 들면, 만약 하드웨어로 실현한다면 다른 한 실시 방식에서처럼 본 분야에서의 데이터 신호에 대해 로직 기능을 실현하기 위한 로직 게이트 회로를 구비한 이산 로직 회로, 적합한 조합 로직 게이트 회로를 구비한 전용 집적 회로, 프로그램 가능 게이트 어레이(PGA), 필드 프로그램 가능 게이트 어레이(FPGA)등 공지된 기술 중의 어느 하나 또는 그들의 조합으로 실현할 수 있다.
본 명세서의 설명에서 참조 용어 "일 실시예", "일부 실시예", "예시", "구체적 예시" 또는 "일부 예시" 등의 설명은 당해 실시예 또는 예시를 결부하여 설명하는 구체적인 특징, 구조, 재료 또는 특징이 본 발명의 적어도 하나의 실시예 또는 예시에 포함된다는 것을 의미한다. 본 명세서에서 상술한 용어에 대한 함축적인 표달이 반드시 동일한 실시예 또는 예시를 가리키는 것은 아니다. 그리고, 설명된 구체적 특징, 구조, 재료 또는 특징은 임의의 하나 또는 복수의 실시예 또는 예시에서 적합한 방식으로 결합될 수 있다.
비록 이미 본 발명의 실시예를 제시하고 설명하였으나 본 분야의 통상의 지식을 가진 기술자들은 본 발명의 원리와 취지를 탈리하지 않는 전제하에 이러한 실시예에 대해 변화, 수정, 대체와 변형을 진행할 수 있고, 본 발명의 범위는 청구항 및 그 균등물에 의해 한정된다는것으로 이해할 것이다.

Claims (13)

  1. 동영상 화면의 처리 방법으로서,
    현재 동영상의 정보를 획득하는 단계;
    상기 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면 - 상기 키 화면은 완전한 자막이 있는 동영상 프레임 화면을 포함함 -을 캡처하는 단계;
    상기 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하는 단계; 및
    플레이 청구를 수신하고, 상기 플레이 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 단계; 및
    동영상 플레이 과정에서 자동적으로 동영상 또는 키 화면을 프리로딩하는데, 미리 설치한 로딩량이 미리 설치한 역치보다 낮을 때, 자동적으로 연속 그림 모드로 전환되는 단계;
    를 포함하고,
    상기 플레이 청구를 수신하고, 상기 플레이 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 단계는:
    자동 플레이 청구를 수신하는 경우에, 상기 자동 플레이 청구에 의거하여 플레이 시간 순서에 따라 상기 화면 베이스에서 대응되는 키 화면을 판독하여 사전 결정된 시간 간격으로 플레이를 행하는 것;
    을 특징으로 하는 동영상 화면의 처리 방법.
  2. 제1항에 있어서,
    상기 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면을 캡처하는 단계는,
    상기 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득하는 단계;
    상기 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처하는 단계,
    를 포함하는 것을 특징으로 하는 동영상 화면의 처리 방법.
  3. 제2항에 있어서,
    상기 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득한 후, 상기 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처하기 전에, 당해 방법은,
    인접한 두개의 키 자막 시점사이의 시간 간격이 예정값보다 큰지를 판단하고, 만약 크면 상기 인접한 두개의 키 자막 시점사이에서 새로 증가된 키 자막 시점을 획득하고, 상기 새로 증가된 키 자막 시점을 상기 키 자막 시점 서열에 삽입하는 것, 및
    상기 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행하는 것, 중의 적어도 하나
    를 더 포함하는 것을 특징으로 하는 동영상 화면의 처리 방법.
  4. 제2항 또는 제3항에 있어서,
    상기 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득하는 단계는,
    상기 현재 동영상의 자막 파일에 의거하여 자막 시간 범위 서열을 획득하고, 자막 시간 범위 서열에 의거하여 키 자막 시점 서열을 생성하는 것; 또는
    현재 동영상에 대해 음성 인식을 행하여 자막 시간 범위 서열을 획득하고, 자막 시간 범위 서열에 의거하여 키 자막 시점 서열을 생성하는 것; 또는
    현재 동영상을 동영상 프레임으로 전환시키고, 이미지 인식의 방식을 적용하여 예정 지역에 완전한 자막이 있는 동영상 프레임 서열을 인식해내어 상기 동영상 프레임 서열에 대해 중복 제거 처리를 행하고, 중복 제거를 한 후의 동영상 프레임 서열에 대응되는 시간을 키 자막 시점 서열로 삼는 것,
    을 포함하는 것을 특징으로 하는 동영상 화면의 처리 방법.
  5. 제1항에 있어서,
    상기 플레이 청구를 수신하고, 상기 플레이 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 단계는,
    호출 청구를 수신하고, 상기 호출 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하는 것,
    을 포함하는 것을 특징으로 하는 동영상 화면의 처리 방법.
  6. 제5항에 있어서,
    상기 호출 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행한 후, 당해 방법은,
    플레이 정지 청구를 수신하고, 상기 플레이 정지 청구에 의거하여 상기 화면 베이스에서 키 화면을 판독하는 것을 정지하는 것,
    을 더 포함하는 것을 특징으로 하는 동영상 화면의 처리 방법.
  7. 동영상 화면의 처리 장치로서,
    현재 동영상의 정보를 획득하기 위한 획득 모듈;
    상기 획득 모듈이 획득한 상기 현재 동영상의 정보에 의거하여 현재 동영상의 키 화면 - 상기 키 화면은 완전한 자막이 있는 동영상 프레임 화면을 포함함 -을 캡처하기 위한 캡처 모듈;
    상기 캡처 모듈이 캡처한 상기 키 화면에 대해 순서 배열을 행하여 화면 베이스를 생성하기 위한 생성 모듈; 및
    플레이 청구를 수신하고, 상기 플레이 청구에 의거하여 상기 생성 모듈이 생성한 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이하며, 동영상 플레이과정에서 자동적으로 동영상 또는 키 화면을 프리로딩하며, 미리 설치한 로딩량이 미리 설치한 역치 보다 낮을 때 자동적으로 연속 그림 모드로 전환되며, 자동 플레이 청구를 수신하는 경우에 상기 자동 플레이 청구에 의거하여 플레이 시간 순서에 따라 상기 화면 베이스에서 대응되는 키 화면을 판독하여 사전 결정된 시간 간격으로 플레이를 행하는 플레이 모듈,
    을 포함하는 것을 특징으로 하는 동영상 화면의 처리 장치.
  8. 제7항에 있어서,
    상기 캡처 모듈은,
    상기 현재 동영상의 정보에 의거하여 키 자막 시점 서열을 획득하기 위한 시점 서열 획득 유닛;
    상기 키 자막 시점 서열에 의거하여 대응되게 현재 동영상의 키 화면을 캡처하기 위한 캡처 유닛,
    을 포함하는 것을 특징으로 하는 동영상 화면의 처리 장치.
  9. 제8항에 있어서,
    상기 캡처 모듈은, 상기 시점 서열 획득 유닛과 상기 캡처 유닛사이에 있는 프레임 보충 유닛과 교정 유닛을 더 포함하고, 여기서,
    상기 프레임 보충 유닛은 상기 시점 서열 획득 유닛이 획득한 또는 상기 교정 유닛이 교정한 키 자막 시점 서열 중의 인접한 두개의 키 자막 시점사이의 시간 간격이 예정값보다 큰지를 판단하고, 만약 크면 상기 인접한 두개의 키 자막 시점사이에서 새로 증가된 키 자막 시점을 획득하고 상기 새로 증가된 키 자막 시점을 상기 키 자막 시점 서열에 삽입하는데 사용되는 것; 및
    상기 교정 유닛은 상기 시점 서열 획득 유닛 또는 상기 프레임 보충 유닛이 획득한 상기 키 자막 시점 서열 중의 키 자막 시점에 대해 오프셋 교정을 행하는데 사용되는 것, 중의 적어도 하나를 포함하는 것,
    을 특징으로 하는 동영상 화면의 처리 장치.
  10. 제8항 또는 제9항에 있어서,
    상기 시점 서열 획득 유닛은 구체적으로,
    상기 현재 동영상의 자막 파일에 의거하여 자막 시간 범위 서열을 획득하고, 자막 시간 범위 서열에 의거하여 키 자막 시점 서열을 생성하기 위한 것; 또는
    현재 동영상에 대해 음성 인식을 행하여 자막 시간 범위 서열을 획득하고, 자막 시간 범위 서열에 의거하여 키 자막 시점 서열을 생성하기 위한 것; 또는
    현재 동영상을 동영상 프레임으로 전환시키고, 이미지 인식의 방식을 적용하여 예정 지역에서 완전한 자막이 있는 동영상 프레임 서열을 인식해내어 상기 동영상 프레임 서열에 대해 중복 제거 처리를 행하고, 중복 제거를 한 후의 동영상 프레임 서열에 대응되는 시간을 키 자막 시점 서열로 삼기 위한 것임,
    을 특징으로 하는 동영상 화면의 처리 장치.
  11. 제7항에 있어서,
    상기 플레이 모듈은 구체적으로,
    호출 청구를 수신하고, 상기 호출 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행하기 위한 것임,
    을 특징으로 하는 동영상 화면의 처리 장치.
  12. 제11항에 있어서,
    상기 플레이 모듈은 또,
    상기 호출 청구에 의거하여 상기 화면 베이스에서 대응되는 키 화면을 판독하여 플레이를 행한 후, 플레이 정지 청구를 수신하고, 상기 플레이 정지 청구에 의거하여 상기 화면 베이스에서 키 화면을 판독하는 것을 정지하기 위한 것임,
    을 특징으로 하는 동영상 화면의 처리 장치.
  13. 저장 매체로서,
    제1항 내지 제3항 중의 어느 한 항에 따른 상기 동영상 화면의 처리 방법을 수행하는데 사용되는 애플리케이션을 저장하는데 사용되는
    것을 특징으로 하는 저장 매체.
KR1020157035232A 2013-12-04 2014-10-30 동영상 화면의 처리 방법 및 장치 KR101746165B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310646783.6 2013-12-04
CN201310646783.6A CN103634605B (zh) 2013-12-04 2013-12-04 视频画面的处理方法及装置
PCT/CN2014/089946 WO2015081776A1 (zh) 2013-12-04 2014-10-30 视频画面的处理方法及装置

Publications (2)

Publication Number Publication Date
KR20160010507A KR20160010507A (ko) 2016-01-27
KR101746165B1 true KR101746165B1 (ko) 2017-06-12

Family

ID=50215178

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157035232A KR101746165B1 (ko) 2013-12-04 2014-10-30 동영상 화면의 처리 방법 및 장치

Country Status (5)

Country Link
US (1) US9973793B2 (ko)
JP (1) JP6266109B2 (ko)
KR (1) KR101746165B1 (ko)
CN (1) CN103634605B (ko)
WO (1) WO2015081776A1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009619B2 (en) 2012-09-19 2015-04-14 JBF Interlude 2009 Ltd—Israel Progress bar for branched videos
US9257148B2 (en) 2013-03-15 2016-02-09 JBF Interlude 2009 LTD System and method for synchronization of selectably presentable media streams
US10448119B2 (en) 2013-08-30 2019-10-15 JBF Interlude 2009 LTD Methods and systems for unfolding video pre-roll
CN103634605B (zh) * 2013-12-04 2017-02-15 百度在线网络技术(北京)有限公司 视频画面的处理方法及装置
US9653115B2 (en) 2014-04-10 2017-05-16 JBF Interlude 2009 LTD Systems and methods for creating linear video from branched video
US9792957B2 (en) 2014-10-08 2017-10-17 JBF Interlude 2009 LTD Systems and methods for dynamic video bookmarking
CN105635749B (zh) 2014-10-31 2017-03-22 广州市动景计算机科技有限公司 产生视频帧集合的方法和设备
CN104581407A (zh) * 2014-12-31 2015-04-29 北京奇艺世纪科技有限公司 一种视频预览的方法和装置
US10582265B2 (en) 2015-04-30 2020-03-03 JBF Interlude 2009 LTD Systems and methods for nonlinear video playback using linear real-time video players
US10460765B2 (en) 2015-08-26 2019-10-29 JBF Interlude 2009 LTD Systems and methods for adaptive and responsive video
US20170178601A1 (en) * 2015-12-22 2017-06-22 Jbf Interlude 2009 Ltd. Intelligent buffering of large-scale video
CN105635849B (zh) * 2015-12-25 2018-06-05 网易传媒科技(北京)有限公司 多媒体文件播放时的文本显示方法和装置
US10462202B2 (en) 2016-03-30 2019-10-29 JBF Interlude 2009 LTD Media stream rate synchronization
US10218760B2 (en) 2016-06-22 2019-02-26 JBF Interlude 2009 LTD Dynamic summary generation for real-time switchable videos
CN106201713B (zh) * 2016-06-30 2019-10-22 宇龙计算机通信科技(深圳)有限公司 一种卡顿的处理方法及系统
CN106295592A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的识别方法、装置及电子设备
CN106454151A (zh) * 2016-10-18 2017-02-22 珠海市魅族科技有限公司 视频画面拼接方法及装置
CN108124164A (zh) * 2016-11-28 2018-06-05 广州华多网络科技有限公司 一种视频播放的方法、系统、主播端设备及客户端设备
CN107484018B (zh) * 2017-07-31 2019-05-17 维沃移动通信有限公司 一种视频截图方法、移动终端
US10257578B1 (en) 2018-01-05 2019-04-09 JBF Interlude 2009 LTD Dynamic library display for interactive videos
CN110198467A (zh) * 2018-02-27 2019-09-03 优酷网络技术(北京)有限公司 视频播放方法及装置
CN108833973B (zh) * 2018-06-28 2021-01-19 腾讯科技(深圳)有限公司 视频特征的提取方法、装置和计算机设备
CN109672932A (zh) * 2018-12-29 2019-04-23 深圳Tcl新技术有限公司 辅助视力障碍者观看视频的方法、系统、设备及存储介质
CN109714644A (zh) * 2019-01-22 2019-05-03 广州虎牙信息科技有限公司 一种视频数据的处理方法、装置、计算机设备和存储介质
CN109803180A (zh) * 2019-03-08 2019-05-24 腾讯科技(深圳)有限公司 视频预览图生成方法、装置、计算机设备及存储介质
CN110602546A (zh) * 2019-09-06 2019-12-20 Oppo广东移动通信有限公司 视频生成方法、终端及计算机可读存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3472659B2 (ja) * 1995-02-20 2003-12-02 株式会社日立製作所 映像供給方法および映像供給システム
JPH11313048A (ja) * 1998-04-24 1999-11-09 Kokusai Electric Co Ltd マルチメディア通信方法及び通信装置
WO2006048963A1 (ja) 2004-11-02 2006-05-11 Tv Asahi Data Vision Corporation 字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム
TWI267303B (en) * 2005-07-11 2006-11-21 Inventec Corp Video browsing system and the method
JP2007336263A (ja) * 2006-06-15 2007-12-27 Fujifilm Corp 画像処理方法及び装置並びにプログラム
JP4846674B2 (ja) * 2007-08-14 2011-12-28 日本放送協会 静止画抽出装置及び静止画抽出プログラム
JP5173337B2 (ja) * 2007-09-18 2013-04-03 Kddi株式会社 要約コンテンツ生成装置およびコンピュータプログラム
CN101770701A (zh) * 2008-12-30 2010-07-07 北京新学堂网络科技有限公司 一种用于外语学习的电影连环画制作方法
JP5246948B2 (ja) * 2009-03-27 2013-07-24 Kddi株式会社 字幕ずれ補正装置、再生装置および放送装置
US8281231B2 (en) * 2009-09-11 2012-10-02 Digitalsmiths, Inc. Timeline alignment for closed-caption text using speech recognition transcripts
JP5232744B2 (ja) * 2009-09-14 2013-07-10 Kddi株式会社 要約コンテンツを表示する表示装置、方法及びプログラム
US8332530B2 (en) * 2009-12-10 2012-12-11 Hulu Llc User interface including concurrent display of video program, histogram, and transcript
KR101289267B1 (ko) * 2009-12-22 2013-08-07 한국전자통신연구원 방송통신시스템에서 dtv 자막 처리 장치 및 방법
CN101901619B (zh) * 2010-07-16 2012-10-17 复旦大学 一种基于视频内容缩影的增强用户体验的视频播放器
CN102685574A (zh) * 2011-03-09 2012-09-19 须泽中 从数字电视节目中自动抽取图像的系统及其应用
JP5677229B2 (ja) * 2011-07-28 2015-02-25 日本放送協会 映像字幕検出装置およびそのプログラム
CN103020076B (zh) * 2011-09-23 2017-02-08 深圳市快播科技有限公司 一种播放器的视频文件动态预览方法和装置
US20130080384A1 (en) * 2011-09-23 2013-03-28 Howard BRIGGS Systems and methods for extracting and processing intelligent structured data from media files
CN102364960B (zh) 2011-11-04 2015-05-27 播思通讯技术(北京)有限公司 移动数字电视画中画和频道缩略图的播放方法及移动终端
CN103634605B (zh) * 2013-12-04 2017-02-15 百度在线网络技术(北京)有限公司 视频画面的处理方法及装置

Also Published As

Publication number Publication date
CN103634605A (zh) 2014-03-12
CN103634605B (zh) 2017-02-15
JP2016531512A (ja) 2016-10-06
JP6266109B2 (ja) 2018-01-24
US9973793B2 (en) 2018-05-15
WO2015081776A1 (zh) 2015-06-11
US20160277779A1 (en) 2016-09-22
KR20160010507A (ko) 2016-01-27

Similar Documents

Publication Publication Date Title
US10904632B2 (en) Live video stream sharing
US10477262B2 (en) Broadcast management system
JP2019050579A (ja) クラウド・ベースのメディア・コンテンツの管理
US10575031B2 (en) Methods and systems for network based video clip generation and management
US10524001B2 (en) Event-based media playback
US10405009B2 (en) Generating videos with multiple viewpoints
US10063775B2 (en) Content transmission apparatus, content transmission method, content reproduction apparatus, content reproduction method, program and content delivery system
US9264765B2 (en) Method for providing a video, transmitting device, and receiving device
US10123070B2 (en) Method and system for central utilization of remotely generated large media data streams despite network bandwidth limitations
US10593369B2 (en) Providing enhanced content
US10219009B2 (en) Live interactive video streaming using one or more camera devices
CN104159151B (zh) 一种在ott盒子上进行视频截取并处理的装置及方法
JP6449494B2 (ja) 再生装置
US9591361B2 (en) Streaming of multimedia data from multiple sources
US9804668B2 (en) Systems and methods for rapid content switching to provide a linear TV experience using streaming content distribution
RU2620716C2 (ru) Синхронизация воспроизведения мультимедийного контента при групповом просмотре
AU2017200865B2 (en) Methods and apparatus for an embedded appliance
US8381246B2 (en) Methods and apparatus for providing electronic program guides
US9912712B2 (en) Method and apparatus for use in tracking playback of media streams while in stand-by mode
KR20160055851A (ko) 콘텐츠 표시 시스템 및 방법
US9098172B2 (en) Apparatus, systems and methods for a thumbnail-sized scene index of media content
US9973793B2 (en) Method and apparatus for processing video image
CN105430455B (zh) 信息呈现方法及系统
US7424545B2 (en) Methods, apparatus, and program products for providing supplemental content to a recorded experiential data stream
US7873983B2 (en) Method and apparatus for controlling an experiential data stream in a social space

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant