KR20160043523A - 동영상 브라우징 방법, 장치, 프로그램 및 기록매체 - Google Patents

동영상 브라우징 방법, 장치, 프로그램 및 기록매체 Download PDF

Info

Publication number
KR20160043523A
KR20160043523A KR1020157007200A KR20157007200A KR20160043523A KR 20160043523 A KR20160043523 A KR 20160043523A KR 1020157007200 A KR1020157007200 A KR 1020157007200A KR 20157007200 A KR20157007200 A KR 20157007200A KR 20160043523 A KR20160043523 A KR 20160043523A
Authority
KR
South Korea
Prior art keywords
image frame
target block
information
current image
frame
Prior art date
Application number
KR1020157007200A
Other languages
English (en)
Other versions
KR101677607B1 (ko
Inventor
바이차오 왕
치우핑 친
웬디 호우
Original Assignee
시아오미 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시아오미 아이엔씨. filed Critical 시아오미 아이엔씨.
Publication of KR20160043523A publication Critical patent/KR20160043523A/ko
Application granted granted Critical
Publication of KR101677607B1 publication Critical patent/KR101677607B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/745Browsing; Visualisation therefor the internal structure of a single video sequence
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer Security & Cryptography (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 동영상 브라우징 방법 및 장치에 관한 것으로, 컴퓨터 기술 분야에 속한다. 상기 방법은, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여, 대상 블록 정보를 획득하는 단계; 대상 블록 정보가 사전 결정된의 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하는 단계; 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 획득하는 단계를, 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하는 단계; 결정된 적어도 하나의 키 프레임을 재생하는 단계를 포함한다. 상기 장치는, 화상 비교 모듈, 화상 결정 모듈, 동작 수행 모듈, 화상 재생 모듈을 포함한다. 본 발명은 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하여, 동영상 재생 효율을 향상시키는 효과를 달성하였다.

Description

동영상 브라우징 방법 및 장치 {METHOD, AND DEVICE FOR VIDEO BROWSING}
본 발명은 컴퓨터 기술 분야에 관한 것으로, 보다 상세하게는 동영상 브라우징 방법 및 장치에 관한 것이다.
본 발명은 출원번호가 CN 201410475165.4이고, 출원일자가 2014년 9월 17일인 중국 특허 출원에 기반하여 제출하였고, 상기 중국 특허 출원의 우선권을 주장하는 바, 중국 특허 출원의 전부 내용은 참조로서 본 발명에 원용된다.
인터넷의 발전과 더불어, 네트워크 동영상(network video)이 점점 많이 사용되고 있다. 한 구간의 동영상을 획득하였을 때, 빠른 속도로 동영상을 브라우징(browsing)하여 동영상의 내용을 파악할 필요가 있으므로, 동영상에 대하여 빠른 속도로 브라우징하는 것이 사람들에게 주목받는 문제로 되고 있다.
동영상은 연속적인 화상 프레임으로 구성되므로, 동영상의 키 프레임을 추출하는 과정에서, 단말기는 동영상을 적어도 두개의 화면으로 분할하고, 매 하나의 화면의 경계(shot boundary)에 따른 화상 품질과 동영상 내용의 변화에 응답하여 매 하나의 화면을 위한 한 조(group)의 키 프레임을 선택하며, 이러한 키 프레임을 적당한 속도로 스크린 상에 재현시켜, 동영상 브라우징을 실현한다.
발명인은 본 발명을 실현하는 과정에서, 관련 기술에 적어도 하기와 같은 문제가 존재한다는 것을 발견했다. 단말기는 화면의 경계에 근거하여 키 프레임을 추출해야 하고, 동영상이 하나의 연속적인 화면일 때, 동영상으로부터 키 프레임을 추출할 수 없다.
본 발명은 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하기 위한 동영상 브라우징 방법, 및 장치를 제공하기 위한 것이다.
본 발명의 실시예의 제1 양태에 근거하여,
동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 상기 현재 화상 프레임 중에 포함된 대상 블록과 상기 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하는 단계;
상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 단계;
상기 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 상기 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하는 단계; 및
결정된 적어도 하나의 키 프레임을 재생하는 단계를 포함하는 동영상 브라우징 방법을 제공한다.
선택적으로, 상기 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻는 단계는,
상기 이전 화상 프레임 중의 대상 블록과 상기 현재 화상 프레임 중의 대상 블록을 비교하는 단계;
상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 현재 화상 프레임 중에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 상기 새로운 대상 블록을 위하여 이미 결정된 키 프레임의 수량에 1을 가한 플래그 비트 정보를 설정하여, 매 하나의 새로운 대상 블록의 대상 블록 정보를 획득하는 단계;
상기 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 상기 현재 화상 프레임 중에 포함될 경우, 존재하는 매 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정하고, 상기 현재 화상 프레임 중의 상기 이미 존재하는 대상 블록이 상기 이전 화상 프레임 중의 대응되는 대상 블록에 기반한 이동정보를 산출하여, 매 하나의 이미 존재하는 대상 블록의 대상 블록 정보를 획득하는 단계; 및
상기 현재 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 이전 화상 프레임 중에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 사라진 대상 블록으로 결정하고, 매 하나의 사라진 대상 블록의 대상 블록 정보를 획득하는 단계를 포함한다.
선택적으로, 상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 상기 단계는,
상기 현재 화상 프레임의 대상 블록 정보에서 상기 이미 존재하는 대상 블록의 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나를 포함하는 매 하나의 이미 존재하는 대상 블록의 이동 정보를 판독하는 단계;
이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 지를 검출하는 단계; 및
상기 이동 조건에 부합되는 이동 정보의 개수가 상기 사전 결정된 임계값보다 큰 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하는 단계를 포함한다.
선택적으로, 상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 상기 단계는,
상기 현재 화상 프레임의 대상 블록 정보에서 매 하나의 대상 블록의 플래그 비트 정보를 판독하는 단계;
각 플래그 비트 정보 중에 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출하는 단계; 및
상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하는 단계를 포함한다.
선택적으로, 상기 방법은,
상기 동영상 중의 매 하나의 화상 프레임 및 상기 화상 프레임 촬영시의 위성 항법 장치GPS정보, 가속도 정보와 감광도ISO정보 중의 적어도 하나를 포함하는 센서 정보를 획득하는 단계;
상기 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 폐기하고, 상기 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻도록 트리거하는 단계를 더 포함한다.
선택적으로, 상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 상기 단계는,
상기 현재 화상 프레임 중에 인물이 포함될 경우, 상기 현재 화상 프레임이 상기 이전 화상 프레임에 비하여 인물 자태 정보에 변화가 발생되었는지의 여부를 검출하고, 상기 현재 화상 프레임 중에서 상기 인물 이외의 대상 블록 정보가 상기 사전 결정된 조건에 부합되는지의 여부를 검출하는 단계;
상기 인물 자태 정보에 변화가 발생되고 상기 현재 화상 프레임 중에서 상기 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는 것으로 검출될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 단계를 포함한다.
본 발명의 실시예의 제2 양태에 근거하여,
동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 상기 현재 화상 프레임 중에 포함된 대상 블록과 상기 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하도록 구성되는 화상 비교 모듈;
상기 화상 비교 모듈에서 획득한 상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 화상 결정 모듈;
상기 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 상기 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하도록 구성되는 동작 수행 모듈; 및
상기 화상 결정 모듈에 의해 결정된 적어도 하나의 키 프레임을 재생하도록 구성되는 화상 재생 모듈을 포함하는 동영상 브라우징 장치를 제공한다.
선택적으로, 상기 화상 비교 모듈은,
상기 이전 화상 프레임 중의 대상 블록과 상기 현재 화상 프레임 중의 대상 블록을 비교하도록 구성되는 대상 비교 서브 모듈;
상기 대상 비교 서브 모듈에 의해 비교를 거친 결과, 상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 현재 화상 프레임에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 상기 새로운 대상 블록을 위하여 이미 결정된 키 프레임의 수량에 1을 가한 플래그 비트 정보를 설정하여, 매 하나의 새로운 대상 블록의 대상 블록 정보를 얻도록 구성되는 제1 결정 서브 모듈;
상기 대상 비교 서브 모듈에 의해 비교를 거친 결과, 상기 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 상기 현재 화상 프레임에 포함될 경우, 존재하는 매 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정하고, 상기 현재 화상 프레임 중의 상기 이미 존재하는 대상 블록이 상기 이전 화상 프레임에 대응되는 대상 블록에 기반한 이동 정보 산출하여, 매 하나의 이미 존재하는 대상 블록의 대상 블록 정보를 얻도록 구성되는 제2 결정 서브 모듈; 및
상기 대상 비교 서브 모듈에 의해 비교를 거친 결과, 상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 현재 화상 프레임 중에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 사라진 블록으로 결정하여, 매 하나의 사라진 대상 블록의 대상 블록 정보를 얻도록 구성되는 제3 결정 서브 모듈을 포함한다.
선택적으로, 상기 화상 결정 모듈은,
상기 현재 화상 프레임의 대상 블록 정보에서 매 하나의 이미 존재하는 대상 블록의 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나를 포함하는 이동 정보를 판독하도록 구성되는 제1 판독 서브 모듈;
이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 지를 검출하도록 구성되는 제1 검출 서브 모듈; 및
상기 제1 검출 서브 모듈에 의해 상기 이동 조건에 부합되는 이동 정보의 개수가 상기 사전 결정된 임계값보다 큰 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하도록 구성되는 제4 결정 서브 모듈을 포함한다.
선택적으로, 상기 화상 결정 모듈은,
상기 현재 화상 프레임의 대상 블록 정보에서 매 하나의 대상 블록의 플래그 비트 정보를 판독하도록 구성되는 제2 판독 서브 모듈;
각 플래그 비트 정보 중에 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출하도록 구성되는 제2 검출 서브 모듈; 및
상기 제2 검출 서브 모듈에 의해 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하도록 구성되는 제5 결정 서브 모듈을 포함한다.
선택적으로, 상기 장치는,
상기 동영상 중의 매 하나의 화상 프레임 및 상기 화상 프레임 촬영시의 위성 항법 장치GPS정보, 가속도 정보와 감광도ISO정보 중의 적어도 하나를 포함하는 센서 정보를 획득하도록 구성되는 정보 획득 모듈; 및
상기 정보 획득 모듈에 의해 획득한 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 폐기하고, 상기 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻는 동작을 트리거하도록 구성되는 화상 스크리닝 모듈을 포함한다.
선택적으로, 상기 화상 결정 모듈은,
상기 현재 화상 프레임 중에 인물이 포함될 경우, 상기 현재 화상 프레임이 상기 이전 화상 프레임에 비하여 인물 자태 정보에 변화가 발생되었는지의 여부를 검출하고, 상기 현재 화상 프레임 중에서 상기 인물 이외의 대상 블록 정보가 상기 사전 결정된 조건에 부합되는지의 여부를 검출하도록 구성되는 제3 검출 서브 모듈; 및
상기 제3 검출 서브 모듈에 의해 상기 인물 자태 정보에 변화가 발생되고 상기 현재 화상 프레임 중에 상기 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는 것으로 검출될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 제6 결정 서브 모듈을 포함한다.
본 발명의 실시예의 제3 양태에 근거하여,
프로세서;
프로세서에 의해 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하고;
상기 프로세서는, 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 상기 현재 화상 프레임 중에 포함된 대상 블록과 상기 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고; 상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하며; 상기 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 상기 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 상기 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하고; 결정된 적어도 하나의 키 프레임을 재생하도록 구성되는 동영상 브라우징 장치를 제공한다.
본 발명의 실시예에 의해 제공된 기술적 해결방법은 하기와 같은 유익한 효과를 포함할 수 있다.
동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하며, 동영상 중의 현재 화상 프레임의 대상 블록을 비교하여 대상 블록 정보를 얻을 수 있으며, 다시 대상 블록 정보에 근거하여 키 프레임을 스크리닝하여, 화면의 경계에 의해 키 프레임을 결정하지 않아도 되므로, 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하여, 동영상 재생 효율을 향상시키는 효과를 달성하였다.
상기의 일반적인 설명과 후술되는 세부 설명는 단지 예시적인 것으로, 본 발명을 한정하는 것이 아님을 이해해야 한다.
아래의 도면은 명세서의 일부분으로서 명세서의 전체를 구성하며 본 발명에 맞는 실시예를 예시하여 본 발명의 원리를 해석하기 위한 것이다.
도1은 일 예시적 실시예에 근거하여 도시된 동영상 브라우징 방법의 흐름도이다.
도2는 다른 예시적 실시예에 근거하여 도시된 동영상 브라우징 방법의 흐름도이다.
도3은 일 예시적 실시예에 근거하여 도시된 동영상 브라우징 장치의 블록도이다.
도4는 일 예시적 실시예에 근거하여 도시된 동영상 브라우징 장치의 블록도이다.
도5는 일 예시적 실시예에 근거하여 도시된 동영상 브라우징에 사용되는 장치의 블록도이다.
여기서, 예시적 실시예에 대하여 상세하게 설명하고, 이를 첨부되는 도면에 예시적으로 나타냈다. 하기에서 첨부되는 도면에 대하여 설명할 때, 별도로 표시하지 않는 한, 다른 도면의 동일한 숫자는 동일하거나 유사한 구성요소를 나타낸다. 하기의 예시적 실시예에서 설명한 실시형태는 본 발명과 일치한 모든 실시형태를 의미하는 것은 아니다. 반대로, 이들은 첨부된 특허청구범위에서 설명한, 본 발명의 일부 양태와 일치한 장치와 방법에 대한 예일 뿐이다.
도1은 일 예시적 실시예의 동영상 브라우징 방법의 흐름도이고, 상기 동영상 브라우징 방법은 단말기에 응용되며, 도1에 도시된 바와 같이, 상기 동영상 브라우징 방법은 하기와 같은 단계를 포함한다.
단계101에서는, 동영상 중의 현재 화상 프레임과 이의(즉, 현재 화상 프레임의) 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득한다.
화상 프레임은 동영상의 단위 화면이다. 대상 블록은 화상 프레임 중의 내용을 구획(dividing)한 후 얻은 것이고, 대상 블록은 적어도 하나의 물체를 포함할 수 있고, 하나의 물체의 일부분을 포함할 수도 있으며, 본 실시예는 대상 블록의 구획 방식에 대하여 한정하지 않는다. 대상 블록 정보는 동영상 중의 현재 화상 프레임의 대상 블록과 이의 이전 화상 프레임의 대상 블록을 비교하여 얻는 정보이다.
단계102에서는, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임(keyframe)으로 결정한다.
키 프레임은 전체 동영상에서 물체 또는 물체의 운동 중의 관건적인 동작(key action)이 위치하는 하나의 화상 프레임이고, 동영상 중의 하나의 시간 구간의 동영상 내용을 대표할 수 있다.
화상 프레임 중의 물체는 대상 블록으로 표시할 수 있으며, 대상 블록 정보는 서로 인접한 두개의 화상 프레임 중의 대상 블록의 변화를 표시할 수 있으므로, 단말기는 대상 블록 정보에 근거하여 화상 프레임이 키 프레임인지에 대하여 검출할 수 있고, 이로써 동영상으로부터 적어도 하나의 키 프레임을 추출할 수 있다.
단계103에서는, 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행한다.
동영상 중의 모든 키 프레임을 추출하기 위하여, 단말기는 모든 화상 프레임을 비교해야 하므로, 현재 화상 프레임을 비교 완성한 후, 현재 화상 프레임의 다음 화상 프레임을 새로운 현재 화상 프레임으로 결정하고, 상기 현재 화상 프레임을 새로운 현재 화상 프레임의 이전 화상 프레임으로 결정하며, 동영상 중의 마지막 하나의 화상 프레임을 현재 화상 프레임으로 하여 비교할 때까지 계속하여 단계101를 수행한 후, 검출 과정을 완료한다.
단계104에서는, 결정된 적어도 하나의 키 프레임을 재생한다.
매 하나의 키 프레임은 모두 하나의 시간 구간의 동영상 내용을 대표할 수 있으므로, 결정된 적어도 하나의 키 프레임을 순서에 따라 적당한 프레임 속도로 단말기에서 재생하고, 동영상이 표달(express)하고자 하는 유효 정보(effective information)를 축소하지 않는 전제 하에서, 동영상의 재생 시간을 압축하여, 동영상의 내용에 대한 빠른 속도의 브라우징을 실현하고, 동영상 재생 효율을 향상시킬 수 있다.
결론적으로, 본 발명이 제공하는 동영상 브라우징 방법은, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하며, 동영상 중의 현재 화상 프레임의 대상 블록을 비교하여 대상 블록 정보를 얻을 수 있으며, 다시 대상 블록 정보에 근거하여 키 프레임을 스크리닝(screening)하여, 화면의 경계에 의해 키 프레임을 결정하지 않아도 되므로, 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하여, 동영상 재생 효율을 향상시키는 효과를 달성하였다.
도2는 일 예시적 실시예의 동영상 브라우징 방법의 흐름도이고, 상기 동영상 브라우징 방법은 단말기에 응용되며, 도2에 도시된 바와 같이, 상기 동영상 브라우징 방법은 하기와 같은 단계를 포함한다.
단계201에서는, 동영상 중의 매 하나의 화상 프레임 및 화상 프레임 촬영시의 GPS(Global Positioning System) 정보, 가속도 정보와 감광도(sensitivity) ISO(International Standardization Organization) 정보 중의 적어도 하나를 포함하는 센서 정보를 획득하고, 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 폐기하고, 단계202를 수행하도록 트리거(trigger)한다.
본 실시예에서, 단계201는 선택 가능한 단계이다. 즉, 단말기는 캠으로 동영상을 촬영할 수 있고, 동영상을 획득한 후 단계202를 수행하거나 또는 단말기는 동영상을 획득한 후, 동영상 중의 화상 프레임에 대하여 스크리닝하여, 폐기 조건에 부합되는 화상 프레임을 폐기함으로써, 폐기 조건에 부합되는 화상 프레임에 대하여 처리함으로 인해 초래되는 자원의 낭비를 절감하고, 화상 프레임에 대한 처리 효율을 향상시킨다. 여기서, 화상 프레임은 동영상의 단위 화면이다.
단말기가 화상 프레임에 대하여 스크리닝할 필요가 있으면, 캠으로 동영상을 촬영할 때, 센서로 매 하나의 화상 프레임의 센서 정보를 수집하고, 센서 정보에 근거하여 매 하나의 화상 프레임이 폐기 조건에 부합되는지의 여부를 검출한다. 여기서, 센서 정보는 GPS정보, 가속도 정보와 감광도 IOS정보 중의 적어도 하나일 수 있다.
여기서, 단말기는 상이한 센서 정보에 근거하여 상이한 폐기 조건을 설정할 수 있다. 센서 정보가 GPS정보일 때, 촬영 장면은 이동 과정 중의 촬영 동영상일 수 있고, 단말기가 긴 시간동안 동일한 위치에 머물러 있으면, 이때 촬영한 화상 프레임은 중복될 수 있으므로, 다음과 같은 폐기 조건을 설정할 수 있다. 즉, 이동 과정에서 동영상을 촬영할 때, GPS정보와 이전 화상 프레임의 GPS정보 사이의 거리가 GPS임계값보다 작은 화상 프레임을 폐기한다. 센서 정보가 가속도 정보일 때, 촬영 장면은 이동 과정 중의 촬영 동영상일 수 있고, 단말기가 이동하는 가속도가 비교적 빠르면, 이때 촬영한 화상 프레임은 모호하므로, 다음과 같은 폐기 조건을 설정할 수 있다. 즉, 가속도가 가속도 임계값을 초과하는 화상 프레임을 폐기한다. 센서 정보가 ISO정보일 때, ISO가 비교적 높으면, 이때 촬영한 화상 프레임 중의 노이즈가 비교적 많으므로, 다음과 같은 폐기 조건을 설정할 수 있다. 즉, ISO가 ISO임계값을 초과하는 화상 프레임을 폐기한다. 센서 정보가 GPS정보, 가속도 정보와, ISO정보 중의 적어도 두가지를 포함할 경우, 단말기는 각종 센서 정보에 각자 대응되는 폐기 조건을 합병시킬 수 있고, 센서 정보 중의 적어도 하나가 폐기 조건에 부합될 경우, 상기 화상 프레임의 폐기를 결정한다.
단계202에서는, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득한다.
대상 블록은 화상 프레임 중의 내용을 구획한 후 얻은 것이고, 대상 블록은 적어도 하나의 물체를 포함할 수 있고, 하나의 물체의 일부분을 포함할 수도 있으며, 화상 프레임에 대한 구획 방식에 근거하여 결정된다. 여기서, 단말기는 화상 프레임에 대하여 등분 동작을 할 수 있는 바, 예를 들면, 단말기는 길이 방향에서 화상 프레임을 M등분하고, 너비 방향에서 N등분하여, M×N개의 대상 블록을 얻는다. 또는, 단말기는 화상 프레임에서 가장 관심하는 최소 목표에 근거하여 대상 블록을 구획할 수 있는 즉, 매 하나의 대상 블록은 적어도 하나의 최소 목표를 포함한다. 또는, 단말기는 개발자의 경험치에 근거하여 대상 블록을 구획하는 등, 본 실시예는 대상 블록에 대한 구획 방식을 한정하지 않는다.
현재 화상 프레임의 대상 블록을 얻은 후, 단말기는 상기 현재 화상 프레임의 대상 블록과 이의 이전 화상 프레임의 대상 블록을 비교하여, 대상 블록 정보를 얻는다. 상기 대상 블록 정보는 서로 인접한 두개의 화상 프레임 중의 대상 블록의 변화를 표시한다.
본 실시예에서, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여 대상 블록 정보를 획득하는 단계는,
1) 이전 화상 프레임 중의 대상 블록과 현재 화상 프레임 중의 대상 블록을 비교하는 단계;
2) 상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 현재 화상 프레임 중에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 새로운 대상 블록을 위하여 이미 결정된 키 프레임의 수량에 1을 가한 플래그 비트 정보를 설정하여, 매 하나의 새로운 대상 블록의 대상 블록 정보를 획득하는 단계;
3) 상기 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 현재 화상 프레임 중에 포함될 경우, 존재하는 매 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정하고, 현재 화상 프레임 중의 이미 존재하는 대상 블록이 이전 화상 프레임 중의 대응되는 대상 블록에 기반한 이동정보를 산출하여, 매 하나의 이미 존재하는 대상 블록의 대상 블록 정보를 획득하는 단계;
4) 현재 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 이전 화상 프레임 중에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 사라진 대상 블록으로 결정하고, 매 하나의 사라진 대상 블록의 대상 블록 정보를 획득하는 단계를 포함한다.
여기서, 현재 화상 프레임 중의 대상 블록과 이전 화상 프레임 중의 대상 블록은 특징 비교를 진행할 수 있고, 상기 특징은 색상 히스토그램일 수 있으며, 색상 히스토그램과 무늬 특징일 수도 있고, 비교 방식은 유클리드 거리를 사용할 수 있다. 대상 블록을 비교하면 3가지 결과가 있을 수 있으므로, 이하 상기 3가지 결과에 대하여 각각 설명하고자 한다.
첫째, 이전 화상 프레임에 존재하지 않는 적어도 하나의 대상 블록이 현재 화상 프레임 중에 포함된다. 이때, 단말기는 상기 존재하지 않는 적어도 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 상기 새로운 대상 블록에 대하여 플래그 비트 정보를 설정하여 마크할 수 있다.
여기서, 단말기는 새로운 대상 블록의 플래그 비트 정보를 이미 결정된 키 프레임의 수량에 1을 가한 것으로 설정할 수 있다. k번째의 화상 프레임 전에 이미 s개의 키 프레임이 결정되었을 경우, k번째의 화상 프레임 중의 새로운 대상 블록의 플래그 비트 정보를 s+1로 설정할 수 있고, k번째의 화상 프레임이 키 프레임이 아니면, 여전히 k+1번째의 화상 프레임 중의 새로운 대상 블록의 플래그 비트를 s+1로 설정할 수 있다. 즉, s번째의 키 프레임과 s+1번째의 키 프레임 사이의 화상 프레임 중의 새로운 대상 블록의 플래그 비트 정보는 모두 s+1이다.
선택적으로, 단말기는 대상 블록의 위치와 마크(identity) 등 정보를 획득할 수 있고, 마크, 플래그 비트 정보와 위치 등 정보를 상기 새로운 대상 블록의 대상 블록 정보로 결정할 수 있다.
둘째, 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 현재 화상 프레임 중에 포함된다. 이때, 단말기는 상기 존재하는 적어도 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정할 수 있고, 이미 존재하는 대상 블록의 이동 정보를 획득할 수 있다.
여기서, 이동 정보는 상기 현재 화상 프레임 중의 대상 블록이 이전 화상 프레임 중에서 대응되는 대상 블록에 비한 이동 변위, 상기 현재 화상 프레임 중의 대상 블록이 이전 화상 프레임 중에서 대응되는 대상 블록에 비한 이동 횟수와 상기 현재 화상 프레임 중의 대상 블록의 이동 영역 중의 적어도 하나일 수 있다.
예를 들면, 이동 정보가 이동 변위를 포함할 경우, 상기 대상 블록이 이전 화상 프레임 중의 좌표가 (10cm, 13cm)이고, 상기 대상 블록이 현재 화상 프레임 중의 좌표가 (10cm, 15cm)일 경우, 이때 상기 대상 블록의 변위는 2cm이다. 이동 정보가 이동 횟수를 포함할 경우, 상기 대상 블록이 이전 화상 프레임 중의 이동 횟수가2이며 상기 대상 블록이 현재 화상 프레임 중의 위치와 상기 대상 블록이 이전 화상 프레임 중의 위치가 상이할 경우, 상기 대상 블록의 이동 횟수는 3이다. 이동 정보가 이동 영역을 포함할 경우, 상기 대상 블록은 현재 화상 프레임의 중앙 영역에 위치하면, 상기 대상 블록의 이동 영역을 중앙 영역으로 결정한다.
선택적으로, 단말기는 상기 대상 블록의 마크와 플래그 비트 정보를 획득할 수 있고, 마크, 플래그 비트 정보와 이동 정보를 상기 이미 존재하는 대상 블록의 대상 블록 정보로 결정할 수 있다.
셋째, 현재 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 이전 화상 프레임 중에 포함된다. 이때, 단말기는 상기 존재하지 않는 적어도 하나의 대상 블록을 사라진 대상 블록으로 결정하고, 상기 대상 블록의 마크, 플래그 비트 정보와 이동 정보를 상기 사라진 대상 블록의 대상 블록 정보로 결정한다.
단계203에서는, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정한다.
키 프레임은 전체 동영상에서 물체 또는 물체 운동 중의 관건적인 동작이 위치하는 하나의 화상 프레임이고, 동영상 중의 하나의 시간 구간의 동영상 내용을 대표할 수 있다. 화상 프레임 중의 물체는 대상 블록으로 표시할 수 있으며 대상 블록 정보는 서로 인접한 두개의 화상 프레임 중의 대상 블록의 변화를 표시할 수 있으므로, 단말기는 대상 블록 정보에 근거하여 화상 프레임이 키 프레임인지에 대하여 검출할 수 있고, 이로써 동영상으로부터 적어도 하나의 키 프레임을 추출할 수 있다.
여기서, 단말기는 상이한 대상 블록 정보에 근거하여 키 프레임을 결정할 수 있고, 본 실시예에서는 대상 블록 정보가 이동 정보와 플래그 비트 정보를 각각 포함하여 키 프레임을 결정하는 과정에 대하여 예를 들어 설명한다.
첫째, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하는 단계는,
1) 현재 화상 프레임의 대상 블록 정보에서 이미 존재하는 대상 블록의 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나를 포함하는 매 하나의 이미 존재하는 대상 블록의 이동 정보를 판독하는 단계;
2) 이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 지를 검출하는 단계;
3) 이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 것으로 검출될 경우, 현재 화상 프레임을 키 프레임으로 결정하는 단계를 포함한다.
상기 키 프레임 결정 방법은 전경 대상(Foreground objects)이 이동하고 배경의 변화가 크기 않은 장면에 적용되거나 또는 배경이 축소되고 전경 대상이 없는 장면에 적용된다.
이동 정보는 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나일 수 있으므로, 이동 정보가 상이할 때, 이동 정보와 대응되는 이동 조건도 상이하다. 예를 들면, 이동 정보가 이동 횟수를 포함할 경우, 이동 조건은 이동 횟수가 횟수 임계값보다 큰 것으로 할 수 있고, 이동 정보가 이동 변위를 포함할 경우, 이동 조건은 이동 변위가 변위 임계값보다 큰 것으로 할 수 있으며, 이동 정보가 이동 영역을 포함할 경우, 이동 조건은 목적 영역일 수 있다. 이동 정보가 이동 횟수, 이동 변위와 이동 영역 중의 적어도 두개를 포함할 경우, 각 이동 정보 각자가 대응하는 이동 조건을 합병할 수 있고, 이동 정보 중의 각 이동 정보가 모두 각자의 이동 조건에 부합될 경우, 상기 이동 정보가 이동 조건에 부합된다고 결정할수 있다.
예를 들면, 이동 횟수가 4를 초과하며 목표 영역이 중앙 영역인 이동 조건에서, 단말기가 어느 하나의 이동 정보 중에 기록된 이동 횟수가 5이며 이동 영역이 중앙 영역인 것으로 검출될 경우, 상기 이동 정보가 이동 조건에 부합된다고 결정한다.
이동 정보가 이동 조건에 부합되는 것으로 결정된 후, 단말기는 이동 조건에 부합되는 이동 정보의 수량에 대하여 통계할 수 있고, 통계를 거쳐 얻은 횟수가 사전 결정된 임계값보다 큰 지를 검출할 수 있다. 단말기가 통계를 거쳐 얻은 횟수가 사전 결정된 임계값보다 큰 것으로 검출될 경우, 현재 화상 프레임 중의 복수개의 대상 블록의 대상 블록 정보가 이전 키 프레임에 비하여 변화가 발생된 것으로 결정하고, 현재 화상 프레임을 키 프레임으로 결정할 수 있다. 단말기가 통계를 거쳐 얻은 횟수가 사전 결정된 임계값보다 작은 것으로 검출될 경우, 현재 화상 프레임 중의 소수의 대상 블록의 목표 정보가 이전 키 프레임에 비하여 변화가 발생된 것으로 결정하고, 현재 화상 프레임을 키 프레임으로 결정하지 않아도 된다.
둘째, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하는 단계는,
1) 현재 화상 프레임의 대상 블록 정보에서 매 하나의 대상 블록의 플래그 비트 정보를 판독하는 단계;
2) 각 플래그 비트 정보 중에 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출하는 단계;
3) 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 현재 화상 프레임을 상기 키 프레임으로 결정하는 단계를 포함한다.
상기 키 프레임 결정 방법은 배경이 사전 결정된 속도로 평행 이동하며 전경 대상이 없는 장면에 적용되거나 또는 배경이 사전 결정된 속도로 평행 이동하고 전경 대상이 변화하지 않는 장면에 적용된다.
대상 블록 정보는 플래그 비트 정보를 더 포함하므로, 화상 프레임 중에서 어느 하나의 플래그 비트 정보가 완전히 사라질 때, 상기 화상 프레임을 키 프레임으로 결정한다. 플래그 비트 정보가 완전히 사라진 것으로 검출될 경우, 단말기는 현재 화상 프레임 중의 사라진 대상 블록의 플래그 비트 정보를 획득할 수 있고, 현재 화상 프레임에 포함된 각 플래그 비트 정보 중에 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출할 수 있다. 단말기가 현재 화상 프레임에 포함된 각 플래그 비트 정보 중에 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 상기 플래그 비트 정보가 완전히 사라진 것으로 결정하고, 단말기가 현재 화상 프레임에 포함된 각 플래그 비트 정보 중에 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는 것으로 검출될 경우, 상기 플래그 비트 정보가 완전히 사라지지 않은 것으로 결정한다.
인물을 포함한 화상 프레임에 있어서, 가끔 인물의 미세한 자태 변화를 포착할 필요가 있고, 이때, 단말기가 인물을 대상 블록으로 구획하여 검출하면, 대상 블록 정보의 변화가 크지 않음으로 인하여 중요한 화상 프레임을 키 프레임이 아닌 것으로 결정할 수 있으므로, 중요한 정보를 잃게 된다.
따라서, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하는 단계는,
1) 현재 화상 프레임 중에 인물이 포함될 경우, 현재 화상 프레임이 이전 화상 프레임에 비하여 인물 자태 정보(the posture information of the character)에 변화가 발생되었는지의 여부를 검출하고, 현재 화상 프레임 중에서 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는지의 여부를 검출하는 단계;
2) 인물 자태 정보에 변화가 발생되고 현재 화상 프레임 중에서 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는 것으로 검출될 경우, 현재 화상 프레임을 키 프레임으로 결정하는 단계를 포함한다.
단말기는 현재 화상 프레임 중의 인물과 배경을 분리하여, 인물 자태에 대하여 분석하고, 배경을 대상 블록으로 구획하여 대상 블록 정보에 근거하여 검출하며, 분석 결과와 검출 결과에 근거하여 화상이 키 프레임인지를 결정할 수 있다. 여기서, 인물 자태 정보는 얼굴 표정 또는 인물 자태를 포함한다.
단말기가 인물 자태에 대하여 분석하는 방법은 아주 많은 바, 예를 들면, 단말기는 능동적 형태 모델(ASM, Active Shape Model) 알고리즘 또는 능동적 외관 모델(AAM, Active Appearance Model) 알고리즘을 사용하여 얼굴 특징점에 대하여 위치 결정하고, 다시 관건적 부위의 특징에 대하여 추출하며, 표정에 따라 특징을 분류할 수 있다. 단말기에 의해 현재 화상 프레임 중 특징적 표정 분류와 이전 화상 프레임 중 특징적 표정 분류가 상이한 것으로 검출될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정한다. 단말기가 대상 블록 정보에 대한 검출 과정은 상기 검출 과정과 동일하므로, 중복 설명하지 않는다.
보충하여 설명해야할 것은, 단말기는 센서 정보에 근거하여 키 프레임을 결정할 수 있다. 예를 들면, 센서 정보가 GPS정보일 때, GPS정보와 이전 화상 프레임의 GPS정보를 비교하여, GPS 정보와 이전 화상 프레임의 GPS정보 사이의 거리가 GPS임계값보다 클 때, 상기 GPS정보에 대응되는 현재 화상 프레임을 키 프레임으로 결정할 수 있다.
단계204에서는, 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 단계202를 수행한다.
동영상 중의 모든 키 프레임을 추출하기 위하여, 단말기는 모든 화상 프레임에 대하여 비교해야 하므로, 현재 화상 프레임을 비교한 후, 현재 화상 프레임의 다음 화상 프레임을 새로운 현재 화상 프레임으로 결정하고, 상기 현재 화상 프레임을 새로운 현재 화상 프레임의 이전 화상 프레임으로 결정하며, 동영상 중의 마지막 하나의 화상 프레임을 현재 화상 프레임으로 하여 비교 완료될 때까지 계속하여 단계(202)를 수행한 후, 검출 과정을 종료한다.
단계205에서는, 결정된 적어도 하나의 키 프레임을 재생한다.
매 하나의 키 프레임은 모두 하나의 시간 구간의 동영상 내용을 대표할 수 있으므로, 결정된 적어도 하나의 키 프레임을 순서에 따라 적당한 프레임 속도로 단말기에서 재생하고, 동영상이 표달하고자 하는 유효 정보를 축소하지 않는 전제 하에서, 동영상의 재생 시간을 압축하여, 동영상의 내용에 대한 빠른 속도의 브라우징을 실현하고, 동영상 재생 효율을 향상시킬 수 있다.
선택적으로, 단말기는 적어도 하나의 키 프레임을 저장할 수 있으므로, 동영상을 짧은 동영상으로 전환시킬 수 있다.
결론적으로, 본 발명이 제공하는 동영상 브라우징 방법은, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하며, 동영상 중의 현재 화상 프레임의 대상 블록을 비교하여 대상 블록 정보를 얻을 수 있으며, 다시 대상 블록 정보에 근거하여 키 프레임을 스크리닝하여, 화면의 경계에 의해 키 프레임을 결정하지 않아도 되므로, 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하여, 동영상 재생 효율을 향상시키는 효과를 달성하였다.
이 외에, 동영상 중의 매 하나의 화상 프레임 및 화상 프레임 촬영시의 센서 정보를 획득하여, 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 페기함으로써, 폐기 조건에 부합되는 화상 프레임에 대하여 처리함으로 인해 초래되는 자원의 낭비를 절감하고, 화상 프레임에 대한 처리 효율을 향상시킨다.
도3은 일 예시적 실시예의 동영상 브라우징 장치의 블록도이고, 상기 동영상 브라우징 장치는 단말기에 응용되며, 도3에서 도시된 바와 같이, 상기 동영상 브라우징 장치는, 화상 비교 모듈(310), 화상 결정 모듈(320), 동작 수행 모듈(330)과 화상 재생 모듈(340)을 포함한다.
상기 화상 비교 모듈(310)은 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하도록 구성된다.
상기 화상 결정 모듈(320)은 화상 비교 모듈(310)에서 획득한 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하도록 구성된다.
상기 동작 수행 모듈(330)은 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 획득하는 단계를, 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하도록 구성된다.
상기 화상 재생 모듈(340)은 화상 결정 모듈(320)에 의해 결정된 적어도 하나의 키 프레임을 재생하도록 구성된다.
결론적으로, 본 발명이 제공하는 동영상 브라우징 장치는, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하며, 동영상 중의 현재 화상 프레임의 대상 블록을 비교하여 대상 블록 정보를 얻을 수 있으며, 다시 대상 블록 정보에 근거하여 키 프레임을 스크리닝하여, 화면의 경계에 의해 키 프레임을 결정하지 않아도 되므로, 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하여, 동영상 재생 효율을 향상시키는 효과를 달성하였다.
도4는 일 예시적 실시예의 동영상 브라우징 장치의 블록도이고, 상기 동영상 브라우징 장치는 단말기에 응용되며, 도4에서 도시된 바와 같이, 상기 동영상 브라우징 장치는, 화상 비교 모듈(310), 화상 결정 모듈(320), 동작 수행 모듈(330)과 화상 재생 모듈(340)을 포함한다.
상기 화상 비교 모듈(310)은 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하도록 구성된다.
상기 화상 결정 모듈(320)은 화상 비교 모듈(310)에서 획득한 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하도록 구성된다.
상기 동작 수행 모듈(330)은 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 획득하는 단계, 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하도록 구성된다.
상기 화상 재생 모듈(340)은 화상 결정 모듈(320)에 의해 결정된 적어도 하나의 키 프레임을 재생하도록 구성된다.
선택적으로, 화상 비교 모듈(310)은,
이전 화상 프레임 중의 대상 블록과 현재 화상 프레임 중의 대상 블록을 비교하도록 구성되는 대상 비교 서브 모듈(311);
대상 비교 서브 모듈(311)에 의해 비교를 거친 결과, 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 현재 화상 프레임 중에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 새로운 대상 블록을 위하여 이미 결정된 키 프레임의 수량에 1을 가한 플래그 비트 정보를 설정하여, 매 하나의 새로운 대상 블록의 대상 블록 정보를 얻도록 구성되는 제1 결정 서브 모듈(312);
대상 비교 서브 모듈(311)에 의해 비교를 거친 결과, 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 현재 화상 프레임 중에 포함될 경우, 존재하는 매 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정하고, 현재 화상 프레임 중의 이미 존재하는 대상 블록이 이전 화상 프레임에 대응되는 대상 블록에 기반한 이동 정보 산출하여, 매 하나의 이미 존재하는 대상 블록의 대상 블록 정보를 얻도록 구성되는 제2 결정 서브 모듈(313);
대상 비교 서브 모듈(311)에 의해 비교를 거친 결과, 상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 현재 화상 프레임에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 사라진 블록으로 결정하여, 매 하나의 사라진 대상 블록의 대상 블록 정보를 얻도록 구성되는 제3 결정 서브 모듈(314)을 포함한다.
선택적으로, 화상 결정 모듈(320)은,
현재 화상 프레임의 대상 블록 정보에서 매 하나의 이미 존재하는 대상 블록의 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나를 포함하는 이동 정보를 판독하도록 구성되는 제1 판독 서브 모듈(321);
이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 지를 검출하도록 구성되는 제1 검출 서브 모듈(322);
제1 검출 서브 모듈에 의해 이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 것으로 검출될 경우, 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 제4 결정 서브 모듈(323)을 포함한다.
선택적으로, 화상 결정 모듈(320)은,
현재 화상 프레임의 대상 블록 정보에서 매 하나의 대상 블록의 플래그 비트 정보를 판독하도록 구성되는 제2 판독 서브 모듈(324);
각 플래그 비트 정보 중에 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출하도록 구성되는 제2 검출 서브 모듈(325);
상기 제2 검출 서브 모듈에 의해 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 제5 결정 서브 모듈(326)을 포함한다.
선택적으로, 동영상 브라우징 장치는, 동영상 중의 매 하나의 화상 프레임 및 화상 프레임 촬영시의 위성 항법 장치GPS정보, 가속도 정보와 감광도ISO정보 중의 적어도 하나를 포함하는 센서 정보를 획득하도록 구성되는 정보 획득 모듈(350);
정보 획득 모듈(350)에 의해 획득한 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 폐기하고, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻는 동작을 트리거하도록 구성되는 화상 스크리닝 모듈(360)을 더 포함한다.
선택적으로, 화상 결정 모듈(320)은,
현재 화상 프레임 중에 인물이 포함될 경우, 현재 화상 프레임이 이전 화상 프레임에 비하여 인물 자태 정보에 변화가 발생되었는지의 여부를 검출하고, 현재 화상 프레임 중에서 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는지의 여부를 검출하도록 구성되는 제3 검출 서브 모듈(327);
제3 검출 서브 모듈에 의해 인물 자태 정보에 변화가 발생되고 현재 화상 프레임 중에 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는 것으로 검출될 경우, 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 제6 결정 서브 모듈(328)을 포함한다.
결론적으로, 본 발명이 제공하는 동영상 브라우징 장치는, 동영상 중의 현재 화상 프레임과 이의 이전 화상 프레임을 비교하여, 현재 화상 프레임 중에 포함된 대상 블록과 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고, 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 현재 화상 프레임을 키 프레임으로 결정하며, 동영상 중의 현재 화상 프레임의 대상 블록을 비교하여 대상 블록 정보를 얻을 수 있으며, 다시 대상 블록 정보에 근거하여 키 프레임을 스크리닝하여, 화면의 경계에 의해 키 프레임을 결정하지 않아도 되므로, 연속적 화면의 동영상으로부터 키 프레임을 추출하지 못함으로 인해 초래되는 동영상을 브라우징하지 못하는 문제를 해결하여, 동영상 재생 효율을 향상시키는 효과를 달성하였다.
이 외에, 동영상 중의 매 하나의 화상 프레임 및 화상 프레임 촬영시의 센서 정보를 획득하여, 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 페기함으로써, 폐기 조건에 부합되는 화상 프레임에 대하여 처리함으로 인해 초래되는 자원의 낭비를 절감하고, 화상 프레임에 대한 처리 효율을 향상시킨다.
상기 실시예의 장치에 관하여 그 중의 각 모듈이 동작을 수행하는 구체적인 방식은 이미 상기 방법과 관련한 실시예에서 상세히 설명하였으므로 여기서 더이상 상세히 설명하지 않는다.
도5는 일 예시적 실시예의 동영상 브라우징에 사용되는 장치(500)의 블록도이다. 예를 들면, 장치(500)는 휴대폰, 컴퓨터, 디지털방송 단말기, 메시지 송수신 기기, 게임 콘솔, 태블릿기기, 의료기기, 휘트니스기기, 개인 휴대 정보 단말기 등일 수 있다.
도5를 참조하면, 장치(500)는 프로세싱 어셈블리(502), 메모리(504), 전원 어셈블리(506), 멀티미디어 어셈블리(508), 오디오 어셈블리(510), 입력/출력(I/O) 인터페이스(512), 센서 어셈블리(514) 및 통신 어셈블리(516)와 같은 하나 또는 다수의 어셈블리를 포함할 수 있다.
프로세싱 어셈블리(502)는 통상적으로 표시, 전화 호출, 데이터 통신, 카메라 동작 및 기록동작과 관련한 장치(500)의 전체 동작을 제어한다. 프로세싱 어셈블리(502)는 상기 방법의 전부 또는 일부 단계를 완성하도록 하나 또는 다수의 프로세서(520)를 포함하여 인스트럭션(instruction)을 실행할 수 있다. 이 외에, 프로세싱 어셈블리(502)는 프로세싱 어셈블리(502)와 기타 어셈블리 사이의 교류가 편리하도록 하나 또는 다수의 모듈을 포함할 수 있다. 예를 들어, 프로세싱 어셈블리(502)는 멀티미디어 어셈블리(508)와 프로세싱 어셈블리(502) 사이의 교류가 편리하도록 멀티미디어 모듈을 포함할 수 있다.
메모리(504)는 장치(500)의 작동을 지지하도록 각종 유형의 데이터를 저장하도록 구성된다. 이러한 데이터의 예시는 장치(500)에서 작동하기 위한 그 어느 하나의 어플리케이션 또는 방법의 인스트럭션, 연계인 데이터, 전화번호부 데이터, 정보, 메시지, 이미지, 동영상 등을 포함한다. 메모리(504)는 스태틱 랜덤 액세스 메모리(SRAM), 전기적 소거 가능한 프로그램 가능 판독전용 메모리(EEPROM), 소거 및 프로그램 가능 판독전용 메모리(EPROM), 프로그램 가능 판독전용 메모리(PROM), 판독 전용 메모리(ROM), 자기 메모리, 플래시 메모리, 디스크 또는 CD와 같은 모든 유형의 휘발성 또는 비휘발성 메모리 기기 또는 그들의 조합으로 이루어질 수 있다.
전원 어셈블리(506)는 장치(500)의 각종 어셈블리에 전력을 제공한다. 전원 어셈블리(506)는 전원관리시스템, 하나 또는 다수의 전원, 장치(500)에 전력을 생성, 관리 및 분배하는 것과 관련되는 기타 어셈블리를 포함할 수 있다.
멀티미디어 어셈블리(508)는 상기 장치(500)와 사용자 사이에 하나의 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 실시예에서 스크린은 액정디스플레이(LCD)와 터치패널(TP)을 포함할 수 있다. 스크린이 터치패널을 포함하면, 스크린은 사용자가 입력한 신호를 수신하도록 터치스크린으로 구현될 수 있다. 터치패널은 터치, 슬라이딩과 터치패널의 손동작을 감지하도록 하나 또는 다수의 터치센서를 포함한다. 상기 터치센서는 터치 또는 슬라이딩 동작의 경계를 감지할 수 있을 뿐만 아니라 상기 터치 또는 슬라이딩 동작과 관련한 지속시간과 압력도 검출할 수 있다. 일부 실시예에서, 멀티미디어 어셈블리(508)는 프론트 카메라 및/또는 리어 카메라를 포함한다. 장치(500)가 작동모드 예를 들어, 촬영모드 또는 동영상 모드일 경우, 프론트 카메라 및/또는 리어 카메라는 외부의 멀티미디어 데이터를 수신할 수 있다. 매 하나의 프론트 카메라와 리어 카메라는 하나의 고정된 광학렌즈 시스템이거나 초점 거리와 광학 줌 능력을 구비할 수 있다.
오디오 어셈블리(510)는 오디오신호를 출력 및/또는 입력한다. 예를 들어, 오디오 어셈블리(510)는 하나의 마이크(MIC)를 포함한 바, 장치(500)가 작동모드, 예를 들어 호출모드, 기록모드 및 음성인식모드일 경우, 마이크는 외부의 오디오신호를 수신한다. 수신된 오디오신호는 진일보로 메모리(504)에 저장되거나 통신 어셈블리(516)를 거쳐 발송될 수 있다. 일부 실시예에서 오디오 어셈블리(510)는 오디오신호를 출력하기 위한 하나의 스피커를 더 포함한다.
I/O인터페이스(512)는 프로세싱 어셈블리(502)와 주변 인터페이스모듈 사이에 인터페이스를 제공하되 상기 주변 인터페이스모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈버튼, 음량버튼, 작동버튼과 잠금버튼을 포함할 수 있지만 이에 한정하지는 않는다.
센서 어셈블리(514)는 하나 또는 다수의 센서를 포함하여 장치(500)에 여러 방면의 상태평가를 제공한다. 예를 들어, 센서 어셈블리(514)는 장치(500)의 온/오프상태, 어셈블리의 상대위치, 예를 들어 상기 어셈블리는 장치(500)의 모니터와 키패드를 검출할 수 있고, 센서 어셈블리(514)는 장치(500) 또는 장치(500)의 한 어셈블리의 위치변화, 사용자와 장치(500)의 접촉여부, 장치(500) 방위 또는 가속/감속과 장치(500)의 온도변화를 검출할 수 있다. 센서 어셈블리(514)는 아무런 물리접촉이 없을 경우 주변 물체의 존재를 검출하도록 구성된 근접센서를 포함할 수 있다. 센서 어셈블리(514)는CMOS 또는 CCD 영상센서와 같은 광 센서를 더 포함하여 영상응용에 사용한다. 일부 실시예에서, 상기 센서 어셈블리(514)는 가속도센서, 자이로센서, 자기센서, 압력센서 또는 온도센서를 더 포함할 수 있다.
통신 어셈블리(516)는 장치(500)와 기타 기기사이의 유선 또는 무선방식의 통신이 편리하도록 구성된다. 장치(500)는 통신표준에 의한 무선 네트워크, 예를 들어 WiFi, 2G 또는 3G 또는 이들의 조합에 액세스(access)할 수 있다. 일 예시적 실시예에서, 통신 어셈블리(516)는 방송신호를 거쳐 외부 방송관리 시스템의 방송신호 또는 방송과 관련한 정보를 수신한다. 일 예시적 실시예에서, 상기 통신 어셈블리(516)는 근거리 통신을 촉진하도록 근거리 자기장 통신(NFC)모듈을 더 포함한다. 예를 들어 무선주파수 인식(RFID)기술, 적외선 통신 규격(InDA)기술, 초광대역(UWB)기술, 블루투스(BT)기술과 기타 기술에 기반하여 구현할 수 있다.
예시적인 실시예에서 장치(500)는 상기 방법을 수행하도록 하나 또는 다수의 응용 주문형 직접회로(ASIC), 디지털신호 프로세서(DSP), 디지털신호 처리기기(DSPD), 프로그램 가능 논리 소자(PLD), 필드 프로그램 가능 게이트 어레이(FPGA), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 기타 전자부품에 의해 실현될 수 있다.
예시적인 실시예에서는 인스트럭션을 포함한 비일시적 컴퓨터 판독 가능한 기록매체, 예를 들어 상기 방법을 완성하도록 장치(500)의 프로세서(520)가 실행하는 인스트럭션을 포함한 메모리(504)를 더 제공한다. 예를 들어, 상기 비일시적 컴퓨터 판독 가능한 기록매체는 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 테이프, 플로피 디스켓과 광 데이터 저장기기 등일 수 있다.
본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들은 명세서를 고려하여 여기서 공개한 발명을 실시한 후 본 발명의 기타 실시형태를 용이하게 생각해낼 수 있다. 본원 발명은 본 발명의 모든 변형, 용도 또는 적응성 변화를 포함하고 이러한 변형, 용도 또는 적응성 변화는 본 발명의 일반적인 원리를 따르며 본 발명이 공개하지 않은 본 기술분야에서의 공지된 상식 또는 통상적인 기술수단을 포함한다. 명세서와 실시예는 예시적인 것일 뿐 본 발명의 진정한 범위와 기술적 사상은 하기의 청구범위에 의해 밝혀질 것이다.
본 발명은 상기에서 설명하고 도면에 도시한 정확한 구조에 한정되는 것이 아니라 그 범위를 벗어나지 않는 한 여러가지 수정과 변경을 할 수 있음을 이해해야 한다. 본 발명의 범위는 첨부되는 청구범위에 의해서만 한정된다.

Claims (13)

  1. 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 상기 현재 화상 프레임 중에 포함된 대상 블록과 상기 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하는 단계;
    상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 단계;
    상기 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 상기 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하는 단계; 및
    결정된 적어도 하나의 키 프레임을 재생하는 단계를 포함하는 동영상 브라우징 방법.
  2. 청구항1에 있어서,
    상기 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻는 단계는,
    상기 이전 화상 프레임 중의 대상 블록과 상기 현재 화상 프레임 중의 대상 블록을 비교하는 단계;
    상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 현재 화상 프레임에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 상기 새로운 대상 블록을 위하여 이미 결정된 키 프레임의 수량에 1을 가한 플래그 비트 정보를 설정하여, 매 하나의 새로운 대상 블록의 대상 블록 정보를 획득하는 단계;
    상기 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 상기 현재 화상 프레임 중에 포함될 경우, 존재하는 매 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정하고, 상기 현재 화상 프레임 중의 상기 이미 존재하는 대상 블록이 상기 이전 화상 프레임 중의 대응되는 대상 블록에 기반한 이동정보를 산출하여, 매 하나의 이미 존재하는 대상 블록의 대상 블록 정보를 획득하는 단계; 및
    상기 현재 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 이전 화상 프레임에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 사라진 대상 블록으로 결정하고, 매 하나의 사라진 대상 블록의 대상 블록 정보를 획득하는 단계를 포함하는 동영상 브라우징 방법.
  3. 제2 항에 있어서,
    상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 상기 단계는,
    상기 현재 화상 프레임의 대상 블록 정보에서 상기 이미 존재하는 대상 블록의 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나를 포함하는 매 하나의 이미 존재하는 대상 블록의 이동 정보를 판독하는 단계;
    이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 지를 검출하는 단계; 및
    상기 이동 조건에 부합되는 이동 정보의 개수가 상기 사전 결정된 임계값보다 큰 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하는 단계를 포함하는 동영상 브라우징 방법.
  4. 제2 항에 있어서,
    상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 상기 단계는,
    상기 현재 화상 프레임의 대상 블록 정보에서 매 하나의 대상 블록의 플래그 비트 정보를 판독하는 단계;
    각 플래그 비트 정보 중에 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출하는 단계;
    상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하는 단계를 포함하는 동영상 브라우징 방법.
  5. 제1 항 내지 제4 항 중의 어느 한 항에 있어서,
    상기 방법은, 상기 동영상 중의 매 하나의 화상 프레임 및 상기 화상 프레임 촬영시의 위성 항법 장치GPS정보, 가속도 정보와 감광도ISO정보 중의 적어도 하나를 포함하는 센서 정보를 획득하는 단계;
    상기 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 폐기하고, 상기 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻도록 트리거하는 단계를 더 포함하는 동영상 브라우징 방법.
  6. 제1 항에 있어서,
    상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 상기 단계는,
    상기 현재 화상 프레임 중에 인물이 포함될 경우, 상기 현재 화상 프레임이 상기 이전 화상 프레임에 비하여 인물 자태 정보에 변화가 발생되었는지의 여부를 검출하고, 상기 현재 화상 프레임 중에서 상기 인물 이외의 대상 블록 정보가 상기 사전 결정된 조건에 부합되는지의 여부를 검출하는 단계;
    상기 인물 자태 정보에 변화가 발생되고 상기 현재 화상 프레임 중에서 상기 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는 것으로 검출될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하는 단계를 포함하는 동영상 브라우징 방법.
  7. 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 상기 현재 화상 프레임 중에 포함된 대상 블록과 상기 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하도록 구성되는 화상 비교 모듈;
    상기 화상 비교 모듈에서 획득한 상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 화상 결정 모듈;
    상기 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 상기 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하도록 구성되는 동작 수행 모듈; 및
    상기 화상 결정 모듈에 의해 결정된 적어도 하나의 키 프레임을 재생하도록 구성되는 화상 재생 모듈을 포함하는 동영상 브라우징 장치.
  8. 제7항에 있어서,
    상기 화상 비교 모듈은,
    상기 이전 화상 프레임 중의 대상 블록과 상기 현재 화상 프레임 중의 대상 블록을 비교하도록 구성되는 대상 비교 서브 모듈;
    상기 대상 비교 서브 모듈에 의해 비교를 거친 결과, 상기 이전 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 현재 화상 프레임에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 새로운 대상 블록으로 결정하고, 상기 새로운 대상 블록을 위하여 이미 결정된 키 프레임의 수량에 1을 가한 플래그 비트 정보를 설정하여, 매 하나의 새로운 대상 블록의 대상 블록 정보를 얻도록 구성되는 제1 결정 서브 모듈;
    상기 대상 비교 서브 모듈에 의해 비교를 거친 결과, 상기 이전 화상 프레임 중에 존재하는 적어도 하나의 대상 블록이 상기 현재 화상 프레임에 포함될 경우, 존재하는 매 하나의 대상 블록을 이미 존재하는 대상 블록으로 결정하고, 상기 현재 화상 프레임 중의 상기 이미 존재하는 대상 블록이 상기 이전 화상 프레임에 대응되는 대상 블록에 기반한 이동 정보 산출하여, 매 하나의 이미 존재하는 대상 블록의 대상 블록 정보를 얻도록 구성되는 제2 결정 서브 모듈; 및
    상기 대상 비교 서브 모듈에 의해 비교를 거친 결과, 상기 현재 화상 프레임 중에 존재하지 않는 적어도 하나의 대상 블록이 상기 이전 화상 프레임에 포함될 경우, 존재하지 않는 매 하나의 대상 블록을 사라진 블록으로 결정하여, 매 하나의 사라진 대상 블록의 대상 블록 정보를 얻도록 구성되는 제3 결정 서브 모듈을 포함하는 동영상 브라우징 장치.
  9. 제8항에 있어서,
    상기 화상 결정 모듈은,
    상기 현재 화상 프레임의 대상 블록 정보에서 매 하나의 이미 존재하는 대상 블록의 이동 횟수, 이동 변위와 이동 영역 중의 적어도 하나를 포함하는 이동 정보를 판독하도록 구성되는 제1 판독 서브 모듈;
    이동 조건에 부합되는 이동 정보의 개수가 사전 결정된 임계값보다 큰 지를 검출하도록 구성되는 제1 검출 서브 모듈; 및
    상기 제1 검출 서브 모듈에 의해 상기 이동 조건에 부합되는 이동 정보의 개수가 상기 사전 결정된 임계값보다 큰 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하도록 구성되는 제4 결정 서브 모듈을 포함하는 동영상 브라우징 장치.
  10. 제8항에 있어서,
    상기 화상 결정 모듈은,
    상기 현재 화상 프레임의 대상 블록 정보에서 매 하나의 대상 블록의 플래그 비트 정보를 판독하도록 구성되는 제2 판독 서브 모듈;
    각 플래그 비트 정보 중에 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하는지의 여부를 검출하도록 구성되는 제2 검출 서브 모듈; 및
    상기 제2 검출 서브 모듈에 의해 상기 사라진 대상 블록의 플래그 비트 정보와 동일한 플래그 비트 정보가 존재하지 않는 것으로 검출될 경우, 상기 현재 화상 프레임을 상기 키 프레임으로 결정하도록 구성되는 제5 결정 서브 모듈을 포함하는 동영상 브라우징 장치.
  11. 제7항 내지 제10항 중의 어느 한 항에 있어서,
    상기 장치는, 상기 동영상 중의 매 하나의 화상 프레임 및 상기 화상 프레임 촬영시의 위성 항법 장치GPS정보, 가속도 정보와 감광도ISO정보 중의 적어도 하나를 포함하는 센서 정보를 획득하도록 구성되는 정보 획득 모듈; 및
    상기 정보 획득 모듈에 의해 획득한 센서 정보에 근거하여 스크리닝 조건에 부합되지 않는 화상 프레임을 폐기하고, 상기 동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 대상 블록 정보를 얻는 동작을 트리거하도록 구성되는 화상 스크리닝 모듈을 더 포함하는 동영상 브라우징 장치.
  12. 제7항에 있어서,
    상기 화상 결정 모듈은,
    상기 현재 화상 프레임 중에 인물이 포함될 경우, 상기 현재 화상 프레임이 상기 이전 화상 프레임에 비하여 인물 자태 정보에 변화가 발생되었는지의 여부를 검출하고, 상기 현재 화상 프레임 중에서 상기 인물 이외의 대상 블록 정보가 상기 사전 결정된 조건에 부합되는지의 여부를 검출하도록 구성되는 제3 검출 서브 모듈; 및
    상기 제3 검출 서브 모듈에 의해 상기 인물 자태 정보에 변화가 발생되고 상기 현재 화상 프레임 중에 상기 인물 이외의 대상 블록 정보가 사전 결정된 조건에 부합되는 것으로 검출될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하도록 구성되는 제6 결정 서브 모듈을 포함하는 동영상 브라우징 장치.
  13. 프로세서;
    프로세서에 의해 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하고;
    상기 프로세서는,
    동영상 중의 현재 화상 프레임과 상기 현재 화상 프레임의 이전 화상 프레임을 비교하여, 상기 현재 화상 프레임 중에 포함된 대상 블록과 상기 이전 화상 프레임 중에 포함된 대상 블록을 비교하여 얻는 정보인 대상 블록 정보를 획득하고;
    상기 대상 블록 정보가 사전 결정된 조건에 부합될 경우, 상기 현재 화상 프레임을 키 프레임으로 결정하며;
    상기 현재 화상 프레임의 다음 화상 프레임을 현재 화상 프레임으로 결정하고, 상기 동영상 중의 현재 화상 프레임과 이전 화상 프레임을 비교하여 대상 블록 정보를 얻는 상기 단계를, 상기 동영상 중의 마지막 하나의 화상 프레임이 비교 완료될 때까지 계속하여 수행하고;
    결정된 적어도 하나의 키 프레임을 재생하도록 구성되는 동영상 브라우징 장치.
KR1020157007200A 2014-09-17 2015-01-21 동영상 브라우징 방법, 장치, 프로그램 및 기록매체 KR101677607B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410475165.4 2014-09-17
CN201410475165.4A CN104284240B (zh) 2014-09-17 2014-09-17 视频浏览方法及装置
PCT/CN2015/071247 WO2016041311A1 (zh) 2014-09-17 2015-01-21 视频浏览方法及装置

Publications (2)

Publication Number Publication Date
KR20160043523A true KR20160043523A (ko) 2016-04-21
KR101677607B1 KR101677607B1 (ko) 2016-11-29

Family

ID=52258644

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157007200A KR101677607B1 (ko) 2014-09-17 2015-01-21 동영상 브라우징 방법, 장치, 프로그램 및 기록매체

Country Status (8)

Country Link
EP (1) EP2998960B1 (ko)
JP (1) JP6211715B2 (ko)
KR (1) KR101677607B1 (ko)
CN (1) CN104284240B (ko)
BR (1) BR112015006631A2 (ko)
MX (1) MX361664B (ko)
RU (1) RU2015111193A (ko)
WO (1) WO2016041311A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284240B (zh) * 2014-09-17 2018-02-02 小米科技有限责任公司 视频浏览方法及装置
US9799376B2 (en) 2014-09-17 2017-10-24 Xiaomi Inc. Method and device for video browsing based on keyframe
CN105426515B (zh) 2015-12-01 2018-12-18 小米科技有限责任公司 视频归类方法及装置
CN105516675B (zh) * 2015-12-28 2018-11-16 同方威视技术股份有限公司 图像显示方法及用于图像显示的系统
KR102374747B1 (ko) 2017-12-15 2022-03-15 삼성전자주식회사 객체를 인식하는 장치 및 방법
CN108563651B (zh) * 2017-12-19 2021-05-11 深圳云天励飞技术有限公司 一种多视频的目标搜索方法、装置及设备
CN109993025B (zh) * 2017-12-29 2021-07-06 中移(杭州)信息技术有限公司 一种关键帧提取方法及设备
CN108470077B (zh) * 2018-05-28 2023-07-28 广东工业大学 一种视频关键帧提取方法、系统及设备和存储介质
CN113516006A (zh) * 2021-04-01 2021-10-19 广州云硕科技发展有限公司 一种用于智能机器人的高效信息处理方法及系统
CN113507571B (zh) * 2021-06-30 2023-10-24 深圳市路卓科技有限公司 视频防剪辑方法、装置、设备、可读存储介质
CN113965814B (zh) * 2021-08-30 2023-07-04 国网山东省电力公司信息通信公司 基于视频会议场景的多会场关键帧提取方法及系统
CN115474084B (zh) * 2022-08-10 2023-10-31 北京奇艺世纪科技有限公司 一种视频封面图像的生成方法、装置、设备和存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055025A (en) * 1993-12-21 2000-04-25 Lucent Technologies, Inc. Method and apparatus for detecting abrupt and gradual scene changes in image sequences
JP2914170B2 (ja) * 1994-04-18 1999-06-28 松下電器産業株式会社 映像変化点検出方法
JP3528524B2 (ja) * 1997-07-10 2004-05-17 ソニー株式会社 記録再生装置および記録再生方法、並びに記録媒体
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
US7280753B2 (en) * 2003-09-03 2007-10-09 Canon Kabushiki Kaisha Display apparatus, image processing apparatus, and image processing system
JP2005159781A (ja) * 2003-11-27 2005-06-16 Seiko Epson Corp 画像選択処理装置、画像選択方法およびそのプログラム、記録媒体
US7843512B2 (en) * 2004-03-31 2010-11-30 Honeywell International Inc. Identifying key video frames
US20070237225A1 (en) * 2006-03-30 2007-10-11 Eastman Kodak Company Method for enabling preview of video files
KR20090028788A (ko) * 2006-06-29 2009-03-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 키 프레임 추출 방법 및 시스템
CN101184226A (zh) * 2006-11-14 2008-05-21 腾讯科技(深圳)有限公司 一种插入视频关键帧的方法及装置
JP4433027B2 (ja) * 2007-09-21 2010-03-17 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
CN101360184B (zh) * 2008-09-22 2010-07-28 腾讯科技(深圳)有限公司 提取视频关键帧的系统及方法
CN101398855B (zh) * 2008-10-24 2010-08-11 清华大学 一种视频关键帧提取方法和系统
JP5630541B2 (ja) * 2009-01-20 2014-11-26 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP5393237B2 (ja) * 2009-04-24 2014-01-22 キヤノン株式会社 画像表示装置及びその制御方法、並びにプログラム及び記憶媒体
WO2011099299A1 (ja) * 2010-02-10 2011-08-18 パナソニック株式会社 映像抽出装置、撮影装置、プログラム及び記録媒体
JP5537285B2 (ja) * 2010-06-28 2014-07-02 日本放送協会 要約映像生成装置及び要約映像生成プログラム
CN102348115B (zh) * 2010-08-02 2014-04-16 南京壹进制信息技术有限公司 一种去除视频中冗余图像的方法和装置
CN109522280B (zh) * 2012-09-16 2022-04-19 哈尔滨华强电力自动化工程有限公司 一种图像文件格式及生成方法及装置及应用
CN103345492A (zh) * 2013-06-25 2013-10-09 无锡赛思汇智科技有限公司 一种视频浓缩的方法和系统
CN103533237B (zh) * 2013-09-29 2016-08-17 清华大学 一种从视频中提取视频关键帧的方法
CN104284240B (zh) * 2014-09-17 2018-02-02 小米科技有限责任公司 视频浏览方法及装置

Also Published As

Publication number Publication date
MX361664B (es) 2018-12-13
KR101677607B1 (ko) 2016-11-29
BR112015006631A2 (pt) 2017-07-04
JP2016541214A (ja) 2016-12-28
CN104284240A (zh) 2015-01-14
EP2998960B1 (en) 2020-06-17
JP6211715B2 (ja) 2017-10-11
MX2015003761A (es) 2016-08-01
RU2015111193A (ru) 2016-10-20
CN104284240B (zh) 2018-02-02
EP2998960A1 (en) 2016-03-23
WO2016041311A1 (zh) 2016-03-24

Similar Documents

Publication Publication Date Title
KR101677607B1 (ko) 동영상 브라우징 방법, 장치, 프로그램 및 기록매체
US9674395B2 (en) Methods and apparatuses for generating photograph
US20170032219A1 (en) Methods and devices for picture processing
TWI702544B (zh) 圖像處理方法、電子設備和電腦可讀儲存介質
US10115019B2 (en) Video categorization method and apparatus, and storage medium
US10212386B2 (en) Method, device, terminal device, and storage medium for video effect processing
US9799376B2 (en) Method and device for video browsing based on keyframe
US20170154206A1 (en) Image processing method and apparatus
TW202036472A (zh) 圖像處理方法及裝置、電子設備和儲存介質
WO2020259073A1 (zh) 图像处理方法及装置、电子设备和存储介质
CN105791958A (zh) 游戏直播方法及装置
CN107784279B (zh) 目标跟踪方法及装置
CN109951476B (zh) 基于时序的攻击预测方法、装置及存储介质
WO2023000639A1 (zh) 视频生成方法、装置、电子设备、存储介质和程序
KR102545408B1 (ko) 차폐된 이미지 검출 방법, 장치 및 매체
US20170054906A1 (en) Method and device for generating a panorama
CN106210495A (zh) 图像拍摄方法和装置
US11551465B2 (en) Method and apparatus for detecting finger occlusion image, and storage medium
CN110798726A (zh) 弹幕显示方法、装置、电子设备及存储介质
CN111553372A (zh) 一种训练图像识别网络、图像识别搜索的方法及相关装置
CN111523346A (zh) 图像识别方法及装置、电子设备和存储介质
CN110781842A (zh) 图像处理方法及装置、电子设备和存储介质
WO2022099988A1 (zh) 目标跟踪方法及装置、电子设备和存储介质
CN107122697A (zh) 照片的自动获取方法及装置、电子设备
CN114549327A (zh) 视频超分辨率方法、装置、电子设备、存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant