KR101798011B1 - 동영상 재생 방법 및 장치 - Google Patents

동영상 재생 방법 및 장치 Download PDF

Info

Publication number
KR101798011B1
KR101798011B1 KR1020167021969A KR20167021969A KR101798011B1 KR 101798011 B1 KR101798011 B1 KR 101798011B1 KR 1020167021969 A KR1020167021969 A KR 1020167021969A KR 20167021969 A KR20167021969 A KR 20167021969A KR 101798011 B1 KR101798011 B1 KR 101798011B1
Authority
KR
South Korea
Prior art keywords
target
moving image
keyword
monitoring
target object
Prior art date
Application number
KR1020167021969A
Other languages
English (en)
Inventor
타오 장
지준 첸
페이 롱
Original Assignee
시아오미 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시아오미 아이엔씨. filed Critical 시아오미 아이엔씨.
Application granted granted Critical
Publication of KR101798011B1 publication Critical patent/KR101798011B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/232Content retrieval operation locally within server, e.g. reading video streams from disk arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/278Content descriptor database or directory service for end-user access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은 동영상 재생 방법 및 장치에 관한 것이고, 인터넷 기술 분야에 속한다. 상기 동영상 재생 방법은, 타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계; 상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및 상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함한다.

Description

동영상 재생 방법 및 장치{VIDEO PLAYING METHOD AND DEVICE}
본원 발명은 출원번호가 201510713118.3이고 출원일자가 2015년 10월 28일인 중국 특허 출원에 기반하여 제출하였고 상기 중국 특허 출원의 우선권을 주장하는 바, 상기 중국 특허 출원의 모든 내용은 본원 발명에 원용된다.
본 발명은 인터넷 기술 분야에 관한 것으로서, 특히는 동영상 재생 방법 및 장치에 관한 것이다.
웹캠의 대중화에 따라, 웹캠을 이용한 실시간 모니터링이 유행하고 있다. 웹캠을 이용한 실시간 모니터링을 통해 획득한 모니터링 동영상은 시간적인 연속성을 구비하기 때문에, 사용자가 모니터링 동영상에서 특정 대상의 행동을 확인하려고 할때, 예를 들어 모니터링 동영상에서 아기의 행동을 확인하고자 하면, 사용자는 흔히 모니터링 동영상의 재생 과정에서 모니터링 동영상의 재생 속도를 수동으로 조절하여 모니터링 동영상에서 특정 대상이 위치한 동영상 화면으로 앞으로 감기 또는 되감기를 함으로써 특정 대상의 행동을 확인한다. 사용자가 모니터링 동영상의 재생 진도에 대하여 수동으로 조절하는 동작이 상대적으로 번거로우며 동영상의 재생 효율을 감소시킨다. 따라서, 동영상 재생에 사용되는 동영상 재생 효율을 개선하는 방법이 시급히 필요하다.
관련 기술에 따른 문제를 해결하고자, 본 발명에서는 동영상 재생 방법 및 장치를 제공한다.
본 발명의 실시예의 제1양태에 근거하여,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송(carrying)하는 재생 요청을 수신하는 단계;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함하는 동영상 재생 방법을 제공한다.
제1 양태를 결부시켜, 상기 제1 양태의 제1 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;
상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하는 단계; 및
상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계를 포함한다.
제1 양태를 결부시켜, 상기 제1 양태의 제2 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함한다.
제1 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제3 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및
상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.
제1 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제4 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.
상기 제1 양태의 제2 가능한 구현 형태 내지 제1 양태의 제4 가능한 구현 형태 중의 임의의 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제5 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,
모니터링 동영상을 획득하는 단계;
상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;
상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및
상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계를 더 포함한다.
상기 제1 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제6 가능한 구현 형태에 있어서, 상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,
상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;
상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및
상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함한다.
상기 제1 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제7 가능한 구현 형태에 있어서, 상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,
상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및
상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함한다.
상기 제1 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제8 가능한 구현 형태에 있어서, 상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,
상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함한다.
본 발명의 실시예의 제2 양태에 근거하여,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈; 및
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하기 위한 재생 모듈을 포함하는 동영상 재생 장치를 제공한다.
제2 양태를 결부시켜, 상기 제2 양태의 제1 가능한 구현 형태에 있어서, 상기 결정 모듈은,
상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하기 위한 제1 결정 유닛;
상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하기 위한 제2 결정 유닛; 및
상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 제3 결정 유닛을 포함한다.
제2 양태를 결부시켜, 상기 제2 양태의 제2 가능한 구현 형태에 있어서, 상기 결정 모듈은,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛을 포함한다.
상기 제2 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제3 가능한 구현 형태에 있어서, 상기 제1 획득 유닛은,
상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제1 획득 서브 유닛; 및
상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제2 획득 서브 유닛을 포함한다.
상기 제2 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제4 가능한 구현 형태에 있어서, 상기 제1 획득 유닛은,
상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제3 획득 서브 유닛을 포함한다.
상기 제2 양태의 제2 가능한 구현 형태 내지 제2 양태의 제4 가능한 구현 형태 중의 임의의 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제5 가능한 구현 형태에 있어서, 상기 결정 모듈은,
모니터링 동영상을 획득하기 위한 제2 획득 유닛;
상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하기 위한 제4 결정 유닛;
상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하기 위한 제5 결정 유닛; 및
상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하기 위한 생성 유닛을 더 포함한다.
제2 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제6 가능한 구현 형태에 있어서, 상기 제5 결정 유닛은,
상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대하여 안면 인식을 진행하여 안면 특징을 얻기 위한 인식 서브 유닛;
상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하기 위한 제4 획득 서브 유닛; 및
상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하기 위한 제1 결정 서브 유닛을 포함한다.
제2 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제7 가능한 구현 형태에 있어서, 상기 생성 유닛은,
상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하기 위한 제2 결정 서브 유닛; 및
상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하기 위한 제1 저장 서브 유닛을 포함한다.
제2 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제8 가능한 구현 형태에 있어서, 상기 생성 유닛은,
상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하기 위한 제2 저장 서브 유닛을 포함한다.
본 발명의 실시예의 제3 양태에 근거하여,
프로세서; 및
상기 프로세서가 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하되,
여기서, 상기 프로세서는,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하고;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며;
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 구성되는 동영상 재생 장치를 제공한다.
본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 포함하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.
상기의 일반적인 설명과 후술되는 구체적인 설명은 단지 예시적이고 해석적인 것이며 본 발명을 한정하는 것이 아님을 이해해야 한다.
아래의 도면은 명세서 전체를 구성하는 명세서의 일부분으로서 본 발명에 부합하는 실시예를 예시하여 본 발명의 원리를 설명하기 위한 것이다.
도1은 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법에 관한 실시 환경의 모식도이다.
도2는 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법의 흐름도이다.
도3은 일 예시적 실시예에 근거하여 도시한 다른 동영상 재생 방법의 흐름도이다.
도4는 일 예시적 실시예에 근거하여 도시한 동영상 재생 장치의 블록도이다.
도5는 일 예시적 실시예에 근거하여 도시한 결정 모듈의 블록도이다.
도6은 일 예시적 실시예에 근거하여 도시한 다른 결정 모듈의 블록도이다.
도7은 일 예시적 실시예에 근거하여 도시한 제1 획득 유닛의 블록도이다.
도8은 일 예시적 실시예에 근거하여 도시한 또 다른 결정 모듈의 블록도이다.
도9는 일 예시적 실시예에 근거하여 도시한 제5 결정 유닛의 블록도이다.
도10은 일 예시적 실시예에 근거하여 도시한 생성 유닛의 블록도이다.
도11은 일 예시적 실시예에 근거하여 도시한 다른 동영상 재생 장치의 블록도이다.
여기서, 예시적 실시예에 대하여 상세하게 설명하고, 이를 첨부되는 도면에 예시적으로 나타냈다. 하기에서 첨부되는 도면에 대하여 설명할 때, 별도로 표시하지 않는 한, 다른 도면의 동일한 숫자는 동일하거나 유사한 구성요소를 나타낸다. 하기의 예시적 실시예에서 설명한 실시형태는 본 발명과 일치한 모든 실시형태를 의미하는 것은 아니다. 반대로, 이들은 첨부된 특허청구범위에서 설명한, 본 발명의 일부 양태와 일치한 장치와 방법에 대한 예일 뿐이다.
도1은 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법에 관한 실시 환경의 모식도이다. 도1에 도시된 바와 같이, 상기 실시 환경은 한 대의 서버 또는 복수 대의 서버에 의해 구성되는 서버 클러스터, 또는 하나의 클라우드 컴퓨팅 서비스 센터일 수 있는 서버(101), 스마트 비디오 카메라일 수 있는 스마트 촬영기기(102)와 휴대폰, 컴퓨터, 태블릿기기 등일 수 있는 단말기(103)를 포함할 수 있다. 서버(101)와 스마트 촬영기기(102)는 네트워크로 연결될 수 있고, 서버(101)와 단말기(103) 또한 네트워크로 연결될 수 있다. 서버(101)는 단말기(103)가 송신한 재생 요청을 수신하기 위한 것이고, 상기 재생 요청에 기반하여 대응되는 동영상을 획득하며, 또한 상기 동영상을 단말기(103)에 송신한다. 스마트 촬영기기(102)는 모니터링 영역 내의 모니터링 동영상을 수집하기 위한 것이고, 또한 모니터링 동영상을 서버(101)에 송신한다. 단말기(103)는 서버(101)가 송신한 동영상을 수신하기 위한 것이고, 또한 상기 동영상을 재생한다.
도2는 일 예시적 실시예에 근거하여 도시한 서버에 사용되는 동영상 재생 방법의 흐름도이고, 도2에 도시된 바와 같이, 하기 단계를 포함한다.
단계201에서, 타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송(carrying)하는 재생 요청을 수신한다.
단계202에서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정한다.
단계203에서, 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 단말기에 송신하여 단말기가 상기 동영상 세그먼트를 재생하도록 한다.
본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 반송하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;
타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하는 단계; 및
타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계를 포함한다.
여기서, 서버는 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하고, 또한 상기 타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하며, 서버가 상기 타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 빠르게 결정하게 할 수 있다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함한다.
단말기가 재생 요청을 송신하는 것은 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 획득하기 위한 것이고, 동영상 세그먼트는 적어도 1 프레임의 동영상 이미지로 구성될 수 있으며, 따라서, 서버는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 빠르게 획득할 수 있어 동영상의 획득 효율을 향상시킨다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및
적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.
모니터링 동영상에 상기 모니터링 동영상에 포함된 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버는 타깃 키워드에 대응되는 적어도 하나의 모니터링 시점을 결정하고, 또한 모니터링 동영상 중에서 상기 적어도 하나의 모니터링 시점에 대응되는 적어도 1 프레임의 동영상 이미지를 획득할 수 있어 동영상 이미지의 획득 정확도를 향상시킨다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 동영상 이미지 사이의 대응관계에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.
여기서, 서버는 타깃 키워드에 기반하여 타깃 대상에 대응되는 적어도 1프레임의 동영상 이미지를 바로 획득하여 동영상 이미지의 획득 효율을 향상시킨다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,
모니터링 동영상을 획득하는 단계;
모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;
대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및
키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계를 더 포함한다.
여기서, 서버는 타깃 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하고, 서버가 재생 요청을 수신할 때, 상기 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 빠르게 획득하게 할 수 있어, 동영상 이미지의 획득 효율을 향상시킨다.
본 발명의 다른 실시예에 있어서, 대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,
대상 카테고리가 사람일 경우, 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;
안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및
신원 식별자를 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함한다.
여기서, 대상 카테고리가 사람일 경우, 서버는 대상의 신원 식별자를 상기 대상이 속하는 타깃 키워드로 결정하여 단말기가 특정 신원을 구비한 사람이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하도록 할 수 있고, 지정된 한 사람의 동영상 세그먼트를 대응되게 획득할 수 있다.
본 발명의 다른 실시예에 있어서, 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계는,
모니터링 동영상 중에서 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및
키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함한다.
모니터링 동영상 중에 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버는 키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하여 서버가 키워드에 기반하여 대응되는 모니터링 시점을 획득하고, 모니터링 동영상에서 상기 모니터링 시점에 대응되는 동영상 이미지를 획득할 수 있어 동영상 이미지의 획득 정확도를 향상시킨다.
본 발명의 다른 실시예에 있어서, 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계는,
키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함한다.
여기서, 서버는 키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하여 서버가 키워드에 근거하여 대응되는 동영상 이미지를 바로 획득할 수 있어, 동영상 이미지의 획득 효율을 향상시킨다.
상기 모든 선택적인 기술적 해결방안은 모두 임의의 결합 형태로 본 발명의 선택적인 실시예를 구성할 수 있으며, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.
도3은 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법의 흐름도이고, 도3에 도시된 바와 같이, 상기 방법은 하기 단계를 포함한다.
단계301에서, 서버는 타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신한다.
설명이 필요한 점은, 상기 재생 요청은 단말기에 의해 바로 송신될 수 있고, 물론, 상기 재생 요청은 또한 단말기에 의해 우선 기타 기기에 송신되고, 다시 기타 기기에서 서버에 송신될 수도 있으며, 본 발명의 실시예에서는 이에 대하여 한정하는 것이 아니라는 점이다.
이외에, 단말기가 재생 요청을 송신할 경우, 상기 단말기는 재생 인스트럭션을 수신하였을 때 서버 또는 기타 기기에 재생 요청을 송신할 수 있다.
설명이 필요한 점은, 재생 인스트럭션은 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 획득하기 위한 것이고, 또한 재생 인스트럭션은 클릭 동작, 슬라이드 동작, 음성 동작 등등일 수 있는 사용자에 의한 지정 동작에 의해 트리거될 수 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.
이외에, 타깃 이미지는 타깃 대상을 포함하는 이미지이고, 또한 상기 타깃 이미지는 타깃 대상의 사진일 수 있으며, 또는 단말기가 모니터링 동영상을 재생하는 과정에서, 모니터링 동영상의 동영상 이미지에 기반하여 선택 인스트럭션을 수신하였을 때, 해당 선택 인스트럭션에 타깃 대상의 이미지가 반송되어 얻어질 수 있으며, 물론, 타깃 이미지는 또한 기타 형태로 얻을 수도 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.
또한, 타깃 키워드는 타깃 대상과 유일하게 대응되고, 또한 타깃 키워드는 타깃 대상이 속하는 카테고리, 타깃 대상의 신원 식별자 등등일 수 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.
단계302에서, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정한다.
타깃 대상 정보에 타깃 대상이 위치한 이미지 또는 타깃 대상이 속하는 타깃 키워드가 포함되므로, 타깃 대상 정보에 포함된 상이한 내용에 근거하여 서버가 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 형태는 하기 두 가지 형태일 수 있다.
제1 형태: 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하고, 또한 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 상기 모니터링 동영상에 위치한 세그먼트를 구성한다.
단말기가 재생 요청을 송신하는 것은 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지로 구성된 동영상 세그먼트를 획득하기 위한 것이므로, 서버는 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하고, 또한 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성할 수 있다.
설명이 필요한 점은, 타깃 대상 정보가 타깃 키워드를 포함할 경우, 타깃 대상 정보에 대응되는 타깃 키워드는 상기 타깃 대상 정보에 포함된 타깃 키워드일 수 있고, 타깃 대상 정보에 타깃 이미지가 포함될 경우, 타깃 대상 정보에 대응되는 타깃 키워드는 상기 타깃 이미지를 통해 얻을 수 있다는 점이다.
여기서, 서버가 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득할 때, 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 서버는 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하고, 또한 상기 적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득한다. 또는, 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 서버는 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계에서 적어도 1프레임의 동영상 이미지를 획득한다.
모니터링 동영상에 상기 모니터링 동영상에 포함된 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버는 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계에서 상기 타깃 키워드에 대응되는 적어도 하나의 모니터링 시점을 획득한 후, 서버는 상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상에서 상기 적어도 하나의 모니터링 시점에 대응되는 적어도 1프레임의 동영상 이미지를 획득할 수 있다.
여기서, 서버가 상기 적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.
예를 들어, 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 키워드가 '양러러'일 경우, 서버는 타깃 키워드 '양러러'에 기반하여 하기 표1에 도시된 키워드와 모니터링 시점 사이의 대응관계에서 '양러러'에 대응되는 적어도 하나의 모니터링 시점인 2015/02/03-21:08:31, 2015/03/05-11:08:11, 2015/08/03-09:05:31을 획득하고, 이후, 서버는 모니터링 동영상에서 2015/02/03-21:08:31, 2015/03/05-11:08:11, 2015/08/03-09:05:31에 각각 대응되는 동영상 이미지를 획득할 수 있다.
키워드 모니터링 시점
양러러 2015/02/03-21:08:31, 2015/03/05-11:08:11, 2015/08/03-09:05:31
궈제 2015/05/13-21:10:02, 2015/05/25-21:03:06, 2015/08/11-19:18:26
설명이 필요한 점은, 본 발명의 실시예에 있어서, 단지 상기 표1에 도시된 키워드와 모니터링 시점 사이의 대응관계를 예로 들어 설명하였는 바, 상기 표1은 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.
또 예를 들어, 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 키워드가 '양러러'일 경우, 서버는 타깃 키워드 '양러러'에 기반하여, 하기 표2에 도시된 키워드와 동영상 이미지 사이의 대응관계에서 '양러러'에 대응되는 적어도 1프레임의 동영상 이미지인 1. JPEG, 2, JPEG, 3. JPEG를 획득할 수 있다.
키워드 동영상 이미지
양러러 1. JPEG, 2, JPEG, 3. JPEG
궈제 1. JPEG, 2, JPEG, 3. JPEG
설명이 필요한 점은, 본 발명의 실시예에 있어서, 단지 상기 표2에 도시된 키워드와 동영상 이미지 사이의 대응관계를 예로 들어 설명하였는 바, 상기 표2는 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.
여기서, 서버가 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.
또한, 서버는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 이전에, 또한 하기 단계(1)-단계(4)를 통해 인덱스 라이브러리를 생성할 수도 있다.
단계(1) 에 있어서, 서버는 모니터링 동영상을 획득한다.
설명이 필요한 점은, 서버는 스마트 촬영기기에서 상기 모니터링 동영상을 획득할 수 있고, 물론, 서버로 하여금 기타 기기에서 상기 모니터링 동영상을 획득할 수 있게 상기 스마트 영상기기는 또한 상기 모니터링 동영상을 기타 기기에 송신할 수도 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.
여기서, 스마트 영상기기는 모니터링 영역 내의 모니터링 동영상을 수집하기 위한 것이고, 또한 스마트 영상기기가 모니터링 영역 내의 모니터링 동영상을 수집하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.
이외에, 스마트 촬영기기는 유선 네트워크 또는 무선 네트워크를 통해 서버 또는 기타 기기와의 통신을 진행할 수 있고, 스마트 영상기기가 무선 네트워크를 통해 서버 또는 기타 기기와의 통신을 진행할 때, 스마트 영상기기는 내장된 무선 WIFI(영문: WIreless-FIdelity, 약칭: WIFI), 블루투스 또는 기타 무선 통신 칩을 통해 서버 또는 기타 기기와의 통신을 진행하고, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.
단계(2)에 있어서, 상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 서버는 지정된 분류 모형에 근거하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정한다.
설명이 필요한 점은, 지정된 분류 모형은 이미지에 대응되는 대상 카테고리를 결정하기 위한 것이고, 또한 지정된 분류 모형은 기설정될 수 있다는 점이다.
지정된 분류 모형은 기설정될 수 있고, 또한 대상 카테고리에 대한 결정 효율을 향상시키기 위해, 상기 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하도록, 지정된 분류 모형은 일반적으로 기설정된 사이즈의 이미지에 대하여 처리할 수 있으며, 따라서, 서버가 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정할 때, 서버는 모니터링 동영상의 동영상 이미지에서 상기 대상이 위치한 영역에 대한 커팅을 통해 대상 이미지를 얻고, 또한 대상 이미지의 사이즈를 기설정된 사이즈로 처리하며, 이후, 지정된 분류 모형과 처리를 진행한 후의 대상 이미지에 기반하여 상기 대상이 속하는 대상 카테고리를 결정한다.
여기서, 서버가 모니터링 동영상의 동영상 이미지에서 상기 대상이 위치한 영역에 대한 커팅을 통해 대상 이미지를 얻을 때, 상기 대상이 위치한 동영상 이미지에서 상기 대상의 외접 사각형을 캡쳐할 수 있고, 또한 상기 외접 사각형을 상기 대상이 모니터링 동영상에 위치한 동영상 영역 즉 대상 이미지로 결정한다. 물론, 서버는 또한 기타 형태로 상기 대상이 위치한 영역에 대한 커팅을 통해 대상 이미지를 얻을 수도 있고, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.
이외에, 예를 들어 기설정된 사이즈가 224*224 화소, 300*300 화소 등등과 같이 기설정된 사이즈는 사전 설정될 수 있고, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.
설명이 필요한 점은, 서버가 지정된 분류 모형과 처리를 진행한 후의 대상 이미지에 기반하여 상기 대상이 속하는 대상 카테고리를 결정하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다는 점이다.
단계(3)에 있어서, 서버는 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정한다.
상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리는 사람일 수 있고, 애완 동물일 수도 있으며, 또한 기타 물체일 수도 있고, 상기 이미지 동영상에 포함된 대상이 속하는 대상 카테고리가 사람 또는 애완 동물일 경우, 단말기는 특정 신원을 구비한 사람 또는 애완 동물이 모니터링 동영상에 위치한 동영상 세그먼트를 획득할 필요가 있고, 따라서, 서버가 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드의 동작을 결정하는 조작은, 동영상 이미지에 포함된 대상이 속하는 카테고리가 사람일 경우, 서버가 상기 대상에 대한 안면 인식을 통해 안면 특징을 얻고, 이후, 상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하고, 또한 상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 것일 수 있다. 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 애완 동물일 경우, 서버는 상기 동영상 이미지에 기반하여 애완 동물 식별자를 획득하고, 또한 상기 애완 동물 식별자에 기반하여 저장된 애완 동물 식별자와 신원 식별자의 대응관계에서 대응되는 신원 식별자를 획득하며, 또한 상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정한다. 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 사람이 아니고, 또한 애완 동물도 아닐 경우, 서버는 상기 대상 카테고리를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 바로 결정할 수 있다.
설명이 필요한 점은, 서버가 상기 대상에 대한 안면 인식을 통해 안면 특징을 얻는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세하게 설명하지 않기로 한다는 점이다.
더 설명이 필요한 점은, 애완 동물 식별자는 상기 애완 동물에 사용하기 위한 유일한 식별자이고, 또한 상기 애완 동물 식별자는 상기 애완 동물 상에 설정된 이차원 코드, 바코드 또는 기타 인식 가능한 마크를 통해 얻을 수 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.
예를 들어, 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 사람일 경우, 서버가 상기 대상에 대한 안면 인식을 통해 얻은 안면 특징이 A이고, 이후, 상기 안면 특징 A에 기반하여 도3에 도시된 안면 특징과 신원 식별자 사이의 대응관계에서 A에 대응되는 신원 식별자인 '양러러'를 획득하며, 서버는 '양러러'를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정할 수 있다.
안면 특징 신원 식별자
A 양러러
B 궈제
설명이 필요한 점은, 본 발명의 실시에에 있어서, 단지 상기 도3에 도시된 안면 특징과 신원 식별자 사이의 대응관계를 예로 들어 설명한 것이고, 상기 도3은 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.
또 예를 들어, 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 애완 동물일 경우, 서버가 상기 동영상 이미지에 기반하여 상기 애완 동물 상에 설정된 이차원 코드, 바코드 또는 기타 인식 가능한 마크에 대한 스캔을 통해 획득한 애완 동물의 식별자가 ID1이고, 이후, 상기 애완 동물 식별자 ID1에 기반하여 하기 도4에 도시된 애완 동물과 신원 식별자 사이의 대응관계에서 ID1에 대응되는 신원 식별자인 '더우더우'를 획득하며, 서버는 상기 '더우더우'를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정할 수 있다.
애완 동물 식별자 신원 식별자
ID1 더우더우
ID2 환환
설명이 필요한 점은, 본 발명의 실시예에 있어서, 단지 상기 표4에 도시된 애완 동물 식별자와 신원 식별자 사이의 대응관계를 예로 들어 설명한 것이고, 상기 표4는 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.
또한, 서버가 상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계에서 대응되는 신원 특징을 획득하기 이전에, 서버는 단말기가 송신한 상기 대상의 신원 식별자 및 상기 대상의 안면 이미지를 반송하는 제1 설정 정보를 수신할 수 있고, 서버는 상기 안면 이미지에 대한 특징 추출을 통해 상기 대상의 안면 특징을 얻으며, 또한 상기 안면 특징과 상기 신원 식별자를 안면 특징과 신원 식별자 사이의 대응관계에 저장한다.
예를 들어, 단말기가 송신한 제1 설정 정보에 신원 식별자와 안면 이미지를 반송하고, 또한 상기 신원 식별자가 '양러러'일 경우, 서버는 상기 안면 이미지에 대한 특징 추출을 통해 안면 특징 A를 얻으며, 서버는 A와 '양러러'를 도3에 도시된 안면 특징과 신원 식별자 사이의 대응관계에 저장한다.
또한, 서버가 상기 애완 동물 식별자에 기반하여 저장된 애완 동물 식별자와 신원 식별자 사이의 대응관계에서 대응되는 신원 식별자를 획득하기 이전에, 서버는 단말기가 송신한 상기 대상의 신원 식별자 및 상기 대상의 애완 동물 식별자를 반송하는 제2 설정 정보를 수신할 수 있고, 서버는 상기 애완 동물 식별자와 상기 신원 식별자를 애완 동물 식별자와 신원 식별자 사이의 대응관계에 저장한다.
예를 들어, 단말기가 송신한 제2 설정 정보에 신원 식별자와 애완 동물 식별자를 반송하고, 또한 상기 신원 식별자가 '더우더우'이며, 애완 동물 식별자가 ID1일 경우, 서버는 ID1과 '더우더우'를 도4에 도시된 애완 동물 식별자와 신원 식별자 사이의 대응관계에 저장된다.
단계(4)에 있어서, 서버는 상기 키워드와 상기 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성한다.
인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계를 저장할 수 있을 뿐만 아니라, 또한 키워드와 동영상 이미지 사이의 대응관계를 저장할 수도 있으며, 따라서, 서버가 상기 키워드와 상기 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 조작은, 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 서버는 상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하고, 또한 상기 키워드와 상기 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장한다. 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 서버는 상기 키워드와 상기 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장한다.
모니터링 동영상에 상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버가 지정 대상이 존재하는 동영상 이미지를 결정하였을 때, 상기 동영상 이미지에 기반하여 상기 동영상 이미지에 속하는 모니터링 동영상에서 상기 동영상 이미지에 대응되는 모니터링 시점을 획득할 수 있으며, 이후, 서버는 상기 대상이 속하는 키워드와 상기 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장할 수 있다.
예를 들어, 상기 대상이 속하는 키워드가 '양러러'일 경우, 서버는 상기 모니터링 동영상에서 '양러러'가 존재하는 동영상 이미지가 속하는 모니터링 시점인 2015/08/03-09:05:31을 결정하고, 서버는 '양러러'와 2015/08/03-09:05:31을 도1에 도시된 키워드와 모니터링 시점 사이의 대응관계에 저장할 수 있다.
또 예를 들어, 상기 대상이 속하는 키워드가 '양러러'일 경우, 상기 모니터링 동영상에 존재하는 '양러러'의 동영상 이미지는 3. JPEG이고, 서버는 '양러러'와 3. JPEG를 도2에 도시된 키워드와 동영상 이미지 사이의 대응관계에 저장할 수 있다.
제2 형태: 타깃 대상 정보에 타깃 대상이 위치한 타깃 이미지가 포함될 경우, 서버는 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하고, 또한 타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하며, 타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정한다.
여기서, 서버가 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정할 경우, 서버는 타깃 이미지의 사이즈를 기설정된 사이즈로 처리할 수 있고, 또한 지정된 분류 모형과 처리를 진행한 후의 타깃 이미지에 기반하여 상기 타깃 이미지에 포함된 타깃 대상이 속하는 타깃 카테고리를 결정할 수 있다.
설명이 필요한 점은, 서버가 지정된 분류 모형과 처리를 진행한 후의 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리에 대한 결정 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 여기서 상세한 설명을 생략한다는 점이다.
설명이 필요한 점은, 서버가 타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드에 대한 결정 과정은 단계302의 제1 형태 중 단계(3)의 결정 과정과 유사하기에, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다는 점이다.
더 설명이 필요한 점은, 서버가 타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트에 대한 결정 과정은 단계302의 제1 형태의 결정 과정과 동일하기에, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다는 점이다.
단계303에서, 서버는 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 단말기에 송신하고, 단말기가 상기 동영상 세그먼트를 재생하도록 한다.
설명이 필요한 점은, 단말기가 상기 동영상 세그먼트를 재생할 때, 단말기에 설정된 재생 모듈로 재생할 수 있을 뿐만 아니라, 물론, 단말기는 또한 자체에 설치된 재생 애플리케이션으로 재생할 수도 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.
본 발명의 실시예에 있어서, 서버가 모니터링 동영상을 획득하고, 또한 지정된 분류 모형에 기반하여 상기 모니터링 동영상의 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하며, 상기 대상 카테고리에 기반하여 상기 대상이 속하는 키워드를 결정하고, 또한 상기 키워드와 상기 키워드에 대응되는 모니터링 시점 또는 상기 키워드와 상기 키워드에 대응되는 동영상 이미지를 인덱스 라이브러리에 저장하며, 이후, 서버가 재생 요청을 수신할 때, 상기 재생 요청에 의해 반송되는 타깃 대상 정보에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하고, 또한 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하며, 또한 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하고, 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결하였으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.
도4는 일 예시적 실시예에 근거하여 도시한 동영상 재생 장치의 블록도이다. 도4를 참조하면, 동영상 재생 장치는,
타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈(401);
타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈(402); 및
동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 동영상 세그먼트를 재생하게 하기 위한 재생 모듈(403)을 포함한다.
본 발명의 다른 실시예에 있어서, 도5를 참조하면, 상기 결정 모듈(402)은,
타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하기 위한 제1 결정 유닛(4021);
타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하기 위한 제2 결정 유닛(4022); 및
타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 제3 결정 유닛(4023)을 포함한다.
본 발명의 다른 실시예에 있어서, 도6을 참조하면, 상기 결정 모듈(402)은,
타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛(4024); 및
적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛(4025)을 포함한다.
본 발명의 다른 실시예에 있어서, 도7을 참조하면, 상기 제1 획득 유닛(4024)은,
인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제1 획득 서브 유닛(40241); 및
적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제2 획득 서브 유닛(40242)을 포함한다.
본 발명의 다른 실시예에 있어서, 상기 제1 획득 유닛(4024)은,
인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제3 획득 서브 유닛을 포함한다.
본 발명의 다른 실시예에 있어서, 도8을 참조하면, 상기 결정 모듈(402)은,
모니터링 동영상을 획득하기 위한 제2 획득 유닛(4026);
모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하기 위한 제4 결정 유닛(4027);
대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하기 위한 제5 결정 유닛(4028); 및
키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하기 위한 생성 유닛(4029)을 더 포함한다.
본 발명의 다른 실시예에 있어서, 도9를 참조하면, 상기 제5 결정 유닛(4028)은,
대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻기 위한 인식 서브 유닛(40281);
안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하기 위한 제4 획득 서브 유닛(40282); 및
신원 식별자를 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하기 위한 제1 결정 서브 유닛(40283)을 포함한다.
본 발명의 다른 실시예에 있어서, 도10을 참조하면, 상기 생성 유닛(4029)은,
모니터링 동영상 중에서 동영상 이미지가 위치한 모니터링 시점을 결정하기 위한 제2 결정 서브 유닛(40291); 및
키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하기 위한 제1 저장 서브 유닛(40292)을 포함한다.
본 발명의 다른 실시예에 있어서, 상기 생성 유닛(4029)은,
키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하기 위한 제2 저장 서브 유닛을 포함한다.
본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 반송하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.
상기 실시예에 따른 장치에 관련하여, 여기서 각각의 모듈이 동작을 수행하는 구체적인 형태는 이미 상기 방법의 관련 실시예에서 상세하게 설명하였는 바, 여기서는 상세한 설명을 생략한다.
도11은 일 예시적 실시예에 근거하여 도시한 동영상 재생 장치(1100)의 블록도이다. 예를 들어, 장치(1100)는 서버로 제공될 수 있다. 도11을 참조하면, 장치(1100)는 프로세싱 컴포넌트(1122)를 포함하고, 하나 또는 복수개의 프로세서 및 예를 들어 애플리케이션과 같이 프로세싱 컴포넌트(1122)에 의해 실행 가능한 인스트럭션을 저장하기 위한 메모리(1132)에 의해 대표되는 메모리 자원을 포함한다. 메모리(1132)에 저장된 애플리케이션에는 하나 또는 하나 이상의 한조의 인스트럭션에 대응되는 각 모듈이 포함될 수 있다.
장치(1100)는 또한 장치(1100)의 전원 관리를 수행하도록 구성되는 하나의 전원 컴포넌트(1126), 장치(1100)를 네트워크에 연결시키도록 구성되는 하나의 유선 또는 무선 네트워크 인터페이스(1150) 및 하나의 입력/출력(I/O) 인터페이스(1158)를 포함할 수도 있다. 장치(1100)는 예를 들어, Wndows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM 또는 유사한, 메모리(1132)에 기반하여 저장되는 운영 체제를 작동 할 수 있다.
이외에, 프로세싱 컴포넌트(1122)는 하기 동영상의 재생 방법에 대한 인스트럭션을 실행하도록 구성된다.
타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계;
타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및
타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 동영상 세그먼트를 재생하게 하는 단계를 포함하는 동영상 재생 방법이다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;
타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하는 단계; 및
타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계를 포함한다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함한다.
본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및
적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.
다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.
본 발명의 다른 실시예에서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,
모니터링 동영상을 획득하는 단계;
모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;
대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및
키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계를 더 포함한다.
본 발명의 다른 실시예에 있어서, 대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,
대상 카테고리가 사람일 경우, 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;
안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및
신원 식별자를 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함한다.
본 발명의 다른 실시예에 있어서, 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계는,
모니터링 동영상 중에서 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및
키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함한다.
본 발명의 다른 실시예에 있어서, 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계는,
키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함한다.
본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 반송하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.
본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들은 명세서를 고려하여 여기서 개시한 발명을 실시한 후 본 발명의 기타 실시형태를 용이하게 생각해낼 수 있다. 본 발명은 본 발명의 모든 변형, 용도 또는 적응성 변화를 포함하고 이러한 변형, 용도 또는 적응성 변화는 본 발명의 일반적인 원리를 따르며 본 발명이 개시하지 않은 본 기술분야에서의 공지된 상식 또는 통상적인 기술수단을 포함한다. 명세서와 실시예는 예시적인 것일 뿐 본 발명의 진정한 범위와 기술적 사상은 하기의 청구범위에 의해 밝혀질 것이다.
본 발명은 상기에서 설명하고 도면에 도시한 정확한 구조에 한정되는 것이 아니라 그 범위를 벗어나지 않는 한 다양한 수정과 변경을 할 수 있음을 이해해야 한다. 본 발명의 범위는 첨부되는 청구범위에 의해서만 한정된다.
본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 포함하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.

Claims (20)

  1. 동영상 재생 방법에 있어서,
    타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계;
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및
    상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함하며,
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
    상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;
    상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하는 단계;
    상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계;
    상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
    상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함하는 동영상 재생 방법.
  2. 삭제
  3. 동영상 재생 방법에 있어서,
    타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계;
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및
    상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함하며,
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
    상기 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
    상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함하는 동영상 재생 방법.
  4. 청구항3에 있어서,
    상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
    상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및
    상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함하는 동영상 재생 방법.
  5. 청구항3에 있어서,
    상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
    상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함하는 동영상 재생 방법.
  6. 청구항3 내지 청구항5 중 어느 한 항에 있어서,
    상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,
    모니터링 동영상을 획득하는 단계;
    상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;
    상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및
    상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계를 더 포함하는 동영상 재생 방법.
  7. 청구항6에 있어서,
    상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,
    상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;
    상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및
    상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함하는 동영상 재생 방법.
  8. 청구항6에 있어서,
    상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,
    상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및
    상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함하는 동영상 재생 방법.
  9. 청구항6에 있어서,
    상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,
    상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함하는 동영상 재생 방법.
  10. 동영상 재생 장치에 있어서,
    타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈;
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈; 및
    상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하기 위한 재생 모듈을 포함하며,
    상기 결정 모듈은,
    상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하기 위한 제1 결정 유닛;
    상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하기 위한 제2 결정 유닛;
    상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 제3 결정 유닛;
    상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛; 및
    상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛을 포함하는 동영상 재생 장치.
  11. 삭제
  12. 동영상 재생 장치에 있어서,
    타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈;
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈; 및
    상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하기 위한 재생 모듈을 포함하며,
    상기 결정 모듈은,
    상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛; 및
    상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛을 포함하는 동영상 재생 장치.
  13. 청구항12에 있어서,
    상기 제1 획득 유닛은,
    상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제1 획득 서브 유닛; 및
    상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제2 획득 서브 유닛을 포함하는 동영상 재생 장치.
  14. 청구항12에 있어서,
    상기 제1 획득 유닛은,
    상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제3 획득 서브 유닛을 포함하는 동영상 재생 장치.
  15. 청구항12 내지 청구항14 중 어느 한 항에 있어서,
    상기 결정 모듈은,
    모니터링 동영상을 획득하기 위한 제2 획득 유닛;
    상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하기 위한 제4 결정 유닛;
    상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하기 위한 제5 결정 유닛; 및
    상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하기 위한 생성 유닛을 더 포함하는 동영상 재생 장치.
  16. 청구항15에 있어서,
    상기 제5 결정 유닛은,
    상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대하여 안면 인식을 진행하여 안면 특징을 얻기 위한 인식 서브 유닛;
    상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하기 위한 제4 획득 서브 유닛; 및
    상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하기 위한 제1 결정 서브 유닛을 포함하는 동영상 재생 장치.
  17. 청구항15에 있어서,
    상기 생성 유닛은,
    상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하기 위한 제2 결정 서브 유닛; 및
    상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하기 위한 제1 저장 서브 유닛을 포함하는 동영상 재생 장치.
  18. 청구항15에 있어서,
    상기 생성 유닛은,
    상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하기 위한 제2 저장 서브 유닛을 포함하는 동영상 재생 장치.
  19. 동영상 재생 장치에 있어서,
    프로세서; 및
    상기 프로세서가 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하되,
    상기 프로세서는,
    타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하고;
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며;
    상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 구성되며,
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 것은,
    상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하는 것;
    상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하는 것;
    상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 것;
    상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 것; 및
    상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 것을 포함하는 동영상 재생 장치.
  20. 동영상 재생 장치에 있어서,
    프로세서; 및
    상기 프로세서가 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하되,
    상기 프로세서는,
    타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하고;
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며;
    상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 구성되며,
    상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 것은,
    상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 것; 및
    상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 것을 포함하는 동영상 재생 장치.


KR1020167021969A 2015-10-28 2015-12-29 동영상 재생 방법 및 장치 KR101798011B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510713118.3 2015-10-28
CN201510713118.3A CN105357475A (zh) 2015-10-28 2015-10-28 用于视频播放的方法及装置
PCT/CN2015/099593 WO2017071086A1 (zh) 2015-10-28 2015-12-29 用于视频播放的方法及装置

Publications (1)

Publication Number Publication Date
KR101798011B1 true KR101798011B1 (ko) 2017-11-15

Family

ID=55333325

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167021969A KR101798011B1 (ko) 2015-10-28 2015-12-29 동영상 재생 방법 및 장치

Country Status (8)

Country Link
US (1) US20170125060A1 (ko)
EP (1) EP3163473A1 (ko)
JP (1) JP6419201B2 (ko)
KR (1) KR101798011B1 (ko)
CN (1) CN105357475A (ko)
MX (1) MX363623B (ko)
RU (1) RU2016118885A (ko)
WO (1) WO2017071086A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105357475A (zh) * 2015-10-28 2016-02-24 小米科技有限责任公司 用于视频播放的方法及装置
CN106162106A (zh) * 2016-08-26 2016-11-23 浙江大华技术股份有限公司 一种视频监控系统中的数据存储方法及装置
CN106709424B (zh) * 2016-11-19 2022-11-11 广东中科人人智能科技有限公司 一种优化的监控视频存储系统
CN108540817B (zh) * 2018-05-08 2021-04-20 成都市喜爱科技有限公司 视频数据处理方法、装置、服务器及计算机可读存储介质
CN108600779B (zh) * 2018-05-18 2021-04-06 新华三信息技术有限公司 一种基于视频内容的目标对象操作方法及装置
CN109873952B (zh) * 2018-06-20 2021-03-23 成都市喜爱科技有限公司 一种拍摄的方法、装置、设备及介质
US11627248B2 (en) 2019-02-03 2023-04-11 Chengdu Sioeye Technology Co., Ltd. Shooting method for shooting device, and electronic equipment
CN112019928B (zh) * 2019-05-30 2022-05-06 杭州海康威视数字技术股份有限公司 一种视频回放方法、装置及电子设备
WO2020238789A1 (zh) * 2019-05-30 2020-12-03 杭州海康威视数字技术股份有限公司 视频回放
CN110225282B (zh) * 2019-05-31 2023-05-30 山西仨仁行文化传媒有限公司 一种视频录制控制方法、设备及计算机可读存储介质
CN111190934A (zh) * 2019-12-30 2020-05-22 青岛海尔科技有限公司 数据的推送方法及装置、存储介质和电子装置
CN114095738A (zh) * 2020-07-30 2022-02-25 京东方科技集团股份有限公司 视频及直播处理方法、直播系统、电子设备、终端、介质
CN114598919B (zh) * 2022-03-01 2024-03-01 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354624A (ja) 2004-06-14 2005-12-22 Canon Inc 動画処理装置、動画処理方法およびコンピュータプログラム
JP2014501049A (ja) 2010-09-27 2014-01-16 フル・エルエルシー 広告体験を改善するためにユーザ情報を提供するための方法および装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1148722A4 (en) * 1999-11-15 2005-11-16 Matsushita Electric Ind Co Ltd METHOD AND APPARATUS FOR VIDEO SEARCH
JP2003046989A (ja) * 2001-07-27 2003-02-14 Mitsubishi Electric Corp 映像監視装置および映像監視システム
US7760908B2 (en) * 2005-03-31 2010-07-20 Honeywell International Inc. Event packaged video sequence
KR101607224B1 (ko) * 2008-03-03 2016-03-29 아비길론 페이턴트 홀딩 2 코포레이션 동적 물체 분류 방법 및 장치
CN101299812B (zh) * 2008-06-25 2012-12-05 北京中星微电子有限公司 视频分析和存储方法、系统,及视频检索方法、系统
US8213689B2 (en) * 2008-07-14 2012-07-03 Google Inc. Method and system for automated annotation of persons in video content
CA2776909A1 (en) * 2009-10-07 2011-04-14 Telewatch Inc. Video analytics method and system
JP2012221322A (ja) * 2011-04-11 2012-11-12 Toshiba Corp オーサリング支援装置、オーサリング支援方法およびプログラム
CN102129474B (zh) * 2011-04-20 2015-02-11 浙江宇视科技有限公司 一种视频数据检索方法及其装置和系统
JP2013092941A (ja) * 2011-10-26 2013-05-16 Nippon Telegr & Teleph Corp <Ntt> 画像検索装置、方法、及びプログラム
US9244923B2 (en) * 2012-08-03 2016-01-26 Fuji Xerox Co., Ltd. Hypervideo browsing using links generated based on user-specified content features
CN102867042A (zh) * 2012-09-03 2013-01-09 北京奇虎科技有限公司 多媒体文件搜索方法及装置
CN103916626A (zh) * 2013-01-05 2014-07-09 中兴通讯股份有限公司 一种监控录像信息提供方法、装置及视频监控系统
CN104239309A (zh) * 2013-06-08 2014-12-24 华为技术有限公司 视频分析检索服务端、系统及方法
JP6200306B2 (ja) * 2013-12-09 2017-09-20 株式会社日立製作所 映像検索装置、映像検索方法、および記憶媒体
CN103778204A (zh) * 2014-01-13 2014-05-07 北京奇虎科技有限公司 基于语音分析的视频搜索方法、设备及系统
CN104053048A (zh) * 2014-06-13 2014-09-17 无锡天脉聚源传媒科技有限公司 一种视频定位的方法及装置
CN104036018A (zh) * 2014-06-25 2014-09-10 百度在线网络技术(北京)有限公司 视频获取方法和装置
CN104754267A (zh) * 2015-03-18 2015-07-01 小米科技有限责任公司 视频片段标注方法、装置及终端
CN105357475A (zh) * 2015-10-28 2016-02-24 小米科技有限责任公司 用于视频播放的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354624A (ja) 2004-06-14 2005-12-22 Canon Inc 動画処理装置、動画処理方法およびコンピュータプログラム
JP2014501049A (ja) 2010-09-27 2014-01-16 フル・エルエルシー 広告体験を改善するためにユーザ情報を提供するための方法および装置

Also Published As

Publication number Publication date
EP3163473A1 (en) 2017-05-03
JP2018503148A (ja) 2018-02-01
JP6419201B2 (ja) 2018-11-07
WO2017071086A1 (zh) 2017-05-04
US20170125060A1 (en) 2017-05-04
CN105357475A (zh) 2016-02-24
RU2016118885A (ru) 2017-11-22
MX2016005835A (es) 2017-07-20
MX363623B (es) 2019-03-28

Similar Documents

Publication Publication Date Title
KR101798011B1 (ko) 동영상 재생 방법 및 장치
KR101680714B1 (ko) 실시간 동영상 제공 방법, 장치, 서버, 단말기기, 프로그램 및 기록매체
CN104012106B (zh) 使表示不同视点的视频对准
WO2017134706A1 (ja) 映像表示方法及び映像表示装置
US10622020B2 (en) Point of view video processing and curation platform
TW201516939A (zh) 查詢使用者標識的方法及裝置、獲取使用者標識的方法及裝置與即時通訊中添加好友的方法及裝置
JP2017139725A (ja) 映像表示方法及び映像表示装置
CN103581705A (zh) 视频节目识别方法和系统
CN202998337U (zh) 视频节目识别系统
WO2019128568A1 (zh) 内容推送方法、装置及设备
CN105979363A (zh) 一种身份识别法和装置
WO2017157135A1 (zh) 媒体信息处理方法及媒体信息处理装置、存储介质
US9706102B1 (en) Enhanced images associated with display devices
WO2023131090A1 (zh) 一种增强现实系统、多设备构建三维地图的方法及设备
CN112770151A (zh) 支持多人截取投屏播放画面的方法、装置和存储介质
US20220165308A1 (en) Point of view video processing and curation platform
WO2015192615A1 (zh) 一种图像文件共享方法、装置和计算机存储介质
CN109389550B (zh) 数据处理方法、装置和计算设备
KR100798917B1 (ko) 디지털 사진 컨텐츠 처리 시스템 및 그 시스템에서의디지털 사진 컨텐츠 송/수신 방법 및 장치
KR20180131687A (ko) 실시간기반 및 컨텐츠 기반 실시간 공연공유 서비스 제공시스템
JP2003219389A (ja) 映像配信方法及びシステム及び装置及びユーザ端末及び映像配信プログラム及び映像配信プログラムを格納した記憶媒体
CN110177332B (zh) 数据传输方法及装置
US8824854B2 (en) Method and arrangement for transferring multimedia data
KR20090093431A (ko) 안내 정보 제공방법 및 그 장치
EP4044584A1 (en) Panoramic video generation method, video acquisition method, and related apparatuses

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant