KR101798011B1

KR101798011B1 - 동영상 재생 방법 및 장치

Info

Publication number: KR101798011B1
Application number: KR1020167021969A
Authority: KR
Inventors: 타오 장; 지준 첸; 페이 롱
Original assignee: 시아오미 아이엔씨.
Priority date: 2015-10-28
Filing date: 2015-12-29
Publication date: 2017-11-15
Also published as: EP3163473A1; CN105357475A; JP2018503148A; WO2017071086A1; MX363623B; JP6419201B2; RU2016118885A; MX2016005835A; US20170125060A1

Abstract

본 발명은 동영상 재생 방법 및 장치에 관한 것이고, 인터넷 기술 분야에 속한다. 상기 동영상 재생 방법은, 타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계; 상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및 상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함한다.

Description

동영상 재생 방법 및 장치{VIDEO PLAYING METHOD AND DEVICE}

본원 발명은 출원번호가 201510713118.3이고 출원일자가 2015년 10월 28일인 중국 특허 출원에 기반하여 제출하였고 상기 중국 특허 출원의 우선권을 주장하는 바, 상기 중국 특허 출원의 모든 내용은 본원 발명에 원용된다.

본 발명은 인터넷 기술 분야에 관한 것으로서, 특히는 동영상 재생 방법 및 장치에 관한 것이다.

웹캠의 대중화에 따라, 웹캠을 이용한 실시간 모니터링이 유행하고 있다. 웹캠을 이용한 실시간 모니터링을 통해 획득한 모니터링 동영상은 시간적인 연속성을 구비하기 때문에, 사용자가 모니터링 동영상에서 특정 대상의 행동을 확인하려고 할때, 예를 들어 모니터링 동영상에서 아기의 행동을 확인하고자 하면, 사용자는 흔히 모니터링 동영상의 재생 과정에서 모니터링 동영상의 재생 속도를 수동으로 조절하여 모니터링 동영상에서 특정 대상이 위치한 동영상 화면으로 앞으로 감기 또는 되감기를 함으로써 특정 대상의 행동을 확인한다. 사용자가 모니터링 동영상의 재생 진도에 대하여 수동으로 조절하는 동작이 상대적으로 번거로우며 동영상의 재생 효율을 감소시킨다. 따라서, 동영상 재생에 사용되는 동영상 재생 효율을 개선하는 방법이 시급히 필요하다.

관련 기술에 따른 문제를 해결하고자, 본 발명에서는 동영상 재생 방법 및 장치를 제공한다.

본 발명의 실시예의 제1양태에 근거하여,

타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송(carrying)하는 재생 요청을 수신하는 단계;

상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및

상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함하는 동영상 재생 방법을 제공한다.

제1 양태를 결부시켜, 상기 제1 양태의 제1 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,

상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;

상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하는 단계; 및

상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계를 포함한다.

제1 양태를 결부시켜, 상기 제1 양태의 제2 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,

상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및

상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함한다.

제1 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제3 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,

상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및

상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.

제1 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제4 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,

상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.

상기 제1 양태의 제2 가능한 구현 형태 내지 제1 양태의 제4 가능한 구현 형태 중의 임의의 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제5 가능한 구현 형태에 있어서, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,

모니터링 동영상을 획득하는 단계;

상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;

상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및

상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계를 더 포함한다.

상기 제1 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제6 가능한 구현 형태에 있어서, 상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,

상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;

상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및

상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함한다.

상기 제1 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제7 가능한 구현 형태에 있어서, 상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,

상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및

상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함한다.

상기 제1 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제1 양태의 제8 가능한 구현 형태에 있어서, 상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,

상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함한다.

본 발명의 실시예의 제2 양태에 근거하여,

타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈;

상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈; 및

상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하기 위한 재생 모듈을 포함하는 동영상 재생 장치를 제공한다.

제2 양태를 결부시켜, 상기 제2 양태의 제1 가능한 구현 형태에 있어서, 상기 결정 모듈은,

상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하기 위한 제1 결정 유닛;

상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하기 위한 제2 결정 유닛; 및

상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 제3 결정 유닛을 포함한다.

제2 양태를 결부시켜, 상기 제2 양태의 제2 가능한 구현 형태에 있어서, 상기 결정 모듈은,

상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛; 및

상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛을 포함한다.

상기 제2 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제3 가능한 구현 형태에 있어서, 상기 제1 획득 유닛은,

상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제1 획득 서브 유닛; 및

상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제2 획득 서브 유닛을 포함한다.

상기 제2 양태의 제2 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제4 가능한 구현 형태에 있어서, 상기 제1 획득 유닛은,

상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제3 획득 서브 유닛을 포함한다.

상기 제2 양태의 제2 가능한 구현 형태 내지 제2 양태의 제4 가능한 구현 형태 중의 임의의 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제5 가능한 구현 형태에 있어서, 상기 결정 모듈은,

모니터링 동영상을 획득하기 위한 제2 획득 유닛;

상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하기 위한 제4 결정 유닛;

상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하기 위한 제5 결정 유닛; 및

상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하기 위한 생성 유닛을 더 포함한다.

제2 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제6 가능한 구현 형태에 있어서, 상기 제5 결정 유닛은,

상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대하여 안면 인식을 진행하여 안면 특징을 얻기 위한 인식 서브 유닛;

상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하기 위한 제4 획득 서브 유닛; 및

상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하기 위한 제1 결정 서브 유닛을 포함한다.

제2 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제7 가능한 구현 형태에 있어서, 상기 생성 유닛은,

상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하기 위한 제2 결정 서브 유닛; 및

상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하기 위한 제1 저장 서브 유닛을 포함한다.

제2 양태의 제5 가능한 구현 형태를 결부시켜, 상기 제2 양태의 제8 가능한 구현 형태에 있어서, 상기 생성 유닛은,

상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하기 위한 제2 저장 서브 유닛을 포함한다.

본 발명의 실시예의 제3 양태에 근거하여,

프로세서; 및

상기 프로세서가 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하되,

여기서, 상기 프로세서는,

타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하고;

상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며;

상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 구성되는 동영상 재생 장치를 제공한다.

본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 포함하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.

상기의 일반적인 설명과 후술되는 구체적인 설명은 단지 예시적이고 해석적인 것이며 본 발명을 한정하는 것이 아님을 이해해야 한다.

아래의 도면은 명세서 전체를 구성하는 명세서의 일부분으로서 본 발명에 부합하는 실시예를 예시하여 본 발명의 원리를 설명하기 위한 것이다.
도1은 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법에 관한 실시 환경의 모식도이다.
도2는 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법의 흐름도이다.
도3은 일 예시적 실시예에 근거하여 도시한 다른 동영상 재생 방법의 흐름도이다.
도4는 일 예시적 실시예에 근거하여 도시한 동영상 재생 장치의 블록도이다.
도5는 일 예시적 실시예에 근거하여 도시한 결정 모듈의 블록도이다.
도6은 일 예시적 실시예에 근거하여 도시한 다른 결정 모듈의 블록도이다.
도7은 일 예시적 실시예에 근거하여 도시한 제1 획득 유닛의 블록도이다.
도8은 일 예시적 실시예에 근거하여 도시한 또 다른 결정 모듈의 블록도이다.
도9는 일 예시적 실시예에 근거하여 도시한 제5 결정 유닛의 블록도이다.
도10은 일 예시적 실시예에 근거하여 도시한 생성 유닛의 블록도이다.
도11은 일 예시적 실시예에 근거하여 도시한 다른 동영상 재생 장치의 블록도이다.

여기서, 예시적 실시예에 대하여 상세하게 설명하고, 이를 첨부되는 도면에 예시적으로 나타냈다. 하기에서 첨부되는 도면에 대하여 설명할 때, 별도로 표시하지 않는 한, 다른 도면의 동일한 숫자는 동일하거나 유사한 구성요소를 나타낸다. 하기의 예시적 실시예에서 설명한 실시형태는 본 발명과 일치한 모든 실시형태를 의미하는 것은 아니다. 반대로, 이들은 첨부된 특허청구범위에서 설명한, 본 발명의 일부 양태와 일치한 장치와 방법에 대한 예일 뿐이다.

도1은 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법에 관한 실시 환경의 모식도이다. 도1에 도시된 바와 같이, 상기 실시 환경은 한 대의 서버 또는 복수 대의 서버에 의해 구성되는 서버 클러스터, 또는 하나의 클라우드 컴퓨팅 서비스 센터일 수 있는 서버(101), 스마트 비디오 카메라일 수 있는 스마트 촬영기기(102)와 휴대폰, 컴퓨터, 태블릿기기 등일 수 있는 단말기(103)를 포함할 수 있다. 서버(101)와 스마트 촬영기기(102)는 네트워크로 연결될 수 있고, 서버(101)와 단말기(103) 또한 네트워크로 연결될 수 있다. 서버(101)는 단말기(103)가 송신한 재생 요청을 수신하기 위한 것이고, 상기 재생 요청에 기반하여 대응되는 동영상을 획득하며, 또한 상기 동영상을 단말기(103)에 송신한다. 스마트 촬영기기(102)는 모니터링 영역 내의 모니터링 동영상을 수집하기 위한 것이고, 또한 모니터링 동영상을 서버(101)에 송신한다. 단말기(103)는 서버(101)가 송신한 동영상을 수신하기 위한 것이고, 또한 상기 동영상을 재생한다.

도2는 일 예시적 실시예에 근거하여 도시한 서버에 사용되는 동영상 재생 방법의 흐름도이고, 도2에 도시된 바와 같이, 하기 단계를 포함한다.

단계201에서, 타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송(carrying)하는 재생 요청을 수신한다.

단계202에서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정한다.

단계203에서, 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 단말기에 송신하여 단말기가 상기 동영상 세그먼트를 재생하도록 한다.

본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 반송하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.

본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,

타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;

타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하는 단계; 및

타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계를 포함한다.

여기서, 서버는 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하고, 또한 상기 타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하며, 서버가 상기 타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 빠르게 결정하게 할 수 있다.

타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및

적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함한다.

단말기가 재생 요청을 송신하는 것은 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 획득하기 위한 것이고, 동영상 세그먼트는 적어도 1 프레임의 동영상 이미지로 구성될 수 있으며, 따라서, 서버는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 빠르게 획득할 수 있어 동영상의 획득 효율을 향상시킨다.

본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,

인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및

적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.

모니터링 동영상에 상기 모니터링 동영상에 포함된 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버는 타깃 키워드에 대응되는 적어도 하나의 모니터링 시점을 결정하고, 또한 모니터링 동영상 중에서 상기 적어도 하나의 모니터링 시점에 대응되는 적어도 1 프레임의 동영상 이미지를 획득할 수 있어 동영상 이미지의 획득 정확도를 향상시킨다.

인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 동영상 이미지 사이의 대응관계에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.

여기서, 서버는 타깃 키워드에 기반하여 타깃 대상에 대응되는 적어도 1프레임의 동영상 이미지를 바로 획득하여 동영상 이미지의 획득 효율을 향상시킨다.

본 발명의 다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,

모니터링 동영상을 획득하는 단계;

모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;

대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및

키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계를 더 포함한다.

여기서, 서버는 타깃 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하고, 서버가 재생 요청을 수신할 때, 상기 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 빠르게 획득하게 할 수 있어, 동영상 이미지의 획득 효율을 향상시킨다.

본 발명의 다른 실시예에 있어서, 대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,

대상 카테고리가 사람일 경우, 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;

안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및

신원 식별자를 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함한다.

여기서, 대상 카테고리가 사람일 경우, 서버는 대상의 신원 식별자를 상기 대상이 속하는 타깃 키워드로 결정하여 단말기가 특정 신원을 구비한 사람이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하도록 할 수 있고, 지정된 한 사람의 동영상 세그먼트를 대응되게 획득할 수 있다.

본 발명의 다른 실시예에 있어서, 키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 단계는,

모니터링 동영상 중에서 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및

키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함한다.

모니터링 동영상 중에 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버는 키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하여 서버가 키워드에 기반하여 대응되는 모니터링 시점을 획득하고, 모니터링 동영상에서 상기 모니터링 시점에 대응되는 동영상 이미지를 획득할 수 있어 동영상 이미지의 획득 정확도를 향상시킨다.

키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함한다.

여기서, 서버는 키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하여 서버가 키워드에 근거하여 대응되는 동영상 이미지를 바로 획득할 수 있어, 동영상 이미지의 획득 효율을 향상시킨다.

상기 모든 선택적인 기술적 해결방안은 모두 임의의 결합 형태로 본 발명의 선택적인 실시예를 구성할 수 있으며, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.

도3은 일 예시적 실시예에 근거하여 도시한 동영상 재생 방법의 흐름도이고, 도3에 도시된 바와 같이, 상기 방법은 하기 단계를 포함한다.

단계301에서, 서버는 타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신한다.

설명이 필요한 점은, 상기 재생 요청은 단말기에 의해 바로 송신될 수 있고, 물론, 상기 재생 요청은 또한 단말기에 의해 우선 기타 기기에 송신되고, 다시 기타 기기에서 서버에 송신될 수도 있으며, 본 발명의 실시예에서는 이에 대하여 한정하는 것이 아니라는 점이다.

이외에, 단말기가 재생 요청을 송신할 경우, 상기 단말기는 재생 인스트럭션을 수신하였을 때 서버 또는 기타 기기에 재생 요청을 송신할 수 있다.

설명이 필요한 점은, 재생 인스트럭션은 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 획득하기 위한 것이고, 또한 재생 인스트럭션은 클릭 동작, 슬라이드 동작, 음성 동작 등등일 수 있는 사용자에 의한 지정 동작에 의해 트리거될 수 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.

이외에, 타깃 이미지는 타깃 대상을 포함하는 이미지이고, 또한 상기 타깃 이미지는 타깃 대상의 사진일 수 있으며, 또는 단말기가 모니터링 동영상을 재생하는 과정에서, 모니터링 동영상의 동영상 이미지에 기반하여 선택 인스트럭션을 수신하였을 때, 해당 선택 인스트럭션에 타깃 대상의 이미지가 반송되어 얻어질 수 있으며, 물론, 타깃 이미지는 또한 기타 형태로 얻을 수도 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.

또한, 타깃 키워드는 타깃 대상과 유일하게 대응되고, 또한 타깃 키워드는 타깃 대상이 속하는 카테고리, 타깃 대상의 신원 식별자 등등일 수 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.

단계302에서, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정한다.

타깃 대상 정보에 타깃 대상이 위치한 이미지 또는 타깃 대상이 속하는 타깃 키워드가 포함되므로, 타깃 대상 정보에 포함된 상이한 내용에 근거하여 서버가 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 형태는 하기 두 가지 형태일 수 있다.

제1 형태: 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하고, 또한 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 상기 모니터링 동영상에 위치한 세그먼트를 구성한다.

단말기가 재생 요청을 송신하는 것은 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지로 구성된 동영상 세그먼트를 획득하기 위한 것이므로, 서버는 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하고, 또한 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성할 수 있다.

설명이 필요한 점은, 타깃 대상 정보가 타깃 키워드를 포함할 경우, 타깃 대상 정보에 대응되는 타깃 키워드는 상기 타깃 대상 정보에 포함된 타깃 키워드일 수 있고, 타깃 대상 정보에 타깃 이미지가 포함될 경우, 타깃 대상 정보에 대응되는 타깃 키워드는 상기 타깃 이미지를 통해 얻을 수 있다는 점이다.

여기서, 서버가 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득할 때, 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 서버는 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하고, 또한 상기 적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득한다. 또는, 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 서버는 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계에서 적어도 1프레임의 동영상 이미지를 획득한다.

모니터링 동영상에 상기 모니터링 동영상에 포함된 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버는 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계에서 상기 타깃 키워드에 대응되는 적어도 하나의 모니터링 시점을 획득한 후, 서버는 상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상에서 상기 적어도 하나의 모니터링 시점에 대응되는 적어도 1프레임의 동영상 이미지를 획득할 수 있다.

여기서, 서버가 상기 적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.

예를 들어, 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 키워드가 '양러러'일 경우, 서버는 타깃 키워드 '양러러'에 기반하여 하기 표1에 도시된 키워드와 모니터링 시점 사이의 대응관계에서 '양러러'에 대응되는 적어도 하나의 모니터링 시점인 2015/02/03-21:08:31, 2015/03/05-11:08:11, 2015/08/03-09:05:31을 획득하고, 이후, 서버는 모니터링 동영상에서 2015/02/03-21:08:31, 2015/03/05-11:08:11, 2015/08/03-09:05:31에 각각 대응되는 동영상 이미지를 획득할 수 있다.

키워드	모니터링 시점
양러러	2015/02/03-21:08:31, 2015/03/05-11:08:11, 2015/08/03-09:05:31
궈제	2015/05/13-21:10:02, 2015/05/25-21:03:06, 2015/08/11-19:18:26
…	…

설명이 필요한 점은, 본 발명의 실시예에 있어서, 단지 상기 표1에 도시된 키워드와 모니터링 시점 사이의 대응관계를 예로 들어 설명하였는 바, 상기 표1은 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.

또 예를 들어, 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 키워드가 '양러러'일 경우, 서버는 타깃 키워드 '양러러'에 기반하여, 하기 표2에 도시된 키워드와 동영상 이미지 사이의 대응관계에서 '양러러'에 대응되는 적어도 1프레임의 동영상 이미지인 1. JPEG, 2, JPEG, 3. JPEG를 획득할 수 있다.

키워드	동영상 이미지
양러러	1. JPEG, 2, JPEG, 3. JPEG
궈제	1. JPEG, 2, JPEG, 3. JPEG
…	…

설명이 필요한 점은, 본 발명의 실시예에 있어서, 단지 상기 표2에 도시된 키워드와 동영상 이미지 사이의 대응관계를 예로 들어 설명하였는 바, 상기 표2는 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.

여기서, 서버가 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.

또한, 서버는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 이전에, 또한 하기 단계(1)-단계(4)를 통해 인덱스 라이브러리를 생성할 수도 있다.

단계(1) 에 있어서, 서버는 모니터링 동영상을 획득한다.

설명이 필요한 점은, 서버는 스마트 촬영기기에서 상기 모니터링 동영상을 획득할 수 있고, 물론, 서버로 하여금 기타 기기에서 상기 모니터링 동영상을 획득할 수 있게 상기 스마트 영상기기는 또한 상기 모니터링 동영상을 기타 기기에 송신할 수도 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.

여기서, 스마트 영상기기는 모니터링 영역 내의 모니터링 동영상을 수집하기 위한 것이고, 또한 스마트 영상기기가 모니터링 영역 내의 모니터링 동영상을 수집하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다.

이외에, 스마트 촬영기기는 유선 네트워크 또는 무선 네트워크를 통해 서버 또는 기타 기기와의 통신을 진행할 수 있고, 스마트 영상기기가 무선 네트워크를 통해 서버 또는 기타 기기와의 통신을 진행할 때, 스마트 영상기기는 내장된 무선 WIFI(영문: WIreless-FIdelity, 약칭: WIFI), 블루투스 또는 기타 무선 통신 칩을 통해 서버 또는 기타 기기와의 통신을 진행하고, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.

단계(2)에 있어서, 상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 서버는 지정된 분류 모형에 근거하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정한다.

설명이 필요한 점은, 지정된 분류 모형은 이미지에 대응되는 대상 카테고리를 결정하기 위한 것이고, 또한 지정된 분류 모형은 기설정될 수 있다는 점이다.

지정된 분류 모형은 기설정될 수 있고, 또한 대상 카테고리에 대한 결정 효율을 향상시키기 위해, 상기 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하도록, 지정된 분류 모형은 일반적으로 기설정된 사이즈의 이미지에 대하여 처리할 수 있으며, 따라서, 서버가 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정할 때, 서버는 모니터링 동영상의 동영상 이미지에서 상기 대상이 위치한 영역에 대한 커팅을 통해 대상 이미지를 얻고, 또한 대상 이미지의 사이즈를 기설정된 사이즈로 처리하며, 이후, 지정된 분류 모형과 처리를 진행한 후의 대상 이미지에 기반하여 상기 대상이 속하는 대상 카테고리를 결정한다.

여기서, 서버가 모니터링 동영상의 동영상 이미지에서 상기 대상이 위치한 영역에 대한 커팅을 통해 대상 이미지를 얻을 때, 상기 대상이 위치한 동영상 이미지에서 상기 대상의 외접 사각형을 캡쳐할 수 있고, 또한 상기 외접 사각형을 상기 대상이 모니터링 동영상에 위치한 동영상 영역 즉 대상 이미지로 결정한다. 물론, 서버는 또한 기타 형태로 상기 대상이 위치한 영역에 대한 커팅을 통해 대상 이미지를 얻을 수도 있고, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.

이외에, 예를 들어 기설정된 사이즈가 224*224 화소, 300*300 화소 등등과 같이 기설정된 사이즈는 사전 설정될 수 있고, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니다.

설명이 필요한 점은, 서버가 지정된 분류 모형과 처리를 진행한 후의 대상 이미지에 기반하여 상기 대상이 속하는 대상 카테고리를 결정하는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다는 점이다.

단계(3)에 있어서, 서버는 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정한다.

상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리는 사람일 수 있고, 애완 동물일 수도 있으며, 또한 기타 물체일 수도 있고, 상기 이미지 동영상에 포함된 대상이 속하는 대상 카테고리가 사람 또는 애완 동물일 경우, 단말기는 특정 신원을 구비한 사람 또는 애완 동물이 모니터링 동영상에 위치한 동영상 세그먼트를 획득할 필요가 있고, 따라서, 서버가 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드의 동작을 결정하는 조작은, 동영상 이미지에 포함된 대상이 속하는 카테고리가 사람일 경우, 서버가 상기 대상에 대한 안면 인식을 통해 안면 특징을 얻고, 이후, 상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하고, 또한 상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 것일 수 있다. 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 애완 동물일 경우, 서버는 상기 동영상 이미지에 기반하여 애완 동물 식별자를 획득하고, 또한 상기 애완 동물 식별자에 기반하여 저장된 애완 동물 식별자와 신원 식별자의 대응관계에서 대응되는 신원 식별자를 획득하며, 또한 상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정한다. 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 사람이 아니고, 또한 애완 동물도 아닐 경우, 서버는 상기 대상 카테고리를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 바로 결정할 수 있다.

설명이 필요한 점은, 서버가 상기 대상에 대한 안면 인식을 통해 안면 특징을 얻는 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 이에 대하여 상세하게 설명하지 않기로 한다는 점이다.

더 설명이 필요한 점은, 애완 동물 식별자는 상기 애완 동물에 사용하기 위한 유일한 식별자이고, 또한 상기 애완 동물 식별자는 상기 애완 동물 상에 설정된 이차원 코드, 바코드 또는 기타 인식 가능한 마크를 통해 얻을 수 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.

예를 들어, 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 사람일 경우, 서버가 상기 대상에 대한 안면 인식을 통해 얻은 안면 특징이 A이고, 이후, 상기 안면 특징 A에 기반하여 도3에 도시된 안면 특징과 신원 식별자 사이의 대응관계에서 A에 대응되는 신원 식별자인 '양러러'를 획득하며, 서버는 '양러러'를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정할 수 있다.

안면 특징	신원 식별자
A	양러러
B	궈제
…	…

설명이 필요한 점은, 본 발명의 실시에에 있어서, 단지 상기 도3에 도시된 안면 특징과 신원 식별자 사이의 대응관계를 예로 들어 설명한 것이고, 상기 도3은 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.

또 예를 들어, 동영상 이미지에 포함된 대상이 속하는 대상 카테고리가 애완 동물일 경우, 서버가 상기 동영상 이미지에 기반하여 상기 애완 동물 상에 설정된 이차원 코드, 바코드 또는 기타 인식 가능한 마크에 대한 스캔을 통해 획득한 애완 동물의 식별자가 ID1이고, 이후, 상기 애완 동물 식별자 ID1에 기반하여 하기 도4에 도시된 애완 동물과 신원 식별자 사이의 대응관계에서 ID1에 대응되는 신원 식별자인 '더우더우'를 획득하며, 서버는 상기 '더우더우'를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정할 수 있다.

애완 동물 식별자	신원 식별자
ID1	더우더우
ID2	환환
…	…

설명이 필요한 점은, 본 발명의 실시예에 있어서, 단지 상기 표4에 도시된 애완 동물 식별자와 신원 식별자 사이의 대응관계를 예로 들어 설명한 것이고, 상기 표4는 본 발명의 실시예에 대하여 한정하는 것이 아니라는 점이다.

또한, 서버가 상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계에서 대응되는 신원 특징을 획득하기 이전에, 서버는 단말기가 송신한 상기 대상의 신원 식별자 및 상기 대상의 안면 이미지를 반송하는 제1 설정 정보를 수신할 수 있고, 서버는 상기 안면 이미지에 대한 특징 추출을 통해 상기 대상의 안면 특징을 얻으며, 또한 상기 안면 특징과 상기 신원 식별자를 안면 특징과 신원 식별자 사이의 대응관계에 저장한다.

예를 들어, 단말기가 송신한 제1 설정 정보에 신원 식별자와 안면 이미지를 반송하고, 또한 상기 신원 식별자가 '양러러'일 경우, 서버는 상기 안면 이미지에 대한 특징 추출을 통해 안면 특징 A를 얻으며, 서버는 A와 '양러러'를 도3에 도시된 안면 특징과 신원 식별자 사이의 대응관계에 저장한다.

또한, 서버가 상기 애완 동물 식별자에 기반하여 저장된 애완 동물 식별자와 신원 식별자 사이의 대응관계에서 대응되는 신원 식별자를 획득하기 이전에, 서버는 단말기가 송신한 상기 대상의 신원 식별자 및 상기 대상의 애완 동물 식별자를 반송하는 제2 설정 정보를 수신할 수 있고, 서버는 상기 애완 동물 식별자와 상기 신원 식별자를 애완 동물 식별자와 신원 식별자 사이의 대응관계에 저장한다.

예를 들어, 단말기가 송신한 제2 설정 정보에 신원 식별자와 애완 동물 식별자를 반송하고, 또한 상기 신원 식별자가 '더우더우'이며, 애완 동물 식별자가 ID1일 경우, 서버는 ID1과 '더우더우'를 도4에 도시된 애완 동물 식별자와 신원 식별자 사이의 대응관계에 저장된다.

단계(4)에 있어서, 서버는 상기 키워드와 상기 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성한다.

인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계를 저장할 수 있을 뿐만 아니라, 또한 키워드와 동영상 이미지 사이의 대응관계를 저장할 수도 있으며, 따라서, 서버가 상기 키워드와 상기 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하는 조작은, 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 서버는 상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하고, 또한 상기 키워드와 상기 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장한다. 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 서버는 상기 키워드와 상기 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장한다.

모니터링 동영상에 상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대응되는 모니터링 시점이 포함되므로, 서버가 지정 대상이 존재하는 동영상 이미지를 결정하였을 때, 상기 동영상 이미지에 기반하여 상기 동영상 이미지에 속하는 모니터링 동영상에서 상기 동영상 이미지에 대응되는 모니터링 시점을 획득할 수 있으며, 이후, 서버는 상기 대상이 속하는 키워드와 상기 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장할 수 있다.

예를 들어, 상기 대상이 속하는 키워드가 '양러러'일 경우, 서버는 상기 모니터링 동영상에서 '양러러'가 존재하는 동영상 이미지가 속하는 모니터링 시점인 2015/08/03-09:05:31을 결정하고, 서버는 '양러러'와 2015/08/03-09:05:31을 도1에 도시된 키워드와 모니터링 시점 사이의 대응관계에 저장할 수 있다.

또 예를 들어, 상기 대상이 속하는 키워드가 '양러러'일 경우, 상기 모니터링 동영상에 존재하는 '양러러'의 동영상 이미지는 3. JPEG이고, 서버는 '양러러'와 3. JPEG를 도2에 도시된 키워드와 동영상 이미지 사이의 대응관계에 저장할 수 있다.

제2 형태: 타깃 대상 정보에 타깃 대상이 위치한 타깃 이미지가 포함될 경우, 서버는 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하고, 또한 타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하며, 타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정한다.

여기서, 서버가 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정할 경우, 서버는 타깃 이미지의 사이즈를 기설정된 사이즈로 처리할 수 있고, 또한 지정된 분류 모형과 처리를 진행한 후의 타깃 이미지에 기반하여 상기 타깃 이미지에 포함된 타깃 대상이 속하는 타깃 카테고리를 결정할 수 있다.

설명이 필요한 점은, 서버가 지정된 분류 모형과 처리를 진행한 후의 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리에 대한 결정 과정은 관련 기술을 참조할 수 있는 바, 본 발명의 실시예에서는 여기서 상세한 설명을 생략한다는 점이다.

설명이 필요한 점은, 서버가 타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드에 대한 결정 과정은 단계302의 제1 형태 중 단계(3)의 결정 과정과 유사하기에, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다는 점이다.

더 설명이 필요한 점은, 서버가 타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트에 대한 결정 과정은 단계302의 제1 형태의 결정 과정과 동일하기에, 본 발명의 실시예에서는 이에 대하여 상세한 설명을 생략한다는 점이다.

단계303에서, 서버는 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 단말기에 송신하고, 단말기가 상기 동영상 세그먼트를 재생하도록 한다.

설명이 필요한 점은, 단말기가 상기 동영상 세그먼트를 재생할 때, 단말기에 설정된 재생 모듈로 재생할 수 있을 뿐만 아니라, 물론, 단말기는 또한 자체에 설치된 재생 애플리케이션으로 재생할 수도 있으며, 본 발명의 실시예에서는 이에 대하여 구체적으로 한정하는 것이 아니라는 점이다.

본 발명의 실시예에 있어서, 서버가 모니터링 동영상을 획득하고, 또한 지정된 분류 모형에 기반하여 상기 모니터링 동영상의 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하며, 상기 대상 카테고리에 기반하여 상기 대상이 속하는 키워드를 결정하고, 또한 상기 키워드와 상기 키워드에 대응되는 모니터링 시점 또는 상기 키워드와 상기 키워드에 대응되는 동영상 이미지를 인덱스 라이브러리에 저장하며, 이후, 서버가 재생 요청을 수신할 때, 상기 재생 요청에 의해 반송되는 타깃 대상 정보에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하고, 또한 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하며, 또한 상기 적어도 1프레임의 동영상 이미지로 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하고, 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서, 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결하였으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.

도4는 일 예시적 실시예에 근거하여 도시한 동영상 재생 장치의 블록도이다. 도4를 참조하면, 동영상 재생 장치는,

타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈(401);

타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈(402); 및

동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 동영상 세그먼트를 재생하게 하기 위한 재생 모듈(403)을 포함한다.

본 발명의 다른 실시예에 있어서, 도5를 참조하면, 상기 결정 모듈(402)은,

타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 타깃 이미지에 기반하여 타깃 대상이 속하는 타깃 카테고리를 결정하기 위한 제1 결정 유닛(4021);

타깃 카테고리에 기반하여 타깃 대상이 속하는 타깃 키워드를 결정하기 위한 제2 결정 유닛(4022); 및

타깃 키워드에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 제3 결정 유닛(4023)을 포함한다.

본 발명의 다른 실시예에 있어서, 도6을 참조하면, 상기 결정 모듈(402)은,

타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛(4024); 및

적어도 1프레임의 동영상 이미지로 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛(4025)을 포함한다.

본 발명의 다른 실시예에 있어서, 도7을 참조하면, 상기 제1 획득 유닛(4024)은,

인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제1 획득 서브 유닛(40241); 및

적어도 하나의 모니터링 시점에 기반하여 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제2 획득 서브 유닛(40242)을 포함한다.

본 발명의 다른 실시예에 있어서, 상기 제1 획득 유닛(4024)은,

인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제3 획득 서브 유닛을 포함한다.

본 발명의 다른 실시예에 있어서, 도8을 참조하면, 상기 결정 모듈(402)은,

모니터링 동영상을 획득하기 위한 제2 획득 유닛(4026);

모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하기 위한 제4 결정 유닛(4027);

대상 카테고리에 기반하여 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하기 위한 제5 결정 유닛(4028); 및

키워드와 모니터링 동영상에 기반하여 인덱스 라이브러리를 생성하기 위한 생성 유닛(4029)을 더 포함한다.

본 발명의 다른 실시예에 있어서, 도9를 참조하면, 상기 제5 결정 유닛(4028)은,

대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻기 위한 인식 서브 유닛(40281);

안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하기 위한 제4 획득 서브 유닛(40282); 및

신원 식별자를 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하기 위한 제1 결정 서브 유닛(40283)을 포함한다.

본 발명의 다른 실시예에 있어서, 도10을 참조하면, 상기 생성 유닛(4029)은,

모니터링 동영상 중에서 동영상 이미지가 위치한 모니터링 시점을 결정하기 위한 제2 결정 서브 유닛(40291); 및

키워드와 모니터링 시점을 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하기 위한 제1 저장 서브 유닛(40292)을 포함한다.

본 발명의 다른 실시예에 있어서, 상기 생성 유닛(4029)은,

키워드와 동영상 이미지를 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하기 위한 제2 저장 서브 유닛을 포함한다.

상기 실시예에 따른 장치에 관련하여, 여기서 각각의 모듈이 동작을 수행하는 구체적인 형태는 이미 상기 방법의 관련 실시예에서 상세하게 설명하였는 바, 여기서는 상세한 설명을 생략한다.

도11은 일 예시적 실시예에 근거하여 도시한 동영상 재생 장치(1100)의 블록도이다. 예를 들어, 장치(1100)는 서버로 제공될 수 있다. 도11을 참조하면, 장치(1100)는 프로세싱 컴포넌트(1122)를 포함하고, 하나 또는 복수개의 프로세서 및 예를 들어 애플리케이션과 같이 프로세싱 컴포넌트(1122)에 의해 실행 가능한 인스트럭션을 저장하기 위한 메모리(1132)에 의해 대표되는 메모리 자원을 포함한다. 메모리(1132)에 저장된 애플리케이션에는 하나 또는 하나 이상의 한조의 인스트럭션에 대응되는 각 모듈이 포함될 수 있다.

장치(1100)는 또한 장치(1100)의 전원 관리를 수행하도록 구성되는 하나의 전원 컴포넌트(1126), 장치(1100)를 네트워크에 연결시키도록 구성되는 하나의 유선 또는 무선 네트워크 인터페이스(1150) 및 하나의 입력/출력(I/O) 인터페이스(1158)를 포함할 수도 있다. 장치(1100)는 예를 들어, Wndows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM 또는 유사한, 메모리(1132)에 기반하여 저장되는 운영 체제를 작동 할 수 있다.

이외에, 프로세싱 컴포넌트(1122)는 하기 동영상의 재생 방법에 대한 인스트럭션을 실행하도록 구성된다.

타깃 대상이 위치한 타깃 이미지 또는 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계;

타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및

타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 동영상 세그먼트를 재생하게 하는 단계를 포함하는 동영상 재생 방법이다.

다른 실시예에 있어서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,

인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 타깃 대상 정보에 대응되는 타깃 키워드에 기반하여 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함한다.

본 발명의 다른 실시예에서, 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 타깃 대상이 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,

모니터링 동영상을 획득하는 단계;

본 발명의 실시예에 있어서, 서버는 타깃 대상 정보를 반송하는 재생 요청을 수신하고, 서버는 타깃 대상 정보에 기반하여 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며, 또한 상기 모니터링 동영상에서 상기 타깃 대상을 제외한 기타 대상이 위치한 동영상 세그먼트를 재생할 필요없이, 상기 동영상 세그먼트를 단말기에 송신하여 단말기로 하여금 상기 모니터링 동영상에서 타깃 대상이 존재하는 동영상 세그먼트를 바로 재생하도록 하고, 사용자가 상기 모니터링 동영상의 재생에 있어서 수동 조절을 통해 타깃 대상이 위치한 동영상을 시청하는 문제를 해결할 수 있으며, 조작이 간편하며, 또한 동영상 재생 효율을 향상시킨다.

본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들은 명세서를 고려하여 여기서 개시한 발명을 실시한 후 본 발명의 기타 실시형태를 용이하게 생각해낼 수 있다. 본 발명은 본 발명의 모든 변형, 용도 또는 적응성 변화를 포함하고 이러한 변형, 용도 또는 적응성 변화는 본 발명의 일반적인 원리를 따르며 본 발명이 개시하지 않은 본 기술분야에서의 공지된 상식 또는 통상적인 기술수단을 포함한다. 명세서와 실시예는 예시적인 것일 뿐 본 발명의 진정한 범위와 기술적 사상은 하기의 청구범위에 의해 밝혀질 것이다.

본 발명은 상기에서 설명하고 도면에 도시한 정확한 구조에 한정되는 것이 아니라 그 범위를 벗어나지 않는 한 다양한 수정과 변경을 할 수 있음을 이해해야 한다. 본 발명의 범위는 첨부되는 청구범위에 의해서만 한정된다.

Claims

동영상 재생 방법에 있어서,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함하며,
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하는 단계;
상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하는 단계;
상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계;
상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함하는 동영상 재생 방법.
삭제
동영상 재생 방법에 있어서,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하는 단계;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계; 및
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하는 단계를 포함하며,
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 단계는,
상기 타깃 대상 정보에 대응되는 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 단계를 포함하는 동영상 재생 방법.
청구항3에 있어서,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하는 단계; 및
상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함하는 동영상 재생 방법.
청구항3에 있어서,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계는,
상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하는 단계를 포함하는 동영상 재생 방법.
청구항3 내지 청구항5 중 어느 한 항에 있어서,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 단계 이전에,
모니터링 동영상을 획득하는 단계;
상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하는 단계;
상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계; 및
상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계를 더 포함하는 동영상 재생 방법.
청구항6에 있어서,
상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하는 단계는,
상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대한 안면 인식을 통해 안면 특징을 얻는 단계;
상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하는 단계; 및
상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하는 단계를 포함하는 동영상 재생 방법.
청구항6에 있어서,
상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,
상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하는 단계; 및
상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하는 단계를 포함하는 동영상 재생 방법.
청구항6에 있어서,
상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하는 단계는,
상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하는 단계를 포함하는 동영상 재생 방법.
동영상 재생 장치에 있어서,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈; 및
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하기 위한 재생 모듈을 포함하며,
상기 결정 모듈은,
상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하기 위한 제1 결정 유닛;
상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하기 위한 제2 결정 유닛;
상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 제3 결정 유닛;
상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛을 포함하는 동영상 재생 장치.
삭제
동영상 재생 장치에 있어서,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하기 위한 수신 모듈;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하기 위한 결정 모듈; 및
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 하기 위한 재생 모듈을 포함하며,
상기 결정 모듈은,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하기 위한 제1 획득 유닛; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하기 위한 구성 유닛을 포함하는 동영상 재생 장치.
청구항12에 있어서,
상기 제1 획득 유닛은,
상기 인덱스 라이브러리에 키워드와 모니터링 시점 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 모니터링 시점 사이의 대응관계 중에서 적어도 하나의 모니터링 시점을 획득하기 위한 제1 획득 서브 유닛; 및
상기 적어도 하나의 모니터링 시점에 기반하여 상기 모니터링 동영상 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제2 획득 서브 유닛을 포함하는 동영상 재생 장치.
청구항12에 있어서,
상기 제1 획득 유닛은,
상기 인덱스 라이브러리에 키워드와 동영상 이미지 사이의 대응관계가 저장될 경우, 상기 타깃 대상 정보에 대응되는 상기 타깃 키워드에 기반하여 상기 키워드와 동영상 이미지 사이의 대응관계 중에서 적어도 1프레임의 동영상 이미지를 획득하기 위한 제3 획득 서브 유닛을 포함하는 동영상 재생 장치.
청구항12 내지 청구항14 중 어느 한 항에 있어서,
상기 결정 모듈은,
모니터링 동영상을 획득하기 위한 제2 획득 유닛;
상기 모니터링 동영상 중의 각 프레임의 동영상 이미지에 대하여, 지정된 분류 모형에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 대상 카테고리를 결정하기 위한 제4 결정 유닛;
상기 대상 카테고리에 기반하여 상기 동영상 이미지에 포함된 대상이 속하는 키워드를 결정하기 위한 제5 결정 유닛; 및
상기 키워드와 상기 모니터링 동영상에 기반하여 상기 인덱스 라이브러리를 생성하기 위한 생성 유닛을 더 포함하는 동영상 재생 장치.
청구항15에 있어서,
상기 제5 결정 유닛은,
상기 대상 카테고리가 사람일 경우, 상기 동영상 이미지에 포함된 대상에 대하여 안면 인식을 진행하여 안면 특징을 얻기 위한 인식 서브 유닛;
상기 안면 특징에 기반하여 저장된 안면 특징과 신원 식별자 사이의 대응관계 중에서 대응되는 신원 식별자를 획득하기 위한 제4 획득 서브 유닛; 및
상기 신원 식별자를 상기 동영상 이미지에 포함된 대상이 속하는 키워드로 결정하기 위한 제1 결정 서브 유닛을 포함하는 동영상 재생 장치.
청구항15에 있어서,
상기 생성 유닛은,
상기 모니터링 동영상 중에서 상기 동영상 이미지가 위치한 모니터링 시점을 결정하기 위한 제2 결정 서브 유닛; 및
상기 키워드와 상기 모니터링 시점을 상기 인덱스 라이브러리에 포함된 키워드와 모니터링 시점 사이의 대응관계에 저장하기 위한 제1 저장 서브 유닛을 포함하는 동영상 재생 장치.
청구항15에 있어서,
상기 생성 유닛은,
상기 키워드와 상기 동영상 이미지를 상기 인덱스 라이브러리에 포함된 키워드와 동영상 이미지 사이의 대응관계에 저장하기 위한 제2 저장 서브 유닛을 포함하는 동영상 재생 장치.
동영상 재생 장치에 있어서,
프로세서; 및
상기 프로세서가 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하되,
상기 프로세서는,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하고;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며;
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 구성되며,
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 것은,
상기 타깃 대상 정보가 타깃 대상이 위치한 타깃 이미지를 포함할 경우, 지정된 분류 모형과 상기 타깃 이미지에 기반하여 상기 타깃 대상이 속하는 타깃 카테고리를 결정하는 것;
상기 타깃 카테고리에 기반하여 상기 타깃 대상이 속하는 타깃 키워드를 결정하는 것;
상기 타깃 키워드에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 것;
상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 것; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 것을 포함하는 동영상 재생 장치.
동영상 재생 장치에 있어서,
프로세서; 및
상기 프로세서가 실행 가능한 인스트럭션을 저장하기 위한 메모리를 포함하되,
상기 프로세서는,
타깃 대상이 위치한 타깃 이미지 또는 상기 타깃 대상이 속하는 타깃 키워드를 포함하는 타깃 대상 정보를 반송하는 재생 요청을 수신하고;
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하며;
상기 동영상 세그먼트를 단말기에 송신하여 상기 단말기가 상기 동영상 세그먼트를 재생하도록 구성되며,
상기 타깃 대상 정보에 기반하여 상기 타깃 대상이 모니터링 동영상에 위치한 동영상 세그먼트를 결정하는 것은,
상기 타깃 대상 정보에 대응되는 상기 타깃 키워드와 저장된 인덱스 라이브러리에 기반하여 상기 타깃 대상이 상기 모니터링 동영상에 위치한 적어도 1프레임의 동영상 이미지를 획득하는 것; 및
상기 적어도 1프레임의 동영상 이미지로 상기 타깃 대상이 상기 모니터링 동영상에 위치한 동영상 세그먼트를 구성하는 것을 포함하는 동영상 재생 장치.