JP2018503148A - ビデオ再生のための方法および装置 - Google Patents

ビデオ再生のための方法および装置 Download PDF

Info

Publication number
JP2018503148A
JP2018503148A JP2016549720A JP2016549720A JP2018503148A JP 2018503148 A JP2018503148 A JP 2018503148A JP 2016549720 A JP2016549720 A JP 2016549720A JP 2016549720 A JP2016549720 A JP 2016549720A JP 2018503148 A JP2018503148 A JP 2018503148A
Authority
JP
Japan
Prior art keywords
video
target object
keyword
target
video image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016549720A
Other languages
English (en)
Other versions
JP6419201B2 (ja
Inventor
▲張▼▲濤▼
▲陳▼志▲軍▼
▲龍▼▲飛▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2018503148A publication Critical patent/JP2018503148A/ja
Application granted granted Critical
Publication of JP6419201B2 publication Critical patent/JP6419201B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/232Content retrieval operation locally within server, e.g. reading video streams from disk arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/278Content descriptor database or directory service for end-user access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本開示の実施例は、ビデオ再生のための方法および装置に関し、インターネット技術分野に属する。前記方法は、再生要求を受信し、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含むことと、前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することと、前記ビデオセグメントを端末に送信し、前記端末に前記ビデオを再生させることとを含む。【選択図】図2

Description

本願は、出願番号201510713118.3、出願日2015年10月28日の中国特許出願に基づいて提出され、且つ、当該中国特許出願の優先権を主張しており、当該中国特許出願の全ての内容が本願に援用される。
本開示は、インターネット技術分野に関し、特にビデオ再生のための方法および装置に関する。
カメラの普及に伴い、カメラを使用してリアルタイムに監視することは、ますます人気とってきている。カメラを使用してリアルタイムに監視して取得された監視ビデオが時間的に連続性を有するため、ユーザは、監視ビデオにおける特定オブジェクトの挙動を見たい場合、例えば、ユーザは、監視ビデオにおける赤ちゃんの挙動を見たい場合、ユーザは、監視ビデオの再生中に、監視ビデオの再生進捗を手動で調整する必要があり、監視ビデオを特定オブジェクトの所在するビデオ画面に早送りまたは後戻しさせ、それによって、特定オブジェクトの挙動を見ることが多い。しかし、ユーザが監視ビデオの再生進捗を手動で調整する操作は、比較的煩雑であり、ビデオの再生効率が低下し、従って、ビデオ再生効率を向上させる、ビデオ再生のための方法が必要となる。
関連技術に存在する問題を克服するために、本開示の実施例は、ビデオ再生のための方法および装置を提供する。
本開示の実施例の第一態様によるビデオ再生のための方法は、
再生要求を受信し、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含むことと、
前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することと、
前記ビデオセグメントを端末に送信し、前記端末に前記ビデオセグメントを再生させることとを含む。
第一態様と組み合わせ、前記第一態様の第一可能な実現形態において、前記の前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することは、
前記ターゲットオブジェクト情報にターゲットオブジェクトの所在するターゲット画像が含まれる場合、指定された分類モデルおよび前記ターゲット画像に基づいて、前記ターゲットオブジェクトの所属するターゲット類別を確定することと、
前記ターゲット類別に基づいて、前記ターゲットオブジェクトの所属するターゲットキーワードを確定することと、
前記ターゲットキーワードに基づいて、前記監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することとを含む。
第一態様と組み合わせ、前記第一態様の第二可能な実現形態において、前記の前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することは、
前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することと、
前記少なくとも1フレームのビデオ画像を前記監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントに構成させることとを含む。
第一態様の第二可能な実現形態と組み合わせ、前記第一態様の第三可能な実現形態において、前記の前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
前記インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードと監視時点との対応関係から、少なくとも一つの監視時点を取得することと、
前記少なくとも一つの監視時点に基づいて、前記監視ビデオから少なくとも1フレームのビデオ画像を取得することとを含む。
第一態様の第二可能な実現形態と組み合わせ、前記第一態様の第四可能な実現形態において、前記の前記ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
前記インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードとビデオ画像との対応関係から、少なくとも1フレームのビデオ画像を取得することとを含む。
第一態様の第二可能な実現形態〜第一態様の第四可能な実現形態のいずれかの可能な実現形態と組み合わせ、前記第一態様の第五可能な実現形態において、前記ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得する前に、さらに
監視ビデオを取得することと、
前記監視ビデオの各フレームのビデオ画像に対して、指定された分類モデルに基づいて、前記ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別を確定することと、
前記オブジェクト類別に基づいて、前記ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することと、
前記キーワードおよび前記監視ビデオに基づいて、前記インデックスライブラリを生成することとを含む。
第一態様の第五可能な実現形態と組み合わせ、前記第一態様の第六可能な実現形態において、前記の前記オブジェクト類別に基づいて、前記ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することは、
前記オブジェクト類別が人間である場合、前記ビデオ画像に含まれるオブジェクトに対して顔識別を行い、顔特徴を取得することと、
前記顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から、対応する身元識別子を取得することと、
前記身元識別子を前記ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することとを含む。
第一態様の第五可能な実現形態と組み合わせ、前記第一態様の第七可能な実現形態において、前記の前記キーワードおよび前記監視ビデオに基づいて、前記インデックスライブラリを生成することは、
前記監視ビデオから前記ビデオ画像の所在する監視時点を確定することと、
前記キーワードと前記監視時点を前記インデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶することとを含む。
第一態様の第五可能な実現形態と組み合わせ、前記第一態様の第八可能な実現形態において、前記の前記キーワードおよび前記監視ビデオに基づいて、前記インデックスライブラリを生成することは、
前記キーワードと前記ビデオ画像を前記インデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶することを含む。
本開示の実施例の第二態様によるビデオ再生のための装置は、
再生要求を受信するように構成され、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含む受信モジュールと、
前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定するように構成される確定モジュールと、
前記ビデオセグメントを端末に送信し、前記端末に前記ビデオセグメントを再生させるように構成される送信モジュールとを含む。
第二態様と組み合わせ、前記第二態様の第一可能な実現形態において、前記確定モジュールは、
前記ターゲットオブジェクト情報にターゲットオブジェクトの所在するターゲット画像が含まれる場合、指定された分類モデルおよび前記ターゲット画像に基づいて、前記ターゲットオブジェクトの所属するターゲット類別を確定するように構成される第一確定ユニットと、
前記ターゲット類別に基づいて、前記ターゲットオブジェクトの所属するターゲットキーワードを確定するように構成される第二確定ユニットと、
前記ターゲットキーワードに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定するように構成される第三確定ユニットとを含む。
第二態様と組み合わせ、前記第二態様の第二可能な実現形態において、前記確定モジュールは、
前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードと記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得するように構成される第一取得ユニットと、
前記少なくとも1フレームのビデオ画像を前記ターゲットオブジェクトの所在する前記監視ビデオのビデオセグメントに構成させるように構成される構成ユニットとを含む。
第二態様の第二可能な実現形態と組み合わせ、前記第二態様の第三可能な実現形態において、前記第一取得ユニットは、
前記インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードと監視時点との対応関係から、少なくとも一つ監視時点を取得するように構成される第一の取得サブユニットと、
前記少なくとも一つの監視時間点に基づいて、前記監視ビデオから少なくとも1フレームのビデオ画像を取得するように構成される第二の取得サブユニットとを含む。
第二態様の第二可能な実現形態と組み合わせ、前記第二態様の第四可能な実現形態において、前記第一取得ユニットは、
前記インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードとビデオ画像との対応関係から少なくとも1フレームのビデオ画像を取得するように構成される第三取得サブユニットを含む。
第二態様の第二〜第四可能な実現のいずれかの可能な実現形態と組み合わせ、前記第二態様の第五可能な実現形態において、前記確定モジュールは、さら、
監視ビデオを取得するように構成される第二の取得ユニットと、
前記監視ビデオの各フレームのビデオ画像に対して、指定された分類モデルに基づいて、前記ビデオ画像に含まれるターゲットの所属するターゲット類別を確定するように構成される第四確定ユニットと、
前記オブジェクト類別に基づいて、前記ビデオ画像に含まれるターゲットの所属するキーワードを確定するように構成される第五確定ユニットと、
前記キーワードと前記監視ビデオに基づいて、前記インデックスライブラリを生成するように構成される生成ユニットとを含む。
第二態様の第五可能な実現形態と組み合わせ、前記第二態様の第六可能な実現形態において、前記第五確定ユニットは、
前記オブジェクト類別が人間である場合、前記ビデオ画像に含まれるターゲットに対して顔識別を行い、顔特徴を取得するように構成される識別サブユニットと、
前記顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から、対応する身元識別子を取得するように構成される第四取得サブユニットと、
前記身元識別子を前記ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定するように構成される第一確定サブユニットとを含む。
第二態様の第五可能な実現形態と組み合わせ、前記第二態様の第七可能な実現形態において、前記生成ユニットは、
前記監視ビデオから前記ビデオ画像の所在する監視時点を確定するように構成される第二確定サブユニットと、
前記キーワードと前記監視時点を前記インデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶するように構成される第一記憶サブユニットとを含む。
第二態様の第五可能な実現形態と組み合わせ、前記第二態様の第八可能な実現形態において、前記生成ユニットは、
前記キーワードと前記ビデオ画像を前記インデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶するように構成される第二記憶サブユニットを含む。
本開示の実施例の第三態様によるビデオ再生のための装置は、
プロセッサと、
プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
ここで、前記プロセッサは、
再生要求を受信し、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含み、
前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定し、
前記ビデオセグメントを端末に送信し、前記端末に前記ビデオセグメントを再生させるように構成される。
本開示の実施例において、サーバは、再生要求を受信し、当該再生要求にターゲットオブジェクト情報が携帯され、サーバは、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定し、当該ビデオセグメントを端末に送信し、それによって、端末が直接前記監視ビデオのターゲットオブジェクトが所在するビデオセグメントを再生することができ、当該監視ビデオのターゲットオブジェクト以外のオブジェクトが存在するビデオセグメントを再生することなく、ユーザが当該監視ビデオを手動で調整してターゲットオブジェクトの所在するビデオセグメントを視聴することを回避し、操作が簡単であり、且つ、ビデオの再生効率を向上させる。
以上の一般的な説明と後の詳細な説明は、例示的および説明的なものに過ぎず、本開示を制限できないと理解すべきである。
例示的な実施例によるビデオ再生のための方法に関する実施環境を示す図である。 例示的な実施例によるビデオ再生のための方法のフローチャートである。 例示的な実施例による別のビデオ再生のための方法のフローチャートである。 例示的な実施例によるビデオ再生のための装置のブロック図である。 例示的な実施例による確定モジュールのブロック図である。 例示的な実施例による別の確定モジュールのブロック図である。 例示的な実施例による第一取得ユニットのブロック図である。 例示的な実施例による別の確定モジュールのブロック図である。 例示的な実施例による第五確定ユニットのブロック図である。 例示的な実施例による生成ユニットのブロック図である。 例示的な実施例による別のビデオ再生装置のブロック図である。
ここの図面は、明細書に組み込まれ、且つ、本明細書の一部を構成し、本発明に該当する実施例を示し、明細書と共に本発明の原理を解釈することに用いられる。
ここで例示的な実施例を詳しく説明し、その例は、図面に示される。以下の説明が図面に関する場合、他に示されない限り、異なる図面の同一の数字は、同一または類似の要素を表す。以下の例示的な実施例に記載される実施形態は、本発明と一致する全ての実施形態を代表しているわけではない。逆に、それらは、特許請求の範囲に詳しく記載される、本発明のいくつかの方面に一致する装置と方法の例に過ぎない。
図1は例示的な実施例によるビデオ再生のための方法に関する実施環境を示す図である。図1に示すように、当該実施環境は、サーバ101、スマート撮影装置102と端末103を含むことができる。サーバ101は、サーバ、または複数のサーバから構成されたサーバクラスタ、またはクラウドコンピューティングサービスセンターであってよく、スマート撮影装置102は、スマート撮影カメラであってよく、端末103は、携帯電話、コンピューター、タブレットデバイスなどであってよい。サーバ101とスマート撮影装置102は、インターネットを介して接続されることができ、サーバ101と端末103は、インターネットを介して接続することもできる。サーバ101は、端末から送信された再生要求を受信し、当該再生要求に基づいて、対応するビデオを取得し、且つ、当該ビデオを端末に送信するように構成される。スマート撮影装置102は、監視エリア内の監視ビデオを収集し、監視ビデオをサーバに送信するように構成される。端末103は、サーバから送信されたビデオを受信し、当該ビデオを再生するように構成される。
図2は例示的な実施例によるビデオ再生のための方法のフローチャートである。図2に示すように、当該方法は、サーバに用いられ、以下のステップを含む。
ステップ201において、再生要求を受信し、再生要求にターゲットオブジェクト情報が携帯され、ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像またはターゲットオブジェクトの所属するターゲットキーワードを含む。
ステップ202において、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定する。
ステップ203において、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを端末に送信し、端末に当該ビデオセグメントを再生させる。
本開示の実施例において、サーバは、再生要求を受信し、当該再生要求にターゲットオブジェクト情報が携帯され、サーバは、ターゲットオブジェクト情報に基づいて監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定し、且つ、当該ビデオセグメントを端末に送信し、それによって、端末が直接当該監視ビデオのターゲットオブジェクトが所在するビデオセグメントを再生することができ、当該監視ビデオのターゲットオブジェクト以外のオブジェクトが所在するビデオセグメントを再生する必要がなく、ユーザが監視ビデオを手動で調整して、ターゲットオブジェクトが所在するビデオセグメントを視聴することを回避し、操作が簡単であり、且つビデオの再生効率を向上させる。
本開示の別の実施例において、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することは、
ターゲットオブジェクト情報にターゲットオブジェクトの所在するターゲット画像が含まれる場合、指定された分類モデルおよびターゲット画像に基づいて、ターゲットオブジェクトの所属するターゲット類別を確定することと、
ターゲット類別に基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定することと、
ターゲットキーワードに基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することとを含む。
ここで、サーバは、指定された分類モデルおよびターゲット画像に基づいて、ターゲットオブジェクトの所属するターゲット類別を確定し、当該ターゲット類別に基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定し、これにより、サーバは、当該ターゲットキーワードに基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを迅速に確定することが便利となる。
本開示の別の実施例において、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することは、
ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが存在する少なくとも1フレームのビデオ画像を取得することと、
少なくとも1フレームのビデオセグメントを監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成することとを含む。
端末が監視ビデオのターゲットオブジェクトが所在するビデオセグメントを取得するために、再生要求を送信し、ビデオセグメントが少なくとも1フレームのビデオ画像から構成されることができ、従って、サーバは、ターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を迅速に取得でき、ビデオの取得効率が向上される。
本開示の別の実施例において、ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、ターゲットオブジェクト情報に対応するターゲットキーワードに基づいて、キーワードと監視時点との対応関係から、少なくとも一つの監視時点を取得することと、
少なくとも一つの時点に基づいて、監視ビデオから少なくとも1フレームのビデオ画像を取得することとを含む。
監視ビデオに当該監視ビデオに含まれる各フレームのビデオ画像に対応する監視時点が含まれるため、サーバは、ターゲットキーワードに対応する少なくとも一つ監視時点を確定し、且つ、監視ビデオから当該少なくとも一つの監視時点に対応する少なくとも一つのビデオ画像を取得することができ、ビデオ画像の取得正確性が向上される。
本開示の別の実施例において、ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、ターゲットオブジェクト情報に対応するターゲットキーワードに基づいて、キーワードとビデオ画像との対応関係から、少なくとも1フレームのビデオ画像を取得することを含む。
ここで、サーバは、ターゲットキーワードに基づいて、直接ターゲットオブジェクトに対応する少なくとも1フレームのビデオ画像を取得し、これにより、ビデオ画像の取得効率が向上される。
本開示の別の実施例において、ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得する前に、さらに、
ビデオ画像を取得することと、
監視ビデオの各フレームのビデオ画像に対して、指定された分類モデルに基づいて、ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別を確定することと、
オブジェクト類別に基づいて、ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することと、
キーワードおよび監視ビデオに基づいて、インデックスライブラリを生成することとを含む。
ここで、サーバは、キーワードおよび監視ビデオに基づいて、インデックスライブラリを生成し、これにより、サーバは、再生要求を受信した場合、当該インデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することが便利となり、ビデオ画像の取得效率が向上される。
本開示の別の実施例において、オブジェクト類別に基づいて、ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することは、
オブジェクト類別が人間である場合、ビデオ画像に含まれるオブジェクトに対して顔識別を行い、顔特徴を取得することと、
顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から、対応する身元識別子を取得することと、
身元識別子をビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することとを含む。
ここで、オブジェクト類別が人間である場合、サーバは、オブジェクトの身元識別子を当該オブジェクトの所属するターゲットキーワードとして確定し、これにより、端末は、監視ビデオの特定な身元を有する人間がいる少なくとも1フレームのビデオ画像を取得することが便利となり、ある人間のビデオセグメントをターゲットに取得することができる。
本開示の別の実施例において、キーワードおよび監視ビデオに基づいて、インデックスライブラリを生成することは、
監視ビデオから、ビデオ画像の所在する監視時点を確定することと、
キーワードと監視時点をインデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶することとを含む。
監視ビデオに各フレームのビデオ画像に対応する監視時点が含まれているため、サーバは、キーワードと監視時点をインデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶し、これにより、サーバは、キーワードに基づいて、対応する監視時点を取得し、さらに監視ビデオから当該監視時点に対応するビデオ画像を取得することが便利となり、ビデオ画像の取得正確性が向上される。
本開示の別の実施例において、キーワードおよび監視ビデオに基づいて、インデックスライブラリを生成することは、
キーワードとビデオ画像をインデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶することを含む。
ここで、サーバは、キーワードとビデオ画像をインデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶し、これにより、サーバは、キーワードに基づいて、対応するビデオ画像を直接取得することが便利となり、ビデオ画像の取得効率が向上される。
前記すべての選択可能な技術的解決手段は、任意の組合せにより本開示の選択可能な実施例を構成できるので、本開示の実施例で説明は、省略する。
図3は例示的な実施例によるビデオ再生のための方法のフローチャートである。図3に示すように、当該方法は、以下のステップを含む。
ステップ301において、サーバは、再生要求を受信し、当該再生要求にターゲットオブジェクト情報が携帯され、ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像またはターゲットオブジェクトの所属するターゲットキーワードを含む。
当該再生要求は、端末によって直接送信されることができ、当然、当該再生要求は、端末によって他のデバイスに送信され、さらに他のデバイスによってサーバに送信されることもでき、本開示の実施例でそれに対して具体的に限定しないと説明すべきである。
また、端末が再生要求を送信する場合、当該端末は、再生命令を受信した場合に、サーバまたは他のデバイスに再生要求を送信することができる。
再生命令は、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを取得するように構成され、且つ、再生命令は、ユーザによってトリガされることができ、ユーザは、指定された操作によりトリガすることができ、当該指定された操作は、クリック操作、スライド操作、音声操作などであってよく、本開示の実施例でそれに対して具体的に限定しないと説明すべきである。
また、ターゲット画像は、ターゲットオブジェクトが含まれる画像であり、且つ、前記ターゲット画像は、ターゲットオブジェクトの写真でり、または、端末が監視ビデオを再生する過程において、端末が監視ビデオのビデオ画像に基づいて選択命令を受信した場合、前記選択命令にターゲットオブジェクトが携帯される画像であってよく、当然、ターゲット画像は、その他の方式により取得されることができ、本開示の実施例でそれに対して具体的に限定しない。
さらに、ターゲットキーワードは、ターゲットオブジェクトと唯一に対応し、且つ、ターゲットキーワードは、ターゲットオブジェクトの所属する類別、ターゲットオブジェクトの身元識別子などであってよく、本開示の実施例でそれに対して具体的に限定しない。
ステップ302において、サーバは、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定する。
ターゲットオブジェクト情報にターゲットオブジェクトの所在する画像またはターゲットオブジェクトの所属するターゲットキーワードが含まれるので、ターゲットオブジェクト情報に含まれる異なる内容に基づいて、サーバは、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することは、以下の2つの方式がある。
第一方式:ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得し、且つ、当該少なくとも1フレームのビデオ画像を当該監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成する。
端末が監視ビデオのターゲットオブジェクトが所在するビデオセグメントを取得するために、再生請求を送信し、ビデオセグメントが少なくとも1フレームのビデオ画像から構成されることができ、従って、サーバは、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得し、且つ、前記少なくとも1フレームのビデオ画像を監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成することができる。
ターゲットオブジェクト情報にターゲットキーワードが含まれる場合、ターゲットオブジェクト情報に対応するターゲットキーワードは、当該ターゲットオブジェクト情報に含まれるターゲットキーワードであってよく、ターゲットオブジェクト情報にターゲット画像が含まれる場合、ターゲットオブジェクト情報に対応するターゲットキーワードは、当該ターゲット画像により取得されることができると説明すべきである。
ここで、サーバは、ターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得する場合、インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、サーバは、ターゲットキーワードに基づいて、当該キーワードと監視時点との対応関係から、少なくとも一つの監視時点を取得し、且つ、当該少なくとも一つの監視時点に基づいて、監視ビデオから少なくとも1フレームのビデオ画像を取得する。または、インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、サーバは、ターゲットキーワードに基づいて、当該キーワードとビデオ画像との対応関係から少なくとも1フレームのビデオ画像を取得する。
監視ビデオに当該監視ビデオに含まれる各フレームのビデオ画像に対応する監視時点が含まれるため、サーバは、ターゲットキーワードに基づいて、当該キーワードと監視時点との対応関係から、当該ターゲットキーワードに対応する少なくとも一つの監視時点を取得した場合、サーバは、当該少なくとも一つの監視時点に基づいて、当該監視ビデオから、当該少なくとも一つの監視時点に対応する少なくとも1フレームのビデオ画像を取得することができる。
サーバが当該少なくとも一つの監視時点に基づいて、監視ビデオから少なくとも1フレームのビデオ画像を取得する過程については、関連技術を参考できるため、本開示の実施例で詳しく説明しない。
例えば、インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、ターゲットキーワードが楊楽楽であると仮定する場合、サーバは、ターゲットキーワード楊楽楽に基づいて、下記の表1に示すキーワードと監視時点との対応関係から、楊楽楽に対応する少なくとも一つの監視時点2015/02/03ー21:08:31、2015/03/05−11:08:11、2015/08/03−09:05:31を取得することができ、その後、サーバは、監視ビデオから2015/02/03−21:08:31、2015/03/05−11:08:11、2015/08/03−09:05:31の各々に対応するビデオ画像を取得することができる。
本開示の実施例において、前記表1に示されるキーワードと監視時点との対応関係だけを例として説明するが、前記表1は、本開示の実施例に対して限定を構成しないと説明すべきである。
また、例えば、インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、ターゲットキーワードが楊楽楽であると仮定する場合、サーバは、ターゲットキーワード楊楽楽に基づいて、下記の表2に示すキーワードとビデオ画像との対応関係から、楊楽楽に対応する少なくとも1フレームのビデオ画像1.JPEG、2.JPEG、3.JPEGを取得することができる。
本開示の実施例において、前記表2に示すキーワードとビデオ画像との対応関係だけを例として説明するが、前記表2は、本開示の実施例に対して限定を構成しないと説明すべきである。
ここで、サーバが当該少なくとも1フレームのビデオ画像を監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成する過程については、関連技術を参考できるため、本発明の実施例で詳しく説明しない。
さらに、サーバがターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得する前に、さらに下記のステップ(1)−(4)によりインデックスライブラリを生成することができる。
(1)サーバは、監視ビデオを取得する。
サーバは、スマート撮影装置から当該監視ビデオを取得でき、当然、当該スマート撮影装置は、当該監視ビデオを他の装置に送信することもでき、これにより、サーバは、他の装置から当該監視ビデオを取得することが可能となり、本開示の実施例でそれに対して詳しく限定しないと説明すべきである。
ここで、スマート撮影装置は、監視エリア内の監視ビデオを収集するように構成され、且つ、スマート撮影装置が監視エリア内の監視ビデオを収集する過程については、関連技術を参考できるため、本開示の実施例でそれに対して詳しく限定しない。
また、スマート撮影装置は、有線または無線ネットワークを介してサーバまたは他の装置と通信することができ、スマート撮影装置が無線ネットワークを介してサーバまたは他の装置と通信する場合、スマート撮影装置は、内蔵されたワイファイ(英語:WIrelss−FIdelity、略称:WAIFI)、ブルートース(登録商標)または他の無線通信チップを介してサーバまたは他の装置と通信することができ、本開示の実施例でそれに対して詳しく限定しない。
(2)当該監視ビデオの各フレームのビデオ画像に対し、サーバは、指定された分類モデルに基づいて、当該ビデオ画像に含まれるオブジェクトの所属する類別を確定する。
指定された分類モデルは、画像に対応するオブジェクト類別を確定することに用いられ、且つ、指定された分類モデルは、予め構築されることができると説明すべきである。
指定された分類モデルが予め構築されることができるため、且つ、オブジェクト類別の確定効率を向上させるために、指定された分類モデルは、一般的に、プリセット寸法の画像を処理し、当該画像に含まれるオブジェクトの所属するオブジェクト類別を確定することができ、従って、サーバは、指定された分類モデルに基づいて、当該ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別を確定する場合、サーバは、監視ビデオのビデオ画像に、当該オブジェクトの所在エリアを切り取り、オブジェクト画像を取得し、且つ、オブジェクト画像の寸法をプリセット寸法に処理し、その後、指定された分類モデルおよび処理されたオブジェクト画像に基づいて、当該オブジェクトの所属するオブジェクト類別を確定することができる。
ここで、サーバは、監視ビデオのビデオ画像に、前記オブジェクトの所在エリアを切り取り、オブジェクト画像を取得した場合、当該オブジェクトの所在するビデオ画像から当該オブジェクトの外接矩形を切り取り、且つ、当該外接矩形を監視ビデオの当該オブジェクトが所在する画像エリア、即ちオブジェクト画像として確定することができる。当然、サーバは、他の方式で当該オブジェクトの所在エリアを切り取り、オブジェクト画像を取得することができるが、本開示の実施例でそれに対して詳しく限定しない。
また、プリセット寸法は、予め設定されることができ、例えば、プリセット寸法は、224*224画素、300*300画素などであり、本開示の実施例でそれに対して詳しく限定しない。
サーバが指定された分類モデルおよび処理されたオブジェクト画像に基づいて、当該オブジェクトの所属するオブジェクト類別を確定する過程については、関連技術を参考できるため、本開示の実施例でそれに対して詳しく限定しないと説明すべきである。
(3)サーバは、当該ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別に基づいて、当該ビデオ画像に含まれるオブジェクトの所属するキーワードを確定する。
当該ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別が人間、またはペット、または他の物体である可能性があり、当該ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別が人間またはペットである場合、端末は、監視ビデオの特定の身元を有する人間またはペットがいるビデオセグメントを取得する必要があり、従って、サーバが当該ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別に基づいて、当該ビデオ画像に含まれるオブジェクトの所属するキーワードを確定する操作は、ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別が人間である場合、サーバが当該オブジェクトに対して顔識別を行い、顔特徴を取得し、その後、当該顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から、対応する身元識別子を取得し、且つ、当該身元識別子を当該ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することであってよい。当該ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別がペットである場合、サーバは、当該ビデオ画像に基づいて、ペット識別子を取得し、且つ、当該ペット識別子に基づいて、記憶されたペット識別子と身元識別子との対応関係から、対応する身元識別子を取得し、当該身元識別子を当該ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定する。ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別が人間、ペットではない場合、サーバは、直接当該オブジェクト類別を当該ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することができる。
サーバが当該オブジェクトに対して顔識別を行い、顔特徴を取得する過程については、関連技術を参考できるため、本開示の実施例で詳しく限定しないと説明すべきである。
また、ペット識別子は、当該ペットを唯一に識別することに用いられ、且つ、当該ペット識別子は、当該ペットに付けられた二次元コード、バーコード、または他の識別可能な識別子で取得されることができ、本開示の実施例でそれに対して詳しく限定しないと説明すべきである。
例えば、ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別が人間である場合、サーバは、当該オブジェクトに対して顔識別を行い、顔特徴Aを取得し、その後、顔特徴Aに基づいて、下記の表3に示す顔特徴と身元識別子との対応関係から、Aに対応する身元識別子である楊楽楽を取得した場合、サーバは、楊楽楽を当該ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することができる。
本開示の実施例において、前記表3に示す顔特徴と身元識別子との対応関係だけを例として説明するが、前記表3は、本開示の実施例に対して限定を構成しないと説明すべきである。
また、例えば、ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別がペットである場合、サーバは、当該ビデオ画像に基づいて、当該ペットに付けられた二次元コード、バーコードまたは他の識別可能な識別子をスキャンし、ペット識別子ID1を取得し、その後、当該ペット識別子ID1に基づいて、下記の表4に示すペット識別子と身元識別子との対応関係から、ID1に対応する身元識別子である豆豆を取得した場合、サーバは、豆豆を当該ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することができる。
本開示の実施例に、前記表4に示すぺット識別子と身元識別子との対応関係だけを例として説明するが、前記表4は、本開示の実施例に対して限定を構成しないと説明すべきである。
さらに、サーバは、当該顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から、対応する身元識別子を取得する前に、サーバは、端末から送信された第一設定情報を受信でき、当該第一設置情報に当該オブジェクトの身元識別子および当該オブジェクトの顔画像が携帯され、サーバは、当該顔画像に対して特徴抽出を行い、当該オブジェクトの顔特徴を取得し、当該顔特徴と当該身元識別子を顔特徴と身元識別子との対応関係に記憶する。
例えば、端末から送信された第一設定情報に身元識別子と顔画像が携帯され、且つ、当該身元識別子が楊楽楽であり、サーバは、当該顔画像に対して、特徴抽出を行い、顔特徴Aを取得した場合、サーバは、Aと楊楽楽を表3に示す顔特徴と身元識別子との対応関係に記憶することができる。
さらに、サーバは、当該ペット識別子に基づいて、記憶されたペット識別子と身元識別子との対応関係から、対応する身元識別子を取得する前に、サーバは、端末から送信された第二設定情報を受信でき、当該第二設定情報に当該オブジェクトの身元識別子および当該オブジェクトのペット識別子が携帯され、サーバは、当該ペット識別子と当該身元識別子を顔特徴と身元識別子との対応関係に記憶する。
例えば、端末から送信された第二設定情報に身元識別子とペット識別子が携帯され、且つ身元識別子が豆豆であり、ペット識別子がID1である場合、サーバは、ID1と豆豆を表4に示すペット識別子と身元識別子との対応関係に記憶することができる。
(4)サーバは、当該キーワードと当該監視ビデオに基づいて、インデックスライブラリを生成する。
インデックスライブラリにキーワードと監視時点との対応関係だけではなく、キーワードとビデオ画像との対応関係が記憶されることができるので、サーバが当該キーワードと当該監視ビデオとの対応関係に基づいて、インデックスライブラリを生成する操作は、インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、サーバが当該監視ビデオから、当該ビデオ画像の所在する監視時点を確定し、当該キーワードと当該監視時点をインデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶することであってよい。インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、サーバは、当該キーワードと当該ビデオ画像をインデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶する。
監視ビデオに当該監視ビデオの各フレームのビデオ画像に対応する監視時点が含まれるため、サーバは、あるオブジェクトのビデオ画像が存在することを確定した場合、当該ビデオ画像に基づいて、当該ビデオ画像の所属する監視ビデオから当該ビデオ画像に対応する監視時点を取得することができ、その後、サーバは、当該オブジェクトの所属するキーワードと当該監視時点をインデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶することができる。
例えば、当該オブジェクトの所属するキーワードが楊楽楽であり、サーバが当該監視ビデオから、楊楽楽がいるビデオ画像の所在する監視時点が2015/08/03−09:05:31であることを確定した場合、サーバは、楊楽楽と2015/08/03−09:05:31を表1に示すキーワードとビデオ画像との対応関係に記憶することができる。
さらに、例えば、当該オブジェクトの所属するキーワードが楊楽楽であり、当該監視ビデオの楊楽楽がいるビデオ画像が3.JPEGである場合、サーバは、楊楽楽と3.JPEGを表2に示すキーワードとビデオ画像との対応関係に記憶することができる。
第二方式:ターゲットオブジェクト情報にターゲットオブジェクトの所在するターゲット画像が含まれる場合、サーバは、指定された分類モデルとターゲット画像に基づいて、ターゲットオブジェクトの所属するターゲット類別を確定し、且つ、ターゲット類別に基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定し、さらに、ターゲットキーワードに基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定する。
ここで、サーバは、指定された分類モデルとターゲット画像に基づいて、ターゲットオブジェクトの所属するターゲット類別を確定した場合、サーバは、ターゲット画像の寸法をプリセット寸法に処理し、指定された分類モデルと処理されたターゲット画像に基づいて、当該ターゲット画像に含まれるターゲットオブジェクトの所属するターゲット類別を確定することができる。
サーバが指定された分類モデルと処理されたターゲット画像に基づいて、当該ターゲットオブジェクトの所属するターゲット類別を確定する過程については、関連技術を参考できるため、本開示の実施例で詳しく説明しないと説明すべきである。
サーバがターゲット類別に基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定する過程は、ステップ302の第一方式におけるステップ(3)の確定過程と類似するので、本開示の実施例で説明は、省略すると説明すべきである。
また、サーバがターゲットキーワードに基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定する過程は、ステップ302の第一方式における確定過程と同様であるので、本開示の実施例で説明は、省略すると説明すべきである。
ステップ303、端末は、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを端末に送信し、端末に当該ビデオセグメントを再生させる。
端末は、当該ビデオセグメントを再生する場合、端末に設置された再生モジュールにより再生できるだけではなく、当然、端末は、自体にインストールされた再生アプリケーションプログラムにより再生でき、本開示の実施例でそれに対して詳しく限定しないと説明すべきである。
本開示の実施例において、サーバは、監視ビデオを取得し、指定された分類モデルに基づいて当該ターゲット画像に含まれるターゲットオブジェクトの所属するオブジェクト類別を確定し、さらに当該オブジェクト類別に基づいて、当該オブジェクトの所属するキーワードを確定し、当該キーワードと当該キーワードに対応する監視時点または当該キーワードと当該キーワードに対応するビデオ画像をインデックスライブラリに記憶し、その後、サーバは、再生要求を受信した場合、当該再生要求に携帯されるターゲットオブジェクト情報に基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定し、且つ、当該ターゲットキーワードと記憶されたインデックスライブラリに基づいて、当該監視ビデオの当該ターゲットオブジェクトが所在する、少なくとも1フレームのビデオ画像を取得し、当該少なくとも1フレームのビデオ画像を監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成し、さらに当該ビデオセグメントを端末に送信し、これにより、端末が直接当該監視ビデオのターゲットオブジェクトが存在するビデオセグメントを再生することが可能となり、当該監視ビデオの当該ターゲットオブジェクト以外のオブジェクトが所在するビデオセグメントを再生する必要がなく、さらに。ユーザが当該監視ビデオの再生を手動で調整してターゲットオブジェクトが所在するビデオを視聴することを回避し、操作が簡単であり、かつビデオの再生効率を向上させる。
図4は例示的な実施例によるビデオ再生のための装置のブロック図である図4を参照し、当該装置は、受信モジュール401、確定モジュール402と送信モジュール403を含む。
受信モジュール401は、再生要求を受信するように構成され、再生要求に情報が携帯され、ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像またはターゲットオブジェクトの所属するターゲットキーワードを含む。
確定モジュール402は、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定するように構成される。
送信モジュール403は、ビデオセグメントを端末に送信し、端末にビデオセグメントを再生させるように構成される。
本開示の別の実施例において、図5を参照し、当該確定モジュール402は、
ターゲットオブジェクト情報にターゲットオブジェクトの所在するターゲット画像が含まれる場合、指定された分類モデルとターゲット画像に基づいて、ターゲットオブジェクトの所属するターゲット類別を確定するように構成される第一確定ユニット4021と、
ターゲット類別基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定するように構成される第二確定ユニット4022と、
ターゲットキーワードに基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定するように構成される第三確定ユニット4023とを含む。
本開示の別の実施例において、図6を参照し、当該確定モジュール402は、第一取得ユニット4024と構成ユニット4025を含む。
第一取得ユニット4024は、ターゲットオブジェクト情報に対応するターゲットキーワードと記憶されるインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得するように構成される。
構成ユニット4025は、少なくとも1フレームのビデオ画像を監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成するように構成される。
本開示の別の実施例において、図7を参照し、当該第一取得ユニット4024は、第一取得サブユニット40241と第二取得サブユニット40242を含む。
第一取得サブユニット40241は、インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、ターゲットオブジェクト情報に対応するターゲットキーワードに基づいて、キーワードと監視時点との対応関係から、少なくとも一つの監視時点を取得するように構成される。
第二取得サブモジュール40242は、少なくとも一つの監視時点に基づいて、監視ビデオから少なくとも1フレームのビデオ画像を取得するように構成される。
本開示の別の実施例において、当該第一取得サブユニット4024は、
第三取得サブユニットールは、インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、ターゲットオブジェクト情報に対応するターゲットキーワードに基づいて、キーワードとビデオ画像との対応関係から、少なくとも1フレームのビデオ画像を取得するように構成される。
本開示の別の実施例において、図8を参照し、当該確定モジュール402は、さらに第二取得ユニット4026、第四確定ユニット4027、第五確定ユニット4028と生成ユニット4029を含む。
第二取得ユニット4026は、スマート撮影装置から送信された監視ビデオを受信するように構成される。
第四確定ユニット4027は、監視ビデオ内の各フレームのビデオ画像に対して、指定された分類モデルに基づいて、ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別を確定するように構成される。
第五確定ユニット4028は、オブジェクト類別に基づいて、ビデオ画像に含まれるオブジェクトの所属するキーワードを確定するように構成される。
生成ユニット4029は、キーワードと監視ビデオに基づいて、インデックスライブラリを生成するように構成される。
本開示の別の実施例において、図9を参照し、当該第五確定ユニット4028は、識別サブユニット40281、第四取得サブユニット40282、第一確定サブユニット40283を含む。
識別サブユニット40281は、オブジェクト類別が人間である場合、ビデオ画像に含まれるオブジェクトに対して、顔識別を行い、顔特徴を取得するように構成される。
第四取得サブユニット40282は、顔特徴に基づいて、記憶された顔特徴と身元識別子の対応関係から、対応する身元識別子を取得するように構成される。
第一確定サブユニット40283は、身元識別子をビデオ画像に含まれるオブジェクトの所属するキーワードとして確定するように構成される。
本開示の別の実施例において、図10を参照し、当該生成ユニット4029は、第二確定サブユニット40291と第一記憶サブユニット40292を含む。
第二確定サブユニット40291は、監視ビデオからビデオ画像の所在する監視時点を確定するように構成される。
第一記憶サブユニット40292は、キーワードと監視時点をインデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶するように構成される。
本開示の別の実施例において、当該生成ユニット4029は、
キーワードとビデオ画像をインデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶するように構成される第二記憶サブユニットを含む。
本開示の実施例において、サーバは、再生要求を受信し、当該再生要求にターゲットオブジェクト情報が携帯され、サーバは、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定し、当該ビデオセグメントを端末に送信し、これにより、端末が直接当該監視ビデオのターゲットオブジェクトが存在するビデオセグメントを再生することが可能となり、監視ビデオの当該ターゲットオブジェクト以外のオブジェクトが存在するビデオセグメントを再生する必要がなく、さらにユーザが当該監視ビデオの再生を手動で調整してターゲットオブジェクトが所在するビデオを視聴することを回避し、操作が簡単であり、且つビデオの再生効率を向上させる。
前記実施例の装置に関して、その中の各モジュールが操作を実行する具体的な方式は、既に当該方法に関する実施例で詳しく説明されたので、ここで詳しく説明しない。
図11は例示的な実施例によるビデオ再生のための装置1100のブロック図である。例えば、装置1100は、サーバとして提供されることができる。図11を参照し、装置1100は、一つまたは複数のプロセッサが含まれる処理コンポーネント1122、および処理コンポーネント1122で実行可能な命令、例えばアプリケーションプログラムを記憶するように構成される、メモリ1132によって代表されるメモリリソースを含む。メモリ1132に記憶されたアプリケーションプログラムは、それぞれが1グループの命令に対応する一つまたは複数のモジュールを含む。
装置1100は、さらに、装置1100の電源管理を実行するように構成される電源コンポーネント1126、装置1100をネットワークに接続するように構成される有線または無線ネットワークインタフェース1150、および入力/出力(I/O)インタフェース1158を含むことができる。装置1100は、メモリ1132に記憶された操作システム、例えばWindows(登録商標) ServerTM、Mac OS XTM、Unix(登録商標)TM、Linux(登録商標)TM、FreeBSDTMまたは類似のシステムに基づいて操作されることができる。
また、処理コンポーネント1122は、下記のビデオ再生方法を実行するために、命令を実行するように構成され、前記方法は、
再生要求を受信し、再生要求にターゲットオブジェクト情報が携帯され、ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像またはターゲットオブジェクトの所属するターゲットキーワードを含むことと、
ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することと、
監視ビデオのターゲットオブジェクトが所在するビデオセグメントを端末に送信し、端末に当該ビデオセグメントを再生させることとを含む。
本開示の別の実施例において、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することは、
ターゲットオブジェクト情報にターゲットオブジェクトの所在するターゲット画像が含まれる場合、指定された分類モデルとターゲット画像に基づいて、ターゲットオブジェクトの所属するターゲット類別を確定することと、
ターゲット類別に基づいて、ターゲットオブジェクトの所属するターゲットキーワードを確定することと、
ターゲットキーワードに基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することとを含む。
本開示の別の実施例において、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定することは、
ターゲットオブジェクト情報に対応するターゲットキーワードと記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することと、
少なくとも1フレームのビデオ画像を監視ビデオのターゲットオブジェクトが所在するビデオセグメントに構成することとを含む。
本開示の別の実施例において、ターゲットオブジェクト情報に対応するターゲットキーワードと記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、ターゲットオブジェクト情報に対応するターゲットキーワードに基づいて、キーワードと監視時点との対応関係から、少なくとも1フレームの監視時点を取得することと、
少なくとも一つの監視時点に基づいて、監視ビデオから少なくとも1フレームのビデオ画像を取得することとを含む。
本開示の別の実施例において、ターゲットオブジェクト情報に対応するターゲットキーワードと記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、ターゲットオブジェクト情報に対応するターゲットキーワードに基づいて、キーワードとビデオ画像との対応関係から、少なくとも1フレームのビデオ画像を取得することを含む。
本開示の別の実施例において、ターゲットオブジェクト情報に対応するターゲットキーワードと記憶されたインデックスライブラリに基づいて、監視ビデオのターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
監視ビデオを取得することと、
監視ビデオ内の各フレームのビデオ画像に対して、指定された分類モデルに基づいて、ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別を確定することと、
オブジェクト類別に基づいて、ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することと、
キーワードと監視ビデオに基づいて、インデックスライブラリを生成することとを含む。
本開示の別の実施例において、オブジェクト類別に基づいて、ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することは、
オブジェクト類別が人間である場合、ビデオ画像に含まれるオブジェクトに対して顔識別を行い、顔特徴を取得することと、
顔特徴に基づいて、記憶される顔特徴と身元識別子の対応関係から対応する身元識別子を取得することと、
身元識別子をビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することとを含む。
本開示の別の実施例において、キーワードと監視ビデオに基づいてインデックスライブラリを生成することは、
監視ビデオから、ビデオ画像の所在する監視時点を確定することと、
キーワードと監視時点をインデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶することとを含む。
本開示の別の実施例において、キーワードと監視ビデオに基づいてインデックスライブラリを生成することは、
キーワードとビデオ画像をインデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶することを含む。
本開示の実施例において、サーバは、再生要求を受信し、当該再生要求にターゲットオブジェクト情報が携帯され、サーバは、ターゲットオブジェクト情報に基づいて、監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定し、当該ビデオセグメントを端末に送信し、これにより、端末は、直接当該監視ビデオのターゲットオブジェクトが所在するビデオセグメントを再生することが可能となり、当該監視ビデオのターゲットオブジェクト以外のオブジェクトが所在するビデオセグメントを再生する必要がなく、さらにユーザが当該監視ビデオの再生を手動で調整してターゲットオブジェクトの所在するビデオを視聴することを回避し、操作が簡単であり、且つビデオの再生効率を向上させる。
当業者は、明細書を考慮してここで開示された発明を実践した後、本発明の他の実施形態を容易に想到する。本出願は、本発明のいかなる変形、用途または適応性変化をカバーすることを意図しており、これらの変形、用途または適応性変化が本発明の一般的な原理に従って、且つ、本開示の実施例で開示されない本技術分野の公知常識または慣用技術手段を含む。明細書と実施例は、例示的なものと見なされるだけであり、本発明の真の範囲と精神は、以下の特許請求の範囲によって示される。
本発明は、以上に記載され且つ図面に示された精確な構造に限らず、且つ、その範囲から逸脱することなく様々な修正および変更を行うことができると理解すべきである。本発明の範囲は、添付の特許請求の範囲のみによって制限される。
本開示の実施例において、サーバは、再生要求を受信し、当該再生要求にターゲットオブジェクト情報が携帯され、サーバは、ターゲットオブジェクト情報に基づいて監視ビデオのターゲットオブジェクトが所在するビデオセグメントを確定し、且つ当該ビデオセグメントを端末に送信し、これにより、端末は、直接当該監視ビデオのターゲットオブジェクトが所在するビデオセグメントを再生することが可能となり、当該監視ビデオの当該ターゲットオブジェクト以外のオブジェクトが所在するビデオセグメントを再生する必要がなく、ユーザが当該監視ビデオの再生を手動で調整してターゲットオブジェクトの所在するビデオセグメントを視聴することを回避し、操作が簡単であり、且つビデオの再生効率を向上させる。

Claims (19)

  1. ビデオ再生のための方法であって、
    再生要求を受信し、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含むことと、
    前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することと、
    前記ビデオセグメントを端末に送信し、前記端末に前記ビデオセグメントを再生させることとを含む、前記ビデオ再生のための方法。
  2. 前記の前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することは、
    前記ターゲットオブジェクト情報にターゲットオブジェクトの所在する画像が含まれる場合、指定された分類モデルおよび前記ターゲット画像に基づいて、前記ターゲットオブジェクトの所属するターゲット類別を確定することと、
    前記ターゲット類別に基づいて、前記ターゲットオブジェクトの所属するターゲットキーワードを確定することと、
    前記ターゲットキーワードに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することとを含むことを特徴とする
    請求項1に記載の方法。
  3. 前記の前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定することは、
    前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することと、
    前記少なくとも1フレームのビデオ画像を前記監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントに構成することとを含むことを特徴とする
    請求項1に記載の方法。
  4. 前記の前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
    前記インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードと監視時点との対応関係から、少なくとも一つの監視時点を取得することと、
    前記少なくとも一つの監視時点に基づいて、前記監視ビデオから少なくとも1フレームのビデオ画像を取得することとを含むことを特徴とする
    請求項3に記載の方法。
  5. 前記の前記ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得することは、
    前記インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードとビデオ画像との対応関係から、少なくとも1フレームのビデオ画像を取得することを含むことを特徴とする
    請求項3に記載の方法。
  6. 前記の前記ターゲットオブジェクト情報に対応するターゲットキーワードおよび記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得する前に、さらに、
    ビデオ画像を取得することと、
    前記監視ビデオの各フレームのビデオ画像のに対して、指定された分類モデルに基づいて、前記ビデオ画像に含まれるオブジェクトの所属するオブジェクト類別を確定することと、
    前記オブジェクト類別に基づいて、前記ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することと、
    前記キーワードおよび前記監視ビデオに基づいて、前記インデックスライブラリを生成することとを含むことを特徴とする
    請求項3〜5のいずれか1項に記載の方法。
  7. 前記の前記オブジェクト類別に基づいて、前記ビデオ画像に含まれるオブジェクトの所属するキーワードを確定することは、
    前記オブジェクト類別が人間である場合、前記ビデオ画像に含まれるオブジェクトに対して顔識別を行い、顔特徴を取得することと、
    顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から、対応する身元識別子を取得することと、
    前記身元識別子を前記ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定することとを含むことを特徴とする
    請求項6に記載の方法。
  8. 前記の前記キーワードと前記監視ビデオに基づいて、前記インデックスライブラリを生成することは、
    前記監視ビデオから、前記ビデオ画像の所在する監視時点を確定することと、
    前記キーワードと前記監視時点を前記インデックスライブラリに含まれるキーワードと監視時点との対応関係内に記憶することとを含むことを特徴とする
    請求項6に記載の方法。
  9. 前記の前記キーワードと前記監視ビデオに基づいて、前記インデックスライブラリを生成することは、
    前記キーワードと前記ビデオ画像を前記インデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶することを含むことを特徴とする
    請求項6に記載の方法。
  10. ビデオ再生のための装置であって、
    再生要求を受信するように構成され、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含む受信モジュールと、
    前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定するように構成される確定モジュールと、
    前記ビデオセグメントを端末に送信し、端末に前記ビデオセグメントを再生させるように構成される送信モジュールとを含む、前記ビデオ再生のための装置。
  11. 前記確定モジュールは、
    前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像を含む場合、指定された分類モデルおよび前記ターゲット画像に基づいて、前記ターゲットオブジェクトの所属するオブジェクト類別を確定するように構成される第一の確定ユニットと、
    前記ターゲット類別に基づいて、前記ターゲットオブジェクトの所属するターゲットキーワードを確定するように構成される第二確定ユニットと、
    前記ターゲットキーワードに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定するように構成される第三確定ユニットとを含むことを特徴とする
    請求項10に記載の装置。
  12. 前記確定モジュールは、
    前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードと記憶されたインデックスライブラリに基づいて、前記監視ビデオの前記ターゲットオブジェクトが所在する少なくとも1フレームのビデオ画像を取得するように構成される第一の取得ユニットと、
    前記少なくとも1フレームのビデオ画像を前記監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントに構成するように構成される構成ユニットとを含むことを特徴とする
    請求項10に記載の装置
  13. 前記第一取得ユニットは、
    前記インデックスライブラリにキーワードと監視時点との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードと監視時点との対応関係から、少なくとも一つの監視時点を取得するように構成される第一取得サブユニットと、
    前記少なくとも一つの監視時点に基づいて、前記監視ビデオから少なくとも1フレームのビデオ画像を取得するように構成される第二取得サブユニットとを含むことを特徴とする
    請求項12に記載の装置。
  14. 前記第一取得ユニットは、
    前記インデックスライブラリにキーワードとビデオ画像との対応関係が記憶された場合、前記ターゲットオブジェクト情報に対応する前記ターゲットキーワードに基づいて、前記キーワードとビデオ画像との対応関係から少なくとも1フレームのビデオ画像を取得するように構成される第三取得サブユニットを含むことを特徴とする
    請求項12に記載の装置。
  15. 前記確定モジュールは、さらに、
    監視画像を取得するように構成される第二取得ユニットと、
    前記監視ビデオの各フレームのビデオ画像に対して、指定された分類モデルに基づいて、前記ビデオ画像に含まれるオブジェクトの所属するターゲット類別を確定するように構成される第四確定ユニットと、
    前記オブジェクト類別に基づいて、前記ビデオ画像に含まれるオブジェクトの所属するキーワードを確定するように構成される第五確定ユニットと、
    前記キーワードと前記監視ビデオに基づいて、前記インデックスライブラリを生成するように構成される生成ユニットとを含むことを特徴とする
    請求項12〜14のいずれか1項に記載の前記装置。
  16. 前記第五確定ユニットは、
    前記オブジェクト類別が人間である場合、前記ビデオ画像に含まれるオブジェクトに対して、顔識別を行い、顔特徴を取得するように構成される識別サブユニットと、
    前記顔特徴に基づいて、記憶された顔特徴と身元識別子との対応関係から対応する身元識別子を取得するように構成される第四取得サブユニットと、
    前記身元識別子を前記ビデオ画像に含まれるオブジェクトの所属するキーワードとして確定するように構成される第一確定サブユニットとを含むことを特徴とする
    請求項15に記載の装置。
  17. 前記生成ユニットは、
    前記監視ビデオから、前記ビデオ画像の所在する監視時点を確定するように構成される第二確定サブユニットと、
    前記キーワードと前記監視時点を前記インデックスライブラリに含まれるキーワードと監視時点との対応関係に記憶するように構成される第一記憶サブユニットとを含むことを特徴とする
    請求項15に記載の装置。
  18. 前記生成ユニットは、
    前記キーワードと前記ビデオ画像を前記インデックスライブラリに含まれるキーワードとビデオ画像との対応関係に記憶するように構成される第二記憶サブユニットを含むことを特徴とする
    請求項15に記載の装置。
  19. ビデオ再生のための装置であって、
    プロセッサと、
    プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
    ここで、前記プロセッサは、
    再生要求を受信し、前記再生要求にターゲットオブジェクト情報が携帯され、前記ターゲットオブジェクト情報がターゲットオブジェクトの所在するターゲット画像または前記ターゲットオブジェクトの所属するターゲットキーワードを含み、
    前記ターゲットオブジェクト情報に基づいて、監視ビデオの前記ターゲットオブジェクトが所在するビデオセグメントを確定し、
    前記ビデオセグメントを端末に送信し、前記端末に前記ビデオセグメントを再生させるように構成される、ビデオ再生のための装置。
JP2016549720A 2015-10-28 2015-12-29 ビデオ再生のための方法および装置 Active JP6419201B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510713118.3 2015-10-28
CN201510713118.3A CN105357475A (zh) 2015-10-28 2015-10-28 用于视频播放的方法及装置
PCT/CN2015/099593 WO2017071086A1 (zh) 2015-10-28 2015-12-29 用于视频播放的方法及装置

Publications (2)

Publication Number Publication Date
JP2018503148A true JP2018503148A (ja) 2018-02-01
JP6419201B2 JP6419201B2 (ja) 2018-11-07

Family

ID=55333325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016549720A Active JP6419201B2 (ja) 2015-10-28 2015-12-29 ビデオ再生のための方法および装置

Country Status (8)

Country Link
US (1) US20170125060A1 (ja)
EP (1) EP3163473A1 (ja)
JP (1) JP6419201B2 (ja)
KR (1) KR101798011B1 (ja)
CN (1) CN105357475A (ja)
MX (1) MX363623B (ja)
RU (1) RU2016118885A (ja)
WO (1) WO2017071086A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105357475A (zh) * 2015-10-28 2016-02-24 小米科技有限责任公司 用于视频播放的方法及装置
CN106162106A (zh) * 2016-08-26 2016-11-23 浙江大华技术股份有限公司 一种视频监控系统中的数据存储方法及装置
CN106709424B (zh) * 2016-11-19 2022-11-11 广东中科人人智能科技有限公司 一种优化的监控视频存储系统
CN108540817B (zh) * 2018-05-08 2021-04-20 成都市喜爱科技有限公司 视频数据处理方法、装置、服务器及计算机可读存储介质
CN108600779B (zh) * 2018-05-18 2021-04-06 新华三信息技术有限公司 一种基于视频内容的目标对象操作方法及装置
CN109905595B (zh) * 2018-06-20 2021-07-06 成都市喜爱科技有限公司 一种拍摄及播放的方法、装置、设备及介质
US11627248B2 (en) 2019-02-03 2023-04-11 Chengdu Sioeye Technology Co., Ltd. Shooting method for shooting device, and electronic equipment
WO2020238789A1 (zh) * 2019-05-30 2020-12-03 杭州海康威视数字技术股份有限公司 视频回放
CN112019928B (zh) * 2019-05-30 2022-05-06 杭州海康威视数字技术股份有限公司 一种视频回放方法、装置及电子设备
CN110225282B (zh) * 2019-05-31 2023-05-30 山西仨仁行文化传媒有限公司 一种视频录制控制方法、设备及计算机可读存储介质
CN111190934A (zh) * 2019-12-30 2020-05-22 青岛海尔科技有限公司 数据的推送方法及装置、存储介质和电子装置
CN114095738A (zh) * 2020-07-30 2022-02-25 京东方科技集团股份有限公司 视频及直播处理方法、直播系统、电子设备、终端、介质
CN114598919B (zh) * 2022-03-01 2024-03-01 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001037560A1 (fr) * 1999-11-15 2001-05-25 Matsushita Electric Industrial Co., Ltd. Procede et appareil de recherche video
JP2003046989A (ja) * 2001-07-27 2003-02-14 Mitsubishi Electric Corp 映像監視装置および映像監視システム
JP2012221322A (ja) * 2011-04-11 2012-11-12 Toshiba Corp オーサリング支援装置、オーサリング支援方法およびプログラム
JP2013092941A (ja) * 2011-10-26 2013-05-16 Nippon Telegr & Teleph Corp <Ntt> 画像検索装置、方法、及びプログラム
JP2014146367A (ja) * 2008-07-14 2014-08-14 Google Inc ビデオコンテンツ内の個人の自動注釈付けのための方法およびシステム
JP2015114685A (ja) * 2013-12-09 2015-06-22 株式会社日立製作所 映像検索装置、映像検索方法、および記憶媒体

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354624A (ja) 2004-06-14 2005-12-22 Canon Inc 動画処理装置、動画処理方法およびコンピュータプログラム
US7760908B2 (en) * 2005-03-31 2010-07-20 Honeywell International Inc. Event packaged video sequence
US8934709B2 (en) * 2008-03-03 2015-01-13 Videoiq, Inc. Dynamic object classification
CN101299812B (zh) * 2008-06-25 2012-12-05 北京中星微电子有限公司 视频分析和存储方法、系统,及视频检索方法、系统
US9420250B2 (en) * 2009-10-07 2016-08-16 Robert Laganiere Video analytics method and system
EP2622558A4 (en) 2010-09-27 2015-07-01 Hulu Llc METHOD AND DEVICE FOR PROVIDING USER INFORMATION FOR AN IMPROVED ADVERTISING EXPERIENCE
CN102129474B (zh) * 2011-04-20 2015-02-11 浙江宇视科技有限公司 一种视频数据检索方法及其装置和系统
US9244923B2 (en) * 2012-08-03 2016-01-26 Fuji Xerox Co., Ltd. Hypervideo browsing using links generated based on user-specified content features
CN102867042A (zh) * 2012-09-03 2013-01-09 北京奇虎科技有限公司 多媒体文件搜索方法及装置
CN103916626A (zh) * 2013-01-05 2014-07-09 中兴通讯股份有限公司 一种监控录像信息提供方法、装置及视频监控系统
CN104239309A (zh) * 2013-06-08 2014-12-24 华为技术有限公司 视频分析检索服务端、系统及方法
CN103778204A (zh) * 2014-01-13 2014-05-07 北京奇虎科技有限公司 基于语音分析的视频搜索方法、设备及系统
CN104053048A (zh) * 2014-06-13 2014-09-17 无锡天脉聚源传媒科技有限公司 一种视频定位的方法及装置
CN104036018A (zh) * 2014-06-25 2014-09-10 百度在线网络技术(北京)有限公司 视频获取方法和装置
CN104754267A (zh) * 2015-03-18 2015-07-01 小米科技有限责任公司 视频片段标注方法、装置及终端
CN105357475A (zh) * 2015-10-28 2016-02-24 小米科技有限责任公司 用于视频播放的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001037560A1 (fr) * 1999-11-15 2001-05-25 Matsushita Electric Industrial Co., Ltd. Procede et appareil de recherche video
JP2003046989A (ja) * 2001-07-27 2003-02-14 Mitsubishi Electric Corp 映像監視装置および映像監視システム
JP2014146367A (ja) * 2008-07-14 2014-08-14 Google Inc ビデオコンテンツ内の個人の自動注釈付けのための方法およびシステム
JP2012221322A (ja) * 2011-04-11 2012-11-12 Toshiba Corp オーサリング支援装置、オーサリング支援方法およびプログラム
JP2013092941A (ja) * 2011-10-26 2013-05-16 Nippon Telegr & Teleph Corp <Ntt> 画像検索装置、方法、及びプログラム
JP2015114685A (ja) * 2013-12-09 2015-06-22 株式会社日立製作所 映像検索装置、映像検索方法、および記憶媒体

Also Published As

Publication number Publication date
CN105357475A (zh) 2016-02-24
EP3163473A1 (en) 2017-05-03
WO2017071086A1 (zh) 2017-05-04
JP6419201B2 (ja) 2018-11-07
RU2016118885A (ru) 2017-11-22
KR101798011B1 (ko) 2017-11-15
US20170125060A1 (en) 2017-05-04
MX363623B (es) 2019-03-28
MX2016005835A (es) 2017-07-20

Similar Documents

Publication Publication Date Title
JP6419201B2 (ja) ビデオ再生のための方法および装置
US9788065B2 (en) Methods and devices for providing a video
US10003769B2 (en) Video telephony system, image display apparatus, driving method of image display apparatus, method for generating realistic image, and non-transitory computer readable recording medium
US20210310826A1 (en) Method, device and system for processing a flight task
CN104012106B (zh) 使表示不同视点的视频对准
WO2017181777A1 (zh) 全景视频直播方法、装置和系统以及视频源控制设备
EP4262214A1 (en) Screen projection method and apparatus, and electronic device and storage medium
CN105519123A (zh) 实况众包的媒体流
CN110536075B (zh) 视频生成方法和装置
KR20120049391A (ko) 장치
KR20150115617A (ko) 스마트 안경 기반 프람프팅 방법 및 장치
US20150244756A1 (en) Method, Apparatus and System for Determining Terminal That is to Share Real-Time Video
CN105320695A (zh) 图片处理方法及装置
JP7231638B2 (ja) 映像に基づく情報取得方法及び装置
WO2017157135A1 (zh) 媒体信息处理方法及媒体信息处理装置、存储介质
CN105701762B (zh) 一种图片处理方法和电子设备
WO2018076358A1 (zh) 多媒体信息播放方法及系统、标准化服务器、直播终端
WO2014183533A1 (zh) 一种图像处理方法、用户终端、图像处理终端及系统
CN115080941B (zh) 账号登录的方法及电子设备
CN111582240A (zh) 一种对象数量的识别方法、装置、设备和介质
WO2015192615A1 (zh) 一种图像文件共享方法、装置和计算机存储介质
WO2018145572A1 (zh) 实现vr直播的方法、装置和ott业务系统以及存储介质
CN114143429B (zh) 图像拍摄方法、装置、电子设备和计算机可读存储介质
CN112887606B (zh) 拍摄方法、装置和电子设备
WO2019061020A1 (zh) 图像生成方法、图像生成装置和机器可读存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181009

R150 Certificate of patent or registration of utility model

Ref document number: 6419201

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250