JP2018528720A - ビデオ処理のためのシステムおよび方法 - Google Patents

ビデオ処理のためのシステムおよび方法 Download PDF

Info

Publication number
JP2018528720A
JP2018528720A JP2018515674A JP2018515674A JP2018528720A JP 2018528720 A JP2018528720 A JP 2018528720A JP 2018515674 A JP2018515674 A JP 2018515674A JP 2018515674 A JP2018515674 A JP 2018515674A JP 2018528720 A JP2018528720 A JP 2018528720A
Authority
JP
Japan
Prior art keywords
frame
video content
video
summary frame
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018515674A
Other languages
English (en)
Inventor
ビ、ニン
リン、ファン
ディン、ジンティン
スン、ユ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2018528720A publication Critical patent/JP2018528720A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19602Image analysis to detect motion of the intruder, e.g. by frame subtraction
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19665Details related to the storage of video surveillance data
    • G08B13/19667Details realated to data compression, encryption or encoding, e.g. resolution modes for reducing data volume to lower transmission bandwidth or memory requirements
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19665Details related to the storage of video surveillance data
    • G08B13/19671Addition of non-video data, i.e. metadata, to video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4786Supplemental services, e.g. displaying phone caller identification, shopping application e-mailing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/917Television signal processing therefor for bandwidth reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

ビデオ処理のシステムおよび方法が開示される。特定の実装形態では、デバイスは、ビデオフレームシーケンスを受信し、ビデオフレームシーケンスとビデオフレームシーケンスの各フレームについてのフレームインデックスとを記憶するように構成されたフレームバッファを含む。本デバイスは、要約フレームを、要約フレームを表す符号化されたファイルに圧縮するように構成されたプロセッサをも含む。要約フレームは、ビデオフレームシーケンスの第1のフレームインデックスに関連する第1のビデオフレーム中に、第1の位置における物体の第1の表現を含む。要約フレームは、ビデオフレームシーケンスに関連する第2のフレームインデックスに関連する第2のビデオフレーム中に、第2の位置における物体の第2の表現をさらに含む。本デバイスは、要約フレームに関連する通知信号を出力するように構成された送信機をも含む。【選択図】 図1A

Description

[0001]本開示は、一般にビデオ処理に関する。
[0002]閉回路テレビジョン(CCTV:closed circuit television)システムなどのビデオ監視システムでは、カメラが固定位置に取り付けられ得る。カメラによって生成されたビデオコンテンツ(たとえば、ビデオストリーム)は、ほとんどの時間、カメラの視野内で移動がなく、イベントがないことがある。記録されたビデオストリーム中で関心(interest)イベント(たとえば、移動)を特定するために、複数のオプションが利用可能であり得る。たとえば、関心イベントは、記録されたビデオを早送りモードで再生することによって、記録されたビデオストリーム中で識別され得る。他の例として、関心イベントは、符号化するときにフレームをスキップすること(たとえば、ビデオストリームのn番目ごとのフレームを符号化すること、ここで、nは整数である)によってビデオストリームの要約クリップを生成することによって、または記録されたビデオストリームのタイムラプス(time-lapse)ビデオを生成することによって識別され得る。これらのオプションの各々は、非効率的であり、時間がかかり得る。
[0003]特定の態様では、デバイスは、ビデオフレームシーケンスを収集するように構成されたキャプチャユニットを含む。各ビデオフレームはフレームインデックスを有する。本デバイスは、キャプチャユニットと電気通信しているフレームバッファをさらに含む。フレームバッファは、ビデオフレームシーケンスおよび関連するフレームインデックスを記憶することが可能である。本デバイスは、フレームバッファと電子通信しているプロセッサをも含む。プロセッサは、要約フレーム(summary frame)を、要約フレームを表す符号化されたファイルに圧縮するように構成される。要約フレームは、ビデオフレームシーケンスの第1のフレームインデックスに関連する第1のビデオフレーム中に、第1の位置における物体の第1の表現を含む。要約フレームは、ビデオフレームシーケンスの第2のフレームインデックスに関連する第2のビデオフレーム中に、第2の位置における物体の第2の表現をさらに含む。本デバイスは、プロセッサと電子通信している送信機を含む。送信機は、要約フレームに関連する通知信号を出力するように構成される。
[0004]別の態様では、装置は、プロセッサと、プロセッサに、ビデオコンテンツの部分中のイベントに対応する動きイベント期間を検出することを含む動作を実行させるために実行可能な命令を記憶するメモリとを含む。ビデオコンテンツは複数の画像フレームを含み、ビデオコンテンツの部分は物体を含む。動作は、ビデオコンテンツの部分に関連する要約フレームを生成することをさらに含む。要約フレームは物体の複数の表現を示す。動作は、デバイスに要約フレームを含む通知を送ることを始動することをも含む。
[0005]別の態様では、装置は、ビデオコンテンツの部分に関連する要約フレームを生成するための手段を含む。要約フレームは、ビデオコンテンツの部分中に含まれる物体の複数の表現を示す。本装置は、デバイスに要約フレームを含む通知を送信するための手段をさらに含む。
[0006]別の特定の態様では、ビデオ監視システムを動作させる方法は、ビデオ監視システムの第1のデバイスによって第2のデバイスに、ビデオ監視システムによってキャプチャされたビデオコンテンツの部分中で検出された動きイベントの通知を送ることを含む。通知は、ビデオコンテンツの部分に関連する要約フレームを含む。ビデオコンテンツの部分は物体を含む。要約フレームは物体の複数の表現を示す。本方法は、第1のデバイスにおいて第2のデバイスから、動きイベントに関連するビデオセグメントについての要求を受信することをさらに含む。本方法は、第1のデバイスから第2のデバイスにビデオセグメントを送ることをも含む。
[0007]本開示の他の態様、利点、および特徴は、以下のセクション、すなわち、図面の簡単な説明と、発明を実施するための形態と、特許請求の範囲とを含む、本出願全体を検討した後に明らかになろう。
[0008]要約フレームを生成するために画像データを処理するための第1の例示的なシステムのブロック図。 [0009]要約フレームを生成するために画像データを処理するための第2の例示的なシステムのブロック図。 [0010]要約フレームを生成するために画像データを処理するための第3の例示的なシステムのブロック図。 [0011]要約フレーム生成器の例示的な例のブロック図。 [0012]要約フレームを生成する方法の第1の例示的な例の流れ図。 [0013]要約フレームを生成する方法の第2の例示的な例の流れ図。 [0014]要約フレームを通信するために画像データを処理するための例示的なシステムのブロック図。 [0015]要約フレームを使用してビデオコンテンツをインデックス付けするように構成されたデバイスの例示的な例のブロック図。 [0016]要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 要約フレーム、要約フレームに基づくビデオコンテンツの部分、またはその両方を提示するためのインターフェースの例の図。 [0017]要約フレームを生成する方法の第3の例示的な例の流れ図。 [0018]要約フレームを通信する方法の例示的な例の流れ図。 [0019]要約フレームを受信する方法の例示的な例の流れ図。 [0020]複数の要約フレームを連結する(concatenate)方法の例示的な例の流れ図。 [0021]ビデオコンテンツをインデックス付けする方法の例示的な例の流れ図。 [0022]本明細書で開示される1つまたは複数の方法、システム、装置、またはコンピュータ可読記憶デバイスの様々な態様をサポートするように動作可能であるデバイスのブロック図。
[0023]本開示の特定の態様が、図面を参照しながら以下で説明される。説明では、共通の特徴は、図面全体にわたって共通の参照番号によって指定される。本明細書で使用される、構造、構成要素、動作など、要素を修飾するために使用される順序を示す用語(たとえば、「第1の」、「第2の」、「第3の」など)は、それ自体、別の要素に関する要素の優先順位または順序を示しておらず、むしろ、要素を、(順序を示す用語の使用を別にすれば)同じ名前を有する別の要素から区別するためのものにすぎない。
[0024]本開示は、ビデオコンテンツの部分を要約する要約フレーム(たとえば、画像)を生成するために、ビデオストリーム(たとえば、ビデオセグメント)など、ビデオコンテンツを処理する方法について説明する。たとえば、ビデオコンテンツは、物体(たとえば、人、車など)に関連する動きイベントなどのイベントをキャプチャし得る。ビデオコンテンツは、ビデオコンテンツ内の(イベントの)動きイベント期間の始まりおよび終了を識別する画像処理デバイスに与えられ得る。たとえば、動きイベント期間は、物体が、カメラの視野に入ることおよびそれから出ることに関連し得る。画像処理デバイスは、ビデオコンテンツの少なくとも部分に関連する要約フレームを生成し得る。要約フレームは物体の複数の表現を示し得る。例示のために、動きイベント期間の終了に応答して、要約フレームは、ユーザが、動きイベント期間中のビデオコンテンツ中の物体の移動を要約する単一の画像を迅速に閲覧することを可能にするために生成され、デバイス(たとえば、リモートデバイス)に送られ得る。
[0025]画像処理デバイスは、例示的な、非限定的な例として、カメラまたはビデオ再生デバイス中に含まれ得る。いくつかの実装形態では、画像処理デバイスは、ビデオ監視システム中に含まれ得、1つまたは複数の動きイベントを含むビデオシーケンスなどのビデオシーケンスをインデックス付けするために使用され得る。いくつかの実装形態では、要約フレームは、イベントに対応するビデオコンテンツの部分(たとえば、動きイベント期間)に関連する識別子をも含む通知中に含まれ得る。たとえば、識別子は、要約フレーム中に埋め込まれたメタデータ中に含まれ得る。識別子は、デバイスが、ビデオ監視システムにビデオコンテンツの部分を要求することを可能にし得る。
[0026]いくつかの実装形態では、画像処理デバイスは、複数の「連結された」要約フレームを含む通知を生成し得る。たとえば、画像処理デバイスは、第1の動きイベント期間に対応する第1の要約フレームを生成し得、第2の動きイベント期間に対応する第2の要約フレームを生成し得る。第1の動きイベント期間は、第1のカメラによってキャプチャされた第1のビデオコンテンツの第1の部分に関連し得、第2の動きイベント期間は、第2のカメラによってキャプチャされた第2のビデオコンテンツの第2の部分に関連し得る。代替的に、第1の動きイベント期間および第2の動きイベント期間は、単一のカメラによってキャプチャされたビデオコンテンツの部分関連し得る。いくつかの実装形態では、連結された要約フレームは、第1の動きイベント中の第1の物体の表現の第1のセットと、第2の動きイベント中の第2の物体の表現の第2のセットとを含み得る。表現の各セットは、連結された要約フレームの共通の背景上に重ね合わせられ得る。画像処理デバイスは、時間期間(たとえば、6時間期間)中に生成された、第1の要約フレームおよび第2の要約フレームなどの1つまたは複数の要約フレームを記憶し得、1つまたは複数の要約フレームを含む単一の通知を送り得る。
[0027]ビデオコンテンツの部分の要約フレームを含む通知を送ることによって、通知のデータサイズは、ビデオコンテンツ部分のビデオクリップを含む通知を送ることと比較して低減され得る。したがって、要約フレームを含む(およびビデオクリップを含まない)通知は、ビデオクリップを含む通知よりもデバイスにより迅速に与えられ得る。さらに、ビデオクリップを送る代わりに要約フレームを送ることによって、デバイスのユーザは、動きイベント期間中に(たとえば、ビデオコンテンツの部分中に)発生したアクティビティの理解を得るために、単一の画像など、要約フレームを迅速にレビューし得る。
[0028]図1Aを参照すると、要約フレームを生成するように動作可能なシステム100の例示的な例が示されている。システム100はデバイス102を含み得る。いくつかの実装形態では、デバイス102は、図5を参照しながら説明されるように、閉回路テレビジョン(CCTV)システムなどのビデオ監視システム中に含まれ得る。例示のために、デバイス102は、カメラデバイスであり得るか、カメラを含み得るか、またはビデオシステムコントローラを含み得る。追加または代替として、デバイス102は、例示的な、非限定的な例として、コンピュータ、ラップトップ、モバイルデバイス、車両、またはサーバなど、再生デバイスを含むかまたはそれの中に含まれ得る。本明細書で説明される技法は、電子デバイス、モバイルデバイス、車両、ゲーミングコンソール、自動車システムコンソール(たとえば、ADAS)、ウェアラブルデバイス(たとえば、パーソナルマウントカメラ)、ヘッドマウントディスプレイ(HMD)などとともに使用され得る。追加の例は、限定はしないが、ロボットまたはロボティックデバイス、無人航空機(UAV)、およびドローンを含む。車両の例は、自動車両(たとえば、車、トラック、オートバイ、バス、または列車)、船舶(たとえば、船またはボート)、航空機(たとえば、飛行機またはヘリコプター)、宇宙船(たとえば、スペースシャトル)、自転車、または別の車両を含むことができる。車両は、例示的な非限定的な例として、装輪車両(wheeled vehicle)、装軌車両(tracked vehicle)、鉄道車両(railed vehicle)、空中車両(airborne vehicle)、またはスキー車両(skied vehicle)であり得る。いくつかの場合には、車両は、1人または複数の運転者によって操作され得る。他の場合には、車両は、自律車両などのコンピュータ制御車両であり得る。さらに、1つまたは複数の態様が、デバイスにおいて実行されている動作を含むものとして本明細書で説明され得るが、他の例では、そのような動作は、「クラウド」において実行され得ることを理解されたい。
[0029]デバイス102は、画像データを含む1つまたは複数の画像フレームなど、ビデオコンテンツ140(たとえば、ビデオシーケンス)を受信するように構成され得る。ビデオコンテンツ140(たとえば、画像データ)は、レンズを含むキャプチャユニット(図示せず)から受信され得る。たとえば、キャプチャユニットは、カメラを含み得るかまたはカメラの一部であり得る。キャプチャユニットは、ビデオコンテンツ140など、ビデオフレームシーケンスを収集するように構成され得る。いくつかの実装形態では、ビデオフレームシーケンスの各ビデオフレームは、対応するフレームインデックスを有し得る。いくつかの実装形態では、デバイス102は、図1B〜図1Cを参照しながら説明されるように、キャプチャユニットを含み得る。
[0030]デバイス102は、フレームバッファ110と、メモリ112と、プロセッサ118と、ユーザインターフェース130と、送信機132とを含み得る。フレームバッファ110は、例示的な、非限定的な例として、ビデオコンテンツ140の1つまたは複数のフレーム(たとえば、ビデオフレームシーケンスの1つまたは複数のフレーム)、フレームタイムスタンプ、フレームシーケンスインデックス値、またはそれらの組合せを記憶するように構成され得る。いくつかの実装形態では、フレームバッファ110は、ビデオコンテンツ140を生成する画像キャプチャユニットに結合され得る。本明細書で使用される「結合された」は、「通信可能に結合された」、「電気的に結合された」、または「物理的に結合された」、およびそれらの組合せを含み得る。2つのデバイス(または構成要素)は、1つまたは複数の他のデバイス、構成要素、ワイヤ、バス、ネットワーク(たとえば、ワイヤードネットワーク、ワイヤレスネットワーク、またはそれらの組合せ)などを介して、直接または間接的に結合され(たとえば、通信可能に結合されるか、電気的に結合されるか、または物理的に結合され)得る。電気的に結合された2つのデバイス(または構成要素)は、同じデバイス中にまたは異なるデバイス中に含まれ得、例示的な、非限定的な例として、電子回路、1つまたは複数のコネクタ、または誘導結合を介して接続され得る。いくつかの実装形態では、電気通信しているなど、通信可能に結合された2つのデバイス(または構成要素)は、1つまたは複数のワイヤ、バス、ネットワークなどを介してなど、直接または間接的に電気信号(デジタル信号またはアナログ信号)を送信および受信し得る。たとえば、フレームバッファ110は、画像キャプチャデバイスと電気通信していることがある。別の例として、フレームバッファ110は、デバイス102に結合されたかまたはデバイス102中に含まれるメモリなど、ストレージデバイスからビデオコンテンツ140を受信し得る。例示のために、ストレージデバイスは、デバイス102の外部にあり得、ワイヤードネットワーク、ワイヤレスネットワーク、またはそれらの組合せなどのネットワークを介してデバイス102に結合され得る。別の例として、ストレージデバイスは、デバイス102に着脱可能に結合され得る。例示のために、メモリデバイスは、デバイス102に物理的に結合され得る、セキュアデジタル(SD)カードなど、メモリカードを含み得る。
[0031]メモリ112は、フレームバッファ110に結合され得、ビデオコンテンツ140の少なくとも部分、ビデオコンテンツ140(たとえば、ビデオフレームシーケンス)の少なくとも部分に関連するインデックス、またはそれらの組合せなど、ビデオコンテンツ114を記憶するように構成され得る。たとえば、ビデオコンテンツ114は、第1のフレームと第2のフレームとを含み得、メモリ112は、第1のフレームに関連する第1のデータ(たとえば、第1のフレームインデックス)と、第2のフレームに関連する第2のデータ(たとえば、第2のフレームインデックス)とを記憶し得る。追加または代替として、メモリ112は、第1のビデオフレームシーケンスインデックスおよび第2のビデオフレームシーケンスインデックスなど、ビデオフレームシーケンス(たとえば、複数のビデオフレームシーケンス)のインデックスを記憶するように構成され得る。いくつかの実装形態では、ビデオコンテンツ140は、フレームバッファ110およびメモリ112において並列に受信され得る。フレームバッファ110とメモリ112とは別個であるものとして説明されるが、他の実装形態では、メモリ112はフレームバッファ110を含み得る。いくつかの実装形態では、ビデオコンテンツ114は、図2を参照しながら説明されるように、動き(たとえば、動きイベント)が検出されたビデオコンテンツ140の1つまたは複数の部分に関連し得る。メモリ112はデバイス102中に含まれるものとして示されているが、他の実装形態では、メモリ112は、デバイス102の外部にあるか、またはデバイス102に着脱可能に結合され得る。たとえば、メモリ112は、ユニバーサルシリアルバス(USB)ドライブなど、メモリカードまたは他のリムーバブルストレージデバイスを含み得る。
[0032]プロセッサ118は、フレームバッファ110と電気的に結合されるか、通信可能に結合されるか、またはその両方であり得る。たとえば、プロセッサ118は、フレームバッファ110と電気通信していることがある。プロセッサ118は、例示的な、非限定的な例として、デジタル信号プロセッサ(DSP)、中央処理ユニット(CPU)、グラフィカル処理ユニット(GPU)、またはそれらの組合せを含み得る。
[0033]プロセッサ118は、要約フレーム生成器120と通知生成器126とを含み得る。要約フレーム生成器120は、要約フレーム122、メタデータ124、またはその両方を生成するように構成され得る。要約フレーム122は、動きイベントが検出されたビデオコンテンツ140の部分の視覚要約を与え得る。たとえば、要約フレーム122は、本明細書でさらに説明されるように、ビデオコンテンツの部分中で移動するものとして検出された物体の複数の表現を示し得る。物体は、1つまたは複数の検出されたブロブ(blobs)に関連するかまたはそれに対応し得る。要約フレーム122中に含まれる物体の複数の表現は、図2〜図5を参照しながら説明されるように、ビデオコンテンツ140の部分から選択されたキーフレームに対応し得る。いくつかの実装形態では、プロセッサ118は、本明細書でさらに説明されるように、ビデオコンテンツ140中の複数のビデオフレーム(たとえば、ビデオフレームシーケンス中の複数のフレーム)にわたる動きイベントに基づく要約フレーム122の生成を始動するように構成され得る。
[0034]たとえば、プロセッサ118は、要約フレーム122を生成するために、ビデオコンテンツ140の部分の第1のフレームからの物体の第1の表現と、ビデオコンテンツ140の部分の第2のフレームからの物体の第2の表現とを組み合わせ得る。例示のために、要約フレーム122の一例が150において示されている。要約フレーム122の例150は、人および自転車の要約など、ビデオコンテンツ140の部分の視覚要約を与える。たとえば、要約フレーム122は、動きイベントの単一フレーム視覚要約を与え得る。例示のために、要約フレーム122は、人および自転車の複数の表現151〜156を示し得る。複数の表現151〜156の各々は、ビデオコンテンツ140の部分から選択された異なるフレームに対応し得る。たとえば、第1の表現151は、ビデオフレームシーケンスの第1のフレームインデックスに関連する第1のフレームに対応し得、第2の表現152は、ビデオフレームシーケンスの第2のフレームインデックスに関連する第2のフレームに対応し得る、などである。いくつかの実装形態では、第1のフレームおよび第2のフレームの各々は、それぞれ、動きイベントに対応するキーフレームに関連し得る。要約フレーム生成器120は、図2〜図4を参照しながら説明されるように、1つまたは複数のキーフレームを選択するように構成され得る。いくつかの例では、複数の表現は、ユーザが人および自転車の移動方向を決定することができるように(たとえば、カラーリング、テクスチャ、シェーディングなどを使用して)提示され得る。他の例では、各表現は、時間的に複数の表現のシーケンスを示す、数値、文字、矢印など、インジケータを含み得る。複数の表現151〜156の各々が、例150では別個である(たとえば、重複しない)ものとして示されているが、他の実装では、第1の表現は、第2の表現と少なくとも部分的に重複し得、ここで、第1の表現は、第2の表現に関連する第2のフレームよりも、フレームのシーケンスにおいて前にまたは後に発生する第1のフレームに関連する。
[0035]デバイス102を参照すると、メタデータ124は、ビデオコンテンツ140に対応するファイル名、要約フレーム識別子、ビデオコンテンツ140が生成された日付または時間、要約フレーム122が生成された日付または時間、動きイベント開始時間、動きイベント終了時間、動きイベント持続時間、ビデオセグメント(たとえば、動きイベント期間に対応するビデオクリップ)の識別子、要約フレーム122中に含まれる物体の表現を生成するために使用されるフレームの指示、ビデオコンテンツ140を生成したキャプチャユニットに関連するキャプチャユニット識別子(たとえば、カメラ識別子)、カメラロケーション、ビデオコンテンツ114が記憶されたメモリ112の記憶ロケーションへのリンク(たとえば、ユニフォームリソースロケータ(URL))、あるいはそれらの組合せを含み得る。例示のために、メタデータ124は、(第1の表現151に対応する)関連する第1のフレームインデックスと、(第2の表現152に対応する)関連する第2のフレームインデックスとを含み得る。いくつかの実装形態では、メタデータ124は、要約フレーム122中に含まれ(たとえば、それの中に埋め込まれ)得る。追加または代替として、いくつかの実装形態では、メタデータ124は、環境情報(たとえば、ビデオコンテンツ140の生成中の気象条件)、セマンティック(semantic)情報(たとえば、イベント識別情報)、物体識別情報、シーン分類情報、またはそれらの組合せを含み得る。メモリ112が、要約フレーム122を生成するために使用されるビデオコンテンツ140の部分に対応するビデオコンテンツ114を記憶する場合、メタデータ124は、ビデオコンテンツ114に含まれるかまたはそれとともに記憶され得る。
[0036]通知生成器126は、要約フレーム122に関連する通知128を生成するように構成され得る。通知128は、例示的な、非限定的な例として、特定の動きイベントが始まったという指示、要約フレーム122が生成されつつあるという指示、動きイベントが終了したという指示、要約フレーム122が生成されたという指示、動きイベントの持続時間の指示、要約フレーム122、メタデータ124、またはそれらの組合せを含み得る。たとえば、通知生成器126は、要約フレーム122が要約フレーム生成器120によって生成されたことに応答して、通知128を生成し得る。いくつかの実装形態では、通知128は、例示的な、非限定的な例として、電子メールまたはショートメッセージサービス(SMS)メッセージを含み得る。
[0037]プロセッサ118は、ユーザインターフェース130、送信機132、またはその両方に、通信可能に結合されるか、電気的に結合されるか、またはその両方であり得る。たとえば、プロセッサ118は、ユーザインターフェース130、送信機132、またはその両方と電子通信していることがある。プロセッサ118は、ユーザインターフェース130、送信機132、またはその両方にプロセッサ出力142を与えるように構成され得る。ユーザインターフェース130は、要約フレーム122、メタデータ124、通知128、またはそれらの組合せに関連する出力を生成するように構成され得る。例示のために、ユーザインターフェース130は、ディスプレイ(たとえば、スクリーンまたはタッチスクリーン)、スピーカー(たとえば、ラウドスピーカー)などのトランスデューサ、光(たとえば、発光ダイオード(LED)などを含み得る。ユーザインターフェース130がスクリーンを含む場合、スクリーンは、要約フレーム122、通知128、またはそれらの組合せを表示するように構成され得る。別の例として、ユーザインターフェース130がラウドスピーカーを含む場合、ラウドスピーカーは、要約フレーム122の生成の完了に関連する音を再生するように構成され得る。さらなる例として、ユーザインターフェース130が光を含む場合、光は、要約フレーム122の生成の完了に応答して照らされるように構成され得る。
[0038]送信機132は、要約フレーム(たとえば、要約フレーム122)が生成されつつあるかまたは生成されたことを示す通知信号など、デバイス出力144を与えるように構成され得る。たとえば、デバイス出力144は、要約フレーム122、メタデータ124、通知128、またはそれらの組合せを含み得る。いくつかの実装形態では、送信機132は、送信機132と受信機とを含むトランシーバなどのトランシーバ(図示せず)中に含まれ得る。
[0039]ユーザインターフェース130および送信機132が、デバイス102中に含まれるものとして説明されるが、他の実装形態では、ユーザインターフェース130および送信機132の一方または両方はデバイス102の外部にあり得る。たとえば、ユーザインターフェース130は、デバイス102の外部にあるディスプレイを含み得る。
[0040]動作中に、プロセッサ118は、ビデオコンテンツ140(たとえば、複数の画像フレーム)に対応する動きイベント期間を検出し得る。プロセッサ118は、物体(たとえば、人および自転車)の複数の表現を示す要約フレーム122を生成し得る。物体は、動きイベント期間に対応するビデオコンテンツ140の部分中に含まれ得る。要約フレーム122が生成された後、要約フレーム122は通知128中に含まれ得る。要約フレーム122は、ユーザインターフェース130(たとえば、ディスプレイ)を介して提示され得、通知128は、送信機132を介して1つまたは複数の他のデバイスに送られ得る。
[0041]いくつかの実装形態では、要約フレーム生成器120は、動きイベント期間(たとえば、動きイベントの始まり、動きイベントの終了、またはその両方)を検出し、ビデオコンテンツ140の部分に関連する要約フレーム122を生成するように構成され得る。この例では、メタデータ124は、動きイベント期間の始まりに関連する第1のタイムスタンプ、動きイベント期間の終了に関連する第2のタイムスタンプ、またはそれらの組合せを含み得る。
[0042]いくつかの実装形態では、通知生成器126は、各要約フレームが要約フレーム生成器120によって生成されたことに応答して、通知を生成するように構成され得る。たとえば、要約フレーム122に応答して、通知生成器126は、図1Bを参照しながら説明されるように、要約フレーム122(たとえば、単一の要約フレーム)を含む通知128を生成し得る。他の実装形態では、通知生成器126は、図1Cを参照しながら説明されるように、複数の要約フレームを「連結」して通知(たとえば、単一の通知)にし得る。たとえば、通知生成器126は、時間期間(たとえば、プログラマブル時間期間)について通知を生成し得、時間期間の間に生成された各要約フレームを通知中に含め得る。いくつかの実装形態では、異なる要約フレームの連結は、異なるプログラマブル時間期間に基づき得る。例示のために、第1のプログラマブル時間期間が1時間に対応し得る。第1のプログラマブル時間期間が経過したことに応答して、通知生成器126は、第1のプログラマブル時間期間中に生成された各要約フレームを含む通知を生成し得る。別の例として、第2のプログラマブル時間期間が8時間に対応し得る。
[0043]いくつかの実装形態では、プロセッサ118は、インデックス付きビデオコンテンツを生成するために、ビデオコンテンツ140(またはビデオコンテンツ114)をインデックス付けするように構成され得る。たとえば、ビデオコンテンツ140またはビデオコンテンツ114は、動きイベント期間の始まりに対応する第1の特定のフレーム、動きイベント期間に関連し、要約フレーム122を生成するために使用される1つまたは複数のフレーム、動きイベント期間の終了に対応する第2の特定のフレーム、またはそれらの組合せに従って、インデックス付けされ得る。別の例として、ビデオコンテンツ140(またはビデオコンテンツ114)は、第1の特定のフレーム、動きイベント期間に関連し、要約フレーム122を生成するために使用されるフレームのうちの1つまたは複数、第2の特定のフレーム、またはそれらの組合せに適用されるオフセットに基づいて、インデックス付けされ得る。例示のために、ビデオコンテンツ140(またはビデオコンテンツ114)は、動きイベント期間の始まりに対応する第1の特定のフレームの前の第1のオフセット値(たとえば、60個のフレーム)におけるフレームを使用して、および動きイベント期間の終了に対応する第2の特定のフレームの後の第2のオフセット値(たとえば、30個のフレーム)における別のフレームを使用して、インデックス付けされ得る。いくつかの実装形態では、プロセッサ118は、メモリ112において、インデックス付きビデオコンテンツを記憶し得る。追加または代替として、プロセッサ118は、メモリ112において、動きイベント期間に関連するビデオセグメント(たとえば、ビデオクリップ)を記憶するように構成され得る。たとえば、ビデオセグメントは、インデックス付きビデオコンテンツとは別個に(それに加えてまたはそれの代わりに)メモリ112において記憶され得る。
[0044]いくつかの実装形態では、プロセッサ118は、図1B〜図1Cを参照しながら説明されるように、ビデオコンテンツ140(またはビデオコンテンツ114)、要約フレーム122、またはその両方を圧縮するように構成されたビデオエンコーダを含み得る。たとえば、プロセッサ118のビデオエンコーダは、要約フレーム122を表す符号化されたファイルを生成するために要約フレーム122を符号化するように構成され得る。いくつかの実装形態では、符号化されたファイルは、要約フレーム122に関連するメタデータ(たとえば、メタデータ124の少なくとも部分)を含み得る。
[0045]要約フレーム122を生成することによって、ビデオコンテンツ140の部分中で発生する動きにより「関心」のあるビデオコンテンツ140の部分を要約する単一の画像フレームが生成され得る。要約フレーム122は、ユーザが、ビデオコンテンツの部分中に発生した動きアクティビティの理解を得るために、要約フレーム122を迅速にレビューすることを可能にし得る。さらに、別のデバイスに送られる通知128中に要約フレーム122を含めることによって、ビデオコンテンツの部分(たとえば、ビデオクリップ)を含む通知を送ることと比較して、通知128のデータサイズが低減され得る。したがって、要約フレーム122を含む(およびビデオクリップを含まない)通知116は、ビデオクリップを含む通知よりも別のデバイスにより迅速に与えられ得る。
[0046]図1Bを参照すると、要約フレームを生成するように動作可能なシステム160の例示的な例が示されている。システム160は、図1Aのシステム100を含むかまたはそれに対応し得る。
[0047]システム160は、カメラ162と、送信機184と、受信機186とを含み得る。カメラ162は、図1のデバイス102を含むかまたはそれに対応し得る。いくつかの実装形態では、送信機184と受信機186とは、トランシーバなど、同じデバイス中に含まれ得る。送信機184および受信機186の各々が、カメラ162とは別個であるものとして説明されるが、他の実装形態では、送信機184、受信機186、またはその両方は、カメラ162中に含まれ得る。いくつかの実装形態では、カメラ162は、例示的な、非限定的な例として、インターネットプロトコル(IP)カメラを含み得る。
[0048]カメラ162は、キャプチャユニット164と、メモリ166と、プロセッサ174とを含み得る。キャプチャユニット164はレンズ165を含み得る。キャプチャユニット164は、ビデオコンテンツ167(たとえば、画像データ)など、ビデオフレームシーケンスを収集するように構成され得る。いくつかの実装形態では、ビデオフレームシーケンスの各ビデオフレームは、対応するフレームインデックスを有し得る。
[0049]メモリ166は、図1Aのメモリ112を含むかまたはそれに対応し得る。メモリ166は、フレームバッファ168と、インデックス付きビデオコンテンツ170と、デバイス情報172とを含み得る。フレームバッファ168は、図1のフレームバッファ110を含むかまたはそれに対応し得る。インデックス付きビデオコンテンツ170は、本明細書でさらに説明されるように、1つまたは複数の要約フレームを使用してインデックス付けされるビデオコンテンツ167の少なくとも部分を含むかまたはそれに対応し得る。追加または代替として、インデックス付きビデオコンテンツ170は、本明細書でさらに説明されるように、要約フレームを生成するために使用されるべき要約フレーム生成器180によって選択されたビデオコンテンツ167の1つまたは複数のフレーム(たとえば、キーフレーム)を使用してインデックス付けされ得る。
[0050]デバイス情報172は、カメラ162に結合された(たとえば、通信可能に結合された)1つまたは複数のデバイスに関連し得る。1つまたは複数のデバイスの各々は、カメラ162からデータを受信するように構成され得る。たとえば、1つまたは複数のデバイスのうちの第1のデバイスが、カメラ162からリモートに配置され、カメラ162から、ビデオコンテンツ167、1つまたは複数の要約フレーム、1つまたは複数の通知、インデックス付きビデオコンテンツ170の部分、またはそれらの組合せを受信するように構成され得る。1つまたは複数のデバイスの各々について、デバイス情報172は、例示的な、非限定的な例として、デバイスに関連するデバイスアドレス(たとえば、電子メールアドレス、電話番号、インターネットプロトコル(IP)アドレス、アカウント番号、プロファイルなど)、認証情報(たとえば、ユーザ名、パスワード、アカウント番号など)、許可情報(たとえば、ユーザ権利)、またはそれらの組合せを示すデータを含み得る。特定のデバイスのデバイスアドレスは、カメラ162が、特定のデバイスにデータを送ることを可能にし得る。認証情報は、カメラ162が、カメラ162において生成されたかまたは記憶されたビデオコンテンツ(たとえば、ビデオコンテンツ167またはインデックス付きビデオコンテンツ170)にアクセスするための特定のデバイスからの要求に応答して、特定のデバイスを認証することを可能にし得る。許可情報は、特定のデバイスに与えられ得るデータを示し得る。
[0051]プロセッサ174は、図1Aのプロセッサ118を含むかまたはそれに対応し得る。プロセッサは、要約フレーム生成器180と、通知生成器182と、ビデオエンコーダ176と、モードコントローラ178とを含み得る。要約フレーム生成器180および通知生成器182は、それぞれ、図1Aの要約フレーム生成器120および通知生成器126を含むかまたはそれに対応し得る。要約フレーム生成器180は、1つまたは複数の要約フレーム、メタデータ187、またはそれらの組合せを生成するように構成され得る。1つまたは複数の要約フレームは、図1Aの要約フレーム122を含むかまたはそれに対応し得る。メタデータ187は、図1Aのメタデータ124を含むかまたはそれに対応し得る。要約フレーム生成器180は、ビデオエンコーダ176に、通知生成器182に、記憶のためにメモリ166に、または、インデックス付きビデオコンテンツ170を生成するためにビデオコンテンツ167をインデックス付けするように構成されたインデクサー(indexer)に、1つまたは複数の要約フレームを与えるように構成され得る。追加または代替として、要約フレーム生成器180は、通知生成器182に、インデクサーに、または記憶のためにメモリ166に、メタデータ187を与えるように構成され得る。
[0052]通知生成器182は、通知188などの1つまたは複数の通知を生成するように構成され得る。通知188は、図1の通知128を含むかまたはそれに対応し得る。いくつかの実装形態では、通知生成器182は、デバイス情報172に基づいて通知188を生成し得る。たとえば、通知生成器182は、デバイス情報172に基づいて特定のデバイスに(たとえば、特定のデバイスのアドレスに)与えられるべき通知188を生成し得る。
[0053]ビデオエンコーダ176は、ビデオデータなど、画像データを符号化する(たとえば、圧縮する)ように構成され得る。たとえば、ビデオエンコーダ176は、ビデオコンテンツ167、インデックス付きビデオコンテンツ170、または要約フレーム生成器180によって生成された要約フレームを圧縮するように構成され得る。
[0054]モードコントローラ178は、ビデオエンコーダ176が、要約フレーム生成器180によって生成された要約フレームを圧縮するのか、ビデオコンテンツ167またはインデックス付きビデオコンテンツ170など、ビデオコンテンツを圧縮するのかを制御するように構成され得る。いくつかの実装形態では、モードコントローラ178は、カメラ162のモードを示す値を記憶するレジスタを含み得る。モードコントローラ178は、ビデオエンコーダ176が、要約フレームを圧縮するのか、ビデオコンテンツ167など、ビデオフレームシーケンスを圧縮するのかを制御するように構成され得る。たとえば、値が0である場合、カメラ162は、ビデオエンコーダ176がビデオコンテンツ167を符号化するように構成された、第1のモードにあり得る。値が1である場合、カメラ162は、ビデオエンコーダ176が要約フレーム生成器180によって生成された1つまたは複数の要約フレームを符号化するように構成された、第2のモードにあり得る。第2のモードでは、要約フレーム生成器180は、図2を参照しながら説明されるように、動きイベントの終了を検出したことに基づいて要約フレームを生成するように構成され得る。追加または代替として、第2のモードでは、通知生成器182は、1つまたは複数の通知を生成するように構成され得、ここで、各通知は単一の要約フレームを含む。たとえば、通知生成器182は、要約フレーム生成器180が特定の要約フレームを生成したことに応答して、特定の通知を生成し得る。
[0055]モードコントローラ178が2つのモードを有するものとして説明されるが、他の実装形態では、モードコントローラ178は、単一のモードまたは3つ以上のモードを含み得る。追加または代替として、モードコントローラ178は、図1Bを参照しながら説明されるモード以外のモードを含み得る。たとえば、モードコントローラ178は、図1Cを参照しながら説明されるように、連結モードを含み得る。連結モードは、要約フレーム生成器180に、プログラマブル時間期間などの時間期間に基づいて1つまたは複数の要約フレームを生成させ得る。例示のために、特定の時間期間の満了に応答して、要約フレーム生成器180は、ビデオコンテンツ167の部分に基づいて1つまたは複数の要約フレームを生成するために、特定の時間期間中に生成されたビデオコンテンツ167の部分を分析し得る。たとえば、要約フレーム生成器180は、ビデオコンテンツ167の部分中で検出された各動きイベントについての少なくとも1つの要約フレームを生成し得る。いくつかの実装形態では、通知生成器182は、ビデオコンテンツ167の部分に基づいて生成された1つまたは複数の要約フレームの各々を含むように単一の通知188を生成し得る。連結モードはまた、ビデオエンコーダ176が、ビデオコンテンツ167の部分に基づいて要約フレーム生成器180によって生成された1つまたは複数の要約フレームを圧縮することを可能にし得る。例示のために、いくつかの実装形態では、ビデオエンコーダ176は、要約フレーム生成器180によって生成された複数の要約フレームを圧縮し得る。
[0056]モードコントローラ178がプロセッサ174中に含まれるものとして説明されるが、他の実装形態では、モードコントローラ178はプロセッサと分離し得る。そのような実装形態では、モードコントローラ178は、プロセッサ174、プロセッサ174の1つまたは複数の構成要素、またはそれらの組合せに、電気的に結合されるか、通信可能に結合されるか、あるいはその両方であり得る。たとえば、モードコントローラ178は、プロセッサ174と電気通信していることがある。
[0057]カメラ162は、送信機184に、および受信機186に結合され得る。送信機184は、ワイヤード接続、ワイヤレス接続、またはそれらの組合せを介してカメラ162に通信可能に結合されたデバイスなどの1つまたは複数のデバイスにデータを送信するように構成され得る。送信機184によって送信されたデータは、例示的な、非限定的な例として、ビデオコンテンツ167の少なくとも部分、インデックス付きビデオコンテンツ170の少なくとも部分、1つまたは複数の要約フレーム、メタデータ187の少なくとも部分、通知188、またはそれらの組合せを含み得る。送信機184によって送信されたデータは、符号化されたデータ(たとえば、圧縮されたデータ)、符号化されていないデータ(たとえば、圧縮されていないデータ)、またはそれらの組合せを含み得る。
[0058]受信機186は、1つまたは複数のデバイスからデータを受信するように構成され得る。いくつかの実装形態では、1つまたは複数のデバイスから受信されたデータは、例示的な、非限定的な例として、要求189、デバイス情報172の部分、またはそれらの組合せを含み得る。例示のために、特定の実装形態では、受信機186は、送信されるべき通知信号(たとえば、通知188)についての要求189を受信するように構成され得る。別の例として、プロセッサ174は、要約フレーム生成器180によって生成された特定の要約フレームに関連するメタデータ187を送信するようにとの要求189を(受信機186を介して)受信するように構成され得る。
[0059]送信機184および受信機186が、カメラ162とは別個であるものとして説明されるが、他の実装形態では、送信機184、受信機186、またはその両方は、カメラ162中に含まれ得る。送信機184および受信機186が、互いに別個であるものとして説明されるが、他の実装形態では、送信機184および受信機186は、トランシーバ中に含まれ得る。
[0060]動作中に、キャプチャユニット164は、ビデオコンテンツ167を生成し、ビデオコンテンツ167をフレームバッファ168に与え得る。プロセッサ174は、フレームバッファ168からビデオコンテンツ167を受信し、モードコントローラ178によって示されるモードに従ってビデオコンテンツ167を処理し得る。たとえば、第1のモードでは、ビデオエンコーダ176は、送信機184を介して別のデバイスに送信されるべきビデオコンテンツ167を符号化し得る。第2のモードでは、要約フレーム生成器180は、ビデオコンテンツ167に基づいて要約フレームを生成し得る。ビデオエンコーダ176は、圧縮された要約フレームなど、圧縮されたデータ177を生成するために要約フレームを符号化し得る。送信機184は、圧縮されたデータ177を受信し得、別のデバイスに、送信された圧縮されたデータ185(たとえば、送信された圧縮された要約フレーム)を与え得る。いくつかの実装形態では、要約フレーム(またはそれの圧縮されたバージョン)は、通知188中に含まれ得る。
[0061]図1Cを参照すると、要約フレームを生成するように動作可能なシステム190の例示的な例が示されている。システム190は、図1Aのシステム100または図1Bのシステム160を含むかまたはそれに対応し得る。
[0062]図1Bを参照しながら説明されたように、モードコントローラ178は、ビデオエンコーダ176が、(要約フレーム生成器180によって生成された)1つまたは複数の要約フレームを圧縮するのか、ビデオコンテンツ167またはインデックス付きビデオコンテンツ170など、ビデオコンテンツを圧縮するのかを制御するように構成され得る。いくつかの実装形態では、モードコントローラ178は、カメラ162のモードを示す値を記憶するレジスタを含み得る。たとえば、値が0である場合、カメラ162は、ビデオエンコーダ176がビデオコンテンツ167を符号化するように構成された、第1のモードにあり得る。値が1である場合、カメラ162は、ビデオエンコーダ176が要約フレーム生成器180によって生成された個々の要約フレームを符号化したように構成された、第2のモードにあり得る。図1Cの例では、値が2である場合、カメラ162は、ビデオエンコーダが、要約フレーム生成器180によって生成された1つまたは複数の要約フレームのグループを圧縮するように構成された、第3のモード(たとえば、連結モード)にあり得る。
[0063]第3のモードでは、要約フレーム生成器180は、時間期間(たとえば、プログラマブル時間期間)に基づいて1つまたは複数の要約フレームを生成し得る。例示のために、特定の時間期間の満了に応答して、要約フレーム生成器180は、ビデオコンテンツ167の部分に基づいて1つまたは複数の要約フレームを生成するために、特定の時間期間中に生成されたビデオコンテンツ167の部分を分析し得る。いくつかの実装形態では、通知生成器182は、ビデオコンテンツ167の部分に基づいて生成された1つまたは複数の要約フレームを含むように通知188を生成し得る。連結モード中に、ビデオエンコーダ176は、ビデオコンテンツ167の部分に基づいて要約フレーム生成器180によって生成された1つまたは複数の要約フレームを圧縮し得る。たとえば、いくつかの実装形態では、ビデオエンコーダ176は、要約フレーム生成器180によって生成された異なる要約フレーム(たとえば、複数の要約フレーム)の連結を圧縮し得る。
[0064]要約フレーム連結196の例示的な例が194において示されている。要約フレーム連結196の例194は、第1の要約フレーム198と、第2の要約フレーム199と、連結されたメタデータ197とを含む。いくつかの実装形態では、第1の要約フレーム198は、ビデオコンテンツ167中に含まれる第1の動きイベントに関連し得、第2の要約フレーム199は、ビデオコンテンツ167中に含まれる第2の動きイベントに関連し得る。連結されたメタデータ197は、第1の要約フレーム198に対応する第1のメタデータと第2の要約フレーム199に対応する第2のメタデータとの全部または部分の組合せを含み得る。要約フレーム連結196が、複数の別個の要約フレームを含むものとして説明されるが、他の実装形態では、要約フレーム連結196は、単一の連結された要約フレームを含み得る。例示のために、第1の要約フレーム198は、第1の物体の表現の第1のセットを含み得、第2の要約フレーム199は、第2の物体の表現の第2のセットを含み得る。連結された要約フレームは、第1の物体の表現の第1のセットと、第2の物体の表現の第2のセットとを含み得る。第1の物体の表現の第1のセットおよび第2の物体の表現の第2のセットは、濃縮された要約フレームの共通の背景上に提示され得る。いくつかの実装形態では、要約フレーム連結196は、通知188に対応し得る。
[0065]システム190の動作中に、キャプチャユニット164は、ビデオコンテンツ167を生成し、ビデオコンテンツ167をフレームバッファ168に与え得る。プロセッサ174は、フレームバッファ168からビデオコンテンツ167を受信し、モードコントローラ178によって示されるモードに従ってビデオコンテンツ167を処理し得る。たとえば、第3のモードでは、ビデオエンコーダ176は、特定の時間期間に関連する1つまたは複数の要約フレームを符号化し得る。1つまたは複数の要約フレームは、要約フレーム連結196など、要約フレーム連結組み合わせられ(たとえば、それの中に含まれ)得る。ビデオエンコーダ176は、圧縮された要約フレーム連結など、圧縮されたデータ192を生成するために要約フレーム連結196を符号化し得る。送信機184は、圧縮されたデータ192を受信し得、別のデバイスに、送信された圧縮されたデータ193(たとえば、送信された圧縮された要約フレーム連結)を与え得る。いくつかの実装形態では、要約フレーム連結196(またはそれの圧縮されたバージョン)は、通知188中に含まれ得る。
[0066]図2を参照すると、要約フレームを生成するように動作可能なシステム200の例示的な例が示されている。システム200は、図1Aの要約フレーム生成器120を含む。要約フレーム生成器120は、複数の画像フレームなど、画像フレーム240を受信するように構成される。たとえば、画像フレーム240は、図1Aのビデオコンテンツ140または図1B〜図1Cのビデオコンテンツ167を含むかまたはそれに対応し得る。画像フレーム240は、バッファまたはメモリなど、記憶ユニット(図示せず)から、あるいは、図1B〜図1Cのキャプチャユニット164などのキャプチャユニット(図示せず)から受信され得る。画像フレーム240は、画像フレーム241〜246などの画像フレームのシーケンスを含み得る。いくつかの実装形態では、画像フレーム240を生成したキャプチャユニットは固定(および静止)位置に取り付けられ、カメラの視野の背景は静止していると見なされ得る。たとえば、背景は、延長された時間期間にわたって固定(または比較的固定)のままである、建築物、木、標識など、特徴を含み得る。
[0067]要約フレーム生成器120は、背景生成器210と、イベント検出器212と、キーフレーム選択器214と、コンバイナ228とを含み得る。いくつかの実装形態では、画像フレーム240は、フレームごとに要約フレーム生成器120によって受信され得る。要約フレーム生成器120によって受信された画像フレーム240の各フレームは、背景生成器210と、イベント検出器212と、キーフレーム選択器214とに与えられ得る。
[0068]背景生成器210は、画像フレーム240のそれの少なくとも1つのフレームに基づいて背景モデル230を生成する(たとえば、維持する)ように構成され得る。たとえば、背景生成器210は、背景モデル230を生成するために、フレーム差分、平均フィルタ処理、ガウス平均化、背景混合モデリング、測量など、1つまたは複数の手法を使用し得る。いくつかの実装形態では、背景生成器210は、背景生成器210が新しい画像フレームを受信するにつれて、背景モデル230を継続的に更新し得る。背景モデル230は、イベント検出器212に、コンバイナ228に、またはその両方に与えられ得る。
[0069]イベント検出器212は、画像フレーム240に基づいて動きイベントの始まりおよび終了を検出するように構成され得る。始まりと終了との間の時間期間は、動きイベント期間と呼ばれることがある。イベント検出器212は、動きイベント期間の始まりおよび終了を決定するように構成され得る。イベント検出器212は、例示的な、非限定的な例として、画像セグメンテーション、色セグメンテーション、画像フィルタ処理、加速化断片試験による特徴抽出(FAST:features from accelerated segment test)、高速化ロバスト特徴(SURF:speeded up robust features)、スケール不変特徴変換(SIFT:scale-invariant feature transform)、コーナー検出、エッジ検出、背景減算、ブロブ検出など、1つまたは複数の検出アルゴリズムを実行することによって動きイベント期間を検出し得る。たとえば、イベント検出器212は、動きイベント期間の始まりおよび終了を決定するために背景減算および前景動き検出を使用し得る。追加または代替として、動きイベント期間は、1つまたは複数の分類アルゴリズム、シーンアルゴリズムのセマンティック分析、またはそれらの組合せを使用して検出され得る。
[0070]動きイベント期間の始まりは、画像フレーム240(たとえば、ビデオコンテンツ)の、特定のフレーム中で動き(たとえば、移動)を検出したことに応答して識別され得る。例示的な、非限定的な例として、イベント検出器212は、背景減算を使用して画像フレーム240中で動きを検出し得る。背景減算は、画像フレーム240の第1の特定のフレームと、背景画像または背景モデル(たとえば、背景モデル230)と呼ばれることがある参照フレームとの間の差分が決定される、画像処理技法である。第1の特定のフレームと第1の背景画像との間の差分は、ブロブまたは前景ブロブと呼ばれることがある、少なくとも1つの前景物体と関連し得る。第1の特定のフレームと背景画像との間の差分が、第1のしきい値よりも大きいかまたはそれに等しい場合、イベント検出器212は、動きイベント期間の始まりの検出(たとえば、特定のフレーム中で動きが検出されたこと)を示し得る。例示のために、動きイベント期間の始まりは、第1の特定のフレームの前景ブロブの、ピクセルの数など、サイズが、しきい値サイズよりも大きいかまたはそれに等しい場合、第1の特定のフレームに対応し得る。
[0071]たとえば、イベント検出器212は、画像フレーム240の特定のフレームを受信し、特定の画像フレームを背景モデル230と比較する(たとえば、差分を決定する)ように構成され得る。(物体に対応する)差分がしきい値よりも大きいかまたはそれに等しい場合、イベント検出器212は、動きイベントが始まったと決定し得る。たとえば、イベント検出器212は、第1の画像フレーム241を受信し得、第1の画像フレーム241と背景モデル230との比較に基づいて動きが検出されないと決定し得る。第1の画像フレーム241を受信した後に、イベント検出器212は、第2の画像フレーム242を受信し得、第2の画像フレーム242と背景モデル230との比較に基づいて動きイベントの始まりを識別し得る。たとえば、第2の画像フレーム242中に含まれる物体(たとえば、自転車に乗っている人)は、第2の画像フレーム242と背景モデル230との間の差分が、しきい値よりも大きいかまたはそれに等しくなることを引き起こし得る。
[0072]動きイベント期間の終了は、画像フレーム240中で(動きイベント期間の始まりが検出された後に)動きを検出することを中止したことに応答して識別され得る。たとえば、イベント検出器212は、動きイベント期間の始まりが検出された後に、動きイベント期間の終了を決定し得る。動きイベント期間の終了は、(画像フレーム240の)第2の特定のフレームと第2の背景画像との間の差分が、第2のしきい値よりも小さいかまたはそれに等しくなること応答して決定され得る。例示のために、第2の特定の画像に関連する第2の前景ブロブのサイズが、第2のしきい値よりも小さいかまたはそれに等しい場合、イベント検出器212は、第2の特定のフレームが動きイベント期間の終了に関連することを示し得る。第1の背景モデル(たとえば、第1の背景画像)と第2の背景モデル(たとえば、第2の背景画像)とは、同じであり得るか、または異なり得る。いくつかの実装形態では、第2の背景モデルは、第1の背景モデルの更新されたバージョンであり得る。
[0073]動きイベントの終了の識別を示すために、イベント検出器212は、動きイベントが始まったと決定した後に、動きイベントの終了を識別するために後続の入力フレームを処理し得る。たとえば、イベント検出器212は、受信された画像フレームと背景モデル230との間の差分がしきい値よりも小さい場合、動きイベントの終了を識別し得る。例示のために、イベント検出器212は、画像フレーム246を受信し得、画像フレーム246と背景モデル230との比較に基づいて動きイベントの終了を検出し得る。いくつかの実装形態では、イベント検出器212は、画像フレーム240の2つの連続的に受信された画像フレームを比較することによって、動きイベントの終了を検出し得る。たとえば、イベント検出器212は、前に受信された画像フレームを画像フレーム246と比較し得、画像フレーム246と前に受信された画像フレームとの間の差分が、第2のしきい値よりも小さいかまたはそれに等しい場合、イベント検出器212は、動きイベントの終了を識別し得る。
[0074]イベント検出器212は、キーフレーム選択器214に、第1のインジケータ232(たとえば、イベントであるインジケータ)と第2のインジケータ234(たとえば、イベント終了インジケータ)とを送り得る。たとえば、イベント検出器212は、動きイベントが始まったと決定したことに応答して第1のインジケータ232を送り得、動きイベントが終了したと決定したことに応答して第2のインジケータを送り得る。第1のインジケータ232は、動きイベントの始まりに対応する第1のタイムスタンプ、動きイベントの始まりに対応する第1の特定の画像フレームまたは第1の特定の画像フレームの第1のフレームインデックス値、あるいはそれらの組合せを示すデータを含み得る。第2のインジケータ233は、動きイベントの終了に対応する第2のタイムスタンプ、動きイベントの終了に対応する第2の特定の画像フレームまたは第2の特定の画像フレームの第2のフレームインデックス値、動きイベントの持続時間、動きイベントに関連するフレームの数、第1の特定の画像フレームから第2の特定の画像フレームへのオフセット、あるいはそれらの組合せを含み得る。第1のインジケータ232と第2のインジケータ234とが別個のインジケータであるものとして説明されるが、他の実装形態では、第1のインジケータ232と第2のインジケータ234とは、組み合わせられて単一のインジケータになり得る。イベント検出器212は、動きイベントの終了を決定したことに応答して、キーフレーム選択器214に単一のインジケータを送り得る。
[0075]キーフレーム選択器214(あるいはキーフレーム選択器214を含むかまたは実装するプロセッサ)は、動きイベント期間(たとえば、動きイベント)の間キーフレーム236として指定されるべき画像フレーム240の複数のフレームを決定する(たとえば、選択する)ように構成され得る。たとえば、キーフレーム選択器214は、本明細書でさらに説明されるように、キーフレーム236として画像フレーム240のうちの2つまたはそれ以上のフレームを選択するように構成され得る。
[0076]キーフレーム選択器214は、バッファ216とイベント分析器218とを含み得る。バッファ216は、画像フレーム240のうちの1つまたは複数の画像フレームを記憶するように構成され得る。いくつかの実装形態では、バッファ216は、第1のインジケータ232(たとえば、イベント始まりインジケータ)に応答して1つまたは複数の画像フレームを記憶し始め得る。他の実装形態では、バッファ216は、先入れ先出し(FIFO)バッファとして動作し得、受信された画像フレームを継続的にバッファし得る。バッファ216が、要約フレーム生成器120中に含まれるものとして説明されるが、他の実装形態では、バッファ216は、要約フレーム生成器120とは別個であり得る。たとえば、バッファ216は、図1Aのフレームバッファ110または図1B〜図1Cのフレームバッファ168を含むかまたはそれに対応し得る。別の例として、バッファ216は、図1Aのプロセッサ118または図1B〜図1Cのプロセッサ174中に含まれるなど、要約フレーム生成器120を含む同じプロセッサ中に含まれ得る。
[0077]キーフレーム選択器214は、コンバイナ228にキーフレーム236として与えられるべき複数のフレームを(バッファ216に記憶されたフレームから)選択するために選択アルゴリズムを使用し得る。いくつかの実装形態では、キーフレーム236は、線形的に選択され得る。たとえば、キーフレーム選択器214は、動きイベント期間に対応する画像フレーム240の部分のn番目ごとのフレーム(またはn番目ごとのキーフレーム)を選択し得、ここで、nは正の整数である。たとえば、キーフレーム選択器214は、画像フレーム240の部分の500番目ごとのフレームを、キーフレーム236中に含まれるように選択し得る。他の実装形態では、キーフレーム選択器214は、キーフレーム236として特定の数のフレームを選択し得る。キーフレーム236は、画像フレーム240のサブセット(たとえば、動きイベント期間に対応する複数の画像フレームのサブセット)であり得る。例示のために、キーフレーム選択器214は、画像フレーム240の部分中に含まれるフレームの総数から、特定の数のフレーム(たとえば、所定の数のフレーム)を選択し得る。「キーフレーム」と呼ばれるが、キーフレームは、イントラコード化フレーム(Iフレーム)であることもないこともあることを理解されたい。いくつかの実装形態では、選択されたフレームは、画像フレーム240の(動きイベントに対応する)部分全体にわたって一様に分散していることがある。たとえば、特定の数のフレームが10個のフレームであり、画像フレーム240の(動きイベントに対応する)部分のフレームの総数が120個のフレームである場合、画像フレーム240の部分の12番目ごとのフレームが、キーフレームとして選択され得る。代替的に、特定の数のフレームは、動きイベント中に一様に分散している3番目ごとの画像または10個ごとのキーフレームなど。画像フレーム240の(動きイベントに対応する)部分からランダムに選択され得る。
[0078]他の実装形態では、キーフレーム選択器214は、動きイベントの各フレームについての分析結果を決定することを含む、非線形技法(たとえば、非線形選択アルゴリズム)を使用し得る。非線形プロセスは、本明細書でさらに説明されるように、要約フレームを作成するために使用されるべき画像フレーム240のキーフレームを選択し得る。選択されたキーフレームは、キーフレームの選択がランダムに見える(たとえば、キーフレームが、動きイベント期間中に時間的に一様に分散していない)ように、動きイベントに関して非線形分散を有し得る。
[0079]たとえば、非線形選択技法は、本明細書でさらに説明されるように、キーフレーム236の選択がランダムに見える(たとえば、キーフレーム236が時間的に一様に分散していない)ように、イベント分析結果220(たとえば、イベント測定結果)に従って、キーフレーム236を選択し得る。フレームについてのイベント分析結果220(たとえば、分析測定値)は、参照フレーム(たとえば、画像フレーム240の別のフレーム、背景モデル230など)など、別のフレームと比較して動きの相対量を表し得る。動きの相対量は、ブロブのロケーション、ブロブのサイズ、ブロブの形状、またはそれらの組合せに基づいて決定され得る。例示のために、xが正の整数である、フレームxの相対動きは、フレームx中の第1のブロブとフレームx−1(たとえば、フレームxに先行するフレーム)中の第2のブロブとの間の差分として決定され得る。いくつかの実装形態では、動きの相対量は、ピクセルの数の変化として決定され得る。他の実装形態では、動きの相対量は、第1のブロブのロケーションと第2のブロブのロケーションとの間の差分に基づくベクトルとして決定され得る。
[0080]いくつかの実装形態では、キーフレーム選択器214(たとえば、イベント分析器218)は、累積値を生成するために、連続する画像フレームの複数のイベント分析結果220をフレームごとに加算し得る。例示のために、動きイベント期間に関連する各フレームについて、イベント分析器218は、フレームのイベント分析結果220を前の累積値に加算することによって、対応する累積値を決定し得る。各フレームについて、イベント分析器218は、対応する累積値を固定しきい値(たとえば、所定のしきい値)と比較し得る。対応する累積値が、固定しきい値よりも大きいかまたはそれに等しい場合、累積値に最も最近加算されたイベント分析結果220に対応するフレームが、キーフレーム236のうちの1つとして選択され得る。キーフレームが選択されたことに応答して、累積値は、固定しきい値だけ減少され得るか、または次のフレームのために初期値(たとえば、0)に設定され得る。対応する累積値が、固定しきい値よりも小さい場合、対応する累積値は、次のイベント分析結果220に関連する次のフレームのために、前の累積値として使用され得る。
[0081]他の実装形態では、しきい値は、所定の数のキーフレームが選択されることを可能にするために、動的に決定され得る。たとえば、要約フレーム生成器120は、総イベント結果を決定するために、動きイベント期間に関連するすべてのフレーム(たとえば、ビデオコンテンツの部分)の複数のイベント分析結果220を加算し得る。総イベント結果は、動きイベント期間中の画像フレーム240(たとえば、ビデオコンテンツ)の相対動きの総量を示し(たとえば、定量化し)得る。イベント分析器218は、総イベント結果を、選択されるべきキーフレームの所定の数で除算することによって、動きイベント期間に対応する動的しきい値を決定し得る。(ビデオコンテンツの部分に関連する)連続する画像フレームの分析結果は、累積値を生成するためにフレームごとに組み合わせられ得る。例示のために、動きイベント期間に関連する各フレームについて、要約フレーム生成器120は、フレームのイベント分析結果を前の累積値に加算することによって、対応する累積値を決定し得る。各フレームについて、要約フレーム生成器120は、対応する累積値を動的しきい値と比較し得る。累積値が、動的しきい値よりも大きいかまたはそれに等しい場合、対応するフレームは、キーフレームとして識別され得る。キーフレームが選択されたことに応答して、累積値は、動的しきい値だけ減少され得るか、または次のフレームのために初期値(たとえば、0)に設定され得る。対応する累積値が、動的しきい値よりも小さい場合、対応する累積は、次のイベント分析結果に関連する次のフレームのために、前の累積値として使用され得る。各フレームについてのイベント分析結果を使用することによって、非線形選択技法は、フレームのセットの(1つまたは複数の)イベント分析結果が高いとき、キーフレームとしてより多くのフレームを選択するように構成され得、フレームのセットの(1つまたは複数の)イベント分析結果が低いとき、より少ないフレームを選択し得る。
[0082]非線形技法を実装するために、イベント分析器218は、アキュムレータ222と比較器224とを含み得る。アキュムレータ222は、累積値を生成するために、連続する画像のイベント分析結果220を画像ごとに加算するように構成され得る。いくつかの実装形態では、アキュムレータ222は、加算器、レジスタ、または加算演算を実行するように構成された他の回路を含み得る。
[0083]比較器224は、累積値をしきい値226と比較するように構成され得る。いくつかの実装形態では、しきい値226は固定しきい値であり得る。例示のために、各フレームについて、比較器224は、対応する累積値を固定しきい値(たとえば、所定のしきい値)と比較し得、累積値が、固定しきい値よりも大きいかまたはそれに等しい場合、対応するフレームが、キーフレームとして選択され得、キーフレーム236中に含まれ得る。キーフレームが選択されると、累積値は、次のフレームのために初期値(たとえば、0)に設定され得るか、または得る、累積値は、累積値からしきい値226の値を減算することによって更新され得る。
[0084]他の実装形態では、しきい値226は、所定の数のキーフレームが選択されることを可能にするために、動的に決定され得る。たとえば、アキュムレータ222は、総イベント分析結果(たとえば、総イベント測定値)を決定するために、動きイベントに関連するすべての画像フレームのイベント分析結果220を加算し得る。総イベント分析結果は、動きイベントに対応する画像フレーム240関連する相対動きの総量に関連し(たとえば、それを定量化し)得る。イベント分析器218は、総イベント分析結果を、キーフレームの所定の数で除算することによって、動きイベントのための動的しきい値(たとえば、しきい値226)を決定し得る。
[0085]動的しきい値(たとえば、しきい値226)が決定された後に、アキュムレータ222は、対応する累積値を生成するために、連続する画像のイベント分析結果を画像ごとに加算し得る。各フレームについて、比較器224は、累積値を動的しきい値(たとえば、しきい値226)と比較し得、累積値が、動的しきい値よりも大きいかまたはそれに等しい場合、対応するフレームは、キーフレームとして識別され得、キーフレーム236中に含まれ得る。キーフレームが選択されると、累積値は、次のフレームのために初期値(たとえば、0)に設定され得るか、または、累積値は、累積値からしきい値226の値を減算することによって更新され得る。
[0086]いくつかの実装形態では、キーフレーム236は、画像フレーム240が受信されているとき、選択され得る。たとえば、動きイベント期間に関連するキーフレーム236のうちの1つまたは複数は、動きイベント期間の終了が決定される前に選択され得る。例示のために、300番目ごとのフレームが、キーフレームとして選択される場合、キーフレーム選択は、動きイベント期間の始まりが検出されたことに応答して始まり得る。他の実装形態では、キーフレーム236は、動きイベントに関連する画像フレーム240部分が受信された後に選択され得る。たとえば、特定の動きイベント期間のキーフレーム236は、動きイベント期間の終了がイベント検出器212によって決定された(たとえば、識別された)後に選択され得る。
[0087]キーフレーム選択器214はまた、メタデータ237を生成するように構成され得る。メタデータ237は、図1Aのメタデータ124または図1B〜図1Cのメタデータ187を含むかまたはそれに対応し得る。キーフレーム選択器214は、コンバイナ228にメタデータ237を与え得るか、要約フレーム生成器120の出力としてメタデータ237を与え得るか、またはその両方である。
[0088]コンバイナ228は、要約フレーム238を生成するように構成され得る。要約フレーム238は、物体の複数の表現を示し得る。物体は、動きイベントに対応する画像フレーム240の部分中に含まれ得る。物体は、1つまたは複数の検出されたブロブに関連するかまたはそれに対応し得る。要約フレーム238中に含まれる物体の複数の表現の各々は、キーフレーム236のうちの1つに対応し(たとえば、それから抽出され)得る。たとえば、コンバイナ228は、要約フレーム238を生成するために、第1のキーフレームからの物体の第1の表現と、第2のキーフレームからの物体の第2の表現とを組み合わせ得る。
[0089]例示のために、コンバイナ228は、背景モデル230とキーフレーム236(たとえば、フレームのサブセット)とを受信し得る。コンバイナ228は、キーフレーム236の各々について、キーフレームからの物体の表現を背景モデル230と組み合わせるように構成され得る。物体の(1つまたは複数の)表現を背景モデル230と組み合わせることによって、コンバイナ228は、要約フレーム238を生成し得る。したがって、要約フレーム238は、単一のフレーム(たとえば、単一の画像)中の動きイベント中の物体の動きを要約し得る。要約フレーム238は、図1の要約フレーム122を含むかまたはそれに対応し得る。要約フレーム238の例示的な例が250と指定される。いくつかの実装形態では、要約フレーム238は、要約フレーム生成器120とは別個であるデバイスなど、要約フレーム生成器120からリモートにある別のデバイスに通信され(たとえば、送信され)得る。
[0090]いくつかの実装形態では、メタデータ237、要約フレーム238、またはその両方は、図6を参照しながら説明されるように、インデクサー(図示せず)に与えられ得る。インデクサーは、メタデータ237、要約フレーム238、またはその両方に基づいて、画像フレーム240を含むビデオコンテンツなどのビデオコンテンツをインデックス付けするように構成され得る。
[0091]いくつかの実装形態では、コンバイナ228は、要約フレーム238中にメタデータ237を含め(たとえば、埋め込み)得る。メタデータ237は、キーフレーム選択器214によって生成され、出力されるものとして説明されるが、他の実装形態では、コンバイナ228は、図1Aのメタデータ124または図1B〜図1Cのメタデータ187など、メタデータを生成し得る。いくつかの実装形態では、コンバイナ228がメタデータを生成する場合、キーフレーム選択器214はメタデータ237を生成しないことがある。代替的に、他の実装形態では、コンバイナ228はメタデータを生成し得、キーフレーム選択器はメタデータ237を生成し得る。
[0092]いくつかの実装形態では、要約フレーム生成器120によって決定された動きイベント期間は、画像フレーム240の部分に対応し得る。画像フレーム240の部分は、画像フレーム240のビデオセグメント(たとえば、ビデオクリップ)に関連し得る。ビデオセグメントは、画像フレームの部分の全体、画像フレーム240の部分の全体未満、または画像フレーム240の部分の全体超を示し得る。例示のために、ビデオセグメントは、例示的な、非限定的な例として、動きイベントの始まりに関連する第1の特定のフレームと、動きイベントの終了に関連する第2の特定のフレームと、第1の特定のフレームおよび第2の特定のフレームの前の、それの後の、またはそれとの間の画像フレーム240とのうちの1つまたは複数のフレームを含み得る。
[0093]いくつかの実装形態では、要約フレーム生成器120(たとえば、イベント検出器212)は、検出技法、分類技法、セマンティック分析技法、またはそれらの組合せなど、1つまたは複数の画像処理技法に基づいて動きイベント期間(たとえば、動きイベント期間の始まりまたは終了)を検出するように構成され得る。検出技法は、(上記で説明された)ブロブ検出または物体検出を含み得る。物体検出は、画像フレーム240中の1つまたは複数の物体を検出するために使用され得る。検出され得る物体の例示的な、非限定的な例としては、歩行者、顔、車、火、煙、水(たとえば、洪水)などがある。いくつかの実装形態では、動きイベント期間の始まりは、画像フレーム240(たとえばビデオコンテンツ)中の特定の物体の検出に応答して決定され得、動きイベント期間の終了は、特定の物体が画像フレーム240(たとえばビデオコンテンツ)中でもはや検出されないときに決定され得る。
[0094]分類技法は、シーン分類器、物体分類器、顔分類器、(ビデオコンテンツがオーディオコンテンツに付随する場合)音および音声認識器、またはそれらの組合せなど、1つまたは複数の分類器を使用してフレームまたはそれの部分を分類し得る。シーン分類器は、フレームが、屋内シーンを示すのか、屋外シーンを示すのかを決定し得る。屋内シーンが決定された場合、フレームは、オフィス、教室、店、図書館、レストラン、リビングルームなどとして分類され得る。代替的に、屋外シーンが決定された場合、フレームは、街路ビュー、景観、ビーチ、海洋、山、森、建築物などとして分類され得る。物体分類器は、検出された物体が、人間であるのか、自動車であるのか、自転車であるのか、バッグであるのか、箱であるのか、家庭用ペットであるのかなどを決定し得る。検出された物体が人間である場合、顔分類器は、その人が誰であるか、性別、感情などを識別し得る。いくつかの実装形態では、画像フレーム240(たとえば、ビデオコンテンツ)がオーディオコンテンツに付随する場合、音および音声分類器は、誰かが話しているかどうかを決定し、言われたことを特徴づけ得る。追加または代替として、音および音声分類器は、発砲、雷、ホーン、サイレンまたはアラームなど、1つまたは複数の音を識別し得る。いくつかの実装形態では、画像フレーム240(たとえばビデオコンテンツ)のフレームに関連する分類器の指示は、メタデータ中に含まれ得る。
[0095]シーンのセマンティック分析は、自動シーン理解またはユーザ事前定義イベント検出を含み得る。自動シーン理解の一例としては、戦っている人々の検出があり得る。戦いは、ある身体動きをもつ複数の歩行者を見つけたときに検出され得るか、ある音および音声に関連し得るか、またはそれらの組合せである。戦いを検出することは、刑務所中など、ある環境またはロケーションにおいて適用可能であり得る。セマンティック分析の別の例は、ユーザ定義イベントを伴うことができる。たとえば、要約フレーム生成器120のユーザが、カメラなど、キャプチャユニットによってキャプチャされた(背景に対応する)街路ビューのシーン中の非パーキングゾーンを定義することができる。非パーキングゾーン中の違法パーキングのイベントが、車が非パーキングゾーン中で検出され、ドライバが車を出たときに検出され得る。
[0096]1つまたは複数の画像処理技法(たとえば、検出技法、分類技法、セマンティック分析技法、またはそれらの組合せ)は、フレームの全体に対して、または、フレーム部分に対して実装され得る。たとえば、フレームの部分は、背景減算がフレームに対して実行された後に検出された前景ブロブに対応し得る。画像の全体に対してではなく部分に対して1つまたは複数の画像処理技法を適用することによって、1つまたは複数の画像処理技法は、より迅速に実行され得、より少ない電力を使用し得る。
[0097]したがって、図2のシステム200は、要約フレーム238を生成するように構成され得る。要約フレーム238は、画像フレーム240中に含まれる物体の、および動きイベントに対応する複数の表現を示し得る。要約フレーム238は、ユーザによって迅速に閲覧され得る単一の画像中に、画像フレーム240中に含まれる物体の動きを要約し得る。したがって、ユーザは、要約フレーム238に基づいて、および動きイベントに対応するビデオクリップを見る必要なしに、動きイベントの理解を得ることが可能であり得る。
[0098]図3を参照すると、要約フレームを生成する方法300の第1の例示的な例の流れ図が示されている。要約フレームは、図1Aの要約フレーム122、要約フレーム150、図2の要約フレーム238、または要約フレーム250を含むかまたはそれに対応し得る。方法300は、図1Aのシステム100、図1Bのシステム160、図1Cのシステム190、図2のシステム200(たとえば、要約フレーム生成器120)、またはそれらの組合せによって実行され得る。
[0099]ビデオコンテンツの画像フレーム(たとえば、画像フレームのストリームのうちの画像フレーム)が、302において、受信され得る。たとえば、ビデオコンテンツは、図1Aのビデオコンテンツ140、図1B〜図1Cのビデオコンテンツ167、または図2の画像フレーム240を含むかまたはそれに対応し得る。306において、アクティビティ(たとえば、動き)がフレーム中で検出されたかどうか決定が行われ得る。たとえば、ビデオ分析およびアクティビティ決定は、図2のイベント検出器212によって実行され得る。例示のために、ビデオ分析およびアクティビティテスト(activity test)は、画像セグメンテーション、色セグメンテーション、画像フィルタ処理、加速化断片試験による特徴抽出(FAST)、高速化ロバスト特徴(SURF)、スケール不変特徴変換(SIFT)、コーナー検出、エッジ検出、背景減算、ブロブ検出など、1つまたは複数の検出アルゴリズムを実行することに関連し得る。追加または代替として、ビデオ分析およびアクティビティテストは、1つまたは複数の分類アルゴリズム、シーンアルゴリズムのセマンティック分析、またはそれらの組合せを使用することに関連し得る。例示のために、フレーム中の動きを検出するために、背景減算が、前景ブロブを決定するために特定のフレームに対して実行され得る。前景ブロブのサイズが決定され、306において、アクティビティ(たとえば、動き)が検出されたかどうかを決定するために、しきい値サイズと比較され得る。
[00100]動きが検出された場合、方法300は、308において、動きイベントの始まりが検出されたかどうかを決定し得る。動きイベントが開始していない場合、方法300は、310において、動きイベントの始まりを示し得、方法300は、312において、フレームについてのイベント分析結果を決定することに進み得る。代替的に、動きイベントがすでに開始している場合、方法300は312に進み得る(たとえば、検出されたアクティビティは、新しい動きイベントの開始ではなく進行中の動きイベントの一部と見なされ得る)。
[00101]方法300は、314において、イベント分析結果に部分的に基づいて、受信されたフレームを保つべきかどうかを決定し得る。312において、イベント分析結果を決定することと、314、受信されたフレームを保つべきかどうかを決定することとは、相対動き値など、フレームに対応するイベント分析結果を決定することと、イベント分析結果に基づいて累積値を決定することと、累積値をしきい値と比較することとを含むかまたはそれに対応し得る。たとえば、そのような動作は、図2のキーフレーム選択器214(たとえば、イベント分析器218)によって実行され得る。
[00102]受信されたフレームを保つとの決定が行われた場合、受信されたフレームは、316において、(バッファにおいて)バッファされ得、方法300は、318において、ビデオコンテンツの次のフレームを識別することに進み得る。バッファされたフレームは、図2のキーフレーム236など、キーフレームを含むかまたはそれに対応し得る。いくつかの実装形態では、バッファされたフレームのメタデータも、316において、バッファされるかまたは場合によっては記憶され得る。代替的に、受信されたフレームを保たない(たとえば、廃棄する)との決定が行われた場合、方法300は、フレームをバッファすることなしに318に進み得る。318において、次のフレームを識別した後に、方法は302に戻り得る。
[00103]306において、アクティビティが検出されない場合、方法300は、322において、動きイベントの始まりが検出されたか(たとえば、動きイベントがすでに開始されたか)どうかを決定し得る。動きイベントが開始されていない場合、方法300は、318に進み得る。動きイベントがすでに開始されている場合、方法300は、324において、イベントの終了を示し得る。
[00104]イベントが324において終了した後に、バッファされたフレーム(たとえば、キーフレーム)は、328において、バッファから取り出され得、バッファされたフレームを使用して要約フレームを生成し得る。要約フレームは、316においてバッファされた画像フレームを使用して生成され得る。たとえば、要約フレームは、図1の要約フレーム122、要約フレーム150、図2の要約フレーム238、または要約フレーム250を含むかまたはそれに対応し得る。
[00105]いくつかの実装形態では、方法300は、330において、要約フレームに関連するメタデータを随意に生成し得る。たとえば、バッファされたフレームのメタデータの部分は、要約フレームのメタデータの少なくとも部分を生成するために組み合わせられ得る。いくつかの実装形態では、要約フレームのメタデータは、バッファされたフレームのうちのどれが要約フレームを生成するために使用されたかを示し得る。
[00106]したがって、図3の方法300は、動きイベントの終了を決定することより前に、1つまたは複数のフレーム(たとえば、キーフレーム)を選択し、バッファすることを示す。動きイベントの終了に応答して、バッファされたキーフレームは、要約フレームを生成するためにアクセスされ得る。
[00107]図4を参照すると、要約フレームを生成する方法400の第2の例示的な例の流れ図が示されている。要約フレームは、図1の要約フレーム122、要約フレーム150、図2の要約フレーム238、または要約フレーム250を含むかまたはそれに対応し得る。方法400は、図1Aのシステム100、図1Bのシステム160、図1Cのシステム190、図2のシステム200(たとえば、要約フレーム生成器120)、またはそれらの組合せによって実行され得る。
[00108]ビデオコンテンツ(たとえば、画像フレームのストリーム)の画像フレームが、402において、受信され得る。たとえば、ビデオコンテンツは、図1Aのビデオコンテンツ140、図1B〜図1Cのビデオコンテンツ167、または図2の画像フレーム240を含むかまたはそれに対応し得る。406において、アクティビティ(たとえば、動き)がフレーム中で検出されたかどうか決定が行われ得る。たとえば、ビデオ分析およびアクティビティ決定は、図2のイベント検出器212によって実行され得る。例示のために、ビデオ分析およびアクティビティテストは、画像セグメンテーション、色セグメンテーション、画像フィルタ処理、加速化断片試験による特徴抽出(FAST)、高速化ロバスト特徴(SURF)、スケール不変特徴変換(SIFT)、コーナー検出、エッジ検出、背景減算、ブロブ検出など、1つまたは複数の検出アルゴリズムを実行することに関連し得る。追加または代替として、ビデオ分析およびアクティビティテストは、1つまたは複数の分類アルゴリズム、シーンアルゴリズムのセマンティック分析、またはそれらの組合せを使用することに関連し得る。例示のために、アクティビティテストは、406において、前景ブロブを決定するために特定のフレームに対して背景減算を実行し得る。前景ブロブのサイズが決定され、406において、特定のフレームがアクティビティ(たとえば、動き)に対応するかどうかを決定するために、しきい値サイズと比較され得る。
[00109]動きが検出された場合、方法400は、408において、動きイベントの始まりが検出されたかどうかを決定する。動きイベントが開始していない場合、方法300は、410において、動きイベントの始まりを示し得、方法400は、412において、フレームについてのイベント分析結果を決定することに進み得る。代替的に、動きイベントがすでに開始している場合、方法400は412に進み得る(たとえば、検出されたアクティビティは、新しい動きイベントの開始ではなく進行中の動きイベントの一部と見なされ得る)。
[00110]412において、方法400は、イベント分析結果を決定し得る。フレームに対応するイベント分析結果は、決定され得る。たとえば、イベント分析結果は、相対動き値、複数のフレームの累積値(たとえば、イベントの総相対動き値)、またはその両方であり得る。たとえば、イベント分析結果は、図2のキーフレーム選択器214(たとえば、イベント分析器218)によって決定され得る。
[00111]412における、イベント分析後に、方法400は、416において、(バッファにおいて)フレームをバッファし得る。いくつかの実装形態では、バッファされたフレームのメタデータも、416において、バッファされるかまたは場合によっては記憶され得る。方法400は、418において、ビデオコンテンツの次のフレームを識別することに進み得る。418において、次のフレームを識別した後に、方法は402に戻り得る。
[00112]406において、アクティビティが検出されない場合、方法400は、422において、動きイベントの始まりが検出されたか(たとえば、動きイベントがすでに開始されたか)どうかを決定し得る。動きイベントが開始されていない場合、方法400は、418に進み得る。動きイベントがすでに開始されている場合、方法400は、424において、イベントの終了を示し得る。
[00113]イベントが424において終了した後に、方法400は、426において、キーフレームとして1つまたは複数のバッファされたフレームを選択し得る。たとえば、キーフレーム選択は、キーフレーム選択器214(たとえば、イベント分析器218)によって実行され得、キーフレームは、図2のキーフレーム236を含むかまたはそれに対応し得る。例示のために、イベントが終了したことに応答して、累積値(たとえば、イベントの総相対動き値)が識別され得る。しきい値は、除算され得るイベントの総相対動き値を、選択されるべきキーフレームの所定の数で除算することによって決定され得る。しきい値が決定された後に、416において、バッファされたフレームは、相対動き値など、フレームに対応するイベント分析結果を決定し、イベント分析結果に基づいて累積値を決定し、累積値をしきい値と比較するために、フレームごとに処理され得る。特定の累積値が、しきい値よりも大きいかまたはそれに等しい場合、特定の累積値に対応する特定のフレームが、(たとえば、要約フレーム生成中に使用するために)キーフレームとして選択され得る。
[00114]方法400は、428において、要約フレームを生成することを含み得る。たとえば、要約フレームは、図1の要約フレーム122、要約フレーム150、図2の要約フレーム238、または要約フレーム250を含むかまたはそれに対応し得る。
[00115]いくつかの実装形態では、方法400は、430において、要約フレームに関連するメタデータを随意に生成し得る。たとえば、キーフレームとして選択された1つまたは複数のバッファされたフレームのメタデータの部分は、要約フレームのメタデータの少なくとも部分を生成するために組み合わせられ得る。いくつかの実装形態では、要約フレームのメタデータは、どのバッファされたキーフレームが要約フレームを生成するために使用されたかを示し得る。
[00116]したがって、図4の方法400は、動きイベントの終了を決定した後に、1つまたは複数のキーフレームを選択することを示す。1つまたは複数のキーフレームの部分は、要約フレームを生成するために組み合わせられ得る。
[00117]図5を参照すると、要約フレームを生成し、通信するように動作可能なシステム500の例示的な例が示されている。システム500は、ビデオシステム502とデバイス550とを含み得る。いくつかの実装形態では、ビデオシステム502は、閉回路テレビジョン(CCTV)システムなどのビデオ監視システムであり得る。追加または代替として、図5を参照しながら説明される技法は、電子デバイス、モバイルデバイス、車両、ゲーミングコンソール、自動車システムコンソール(たとえば、ADAS)、ウェアラブルデバイス(たとえば、パーソナルマウントカメラ)、ヘッドマウントディスプレイ(HMD)などとともに使用され得る。追加の例は、限定はしないが、ロボットまたはロボティックデバイス、無人航空機(UAV)、およびドローンを含む。
[00118]ビデオシステム502は、ネットワーク570を介してデバイス550に通信可能に結合され得る。ネットワーク570は、ワイヤードネットワーク、ワイヤレスネットワーク、またはそれらの組合せを含み得る。
[00119]ビデオシステム502は、コントローラ510と、1つまたは複数のカメラなど、1つまたは複数のキャプチャユニットとを含み得る。たとえば、ビデオシステム502は、単一のカメラを含み得るか、または第1のカメラ530および第2のカメラ532など、複数のカメラを含み得る。第1のカメラ530、第2のカメラ532、またはその両方は、図1B〜図1Cのカメラ162を含むかまたはそれに対応し得る。いくつかの実装形態では、コントローラ510は、例示的な、非限定的な例として、コンピュータ、サーバ、タブレット、ルータ、カメラなど、デバイス(たとえば、画像処理デバイス)を含むかまたはそれに対応し得る。コントローラ510は、第1の接続536を介して第1のカメラ530に結合され得、第2の接続538を介して第2のカメラ532に結合され得る。第1の接続536および第2の接続538の各々は、ワイヤード接続、ワイヤレス接続、またはそれらの組合せを含み得る。いくつかの実装形態では、第1のカメラ530または第2のカメラ532は、インターネットプロトコル(IP)カメラを含み得る。ビデオシステム502が2つのカメラを有するものとして説明されるが、他の実装形態では、ビデオシステム502は、3つ以上のカメラまたは2つよりも少ないカメラを含み得る。
[00120]第1のカメラ530および第2のカメラ532の各々は、カメラの対応する視野のビデオコンテンツを生成するように構成され得る。ビデオコンテンツは、画像フレームのシーケンスを含み得る。たとえば、第1のカメラ530は、ビデオコンテンツ534(たとえば、複数の画像フレーム)を生成するように構成され得る。ビデオコンテンツ534は、図1Aのビデオコンテンツ140、図1B〜図1Cのビデオコンテンツ167、または図2の画像フレーム240を含むかまたはそれに対応し得る。いくつかの実装形態では、第1のカメラ530、第2のカメラ532、またはその両方は、対応するメモリを含み得る。たとえば、第1のカメラ530は、第1のカメラ530によって生成された1つまたは複数の画像フレーム(たとえば、ビデオコンテンツ534)を記憶するように構成されたメモリ531を含み得る。
[00121]第1のカメラ530、第2のカメラ532、またはその両方は、固定(および静止)位置に取り付けられ得る。第1のカメラ530が、固定および静止位置に取り付けられた場合、第1のカメラ530の視野の背景は、静止していると見なされ得る。たとえば、ビデオコンテンツ534(たとえば、ビデオストリーム)の背景は、延長された時間期間にわたって固定(または比較的固定)のままである、建築物、木、標識など、特徴を含み得る。
[00122]コントローラ510は、メモリ512と、プロセッサ518と、通知生成器526とを含み得る。コントローラ510は、第1のカメラ530および第2のカメラ532など、1つまたは複数のカメラからビデオコンテンツを受信し得、プロセッサ518にビデオコンテンツを与え得る。たとえば、プロセッサ518は、第1のカメラ530からビデオコンテンツ534を受信し得る。
[00123]メモリ512は、インデックス付きビデオコンテンツ514と、デバイス情報516とを含み得る。インデックス付きビデオコンテンツ514は、ビデオコンテンツ534とインデックスデータ513とを含み得る。インデックスデータ513は、図6を参照しながら説明されるように生成され得る。たとえば、インデックスデータ513は、プロセッサ518(たとえば、インデクサー)によって生成され得る。インデックスデータ513は、インデックスメタデータ515と、1つまたは複数の要約フレーム521とを含み得る。インデックスメタデータ515は、ビデオコンテンツ534の1つまたは複数の再生位置を示すマーカーデータを含み得る。一例として、マーカーデータは、ビデオコンテンツ534の記憶ロケーションへのリンク(たとえば、ユニフォームリソースロケータ(URL))を含み得、リンクの選択は、第1の再生位置において始まるビデオコンテンツ534の再生を始動し得る。第1の再生位置は、1つまたは複数の要約フレーム521のうちの第1の要約フレームに関連する動きイベントの始まりに対応し得る。追加または代替として、インデックスメタデータ515は、ビデオコンテンツ534の部分の第2の再生位置を示す第2のマーカーデータを含み得る。第2の再生位置は、第1の要約フレーム中に含まれる物体の複数の表現のうちの第1の表現を生成するために使用されるビデオコンテンツ534のフレームに対応し得る。
[00124]いくつかの実装形態では、インデックスデータ513は、第1の要約フレームおよび第2の要約フレームなど、複数の要約フレームを含み得る。第2の要約フレームは、ビデオコンテンツ534の第2の部分に関連し得、ビデオコンテンツ534の第2の部分中に含まれる第2の物体の複数の表現を示し得る。この例では、インデックスメタデータ515は、ビデオコンテンツ534の第2の部分に対応する第3の再生位置を示す第3のマーカーデータを含み得る。
[00125]いくつかの実装形態では、インデックスデータ513が複数の要約フレームを含む場合、インデックスメタデータ515は、(1つまたは複数の要約フレーム521のうちの)第1の要約フレームに対応するメタデータの少なくとも第1の部分と、(1つまたは複数の要約フレーム521のうちの)第2の要約フレームに対応するメタデータの少なくとも第2の部分とを組み合わせることによって生成されたメタデータなど、連結されたメタデータであり得る。連結されたメタデータ586の例示的な例が580において示されている。連結されたメタデータ586は、リンク581〜585を含む。リンク581〜585の各々は、ビデオコンテンツ534の異なる再生位置に対応する。第1のリンク581は、第1の要約フレームに関連する動きイベントの開始における第1のフレームに対応する。第2のリンク582は、第1の要約フレームを生成するために使用されたビデオコンテンツ534の第2のフレーム(たとえば、第1のキーフレーム)に対応する。第3のリンク583は、第1の要約フレームを生成するために使用されたビデオコンテンツ534の第3のフレーム(たとえば、第2のキーフレーム)に対応する。第4のリンク584は、第2の要約フレームに関連する動きイベントの開始における第4のフレームに対応する。第5のリンク585は、第2の要約フレームを生成するために使用されたビデオコンテンツ534の第5のフレーム(たとえば、キーフレーム)に対応する。したがって、特定の態様では、(1つまたは複数の)要約フレームについてのメタデータは、ビデオコンテンツ内の特定の時点に「ジャンプする」ために使用され得る再生リストであり得る。
[00126]デバイス情報516は、ビデオシステム502にリモートでアクセスするように構成され得るか、またはビデオシステム502からデータを受信し得る、デバイス550に関連し得る。たとえば、デバイス情報516は、デバイス550のデバイスアドレス(たとえば、電子メールアドレス、電話番号など)を示すデータを含み得る。
[00127]デジタル信号プロセッサ(DSP)、中央処理ユニット(CPU)、またはグラフィカル処理ユニット(GPU)など、プロセッサ518は、要約フレーム生成器520を含み得る。要約フレーム生成器520は、図1Aの要約フレーム生成器120または図1B〜図1Cの要約フレーム生成器180を含むかまたはそれに対応し得る。プロセッサ518(たとえば、要約フレーム生成器520)は、ビデオコンテンツ534の部分に対応する動きイベント期間(たとえば、動きイベントの始まり、動きイベントの終了、またはその両方)を検出するように構成され得る。動きイベント期間に対応するビデオコンテンツ534の部分は、ビデオセグメント548(たとえば、ビデオクリップ)と呼ばれることがある。いくつかの実装形態では、ビデオセグメント548はメモリ512に記憶され得る。
[00128]プロセッサ518(たとえば、要約フレーム生成器520)は、ビデオコンテンツ534の部分に関連する要約フレーム522を生成するようにであるさらに構成され得る。たとえば、ビデオコンテンツ534の部分は、物体に関連する動きイベントを示し得る。要約フレーム522は、ビデオコンテンツ534の部分の視覚要約を与え得る。たとえば、図1Aの要約フレーム122、図1Cの第1の要約フレーム198、要約フレーム199、図2の要約フレーム238、または要約フレーム250など、要約フレーム522は、物体の複数の表現を示し得る。要約フレーム522を生成するために、プロセッサ518(たとえば、要約フレーム生成器520)は、図2のキーフレーム236などの1つまたは複数のキーフレームを選択するように構成され得る。たとえば、プロセッサ518は、要約フレーム522を生成するために、第1のキーフレームからの物体の第1の表現と、第2のキーフレームからの物体の第2の表現とを組み合わせ得る。
[00129]プロセッサ518は、要約フレーム522に関連するメタデータ524を生成するようにさらに構成され得る。メタデータ524は、図1Aのメタデータ124または図1B〜図1Cのメタデータ187を含むかまたはそれに対応し得る。メタデータ524は、(動きイベント期間に対応する)ビデオセグメント548の識別子、要約フレーム522中に含まれる物体の表現を生成するために使用されたキーフレームの指示、動きイベント期間の始まりに関連する第1のタイムスタンプ、動きイベント期間の終了に関連する第2のタイムスタンプ、ビデオコンテンツ534を生成した第1のカメラ530に関連するカメラ識別子、インデックス付きビデオコンテンツ514(またはビデオセグメント548)が記憶されたメモリ512の記憶ロケーションへのリンク、またはそれらの組合せを含み得る。いくつかの実装形態では、メタデータ524は、要約フレーム522中に含まれ(たとえば、それの中に埋め込まれ)得る。追加または代替として、メタデータ524はメモリ512において記憶され得る。例示のために、メタデータ524は、メモリ112において記憶されたインデックス付きビデオコンテンツ514またはビデオセグメント548中に含まれ得る。
[00130]いくつかの実装形態では、プロセッサ518は、インデックス付きビデオコンテンツ514を生成するためにビデオコンテンツ534をインデックス付けするように構成され得る。たとえば、ビデオコンテンツ534は、動きイベント期間の始まりに対応する第1の特定のフレーム、動きイベント期間に関連するキーフレームのうちの1つまたは複数、動きイベント期間の終了に対応する第2の特定のフレーム、または要約フレーム522、あるいはそれらの組合せに従って、インデックス付けされ得る。1つまたは複数の要約フレームを使用してビデオコンテンツをインデックス付けすることの例は、図7A〜図7Bを参照しながら説明される。別の例として、ビデオコンテンツ534は、第1の特定のフレーム、キーフレームのうちの1つまたは複数、第2の特定のフレーム、またはそれらの組合せに適用されるオフセットに基づいて、インデックス付けされ得る。例示のために、ビデオコンテンツ534は、動きイベント期間の始まりに対応する第1の特定のフレームの前の第1のオフセット値(たとえば、60個のフレーム)におけるフレームを使用して、および動きイベント期間の終了に対応する第2の特定のフレームの後の第2のオフセット値(たとえば、30個のフレーム)における別のフレームを使用して、インデックス付けされ得る。いくつかの実装形態では、プロセッサ518は、メモリ512において、動きイベント期間に関連するビデオセグメント548を記憶し得る。たとえば、ビデオセグメント548は、インデックス付きビデオコンテンツ514とは別個に(それに加えてまたはそれの代わりに)メモリ512において記憶され得る。
[00131]通知生成器526は、要約フレーム522、メタデータ524、またはその両方を受信することと、要約フレーム522を受信すべき、デバイス550などの1つまたは複数のデバイスを識別することとを行うように構成され得る。たとえば、要約フレーム522を受信したことに応答して、通知生成器526は、メタデータ524を識別し得、ビデオコンテンツ534を生成した第1のカメラ530のカメラ識別子を決定し得る。通知生成器526は、デバイス情報516にアクセスし、第1のカメラ530のカメラ識別子に基づいて1つまたは複数のデバイスを識別し得る。例示のために、通知生成器526は、検出された動きイベントに応答してデバイス550が通知されるべきであると決定し得、デバイス情報516中に含まれる(デバイス550に関連する)アドレスを識別し得る。通知生成器526は、動きイベント期間に関連する要約フレーム522、メタデータ524、または要約フレーム522が生成されたことを識別するインジケータを含む通知540を生成し得る。。いくつかの実装形態では、通知540は、例示的な、非限定的な例として、電子メールまたはショートメッセージサービス(SMS)メッセージを含み得る。ビデオシステム502(たとえば、コントローラ510)は、ワイヤレスネットワークなどのネットワーク570を介して、アドレス(たとえば、デバイス550)に通知540を送り得る。
[00132]デバイス550は、受信機552と、送信機554と、ディスプレイ556と、プロセッサ558と、メモリ560と、インターフェース562とを含み得る。いくつかの実装形態では、受信機552、送信機554、またはその両方は、トランシーバ(図示せず)中に含まれ得る。受信機552は、ビデオシステム502から通知540を受信するように構成され得る。
[00133]ディスプレイ556は、画像(たとえば、画像フレーム)、または複数の画像フレームを含むビデオコンテンツを提示するように構成され得る。たとえば、ディスプレイ556は、要約フレーム522を提示するように構成され得る。動きイベント期間に関連する、および物体の複数の表現を含む要約フレーム522を提示することによって、デバイス550のユーザは、動きイベント期間中に発生したアクティビティの理解を得るために、要約フレーム522を迅速にレビューし得る。
[00134]インターフェース562は、キーパッド、タッチスクリーン、マイクロフォン、カメラ、動きセンサー(たとえば、超音波または赤外線センサー)、ワイヤレスインターフェースなど、ユーザインターフェースを含み得る。いくつかの実装形態では、インターフェース562は、ディスプレイ556を介して提示されるグラフィカルユーザインターフェース(GUI)に対応し得る。インターフェース562は、要約フレーム522に対応するビデオコンテンツ534の部分を再生するための選択に対応する入力などの入力を受信するように構成され得る。たとえば、入力は、要約フレーム522に対応するビデオセグメント548(たとえば、ビデオコンテンツ534のビデオクリップ)についての要求544に関連し得る。例示のために、デバイス550において要約フレーム522を閲覧したことに応答して、デバイス550のユーザは、要約フレーム522に対応するビデオセグメント548(たとえば、ビデオクリップ)を閲覧することを要求し得る。したがって、ユーザは、要求544を始動するために、インターフェース562を介して入力を与え得る。
[00135]デジタル信号プロセッサ(DSP)、中央処理ユニット(CPU)、またはグラフィカル処理ユニット(GPU)など、プロセッサ558は、メモリ560に結合され得る。メモリ560は、データ、命令、またはその両方を記憶するように構成され得る。プロセッサ558は、メモリ560に記憶されたソフトウェア(たとえば、1つまたは複数の命令のプログラム)を実行するように構成され得る。インターフェース562を介して受信された入力に応答して、プロセッサ558は、要約フレーム522によって要約された動きイベントに対応するビデオセグメント548についての要求544を生成し得る。いくつかの実装形態では、要求544は、デバイス550(またはユーザ)が、ビデオセグメント548を受信することを許可されることを検証するために使用され得る認証情報546を含み得る。追加または代替として、要求544は、例示的な、非限定的な例として、要約フレーム522、動きイベント期間、またはそれらの組合せを識別するメタデータ524の少なくとも部分を含み得る。プロセッサ558は、ビデオシステム502(たとえば、コントローラ510)に要求544を送ることを始動し得る。送信機554は、ネットワーク570を介して(たとえば、少なくとも1つのネットワークを介して)ビデオシステム502に要求544を送信するように構成され得る。
[00136]コントローラ510は、デバイス550から要求544を受信し得、デバイス550が、要約フレーム522に関連するビデオセグメント548を受信することを許可されることを検証し得る。たとえば、コントローラ510は、デバイス550から受信された認証情報546中に含まれるユーザ名とパスワードとを検証し得る。例示のために、コントローラ510は、ユーザ名とパスワードとを検証するためにデバイス情報516を使用し得る。
[00137]要求544に応答して、コントローラ510は、要約フレーム522に対応するビデオセグメント548を識別し得る。たとえば、コントローラ510は、要求544中に含まれるメタデータ524の部分に基づいてビデオセグメント548を識別し得る。いくつかの実装形態では、コントローラ510(たとえば、プロセッサ518)は、メモリ512において記憶されたビデオセグメント548を取り出し得る。他の実装形態では、メタデータ524の部分は、コントローラ510が、ビデオセグメント548に対応するインデックス付きビデオコンテンツ514の部分にアクセスすることを可能にするインデックス識別子を含み得る。コントローラ510は、ネットワーク570を介してデバイス550にビデオセグメント548を送り得る。(要約フレーム522を含む)通知540の第1のデータサイズが、ビデオセグメント548の第2のデータサイズよりも小さくなり得る。したがって、要約フレーム522を含む(およびビデオセグメント548を含まない)通知540は、より少ないネットワーク帯域幅を使用し得、ビデオセグメント548を含む通知よりもデバイス550により迅速に与えられ得る。
[00138]動作中に、コントローラ510は、第1のカメラ530から受信されたビデオコンテンツ534(たとえば、複数の画像フレーム)に対応する動きイベント期間を検出し得る。コントローラ510は、物体の複数の表現を示す要約フレーム522を生成し得る。物体は、動きイベント期間に対応するビデオコンテンツ534の部分中に含まれ得る。要約フレーム522が生成された後に、要約フレーム522は、デバイス550に送られる通知540中に含まれ得る。
[00139]デバイス550は、ビデオシステム502(たとえば、ビデオ監視システム)から動きイベント期間の通知540を受信し得る。デバイス550は、ディスプレイ556を介して通知540中に含まれる要約フレーム522を提示し得る。ディスプレイ556を介して提示された要約フレーム522は、デバイス550のユーザに、動きイベント期間に対応するビデオコンテンツ534を要約する単一の画像を与え得る。例示のために、ビデオシステム502は、デバイス550のユーザの自宅において設置され得、第1のカメラ530は、自宅のフロントドアの外側のシーンに関連する視野を有するために、自宅に取り付けられ得る。コントローラ510は、配達人などの人がフロントドアに近づくたびに動きイベント期間を検出し得、デバイス550に送られる対応する要約フレームを生成し得る。
[00140]要約フレーム522を含む通知540を受信した後に、デバイス550は、ビデオシステム502(たとえば、コントローラ510)に、動きイベント期間に対応するビデオセグメント548など、要約フレーム522に関連するビデオセグメント548についての要求544を送り得る。ビデオシステム502(たとえば、コントローラ510)は、デバイス550から要求544を受信し得、要求544に応答して、デバイス550にビデオセグメント548を送り得る。デバイス550は、ビデオセグメント548を受信し得、メモリ560においてビデオセグメント548を記憶し得る。追加または代替として、デバイス550は、デバイス550のディスプレイ556を介してビデオセグメント548を提示し得る。いくつかの実装形態では、ビデオセグメント548は、要求544に応答して、ビデオシステム502からデバイス550にストリーミングされ得る。
[00141]いくつかの実装形態では、通知540は、要約フレーム522などの単一の要約フレームを含み得る。他の実装形態では、通知540は複数の要約フレームを含み得る。たとえば、プロセッサ518は、ビデオコンテンツ534の第1の部分に関連する第1の動きイベント期間を検出し得、第1のカメラ530によってまたは第2のカメラ532によって生成された第2のビデオコンテンツの第2の部分に関連する第2の動きイベント期間を検出し得る。プロセッサ518は、第1の動きイベント期間に関連する要約フレーム522を生成し得、第2の動きイベント期間に関連する第2の要約フレームを生成し得る。通知540は、要約フレーム522と第2の要約フレームとを含み得る。第1の動きイベントは、第2の動きイベントの第2の持続時間と同じであるかまたはそれとは異なる第1の持続時間を有し得る。いくつかの実装形態では、第1の持続時間および第2の持続時間は、時間の最小量または最大量に制限されないことがある。他の実装形態では、第1の持続時間または第2の持続時間のうちの少なくとも1つは、第1の持続時間または第2の持続時間が、第1のしきい値よりも大きいか、第2のしきい値よりも小さいか、またはその両方であるように、時間的に制限され得る。代替または追加として、第1の動きイベント期間と第2の動きイベント期間とは、時間的に少なくとも部分的に重複し得る。他の実装形態では、第1の動きイベントと第2の動きイベントとは、時間的に重複しないことがある。
[00142]いくつかの実装形態では、通知生成器526は、動きイベント期間の終了を決定したことに応答して通知540を生成するように構成され得る。追加または代替として、通知540は、要約フレーム522が生成されたことに応答して生成され得る。他の実装形態では、通知生成器526は、所定の間隔において通知を生成するように構成され得る。例示的な非限定的な例として、通知生成器526は、3時間ごとに通知を生成し得る。随意に、先行する3時間期間中に動きイベントが検出されなかった場合、(1つまたは複数の)要約フレームなしの通知が生成され得る。別の例として、第1の間隔は8時間長であり得、午前9時から午後5時までに発生し得、第2の間隔は1時間長であり得、午前9時から午後5時までに数回発生し得る。通知生成器526が所定の間隔において通知を生成する場合、各通知は、最も最近の通知が送られたときから生成された1つまたは複数の要約フレームを含み得る。いくつかの実装形態では、通知生成器526は、要約フレームが生成されなかった場合、あらゆる所定の間隔において通知を送るとは限らない。たとえば、要約フレームが第1の時間と第2の時間との間で生成されなかった場合、および第2の時間が所定の時間間隔に対応する場合、通知生成器526は、第2の時間において通知を送らないことがある。
[00143]いくつかの実装形態では、ビデオシステム502(たとえば、コントローラ510)が、時間期間の後になど、所定の時間において通知を送るように構成された場合、メモリ512は、時間期間中にビデオコンテンツ(またはそれのフレーム)を記憶するように構成され得る。所定の時間において、要約フレーム生成器520は、記憶されたビデオコンテンツにアクセスし、ビデオコンテンツ中に含まれる動きイベントを識別するためにビデオコンテンツを分析するように構成され得る。各識別された動きイベントについて、要約フレーム生成器520は、対応する要約フレームを生成し得る。(時間期間に関連する)ビデオコンテンツに基づいて生成された各要約フレームは、通知生成器526によって生成された同じ通知中に含まれ得る。
[00144]いくつかの実装形態では、デバイス550は、ビデオシステム502とデバイス550との間のセキュアな通信を可能にするアプリケーション(たとえば、プロセッサ558によって実行可能なソフトウェアアプリケーション)を含み得る。そのような実装形態では、通知540、要求544、ビデオセグメント548、またはそれらの組合せは、アプリケーションを使用して通信され得る。追加または代替として、アプリケーションは、デバイス550がビデオシステム502にアクセスすることを可能にし得る。たとえば、アプリケーションは、デバイス550が、例示的な、非限定的な例として、メモリ512(たとえば、デバイス情報516、またはインデックス付きビデオコンテンツ514の少なくとも部分)、第1のカメラ530によって生成されたビデオコンテンツ534、第2のカメラ532によって生成されたビデオコンテンツにアクセスすることを可能にし得る。いくつかの実装形態では、アプリケーションは、デバイス550のユーザが、要約フレーム、通知、またはその両方の生成および送信に関連する1つまたは複数の選好を設定することを可能にし得る。たとえば、1つまたは複数の選好は、例示的な、非限定的な例として、通知がデバイスにどのくらいの頻度で送られるか、どのカメラについての通知をデバイス550が受信したべきであるか、または動きイベント期間のためにいくつのキーフレームを選択すべきかを示し得る。
[00145]コントローラ510が1つまたは複数のカメラとは別個であるものとして説明されたが、他の実装形態では、コントローラ510、またはそれの構成要素は、第1のカメラ530、第2のカメラ532、またはその両方など、カメラ中に含まれている得る。例示的な、非限定的な例として、第2のカメラ532は、メモリ(たとえば、メモリ512)と画像プロセッサ(たとえば、プロセッサ518)とを含み得る。いくつかの実装形態では、第1のカメラ530のメモリ531は、コントローラ510のメモリ512に対応し得る。たとえば、メモリ531は、インデックス付きビデオコンテンツ514、デバイス情報516、またはそれらの組合せを記憶するように構成され得る。
[00146]いくつかの実装形態では、第1のカメラ530は、1つまたは複数の要約フレームを生成し、(第1のカメラ530とは別個である)コントローラ510にまたはデバイス550に、1つまたは複数の要約フレームを与えるように構成され得る。たとえば、いくつかの実装形態では、第1のカメラ530は、ネットワーク570を介してデバイス550に、第1の要約フレームを含む第1の通知を送り得る。別の例として、他の実装形態では、第1のカメラ530は、第1の要約フレームを生成し得、第1の接続536を介してコントローラ510に、第1の要約フレームを含む第1の通知を送り得る。第1の通知を受信した後に、コントローラ510は、ネットワーク570を介してデバイス550に、第1の要約フレームを含む第2の通知を送り得る。いくつかの実装形態では、ビデオコンテンツ、インデックス付きビデオコンテンツ、ビデオセグメント、または要約フレームは、第1のカメラ530のメモリ531、コントローラ510のメモリ512、またはその両方において記憶され得る。
[00147]いくつかの実装形態では、メモリ512は、パラメータ、設定、またはビデオシステム502の動作に関連する他の情報を記憶し得る。たとえば、ビデオシステム502のパラメータまたは設定は、例示的な、非限定的な例として、デバイス情報516、アカウント情報(たとえば、ユーザ名、ユーザアドレス、ユーザによってアクセスされることを許可された1つまたは複数のカメラ)、(たとえば、図1B〜図1Cのモードコントローラ178によって指定されたモードを示す)モード値、連結モードに関連する1つまたは複数の時間期間、カメラロケーション情報、またはそれらの組合せを含むかまたは示し得る。例示のために、メモリ512は、要約フレーム生成器520の動作に関連するパラメータまたは設定を記憶し得る。たとえば、要約フレーム生成器520の動作に関連するパラメータまたは設定は、例示的な、非限定的な例として、要約フレーム522を生成するために使用されるべきキーフレームの数、(たとえば、図1B〜図1Cのモードコントローラ178によって指定されたモードを示す)モード値、連結モードに関連する1つまたは複数の時間期間、1つまたは複数のしきい値(たとえば、図2のしきい値226)、またはそれらの組合せを含むかまたは示し得る。追加または代替として、パラメータまたは設定は、通知生成器526の動作に関連し得る。たとえば、通知生成器526に関連するパラメータまたは設定は、例示的な、非限定的な例として、(たとえば、図1B〜図1Cのモードコントローラ178によって指定されたモードを示す)モード値、連結モードに関連する1つまたは複数の時間期間、通知540のメッセージフォーマット、通知が要約フレーム生成器520、メタデータ524、またはビデオセグメント548を含むべきであるかどうか、あるいはそれらの組合せを含むかまたは示し得る。
[00148]1つまたは複数の態様が、特定のデバイスにおいて実行されている動作を含むものとして本明細書で説明され得るが、他の例では、そのような動作、構成要素、またはデバイスは、「クラウド」に関連し得ることを理解されたい。たとえば、他の実装形態では、ビデオコンテンツ534、インデックス付きビデオコンテンツ514、デバイス情報516、要約フレーム522、メタデータ524、またはそれらの組合せは、ネットワーク570中に含まれるデバイス(たとえば、サーバ)において記憶され得る。追加または代替として、要約フレーム生成器520は、ネットワーク570中に含まれ得る。
[00149]動きイベント期間に関連する要約フレーム522を含む通知540を送ることによって、動きイベント期間に関連するビデオセグメント548(たとえば、ビデオクリップ)を含む通知を送ることと比較して、通知540のデータサイズが低減され得る。したがって、要約フレーム522を含む(およびビデオセグメント548を含まない)通知540は、ビデオセグメント548を含む通知よりも、より少ない電力およびより少ない帯域幅を使用して、より迅速にデバイス550に与えられ得る。さらに、ビデオセグメント548を送る代わりに要約フレーム522を送ることによって、デバイス550のユーザは、動きイベント期間中に発生したアクティビティの理解を得るために、要約フレーム522を迅速にレビューし得る。
[00150]図6を参照すると、要約フレームを使用してビデオコンテンツをインデックス付けするように動作可能なシステム600の例示的な例が示されている。システム600は、図1Aのシステム100、図1B〜図1Cのシステム160、システム200、または図5のシステム500(たとえば、ビデオシステム502、コントローラ510、第1のカメラ530、第2のカメラ532、またはデバイス550)を含むかまたはそれに対応し得る。
[00151]システム600はデバイス602を含み得る。デバイス602は、例示的な、非限定的な例として、コンピュータ、ラップトップ、モバイルデバイス、カメラ、またはサーバなど、再生デバイスを含み得る。いくつかの実装形態では、デバイス602は、閉回路テレビジョン(CCTV)システムなどのビデオ監視システム中に含まれ得る。追加または代替として、デバイス602は、電子デバイス、モバイルデバイス、車両、ゲーミングコンソール、自動車システムコンソール(たとえば、ADAS)、ウェアラブルデバイス(たとえば、パーソナルマウントカメラ)、ヘッドマウントディスプレイ(HMD)などを含むかまたはそれの中に含まれ得る。追加の例は、限定はしないが、ロボットまたはロボティックデバイス、無人航空機(UAV)、およびドローンを含む。さらに、1つまたは複数の態様が、デバイスにおいて実行されている動作を含むものとして本明細書で説明され得るが、他の例では、そのような動作は、「クラウド」において実行され得ることを理解されたい。
[00152]デバイス602は、メモリ612と、入力デバイス632と、プロセッサ618と、ディスプレイ628(たとえば、スクリーン)とを含み得る。メモリ612は、ビデオコンテンツ614を含み得る。いくつかの実装形態では、ビデオコンテンツ614は、ファイル名を有するデータファイルとして記憶され得る。ビデオコンテンツ614は、図1Aのビデオコンテンツ140、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、または図5のビデオコンテンツ534を含むかまたはそれに対応し得る。いくつかの実装形態では、メモリ612は、複数のデータファイル(たとえば、複数のビデオファイル)を含み得、各データファイルは、異なるビデオコンテンツに対応し得る。たとえば、複数のデータファイルのうちの第1のデータファイルは、第1のビデオコンテンツに対応し得、複数のデータファイルのうちの第2のデータファイルは、第2のビデオコンテンツを含むかまたはそれに対応し得る。
[00153]入力デバイス632は、1つまたは複数の入力を受信するように構成され得る。ユーザインターフェースなど、入力デバイス632は、マウス、タッチパッド、キーボード、タッチスクリーン、マイクロフォン、動きセンサー、カメラ、ディスプレイ、ワイヤレス受信機などを含み得る。1つまたは複数の入力は、ビデオコンテンツ614のインデックス付きバージョンを生成するかまたは与えるようにとの要求など、要求640を含むかまたは示し得る。いくつかの実装形態では、要求640は、ビデオコンテンツ614を識別するかまたはそれに関連し得る。たとえば、要求640は、ビデオコンテンツ614を含むファイルのファイル名を含み得る。
[00154]プロセッサ618は、インデックス付きビデオコンテンツ642を生成するように構成され得る。いくつかの実装形態では、インデックス付きビデオコンテンツは、図5のインデックス付きビデオコンテンツ514を含むかまたはそれに対応し得る。プロセッサ618は、要約フレーム生成器620とインデクサー624とを含み得る。要約フレーム生成器620は、図1Aの要約フレーム生成器120、図1B〜図1Cの要約フレーム生成器180、または図5の要約フレーム生成器520を含むかまたはそれに対応し得る。要約フレーム生成器620は、ビデオコンテンツ614が1つまたは複数の動きイベントを含むかどうかを決定するように構成され得る。ビデオコンテンツ614中に含まれる各動きイベントについて、要約フレーム生成器620は、動きイベント中の少なくとも1つの対応する物体の複数の表現を含む、要約フレーム622など、対応する要約フレームを生成するように構成され得る。
[00155]インデクサー624は、要約フレーム生成器620によって生成された1つまたは複数の要約フレームに基づいて、ビデオコンテンツ614をインデックス付けするように構成され得る。例示のために、インデクサー624は、インデックス付きビデオコンテンツ642を生成するためにビデオコンテンツ614をインデックス付けし得る。プロセッサ618は、ディスプレイ628(たとえば、スクリーン)など、出力デバイスにインデックス付きビデオコンテンツ642を与えるように構成され得る。いくつかの実装形態では、プロセッサ618は、送信機(図示せず)を介した別のデバイスへのインデックス付きビデオコンテンツ642の送信を始動するように構成され得る。ディスプレイ628は、図7A〜図7Bを参照しながら説明されるように、インデックス付きビデオコンテンツ642の表現を提示するように構成され得る。ディスプレイ628がデバイス602中に含まれるものとして説明されるが、他の実装形態では、ディスプレイ628は、デバイス602の外部にあり得る。たとえば、ディスプレイ628は、ワイヤード接続、ワイヤレス接続、またはそれらの組合せを介してデバイス602に結合され得る。追加または代替として、ディスプレイ628は、要約フレーム生成器620によって生成された、要約フレーム622など、(ビデオコンテンツの)少なくとも1つの要約フレームを提示するように構成され得る。
[00156]動作中に、デバイス602は、ビデオコンテンツ614をインデックス付けするようにとの要求640を受信し得る。プロセッサ618は、入力デバイス632を介して要求640を受信し得る。プロセッサ618は、ビデオコンテンツ614に関連するインジケータを識別し得る。インジケータに応答して、プロセッサ618は、ビデオコンテンツ614にアクセスし得る。要約フレーム生成器620は、ビデオコンテンツ中に含まれる1つまたは複数の動きイベントを識別し得る。たとえば、要約フレーム生成器620は、第1の時間において始まる第1の動きイベントを識別し得、第2の時間において始まる第2の動きイベントを識別し得る。要約フレーム生成器620は、第1の動きイベントに関連する第1の要約フレームを生成し得、第2の動きイベントに関連する第2の要約フレームを生成し得る。
[00157]インデクサー624は、要約フレーム生成器620によって生成された1つまたは複数の要約フレーム(たとえば、第1の要約フレームおよび第2の要約フレーム)に基づいて、ビデオコンテンツ614をインデックス付けし得る。たとえば、インデクサー624は、第1の要約フレームを使用して、(第1の時間に対応する)第1のロケーションにおけるビデオコンテンツ614のタイムラインをインデックス付けし得る。インデクサー624は、第2の要約フレームを使用して、(第2の時間に対応する)第2のロケーションにおけるタイムラインをインデックス付けし得る。いくつかの実装形態では、インデックス付きビデオコンテンツ642は、インデックス付きタイムラインを含むかまたはそれに対応し得る。プロセッサ618は、ディスプレイ628を介して提示されるべきインデックス付きビデオコンテンツ642を与え得る。
[00158]いくつかの実装形態では、プロセッサ618は、インデックス付きビデオコンテンツ642が、メモリ612において記憶されることを引き起こし得る。インデックス付きビデオコンテンツ642がメモリ612において記憶された後に、デバイスは、ビデオコンテンツ614のインデックス付きバージョンについての第2の要求を受信し得る。第2の要求に応答して、プロセッサ618は、インデックス付きビデオコンテンツ642がメモリ612中に存在するかどうかを決定し得る。インデックス付きビデオコンテンツ642がメモリ612中に存在する場合、プロセッサ618は、メモリ612からインデックス付きビデオコンテンツにアクセスし、ディスプレイ628にインデックス付きビデオコンテンツ642を与え得る。代替的に、インデックス付きビデオコンテンツ642がメモリ612中に存在しないとプロセッサ618が決定した場合、プロセッサ618は、ビデオコンテンツ614にアクセスし、要約フレーム生成器620とインデクサー624とを使用して、インデックス付きビデオコンテンツ642を生成し得る。
[00159]他の実装形態では、プロセッサ618は、1つまたは複数の生成された要約フレームを出力するように構成され得る。たとえば、プロセッサ618は、ビデオコンテンツ614の全部または部分中の動きイベントに対応する単一の要約フレーム、あるいはビデオコンテンツ614の全体に対応する単一の要約フレームなど、ビデオコンテンツ614に基づく単一の要約フレームを生成し得る。別の例として、プロセッサ618は、各要約フレームがビデオコンテンツ614の部分に対応する、複数の要約フレームを生成し得る。複数の要約フレームが生成されたとき、ビデオコンテンツ614の関連する部分は、時間的に重複しないことがあるかまたは少なくとも部分的に重複し得る。いくつかの実装形態では、要約フレームに対応するビデオコンテンツ614の部分は、固定持続時間(たとえば、30秒)、最小持続時間(たとえば、10秒)、またはそれらの組合せを有し得る。他の実装形態では、部分の持続時間は、ビデオコンテンツ614中で検出された動きイベント期間の持続時間に基づき得る。いくつかの例では、プロセッサ618が、単一のビデオファイルについての複数の要約フレームを生成した場合、複数の要約フレームは連結され、グループとしてディスプレイ628に与えられ得る。
[00160]いくつかの実装形態では、デバイス602は、ビデオコンテンツ614を生成するように構成された、カメラなど、キャプチャユニットを含み得るかまたはそれに結合され得る。たとえば、カメラは、ビデオコンテンツ614を生成し、メモリ612にビデオコンテンツ614を与え得る。追加または代替として、いくつかの実装形態では、デバイス602は、第2のメモリを含むかまたはそれに結合され得る。第2のメモリは、各データファイルが対応するビデオコンテンツを含む、1つまたは複数のデータファイルなど、ビデオコンテンツを記憶し得る。たとえば、デバイス602は、ワイヤード接続、ワイヤレス接続、またはそれらの組合せを介して第2のメモリに結合され得る。例示のために、第2のメモリは、「クラウド」中にあり得、デバイス602は、ワイヤードネットワーク、ワイヤレスネットワーク、またはそれらの組合せを介して第2のメモリにアクセスし得る。いくつかの実装形態では、要求640は、デバイス602に、第2のメモリにおいて記憶されたビデオコンテンツをインデックス付けするように、または第2のメモリにおいて記憶されたビデオコンテンツに基づいて1つまたは複数の要約フレームを生成するように要求し得る。
[00161]いくつかの実装形態では、プロセッサ618によって出力された1つまたは複数の要約フレームは、メタデータを含み得る。特定の要約フレームについてのメタデータは、特定の要約フレームに関連するビデオコンテンツ614の時間(たとえば、ロケーション)または部分に対応する識別子またはリンクを含み得る。特定の要約フレームは、ディスプレイ628を介して提示され得る。特定の要約フレームのユーザ選択に応答して、メタデータは、ビデオコンテンツ614にアクセスするために使用され得、プロセッサ618は、ビデオコンテンツ614(またはそれの対応する部分)が、ディスプレイ628を介して提示されることを引き起こし得る。いくつかの実装形態では、ビデオコンテンツ614(またはそれの部分)の提示は、特定の要約フレームの生成を引き起こした動きイベントの開始に対応するビデオフレームにおいて始まり得る。たとえば、プロセッサ618は、ビデオコンテンツ614の始まりをスキップし得、ビデオコンテンツ614の中間部分を再生することを開始し得る。
[00162]いくつかの実装形態では、プロセッサ618(たとえば、インデクサー624)は、ビデオコンテンツ614についてのインデックスデータを生成するように構成され得る。たとえば、インデックスデータは、図5のインデックスデータ513を含むかまたはそれに対応し得る。インデックスデータは、要約フレーム622などの要約フレームとメタデータとを含み得る。メタデータは、ビデオコンテンツの再生位置を示すマーカーデータを含み得、ここで、再生位置は要約フレーム622に関連し得る。いくつかの実装形態では、メモリ612は、インデックスデータを記憶するように構成され得る。
[00163]特定の例示的な例では、再生位置は、ビデオコンテンツ中に含まれる動きイベントの始まりに対応し得る。マーカーデータは、ビデオコンテンツ614の記憶ロケーションへの、ユニフォームリソースロケータ(URL)など、リンクを含み得る。(たとえば、自動的に、あるいは、ディスプレイ628または入力デバイス632を介するユーザによる)リンクの選択が、再生位置におけるビデオコンテンツ614の再生を始動するように構成され得る。いくつかの実装形態では、メタデータは、ビデオコンテンツの部分の第2の再生位置を示す第2のマーカーデータを含み得る。第2の再生位置は、要約フレーム622によって示された複数の表現のうちの第1の表現を生成するために要約フレーム生成器620によって使用されたビデオコンテンツ614のフレームに対応し得る。
[00164]いくつかの実装形態では、インデックスデータは、ビデオコンテンツ614の第2の部分に関連する第2の要約フレーム(図示せず)を含み得る。第2の要約フレームは、要約フレーム生成器620によって生成され得、ビデオコンテンツ614の第2の部分中に含まれる第2の物体の複数の表現を示し得る。インデックスデータが第2の要約フレームを含む場合、メタデータは、ビデオコンテンツ614の第2の部分に対応する第3の再生位置を示す第3のマーカーデータを含み得る。
[00165]プロセッサ618(たとえば、インデクサー624)は、ディスプレイ628にインデックスデータを送り得る。ディスプレイ628は、ビデオコンテンツ614の時間期間に対応するタイムラインを提示し得る。タイムラインは1つまたは複数のマーカーを含み得る。1つまたは複数のマーカーの各マーカーは、ビデオコンテンツ614に基づいて生成された異なる要約フレームに対応し得る。
[00166]特定の実装形態では、ディスプレイ628は、物体の表現の第1のセットを示す要約フレーム622を含むグラフィカルユーザインターフェース(GUI)を提示するように構成され得る。いくつかの実装形態では、要約フレーム622は、ビデオコンテンツ614の部分に関連する。さらに、プロセッサ618は、ディスプレイ628に電気的に結合され、表現の第1のセットのうちの特定の表現を示す選択を受信するように構成され得る。たとえば、入力デバイス632は、選択を生成するように構成され得る。例示のために、選択は、選択によって示された特定の表現に関連する再生位置における(たとえば、そこから開始する)ビデオコンテンツ614の再生についての特定の要求中に含まれ得る。
[00167]図7A〜図7Jを参照すると、少なくとも1つの要約フレームを提示するためのインターフェースの例が示されている。図7A〜図7Jの例の各々は、ディスプレイ702を介して提示され得る、ユーザインターフェースなど、対応するインターフェースを含む。いくつかの実装形態では、ユーザインターフェースは、グラフィカルユーザインターフェース(GUI)を含み得る。ディスプレイ702は、図1Aのユーザインターフェース130、図5のディスプレイ556、または図6のディスプレイ628を含むかまたはそれに対応し得る。図7A〜図7Jを参照しながら説明される例は、限定するものではないことに留意されたい。たとえば、図7A〜図7Jの一例の態様が、インターフェースを生成するために、図7A〜図7Jの異なる例の別の態様と組み合わせられ得る。さらに、図7A〜図7Jの例において、態様またはフィーチャは、図7A〜図7Jの異なる例の2つの態様が組み合わせられることを可能にするように求められると見なされないことに留意されたい。
[00168]図7Aは、図6のビデオコンテンツ614などのビデオコンテンツのタイムライン701を含むインターフェースの第1の例700を含む。ビデオコンテンツに対応するファイル名706が、タイムラインの下側に提示されている。タイムライン701は、(代替的にインデックスマーカーと呼ばれる)1つまたは複数の時間マーカーを使用してインデックス付けされる。たとえば、時間マークは、第1の時間マーカーT0と、第2の時間マーカーT1と、第3の時間マーカーT2と、第4の時間マーカーT3と、第5の時間マーカーT4と、第6の時間マーカーT5とを含み得る。第1の時間マーカーT0は、ビデオコンテンツの初期フレームに対応し得、第6の時間マーカーT5は、ビデオコンテンツの最終フレームに対応し得る。初期フレームおよび最終フレームは、要約フレームを含まないことがある。いくつかの実装形態では、タイムライン701は、第1の時間マーカーT0と第6の時間マーカーT5とを含まないことがある。第2の時間マーカーT1、第3の時間マーカーT2、第4の時間マーカーT3、および第5の時間マーカーT4の各々は、異なる要約フレームに対応し得る。
[00169]ディスプレイ702と対話するユーザが、カーソル703を制御し得る。カーソルがタイムライン701の時間マーカーT0〜T5のうちの1つ上またはそれの近くに配置された場合、時間マーカーに対応する要約フレームが、ディスプレイ702を介して提示され得る。例示のために、第1の例700に示されているように、カーソル703は、要約フレーム704に対応する第2の時間マーカーT1の近くにある。したがって、要約フレーム704は、ディスプレイ702を介して(タイムライン701の上側に)提示される。要約フレーム704は、第2の時間マーカーT1に関連する動きイベントを要約し得る。
[00170]図7Bは、ディスプレイ702を介して提示され得るインターフェースの第2の例710を含む。第2の例710は、図6のビデオコンテンツ614などのビデオコンテンツに対応するファイル名711を含む。ビデオコンテンツは、第1の要約フレーム712および第2の要約フレーム713など、1つまたは複数の要約フレームを使用してインデックス付けされ得る。ディスプレイ702は、第1の要約フレーム712と第2の要約フレーム713とを含む。第1の要約フレーム712は、ビデオコンテンツ中に含まれる第1の動きイベントに関連し得、第2の要約フレーム713は、ビデオコンテンツ中に含まれる第2の動きイベントに関連し得る。第1の動きイベントは、第1の時間714において発生していることがあり、第2の動きイベントは、第2の時間715において発生していることがある。第1の時間714および第2の時間715(たとえば、タイムスタンプ)はまた、図示のように、提示され得る。いくつかの実装形態では、ディスプレイ702はまた、各要約フレームについて、要約フレームに対応する動きイベントの持続時間を示し得る。
[00171]第2の例710はまた、第1の矢印716および第2の矢印717など、矢印を含み得る。第1の矢印716および第2の矢印717は、ユーザが、ビデオコンテンツをインデックス付けするために使用される異なる要約フレームを閲覧することを可能にし得る。例示のために、ディスプレイ702と対話するユーザは、ディスプレイに、第1の要約フレーム712に対応する動きイベントより時間的に前に発生した動きイベントに対応する別の要約フレームを提示させるために、第1の矢印716を選択し得る。第1の要約フレーム712より時間的に前である要約フレームが存在しない場合、第1の矢印716は、ディスプレイ702中に含まれないことがある。ユーザは、ディスプレイに、第2の要約フレーム713に対応する動きイベントに時間的に続いて発生した動きイベントに対応する別の要約フレームを提示させるために、第2の矢印717を選択し得る。第2の要約フレーム713に時間的に続く要約フレームが存在しない場合、第2の矢印717は、ディスプレイ702中に含まれないことがある。
[00172]他の実装形態では、複数の要約フレームが、異なるフォーマットを使用して編成され、提示され得る。たとえば、複数の要約フレームは、例示的な、非限定的な例として、タイルフォーマット、リストフォーマット、ローロデックスフォーマット、またはモザイクフォーマットで提示され得る。
[00173]図7Cは、ディスプレイ702を介して提示され得るインターフェースの第3の例720を含む。第3の例720では、ディスプレイ702は、要約フレーム722と要約フレーム時間期間721とを提示するように構成される。要約フレーム722は、ビデオコンテンツの少なくとも部分に関連し得る。要約フレーム時間期間721は、要約フレーム722に関連するビデオコンテンツの少なくとも部分の始まり時間、終了時間、または持続時間を示し得る。
[00174]要約フレーム722は、自転車に乗っている人など、物体の複数の表現を含み得る。たとえば、複数の表現は、第1の表現723および第2の表現724を含み得る。要約フレーム722は、表現の時間シーケンスを示す1つまたは複数のインジケータを含み得る。第3の例720に示されているように、1つまたは複数のインジケータは、文字「A」、「B」、「C」、「D」、「E」、および「F」を含む。いくつかの実装形態では、各インジケータは、異なる表現に対応し得る。例示のために、インジケータ「A」は、第1の表現723に対応し得、インジケータ「B」は、第2の表現「B」に対応し得る。したがって、要約フレーム722中に含まれる1つまたは複数のインジケータは、物体(たとえば、自転車に乗っている人)が、要約フレーム722に関して右側から左側に進行したことを示し得る。1つまたは複数のインジケータが文字であるものとして説明されたが、1つまたは複数のインジケータは文字に限定されない。たとえば、1つまたは複数のインジケータは、例示的な、非限定的な例として、番号、矢印、文字、タイムスタンプ、またはそれらの組合せとして提示され得る。
[00175]図7Dは、ディスプレイ702を介して提示され得るインターフェースの第4の例725を含む。第4の例725では、ディスプレイ702は、要約フレーム726を提示するように構成される。要約フレーム726は、ビデオコンテンツの少なくとも部分に関連し得る。要約フレーム726は、人の腕など、物体の複数の表現を含み得る。たとえば、複数の表現は、第1の表現727および第2の表現728を含み得る。要約フレーム726は、複数の表現のシーケンスを時間的に示す1つまたは複数のインジケータを含み得る。第4の例725に示されているように、1つまたは複数のインジケータは、矢印729など、矢印を含む。複数のインジケータが図7Dを参照しながら説明されたが、他の実装形態では、要約フレーム726は、物体(たとえば、腕)の進行経路を示す、単一の矢印または単一のラインセグメントなど、単一のインジケータを含み得る。
[00176]図7Eは、ディスプレイ702を介して提示され得るインターフェースの第5の例730を含む。第5の例730では、ディスプレイ702は、要約フレーム731とビデオセグメントへのリンク732とを提示するように構成される。要約フレーム731は、ビデオコンテンツの少なくとも部分に関連し得る。リンク732は、ビデオコンテンツの部分に関連するビデオセグメントへのリンクを与え得る。例示のために、ディスプレイ702を介して提示されたリンク732がユーザによって選択された場合、ディスプレイ702は、要約フレーム731に対応するビデオセグメント(たとえば、ビデオクリップ)を表示し得る。
[00177]要約フレーム731は、車など、物体の複数の表現を含み得る。たとえば、複数の表現は、第1の表現733、第2の表現734、および第3の表現735を含み得る。要約フレーム731は、複数の表現のシーケンスを時間的に示す1つまたは複数のインジケータを含み得る。第3の例720に示されているように、1つまたは複数のインジケータは、文字「A」、「B」、「C」、および「D」を含む。要約フレーム731中に含まれる1つまたは複数のインジケータは、物体(たとえば、車)が、要約フレーム731に関して左側から右側へ進行したことを示し得る。要約フレーム731に示されているように、時間的に後の表現が、時間的に前の表現の「上に階層化」され得る。例示のために、第2の表現734は、第1の表現733と重複し、第3の表現735は、第1の表現733および第2の表現734と重複する。他の実装形態では、特定の表現は、特定の表現に関して時間的に後である1つまたは複数の表現の「上に階層化」され得る。
[00178]図7Fは、ディスプレイ702を介して提示され得るインターフェースの第6の例740を含む。第6の例740では、ディスプレイ702は、要約フレーム741と、データ値750〜758(たとえば、テキスト情報)と、選択可能なフィーチャ742〜747とを提示するように構成される。要約フレーム741は、ビデオコンテンツの少なくとも部分に関連し得る。ビデオコンテンツは、カメラによって生成されていることがある。ビデオコンテンツは、ファイル名を有するデータファイル中に含まれ得る。要約フレーム741は、ビデオコンテンツ中に含まれる動きイベントに関連し得る。
[00179]データ値750〜758は、要約フレーム741に関連するメタデータに対応し得る。たとえば、メタデータは、図1Aのメタデータ124、図1B〜図1Cのメタデータ187、または図5のメタデータ524を含むかまたはそれに対応し得る。データ値750〜758は、ファイル名750と、要約フレーム識別子751と、動きイベント日付752と、動きイベント開始時間753と、動きイベント終了時間754と、動きイベント持続時間755と、カメラ識別子756と、カメラロケーション757と、気象条件758とを含み得る。ファイル名750は、ビデオコンテンツを含むデータファイルを含むかまたはそれに対応し得る。要約フレーム識別子751は、要約フレーム741を一意に識別し得る。動きイベント日付752、動きイベント開始時間753、動きイベント終了時間754、および動きイベント持続時間755は、ビデオコンテンツ中に含まれる動きイベントに対応し得る。カメラ識別子756およびカメラロケーション757は、ビデオコンテンツを生成したカメラを含むかまたはそれに対応し得る。気象条件758は、サードパーティ気象情報サービスにアクセスすることなどによって、ビデオコンテンツ中で決定された(たとえば、検出された)か、ビデオコンテンツの生成中にカメラによって測定されたか、または、ビデオコンテンツの生成中にカメラによって決定された環境条件を示し得る。
[00180]選択可能なフィーチャ742〜747は、要求ビデオセグメント(request video segment)フィーチャ742と、ストリームカメラフィーチャ743と、フルスクリーンフィーチャ744と、通知設定フィーチャ745と、要約フレーム設定フィーチャ746と、システムカメラフィーチャ747とを含み得る。要求ビデオセグメントフィーチャ742のユーザ選択に応答して、ディスプレイ702は、要約フレーム741に対応するビデオコンテンツの部分のビデオクリップを提示し得る。ストリームカメラフィーチャ743のユーザ選択に応答して、ディスプレイ702は、カメラによって生成されたビデオストリーム(たとえば、リアルタイムビデオストリーム)を表示し得る。フルスクリーンフィーチャ744のユーザ選択に応答して、ディスプレイ702は、要約フレーム741のフルスクリーンバージョンを表示し得る。通知設定フィーチャ745のユーザ選択に応答して、ディスプレイ702は、ユーザが、図5のそのような通知540通知が配信されるべきであるデバイスアドレスなど、1つまたは複数の通知設定または通知パラメータを設定または修正することを可能にするインターフェースを提示し得る。1つまたは複数の通知設定または通知パラメータは、図1Aの通知生成器126、図1B〜図1Cの通知生成器182、図5の通知生成器526、またはそれらの組合せなど、通知生成器の動作に関連し得る。
[00181]要約フレーム設定フィーチャ746のユーザ選択に応答して、ディスプレイ702は、ユーザが、要約フレーム741などの特定の要約フレーム中に含まれる(物体の)表現の数など、1つまたは複数の要約フレーム設定または要約フレームパラメータを設定または修正することを可能にするインターフェースを提示し得る。1つまたは複数の要約フレーム設定または要約フレームパラメータは、図1Aの要約フレーム生成器120、図1B〜図1Cの要約フレーム生成器180、図5の要約フレーム生成器520、図6の要約フレーム生成器620、またはそれらの組合せなど、要約フレーム生成器の動作に関連し得る。いくつかの実装形態では、特定の要約フレーム設定または特定の要約フレームパラメータを設定または変更することに応答して、ディスプレイ702を介して提示される要約フレーム741は更新され得る。たとえば、要約フレーム741中に含まれるべき表現の数が6つから7つに変更された場合、要約フレーム741は、自転車に乗っている人の7つの表現を含むように更新され得る。
[00182]システムカメラフィーチャ747のユーザ選択に応答して、ディスプレイ702は、特定のユーザにとって利用可能な1つまたは複数のカメラの指示(たとえば、リスト、マップなど)を提示し得る。たとえば、特定のユーザは、1つまたは複数のカメラの各々から1つまたは複数の要約フレームを受信することを許可され得る。別の例として、特定のユーザは、1つまたは複数のカメラの各々によって生成されたビデオコンテンツをストリーミングすることを許可され得る。いくつかの例では、ユーザは、カメラのリスト中に含まれるカメラをアクティブにするか、非アクティブにするか、または再配向するインターフェースユーザが可能であり得る。
[00183]図7Gは、ディスプレイ702を介して提示され得るインターフェースの第7の例760を含む。第7の例760では、ディスプレイ702は、ビデオコンテンツの部分に関連する要約フレーム761と、ビデオコンテンツに対応する第1のタイムライン762と、ビデオコンテンツの部分に対応する第2のタイムライン763とを提示するように構成される。第1のタイムライン762は時間マークT0〜T5を含む。第1の時間マークT0はビデオコンテンツの始まり対応し、第2の時間マークT1は第1の要約フレームに関連し、第3の時間マークT2は第2の要約フレーム(たとえば、要約フレーム761)に関連し、第4の時間マークT3は第3の要約フレームに関連し、第5の時間マークT5はビデオコンテンツの終了に対応する。
[00184]時間マークT1〜T3のうちの1つの選択に応答して、対応する要約フレームが提示される。たとえば、第7の例760は、第3の時間マークT2の選択に応答する要約フレーム761の提示を示す。ビデオコンテンツの部分の第2のタイムライン763も表示され得る。第2のタイムライン763も複数の時間マークを含む。第2のタイムライン763中の時間マークの各々は、ビデオコンテンツ部分の異なる再生位置(たとえば、異なるフレーム)に対応し、選択されたとき、再生位置における(たとえば、そこから開始する)ビデオコンテンツの再生を引き起こすリンクを含み得る。たとえば、第1の時間マーク(リンクT2)が、ビデオコンテンツの部分の第1のフレームに対応する。第2の時間マーク(リンクA)が、要約フレーム761を生成するために第1のキーフレームとして使用された第2のフレームに対応し、第3の時間マーク(リンクB)が、要約フレーム761を生成するために第2のキーフレームとして使用された第3のフレームに対応し、第4の時間マーク(リンクC)が、要約フレーム761を生成するために第3のキーフレームとして使用された第4のフレームに対応し、第5の時間マーク(リンクD)が、要約フレーム761を生成するために第4のキーフレームとして使用された第5のフレームに対応する。いくつかの例では、再生は、同じく、または代替的に、要約フレーム761中に含まれる表現のセットのうちの特定の表現の選択に基づいて始動され得る。たとえば、インジケータ「B」に対応する(自転車に乗っている人の)特定の表現の選択が、第3のフレームにおけるビデオコンテンツの再生を始動し得る。
[00185]図7Hは、ディスプレイ702を介して提示され得るインターフェースの第8の例765を含む。第8の例765では、ディスプレイ702は、第1の要約フレーム766と第2の要約フレーム767とをコンカレントに提示するように構成される。第1の要約フレーム766は、第1の動きイベントに関連し得、第1の動きイベント中の第1の物体の表現の第1のセットを含み得る。たとえば、表現の第1のセットは、第1の表現および第2の表現など、少なくとも2つの表現を含み得る。第1の表現は、第1の要約フレーム766を生成するために使用された第1のキーフレームに対応し得、第2の表現は、第1の要約フレーム766を生成するために使用された第2のキーフレームに対応し得る。第2の要約フレーム767は、第2の動きイベントに関連し得、第2の動きイベント中の第2の物体の表現の第2のセットを含み得る。たとえば、表現の第2のセットは、第3の表現および第4の表現など、少なくとも2つの表現を含み得る。第3の表現は、第2の要約フレーム767を生成するために使用された第3のキーフレームに対応し得、第4の表現は、第2の要約フレーム767を生成するために使用された第4のキーフレームに対応し得る。第1の物体と第2の物体とは、同じ物体であり得るか、または異なる物体であり得る。
[00186]ディスプレイ702はまた、リンクの第1のセット768とリンクの第2のセット769とを提示するように構成され得る。リンクの第1のセット768は第1の要約フレーム766に対応し得、リンクの第2のセット769は第2の要約フレーム767に対応し得る。各リンクは、選択されたとき、対応する再生位置におけるビデオコンテンツの再生を始動するように構成され得る。
[00187]図7Iは、ディスプレイ702を介して提示され得るインターフェースの第9の例770を含む。第9の例770では、ディスプレイ702は、要約フレーム772とタイムライン771とを提示するように構成される。タイムライン771は、イベント1およびイベント2など、2つの動きイベントを含むビデオコンテンツに対応する。各動きイベントについて、4つのキーフレームが、表現のセットを生成するために選択された。第1の動きイベント中に、2つの物体(たとえば、飛行機、および自転車に乗っている人)が動いていた。飛行機は、第1のイベントの4つのキーフレームのうちの2つ中で検出されたことに留意されたい。第2の動きイベント中に、車が動いていた。要約フレーム772は、複数の動きイベント(たとえば、イベント1およびイベント2)からの表現の複数のセットを含む連結された要約フレームの実装形態を表す。タイムライン771上のイベント1の選択は、要約フレーム772が、イベント1に対応する表現の第1のセットを提示することと、イベント2に関連する表現の第2のセットを除去する(たとえば、非表示にする)こととを引き起こし得る。
[00188]図7Jは、ディスプレイ702を介して提示され得るインターフェースの第10の例780を含む。第10の例780では、ディスプレイ702は、第1の領域782(たとえば、GUIウィンドウなど、要約フレーム領域)と、第2の領域784(たとえば、別のGUIウィンドウなど、再生領域)と、タイムライン789とを提示するように構成される。第1の領域782は1つまたは複数の要約フレームを含み得る。たとえば、第1の領域782は、ビデオコンテンツの部分(たとえば、動きイベント)に関連する要約フレーム783を含み得る。タイムライン789は、ビデオコンテンツの部分に対応し得る。タイムライン789は、動きイベントの始まりに従って、および、要約フレーム783を生成するために使用された1つまたは複数のキーフレームに従って、インデックス付けされ得る。第2の領域784は、本明細書で説明されるように、ビデオセグメント786(たとえば、ビデオクリップ)を提示するように構成され得る。タイムライン789は、ユーザが、第2の領域784中で再生されるべきビデオコンテンツの再生部分785(たとえば、時間期間)を識別することを可能にし得る。再生位置インジケータ787が、第2の領域784中で提示されているビデオコンテンツのフレームを示し得る。他の実装形態では、要約フレーム783中に含まれる表現のうちの1つが、第2の領域784中で、表現に対応する再生位置におけるビデオコンテンツの再生を始動するために選択され得る。さらに、タイムライン789をインデックス付けするために使用された時間マーク(たとえば、リンク)のうちの1つまたは複数がまた、第2の領域784中で、特定の再生位置におけるビデオコンテンツの提示を始動するために選択され得る。
[00189]第1の領域782と第2の領域784とが、図7Jのディスプレイ702中で隣り合うものとして示されているが、他の実装形態では、第1の領域782と第2の領域784とは、別様に配置され得る。たとえば、第1の領域782は、第2の領域784の「上」に部分的にまたは完全に配置され(たとえば、それの上に重ね合わせられ)得、またはその逆も同様である。追加または代替として、いくつかの実装形態では、第1の領域782のロケーション、第2の領域784のロケーション、またはその両方は可動であり得る。たとえば、ディスプレイ702中の領域782、784のうちの1つまたは複数のロケーションは、入力に応答して移動され得る。例示のために、ユーザは、ディスプレイ702の第1の領域782にタッチし、その後に、ユーザは、第1の領域782が移動されるべきである、ディスプレイ702の新しいロケーションにタッチし得る。代替的に、ユーザは、領域782、784を選択し、ディスプレイ702の所望の位置に「ドラッグ」し得る。
[00190]本明細書で説明される様々な例が、タッチスクリーン上などの、入力を介するユーザ選択を参照するが、代替実装形態では、「選択」は、他の方法で実行され得ることが理解されるべきであることに留意されたい。たとえば、選択は、タッチ、ユーザの眼の追跡(たとえば、視線検出)、タッチ入力を与えることなしにアイテム上で手、指、スタイラス、または他のデバイスを「ホバリングする(hover)」ことなどを介して、行われ得る。
[00191]いくつかの実装形態では、図7A〜図7Jの一例の態様は、インターフェースを生成するために、図7A〜図7Jの異なる例の別の態様と組み合わせられ得る。例示のために、図7Bの第2の例710は、図7Aの第1の例700を参照しながら説明されたように、第1の要約フレーム712および第2の要約フレーム713の各々について、対応するタイムラインを含み得る。
[00192]図8を参照すると、要約フレームを生成する方法800の例示的な例の流れ図が示されている。要約フレームは、図1Aの要約フレーム122、図1Cの第1の要約フレーム198、第2の要約フレーム199、図2の要約フレーム238、図5の要約フレーム522、図6の要約フレーム622、図7Aの要約フレーム704、図7Bの第1の要約フレーム712、第2の要約フレーム713、図7Cの要約フレーム722、図7Dの要約フレーム726、図7Eの要約フレーム731、図7Fの要約フレーム741、図Gの要約フレーム761、図7Hの第1の要約フレーム766、第2の要約フレーム767、図7Iの要約フレーム772、図7Jの要約フレーム783、またはそれらの組合せを含むかまたはそれに対応し得る。方法800は、図1Aのデバイス102(たとえば、プロセッサ118)、図1B〜図1Cのカメラ162(たとえば、プロセッサ174)、図2の要約フレーム生成器120、図5のビデオシステム502(たとえば、コントローラ510、第1のカメラ530、または第2のカメラ532)、図6のデバイス602(たとえば、プロセッサ618)、またはそれらの組合せによって実行され得る。
[00193]方法800は、802において、ビデオコンテンツの少なくとも部分中のイベントに対応する動きイベント期間を検出することを含み得、ビデオコンテンツは複数の画像フレームを含み、ここで、ビデオコンテンツの部分は物体を含む。データコンテンツは、カメラまたはメモリ(たとえば、バッファ)から受信され得る。ビデオコンテンツは、図1Aのビデオコンテンツ140(またはビデオコンテンツ114)、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、図5のビデオコンテンツ534、または図6のビデオコンテンツ614を含むかまたはそれに対応し得る。いくつかの実装形態では、動きイベント期間を検出することは、動きイベント期間の始まりを検出することと、動きイベント期間の終了を検出することとを含み得る。
[00194]方法800は、804において、ビデオコンテンツの部分に関連する要約フレームを生成することをさらに含み得、要約フレームは物体の複数の表現を示す。要約フレームは、動きイベント期間の視覚要約を与える。いくつかの実装形態では、通知は、第1の動きイベントに対応する第1の要約フレームおよび第2の動きイベントに対応する第2の要約フレームなど、複数の要約フレームを含み得る。方法800は、806において、デバイスに通知を送ることを始動することをさらに含み得、ここで、通知は要約フレームの生成を示す。たとえば、通知は、要約フレームを含むか、あるいは、要約フレームが生成されつつあるかまたは生成されたことを示すインジケータを含み得る。通知は、図1Aの通知128、図1B〜図1Cの通知188、図5の通知540、またはそれらの組合せを含むかまたはそれに対応し得る。デバイスは、図1のコントローラ510または図1のデバイス550を含むかまたはそれに対応し得る。
[00195]いくつかの実装形態では、方法800は、複数の画像フレームのうちの少なくとも1つに基づいて背景モデルを維持することを含み得る。たとえば、フレーム差分、平均フィルタ処理、ガウス平均化などが、背景モデルを生成するために、複数の画像フレームのうちの少なくとも1つに適用され得る。背景モデルは、動きイベント期間の始まり、動きイベント期間の終了、またはその両方を識別するために使用され得る。例示のために、動きイベント期間の始まりは、(複数の画像フレームのうちの)画像フレームを背景モデルと比較することによって識別され得る。動きイベント期間の始まりを識別することに応答して、方法800は、画像フレームに基づいてビデオコンテンツをインデックス付けすることを含み得る。
[00196]いくつかの実装形態では、方法800は、複数の画像フレームのうちの2つまたはそれ以上の画像フレームをキーフレームとして選択することを含み得る。2つまたはそれ以上の画像フレームは、動きイベント期間中にバッファされ得る。ビデオコンテンツは、キーフレームとして選択された2つまたはそれ以上の画像フレームの各々を使用してインデックス付けされ得る。たとえば、ビデオコンテンツは、図1B〜図1Cのインデックス付きビデオコンテンツ170、図5のインデックス付きビデオコンテンツ514、または図6のインデックス付きビデオコンテンツ642など、インデックス付きビデオコンテンツを生成するためにインデックス付けされ得る。さらに、方法800は、2つまたはそれ以上の画像フレームの各々について、画像フレームからの物体の表現を背景モデルと組み合わせることを含み得る。
[00197]いくつかの実装形態では、2つまたはそれ以上の画像フレームを選択することは、複数の画像フレームの各画像フレームについて、対応する分析結果値を決定するために画像フレームを分析することを含み得る。動きイベント期間の総分析結果値を決定するために、複数の画像フレームの複数の分析結果値がともに加算され得る。総分析結果値は、しきい値を決定するためにキーフレームの数で除算され得る。
[00198]他の実装形態では、2つまたはそれ以上の画像フレームのうちの第1の画像フレームを選択することは、対応する分析結果値を決定するために第1の画像フレームを分析することを含み得る。対応する分析結果値に基づいて、累積値が決定され得る。たとえば、累積値は、対応する分析結果値を既存の累積値に加算することによって決定され得る。方法800は、累積値をしきい値と比較することを含み得る。第1の画像フレームは、累積値がしきい値よりも大きいかまたはそれに等しいことに応答して、キーフレームとして選択され得る。
[00199]したがって、方法800は、動きイベント期間に関連する要約フレームの生成を可能にする。要約フレームは、要約フレームの閲覧者が、動きイベント期間中に発生したアクティビティの理解を迅速に得ることを可能にし得る。さらに、要約フレームを含む通知をデバイスに送ることによって、動きイベント期間に関連するビデオセグメント(たとえば、ビデオクリップ)を含む通知を送ることと比較して、通知のデータサイズが低減され得る。さらに、要約フレームを含む(およびビデオセグメントを含まない)通知は、ビデオセグメントを含む通知よりも、より少ない電力およびより少ない帯域幅を使用して、より迅速に与えられ得る。
[00200]図9を参照すると、要約フレームを通信する方法900の例示的な例の流れ図が示されている。要約フレームは、図1A〜図1Cの要約フレーム122、198、199のうちの1つまたは複数、図2の要約フレーム238、図5の要約フレーム522、図6の要約フレーム622、図7A〜図7Jの要約フレーム704、712、713、722、726、731、741、761、766、767、772、783のうちの1つまたは複数、またはそれらの組合せを含むかまたはそれに対応し得る。方法900は、図1Aのデバイス102、図1B〜図1Cのカメラ162、図5のビデオシステム502(たとえば、コントローラ510、第1のカメラ530、または第2のカメラ532)、デバイス550、図6のデバイス602、またはそれらの組合せによって実行され得る。
[00201]方法900は、902において、第1のデバイスによって第2のデバイスに、ビデオコンテンツの部分中で検出された動きイベントの通知を送ることを含み得、通知は、ビデオコンテンツの部分に関連する要約フレームを含み、ここで、ビデオコンテンツの部分は物体を含み、ここで、要約フレームは物体の複数の表現を示す。ビデオコンテンツの部分は、ビデオコンテンツの全体またはビデオコンテンツの全体未満を含み得る。いくつかの実装形態では、第1のデバイスはビデオ監視システム中に含まれ得、ビデオコンテンツは、ビデオ監視システムのキャプチャデバイス(たとえば、カメラ)によって生成されていることがある。第2のデバイスは、図5のデバイス550を含むかまたはそれに対応し得る。
[00202]方法900は、904において、第1のデバイスにおいて第2のデバイスから、動きイベントに関連するビデオセグメントについての要求を受信することをさらに含み得る。たとえば、要求は、図5の要求544を含むかまたはそれに対応し得る。いくつかの実装形態では、要求を受信したことに応答して、ビデオセグメントを生成した(たとえば、ビデオセグメント中に含まれる1つまたは複数の画像フレームを生成した)カメラのカメラ識別子が決定され得る。ビデオセグメントは、カメラ識別子に基づく記憶ロケーションから受信され得る。例示のために、方法900は、ビデオコンテンツを生成したカメラのメモリからビデオセグメントにアクセスすることを含み得る。
[00203]方法900は、906において、第1のデバイスから第2のデバイスにビデオセグメントを送ることをも含み得る。たとえば、ビデオセグメントは、図5のビデオセグメント548を含むかまたはそれに対応し得る。いくつかの実装形態では、通知の第1のデータサイズが、ビデオセグメントの第2のデータサイズよりも小さくなり得る。
[00204]いくつかの実装形態では、通知は単一の要約フレームを含み得る。他の実装形態では、通知は、第1の要約フレームおよび第2の要約フレームなど、複数の要約フレームを含み得る。第1の要約フレームは、第1のビデオセグメントに関連し得、第2の要約フレームは、第2のビデオセグメントに関連し得る。第1の要約フレームは、第1のビデオセグメント中に含まれる第1の物体の複数の表現を示し得、第2の要約フレームは、第2のビデオセグメント中に含まれる第2の物体の複数の表現を示し得る。第1の物体と第2の物体とは、異なる物体であり得るか、または同じ物体であり得る。いくつかの実装形態では、第1のビデオセグメントと第2のビデオセグメントとは、同じカメラによって生成され得る。他の実装形態では、第1のビデオセグメントと第2のビデオセグメントとは、異なるカメラによって生成され得る。
[00205]いくつかの実装形態では、方法900は、第2のデバイスから認証情報を受信することを含み得る。たとえば、認証情報は、図1の認証情報546を含むかまたはそれに対応し得る。方法900は、第2のデバイスにビデオセグメントを送ることより前に認証情報を確認することを含み得る。認証情報は、デバイスがビデオセグメントを受信することを許可されることを保証するために確認され得る。
[00206]いくつかの実装形態では、要約フレームは、図1Aのメタデータ124、図1B〜図1Cのメタデータ187、または図5のメタデータ524など、メタデータを含み得る。メタデータは、ビデオセグメントの識別子、複数の表現のうちの表現を生成するために使用されるビデオセグメントの画像フレームのインジケータ、ビデオセグメントの開始に関連する第1のタイムスタンプ、ビデオセグメントの終了に関連する第2のタイムスタンプ、ビデオセグメントが記憶されたメモリの記憶ロケーションへのリンク、またはそれらの組合せを含み得る。
[00207]したがって、方法900は、動きイベントに関連する要約フレームが、第2のデバイスにビデオセグメントを送ることより前に第2のデバイスに与えられることを可能にする。要約フレームは、第2のデバイスにおける要約フレームの閲覧者が、ビデオセグメントを閲覧する必要なしに、動きイベント中に発生したアクティビティの理解を迅速に得ることを可能にし得る。したがって、第2のデバイスのユーザは、要約フレームを受信した後にビデオセグメントを要求することを決定し得る。さらに、要約フレームを含む通知を第2のデバイスに送ることによって、ビデオセグメントを第2のデバイスに送ることと比較して、通知のデータサイズが低減され得る。したがって、要約フレームを含む(およびビデオセグメントを含まない)通知は、ビデオセグメントを与えることよりも、より少ない電力およびより少ない帯域幅を使用して、より迅速に第2のデバイスに与えられ得る。
[00208]図10を参照すると、要約フレームを受信する方法1000の例示的な例の流れ図が示されている。要約フレームは、図1A〜図1Cの要約フレーム122、198、199のうちの1つまたは複数、図2の要約フレーム238、図5の要約フレーム522、図6の要約フレーム622、図7A〜図7Jの要約フレーム704、712、713、722、726、731、741、761、766、767、772、783のうちの1つまたは複数、またはそれらの組合せを含むかまたはそれに対応し得る。方法1000は、図1Aのデバイス102、図1B〜図1Cのカメラ162、図5のビデオシステム502(たとえば、コントローラ510、第1のカメラ530、または第2のカメラ532)、デバイス550、図6のデバイス602、またはそれらの組合せによって実行され得る。
[00209]方法1000は、1002において、動きイベントの通知を受信することを含み得、通知は、動きイベントに関連するビデオコンテンツの部分に関連する要約フレームを含み、要約フレームは物体の複数の表現を示し、物体はビデオコンテンツの部分中に含まれる。たとえば、通知は、図1Aの通知128、図1B〜図1Cの通知188、図5の通知540、またはそれらの組合せを含むかまたはそれに対応し得る。通知は、ビデオ監視システム中に含まれるデバイスなどのデバイスから受信され得る。いくつかの実装形態では、通知は、例示的な、非限定的な例として、電子メールメッセージまたはショートメッセージサービス(SMS)メッセージを含み得る。いくつかの実装形態では、通知は、ワイヤレスネットワークを介して受信され得る。通知を受信した後に、要約フレームは、通知を受信したデバイスに結合されたディスプレイを介して提示され得る。
[00210]方法1000は、1004において、動きイベントに関連するビデオコンテンツの少なくとも部分についての要求を生成することをさらに含み得る。たとえば、要求は、図5の要求544を含むかまたはそれに対応し得る。ビデオコンテンツは、図1Aのビデオコンテンツ140(またはビデオコンテンツ114)、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、図5のビデオコンテンツ534、または図6のビデオコンテンツ614を含むかまたはそれに対応し得る。いくつかの実装形態では、要求を送った後に、方法1000は、ビデオコンテンツの部分を受信することを含み得る。ビデオコンテンツの部分を受信したことに応答して、ビデオコンテンツの部分は、ディスプレイを介して提示されるか、メモリに記憶されるか、またはその両方であり得る。
[00211]いくつかの実装形態では、入力は、ユーザインターフェース(たとえば、キーパッド、タッチスクリーン、マイクロフォンなど)など、インターフェースを介して受信され得る。たとえば、インターフェースは、図1Aのユーザインターフェース130、図5のインターフェース562、または図6の入力デバイス632を含むかまたはそれに対応し得る。入力は、要求を始動することに関連し得る。たとえば、要求は、入力を受信したことに応答して生成され得る。さらに、入力に応答して、要求は、例示的な、非限定的な例として、ワイヤレスネットワークなど、少なくとも1つのネットワークを介して送信され得る。
[00212]したがって、方法1000は、要約フレームの閲覧者が、動きイベント中に発生したアクティビティの理解を迅速に得ることを可能にするために、デバイスが要約フレームを受信することを可能にする。したがって、要約フレームに基づいて、ユーザは、動きイベントに対応するビデオセグメント(たとえば、ビデオクリップ)を要求すべきかどうかを決定し得る。
[00213]図11を参照すると、複数の要約フレームを「連結」する方法1100の例示的な例の流れ図が示されている。複数の要約フレームは、図1A〜図1Cの要約フレーム122、198、199のうちの1つまたは複数、図2の要約フレーム238、図5の要約フレーム522、図6の要約フレーム622、図7A〜図7Jの要約フレーム704、712、713、722、726、731、741、761、766、767、772、783のうちの1つまたは複数、またはそれらの組合せを含むかまたはそれに対応し得る。方法1100は、図1Aのデバイス102、図1B〜図1Cのカメラ162、図5のビデオシステム502(たとえば、コントローラ510、第1のカメラ530、または第2のカメラ532)、デバイス550、図6のデバイス602、またはそれらの組合せによって実行され得る。
[00214]方法1100は、1102において、時間期間の終了の識別に応答して、時間期間中にキャプチャされたビデオコンテンツにアクセスすることを含み得る。ビデオコンテンツは、図1Aのビデオコンテンツ140(またはビデオコンテンツ114)、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、図5のビデオコンテンツ534、または図6のビデオコンテンツ614を含むかまたはそれに対応し得る。方法1100は、1104において、ビデオコンテンツ中の複数の動きイベントを識別することをさらに含み得る。方法1100は、1106において、各動きイベントについて、動きイベント中の最小1つの対応する物体の複数の表現を含む対応する要約フレームを生成することをも含み得る。方法1100は、1108において、複数の動きイベントに対応する要約フレームを含む通知を生成することを含み得る。例示のために、通知は、図1Cの要約フレーム連結196などの要約フレーム連結を含み得る。たとえば、通知は、図1Aの通知128、図1B〜図1Cの通知188、図5の通知540、またはそれらの組合せを含むかまたはそれに対応し得る。したがって、方法1100は、複数の要約フレームを含む通知の生成を可能にする。
[00215]図12を参照すると、ビデオコンテンツをインデックス付けする方法1200の例示的な例の流れ図が示されている。方法1200は、図1Aのデバイス102、図1B〜図1Cのカメラ162、図5のビデオシステム502(たとえば、コントローラ510、第1のカメラ530、または第2のカメラ532)、デバイス550、図6のデバイス602、またはそれらの組合せによって実行され得る。
[00216]方法1200は、1202において、インデックス付きビデオコンテンツについての要求を受信することを含み得る。たとえば、要求は、図6の要求640を含むかまたはそれに対応し得る。ビデオコンテンツは、図1Aのビデオコンテンツ140(またはビデオコンテンツ114)、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、図5のビデオコンテンツ534、または図6のビデオコンテンツ614を含むかまたはそれに対応し得る。
[00217]方法1200は、1204において、要求に応答してビデオコンテンツを受信することをも含み得る。たとえば、ビデオコンテンツは、図1Aのビデオコンテンツ140(またはビデオコンテンツ114)、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、図5のビデオコンテンツ534、または図6のビデオコンテンツ614を含むかまたはそれに対応し得る。いくつかの実装形態では、ビデオコンテンツを受信することは、図2のメモリ612など、メモリからビデオコンテンツにアクセスすることを含み得る。
[00218]方法1200は、1206において、ビデオコンテンツに基づいて1つまたは複数の要約フレームを生成することをさらに含み得る。1つまたは複数の要約フレームは、図1A〜図1Cの要約フレーム122、198、199のうちの1つまたは複数、図2の要約フレーム238、図5の要約フレーム522、図6の要約フレーム622、図7A〜図7Jの要約フレーム704、712、713、722、726、731、741、761、766、767、772、783のうちの1つまたは複数、またはそれらの組合せを含むかまたはそれに対応し得る。
[00219]方法1200は、1208において、インデックス付きビデオコンテンツを生成するために、1つまたは複数の要約フレームを使用してビデオコンテンツをインデックス付けすることを含み得る。たとえば、インデックス付きビデオコンテンツは、図1B〜図1Cのインデックス付きビデオコンテンツ170、図5のインデックス付きビデオコンテンツ514、または図6のインデックス付きビデオコンテンツ642を含むかまたはそれに対応し得る。したがって、方法1200は、1つまたは複数の要約フレームを使用してビデオコンテンツをインデックス付けすることを可能にする。
[00220]図3、図4、および図8〜図12の方法は、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、グラフィカル処理ユニット(GPU)、中央処理ユニット(CPU)などの処理ユニット、デジタル信号プロセッサ(DSP)、コントローラ、別のハードウェアデバイス、ファームウェアデバイス、またはそれらの任意の組合せによって実装され得る。一例として、図3、図4、および図8〜図12の方法は、1つまたは複数の画像に関連するラインセグメントを検出または追跡するための命令を実行する1つまたは複数のプロセッサによって実行され得る。一例として、図3の方法300、図4の方法400、図8の方法800、図9の方法900、図10の方法1000、図11の方法1100、図12の方法1200、またはそれらの組合せは、要約フレームを生成または通信するための命令を実行する1つまたは複数のプロセッサによって実行され得る。例示のために、図3、図4、または図8〜図12の方法のうちの1つの部分が、図3、図4、または図8〜図12の方法のうちの1つのうちの1つの第2の部分と組み合わせられ得る。さらに、図3、図4、または図8〜図12の方法のうちの1つに関して説明された1つまたは複数のステップは、随意であり得るか、少なくとも部分的にコンカレントに実行され得るか、あるいは、示されたまたは説明された順序とは異なる順序で実行され得る。
[00221]図13を参照すると、ワイヤレス通信デバイスなど、電子デバイス1300の特定の例示的な例のブロック図が示されている。デバイス1300、またはそれの構成要素は、図1Aのシステム100(たとえば、デバイス102)、図1Bのシステム160(たとえば、カメラ162)、図1Cのシステム190(たとえば、カメラ162)、図2のシステム200、図5のシステム500(たとえば、コントローラ510、第1のカメラ530、第2のカメラ532、デバイス550)、図6のシステム600(たとえば、デバイス602)、またはそれらの構成要素を含むかまたはそれに対応し得る。
[00222]いくつかの実装形態では、デバイス1300、またはそれの構成要素は、閉回路テレビジョン(CCTV)システムなどのビデオ監視システム中に含まれ得るか、またはそれを実装するために使用され得る。例示のために、デバイス1300は、カメラデバイスであり得るか、カメラを含み得るか、またはビデオシステムコントローラを含み得る。追加または代替として、デバイス1300は、例示的な、非限定的な例として、コンピュータ、ラップトップ、モバイルデバイス(たとえば、スマートフォン、タブレットコンピュータなど)、またはサーバなど、再生デバイスを含み得る。追加または代替として、デバイス1300は、車両、ゲーミングコンソール、自動車システムコンソール(たとえば、ADAS)、ウェアラブルデバイス(たとえば、パーソナルマウントカメラ)、ヘッドマウントディスプレイ(HMD)などの中に含まれ得る。たとえば、デバイス1300は車両中に含まれ得る。追加の例は、限定はしないが、ロボットまたはロボティックデバイス、無人航空機(UAV)、あるいはドローン中に含まれることを含む。車両の例は、自動車両(たとえば、車、トラック、オートバイ、バス、または列車)、船舶(たとえば、船またはボート)、航空機(たとえば、飛行機またはヘリコプター)、宇宙船(たとえば、スペースシャトル)、自転車、または別の車両を含むことができる。車両は、例示的な非限定的な例として、装輪車両、装軌車両、鉄道車両、空中車両、またはスキー車両であり得る。いくつかの場合には、車両は、1人または複数の運転者によって操作され得る。他の場合には、車両は、自律車両などのコンピュータ制御車両であり得る。
[00223]デバイス1300は、メモリ1332に結合された、デジタル信号プロセッサ(DSP)、中央処理ユニット(CPU)、またはグラフィカル処理ユニット(GPU)など、少なくとも1つのプロセッサ1310を含む。メモリ1332は、図1Aのメモリ112、図1B〜図1Cのメモリ166、図5のメモリ512、図6のメモリ612、またはそれらの組合せを含むかまたはそれに対応し得る。プロセッサ1310は、1つまたは複数の画像(たとえば、1つまたは複数の画像フレーム)に関連する画像データ1374を処理するように構成され得る。画像データ1374は、図1Aのビデオコンテンツ140(またはビデオコンテンツ114)、図1B〜図1Cのビデオコンテンツ167、図2の画像フレーム240、図5のビデオコンテンツ534、または図6のビデオコンテンツ614を含むかまたはそれに対応し得る。
[00224]プロセッサ1310は、要約フレーム生成器1350と通知生成器1356とを含む。要約フレーム生成器1350は、図1Aの要約フレーム生成器120、図1B〜図1Cの要約フレーム生成器180、図5の要約フレーム生成器520、図6の要約フレーム生成器620、またはそれらの組合せを含むかまたはそれに対応し得る。通知生成器1356は、図1Aの通知生成器126、図1B〜図1Cの通知生成器182、図5の通知生成器526、またはそれらの組合せを含むかまたはそれに対応し得る。要約フレーム生成器1350は、要約フレーム1372を生成するために画像データ1374を処理するように構成され得る。要約フレーム1372は、図1A〜図1Cの要約フレーム122、198、199のうちの1つまたは複数、図2の要約フレーム238、図5の要約フレーム522、図6の要約フレーム622、図7A〜図7Jの要約フレーム704、712、713、722、726、731、741、761、766、767、772、783のうちの1つまたは複数、またはそれらの組合せを含むかまたはそれに対応し得る。要約フレーム生成器1350は、通知生成器1356に要約フレーム1372を与え得る。通知生成器1356は、要約フレーム1372を含む通知(たとえば、メッセージ)を生成するように構成され得る。
[00225]メモリ1332は、コンピュータ可読命令またはプロセッサ可読命令などの命令1368(たとえば、実行可能な命令)とビデオコンテンツ1370とを含む。ビデオコンテンツ1370は、画像データ1374を含むかまたはそれに対応し得る。いくつかの実装形態では、ビデオコンテンツ1370は、画像データ1374の少なくとも部分または画像データ1374のインデックス付きバージョンを含み得る。命令1368は、プロセッサ1310の各々によってなど、コンピュータによって実行可能である1つまたは複数の命令を含み得る。
[00226]例示のために、命令1368は、プロセッサ1310に、ビデオコンテンツの部分中のイベント対応する動きイベント期間を検出するを含む動作を実行させるために、プロセッサ1310によって実行可能であり得る。複数の画像フレームを含むビデオコンテンツ、ビデオコンテンツの部分は物体を含む。動作は、ビデオコンテンツの部分に関連する要約フレームを生成することをさらに含み得、要約フレームは物体の複数の表現を示す。動作は、デバイスに通知を送ることを始動することをさらに含み得る。通知は要約フレームを含み得る。
[00227]別の例示的な、非限定的な例として、命令1368は、プロセッサ1310に、デバイスによって第2のデバイスに、ビデオコンテンツの部分中で検出された動きイベントの通知を送ることを始動することを含む動作を実行させるために、プロセッサ1310によって実行可能であり得る。通知は、ビデオコンテンツの部分に関連する要約フレームを含み得る。ビデオコンテンツの部分は物体を含み得る。要約フレームは物体の複数の表現を示し得る。動作は、デバイスにおいて第2のデバイスから、動きイベントに関連するビデオセグメントについての要求を受信することをさらに含み得る。動作は、デバイスから第2のデバイスにビデオセグメントを送ることを始動することをさらに含む。
[00228]別の例示的な、非限定的な例として、命令1368は、プロセッサ1310に、プロセッサに結合されたディスプレイを介するグラフィカルユーザインターフェース(GUI)の提示を始動することを含む動作を実行させるために、プロセッサ1310によって実行可能であり得る。GUIは、ビデオコンテンツの部分に関連する要約フレームを含み得る。要約フレームは、ビデオコンテンツの部分中に含まれる物体の表現の第1のセットを示し得る。GUIは、要約フレームに関連するメタデータに基づくテキスト情報を含み得る。
[00229]別の例示的な、非限定的な例として、命令1368は、プロセッサ1310に、ビデオコンテンツについてのインデックスデータを生成することを含む動作を実行させるために、プロセッサ1310によって実行可能であり得る。インデックスデータは、要約フレームおよびメタデータを含み得る。要約フレームは、ビデオコンテンツの部分に関連し得、ビデオコンテンツの部分中に含まれる物体の複数の表現を示し得る。メタデータは、ビデオコンテンツの再生位置を示すマーカーデータを含み得る。再生位置は、要約フレームに関連し得る。
[00230]別の例示的な、非限定的な例として、命令1368は、プロセッサ1310に、デバイスから受信された通知中に含まれる要約フレームを識別することを含む動作を実行させるために、プロセッサ1310によって実行可能であり得る。要約フレームは、ビデオコンテンツに関連する動きイベント中の物体の複数の表現を示し得る。動作は、動きイベントに関連するビデオコンテンツについての要求を生成することと、デバイスに要求を送ることを始動することとをさらに含み得る。
[00231]別の例示的な、非限定的な例として、命令1368は、プロセッサ1310に、ディスプレイデバイスにおいて要約フレームを提示することを含む動作を実行させるために、プロセッサ1310によって実行可能であり得る。要約フレームは、ビデオコンテンツの部分中に含まれる物体の複数の表現を示し得る。動作は、ビデオコンテンツの部分に対応する再生位置を識別することと、再生位置が、要約フレームに基づいて識別される、再生位置においてビデオコンテンツの再生を始動することとをも含み得る。
[00232]いくつかの実装形態では、メモリ1332は、図3、図4、図8〜図12方法のうちの1つまたは複数の少なくとも部分またはそれらの組合せを実行するために、プロセッサ1310に、図1Aの要約フレーム生成器120、図1B〜図1Cの要約フレーム生成器180、図5の要約フレーム生成器520、図6の要約フレーム生成器620に関して説明された機能を実行させるために、プロセッサ1310によって実行され得るコード(たとえば、解釈されたまたはコンパイルされたプログラム命令)を含み得る。さらなる例示のために、以下の例1は、コンパイルされ、メモリ1332に記憶され得る例示的な擬似コード(たとえば、浮動小数点での簡略化されたCコード)を示す。例1は、所定のキーフレーム数を用いた非線形キーフレーム選択アルゴリズムを与える。非線形キーフレーム選択アルゴリズムは、イベント分析結果に従って非線形的にキーフレームを選択する。例1の非線形キーフレーム選択アルゴリズムを使用すると、イベント分析からのイベント測定値が高いとき、要約フレームを生成する際に使用するためにより多くのフレームが選択される可能性があり、イベント測定値が低いとき、より少ないフレームが選択される可能性がある。
例1
accu=threshold /*しきい値に等しくなるようにアキュムレータ値(accu)を始動する。フレームiのイベント分析は、「ea[i]」として表される。しきい値は、ea[i]、iが1からNまで、の総値に基づいて選択され得、ここで、iはフレームに対応し、正の整数であり、ここで、Nは、iよりも大きい正の整数である。*/
kfIndex=0 /*0に等しくなるようにキーフレームインデックス値(kfIndex)を始動する*/

For i=1 to N,i++ /*ビデオクリップ中に記録されたイベントのNフレームのループ*/
accu=accu+ea[i] /*フレームiのイベント分析(ea[i])結果をイベント測定値のアキュムレータに累積する*/

IF accu≧threshold /*アキュムレータの値がしきい値よりも大きいかまたはそれに等しい場合*/
keyFrame[kfIndex]=i /*キーフレームとしてフレームiを選択する*/
kfIndex=kfIndex+1 /*次のキーフレームに移る*/
accu=accu−threshold /*アキュムレータからしきい値を除去する*/

End if

End loop
[00233]M個のキーフレーム(ここで、Mは1よりも大きい正の整数である)などの所定の数キーフレームを選択するために、しきい値は、以下に従って設定され得る。
Figure 2018528720
代替的に、動的に適応可能なキーフレーム数を有するために、しきい値は、所定の定数に設定され得る。しきい値を所定の定数に設定することによって、著しいアクティビティをもつ動きイベントが、より多くのキーフレームを得ることがあり、アクティブをほとんどもたない動きイベントが、比較的より少ないキーフレームを有し得る。
[00234]図13はまた、プロセッサ1310とディスプレイ1328とに結合されたディスプレイコントローラ1326を示す。ディスプレイ1328は、図1Aのユーザインターフェース130、図5のディスプレイ556、図6のディスプレイ628、または図7A〜図7Fのディスプレイ702を含むかまたはそれに対応し得る。コーダ/デコーダ(コーデック)1334もプロセッサ1310に結合され得る。スピーカー1336およびマイクロフォン1338がコーデック1334に結合され得る。プロセッサ1310はまた、カメラ1362に結合されたカメラコントローラ1360に結合され得る。カメラ1362は、図1B〜図1Cのキャプチャユニット164、図5の第1のカメラ530、または第2のカメラ532を含むかまたはそれに対応し得る。カメラコントローラ1360は、プロセッサ1310に画像データ1374を通信し得る。画像データ1374は、カメラ1362によってキャプチャされた1つまたは複数の画像に基づき得る。
[00235]デバイス1300はまた、プロセッサ1310におよびアンテナ1342に結合され得る、ワイヤレスコントローラなど、ワイヤレスインターフェース1340を含み得る。いくつかの実装形態では、ワイヤレスインターフェース1340は、トランシーバ(図示せず)を介してアンテナ1342に結合され得る。トランシーバは、送信機、受信機、またはその両方を含み得る。トランシーバは、デバイス1300によって生成された1つまたは複数のメッセージを送信することと、他のデバイスによってデバイス1300に送信された1つまたは複数のメッセージを受信することとを行うように構成され得る。たとえば、トランシーバは、要約フレーム1372を含む通知など、通知生成器1356によって生成された通知を送信するように構成され得る。
[00236]特定の実装形態では、プロセッサ1310、ディスプレイコントローラ1326、カメラコントローラ1360、メモリ1332、コーデック1334、およびワイヤレスインターフェース1340は、システムインパッケージまたはシステムオンチップデバイス1322中に含まれる。いくつかの実装形態では、入力デバイス1330および電源1344が、システムオンチップデバイス1322に結合される。その上、いくつかの実装形態では、図13に示されているように、ディスプレイ1328、入力デバイス1330、スピーカー1336、マイクロフォン1338、アンテナ1342、カメラ1362、および電源1344は、システムオンチップデバイス1322の外部にある。しかしながら、ディスプレイ1328、カメラ1362、入力デバイス1330、スピーカー1336、マイクロフォン1338、アンテナ1342、および電源1344の各々は、インターフェースまたはコントローラなど、システムオンチップデバイス1322の構成要素に結合され得る。
[00237]図1〜図13の説明された態様のうちの1つまたは複数とともに、ビデオコンテンツの部分に関連する要約フレームを生成するための手段を含み得る第1の装置が開示され、要約フレームは、ビデオコンテンツの部分中に含まれる物体の複数の表現を示す。要約フレームを生成するための手段は、図1Aのデバイス102、プロセッサ118、要約フレーム生成器120、図1B〜図1Cのカメラ162、プロセッサ174、要約フレーム生成器180、図2の背景生成器210、キーフレーム選択器214、コンバイナ228、図5のコントローラ510、プロセッサ518、要約フレーム生成器520、第1のカメラ530、第2のカメラ532、デバイス550、プロセッサ558、図6のデバイス602、プロセッサ618、要約フレーム生成器620、図13の要約フレーム生成器1350、命令1368を実行するようにプログラムされたプロセッサ1310、要約フレームを生成するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含むかまたはそれに対応し得る。
[00238]第1の装置は、デバイスに通知を送信するための手段をも含み得、ここで、通知は要約フレームを含む。送信するための手段は、図1Aの送信機132、図1B〜図1Cの送信機184、図5の送信機554、図13のワイヤレスインターフェース1340、送信機、トランシーバ、通知を送信するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含むかまたはそれに対応し得る。通知は、例示的な、非限定的な例として、電子メールまたはショートメッセージサービス(SMS)メッセージを含み得る。いくつかの実装形態では、生成するための手段および送信するための手段は、ビデオ監視システム中に含まれる。
[00239]いくつかの実装形態では、ビデオコンテンツを生成するための手段は、図1B〜図1Cのキャプチャユニット164、図5の第1のカメラ530、第2のカメラ532、カメラ、インターネットプロトコル(IP)カメラ、ビデオコンテンツを生成するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含むかまたはそれに対応し得る。
[00240]図1〜図13の説明された態様のうちの1つまたは複数とともに、要約フレームを提示するための手段を含み得る第2の装置が開示される。要約フレームは、ビデオコンテンツの部分中に含まれる物体の複数の表現を示し得る。提示するための手段は、図1Aのデバイス102、ユーザインターフェース130、図5のデバイス550、ディスプレイ556、図6のデバイス602、ディスプレイ628、図13のディスプレイ1328、スクリーン、ディスプレイ、モニタ、テレビジョン、プロジェクタ、要約フレームを提示するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含むかまたはそれに対応し得る。
[00241]第2の装置は、ビデオコンテンツの部分に対応する再生位置を識別するための手段をも含み得る。再生位置は、要約フレームに基づいて識別され得る。識別するための手段は、図1Aのデバイス102、プロセッサ118、図1B〜図1Cのプロセッサ174、図5のコントローラ510、プロセッサ518、第1のカメラ530、第2のカメラ532、デバイス550、プロセッサ558、図6のデバイス602、プロセッサ618、図13の命令1368を実行するようにプログラムされたプロセッサ1310、要約フレームを生成するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含むかまたはそれに対応し得る。
[00242]第2の装置は、再生位置においてビデオコンテンツの再生を始動するための手段をも含み得る。識別するための手段は、図1Aのデバイス102、プロセッサ118、ユーザインターフェース130、図1B〜図1Cのプロセッサ174、受信機186、図5のコントローラ510、プロセッサ518、第1のカメラ530、第2のカメラ532、デバイス550、ディスプレイ556、プロセッサ558、インターフェース562、図6のデバイス602、プロセッサ618、ディスプレイ628、インターフェース632、図13の入力デバイス1330、カメラ1336、スピーカー1336、マイクロフォン1338、ディスプレイ1328、ディスプレイコントローラ1326、命令1368を実行するようにプログラムされたプロセッサ1310、スクリーン、ディスプレイ、モニタ、テレビジョン、プロジェクタ、要約フレームを生成するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含むかまたはそれに対応し得る。
[00243]いくつかの実装形態では、第2の装置は、要約フレームまたは複数の表現のうちの少なくとも1つの表現の選択を受信するための手段を含み得る。再生位置におけるビデオコンテンツの再生は、選択に基づいて始動され得る。受信するための手段は、図1Aのデバイス102、プロセッサ118、ユーザインターフェース130、図1B〜図1Cのキャプチャユニット164、プロセッサ174、受信機186、図5のコントローラ510、プロセッサ518、第1のカメラ530、第2のカメラ532、デバイス550、プロセッサ558、受信機552、インターフェース562、ディスプレイ556、図6のデバイス602、プロセッサ618、入力デバイス632、ディスプレイ628、図13の入力デバイス1330、カメラ1336、スピーカー1336、マイクロフォン1338、命令1368を実行するようにプログラムされたプロセッサ1310、マウス、タッチパッド、キーボード、タッチスクリーン、マイクロフォン、動きセンサー、カメラ、ディスプレイ、ワイヤレス受信機、選択を受信するように構成された1つまたは複数の他の、構造、デバイス、または回路、あるいはそれらの任意の組合せを含む、を含むかまたはそれに対応し得る。
[00244]開示される態様のうちの1つまたは複数は、通信デバイス、固定ロケーションデータユニット、モバイルロケーションデータユニット、モバイルフォン、セルラーフォン、衛星フォン、コンピュータ、タブレット、ポータブルコンピュータ、ディスプレイデバイス、メディアプレーヤ、またはデスクトップコンピュータを含み得る、電子デバイス1300など、システムまたは装置において実装され得る。代替または追加として、電子デバイス1300は、セットトップボックス、エンターテインメントユニット、ナビゲーションデバイス、携帯情報端末(PDA)、モニタ、コンピュータモニタ、テレビジョン、チューナー、無線機、衛星無線、音楽プレーヤ、デジタル音楽プレーヤ、ポータブル音楽プレーヤ、ビデオプレーヤ、デジタルビデオプレーヤ、デジタルビデオディスク(DVD)プレーヤ、ポータブルデジタルビデオプレーヤ、衛星、車両、プロセッサを含むかまたはデータもしくはコンピュータ命令を記憶するかもしくは取り出す任意の他のデバイス、あるいはそれらの組合せを含み得る。別の例示的な、非限定的な例として、システムまたは装置は、ハンドヘルドパーソナル通信システム(PCS)ユニットなどのリモートユニット、GPS対応デバイスなどのポータブルデータユニット、メーター読取り機器、あるいはプロセッサを含むかまたはデータもしくはコンピュータ命令を記憶するかもしくは取り出す任意の他のデバイス、あるいはそれらの任意の組合せを含み得る。
[00245]図1〜図13のうちの1つまたは複数は、本開示の教示によるシステム、装置、または方法を示し得るが、本開示は、これらの示されたシステム、装置、または方法に限定されない。本明細書で示されたまたは説明された図1〜図13のいずれかの1つまたは複数の機能または構成要素は、図1〜図13の別の機能または構成要素の1つまたは複数の他の部分と組み合わせられ得る。したがって、本明細書で説明されたいずれの単一の例も限定的なものと解釈されるべきではなく、本開示の例は、本開示の教示から逸脱することなく適切に組み合わせられ得る。
[00246]さらに、本明細書で開示される態様に関して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、プロセッサによって実行されるコンピュータソフトウェア、またはその両方の組合せとして実装され得ることを、当業者は諒解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップが、上記では概して、それらの機能に関して説明された。そのような機能がハードウェアとして実装されるか、プロセッサ実行可能命令として実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明された機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[00247]本明細書で開示される例に関して説明された方法またはアルゴリズムのステップは、直接ハードウェアで実装されるか、プロセッサによって実行されるソフトウェアモジュールで実装されるか、またはその2つの組合せで実装され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、リムーバブルディスク、コンパクトディスク読取り専用メモリ(CD−ROM)、または当技術分野で知られている任意の他の形態の非一時的(non-transient)(たとえば、非一時的(non-transitory))記憶媒体中に存在し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサと一体であり得る。プロセッサおよび記憶媒体は特定用途向け集積回路(ASIC)中に存在し得る。ASICはコンピューティングデバイスまたはユーザ端末中に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として存在し得る。
[00248]開示される態様の上記の説明は、開示される態様を当業者が作成または使用することを可能にするために与えられた。これらの態様への様々な変更は当業者には容易に明らかになり、本明細書で定義された原理は本開示の範囲から逸脱することなく他の態様に適用され得る。したがって、本開示は、本明細書に示された態様に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴に一致する可能な最も広い範囲を与えられるべきである。

Claims (30)

  1. カメラデバイスであって、
    ビデオフレームシーケンスを収集するように構成されたキャプチャユニットと、各ビデオフレームがフレームインデックスを有する、
    前記ビデオフレームシーケンスおよび関連するフレームインデックスを記憶することが可能な、前記キャプチャユニットと電気通信しているフレームバッファと、
    要約フレームを、前記要約フレームを表す符号化されたファイルに圧縮するように構成された、前記フレームバッファと電子通信しているプロセッサと、ここにおいて、前記要約フレームが、前記ビデオフレームシーケンスの第1のフレームインデックスに関連する第1のビデオフレーム中に、第1の位置における物体の第1の表現を含み、前記要約フレームが、前記ビデオフレームシーケンスの第2のフレームインデックスに関連する第2のビデオフレーム中に、第2の位置における前記物体の第2の表現を含む、
    前記要約フレームに関連する通知信号を出力するように構成された、前記プロセッサと電子通信している送信機と
    を備えるカメラデバイス。
  2. 前記プロセッサが、前記要約フレームに関連するメタデータを送信するようにとの要求を受信するように構成された、請求項1に記載のデバイス。
  3. 前記メタデータが、前記第1のフレームインデックスに関連するおよび前記第2のフレームインデックスに関連するインジケータを含む、請求項2に記載のデバイス。
  4. 前記プロセッサが、
    前記ビデオフレームシーケンスの複数のビデオフレームにわたって発生する動きイベントを検出することと、
    前記複数のビデオフレームのサブセットに基づいて前記要約フレームを生成することと
    を行うように構成された、請求項1に記載のデバイス。
  5. ビデオエンコーダが前記要約フレームを圧縮するのか前記ビデオフレームシーケンスを圧縮するのかを制御するように構成された、前記プロセッサと電気通信しているモードコントローラをさらに備える、請求項1に記載のデバイス。
  6. 前記モードコントローラは、前記ビデオエンコーダが、異なる要約フレームの連結を圧縮することをさらに可能にするように構成された、請求項5に記載のデバイス。
  7. 異なる要約フレームの前記連結が異なるプログラマブル時間期間に基づく、請求項6に記載のデバイス。
  8. 前記第1のフレームインデックスに関連する第1のデータ、前記第2のフレームインデックスに関連する第2のデータ、前記要約フレーム、またはそれらの組合せを記憶するように構成されたメモリと、
    前記要約フレームを表示するように構成されたスクリーンと
    をさらに備える、請求項1に記載のデバイス。
  9. 前記通知信号が送信されるべきであるという要求を受信するように構成された受信機と、
    前記要約フレームの生成の完了に関連する音を再生するように構成されたラウドスピーカーと
    をさらに備える、請求項1に記載のデバイス。
  10. プロセッサと、
    前記プロセッサに、
    ビデオコンテンツの部分中のイベントに対応する動きイベント期間を検出することと、前記ビデオコンテンツが複数の画像フレームを含み、ここにおいて、前記ビデオコンテンツの前記部分が物体を含む、
    前記ビデオコンテンツの前記部分に関連する要約フレームを生成することと、前記要約フレームが前記物体の複数の表現を示す、
    デバイスに通知を送ることを始動することと、ここにおいて、前記通知が前記要約フレームを含む、
    を備える動作を実行させるために実行可能な命令を記憶するメモリと
    を備える装置。
  11. 前記ビデオコンテンツが、ビデオ監視システムの複数のカメラのうちのカメラから受信され、ここにおいて、前記要約フレームが、前記イベントの単一フレーム視覚要約を与える、請求項10に記載の装置。
  12. 前記動作が、
    前記複数の画像フレームのうちの少なくとも1つに基づいて背景モデルを維持することと、
    前記複数の画像フレームの第1の画像フレームと前記背景モデルとの比較に基づいて前記動きイベント期間の始まりを識別することと、
    前記複数の画像フレームの第2の画像フレームと前記背景モデルとの比較に基づいて前記動きイベント期間の終了を識別することと、
    前記第1の画像フレーム、前記第2の画像フレーム、またはその両方に基づいて前記ビデオコンテンツをインデックス付けすることと
    をさらに備える、請求項10に記載の装置。
  13. 前記動作が、前記複数の画像フレームのうちの2つまたはそれ以上の画像フレームをキーフレームとして選択することをさらに備える、請求項10に記載の装置。
  14. 前記動作が、
    前記複数の画像フレームのうちの少なくとも1つに基づいて背景モデルを維持することと、
    前記動きイベント期間中に前記2つまたはそれ以上の画像フレームをバッファすることと、
    前記2つまたはそれ以上の画像フレームの各々について、前記画像フレームからの前記物体の表現を前記背景モデルと組み合わせることと
    をさらに備える、請求項13に記載の装置。
  15. 前記2つまたはそれ以上の画像フレームを選択するための前記動作が、
    前記複数の画像フレームの各画像フレームについて、対応する分析結果値を決定するために前記画像フレームを分析することと、
    前記動きイベント期間の総分析結果値を決定するために前記複数の画像フレームの複数の分析結果値を加算することと、
    しきい値を決定するために前記総分析結果値をキーフレームの数で除算することと
    を備える、請求項13に記載の装置。
  16. 前記2つまたはそれ以上の画像フレームを選択するための前記動作は、
    対応する分析結果値を決定するために第1の画像フレームを分析することと、
    第2の累積値を決定するために前記対応する分析結果値を第1の累積値に加算することと、
    前記第2の累積値をしきい値と比較することと、ここにおいて、前記第1の画像フレームが、前記第2の累積値が前記しきい値よりも大きいかまたはそれに等しいことに応答して、キーフレームとして選択される、
    を備える、請求項13に記載の装置。
  17. 前記動作は、
    前記デバイスに関連するアドレスを識別することと、
    前記通知を生成することと、ここにおいて、前記通知が前記アドレスを含む、
    をさらに備える、請求項10に記載の装置。
  18. ビデオコンテンツの部分に関連する要約フレームを生成するための手段と、ここにおいて、前記要約フレームが、前記ビデオコンテンツの前記部分中に含まれる物体の複数の表現を示す、
    デバイスに通知を送信するための手段と、ここにおいて、前記通知が前記要約フレームを含む、
    を備える装置。
  19. 前記ビデオコンテンツを生成するための手段をさらに備える、請求項18に記載の装置。
  20. 前記ビデオコンテンツを生成するための前記手段が、インターネットプロトコル(IP)カメラを備える、請求項19に記載の装置。
  21. 前記通知が、電子メールまたはショートメッセージサービス(SMS)メッセージを備える、請求項18に記載の装置。
  22. 生成するための前記手段および送信するための前記手段が、ビデオ監視システム中に含まれる、請求項18に記載の装置。
  23. ビデオ監視システムを動作させる方法であって、前記方法は、
    第1のデバイスによって第2のデバイスに、ビデオコンテンツの部分中で検出された動きイベントの通知を送ることと、前記通知が、前記ビデオコンテンツの前記部分に関連する要約フレームを備え、ここにおいて、前記ビデオコンテンツの前記部分が物体を含み、ここにおいて、前記要約フレームが前記物体の複数の表現を示す、
    前記第1のデバイスにおいて前記第2のデバイスから、前記動きイベントに関連するビデオセグメントについての要求を受信することと、
    前記第1のデバイスから前記第2のデバイスに前記ビデオセグメントを送ることと
    を備える、方法。
  24. 前記通知の第1のデータサイズが、前記ビデオセグメントの第2のデータサイズよりも小さい、請求項23に記載の方法。
  25. 前記要求を受信したことに応答して、
    前記ビデオコンテンツを生成したカメラを決定することと、
    前記カメラのメモリから前記ビデオセグメントにアクセスすることと
    をさらに備える、請求項24に記載の方法。
  26. 前記第2のデバイスから認証情報を受信することと、
    前記第2のデバイスに前記ビデオセグメントを送ることより前に前記認証情報を確認することと
    をさらに備える、請求項23に記載の方法。
  27. 前記要約フレームがメタデータを含み、ここにおいて、前記メタデータは、前記ビデオセグメントの識別子、前記複数の表現のうちの表現を生成するために使用される前記ビデオセグメントの画像フレームのインジケータ、前記ビデオセグメントの開始に関連する第1のタイムスタンプ、前記ビデオセグメントの終了に関連する第2のタイムスタンプ、前記ビデオセグメントが記憶されたメモリの記憶ロケーションへのリンク、またはそれらの組合せを含む、請求項23に記載の方法。
  28. 前記通知が単一の要約フレームを含む、請求項23に記載の方法。
  29. 前記通知が、前記要約フレームと第2の要約フレームとを含み、前記第2の要約フレームが、第2の動きイベントに関連する、請求項23に記載の方法。
  30. 前記要約フレームを生成することと、
    第2の物体の複数の表現を示す前記第2の要約フレームを生成することと、前記第2の物体の前記複数の表現が、前記第2の動きイベントに関連する、
    前記要約フレームと前記第2の要約フレームとに基づいて前記通知を生成することと
    をさらに備える、請求項29に記載の方法。
JP2018515674A 2015-09-25 2015-09-25 ビデオ処理のためのシステムおよび方法 Pending JP2018528720A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2015/090733 WO2017049589A1 (en) 2015-09-25 2015-09-25 Systems and methods for video processing

Publications (1)

Publication Number Publication Date
JP2018528720A true JP2018528720A (ja) 2018-09-27

Family

ID=58385756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018515674A Pending JP2018528720A (ja) 2015-09-25 2015-09-25 ビデオ処理のためのシステムおよび方法

Country Status (7)

Country Link
US (1) US20190035091A1 (ja)
EP (1) EP3354016A4 (ja)
JP (1) JP2018528720A (ja)
KR (1) KR20180056655A (ja)
CN (1) CN108028908A (ja)
BR (1) BR112018006094A2 (ja)
WO (1) WO2017049589A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10796163B2 (en) * 2014-03-07 2020-10-06 Eagle Eye Networks, Inc. Surveillance video activity summary system and access method of operation (VASSAM)
US10708673B2 (en) 2015-09-25 2020-07-07 Qualcomm Incorporated Systems and methods for video processing
US10666909B2 (en) * 2016-06-29 2020-05-26 Intel Corporation Methods and apparatus to perform remote monitoring
US10783397B2 (en) * 2016-06-29 2020-09-22 Intel Corporation Network edge device with image thresholding
CN107888636B (zh) * 2016-09-30 2020-01-17 杭州海康威视数字技术股份有限公司 基于云存储的数据处理方法及系统
US10789291B1 (en) * 2017-03-01 2020-09-29 Matroid, Inc. Machine learning in video classification with playback highlighting
US10992887B2 (en) * 2017-09-28 2021-04-27 Apple Inc. System and method for event camera data processing
US11200402B2 (en) * 2018-01-26 2021-12-14 GICSOFT, Inc. Application execution based on object recognition
US10679069B2 (en) * 2018-03-27 2020-06-09 International Business Machines Corporation Automatic video summary generation
CN110324528A (zh) * 2018-03-28 2019-10-11 富泰华工业(深圳)有限公司 摄像装置、影像处理系统及方法
US20190354762A1 (en) * 2018-05-17 2019-11-21 Chandru Bolaki Method and device for time lapsed digital video recording and navigation through the same
IL279336B1 (en) 2018-11-11 2024-04-01 Netspark Ltd On-line video filtering
US11574476B2 (en) * 2018-11-11 2023-02-07 Netspark Ltd. On-line video filtering
US11140328B2 (en) 2019-01-22 2021-10-05 Tempus Ex Machina, Inc. Systems and methods for partitioning a video feed to segment live player activity
US11787413B2 (en) * 2019-04-26 2023-10-17 Samsara Inc. Baseline event detection system
EP3739503B1 (en) * 2019-05-14 2023-10-25 Nokia Technologies Oy Video processing
US10742882B1 (en) 2019-05-17 2020-08-11 Gopro, Inc. Systems and methods for framing videos
US11954866B2 (en) * 2019-08-20 2024-04-09 Sony Interactive Entertainment Inc. Image processing apparatus using movement estimation, imaging apparatus, system, image processing method, and program
KR102252083B1 (ko) * 2019-10-17 2021-05-14 주식회사 지오비전 이벤트의 등장 객체간 관련성 파악이 용이한 비디오 서머리방법
US11317132B2 (en) 2019-12-13 2022-04-26 Rovi Guides, Inc. Systems and methods for generating new content segments based on object name identification
US11330307B2 (en) * 2019-12-13 2022-05-10 Rovi Guides, Inc. Systems and methods for generating new content structures from content segments
KR20210152221A (ko) * 2020-06-08 2021-12-15 현대자동차주식회사 영상 처리 장치, 그를 가지는 차량 및 그 제어 방법
US11538248B2 (en) * 2020-10-27 2022-12-27 International Business Machines Corporation Summarizing videos via side information

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006121475A (ja) * 2004-10-22 2006-05-11 Matsushita Electric Ind Co Ltd 画像伝送装置
JP2008154100A (ja) * 2006-12-19 2008-07-03 Sharp Corp 撮像装置、サーバ、その制御プログラムおよび該制御プログラムを記録したコンピュータ読取り可能な記録媒体、イベント管理システムならびに制御方法
JP2009212711A (ja) * 2008-03-03 2009-09-17 Toshiba Teli Corp 画像処理装置
JP2013148973A (ja) * 2012-01-17 2013-08-01 Hitachi Building Systems Co Ltd 映像監視システム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549643B1 (en) 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
US6882793B1 (en) * 2000-06-16 2005-04-19 Yesvideo, Inc. Video processing system
US6998527B2 (en) * 2002-06-20 2006-02-14 Koninklijke Philips Electronics N.V. System and method for indexing and summarizing music videos
US20040064691A1 (en) * 2002-09-26 2004-04-01 International Business Machines Corporation Method and system for processing certificate revocation lists in an authorization system
US6963378B2 (en) * 2002-11-01 2005-11-08 Motorola, Inc. Method and apparatus for reduction of visual content
US7577199B1 (en) * 2003-06-19 2009-08-18 Nvidia Corporation Apparatus and method for performing surveillance using motion vectors
US7280753B2 (en) * 2003-09-03 2007-10-09 Canon Kabushiki Kaisha Display apparatus, image processing apparatus, and image processing system
JP2005277733A (ja) * 2004-03-24 2005-10-06 Seiko Epson Corp 動画像処理装置
US20060146122A1 (en) * 2004-10-25 2006-07-06 Mcdonald Chad System for remotely capturing and storing images for multiple users in a centralized image management center
KR20070104614A (ko) * 2005-01-20 2007-10-26 코닌클리케 필립스 일렉트로닉스 엔.브이. 간접 광고들을 포함하는 예고편들의 자동적인 생성
US20070212023A1 (en) * 2005-12-13 2007-09-13 Honeywell International Inc. Video filtering system
JP4181590B2 (ja) * 2006-08-30 2008-11-19 株式会社東芝 インタフェース装置及びインタフェース処理方法
US8181197B2 (en) * 2008-02-06 2012-05-15 Google Inc. System and method for voting on popular video intervals
US8462212B1 (en) * 2008-12-04 2013-06-11 Stoplift, Inc. Correlating detected events with image data
US10645344B2 (en) * 2010-09-10 2020-05-05 Avigilion Analytics Corporation Video system with intelligent visual display
CN202003350U (zh) * 2010-12-14 2011-10-05 广东鑫程电子科技有限公司 视频摘要系统
US20160129883A1 (en) * 2011-04-22 2016-05-12 Angel A. Penilla Contact detect feature of a vehicle and notifications to enable live views of vehicle
US10140827B2 (en) * 2014-07-07 2018-11-27 Google Llc Method and system for processing motion event notifications
CN104284158B (zh) 2014-10-23 2018-09-14 南京信必达智能技术有限公司 应用于面向事件的智能监控相机的方法
US9369768B1 (en) * 2015-03-02 2016-06-14 Nbcuniversal Media, Llc System and method for media presentation with dynamic secondary content
US20170064240A1 (en) * 2015-08-24 2017-03-02 Microsoft Technology Licensing, Llc Player position and auxiliary information visualization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006121475A (ja) * 2004-10-22 2006-05-11 Matsushita Electric Ind Co Ltd 画像伝送装置
JP2008154100A (ja) * 2006-12-19 2008-07-03 Sharp Corp 撮像装置、サーバ、その制御プログラムおよび該制御プログラムを記録したコンピュータ読取り可能な記録媒体、イベント管理システムならびに制御方法
JP2009212711A (ja) * 2008-03-03 2009-09-17 Toshiba Teli Corp 画像処理装置
JP2013148973A (ja) * 2012-01-17 2013-08-01 Hitachi Building Systems Co Ltd 映像監視システム

Also Published As

Publication number Publication date
EP3354016A1 (en) 2018-08-01
US20190035091A1 (en) 2019-01-31
WO2017049589A1 (en) 2017-03-30
CN108028908A (zh) 2018-05-11
KR20180056655A (ko) 2018-05-29
EP3354016A4 (en) 2019-08-21
BR112018006094A2 (pt) 2018-10-16

Similar Documents

Publication Publication Date Title
US10708673B2 (en) Systems and methods for video processing
JP2018528720A (ja) ビデオ処理のためのシステムおよび方法
US10084961B2 (en) Automatic generation of video from spherical content using audio/visual analysis
US9570113B2 (en) Automatic generation of video and directional audio from spherical content
US10116910B2 (en) Imaging apparatus and method of providing imaging information
CN105323657B (zh) 提供视频摘要的成像设备和方法
US11984141B2 (en) Method and system for automatic pre-recordation video redaction of objects
WO2015072631A1 (ko) 영상 처리 장치 및 방법
US20220172700A1 (en) Audio privacy protection for surveillance systems
US10567844B2 (en) Camera with reaction integration
US20170294213A1 (en) Method for video investigation
KR20160095058A (ko) 카메라 모션에 의해 손상된 비디오 프레임의 처리
WO2021053689A1 (en) Methods and systems for managing storage of videos in a storage device
US20230089648A1 (en) Video camera and device for automatic pre-recorded video or audio redaction of objects
US9112940B2 (en) Correlating sensor inputs with content stream intervals and selectively requesting and transmitting content streams

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200623