JP6932254B2 - キーフレームスケジューリング方法及び装置、電子機器、プログラム並びに媒体 - Google Patents
キーフレームスケジューリング方法及び装置、電子機器、プログラム並びに媒体 Download PDFInfo
- Publication number
- JP6932254B2 JP6932254B2 JP2020519444A JP2020519444A JP6932254B2 JP 6932254 B2 JP6932254 B2 JP 6932254B2 JP 2020519444 A JP2020519444 A JP 2020519444A JP 2020519444 A JP2020519444 A JP 2020519444A JP 6932254 B2 JP6932254 B2 JP 6932254B2
- Authority
- JP
- Japan
- Prior art keywords
- keyframe
- layer
- current frame
- scheduling
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 68
- 238000000605 extraction Methods 0.000 claims description 67
- 238000013528 artificial neural network Methods 0.000 claims description 35
- 230000011218 segmentation Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
- G06V20/47—Detecting features for summarising video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23424—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Description
本願は、2017年12月27日に中国特許局に提出された、出願番号がCN201711455838.Xであり、発明の名称が「キーフレームスケジューリング方法及び装置、電子機器、プログラム並びに媒体」である中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。
ニューラルネットワークの第1のネットワーク層によって現在フレームに対して特徴抽出を行って現在フレームの低層特徴を得ることと、
前記現在フレームに隣接する1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴により、前記現在フレームのスケジューリング確率値を取得することであって、前記1つ前のキーフレームの低層特徴が、前記第1のネットワーク層により前記1つ前のキーフレームに対して特徴抽出を行って得られ、前記スケジューリング確率値が、現在フレームがキーフレームとしてスケジューリングされる確率であることと、
前記現在フレームのスケジューリング確率値により、前記現在フレームがキーフレームとしてスケジューリングされるか否かを決定することと、
前記現在フレームがキーフレームとしてスケジューリングされることを決定した場合に、前記現在フレームを現在キーフレームとして決定し、第2のネットワーク層によって前記現在キーフレームの低層特徴に対して特徴抽出を行い、前記現在キーフレームの高層特徴を得ることであって、前記ニューラルネットワークにおいて、前記第1のネットワーク層のネットワーク深度が前記第2のネットワーク層のネットワーク深度より浅いことと、を含む。
初期キーフレームを決定することと、
前記第1のネットワーク層によって前記初期キーフレームに対して特徴抽出を行い、前記初期キーフレームの低層特徴を得てキャッシュすることと、
前記第2のネットワーク層によって前記初期キーフレームの低層特徴に対して特徴抽出を行い、前記初期キーフレームの高層特徴を得ることと、を更に含む。
前記初期キーフレームに対してセマンティックセグメンテーションを行い、前記初期キーフレームのセマンティックラベルを出力することを更に含む。
前記現在キーフレームの低層特徴をキャッシュすることを更に含む。
前記1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴を接合して接合特徴を得ることと、
キーフレームスケジューリングネットワークによって、前記接合特徴に基づいて前記現在フレームのスケジューリング確率値を取得することと、を含む。
前記現在キーフレームに対してセマンティックセグメンテーションを行い、前記キーフレームのセマンティックラベルを出力することを更に含む。
ニューラルネットワークの第1のネットワーク層を含み、現在フレームに対して特徴抽出を行って現在フレームの低層特徴を得るために用いられる第1の特徴抽出ユニットと、
前記現在フレームに隣接する1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴により、前記現在フレームのスケジューリング確率値を取得するために用いられるスケジューリングユニットであって、前記1つ前のキーフレームの低層特徴が、前記第1のネットワーク層により前記1つ前のキーフレームに対して特徴抽出を行って得られ、前記スケジューリング確率値が、現在フレームがキーフレームとしてスケジューリングされる確率であるスケジューリングユニットと、
前記現在フレームのスケジューリング確率値により、前記現在フレームがキーフレームとしてスケジューリングされるか否かを決定するために用いられる決定ユニットと、
第2のネットワーク層を含み、前記決定ユニットの決定結果により、前記現在フレームがキーフレームとしてスケジューリングされることを決定した場合に、前記現在フレームを現在キーフレームとして決定し、前記現在キーフレームの低層特徴に対して特徴抽出を行い、前記現在キーフレームの高層特徴を得るために用いられる第2の特徴抽出ユニットであって、前記ニューラルネットワークにおいて、前記第1のネットワーク層のネットワーク深度が前記第2のネットワーク層のネットワーク深度より浅い第2の特徴抽出ユニットと、を含む。
前記装置は、
前記初期キーフレームを含むキーフレームの低層特徴と高層特徴をキャッシュするために用いられるキャッシュユニットを更に含む。
前記1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴を接合して接合特徴を得るために用いられる接合サブユニットと、
前記接合特徴に基づいて前記現在フレームのスケジューリング確率値を取得するために用いられるキーフレームスケジューリングネットワークと、を含む。
初期キーフレーム、前記1つ前のキーフレーム又は前記現在キーフレームを含む前記キーフレームに対してセマンティックセグメンテーションを行い、前記キーフレームのセマンティックラベルを出力するために用いられるセマンティックセグメンテーションユニットを更に含む。
プロセッサと本願のいずれか1つの実施例に記載のキーフレームスケジューリング装置とを含み、
プロセッサにより前記キーフレームスケジューリング装置を作動させる時に、本願のいずれか1つの実施例に記載のキーフレームスケジューリング装置のユニットが作動する。
前記メモリは少なくとも1つの実行可能コマンドを格納するために用いられ、前記実行可能コマンドは前記プロセッサに本願のいずれか1つの実施例に記載のキーフレームスケジューリング方法中の各ステップの操作を実行させる。
上記第1のネットワーク層によって初期キーフレームに対して特徴抽出を行い、初期キーフレームの低層特徴を取得しキャッシュし、続いてこのキーフレームの低層特徴に基づいて他のフレームをキーフレームとしてスケジューリングするか否かを決定してよく(上記ステップ102を参照して決定してよい)、
上記第2のネットワーク層によって初期キーフレームの低層特徴に対して特徴抽出を行い、初期キーフレームの高層特徴を得てセマンティックセグメンテーションに用いる。
1つ前のキーフレームの低層特徴と現在フレームの低層特徴を接合し、接合特徴を得ることと、
キーフレームスケジューリングネットワークによってこの接合特徴に基づいて現在フレームのスケジューリング確率値を取得し出力することと、を含んでもよい。
1、自動運転のシーンで、本願の実施例を利用してビデオ中の目標、例えば、人物と車両を速やかに分割することができ、
2、ビデオ監視シーンで、人物を速やかに分割することができ、
3、人物画像分割などのインターネットエンタテインメント製品中で、ビデオフレームから人物を速やかに分割することができる。
プロセッサと本願の上記のいずれか1つの実施例のキーフレームスケジューリング装置とを含み、
プロセッサによりキーフレームスケジューリング装置を作動させる時に、本願の上記のいずれか1つの実施例のキーフレームスケジューリング装置中のユニットが作動する別の電子機器を更に提供する。
メモリが少なくとも1つの実行可能コマンドを格納するために用いられ、実行可能コマンドがプロセッサに本願の上記のいずれか1つの実施例のキーフレームスケジューリング方法中の各ステップの操作を実行させるまた1つの電子機器を更に提供する。
Claims (16)
- キーフレームスケジューリング方法であって、
ニューラルネットワークの第1のネットワーク層によって現在フレームに対して特徴抽出を行って現在フレームの低層特徴を得ることと、
前記現在フレームに隣接する1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴により、前記現在フレームのスケジューリング確率値を取得することであって、前記1つ前のキーフレームの低層特徴が、前記第1のネットワーク層により前記1つ前のキーフレームに対して特徴抽出を行って得られ、前記スケジューリング確率値が、現在フレームがキーフレームとしてスケジューリングされる確率であることと、
前記現在フレームのスケジューリング確率値により、前記現在フレームがキーフレームとしてスケジューリングされるか否かを決定することと、
前記現在フレームがキーフレームとしてスケジューリングされることを決定した場合に、前記現在フレームを現在キーフレームとして決定し、第2のネットワーク層によって前記現在キーフレームの低層特徴に対して特徴抽出を行い、前記現在キーフレームの高層特徴を得ることであって、前記ニューラルネットワークにおいて、前記第1のネットワーク層のネットワーク深度が前記第2のネットワーク層のネットワーク深度より浅いことと、を含むことを特徴とするキーフレームスケジューリング方法。 - 前記方法は、
初期キーフレームを決定することと、
前記第1のネットワーク層によって前記初期キーフレームに対して特徴抽出を行い、前記初期キーフレームの低層特徴を得てキャッシュすることと、
前記第2のネットワーク層によって前記初期キーフレームの低層特徴に対して特徴抽出を行い、前記初期キーフレームの高層特徴を得ることと、を更に含むことを特徴とする請求項1に記載の方法。 - 前記方法は、
前記初期キーフレームに対してセマンティックセグメンテーションを行い、前記初期キーフレームのセマンティックラベルを出力することを更に含むことを特徴とする請求項2に記載の方法。 - 前記現在フレームがキーフレームとしてスケジューリングされることを決定した後に、前記方法は、
前記現在キーフレームの低層特徴をキャッシュすることを更に含むことを特徴とする請求項1〜3のいずれか一項に記載の方法。 - 前記の前記現在フレームに隣接する1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴により、前記現在フレームのスケジューリング確率値を取得することは、
前記1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴を接合して接合特徴を得ることと、
キーフレームスケジューリングネットワークによって、前記接合特徴に基づいて前記現在フレームのスケジューリング確率値を取得することと、を含むことを特徴とする請求項1〜4のいずれか一項に記載の方法。 - 前記方法は、
前記現在キーフレームに対してセマンティックセグメンテーションを行い、前記キーフレームのセマンティックラベルを出力することを更に含むことを特徴とする請求項1〜5のいずれか一項に記載の方法。 - キーフレームスケジューリング装置であって、
ニューラルネットワークの第1のネットワーク層を含み、現在フレームに対して特徴抽出を行って現在フレームの低層特徴を得るために用いられる第1の特徴抽出ユニットと、
前記現在フレームに隣接する1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴により、前記現在フレームのスケジューリング確率値を取得するために用いられるスケジューリングユニットであって、前記1つ前のキーフレームの低層特徴が、前記第1のネットワーク層により前記1つ前のキーフレームに対して特徴抽出を行って得られ、前記スケジューリング確率値が、現在フレームがキーフレームとしてスケジューリングされる確率であるスケジューリングユニットと、
前記現在フレームのスケジューリング確率値により、前記現在フレームがキーフレームとしてスケジューリングされるか否かを決定するために用いられる決定ユニットと、
第2のネットワーク層を含み、前記決定ユニットの決定結果により、前記現在フレームがキーフレームとしてスケジューリングされることを決定した場合に、前記現在フレームを現在キーフレームとして決定し、前記現在キーフレームの低層特徴に対して特徴抽出を行い、前記現在キーフレームの高層特徴を得るために用いられる第2の特徴抽出ユニットであって、前記ニューラルネットワークにおいて、前記第1のネットワーク層のネットワーク深度が前記第2のネットワーク層のネットワーク深度より浅い第2の特徴抽出ユニットと、を含むことを特徴とするキーフレームスケジューリング装置。 - 前記1つ前のキーフレームに予め決定された初期キーフレームを含み、
前記装置は、
前記初期キーフレームを含むキーフレームの低層特徴をキャッシュするために用いられるキャッシュユニットを更に含むことを特徴とする請求項7に記載の装置。 - 前記第1の特徴抽出ユニットは、更に、前記決定ユニットの決定結果により前記キャッシュユニットに前記現在キーフレームの低層特徴をキャッシュするために用いられることを特徴とする請求項8に記載の装置。
- 前記スケジューリングユニットは、
前記1つ前のキーフレームの低層特徴と前記現在フレームの低層特徴を接合して接合特徴を得るために用いられる接合サブユニットと、
前記接合特徴に基づいて前記現在フレームのスケジューリング確率値を取得するために用いられるキーフレームスケジューリングネットワークと、を含むことを特徴とする請求項7〜9のいずれか一項に記載の装置。 - 初期キーフレーム、前記1つ前のキーフレーム又は前記現在キーフレームを含む前記キーフレームに対してセマンティックセグメンテーションを行い、前記キーフレームのセマンティックラベルを出力するために用いられるセマンティックセグメンテーションユニットを更に含むことを特徴とする請求項7〜10のいずれか一項に記載の装置。
- 電子機器であって、
請求項7〜11のいずれか一項に記載のキーフレームスケジューリング装置を含むことを特徴とする電子機器。 - 電子機器であって、
プロセッサと請求項7〜11のいずれか一項に記載のキーフレームスケジューリング装置とを含み、
プロセッサにより前記キーフレームスケジューリング装置を作動させる時に、請求項7〜11のいずれか一項に記載のキーフレームスケジューリング装置中のユニットが作動することを特徴とする電子機器。 - 電子機器であって、
プロセッサとメモリとを含み、
前記メモリは少なくとも1つの実行可能コマンドを格納するために用いられ、前記プロセッサは、前記実行可能コマンドを実行することで、請求項1〜6のいずれか一項に記載のキーフレームスケジューリング方法中の各ステップの操作を実行するために用いられることを特徴とする電子機器。 - コンピュータに、請求項1〜6のいずれか一項に記載のキーフレームスケジューリング方法を実行させることを特徴とするコンピュータプログラム。
- コンピュータに、請求項1〜6のいずれか一項に記載のキーフレームスケジューリング方法を実行させるコンピュータ読取可能コマンドを記憶したコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711455838.X | 2017-12-27 | ||
CN201711455838.XA CN108229363A (zh) | 2017-12-27 | 2017-12-27 | 关键帧调度方法和装置、电子设备、程序和介质 |
PCT/CN2018/123445 WO2019128979A1 (zh) | 2017-12-27 | 2018-12-25 | 关键帧调度方法和装置、电子设备、程序和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020536332A JP2020536332A (ja) | 2020-12-10 |
JP6932254B2 true JP6932254B2 (ja) | 2021-09-08 |
Family
ID=62648208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020519444A Active JP6932254B2 (ja) | 2017-12-27 | 2018-12-25 | キーフレームスケジューリング方法及び装置、電子機器、プログラム並びに媒体 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11164004B2 (ja) |
EP (1) | EP3644221A4 (ja) |
JP (1) | JP6932254B2 (ja) |
KR (1) | KR102305023B1 (ja) |
CN (1) | CN108229363A (ja) |
MY (1) | MY182985A (ja) |
SG (1) | SG11202000578UA (ja) |
WO (1) | WO2019128979A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229363A (zh) * | 2017-12-27 | 2018-06-29 | 北京市商汤科技开发有限公司 | 关键帧调度方法和装置、电子设备、程序和介质 |
JP7257756B2 (ja) * | 2018-08-20 | 2023-04-14 | キヤノン株式会社 | 画像識別装置、画像識別方法、学習装置、及びニューラルネットワーク |
CN111862030B (zh) | 2020-07-15 | 2024-02-09 | 北京百度网讯科技有限公司 | 一种人脸合成图检测方法、装置、电子设备及存储介质 |
DE102021204846B4 (de) | 2021-05-12 | 2023-07-06 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zum Steuern einer Robotervorrichtung |
CN114222124B (zh) * | 2021-11-29 | 2022-09-23 | 广州波视信息科技股份有限公司 | 一种编解码方法及设备 |
CN115908280B (zh) * | 2022-11-03 | 2023-07-18 | 广东科力新材料有限公司 | 基于数据处理的pvc钙锌稳定剂的性能确定方法及系统 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003134450A (ja) * | 2001-10-24 | 2003-05-09 | Ricoh Co Ltd | 代表フレーム画像検出装置及びそのプログラム |
JP4546157B2 (ja) * | 2004-06-03 | 2010-09-15 | キヤノン株式会社 | 情報処理方法、情報処理装置、撮像装置 |
CN102799684B (zh) | 2012-07-27 | 2015-09-09 | 成都索贝数码科技股份有限公司 | 一种视音频文件编目标引、元数据存储索引与搜索方法 |
US9530047B1 (en) * | 2013-11-30 | 2016-12-27 | Beijing Sensetime Technology Development Co., Ltd. | Method and system for face image recognition |
US10387773B2 (en) * | 2014-10-27 | 2019-08-20 | Ebay Inc. | Hierarchical deep convolutional neural network for image classification |
US10062412B2 (en) * | 2015-06-05 | 2018-08-28 | Apple Inc. | Hierarchical segmentation and quality measurement for video editing |
US20160378863A1 (en) | 2015-06-24 | 2016-12-29 | Google Inc. | Selecting representative video frames for videos |
US9552520B1 (en) * | 2015-07-07 | 2017-01-24 | Disney Enterprises, Inc. | Systems and methods for automatic key frame extraction and storyboard interface generation for video |
CN105095862B (zh) * | 2015-07-10 | 2018-05-29 | 南开大学 | 一种基于深度卷积条件随机场的人体动作识别方法 |
CN105677735B (zh) * | 2015-12-30 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 一种视频搜索方法及装置 |
US20190122035A1 (en) * | 2016-03-28 | 2019-04-25 | Beijing Sensetime Technology Development Co., Ltd | Method and system for pose estimation |
CN107484017B (zh) * | 2017-07-25 | 2020-05-26 | 天津大学 | 基于注意力模型的有监督视频摘要生成方法 |
CN108229363A (zh) * | 2017-12-27 | 2018-06-29 | 北京市商汤科技开发有限公司 | 关键帧调度方法和装置、电子设备、程序和介质 |
US11577388B2 (en) * | 2019-06-27 | 2023-02-14 | Intel Corporation | Automatic robot perception programming by imitation learning |
-
2017
- 2017-12-27 CN CN201711455838.XA patent/CN108229363A/zh active Pending
-
2018
- 2018-12-25 KR KR1020207005376A patent/KR102305023B1/ko active IP Right Grant
- 2018-12-25 SG SG11202000578UA patent/SG11202000578UA/en unknown
- 2018-12-25 WO PCT/CN2018/123445 patent/WO2019128979A1/zh unknown
- 2018-12-25 JP JP2020519444A patent/JP6932254B2/ja active Active
- 2018-12-25 US US16/633,341 patent/US11164004B2/en active Active
- 2018-12-25 EP EP18897706.0A patent/EP3644221A4/en not_active Ceased
- 2018-12-25 MY MYPI2020000416A patent/MY182985A/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP3644221A4 (en) | 2020-10-28 |
KR20200102409A (ko) | 2020-08-31 |
MY182985A (en) | 2021-02-05 |
US20200394414A1 (en) | 2020-12-17 |
CN108229363A (zh) | 2018-06-29 |
JP2020536332A (ja) | 2020-12-10 |
US11164004B2 (en) | 2021-11-02 |
KR102305023B1 (ko) | 2021-09-24 |
WO2019128979A1 (zh) | 2019-07-04 |
SG11202000578UA (en) | 2020-02-27 |
EP3644221A1 (en) | 2020-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6932254B2 (ja) | キーフレームスケジューリング方法及び装置、電子機器、プログラム並びに媒体 | |
US11170210B2 (en) | Gesture identification, control, and neural network training methods and apparatuses, and electronic devices | |
JP7165731B2 (ja) | 目標検出方法及び装置、トレーニング方法、電子機器並びに媒体 | |
US10943145B2 (en) | Image processing methods and apparatus, and electronic devices | |
US11062453B2 (en) | Method and system for scene parsing and storage medium | |
CN108229479B (zh) | 语义分割模型的训练方法和装置、电子设备、存储介质 | |
CN113255694B (zh) | 训练图像特征提取模型和提取图像特征的方法、装置 | |
US10891465B2 (en) | Methods and apparatuses for searching for target person, devices, and media | |
CN108235116B (zh) | 特征传播方法和装置、电子设备和介质 | |
US20190156144A1 (en) | Method and apparatus for detecting object, method and apparatus for training neural network, and electronic device | |
US11270158B2 (en) | Instance segmentation methods and apparatuses, electronic devices, programs, and media | |
CN113033537B (zh) | 用于训练模型的方法、装置、设备、介质和程序产品 | |
WO2018109505A1 (en) | Transforming source domain images into target domain images | |
US9269025B1 (en) | Object detection in images | |
US20180173966A1 (en) | Method and device for target detection | |
CN113326773A (zh) | 识别模型训练方法、识别方法、装置、设备及存储介质 | |
CN110633716A (zh) | 一种目标对象的检测方法和装置 | |
US10559129B2 (en) | Method for navigating between navigation points of a 3-dimensional space, a related system and a related device | |
CN116030140A (zh) | 输出虚拟相机运镜路径的方法、装置及电子设备 | |
CN108734718B (zh) | 用于图像分割的处理方法、装置、存储介质及设备 | |
CN113657596A (zh) | 训练模型和图像识别的方法和装置 | |
CN114093006A (zh) | 活体人脸检测模型的训练方法、装置、设备以及存储介质 | |
WO2024012143A1 (zh) | 图像数据处理方法、装置和存储介质 | |
CN110232407B (zh) | 图像处理方法和装置、电子设备和计算机存储介质 | |
CN115661238B (zh) | 可行驶区域生成方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200403 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210805 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6932254 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |