JP7209044B2 - ビデオにおけるキーロゴの認識方法、装置、設備、記憶媒体、及びプログラム - Google Patents
ビデオにおけるキーロゴの認識方法、装置、設備、記憶媒体、及びプログラム Download PDFInfo
- Publication number
- JP7209044B2 JP7209044B2 JP2021100928A JP2021100928A JP7209044B2 JP 7209044 B2 JP7209044 B2 JP 7209044B2 JP 2021100928 A JP2021100928 A JP 2021100928A JP 2021100928 A JP2021100928 A JP 2021100928A JP 7209044 B2 JP7209044 B2 JP 7209044B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- key
- mask
- logo
- recognizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 68
- 230000015654 memory Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 11
- 230000003628 erosive effect Effects 0.000 claims description 8
- 230000010339 dilation Effects 0.000 claims description 7
- 238000003708 edge detection Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000916 dilatatory effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/09—Recognition of logos
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
Description
ビデオから複数のキーフレームを抽出することと、
複数の当該キーフレーム間の差異により、キーロゴのマスクを生成することと、
当該ビデオのビデオフレームにおいて、当該マスクを用いてキーロゴ領域画像を決定することと、
当該キーロゴ領域画像を認識して、当該ビデオに含まれるキーロゴタイプを得ることとを含む、ビデオにおけるキーロゴの認識方法を提供する。
ビデオから複数のキーフレームを抽出するための抽出モジュールと、
複数の当該キーフレーム間の差異により、キーロゴのマスクを生成するための生成モジュールと、
当該ビデオのビデオフレームにおいて、当該マスクを用いてキーロゴ領域画像を決定するための決定モジュールと、
当該キーロゴ領域画像を認識して、当該ビデオに含まれるキーロゴタイプを得るための認識ユニットとを備える、ビデオにおけるキーロゴの認識装置を提供する。
少なくとも1つのプロセッサと、
当該少なくとも1つのプロセッサと通信接続されるメモリとを備え、
当該メモリには、当該少なくとも1つのプロセッサによって実行可能なコマンドが記憶されており、当該コマンドは、当該少なくとも1つのプロセッサによって実行されると、当該少なくとも1つのプロセッサにビデオにおけるキーロゴの認識方法を実行させる、電子設備を提供する。
なお、上述した内容が本開示の実施形態の重要な特徴を示すためではなく、本開示の範囲の限定にもならない。本開示の他の特徴は下記の説明から理解しやすくなる。
S101で、ビデオから複数のキーフレームを抽出する。
S102で、複数の当該キーフレーム間の差異により、キーロゴのマスクを生成する。
S103で、当該ビデオのビデオフレームにおいて、当該マスクを用いてキーロゴ領域画像を決定する。
S104で、当該キーロゴ領域画像を認識して、当該ビデオに含まれるキーロゴタイプを得る。
S1012で、当該連続する3つのフレームにおける2つの隣接フレームの画素間の平均絶対差(Mean Absolute Difference、略称「MAD」又は「MAFD」)を計算して、それぞれ第1平均絶対差及び第2平均絶対差を得る。
S1013で、当該第1平均絶対差と第2平均絶対差の第1差値を計算する。
S1014で、当該第1平均絶対差、第2平均絶対差、当該第1差値のうちの最小値が第1閾値よりも大きい場合に、当該連続する3つのフレームにおける現在フレームをキーフレームとして抽出する。
S1022で、処理すべきキーフレームとその前のキーフレームとのグレースケール画像の差値を計算して、当該処理すべきキーフレームの各画素位置に対応する第2差値を得る。
S1023で、当該処理すべきキーフレームをトラバースし、当該処理すべきキーフレームのグレースケール画像における画素値が画素の最小値よりも大きい画素位置、及び/又は当該第2差値が変化の最大値よりも小さい画素位置を、マスクに属する画素位置と決定する。
p=(p0×alpha+p1×(255-alpha))/255 式1
ここで、pはアルファブレンディング後の結果(0~255)であり、p0はビデオフレームの原画像(0~255)であり、p1は黒一色の画像(0)であり、アルファ(alpha)はマスク(mask)における値(0又は255)である。
S502で、分割後のビデオフレームの4つのコーナーの位置する領域画像を抽出する。
S503で、当該4つのコーナーの位置する領域画像及び抽出されたキーロゴ領域画像に基づいて、認識するキーロゴ領域画像を決定する。
例えば、図8に示すとおり、マルチメディア処理ソフトウェアffmpegを用いて、ビデオからシーンが変換する時のキーフレームを抽出して、処理時間を短縮し計算量を減らすとともに認識効果を向上することができる。
現在フレームと前のビデオフレームの平均絶対差(mafd)を計算し、2つのmafdの差(diff)を計算し、例えば、連続する3つビデオフレームT1、T2、T3(現在フレーム)で2つの平均絶対差(mafd)を計算し、T3-T2はmafd1であり、T2-T1はmafd2であり、mafd1-mafd2の絶対値はdiffである。2つのmafd、diffのうちの最小値を得る。当該最小値が設定された閾値よりも大きい場合に、現在フレームでシーン変換が生じたものとし、現在フレームを出力する。
対象グレースケール画像と前のグレースケール画像の差の絶対値(0~255)を得て、adと称する。
複数のキーフレームの差値を得ることで、動的領域を除去してマスクを生成できるだけでなく、マスクに収縮及び膨張処理を行うと、変化前の図形が比較的完全な状態になる。
収縮によって、マスクから単色の画素領域や細いラインを除去することができる。膨張によってマスクの輪郭が大きくなり、これを複数回繰り返せば、輪郭がさらに大きくなる。
マスク(mask)で値255が取り囲む領域内の非255画素位置を255に変換して、マスク内の連結を実現する。図10に示すのは収縮、膨張及び連結処理後のマスクの例である。
ここで、アルファ(alpha)計算はアルファブレンディング(alpha blending)とも呼ばれ、算式で示すと、p=(p0×alpha+p1×(255-alpha))/255である。ここで、pはアルファブレンディング後の結果(0~255)であり、p0はビデオフレームの原画像(0~255)であり、p1は黒一色の画像(0)であり、アルファ(alpha)はマスク(mask)における値(0又は255)である。ここで、原画像はカラー画像であってもよいし、色空間はYUVを含んでもよい。
また、ビデオフレームに領域分割を行って、4つのコーナーの領域画像とテレビ局ロゴ領域画像を比較して、最終的にどちらのテレビ局ロゴ領域画像を認識するかを総合的に決定してもよい。
前記方法では、シーン変換フレームの抽出によって画素の変化が大きなフレームを見つけ、テレビ局のロゴの位置がほぼ変わらないため、変化が大きなフレームでテレビ局のロゴのより正確な位置を得ることができる。フォールトトレランスが高く、背景が複雑なビデオからテレビ局のロゴを認識することができる。
前記方法では、複数のフレーム画像の比較及び最小画素値でのフィルタリングによって、透明なテレビ局ロゴやビデオで長期的に移動しない物体にも対応し、誤認識を減らすことができる。
ビデオから複数のキーフレームを抽出するための抽出モジュール41と、
複数の当該キーフレーム間の差異により、キーロゴのマスクを生成するための生成モジュール42と、
当該ビデオのビデオフレームにおいて、当該マスクを用いてキーロゴ領域画像を決定するための決定モジュール43と、
当該キーロゴ領域画像を認識して、当該ビデオに含まれるキーロゴタイプを得るための認識ユニット44とを含んでもよい。
当該ビデオから現在フレームを含む連続する3つのフレームを取得するための取得サブモジュール411と、
当該連続する3つのフレームにおける2つの隣接フレームの画素の平均絶対差を計算して、それぞれ第1平均絶対差及び第2平均絶対差を得るための第1計算サブモジュール412と、
当該第1平均絶対差と第2平均絶対差の第1差値を計算するための第2計算サブモジュール413と、
当該第1平均絶対差、第2平均絶対差、当該第1差値のうちの最小値が第1閾値よりも大きい場合に、当該連続する3つのフレームにおける現在フレームをキーフレームとして抽出するための抽出サブモジュール414とを含む。
当該キーフレームにブラックエッジ検出を行って、当該キーフレームのブラックエッジ領域を除去するためのブラックエッジ検出モジュール51をさらに含む。
複数の当該キーフレームをそれぞれグレースケール画像に変換するためのグレースケールサブモジュール421と、
処理すべきキーフレームとその前のキーフレームとのグレースケール画像の差値を計算して、当該処理すべきキーフレームの各画素位置に対応する第2差値を得るための第3計算サブモジュール422と、
当該処理すべきキーフレームをトラバースし、当該処理すべきキーフレームのグレースケール画像で画素値が画素の最小値より大きく、及び/又は、当該第2差値が変化の最大値よりも小さい画素位置を、マスクに属する画素位置と決定するためのトラバースサブモジュール423とを含む。
当該処理すべきキーフレームにおけるマスクに属する画素位置とその前のキーフレームにおけるマスクに属する画素位置との共通部分を取得するための共通部分サブモジュール424とをさらに含む。
当該マスクに収縮、膨張及び連結処理を行うためのマスク処理モジュール52をさらに含む。
充填後のビデオフレームを複数の領域に分割し、分割後のビデオフレームの4つのコーナーの位置する領域画像を抽出し、4つのコーナーの位置する領域画像及び抽出したキーロゴ領域画像に基づいて、認識するキーロゴ領域画像を決定するための分割モジュール53をさらに含む。
図14は、本開示の実施形態によるビデオにおけるキーロゴの認識方法を実現するための電子設備のブロック図である。電子設備としては、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバー、ブレードサーバー、大型コンピュータ、他の適切なコンピュータなど、様々な形態のデジタルコンピュータであってもよい。また、パーソナルデジタルアシスタント、セルラーホン、スマートフォン、ウェアラブルデバイス、他の類似の計算設備など、様々な形態の移動設備であってもよい。本明細書に記載のコンポーネント、その接続関係、及びその機能は例示的なものに過ぎず、本開示の実施に関して本明細書に記載及び/又は主張された内容に限定を加えるためではない。
Claims (17)
- ビデオから複数のキーフレームを抽出することと、
複数の前記キーフレーム間の差異により、キーロゴのマスクを生成することと、
前記ビデオのビデオフレームにおいて、前記マスクを用いてキーロゴ領域画像を決定することと、
前記キーロゴ領域画像を認識して、前記ビデオに含まれるキーロゴタイプを得ることとを含み、
ビデオから複数のキーフレームを抽出することは、
前記ビデオにおいて隣接するフレーム間の差異に基づいて、前記ビデオからシーンが変換するキーフレームを抽出することを含み、
前記ビデオにおいて隣接するフレーム間の差異に基づいて、前記ビデオからシーンが変換するキーフレームを抽出することは、
前記ビデオから現在フレームを含む連続する3つのフレームを取得することと、
前記連続する3つのフレームにおける2つの隣接フレームの画素間の平均絶対差を計算して、それぞれ第1平均絶対差及び第2平均絶対差を得ることと、
前記第1平均絶対差と第2平均絶対差の第1差値を計算することと、
前記第1平均絶対差、第2平均絶対差、前記第1差値のうちの最小値が第1閾値よりも大きい場合に、前記連続する3つのフレームにおける現在フレームをキーフレームとして抽出することとを含む、
ビデオにおけるキーロゴの認識方法。 - 前記ビデオにおけるキーロゴの認識方法は、
前記キーフレームにブラックエッジ検出を行って、前記キーフレームのブラックエッジ領域を除去することをさらに含む、
請求項1に記載のビデオにおけるキーロゴの認識方法。 - 前記マスクは、前記キーフレームにおける非動的領域を含み、
複数の前記キーフレーム間の差異により、キーロゴのマスクを生成することは、
複数の前記キーフレームをそれぞれグレースケール画像に変換することと、
処理すべきキーフレームとその前のキーフレームとのグレースケール画像の差値を計算して、前記処理すべきキーフレームの各画素位置に対応する第2差値を得ることと、
前記処理すべきキーフレームをトラバースし、前記処理すべきキーフレームのグレースケール画像における画素値が画素の最小値よりも大きい画素位置、及び/又は前記第2差値が変化の最大値よりも小さい画素位置を、マスクに属する画素位置と決定することとを含む、
請求項1に記載のビデオにおけるキーロゴの認識方法。 - 複数の前記キーフレーム間の差異により、キーロゴのマスクを生成することは、
前記処理すべきキーフレームにおけるマスクに属する画素位置とその前のキーフレームにおけるマスクに属する画素位置との共通部分を取得することをさらに含む、
請求項3に記載のビデオにおけるキーロゴの認識方法。 - 前記ビデオにおけるキーロゴの認識方法は、
前記マスクに対して、収縮、膨張及び連結処理を行うことをさらに含む、
請求項1に記載のビデオにおけるキーロゴの認識方法。 - 前記ビデオのビデオフレームにおいて、前記マスクを用いてキーロゴ領域画像を決定することは、
前記マスク及び前記ビデオのビデオフレームを用いてアルファ(alpha)計算を行って、少なくとも1つのキーロゴ領域画像を抽出し、前記ビデオフレームの他の部分を第1画素値で充填することを含む、
請求項1に記載のビデオにおけるキーロゴの認識方法。 - 充填後のビデオフレームを複数の領域に分割することと、
分割前のビデオフレームの4つのコーナーが分割後のビデオフレームに位置する領域画像を抽出することと、
前記4つのコーナーの位置する領域画像及び抽出されたキーロゴ領域画像に基づいて、認識すべきキーロゴ領域画像を決定することとをさらに含む、
請求項6に記載のビデオにおけるキーロゴの認識方法。 - ビデオから複数のキーフレームを抽出するための抽出モジュールと、
複数の前記キーフレーム間の差異により、キーロゴのマスクを生成するための生成モジュールと、
前記ビデオのビデオフレームにおいて、前記マスクを用いてキーロゴ領域画像を決定するための決定モジュールと、
前記キーロゴ領域画像を認識して、前記ビデオに含まれるキーロゴタイプを得るための認識ユニットとを備え、
前記抽出モジュールは、前記ビデオにおいて隣接するフレーム間の差異に基づいて、前記ビデオからシーンが変換するキーフレームを抽出することに用いられ、
前記抽出モジュールは、
前記ビデオから現在フレームを含む連続する3つのフレームを取得するための取得サブモジュールと、
前記連続する3つのフレームにおける2つの隣接フレームの画素間の平均絶対差を計算して、それぞれ第1平均絶対差及び第2平均絶対差を得るための第1計算サブモジュールと、
前記第1平均絶対差と第2平均絶対差の第1差値を計算するための第2計算サブモジュールと、
前記第1平均絶対差、第2平均絶対差、前記第1差値のうちの最小値が第1閾値よりも大きい場合に、前記連続する3つのフレームにおける現在フレームをキーフレームとして抽出するための抽出サブモジュールとを備える、
ビデオにおけるキーロゴの認識装置。 - 前記ビデオにおけるキーロゴの認識装置は、
前記キーフレームにブラックエッジ検出を行って、前記キーフレームのブラックエッジ領域を除去するためのブラックエッジ検出モジュールをさらに備える、
請求項8に記載のビデオにおけるキーロゴの認識装置。 - 前記マスクは、前記キーフレームにおける非動的領域を含み、
前記生成モジュールは、
複数の前記キーフレームをそれぞれグレースケール画像に変換するためのグレースケールサブモジュールと、
処理すべきキーフレームとその前のキーフレームとのグレースケール画像の差値を計算して、前記処理すべきキーフレームの各画素位置に対応する第2差値を得るための第3計算サブモジュールと、
前記処理すべきキーフレームをトラバースし、前記処理すべきキーフレームのグレースケール画像で画素値が画素の最小値よりも大きい画素位置、及び/又は前記第2差値が変化の最大値よりも小さい画素位置を、マスクに属する画素位置と決定するためのトラバースサブモジュールとを備える、
請求項8に記載のビデオにおけるキーロゴの認識装置。 - 前記生成モジュールは、
前記処理すべきキーフレームにおけるマスクに属する画素位置とその前のキーフレームにおけるマスクに属する画素位置の共通部分を取得するための共通部分サブモジュールをさらに備える、
請求項10に記載のビデオにおけるキーロゴの認識装置。 - 前記ビデオにおけるキーロゴの認識装置は、
前記マスクに対して、収縮、膨張及び連結処理を行うためのマスク処理モジュールをさらに備える、
請求項8に記載のビデオにおけるキーロゴの認識装置。 - 前記決定モジュールは、前記マスク及び前記ビデオのビデオフレームを用いてアルファ(alpha)計算を行って、少なくとも1つのキーロゴ領域画像を抽出し、前記ビデオフレームの他の部分を第1画素値で充填することに用いられる、
請求項8に記載のビデオにおけるキーロゴの認識装置。 - 前記ビデオにおけるキーロゴの認識装置は、
充填後のビデオフレームを複数の領域に分割し、分割前のビデオフレームの4つのコーナーが分割後のビデオフレームに位置する領域画像を抽出し、前記4つのコーナーの位置する領域画像及び抽出されたキーロゴ領域画像に基づいて、認識すべきキーロゴ領域画像を決定するための分割モジュールをさらに備える、
請求項13に記載のビデオにおけるキーロゴの認識装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されるメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能なコマンドが記憶されており、前記コマンドは、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~7のいずれか1項に記載のビデオにおけるキーロゴの認識方法を実行させる、
電子設備。 - コンピュータに請求項1~7のいずれか1項に記載のビデオにおけるキーロゴの認識方法を実行させるコマンドが記憶されている非一時的なコンピュータ可読記憶媒体。
- コンピュータにおいて、プロセッサにより実行される場合、請求項1~7のいずれか1項に記載のビデオにおけるキーロゴの認識方法を実現することを特徴とするプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010599295.4A CN111753762B (zh) | 2020-06-28 | 2020-06-28 | 视频中关键标识的识别方法、装置、设备以及存储介质 |
CN202010599295.4 | 2020-06-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021166066A JP2021166066A (ja) | 2021-10-14 |
JP7209044B2 true JP7209044B2 (ja) | 2023-01-19 |
Family
ID=72676856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100928A Active JP7209044B2 (ja) | 2020-06-28 | 2021-06-17 | ビデオにおけるキーロゴの認識方法、装置、設備、記憶媒体、及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11748986B2 (ja) |
EP (1) | EP3819820B1 (ja) |
JP (1) | JP7209044B2 (ja) |
KR (1) | KR102596989B1 (ja) |
CN (1) | CN111753762B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883902B (zh) * | 2021-03-12 | 2023-01-24 | 百度在线网络技术(北京)有限公司 | 视频检测方法、装置、电子设备及存储介质 |
CN113221801B (zh) * | 2021-05-24 | 2023-08-18 | 北京奇艺世纪科技有限公司 | 版号信息识别方法、装置、电子设备及可读存储介质 |
CN113327308A (zh) * | 2021-05-28 | 2021-08-31 | 北京沃东天骏信息技术有限公司 | 表情包图片的生成方法和装置 |
CN114494954A (zh) * | 2022-01-18 | 2022-05-13 | 北京达佳互联信息技术有限公司 | 视频识别方法、装置、电子设备和存储介质 |
GB2618863A (en) * | 2022-02-02 | 2023-11-22 | Preqin Ltd | System for and method of detecting changes |
CN114979481B (zh) * | 2022-05-23 | 2023-07-07 | 深圳市海创云科技有限公司 | 一种5g超高清视频监控系统及方法 |
CN115115822B (zh) * | 2022-06-30 | 2023-10-31 | 小米汽车科技有限公司 | 车端图像处理方法、装置、车辆、存储介质及芯片 |
CN116524417B (zh) * | 2023-06-30 | 2023-10-20 | 深圳市华曦达科技股份有限公司 | 一种基于Flink的分布式实时视频关键帧的提取方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130113999A1 (en) | 2011-11-03 | 2013-05-09 | Infosys Technologies, Ltd. | Methods, systems, and computer-readable media for detecting scene changes in a video |
US20180150696A1 (en) | 2016-11-30 | 2018-05-31 | Arris Enterprises Llc | Detection of logos in a sequence of video frames |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5617149A (en) | 1994-11-22 | 1997-04-01 | Electronics And Telecommunications Research Institute | Apparatus and method for detecting scene changes using the difference of mad between image frames |
KR20030067133A (ko) | 2002-02-07 | 2003-08-14 | (주)지토 | 동영상의 자동분할 기술을 응용한 지능형 디지털 영상녹화기 시스템 |
US7483484B2 (en) * | 2003-10-09 | 2009-01-27 | Samsung Electronics Co., Ltd. | Apparatus and method for detecting opaque logos within digital video signals |
US7843512B2 (en) * | 2004-03-31 | 2010-11-30 | Honeywell International Inc. | Identifying key video frames |
JP4720705B2 (ja) | 2006-09-27 | 2011-07-13 | ソニー株式会社 | プログラム、検出方法、及び検出装置 |
US8280158B2 (en) * | 2009-10-05 | 2012-10-02 | Fuji Xerox Co., Ltd. | Systems and methods for indexing presentation videos |
US8396302B2 (en) * | 2011-01-11 | 2013-03-12 | Intel Corporation | Method of detecting logos, titles, or sub-titles in video frames |
CN102226907B (zh) * | 2011-05-24 | 2013-06-05 | 武汉嘉业恒科技有限公司 | 基于多特征的车牌定位方法及装置 |
JP2013054430A (ja) | 2011-09-01 | 2013-03-21 | Nikon Corp | 画像評価装置、撮像装置およびプログラム |
CN103714314B (zh) | 2013-12-06 | 2017-04-19 | 安徽大学 | 一种结合边缘和颜色信息的电视视频台标识别方法 |
KR101537559B1 (ko) | 2013-12-30 | 2015-07-20 | 전자부품연구원 | 객체 검출 장치, 차량용 객체 검출 장치 및 이들의 방법 |
KR101898765B1 (ko) | 2015-12-27 | 2018-09-13 | 전자부품연구원 | 콘텐츠 인식 기술 기반 콘텐츠 자동 생성 방법 및 시스템 |
CN106851397B (zh) | 2017-02-28 | 2020-03-10 | 青岛海信电器股份有限公司 | 一种台标更换方法及装置 |
CN109376603A (zh) * | 2018-09-25 | 2019-02-22 | 北京周同科技有限公司 | 一种视频识别方法、装置、计算机设备及存储介质 |
CN110781711A (zh) * | 2019-01-21 | 2020-02-11 | 北京嘀嘀无限科技发展有限公司 | 目标对象识别方法、装置、电子设备及存储介质 |
CN110909613B (zh) * | 2019-10-28 | 2024-05-31 | Oppo广东移动通信有限公司 | 视频人物识别方法、装置、存储介质与电子设备 |
-
2020
- 2020-06-28 CN CN202010599295.4A patent/CN111753762B/zh active Active
-
2021
- 2021-03-22 US US17/208,684 patent/US11748986B2/en active Active
- 2021-03-22 EP EP21163943.0A patent/EP3819820B1/en active Active
- 2021-03-24 KR KR1020210038213A patent/KR102596989B1/ko active IP Right Grant
- 2021-06-17 JP JP2021100928A patent/JP7209044B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130113999A1 (en) | 2011-11-03 | 2013-05-09 | Infosys Technologies, Ltd. | Methods, systems, and computer-readable media for detecting scene changes in a video |
US20180150696A1 (en) | 2016-11-30 | 2018-05-31 | Arris Enterprises Llc | Detection of logos in a sequence of video frames |
Also Published As
Publication number | Publication date |
---|---|
US11748986B2 (en) | 2023-09-05 |
JP2021166066A (ja) | 2021-10-14 |
US20210209375A1 (en) | 2021-07-08 |
CN111753762A (zh) | 2020-10-09 |
KR102596989B1 (ko) | 2023-10-31 |
EP3819820A2 (en) | 2021-05-12 |
EP3819820B1 (en) | 2022-12-21 |
EP3819820A3 (en) | 2021-11-10 |
KR20210040323A (ko) | 2021-04-13 |
CN111753762B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7209044B2 (ja) | ビデオにおけるキーロゴの認識方法、装置、設備、記憶媒体、及びプログラム | |
EP3843031A2 (en) | Face super-resolution realization method and apparatus, electronic device and storage medium | |
US11074437B2 (en) | Method, apparatus, electronic device and storage medium for expression driving | |
CN111709873B (zh) | 图像转换模型生成器的训练方法和装置 | |
US9842251B2 (en) | Bulleted lists | |
CN111275034B (zh) | 从图像中提取文本区域的方法、装置、设备和存储介质 | |
US11641446B2 (en) | Method for video frame interpolation, and electronic device | |
CN111767920B (zh) | 感兴趣区域的提取方法、装置、电子设备及存储介质 | |
CN111062854B (zh) | 检测水印的方法、装置、终端及存储介质 | |
KR102648760B1 (ko) | 이미지 생성 방법 및 장치 | |
US11983849B2 (en) | Image filling method and apparatus, device, and storage medium | |
CN111179159A (zh) | 消除视频中目标影像的方法、装置、电子设备及存储介质 | |
CN111768356A (zh) | 一种人脸图像融合方法、装置、电子设备及存储介质 | |
KR20220126264A (ko) | 비디오 흔들림 검출 방법, 장치, 전자 기기 및 저장 매체 | |
CN112367559B (zh) | 视频展示方法、装置、电子设备、服务器及存储介质 | |
CN112752158A (zh) | 一种视频展示的方法、装置、电子设备及存储介质 | |
CN113506305B (zh) | 三维点云数据的图像增强方法、语义分割方法及装置 | |
CN112541934B (zh) | 一种图像处理方法及装置 | |
CN113627342A (zh) | 视频深度特征提取优化的方法、系统、设备及存储介质 | |
CN113160045A (zh) | 模型训练方法、超分辨率方法、装置、电子设备及介质 | |
CN113160044A (zh) | 深度图像超分辨率方法、训练方法及装置、设备、介质 | |
CN112419145B (zh) | 一种图像数据处理方法、装置、设备及存储介质 | |
CN111160265A (zh) | 文件转换方法、装置、存储介质及电子设备 | |
CN110942420A (zh) | 一种图像字幕的消除方法及装置 | |
CN114842485B (zh) | 一种字幕去除方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210617 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20210729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7209044 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |