JP2021145322A - ビデオ処理方法、ビデオ処理装置および記憶媒体 - Google Patents

ビデオ処理方法、ビデオ処理装置および記憶媒体 Download PDF

Info

Publication number
JP2021145322A
JP2021145322A JP2020125375A JP2020125375A JP2021145322A JP 2021145322 A JP2021145322 A JP 2021145322A JP 2020125375 A JP2020125375 A JP 2020125375A JP 2020125375 A JP2020125375 A JP 2020125375A JP 2021145322 A JP2021145322 A JP 2021145322A
Authority
JP
Japan
Prior art keywords
video
frame
cropping
frames
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020125375A
Other languages
English (en)
Other versions
JP7062036B2 (ja
Inventor
ジアガオ フー
Jiagao Hu
ジアガオ フー
チャンシン リウ
Changxin Liu
チャンシン リウ
フェイ ワン
Fei Wang
フェイ ワン
ペンフェイ ユー
Pengfei Yu
ペンフェイ ユー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Publication of JP2021145322A publication Critical patent/JP2021145322A/ja
Application granted granted Critical
Publication of JP7062036B2 publication Critical patent/JP7062036B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • H04N21/440272Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA for performing aspect ratio conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4756End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for rating content, e.g. scoring a recommended movie

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Computer Graphics (AREA)
  • Studio Circuits (AREA)

Abstract

【課題】ビデオ処理方法ビデオ処理装置および記憶媒体の提供。【解決手段】ビデオ処理方法であって、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって評点は各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表し評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、各ビデオフレームが選択されたクロッピングフレームを使用してクロッピングし第2アスペクト比を有するターゲットビデオを生成することとを含むことを特徴とするビデオ処理方法。【選択図】図1

Description

本開示は、画像およびビデオ処理の技術分野に関し、特に、ビデオ処理方法、ビデオ処理装置および記憶媒体に関する。
ソースビデオのアスペクト比とビデオの現在の再生機器のディスプレイのアスペクト比が一致しない場合が発生する。例えば、ユーザが撮影したビデオや、インタネットからダウンロードしたビデオなどは、通常、複数のアスペクト比を有し、ユーザの再生機器のディスプレイも複数のアスペクト比を有する。ソースビデオのアスペクト比とターゲットディスプレイのアスペクト比が一致しない場合、ビデオをターゲットディスプレイで再生すると(アスペクト比が16:9であるターゲットディスプレイでアスペクト比が4:3であるビデオを再生する)、ディスプレイの両側に大きな黒い画面が表示される。
関連技術では、ソースビデオ再生のアスペクト比を再生機器のディスプレイのアスペクト比とマッチングさせて、ビデオ画面をディスプレイに埋めてより優れたユーザ体験を提供するためには、通常、ビデオ画面をズームし、またはクロッピングする必要がある。
関連技術に存在する問題を解決するために、本開示は、ビデオ処理方法、ビデオ処理装置および記憶媒体を提供する。
本開示の実施例の第1態様によれば、ビデオ処理方法を提供し、前記方法は、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表し、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成することとを含む。
一実施形態において、前記候補クロッピングフレームの評点を決定することは、
前記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを含む。
別の実施形態において、前記候補クロッピングフレームの評点を決定することは、
前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することと、前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定することとを含む。
さらに別の実施形態において、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することは、
前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されることと、最大目的関数に基づいて、前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むこととを含む。
さらに別の実施形態において、前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
前記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築するを含み、前記係数乗数は、平滑化の度合いを制御するために使用される。
さらに別の実施形態において、前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することを含み、前記係数乗数は、平滑化の度合いを制御するために使用される。
さらに別の実施形態において、各ビデオフレームのクロッピングフレームを選択した後、前記方法は、
前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割することと、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定することと、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することとをさらに含む。
さらに別の実施形態において、前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することと、第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、ここで、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であることと、第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することとを含む。
本開示の実施例の第2態様によれば、ビデオ処理装置を提供し、前記装置は、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される抽出ユニットと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成されるクロッピングユニットと、前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成される評点ユニットであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表す評点ユニットと、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される選択ユニットと、各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成するように構成される生成ユニットとを含む。
一実施形態において、前記評点ユニットは、
前記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを採用して、前記候補クロッピングフレームの評点を決定するように構成される。
別の実施形態において、前記評点ユニットは、
前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定すること、前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定することを採用して、前記候補クロッピングフレームの評点を決定するように構成される。
さらに別の実施形態において、前記選択ユニットは、
前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、最大目的関数に基づいて、前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する。
さらに別の実施形態において、前記選択ユニットは、
各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することであって、前記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築する。
さらに別の実施形態において、前記選択ユニットは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することであって、前記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築する。
さらに別の実施形態において、前記装置は調整ユニットをさらに含み、前記調整ユニットは、
前記選択ユニットが各ビデオフレームのクロッピングフレームを選択した後、前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定し、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成される。
さらに別の実施形態において、前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
前記調整ユニットは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、ここで、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整する。
本開示の実施例の第3態様によれば、ビデオ処理装置を提供し、前記装置は、
プロセッサと、プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
ここで、前記プロセッサは、第1態様または第1態様の任意の1つの実施形態に記載のビデオ処理方法を実行するように構成される。
本開示の実施例の第4態様によれば、非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記記憶媒体の命令がモバイル端末のプロセッサによって実行されるときに、モバイル端末が第1態様または第1態様の任意の1つの実施形態に記載のビデオ処理方法を実行することができるようにする。
例えば、本願は以下の項目を提供する。
(項目1)
ビデオ処理方法であって、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、
第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、上記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、
上記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、上記評点は、各候補クロッピングフレームがクロッピング範囲であるときの上記ビデオフレームの再生効果を表し、上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、
各ビデオフレームが、選択された上記クロッピングフレームを使用してクロッピングし、上記第2アスペクト比を有するターゲットビデオを生成することとを含むことを特徴とする、上記ビデオ処理方法。
(項目2)
上記候補クロッピングフレームの評点を決定することは、
上記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、上記候補クロッピングフレームの評点を取得することを含むことを特徴とする、
上記項目に記載のビデオ処理方法。
(項目3)
上記候補クロッピングフレームの評点を決定することは、
上記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、上記顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することと、
上記候補クロッピングフレーム内の各画素の画素評点に従って、上記候補クロッピングフレームの評点を決定することとを含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目4)
上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することは、
上記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、上記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されることと、
最大目的関数に基づいて、上記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、上記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むこととを含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目5)
上記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
上記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することを含み、上記係数乗数は、平滑化の度合いを制御するために使用されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目6)
上記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することを含み、上記係数乗数は、平滑化の度合いを制御するために使用されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目7)
各ビデオフレームのクロッピングフレームを選択した後、上記方法は、
上記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割することと、
隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが上記隣接する2つのビデオセグメント内で移動する速度を決定することと、
上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することとをさらに含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目8)
上記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することと、
第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、上記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、上記第1距離は、第1速度と第1時間の積であり、上記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、上記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であることと、
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することとを含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目9)
ビデオ処理装置であって、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される抽出ユニットと、
第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、上記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成されるクロッピングユニットと、
上記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成される評点ユニットであって、上記評点は、各候補クロッピングフレームがクロッピング範囲であるときの上記ビデオフレームの再生効果を表す評点ユニットと、
上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される選択ユニットと、
各ビデオフレームが、選択された上記クロッピングフレームを使用してクロッピングし、上記第2アスペクト比を有するターゲットビデオを生成するように構成される生成ユニットとを含むことを特徴とする、上記ビデオ処理装置。
(項目10)
上記評点ユニットは、
上記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、上記候補クロッピングフレームの評点を取得することを採用して、上記候補クロッピングフレームの評点を決定するように構成されることを特徴とする、
上記項目に記載のビデオ処理装置。
(項目11)
上記評点ユニットは、
上記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定すること、
上記候補クロッピングフレーム内の各画素の画素評点に従って、上記候補クロッピングフレームの評点を決定することを採用して、上記候補クロッピングフレームの評点を決定するように構成されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目12)
上記選択ユニットは、
上記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、上記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、
最大目的関数に基づいて、上記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、上記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目13)
上記選択ユニットは、
各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することであって、上記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目14)
上記選択ユニットは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することであって、上記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目15)
上記装置は調整ユニットをさらに含み、上記調整ユニットは、
上記選択ユニットが各ビデオフレームのクロッピングフレームを選択した後、上記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、
隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが上記隣接する2つのビデオセグメント内で移動する速度を決定し、
上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目16)
上記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
上記調整ユニットは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、
第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、上記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、上記第1距離は、第1速度と第1時間の積であり、上記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、上記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目17)
ビデオ処理装置であって、
プロセッサと、
プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
上記プロセッサは、上記項目のいずれか一項に記載のビデオ処理方法を実行するように構成されることを特徴とする、上記ビデオ処理装置。
(項目18)
非一時的なコンピュータ読み取り可能な記憶媒体であって、
上記記憶媒体の命令がモバイル端末のプロセッサによって実行されるときに、モバイル端末が上記項目のいずれか一項に記載のビデオ処理方法を実行することができるようにすることを特徴とする、上記非一時的なコンピュータ読み取り可能な記憶媒体。
(摘要)
本開示は、ビデオ処理方法、ビデオ処理装置および記憶媒体に関する。ビデオ処理方法は、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表し、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成することとを含む。本開示により、ソースビデオをターゲットアスペクト比に従って出力することができ、出力コンテンツの再生効果を保証することができる。
本開示の実施例によって提供される技術的解決策は、以下の有益な効果を含み得る。
ソースビデオから抽出された複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングして、第2アスペクト比を有する複数の候補クロッピングフレームを生成し、候補クロッピングフレーム再生効果の評点に基づいてクロッピングフレームを選択し、最後に、クロッピングフレームを使用してビデオフレームをクロッピングして前記第2アスペクト比を有するターゲットビデオを生成することにより、ソースビデオをターゲットアスペクト比に従って出力することができ、出力コンテンツの再生効果を保証することができる。
上記した一般的な説明および後述する詳細な説明は、単なる例示および説明に過ぎず、本開示を限定するものではないことを理解されたい。
ここでの図面は、本明細書に組み込まれてその一部を構成し、本開示と一致する実施例を示し、明細書とともに本開示の実施例の原理を説明するために使用される。
一例示的な実施例によって示されたビデオ処理方法のフローチャートである。 一例示的な実施例によって示された評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択してフレーム間の平滑化制御を実現する例示的なフローチャートである。 一例示的な実施例によって示されたクロッピングフレーム位置調整方法のフローチャートである。 一例示的な実施例によって示されたビデオ処理装置のブロック図(モバイル端末の一般的な構造)である。 一例示的な実施例によって示されたビデオ処理のための装置のブロック図である。
ここで、例示的な実施例について詳細に説明し、その例は図面に示す。特に明記しない限り、以下の説明が添付の図面に関する場合、異なる図面の同じ数字は同じまたは類似の要素を表す。以下の例示的な実施例で説明される実施形態は、本開示と一致するすべての実施形態を表すものではない。むしろ、それらは、添付された特許請求の範囲に詳述されたように、本開示の特定の態様と一致する装置および方法の例である。
関連技術では、ソースビデオ再生のアスペクト比を再生機器のディスプレイのアスペクト比とマッチングさせて、ビデオ画面をディスプレイに埋めてより優れたユーザ体験を提供するためには、通常、ビデオ画面をズームし、またはクロッピングする必要がある。ここで、ビデオ画面をズームする技術案では、ソースビデオをターゲットアスペクト比に直接にズームするが、ソースビデオのアスペクト比とターゲットアスペクト比が一致しないため、ビデオの水平方向および垂直方向のスケーリングファクタは必ず異なり、これにより画面がある程度引き伸ばされ、または圧縮される。両者のアスペクト比の差が大きいとより明確になり、ルックアンドフィールを影響する。別の技術案では、コンテンツに対する敏感なズームを試し、まず、ビデオ内の重要な物体/コンテンツを検出してキーアウトし、その後、それをターゲットアスペクト比にズームした背景に貼り付け直す。しかし、プロセス全体は、重要な物体の検出、画像の復元、ズームおよび画像の合成などの多くの動作に関するため、計算の複雑さが比較的に大きくなる。ビデオ画面をクロッピングする技術案では、通常の方式は、ビデオ画面の中心を保持する中心クロッピング方法を採用し、ソースビデオをターゲットディスプレイにリアルタイムで出力して、「全画面再生」を実現する。実施プロセス全体では、垂直方向と水平方向のコンテンツの不均等なズームがなく、それにより、背景を含む、表示されるすべてのコンテンツは、引き伸ばされたり圧縮されたりすることがない。しかしながら、ビデオ両端の余分のコンテンツをクロッピングし、ビデオの中央位置のみを保持する方法でビデオの主要コンテンツを失わないことが保証されず、クロッピングされた画像の美しさを維持することは不可能である。
これを鑑みて、本開示の実施例はビデオ処理方法を提供し、固定領域のクロッピングとコンテンツ敏感領域を組み合わせてビデオ処理を実行して、ソースビデオをターゲットアスペクト比に従って出力し、出力コンテンツの再生効果を保証することができる。
一方式において、本開示の実施例では、ソースビデオから複数のビデオフレームを抽出し、抽出された複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングしてターゲットアスペクト比を有する複数の候補クロッピングフレームを生成し、候補クロッピングフレーム再生効果の評点に基づいてクロッピングフレームを選択し、最後に、クロッピングフレームを使用してビデオフレームをクロッピングしてターゲットアスペクト比を有するターゲットビデオを生成して、ソースビデオをターゲットアスペクト比に従って出力し、出力コンテンツの再生効果を保証することができる。
図1は、一例示的な実施例によって示されたビデオ処理方法のフローチャートであり、図1に示されたように、ビデオ処理方法は次のステップを含む。
ステップS11において、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出する。
本開示の実施例では、ソースビデオは処理されるビデオとして理解することができ、特定のアスペクト比を有する。説明を容易にするため、ソースビデオのアスペクト比を第1アスペクト比と称する。
本開示の実施例では、画像に変換して後続のクロッピング処理を実行するために、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出する。ここで、ソースビデオから複数のビデオフレームを抽出する場合、ソースビデオ内のすべてのビデオフレームを抽出してもよく、ビデオフレームを等間隔でまばらに抽出してもよい。
本開示の実施例では、抽出された複数のビデオフレームの数をN(Nは正の整数である)として表記する。
ステップS12において、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングする。
本開示の実施例では、ビデオの完全なフォーマットで、ウィンドウをスライディングする方式を使用して固定のステップサイズでターゲットアスペクト比を有する長方形フレームを生成することができ、候補クロッピングフレームとして使用される。ここで、説明を容易にするために、ターゲットアスペクト比を第2アスペクト比と称する。
本開示の実施例では、各ビデオフレームを複数回クロッピングした後に生成された複数の候補クロッピングフレームの数をM(Mは正の整数である)として表記する。
ここで、本開示の実施例では、候補クロッピングフレームの数を実際のニーズに従って設定することができる。ここで、候補クロッピングフレームの数を減らし、且つ大量のコンテンツがクロッピングされて破棄されるのを防ぐために、スライディングウィンドウの大きさを設定された閾値より大きいか等しいように制限することができる。
ステップS13において、複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定し、評点は、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表す。
本開示の実施例では、コンテンツ敏感領域の決定を実現するために、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を評点することができる。評点の高さを通じて、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表す。
本開示の実施例の一実施形態において、各ビデオフレームにクロッピングフレームがあるようにするために、各ビデオフレーム内のすべての候補クロッピングフレームの評点を調整することができる。一例では、本開示の実施例は、softmax関数を使用して、各ビデオフレーム内のすべての候補クロッピングフレームの評点をそれらの和が1であるように調整するため、各候補クロッピングフレーム重み評点の高さを通じてビデオフレームの各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表すことができる。
本開示の実施例では、n(nは1より大きいか等しく、且つNより小さいか等しい正の整数である)番目のフレームのm(mは1より大きいか等しく、且つMより小さいか等しい正の整数である)番目の候補クロッピングフレームの評点を
Figure 2021145322
として表記することができる。
ステップS14において、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する。
ステップS15において、各ビデオフレームは、選択されたクロッピングフレームを使用してクロッピングし、第2アスペクト比を有するターゲットビデオを生成する。
本開示の実施例では、第1アスペクト比を有するソースビデオから抽出された複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングして、第2アスペクト比を有する複数の候補クロッピングフレームを生成し、候補クロッピングフレーム再生効果の評点に基づいてクロッピングフレームを選択し、最後に、クロッピングフレームを使用してビデオフレームをクロッピングして前記第2アスペクト比を有するターゲットビデオを生成することにより、ソースビデオをターゲットアスペクト比に従って出力することができ、出力コンテンツの再生効果を保証することができる。
本開示の実施例において、以下、上記した実施例に関するビデオ処理プロセスを実際の応用と組み合わせて説明する。
本開示の実施例では、まず、候補クロッピングフレームを評点するプロセスを説明する。
本開示の実施例では、ソースビデオから抽出されたN個のビデオフレームに対して、候補クロッピングフレームの評点の決定を1フレームずつ実行する必要がある。
一実施形態において、候補クロッピングフレームの評点を決定する場合、候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、候補クロッピングフレームの評点を取得することができる。本開示の実施例では、美的スコアを付ける具体的な実施プロセスを限定せず、既存の画像美的クロッピング方法または画像美的評点方法を使用して各フレームのすべてのM個の候補クロッピングフレームに対して美的スコアを付けることができる。その後、softmax関数を使用して、将各ビデオフレーム内のすべての候補クロッピングフレームの評点をそれらの和が1であるように調整するため、各フレームのすべてのM個の候補クロッピングフレームの評点を取得することができる。例えば、n番目のフレームのm番目の候補クロッピングフレームの評点
Figure 2021145322
を取得する。
別の実施形態において、候補クロッピングフレームの評点を決定する場合、顕著性ターゲット検出方式に基づいて評点することもできる。ここで、本開示の実施例では、各フレームのすべてのM個の候補クロッピングフレーム内の各候補クロッピングフレームに対して、候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することを採用して、評点を決定する。候補クロッピングフレーム内の各画素の画素評点に従って、候補クロッピングフレームの評点を決定する。
本開示の実施例では、各ビデオフレームが選択した候補クロッピングフレームに基づいて選択されたクロッピングフレームをビデオ再生する場合、フレーム間にジッターがあるという問題が発生する可能性がある。本開示の実施例では、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する場合、隣接する各フレーム間のジッターに対して平滑化制御を実行する。
本開示の実施例の一実施形態において、複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するプロセスを分類プロセスと見なされ、隣接する各フレーム間のジッターを削除するために、線形チェーン条件付きランダムフィールド(linear−CRF:Linear chain Conditional Random Fields)モデルを使用して処理する。
図2は、一例示的な実施例によって示された評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択してフレーム間のスムーズな制御を実現する例示的なフローチャートである。図2を参照すると、隣接する各フレーム間のジッターに対して平滑化制御を実行することは、次のステップを含み得る。
ステップS141において、複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築する。
本開示の実施例によって構築された状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用される。
本開示の実施例では、候補クロッピングフレーム間の位置大きさの差に従って状態遷移行列を設定し、以下、状態遷移行列は
Figure 2021145322
として表される。
一実施形態において、各2つの候補クロッピングフレーム間の交差比(IoU:Intersection over Union,)および係数乗数に基づいて、状態遷移行列を構築することができる。
例えば、2つのクロッピングフレーム間の交差比に基づいて計算し、具体的な計算式は以下に示す。
Figure 2021145322
ここで、
Figure 2021145322
は状態遷移行列の第i行第j列の値を表し、
Figure 2021145322
はi番目の候補クロッピングフレームを表し、
Figure 2021145322
はi番目の候補クロッピングフレームとj番目の候補クロッピングフレームの間のIoUを表し、
Figure 2021145322
は係数乗数であり、平滑化の度合いの大きさを制御するために使用され、
Figure 2021145322
の大きさを調整することにより平滑化の度合いの制御を実現することができる。
別の実施形態において、本開示の実施例では、隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築し、前記係数乗数は、平滑化の度合いを制御するために使用される。
例えば、本開示の実施例では、クロッピングフレームの大きさおよび中心位置を同時に考慮して、以下の式を使用して状態遷移行列を決定することができる。
Figure 2021145322
ここで、
Figure 2021145322
はi番目の候補クロッピングフレームの中心座標を表し、
Figure 2021145322
はi番目の候補クロッピングフレームの面積を表し、
Figure 2021145322
関数は2つのクロッピングフレーム中心座標の差を計算するために使用され、ここで、直接にユークリッド距離を使用して計算することができ、
Figure 2021145322
は、中心点位置と面接の差の影響のバランスを取るために使用され、
Figure 2021145322
を調整することにより面積変化および中心点位置変化による影響のバランスを取ることができ、
Figure 2021145322
は平滑化の度合いの大きさを制御するための係数乗数であり、
Figure 2021145322
の大きさを制御することにより平滑化の度合いの制御を実現することができる。
ステップS142において、最大目的関数に基づいて、状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定し、クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含む。
一実施形態において、本開示の実施例は、フレーム間にジッターが発生しないクロッピングフレームシーケンス
Figure 2021145322
を取得するために、ビタビアルゴリズムを使用して以下の最大目的関数を解ける。
Figure 2021145322
ここで、
Figure 2021145322
はi番目のフレームが選択した候補クロッピングフレームの番号を表す。
Figure 2021145322
はn番目のフレームから選択されたy番目の候補クロッピングフレームの評点を表す。
Figure 2021145322
はn番目のフレームから選択されたy番目の候補クロッピングフレームとn−1番目のフレームから選択されたy番目の候補クロッピングフレームに対応する状態遷移行列値を表す。
本開示の実施例では、上記したアンチシェイク平滑化処理を実行した後、各クロッピングフレームは、フレーム間にジッターがないようにする。通常、候補クロッピングフレームの位置と大きさは一定期間変更しないが、突然別の候補クロッピングフレームにジャンプして一定時間維持する。クロッピングフレームのこのようなジャンプは、最後に出力されたビデオコンテンツがジャンプし、および途切れる。したがって、このクロッピングフレーム変化をクロッピングフレームの移動およびズームの平滑を含む平滑化処理し、クロッピングフレーム位置の調整を実行する必要がある。
図3は、一例示的な実施例によって示されたクロッピングフレーム位置調整方法のフローチャートである。図3を参照すると、クロッピングフレーム位置調整方法は、次のステップを含む。
ステップS21において、ソースビデオを隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割する。
本開示の実施例では、クロッピングフレーム位置および大きさが変更しない各ビデオセグメントを決定することができ、複数のビデオセグメントの総数がK(Kは1より大きい正の整数である)であると仮定する。
ステップS22において、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが隣接する2つのビデオセグメント内で移動する速度を決定する。
本開示の実施例では、k番目のビデオの持続時間は
Figure 2021145322
であり、中間時点は
Figure 2021145322
である。ここで、
Figure 2021145322
である。ベクトル
Figure 2021145322
を使用して
Figure 2021145322
番目のセグメントのビデオのクロッピングフレームを表し、ここで、
Figure 2021145322
はそれぞれ、前記クロッピングフレームの左上頂点の横軸および縦軸であり、
Figure 2021145322
はそれぞれ、前記クロッピングフレームの右下頂点の横軸および縦軸である。
クロッピングフレームの移動速度を決定する場合、以下の式を使用してk番目からk+1番目までのクロッピングフレームの速度を計算することができる。
Figure 2021145322
ここで、クロッピングフレームの減算は4つの座標の減算である。計算された速度
Figure 2021145322
の各値は各座標が特定の軸に沿った移動速度に対応し、即ち、
Figure 2021145322
それぞれはx軸に沿った左上隅および右下隅の頂点の移動速度であり、
Figure 2021145322
それぞれはy軸に沿った左上隅および右下隅の頂点の移動速度である。
ステップS23において、隣接する2つのビデオセグメントでクロッピングフレームが移動しようとする速度および再生時間に基づいて、隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整する。
本開示の実施例では、第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持する。
Figure 2021145322
である場合、第kビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動し、第1距離は第1速度と第1時間の積であり、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、第1時間は、現在の時間と第kビデオセグメントの中間時点の差である。
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持する。
本開示の実施例では、任意の時間tに対して、以下の式を使用して当該時間のクロッピングフレーム位置
Figure 2021145322
を計算することができる。
Figure 2021145322
ここで、
Figure 2021145322
(即ち、最初のビデオの前半である)である場合、
Figure 2021145322
である。
Figure 2021145322
(即ち、最後のビデオの後半である)である場合、
Figure 2021145322
である。
Figure 2021145322
である場合、
Figure 2021145322
である。
本開示の実施例では、ソースビデオ内の各ビデオフレームに対して、上記した方法を採用してクロッピングして、クロッピングフレームを生成し、ここで、クロッピングして生成されたクロッピングフレームは同じアスペクト比を有する。同じアスペクト比を有するクロッピングフレームを同じ解像度にズームした後にビデオに再び組み合わせすると、ターゲットビデオを取得して出力することができ、ソースビデオをターゲットアスペクト比に従って出力し、出力コンテンツの再生効果を保証することができる。
同じ構想に基づいて、本開示の実施例はビデオ処理装置をさらに提供する。
前記機能を実現するために、本開示の実施例によって提供されるビデオ処理装置は、各機能を実行することに対応するハードウェア構造および/またはソフトウェアモジュールを含むことを理解すべきである。本開示の実施例に開示される実施例で説明された各例示のユニットおよびアルゴリズムステップを組み合わせることにより、本開示の実施例は、ハードウェア、またはハードウェアとコンピュータソフトウェアの組み合わせの形態で実現されることができる。特定の機能がハードウェアで実行されるかコンピュータソフトウェア駆動のハードウェアで実行されるかは、技術的解決策の特定の応用および設計の制約条件に依存する。当業者は、各特定の応用に対して異なる方法を使用して説明された機能を実現することができるが、このような実現は本開示の実施例の範囲を超えると見なされるべきではない。
図4は、一例示的な実施例によって示されたビデオ処理装置のブロック図である。図4を参照すると、ビデオ処理装置100は、抽出ユニット101、クロッピングユニット102、評点ユニット103、選択ユニット104および生成ユニット105を含む。
抽出ユニット101は、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される。クロッピングユニット102は、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成される。評点ユニット103は、複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成され、評点は、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表す。選択ユニット104は、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される。生成ユニット105は、各ビデオフレームが、選択されたクロッピングフレームを使用してクロッピングし、第2アスペクト比を有するターゲットビデオを生成するように構成される。
一実施形態において、評点ユニット103は、候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、候補クロッピングフレームの評点を取得する。
別の実施形態において、評点ユニット103は、候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定する。候補クロッピングフレーム内の各画素の画素評点に従って、候補クロッピングフレームの評点を決定する。
さらに別の実施形態において、選択ユニット104は、
複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、最大目的関数に基づいて、状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する。
さらに別の実施形態において、選択ユニット104は、各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築し、係数乗数は、平滑化の度合いを制御するために使用される。
さらに別の実施形態において、選択ユニット104は、隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築し、係数乗数は、平滑化の度合いを制御するために使用される。
さらに別の実施形態において、ビデオ処理装置100は調整ユニット106をさらに含み、調整ユニット106は、選択ユニット104が各ビデオフレームのクロッピングフレームを選択した後、ソースビデオを隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが隣接する2つのビデオセグメント内で移動する速度を決定し、速度および再生時間に基づいて、隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成される。
さらに別の実施形態において、複数のビデオセグメントの総数はKであり、ここで、Kは1より大きい正の整数である。
調整ユニット106は、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、第1距離は第1速度と第1時間の積であり、ここで、第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、速度および再生時間に基づいて、隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整する。
上記の実施例の装置に関して、ここで、各モジュールが動作を実行する具体的な方法は、既に、前記方法に関する実施例で詳細に説明されており、ここでは詳細に説明しない。
図5は、一例示的な実施例によって示されたビデオ処理のための装置200のブロック図である。例えば、装置200は携帯電話、コンピュータ、デジタル放送端末、メッセージングデバイス、ゲームコンソール、タブレットデバイス、医療機器、フィットネス機器、携帯情報端末等であってもよい。
図5を参照すれば、装置200は、処理コンポーネント202、メモリ204、電力コンポーネント206、マルチメディアコンポーネント208、オーディオコンポーネント210、入力/出力(I/O)インターフェース212、センサコンポーネント214、および通信コンポーネント216のうちの1つまたは複数のコンポーネットを含むことができる。
処理コンポーネント202は、一般的に、ディスプレイ、電話の呼び出し、データ通信、カメラ操作及び記録操作に関する操作のような装置200の全般的な操作を制御する。処理コンポーネント202は、前記方法のステップのすべてまたは一部を完了するために、1つまたは複数のプロセッサ220を含んで命令を実行することができる。加えて、処理コンポーネント202は、処理コンポーネント202と他のコンポーネントの間の相互作用を容易にするために、1つまたは複数のモジュールを含むことができる。例えば、処理コンポーネント202は、マルチメディアコンポーネント208と処理コンポーネント202との間の相互作用を容易にするために、マルチメディアモジュールを含むことができる。
メモリ204は、機器200での操作をサポートするために、様々なタイプのデータを格納するように構成される。これらのデータの例には、装置200で動作する任意のアプリケーションまたは方法の命令、連絡先データ、電話帳データ、メッセージ、写真、ビデオ等が含まれる。メモリ204は、スタティックランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、消去可能なプログラム可能な読み取り専用メモリ(EPROM)、プログラム可能な読み取り専用メモリ(PROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなど、あらゆるタイプの揮発性または不揮発性ストレージデバイスまたはそれらの組み合わせによって実現されることができる。
電力コンポーネント206は、装置200の様々なコンポーネントに電力を提供する。電力コンポーネント206は、電力管理システム、1つまたは複数の電源、及び装置200の電力の生成、管理および分配に関する他のコンポーネントを含むことができる。
マルチメディアコンポーネント208は、前記バッテリの充電装置200とユーザとの間の、出力インターフェースを提供するスクリーンを含む。いくつかの実施形態において、スクリーンは、液晶ディスプレイ(LCD)及びタッチパネル(TP)を含み得る。スクリーンがタッチパネルを含む場合、スクリーンは、ユーザからの入力信号を受信するためのタッチスクリーンとして実装されることができる。タッチパネルは、タッチ、スワイプ及びタッチパネルでのジェスチャーを検知するための1つまたは複数のタッチセンサを含む。前記タッチセンサは、タッチまたはスワイプの操作の境界を感知するだけでなく、前記タッチまたはスワイプ動作に関連する持続時間及び圧力も検出することができる。いくつかの実施例において、マルチメディアコンポーネント208は、1つのフロントカメラ及び/またはリアカメラを含む。機器200が、撮影モードまたはビデオモードなどの動作モードにあるとき、フロントカメラ及び/またはリアカメラは、外部のマルチメディアデータを受信することができる。各フロントカメラ及びリアカメラは、固定光学レンズシステムであり、または焦点距離と光学ズーム機能を持つことができる。
オーディオコンポーネント210は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオコンポーネント210は、1つのマイクロフォン(MIC)を含み、装置200が通話モード、録音モード及び音声認識モードなどの動作モードにあるとき、マイクロフォンは、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、メモリ204にさらに格納されてもよく、または通信コンポーネント216を介して送信されてもよい。いくつかの実施例において、オーディオコンポーネント210は、オーディオ信号を出力するためのスピーカをさらに含む。
I/Oインターフェース212は、処理コンポーネント202と周辺インターフェースモジュールとの間にインターフェースを提供し、前記周辺インターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームボタン、ボリュームボタン、スタートボタン、ロックボタンを含むが、これらに限定されない。
センサコンポーネント214は、装置200に各態様の状態の評価を提供するための1つまたは複数のセンサを含む。例えば、センサコンポーネント214は、機器200のオン/オフ状態と、装置200のディスプレイやキーパッドなどのコンポーネントの相対的な位置づけを検出することができ、センサコンポーネント214は、装置200または装置200のコンポーネントの位置の変化、ユーザとの装置200の接触の有無、装置200の向きまたは加速/減速、及び装置200の温度の変化も検出することができる。センサコンポ―ネット214は、物理的接触なしに近くの物体の存在を検出するように構成された近接センサを含むことができる。センサコンポーネント214は、撮像用途で使用するためのCMOSまたはCCD画像センサなどの光センサも含むことができる。いくつかの実施例において、前記センサコンポーネント214は、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサをさらに含むことができる。
通信コンポーネント216は、装置200と他の装置の間の有線または無線通信を容易にするように構成される。装置200は、WiFi、2Gまたは3G、またはそれらの組み合わせなどの通信規格に基づく無線ネットワークにアクセスすることができる。一例示的な実施例において、前記通信コンポーネント216は、放送チャンネルを介して外部放送管理システムからの放送信号または放送関連情報を受信する。一例示的な実施例において、前記通信コンポーネント216は、短距離通信を促進するために、近距離通信(NFC)モジュールをさらに含む。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術及び他の技術に基づいて具現することができる。
例示的な実施例において、装置200は、1つまたは複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子素子によって具現されることができ、前記方法を実行するように構成される。
例示的な実施例において、命令を含むメモリ204などの、命令を含む非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記命令は、装置200のプロセッサ220によって実行されて前記方法を完了することができる。例えば、前記非一時的なコンピュータ読み取り可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスクおよび光学データ記憶装置などであってもよい。
本開示の「複数」は2つまたは2つ以上を指し、他の数量詞はこれと類似することを理解することができる。「および/または」は、関連付けられたオブジェクトを説明する関連付けであり、3種類の関係が存在することができることを示し、例えば、Aおよび/またはBは、Aが独立で存在する場合、AとBが同時に存在する場合、Bが独立で存在する場合など3つの場合を表すことができる。文字「/」は、一般的に、コンテキストオブジェクトが「または」の関係であることを示す。単数形の「1つ」、「前記」および「当該」は、コンテキストで他の意味を明確に示さない限り、複数形も含むことを意図する。
用語「第1」、「第2」などは様々な情報を説明するために使用されるが、これらの情報はこれらの用語に限定されないことをさらに理解されたい。これらの用語は、同じタイプの情報をお互いに区別するために使用され、特定の順序または重要性を示すものではない。実際に、「第1」、「第2」などの表現は、お互いに交換して使用することができる。例えば、本開示の範囲から逸脱することなく、第1の情報は第2の情報とも称し得、同様に、第2の情報は第1の情報とも称し得る。
本開示の実施例で、図面において特定の順序で動作を説明したが、それらの動作は、示された特定の順序でまたは連続した順序に従って実行されることを要求し、または示された全ての動作を実行して、目的の結果を取得することを要求するものとして理解されるべきではないことをさらに理解することができる。特定の環境では、マルチタスクと並列処理が有利な場合がある。
当業者は、明細書を考慮して、本明細書に開示された発明を実施した後に、本開示の他の実施形態を容易に想到し得るであろう。本出願は、本開示のあらゆる変形、応用または適応性変化を網羅することを意図し、これらの変形、応用または適応性変化は、本開示の普通の原理に準拠し、本開示によって開示されない本技術分野における公知知識または従来の技術的手段を含む。明細書と実施例は、例示としてのみ考慮され、本開示の真の範囲および思想は添付の特許請求の範囲によって示される。
本開示は、上記に既に説明し且つ図面に示した正確な構造に限定されるものではなく、その範囲から逸脱することなく様々な修正及び変更を行うことができることを理解されたい。本開示の範囲は、添付の特許請求の範囲によってのみ制限される。

Claims (18)

  1. ビデオ処理方法であって、
    第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、
    第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、
    前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表し、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、
    各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成することとを含むことを特徴とする、前記ビデオ処理方法。
  2. 前記候補クロッピングフレームの評点を決定することは、
    前記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを含むことを特徴とする、
    請求項1に記載のビデオ処理方法。
  3. 前記候補クロッピングフレームの評点を決定することは、
    前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、前記顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することと、
    前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定することとを含むことを特徴とする、
    請求項1に記載のビデオ処理方法。
  4. 前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することは、
    前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されることと、
    最大目的関数に基づいて、前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むこととを含むことを特徴とする、
    請求項1ないし3のいずれか一項に記載のビデオ処理方法。
  5. 前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
    前記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することを含み、前記係数乗数は、平滑化の度合いを制御するために使用されることを特徴とする、
    請求項4に記載のビデオ処理方法。
  6. 前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
    隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することを含み、前記係数乗数は、平滑化の度合いを制御するために使用されることを特徴とする、
    請求項4に記載のビデオ処理方法。
  7. 各ビデオフレームのクロッピングフレームを選択した後、前記方法は、
    前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割することと、
    隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定することと、
    前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することとをさらに含むことを特徴とする、
    請求項4に記載のビデオ処理方法。
  8. 前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
    前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することは、
    第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することと、
    第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であることと、
    第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することとを含むことを特徴とする、
    請求項7に記載のビデオ処理方法。
  9. ビデオ処理装置であって、
    第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される抽出ユニットと、
    第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成されるクロッピングユニットと、
    前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成される評点ユニットであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表す評点ユニットと、
    前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される選択ユニットと、
    各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成するように構成される生成ユニットとを含むことを特徴とする、前記ビデオ処理装置。
  10. 前記評点ユニットは、
    前記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを採用して、前記候補クロッピングフレームの評点を決定するように構成されることを特徴とする、
    請求項9に記載のビデオ処理装置。
  11. 前記評点ユニットは、
    前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定すること、
    前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定することを採用して、前記候補クロッピングフレームの評点を決定するように構成されることを特徴とする、
    請求項9に記載のビデオ処理装置。
  12. 前記選択ユニットは、
    前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、
    最大目的関数に基づいて、前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することを特徴とする、
    請求項9ないし11のいずれか一項に記載のビデオ処理装置。
  13. 前記選択ユニットは、
    各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することであって、前記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することを特徴とする、
    請求項12に記載のビデオ処理装置。
  14. 前記選択ユニットは、
    隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することであって、前記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することを特徴とする、
    請求項12に記載のビデオ処理装置。
  15. 前記装置は調整ユニットをさらに含み、前記調整ユニットは、
    前記選択ユニットが各ビデオフレームのクロッピングフレームを選択した後、前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、
    隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定し、
    前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成されることを特徴とする、
    請求項12に記載のビデオ処理装置。
  16. 前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
    前記調整ユニットは、
    第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、
    第k(kは、1<k<K−1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、
    第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することを特徴とする、
    請求項15に記載のビデオ処理装置。
  17. ビデオ処理装置であって、
    プロセッサと、
    プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
    前記プロセッサは、請求項1ないし8のいずれか一項に記載のビデオ処理方法を実行するように構成されることを特徴とする、前記ビデオ処理装置。
  18. 非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記記憶媒体の命令がモバイル端末のプロセッサによって実行されるときに、モバイル端末が請求項1ないし8のいずれか一項に記載のビデオ処理方法を実行することができるようにすることを特徴とする、前記非一時的なコンピュータ読み取り可能な記憶媒体。
JP2020125375A 2020-03-11 2020-07-22 ビデオ処理方法、ビデオ処理装置および記憶媒体 Active JP7062036B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010165769.4 2020-03-11
CN202010165769.4A CN111356016B (zh) 2020-03-11 2020-03-11 视频处理方法、视频处理装置及存储介质

Publications (2)

Publication Number Publication Date
JP2021145322A true JP2021145322A (ja) 2021-09-24
JP7062036B2 JP7062036B2 (ja) 2022-05-02

Family

ID=71194437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020125375A Active JP7062036B2 (ja) 2020-03-11 2020-07-22 ビデオ処理方法、ビデオ処理装置および記憶媒体

Country Status (5)

Country Link
US (1) US11488383B2 (ja)
EP (1) EP3879530A1 (ja)
JP (1) JP7062036B2 (ja)
KR (1) KR102301447B1 (ja)
CN (1) CN111356016B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112188283B (zh) * 2020-09-30 2022-11-15 北京字节跳动网络技术有限公司 裁剪视频的方法、装置、设备以及存储介质
CN114026874A (zh) * 2020-10-27 2022-02-08 深圳市大疆创新科技有限公司 视频处理方法、装置、可移动设备及可读存储介质
CN112565890B (zh) * 2020-12-02 2022-09-16 北京有竹居网络技术有限公司 视频裁剪方法、装置、存储介质及电子设备
CN115379246A (zh) * 2021-05-21 2022-11-22 北京字节跳动网络技术有限公司 直播视频流播放方法、装置、电子设备及存储介质
CN113840172B (zh) * 2021-09-28 2023-01-03 北京奇艺世纪科技有限公司 视频裁剪方法、装置、终端设备以及可读存储介质
CN114898171B (zh) * 2022-04-07 2023-09-22 中国科学院光电技术研究所 一种适用于嵌入式平台的实时目标检测方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005229578A (ja) * 2004-01-14 2005-08-25 Matsushita Electric Ind Co Ltd 映像信号表示装置
US20090251594A1 (en) * 2008-04-02 2009-10-08 Microsoft Corporation Video retargeting
WO2009141955A1 (ja) * 2008-05-21 2009-11-26 パナソニック株式会社 撮像装置、撮像方法及び集積回路
US20130050547A1 (en) * 2011-08-25 2013-02-28 Altasens, Inc. Programmable data readout for an optical sensor
US20130050574A1 (en) * 2011-08-29 2013-02-28 Futurewei Technologies Inc. System and Method for Retargeting Video Sequences
US20170249719A1 (en) * 2016-02-26 2017-08-31 Netflix, Inc. Dynamically cropping digital content for display in any aspect ratio
CN110062279A (zh) * 2019-04-22 2019-07-26 努比亚技术有限公司 视频裁剪方法、可穿戴设备以及计算机可读存储介质
CN110149532A (zh) * 2019-06-24 2019-08-20 北京奇艺世纪科技有限公司 一种封面选取方法及相关设备
JP2019149785A (ja) * 2018-02-28 2019-09-05 日本放送協会 映像変換装置及びプログラム
US20190348077A1 (en) * 2002-05-09 2019-11-14 Gvbb Holdings S.A.R.L. Systems, methods, and computer program products for automated real-time execution of live inserts of repurposed stored content distribution

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7236632B2 (en) * 2003-04-11 2007-06-26 Ricoh Company, Ltd. Automated techniques for comparing contents of images
US8171030B2 (en) * 2007-06-18 2012-05-01 Zeitera, Llc Method and apparatus for multi-dimensional content search and video identification
WO2013030833A1 (en) * 2011-08-29 2013-03-07 I.C.V.T. Ltd. Controlling a video content system
DE102014207607B4 (de) * 2013-04-25 2019-09-19 Avago Technologies International Sales Pte. Ltd. System und Verfahren zur Verarbeitung von Videodaten
CN105227999B (zh) * 2015-09-29 2018-12-14 北京奇艺世纪科技有限公司 一种视频裁剪的方法和装置
US10319410B1 (en) * 2015-12-21 2019-06-11 Amazon Technologies, Inc. Video story assembly
US10154228B1 (en) * 2015-12-23 2018-12-11 Amazon Technologies, Inc. Smoothing video panning
US10239456B1 (en) * 2016-02-10 2019-03-26 Ambarella, Inc. Apparatus to adjust a field of view displayed on an electronic mirror using an automobile state or a driver action
US20170243384A1 (en) * 2016-02-19 2017-08-24 Mediatek Inc. Image data processing system and associated methods for processing panorama images and image blending using the same
CN107155065A (zh) * 2017-06-28 2017-09-12 哈尔滨市舍科技有限公司 一种虚拟拍照装置及方法
CN107396018A (zh) * 2017-08-09 2017-11-24 维沃移动通信有限公司 一种录像方法、移动终端及计算机可读存储介质
CN107463912A (zh) * 2017-08-10 2017-12-12 武汉大学深圳研究院 基于运动显著性的视频人体行为识别方法
CN108280808B (zh) * 2017-12-15 2019-10-25 西安电子科技大学 基于结构化输出相关滤波器的目标跟踪方法
CN110868631B (zh) * 2018-08-28 2021-12-14 腾讯科技(深圳)有限公司 视频剪辑方法、装置、终端及存储介质
US10986308B2 (en) * 2019-03-20 2021-04-20 Adobe Inc. Intelligent video reframing
CN110189378B (zh) * 2019-05-23 2022-03-04 北京奇艺世纪科技有限公司 一种视频处理方法、装置及电子设备
CN110611787B (zh) * 2019-06-10 2021-05-28 海信视像科技股份有限公司 一种显示器及图像处理方法
CN110347877B (zh) * 2019-06-27 2022-02-11 北京奇艺世纪科技有限公司 一种视频处理方法、装置、电子设备及存储介质
CN110414399B (zh) * 2019-07-22 2020-09-04 北京三快在线科技有限公司 信号灯的检测方法、装置及智能驾驶设备
CN110602527B (zh) 2019-09-12 2022-04-08 北京小米移动软件有限公司 视频处理方法、装置及存储介质
US11227179B2 (en) * 2019-09-27 2022-01-18 Intel Corporation Video tracking with deep Siamese networks and Bayesian optimization
US11941816B2 (en) * 2020-01-22 2024-03-26 Gracenote, Inc. Automated cropping of images using a machine learning predictor
US11145065B2 (en) * 2020-01-22 2021-10-12 Gracenote, Inc. Selection of video frames using a machine learning predictor
US11080549B1 (en) * 2020-01-22 2021-08-03 Gracenote, Inc. Automated cropping of images using a machine learning predictor
US11184558B1 (en) * 2020-06-12 2021-11-23 Adobe Inc. System for automatic video reframing
CN112307925B (zh) * 2020-10-23 2023-11-28 腾讯科技(深圳)有限公司 图像检测方法、图像显示方法、相关设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190348077A1 (en) * 2002-05-09 2019-11-14 Gvbb Holdings S.A.R.L. Systems, methods, and computer program products for automated real-time execution of live inserts of repurposed stored content distribution
JP2005229578A (ja) * 2004-01-14 2005-08-25 Matsushita Electric Ind Co Ltd 映像信号表示装置
US20090251594A1 (en) * 2008-04-02 2009-10-08 Microsoft Corporation Video retargeting
WO2009141955A1 (ja) * 2008-05-21 2009-11-26 パナソニック株式会社 撮像装置、撮像方法及び集積回路
US20130050547A1 (en) * 2011-08-25 2013-02-28 Altasens, Inc. Programmable data readout for an optical sensor
US20130050574A1 (en) * 2011-08-29 2013-02-28 Futurewei Technologies Inc. System and Method for Retargeting Video Sequences
US20170249719A1 (en) * 2016-02-26 2017-08-31 Netflix, Inc. Dynamically cropping digital content for display in any aspect ratio
JP2019149785A (ja) * 2018-02-28 2019-09-05 日本放送協会 映像変換装置及びプログラム
CN110062279A (zh) * 2019-04-22 2019-07-26 努比亚技术有限公司 视频裁剪方法、可穿戴设备以及计算机可读存储介质
CN110149532A (zh) * 2019-06-24 2019-08-20 北京奇艺世纪科技有限公司 一种封面选取方法及相关设备

Also Published As

Publication number Publication date
KR102301447B1 (ko) 2021-09-14
EP3879530A1 (en) 2021-09-15
JP7062036B2 (ja) 2022-05-02
CN111356016B (zh) 2022-04-22
CN111356016A (zh) 2020-06-30
US20210287009A1 (en) 2021-09-16
US11488383B2 (en) 2022-11-01

Similar Documents

Publication Publication Date Title
JP7062036B2 (ja) ビデオ処理方法、ビデオ処理装置および記憶媒体
WO2020224457A1 (zh) 图像处理方法及装置、电子设备和存储介质
TWI740309B (zh) 圖像處理方法及裝置、電子設備和電腦可讀儲存介質
TWI747325B (zh) 目標對象匹配方法及目標對象匹配裝置、電子設備和電腦可讀儲存媒介
CN107492115B (zh) 目标对象的检测方法及装置
EP3136391B1 (en) Method, device and terminal device for video effect processing
WO2020133966A1 (zh) 锚点确定方法及装置、电子设备和存储介质
TWI736179B (zh) 圖像處理方法、電子設備和電腦可讀儲存介質
JP6211715B2 (ja) ビデオのブラウジング方法、その装置、プログラム及び記録媒体
TW202131281A (zh) 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒介
WO2020007241A1 (zh) 图像处理方法和装置、电子设备以及计算机可读存储介质
US20160232426A1 (en) Method and apparatus for generating image filter
TW202105202A (zh) 影片處理方法及裝置、電子設備、儲存媒體和電腦程式
EP3040912A1 (en) Method and device for classifying pictures
US20220222831A1 (en) Method for processing images and electronic device therefor
WO2015196715A1 (zh) 图像重定位方法、装置及终端
WO2023160617A1 (zh) 视频插帧处理方法、视频插帧处理装置和可读存储介质
WO2023134583A1 (zh) 视频录制方法、装置及电子设备
CN112508773A (zh) 图像处理方法及装置、电子设备、存储介质
JP2021168463A (ja) 全方位視差ビューの合成方法、装置および記憶媒体
KR20140089829A (ko) 전자 장치에서 움직이는 사진 제어 장치 및 방법
WO2021189927A1 (zh) 图像处理方法、装置、电子设备及存储介质
EP3799415A2 (en) Method and device for processing videos, and medium
CN104813342B (zh) 内容感知的改变视频大小
CN116092147A (zh) 视频处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220419

R150 Certificate of patent or registration of utility model

Ref document number: 7062036

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150