JP2021519051A - ビデオ修復方法および装置、電子機器、ならびに記憶媒体 - Google Patents

ビデオ修復方法および装置、電子機器、ならびに記憶媒体 Download PDF

Info

Publication number
JP2021519051A
JP2021519051A JP2021506038A JP2021506038A JP2021519051A JP 2021519051 A JP2021519051 A JP 2021519051A JP 2021506038 A JP2021506038 A JP 2021506038A JP 2021506038 A JP2021506038 A JP 2021506038A JP 2021519051 A JP2021519051 A JP 2021519051A
Authority
JP
Japan
Prior art keywords
optical flow
image
reverse
optimization
optimized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021506038A
Other languages
English (en)
Other versions
JP7125541B2 (ja
Inventor
ルイ シュウ,
ルイ シュウ,
シャオシャオ リ,
シャオシャオ リ,
ボレイ ツォウ,
ボレイ ツォウ,
チェンチャン ロイ,
チェンチャン ロイ,
Original Assignee
ベイジン センスタイム テクノロジー デベロップメント カンパニー リミテッド
ベイジン センスタイム テクノロジー デベロップメント カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベイジン センスタイム テクノロジー デベロップメント カンパニー リミテッド, ベイジン センスタイム テクノロジー デベロップメント カンパニー リミテッド filed Critical ベイジン センスタイム テクノロジー デベロップメント カンパニー リミテッド
Publication of JP2021519051A publication Critical patent/JP2021519051A/ja
Application granted granted Critical
Publication of JP7125541B2 publication Critical patent/JP7125541B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • H04N7/0137Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes dependent on presence/absence of motion, e.g. of motion zones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)
  • Picture Signal Circuits (AREA)
  • Television Systems (AREA)

Abstract

本開示は、連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得するステップ(S100)と、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い(S200)、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることと、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々がいずれも修復の要求を満たすまで実行するステップ(S300)と、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得るステップ(S400)と、を含むビデオ修復方法および装置、電子機器、ならびに記憶媒体に関する。【選択図】図1

Description

関連出願の相互参照
本開示は、2019年1月31日に中国特許局に提出された、出願番号201910099762.4、出願の名称「ビデオ修復方法および装置、電子機器、ならびに記憶媒体」の中国特許出願の優先権を主張し、その開示の全てが参照によって本開示に組み込まれる。
本開示は、ビデオ修復の分野に関し、特にビデオ修復方法および装置、電子機器、ならびに記憶媒体に関する。
画像修復は従来から、コンピュータビジョンにおける重量な課題であり、例えば、画像修復によって画像透かしの除去や画像補修等の目的が実現できるように、多くの分野で重要な適用を有する。ビデオ修復は、画像修復のビデオへの拡大適用として、単純な画像修復の課題に比べて、その実現がはるかに困難である。しかしながら、インターネットの発展に伴い、ビデオ修復アルゴリズムは、例えばビデオ透かしの除去やビデオの何らかの部分の除去等、より広範な用途展開の可能性が高くなる。
本開示の実施例は、ビデオ修復の解決手段を提供する。
本開示の第1の態様によれば、連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得することと、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることと、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々がいずれも修復の要求を満たすまで実行することと、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得ることと、を含むビデオ修復方法を提供する。
いくつかの可能な実施形態では、連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得することは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの順方向順序に従って、隣接画像間の順方向オプティカルフローを決定し、前記複数フレームの画像の時間フレームの逆方向順序に従って、隣接画像間の逆方向オプティカルフローを決定することと、i番目の画像とi+1番目の画像との間の順方向オプティカルフローにi+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得て、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得て、iは1以上且つG未満の正整数で、Gは複数フレームの画像の画像数であることと、を含む。
いくつかの可能な実施形態では、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行うことは、前記第1の順方向オプティカルフローを連結して第1の連結オプティカルフローを得て、前記第1の逆方向オプティカルフローを連結して第2の連結オプティカルフローを得ることと、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行い、前記第1の連結オプティカルフローに対応する第1の最適化オプティカルフロー、および第2の連結オプティカルフローに対応する第2の最適化オプティカルフローを得て、Nは1以上の正整数であることと、前記第1の最適化オプティカルフローに基づいて各第1の順方向オプティカルフローに対応する第2の順方向オプティカルフローを得て、前記第2の最適化オプティカルフローに基づいて各第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることと、を含む。
いくつかの可能な実施形態では、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行うことは、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対して1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第1の最適化サブオプティカルフローを得ることと、前記第1の連結オプティカルフローおよび前記第2の連結オプティカルフローの第iの最適化サブオプティカルフローに対してそれぞれi+1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフローを得て、iは1より大きく且つNより小さい正整数であることとを含み、N回目の最適化処理により得られた前記第1の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第1の最適化オプティカルフローとして決定し、得られた前記第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第2の最適化オプティカルフローとして決定し、ここで、各回のオプティカルフロー最適化処理は残差処理およびアップサンプリング処理を含む。
いくつかの可能な実施形態では、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行うことは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて1番目の画像以外の画像の第1の修復画像を得ることと、得られた前記第1の修復画像に基づいて対応画像のマスク画像を調整し、第1の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することと、を含む。
いくつかの可能な実施形態では、前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて各画像の第1の修復画像を得ることは、前記複数フレームの画像の時間フレームの順方向順序に従って、1番目の第2の順方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第1の修復画像を得ることと、k番目の画像と前記k番目の画像の修復画像との加算処理を行い、k番目の画像の第1の加算画像を得、k番目の第2の順方向オプティカルフローで前記k番目の第1の加算画像に対してシフト処理を行い、k+1番目の画像の第1の修復画像を得て、kは1より大きく且つGより小さい正整数で、Gは複数フレームの画像の画像数を表すことと、を含む。
いくつかの可能な実施形態では、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることと、得られた前記第2の修復画像に基づいて対応画像のマスク画像を調整し、第2の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することと、を含む。
いくつかの可能な実施形態では、前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることは、前記複数フレームの画像の時間フレームの逆方向順序に従って、1番目の第2の逆方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第2の修復画像を得ることと、h番目の画像と前記h番目の画像の修復画像との加算処理を行い、h番目の画像の第2の加算画像を得、h番目の第2の逆方向オプティカルフローで前記h番目の第2の加算画像に対してシフト処理を行い、h+1番目の画像の第2の修復画像を得て、hは1より大きく且つG以下の正整数であり、Gは複数フレームの画像の画像数を表すことと、を含む。
いくつかの可能な実施形態では、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得ることは、複数フレームの画像の時間フレームの順方向順序に従って、前記順方向の伝播最適化により得られた第1の最適化画像を得ることと、複数フレームの画像の時間フレームの順方向順序に従って、前記逆方向の伝播最適化により得られた第2の最適化画像を得ることと、各画像の第1の最適化画像と第2の最適化画像の平均値に基づいて該画像の修復画像を得て、前記複数フレームの画像の各々の修復画像を得ることと、を含む。
いくつかの可能な実施形態では、前記方法は、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることを、オプティカルフロー最適化モジュールによって実行することを含み、前記方法は、前記オプティカルフロー最適化モジュールをトレーニングすることをさらに含み、前記トレーニングは、複数群のオプティカルフローサンプル、および各オプティカルフローサンプルに対応するマスクサンプルと実際のオプティカルフローを含むトレーニングサンプルを取得することと、前記オプティカルフロー最適化モジュールを用いて前記オプティカルフローサンプルに対してオプティカルフロー最適化処理を行い、対応する最適化オプティカルフローを得ることと、前記最適化オプティカルフローと前記実際のオプティカルフローとの比較結果に基づいて、前記最適化オプティカルフローから第1の要求を満たす第1の画素点を選択し、前記第1の画素点のマスク画像におけるマスク値を調整して新しいマスクサンプルを得ることと、予め設定された損失関数に従って、前記最適化オプティカルフロー、元のマスクサンプルおよび新しいマスクサンプルに基づいて損失値を得ることと、前記損失値がトレーニングの要求を満たす場合、トレーニングが完了したオプティカルフロー最適化モジュールを得て、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、前記オプティカルフロー最適化モジュールのネットワークパラメータを調整し、オプティカルフローサンプルのオプティカルフロー最適化処理を再実行することと、を含む。
いくつかの可能な実施形態では、前記予め設定された損失関数の表現式は以下のとおりである。
Figure 2021519051
式中、Lはオプティカルフロー最適化処理の損失関数を表し、Mは元のマスクサンプルであり、
Figure 2021519051
は新しいマスクサンプルを表し、
Figure 2021519051
は得られた最適化オプティカルフローを表し、
Figure 2021519051
は実際のオプティカルフローを表し、
Figure 2021519051
は重み値である。
本開示の第2の態様によれば、連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得するための取得モジュールと、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得るためのオプティカルフロー最適化モジュールと、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々がいずれも修復の要求を満たすまで実行するための伝播最適化モジュールと、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得るための修復モジュールと、を含むビデオ修復装置を提供する。
いくつかの可能な実施形態では、前記取得モジュールはさらに、前記複数フレームの画像の各々のマスク画像を取得し、また前記複数フレームの画像の時間フレームの順方向順序に従って、隣接画像間の順方向オプティカルフローを決定し、前記複数フレームの画像の時間フレームの逆方向順序に従って、隣接画像間の逆方向オプティカルフローを決定することと、i番目の画像とi+1番目の画像との間の順方向オプティカルフローにi+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得て、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得て、前記マスク画像は対応画像の修復対象領域を表し、iは1以上且つG未満の正整数で、Gは複数フレームの画像の画像数であることと、に用いられる。
いくつかの可能な実施形態では、前記オプティカルフロー最適化モジュールはさらに、前記第1の順方向オプティカルフローを連結して第1の連結オプティカルフローを得て、前記第1の逆方向オプティカルフローを連結して第2の連結オプティカルフローを得ることと、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行い、前記第1の連結オプティカルフローに対応する第1の最適化オプティカルフロー、および第2の連結オプティカルフローに対応する第2の最適化オプティカルフローを得て、Nは1以上の正整数であるステップと、前記第1の最適化オプティカルフローに基づいて各第1の順方向オプティカルフローに対応する第2の順方向オプティカルフローを得て、前記第2の最適化オプティカルフローに基づいて各第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることと、に用いられる。
いくつかの可能な実施形態では、前記オプティカルフロー最適化モジュールはさらに、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対して1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第1の最適化サブオプティカルフローを得ることと、前記第1の連結オプティカルフローおよび前記第2の連結オプティカルフローの第iの最適化サブオプティカルフローに対してそれぞれi+1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフローを得て、iは1より大きく且つNより小さい正整数であることとに用いられ、N回目の最適化処理により得られた前記第1の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第1の最適化オプティカルフローとして決定し、得られた前記第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第2の最適化オプティカルフローとして決定し、ここで、各回のオプティカルフロー最適化処理は残差処理およびアップサンプリング処理を含む。
いくつかの可能な実施形態では、前記伝播最適化モジュールは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて1番目の画像以外の画像の第1の修復画像を得ることと、得られた前記第1の修復画像に基づいて対応画像のマスク画像を調整し、第1の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することと、に用いられる第1の伝播最適化ユニットを含む。
いくつかの可能な実施形態では、前記第1の伝播最適化ユニットはさらに、前記複数フレームの画像の時間フレームの順方向順序に従って、1番目の第2の順方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第1の修復画像を得ることと、k番目の画像と前記k番目の画像の修復画像との加算処理を行い、k番目の画像の第1の加算画像を得、k番目の第2の順方向オプティカルフローで前記k番目の第1の加算画像に対してシフト処理を行い、k+1番目の画像の第1の修復画像を得て、kは1より大きく且つGより小さい正整数で、Gは複数フレームの画像の画像数を表すことと、に用いられる。
いくつかの可能な実施形態では、前記伝播最適化モジュールは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることと、得られた前記第2の修復画像に基づいて対応画像のマスク画像を調整し、第2の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することと、に用いられる第2の伝播最適化ユニットをさらに含む。
いくつかの可能な実施形態では、前記第2の伝播最適化ユニットはさらに、前記複数フレームの画像の時間フレームの逆方向順序に従って、1番目の第2の逆方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第2の修復画像を得ることと、h番目の画像と前記h番目の画像の修復画像との加算処理を行い、h番目の画像の第2の加算画像を得、h番目の第2の逆方向オプティカルフローで前記h番目の第2の加算画像に対してシフト処理を行い、h+1番目の画像の第2の修復画像を得て、hは1より大きく且つG以下の正整数であり、Gは複数フレームの画像の画像数を表すことと、に用いられる。
いくつかの可能な実施形態では、前記修復モジュールはさらに、複数フレームの画像の時間フレームの順方向順序に従って、前記順方向の伝播最適化により得られた第1の最適化画像を得ることと、複数フレームの画像の時間フレームの順方向順序に従って、前記逆方向の伝播最適化により得られた第2の最適化画像を得ることと、各画像の第1の最適化画像と第2の最適化画像の平均値に基づいて該画像の修復画像を得て、前記複数フレームの画像の各々の修復画像を得ることと、に用いられる。
いくつかの可能な実施形態では、前記オプティカルフロー最適化モジュールをトレーニングするためのトレーニングモジュールをさらに含み、前記トレーニングモジュールは、前記オプティカルフロー最適化モジュールに、複数群のオプティカルフローサンプル、および各オプティカルフローサンプルに対応するマスクサンプルと実際のオプティカルフローを含むトレーニングサンプルを入力することと、前記オプティカルフロー最適化モジュールを用いて前記オプティカルフローサンプルに対してオプティカルフロー最適化処理を行い、対応する最適化オプティカルフローを得ることと、前記最適化オプティカルフローと前記実際のオプティカルフローとの比較結果に基づいて、前記最適化オプティカルフローから第1の要求を満たす第1の画素点を選択し、前記第1の画素点のマスク画像におけるマスク値を調整して新しいマスクサンプルを得ることと、予め設定された損失関数に従って、前記最適化オプティカルフロー、元のマスクサンプルおよび新しいマスクサンプルに基づいて損失値を得ることと、前記損失値がトレーニングの要求を満たす場合、トレーニングが完了したオプティカルフロー最適化モジュールを得て、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、前記オプティカルフロー最適化モジュールのネットワークパラメータを調整し、オプティカルフローサンプルのオプティカルフロー最適化処理を再実行することと、に用いられる。
いくつかの可能な実施形態では、前記予め設定された損失関数の表現式は以下のとおりである。
Figure 2021519051
式中、Lはオプティカルフロー最適化処理の損失関数を表し、Mは元のマスクサンプルであり、
Figure 2021519051
は新しいマスクサンプルを表し、
Figure 2021519051
は得られた最適化オプティカルフローを表し、
Figure 2021519051
は実際のオプティカルフローを表し、
Figure 2021519051
は重み値である。
本開示の第3の態様によれば、プロセッサと、プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、前記プロセッサは、第1の態様のいずれか一項に記載の方法を実行するように構成される電子機器を提供する。
本開示の第4の態様によれば、コンピュータプログラム命令が記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラム命令は、プロセッサに実行されると第1の態様のいずれか一項に記載の方法を実現させることを特徴とするコンピュータ可読記憶媒体を提供する。
本開示の第5の態様によれば、コンピュータ可読コードを含むコンピュータプログラムであって、前記コンピュータ可読コードは、電子機器で実行されると、前記電子機器のプロセッサに第1の態様のいずれか一項に記載の方法を実現するための命令を実行させるコンピュータプログラムを提供する。
本開示の実施例は、同時に複数の連続時間フレームのビデオ画像に対して修復処理を行うことができ、ここで、まず隣接するフレームの画像間の順方向オプティカルフローおよび逆方向オプティカルフローを最適化し、修復後の精度の高いオプティカルフローを取得し、その後、最適化された順方向オプティカルフローおよび逆方向オプティカルフローによってビデオ修復をガイドし、ビデオ画像の修正を完了することができる。このプロセスは、ビデオ修復の正確度を高めるとともに、フレーム間の連続性および整合性を高めることができる。また、本開示の実施例は修復速度が速く、修復のリアルタイム性が満たされる。
以上の一般説明と以下の詳細説明は解釈するための例示的なものに過ぎず、本開示を制限しないことを理解すべきである。
以下の図面と関連付けられた例示的な実施例に対する詳細な説明によれば、本開示の他の特徴および態様は明確になる。
ここの図面は明細書に組み込まれて明細書の一部を構成し、これらの図面は本開示に合致する実施例を示し、明細書と共に本開示の技術的手段を説明するために用いられる。
本開示の実施例に係るビデオ修復方法のフローチャートを示す。 本開示の実施例に係るビデオ修復方法におけるステップS100のフローチャートを示す。 本開示の実施例に係るビデオ修復方法におけるステップS200のフローチャートを示す。 本開示の実施例に係るオプティカルフロー最適化ネットワークの構成図を示す。 本開示の実施例に係るビデオ修復方法におけるステップS300のフローチャートを示す。 本開示の実施例に係るビデオ修復方法におけるステップS302のフローチャートを示す。 本開示の実施例に係るビデオ修復方法におけるステップS300のフローチャートを示す。 本開示の実施例に係るビデオ修復方法におけるステップS3002のフローチャートを示す。 本開示の実施例に係るビデオ修復方法におけるステップS400のフローチャートを示す。 本開示の実施例に係るオプティカルフロー最適化モジュールのトレーニング方法のフローチャートを示す。 本開示の実施例に係るビデオ修復装置のブロック図を示す。 本開示の実施例に係る電子機器800のブロック図を示す。 本開示の実施例に係る電子機器1900のブロック図を示す。
以下に図面を参照しながら本開示の様々な例示的実施例、特徴および態様を詳細に説明する。図面における同じ符号は同じまたは類似する機能の要素を表す。図面において実施例の様々な態様を示したが、特に断らない限り、比例に従って図面を作る必要がない。ここの用語「例示的」とは、「例、実施例として用いられることまたは説明的なもの」を意味する。ここで「例示的」に説明したいかなる実施例も他の実施例より優れたものと理解すべきではない。
本明細書の用語の「および/または」は、関連対象の関連関係を記述するためのものに過ぎず、3種の関係が存在可能であることを示し、例えば、Aおよび/またはBは、Aが単独して存在し、AとBが同時に存在し、Bが単独して存在するという3種の場合を示すことができる。また、本明細書の用語の「少なくとも1種」は多種のうちのいずれか1種または多種のうちの少なくとも2種の任意の組合を示し、例えば、A、B、Cのうちの少なくとも1種を含むということは、A、BおよびCから構成される集合から選択されるいずれか1つまたは複数の要素を含むことを示すことができる。
また、本開示をより効果的に説明するために、以下の具体的な実施形態において様々な具体的詳細を示す。当業者であれば、何らかの具体的詳細がなくなるにも関わらず、本開示は同様に実施できるということを理解すべきである。いくつかの実施例では、本開示の趣旨を強調するよう、当業者に既知の方法、手段、要素および回路に対する詳細な説明を省略する。
図1は本開示の実施例に係るビデオ修復方法のフローチャートを示し、本開示の実施例のビデオ修復方法はビデオ画像の修復に用いることができ、また本開示の実施例は、連続したビデオフレームの修復の整合性を保証でき、且つ修復精度が高く、効率が高い。
本開示の実施例は、例えば携帯電話、カメラ、ノートパソコン、PAD、クラウドサーバ等任意の端末機器やサーバ機器であり得る画像処理機器、またはビデオ収集機器に適用でき、画像処理の機能を有するものまたはビデオ情報を収集できるものであれば、本開示の実施例のビデオ修復方法を適用することができる。以下、本開示の実施例を詳細に説明する。
図1に示すように、本開示の実施例のビデオ修復方法は、連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得するステップS100と、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得るステップS200と、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々がいずれも修復の要求を満たすまで実行するステップS300と、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得るステップS400と、を含んでもよい。
本開示の実施例では、例えば深層学習ニューラルネットワークによってビデオ画像の修復を実現するように、構築されたニューラルネットワークによってビデオ修復のプロセスを実行してもよいが、これについて本開示は具体的に限定せず、本開示の実施例では、本開示の実施例により限定される機能とマッチするアルゴリズムによってビデオ修復のプロセスを実行してもよい。
ステップS100の前に、まず修復対象のビデオ画像を取得し、連続したビデオフレーム画像(すなわち、上記連続した複数フレームの画像)を取得するようにしてもよく、ここで、本開示の実施例では、設定数の連続時間フレームの画像、例えば5フレームの画像を取得してもよく、または、他の実施例では、設定数は他の数値であってもよく、異なるニーズや状況に応じて当業者により自ら設定することができる。
連続した複数フレームの画像を取得した後、該複数フレームの画像に対して修復処理を行うことができる。まずステップS100では、隣接画像間のオプティカルフローを取得してもよく、ここで、隣接画像とは隣接する2フレームの画像を意味する。時間フレームが時系列的なものであるため、本開示の実施例では、時間の順方向および逆方向の2つの方向から画像を処理して、ビデオの修復を実現するようにしてもよい。
また、オプティカルフロー(optical flow)は動画像間の変化を表すために用いることができ、時変画像におけるパターンの動き速度を指す。対象物体が動いている場合、画像におけるその対応点の輝度パターンも動いているため、オプティカルフローは画像間の変化を表すために用いることができ、また、オプティカルフローには対象の動き情報が含まれるため、対象の動き状況を特定するために観察者によって使用され得る。
相応して、本開示の実施例では、ステップS100において、例えば時間フレームの順方向順序に従って、2つの隣接画像間の第1の順方向オプティカルフローを取得し、および時間フレームの逆方向順序に従って、2つの隣接画像間の第1の順方向オプティカルフローを取得するように、隣接する2つの画像間毎にオプティカルフローを取得するようにしてもよい。ここで、本開示の実施例における複数フレームの画像を
Figure 2021519051
と仮定し、すなわち、例えば5または他の数値であってもよいGフレームの画像が含まれ得る。第1の順方向オプティカルフロー
Figure 2021519051
は時間フレームの順方向順序に従って取得でき、ここで、
Figure 2021519051
は画像
Figure 2021519051
から画像
Figure 2021519051
への第1の順方向オプティカルフローを表し、iは1以上且つG未満の任意の整数である。また、第1の逆方向オプティカルフロー
Figure 2021519051
は時間フレームの逆方向順序に従って取得でき、ここで、
Figure 2021519051
は画像
Figure 2021519051
から画像
Figure 2021519051
への第1の逆方向オプティカルフローを表し、jは1以上且つG未満の整数である。
ここで、本開示の実施例では、例えばFlowNet 2.0であり得るオプティカルフロー推定モデルを用いて、画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得してもよく、本開示の他の実施例では、他の方法で画像間のオプティカルフローを取得してもよく、これについて本開示は具体的に限定しない。
また、オプティカルフロー最適化の正確度を高めるために、本開示の実施例では、マスク画像を併用して画像間のオプティカルフローを処理し、第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得するようにしてもよい。図2は、本開示の実施例に係るビデオ修復方法におけるステップS100のフローチャートを示す。ここで、連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得することは、以下を含んでもよい。
S101では、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得する。
本開示の実施例では、取得された複数フレームの画像のうちのいずれも、対応するマスク画像を有してもよく、該マスク画像は人為的に定められてもよい。例えば、各画像内の修復すべき領域に応じて対応するマスク画像を作成してもよく、ここで、マスク画像のスケールは対応画像のスケールと同じであり、且つマスク画像における画素点は対応画像の画素点と一対一対応になっている。本開示の実施例では、修復対象領域内の画素点の、マスク画像におけるマスクを1として定義し、他の修復対象外の領域の画素点の、マスク画像におけるマスクを0として定義するようにしてもよく、または、修復対象領域内の画素点の、マスク画像におけるマスクを0として定義し、他の修復対象外の領域の画素点の、マスク画像におけるマスクを1として定義するようにしてもよく、マスクは異なるニーズに応じて当業者により設定されてもよく、これについて本開示は具体的に限定しない。
S102では、前記複数フレームの画像の時間フレームの順方向順序に従って、隣接画像間の順方向オプティカルフローを決定し、前記複数フレームの画像の時間フレームの逆方向順序に従って、隣接画像間の逆方向オプティカルフローを決定する。
このプロセスは、上記実施例に説明されたオプティカルフローを決定するプロセスと同じであり、例えば、オプティカルフロー推定モデルによって複数フレームの画像から隣接画像間の順方向オプティカルフローおよび逆方向オプティカルフローを取得するようにしてもよく、ここで、このプロセスの詳細について再度説明しない。
ここで、説明すべきものとして、ステップS101とステップS102の順序について、本開示の実施例は具体的に限定せず、ステップS101はステップS102の前に実行してもよく、ステップS102の後に実行してもよく、ステップS101とステップS102を同時に実行してもよい。ステップS103を実行する前に、各画像のマスク画像、および任意の2つの隣接画像間の順方向オプティカルフローと逆方向オプティカルフローが特定されていたならば、本開示の実施例となり得る。
S103では、i番目の画像とi+1番目の画像との間の順方向オプティカルフローにi+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得て、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得て、ここで、iは1以上且つG未満の正整数で、Gは複数フレームの画像の画像数である。
すなわち、本開示の実施例では、順方向オプティカルフローに、対応するマスク画像を乗算し、順方向オプティカルフローのうち、最適化が必要なオプティカルフロー領域を特定し、対応する第1の順方向オプティカルフローを得るようにしてもよい。同様に、逆方向オプティカルフローに、対応するマスク画像を乗算し、逆方向オプティカルフローのうち、最適化が必要なオプティカルフロー領域を特定し、対応する第1の逆方向オプティカルフローを得るようにしてもよい。
上記実施例で説明したように、複数フレームの画像を
Figure 2021519051
とし、得られた隣接画像間の順方向オプティカルフローを
Figure 2021519051
とし、画像間の逆方向オプティカルフローを
Figure 2021519051
とするようにしてもよい。ここで、各画像のマスク画像は
Figure 2021519051
と表されてもよく、
Figure 2021519051
はk番目の画像
Figure 2021519051
のマスク画像を表し、kは1以上且つG以下の整数である。
相応して、本開示の実施例では、1番目の画像
Figure 2021519051
と2番目の画像
Figure 2021519051
との間の順方向オプティカルフローを得た後、例えば対応要素を乗算するように、該順方向オプティカルフローに2番目の画像
Figure 2021519051
のマスク画像
Figure 2021519051
を乗算し、1番目の画像
Figure 2021519051
と2番目の画像
Figure 2021519051
との間の第1の順方向オプティカルフローを得るようにしてもよい。同様に、2番目の画像
Figure 2021519051
と3番目の画像
Figure 2021519051
との間の順方向オプティカルフローを得て、そして例えば対応要素を乗算するように、該順方向オプティカルフローに3番目の画像
Figure 2021519051
のマスク画像
Figure 2021519051
を乗算し、2番目の画像
Figure 2021519051
と3番目の画像
Figure 2021519051
との間の第1の順方向オプティカルフローを得るようにしてもよい。同様に、例えば対応要素を乗算するように、i番目の画像とi+1番目の画像との間の順方向オプティカルフローに、i+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得るようにしてもよい。上記のようにして、隣接画像間の第1の順方向
オプティカルフロー
Figure 2021519051
を得ることができる。
また、同様に、本開示の実施例では、最後の画像
Figure 2021519051
と最後から2番目の画像
Figure 2021519051
との間の逆方向オプティカルフローを得た後、例えば対応要素を乗算するように、該逆方向オプティカルフローに該最後から2番目の画像
Figure 2021519051
のマスク画像
Figure 2021519051
を乗算し、最後の画像
Figure 2021519051
と最後から2番目の画像
Figure 2021519051
との間の第1の逆方向オプティカルフローを得るようにしてもよい。同様に、最後から2番目の画像
Figure 2021519051
と最後から3番目の画像
Figure 2021519051
との間の逆方向オプティカルフローを得て、例えば対応要素を乗算するように、該逆方向オプティカルフローに最後から3番目の画像
Figure 2021519051
のマスク画像
Figure 2021519051
を乗算し、最後から2番目の画像
Figure 2021519051
と最後から3番目の画像
Figure 2021519051
との間の第1の逆方向オプティカルフローを得るようにしてもよい。同様に、例えば対応要素を乗算するように、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得るようにしてもよい。上記のようにして、隣接画像間の第1の逆方向オプティカルフロー
Figure 2021519051
を得ることができる。
本開示の実施例では、得られた順方向オプティカルフローおよび逆方向オプティカルフローに対応画像のマスク画像を乗算することで、対応する第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを得る。得られた第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローにはオプティカルフロー最適化が必要な領域が含まれ得るため、オプティカルフローの最適化精度を高めることができる。
画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを得た後、オプティカルフローに対して最適化処理、すなわちステップS200を実行してもよい。本開示の実施例では、第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれ最適化を行い、対応する第2の順方向オプティカルフローおよび第2の逆方向オプティカルフローを得るようにしてもよい。本開示の実施例のオプティカルフロー最適化プロセスは、少なくとも1つのオプティカルフロー最適化ネットワークモジュールを含み得るオプティカルフロー最適化ネットワークによって実現されてもよく、各オプティカルフロー最適化ネットワークモジュールは同じである。オプティカルフロー最適化の回数は、オプティカルフロー最適化ネットワークモジュールの数に応じて決定でき、オプティカルフロー最適化処理の回数について、本開示の実施例は具体的に限定せず、異なるニーズに応じて当業者により選択および設定することができる。以下、第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローの最適化プロセスをそれぞれ詳細に説明する。
図3は、本開示の実施例に係るビデオ修復方法におけるステップS200のフローチャートを示し、ここで、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行うことは、以下を含む。
S201では、前記第1の順方向オプティカルフローを連結して第1の連結オプティカルフローを得て、前記第1の逆方向オプティカルフローを連結して第2の連結オプティカルフローを得る。
本開示の実施例では、オプティカルフロー最適化を行う前に、まずは、例えば、それぞれ縦続するように、隣接画像間の第1の順方向オプティカルフローをそれぞれ連結する。ここで、深さ方向において第1の順方向オプティカルフローを連結し、多層の第1の順方向オプティカルフローからなる第1の連結オプティカルフローを形成する。同様に、例えば深さ方向において第1の逆方向オプティカルフローを連結するように、隣接画像間の第1の逆方向オプティカルフローをそれぞれ連結し、多層の第1の逆方向オプティカルフローからなる第2の連結オプティカルフローを形成するようにしてもよい。
S202では、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行い、前記第1の連結オプティカルフローに対応する第1の最適化オプティカルフロー、および第2の連結オプティカルフローに対応する第2の最適化オプティカルフローを得て、ここで、Nは1以上の正整数である。
第1の連結オプティカルフローおよび第2の連結オプティカルフローを得た後、第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行うようにしてもよく、上記実施例で説明したように、本開示の実施例では、オプティカルフロー最適化処理プロセスを少なくとも1回行ってもよい。例えば、本開示の実施例では、ニューラルネットワークから構成されてもよいオプティカルフロー最適化モジュールによって毎回のオプティカルフロー最適化処理を実行してもよく、または、対応するアルゴリズムで最適化の操作を実行してもよい。相応して、オプティカルフロー最適化処理をN回行う場合、N個の順次接続されるオプティカルフロー最適化ネットワークモジュールを含み、前のオプティカルフロー最適化ネットワークモジュールの出力を、次のオプティカルフロー最適化ネットワークモジュールの入力とし、最後のオプティカルフロー最適化ネットワークモジュールの出力を、第1の連結オプティカルフローおよび第2の連結オプティカルフローに対する最適化の結果とするようにしてもよい。
1つのオプティカルフロー最適化ネットワークモジュールを含む場合、該オプティカルフロー最適化ネットワークモジュールを用いて、第1の連結オプティカルフローに対して最適化処理を行って第1の連結オプティカルフローに対応する第1の最適化サブオプティカルフローを得て、オプティカルフロー最適化ネットワークモジュールによって第2の連結オプティカルフローに対して最適化処理を行い、第2の連結オプティカルフローに対応する第2の最適化サブオプティカルフローを得るようにしてもよい。ここで、オプティカルフロー最適化処理は、残差処理およびアップサンプリング処理を含んでもよく、すなわち、オプティカルフロー最適化ネットワークモジュールは、残差ユニットおよびアップサンプリングユニットをさらに含んでもよい。複数の畳込み層を含み得る残差ユニットによって、入力される第1の連結オプティカルフローや第2の連結オプティカルフローに対して残差処理を行う。各畳込み層に用いられる畳込みカーネルについて、本開示の実施例は具体的に限定せず、残差ユニットにより残差処理された第1の連結オプティカルフローのスケールは縮小、例えば入力される連結オプティカルフローのスケールの4分の1に縮小され、これについて本開示は具体的に限定せず、必要に応じて設定してもよい。残差処理を行った後、残差処理を経た第1の連結オプティカルフローや第2の連結オプティカルフローに対してアップサンプリング処理を行ってもよく、アップサンプリング処理により、出力される第1の最適化サブオプティカルフローのスケールを第1の連結オプティカルフローのスケールに調整し、および出力される第2の最適化サブオプティカルフローのスケールを第2の連結オプティカルフローのスケールに調整することができる。また、オプティカルフロー最適化のプロセスにより、複数のオプティカルフローの特徴を融合することができ、且つオプティカルフローの精度を高めることもできる。
別の実施例では、オプティカルフロー最適化モジュールは、複数のオプティカルフロー最適化ネットワークモジュール、例えばN個のオプティカルフロー最適化ネットワークモジュールを含んでもよい。そのうち、1番目のオプティカルフロー最適化ネットワークモジュールは、第1の連結オプティカルフローおよび第2の連結オプティカルフローを受信し、第1の連結オプティカルフローおよび第2の連結オプティカルフローの各々に対して、残差処理およびアップサンプリング処理が含まれる1回目のオプティカルフロー最適化処理を行うようにしてもよく、その具体的なプロセスは上記実施例と同じであり、ここでは説明を省略する。該1回目のオプティカルフロー最適化処理により、第1の連結オプティカルフローの第1の最適化サブオプティカルフロー、および第2の連結オプティカルフローの第1の最適化サブオプティカルフローを得ることができる。
さらに、該第1の連結サブオプティカルフローおよび第2の連結サブオプティカルフローを、残差処理を行う残差ユニットおよびアップサンプリング処理を行うアップサンプリングユニットが同様に含まれ得る2番目のオプティカルフロー最適化ネットワークモジュールに入力し、2回目のオプティカルフロー最適化処理を行う。2番目のオプティカルフロー最適化ネットワークモジュールにより、第1の連結サブオプティカルフローおよび第2の連結サブオプティカルフローのオプティカルフロー最適化処理を行ってもよく、その具体的なプロセスは上記実施例と同じであり、ここでは説明を省略する。該2回目のオプティカルフロー最適化処理により、第1の連結オプティカルフローの第2の最適化サブオプティカルフロー、および第2の連結オプティカルフローの第2の最適化サブオプティカルフローを得ることができる。
同様に、各オプティカルフロー最適化ネットワークモジュールを用いてそれぞれオプティカルフロー最適化プロセスを1回行ってもよく、すなわち、i+1番目のオプティカルフロー最適化ネットワークモジュールを用いて、前記第1の連結オプティカルフローおよび前記第2の連結オプティカルフローの第iの最適化サブオプティカルフローに対してi+1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフローを得るようにしてもよく、ここで、iは1より大きく且つNより小さい正整数である。最終的には、N番目のオプティカルフロー最適化ネットワークモジュールにより行われるN回目の最適化処理によって、第1の連結オプティカルフローの第Nの最適化サブオプティカルフロー、および第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを得ることができ、且つ得られた前記第1の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第1の最適化オプティカルフローとして決定し、得られた前記第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第2の最適化オプティカルフローとして決定することができる。本開示の実施例では、各オプティカルフロー最適化ネットワークモジュールにより実行されるオプティカルフロー最適化処理プロセスは、いずれも残差処理およびアップサンプリング処理を含んでもよく、すなわち、各オプティカルフロー最適化ネットワークモジュールは、同じオプティカルフロー最適化モジュールであってもよい。
例えば、図4は、本開示の実施例に係るオプティカルフロー最適化ネットワークの構成図を示し、その中に3つのオプティカルフロー最適化ネットワークモジュールA、BおよびCを含んでもよい。該3つのオプティカルフロー最適化ネットワークモジュールの各々は、残差ユニットおよびアップサンプリングユニットから構成されてもよい。ここで、1番目のオプティカルフロー最適化ネットワークモジュールAによって、第1の連結オプティカルフロー
Figure 2021519051
および第2の連結オプティカルフロー
Figure 2021519051
の1回目のオプティカルフロー最適化処理を行い、第1の連結オプティカルフローの第1の連結サブオプティカルフロー
Figure 2021519051
、および第2の連結オプティカルフローの第1の連結サブオプティカルフロー
Figure 2021519051
を得るようにしてもよい。該第1の連結サブオプティカルフロー
Figure 2021519051
および
Figure 2021519051
をそれぞれ2番目のオプティカルフロー最適化ネットワークモジュールBに入力し、2回目のオプティカルフロー最適化処理を行い、第1の連結オプティカルフローの第2の連結サブオプティカルフロー
Figure 2021519051
および第2の連結オプティカルフローの第2の連結サブオプティカルフロー
Figure 2021519051
を得る。さらに、第2の連結サブオプティカルフロー
Figure 2021519051
および
Figure 2021519051
をそれぞれ3番目のオプティカルフロー最適化ネットワークモジュールCに入力し、それぞれ3回目のオプティカルフロー最適化処理を行い、第1の連結オプティカルフローに対応する第3の最適化サブオプティカルフロー
Figure 2021519051
および第2の連結オプティカルフローに対応する第3の最適化サブオプティカルフロー
Figure 2021519051
を得る。この時、最終回のオプティカルフロー最適化処理で得られた第1の連結オプティカルフローの第3の最適化サブオプティカルフローを第1の最適化オプティカルフローとして決定し、最終回のオプティカルフロー最適化処理で得られた第2の連結オプティカルフローの第3の最適化サブオプティカルフローを第2の最適化オプティカルフローとして決定するようにしてもよい。
S203では、前記第1の最適化オプティカルフローに基づいて各第1の順方向オプティカルフローに対応する第2の順方向オプティカルフローを得て、前記第2の最適化オプティカルフローに基づいて各第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得る。
N回のオプティカルフロー最適化処理を経た後、得られた第1の最適化オプティカルフローのスケールは、第1の連結オプティカルフローのスケールと同じであり、深さ方向に従って該第1の最適化オプティカルフローを、それぞれ第1の順方向オプティカルフローの最適化結果に対応するG個の第2の順方向オプティカルフローに分割するようにしてもよい。同様に、N回のオプティカルフロー最適化処理を経た後、得られた第2の最適化オプティカルフローのスケールは第2の連結オプティカルフローのスケールと同じであり、深さ方向に従って該第2の最適化オプティカルフローを、それぞれ第1の逆方向オプティカルフローの最適化結果に対応するG個の第2の逆方向オプティカルフローに分割するようにしてもよい。
上記実施例によって、画像間の第1の順方向オプティカルフローを最適化した後の第2の順方向オプティカルフロー、および画像間の第1の逆方向オプティカルフローを最適化した後の第2の逆方向オプティカルフローを得ることができる。オプティカルフローを最適化することで、ビデオ修復の正確度を実現することができる。
最適化されたオプティカルフローを得た後、該最適化された第2の順方向オプティカルフローおよび第2の逆方向オプティカルフローを用いて、複数フレームの画像の順方向ガイドおよび逆方向ガイドをそれぞれ行い、最終的な修復画像を得るようにしてもよい。以下、順方向ガイドおよび逆方向ガイドのプロセスをそれぞれ説明する。
図5は、本開示の実施例に係るビデオ修復方法におけるステップS300のフローチャートを示し、ここで、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行うことは以下を含む。
S301では、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得する。
上述したように、本開示の実施例では、各画像はいずれも、対応画像内の修復すべき修復対象領域を表すためのマスク画像に対応するようにしてもよい。該領域内の画素点に対応するマスクを1とし、他の領域のマスクを0とするようにしてもよく、または、修復対象領域の画素点のマスクを0とし、他の領域の画素点のマスクを1とするようにしてもよい。これについて本開示は具体的に限定しない。
S302では、前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて1番目の画像以外の画像の第1の修復画像を得る。
本開示の実施例では、得られた第2の順方向オプティカルフローは、時間フレームの順方向順序で隣接する2つの画像間のオプティカルフロー、すなわち前の画像から次の画像へのオプティカルフローを表す。従って、得られた第2の順方向オプティカルフローに基づいて画像をガイドし、つまり、各画像の、対応する第2の順方向オプティカルフローのオプティカルフロー変化の条件下で得られた新しい画像を特定することができ、該新しい画像は次の画像の第1の修復画像となる。
図6は本開示の実施例に係るビデオ修復方法におけるステップS302のフローチャートを示し、本開示の実施例では、前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて各画像の第1の修復画像を得ることは、前記複数フレームの画像の時間フレームの順方向順序に従って、1番目の第2の順方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第1の修復画像を得るステップS3021と、k番目の画像と前記k番目の画像の修復画像との加算処理を行い、k番目の画像の第1の加算画像を得、k番目の第2の順方向オプティカルフローで前記k番目の第1の加算画像に対してシフト処理を行い、k+1番目の画像の第1の修復画像を得て、kは1より大きく且つGより小さい正整数で、Gは複数フレームの画像の画像数を表すステップS3022と、を含んでもよい。
ここで、時間フレームの順方向順序に従って第2の順方向オプティカルフローを
Figure 2021519051
として表してもよく、ここで、
Figure 2021519051
はi−1番目の画像
Figure 2021519051
とi番目の画像
Figure 2021519051
との間の第2の順方向オプティカルフローを表し、iは1より大きく且つG以下の整数である。相応して、第2の逆方向オプティカルフローを
Figure 2021519051
として表してもよく、ここで、
Figure 2021519051
はj+1番目の画像
Figure 2021519051
とj番目の画像
Figure 2021519051
との間の第2の逆方向オプティカルフローを表し、jは1以上且つG未満の整数である。
相応して、1番目の第2の順方向オプティカルフロー
Figure 2021519051
のオプティカルフロー変化に基づいて、1番目の画像
Figure 2021519051
に対してシフト処理を行い、2番目の画像
Figure 2021519051
の第1の修復画像となり得る新しい画像
Figure 2021519051
を得るようにしてもよい。その後、第2の画像
Figure 2021519051
およびその第1の修復画像
Figure 2021519051
に対して、例えば要素を対応して加算するように加算処理を行い、2番目の画像
Figure 2021519051
の第1の加算画像を得るようにしてもよい。該加算処理により、最適化された第2の順方向オプティカルフローによる第2の画像の修復対象領域の修復、例えば、対応する画素値の補完や画素値の調整等を実現することができる。
さらに、2番目の第2の順方向オプティカルフロー
Figure 2021519051
のオプティカルフロー変化によって、2番目の画像
Figure 2021519051
の第1の加算画像に対してシフト処理を行い、3番目の画像
Figure 2021519051
の第1の修復画像となり得る新しい画像
Figure 2021519051
を得るようにしてもよい。その後、3番目の画像
Figure 2021519051
およびその第1の修復画像
Figure 2021519051
に対して、例えば要素を対応して加算するように加算処理を行い、3番目の画像
Figure 2021519051
の第1の加算画像を得るようにしてもよい。該加算処理により、最適化された第2の順方向オプティカルフローによる3番目の画像の修復対象領域の修復、例えば、対応する画素値の補完や画素値の調整等を実現することができる。
同様に、k番目の第2の順方向オプティカルフロー
Figure 2021519051
のオプティカルフロー変化によって、k番目の画像
Figure 2021519051
の第1の加算画像に対してシフト処理を行い、k番目の画像
Figure 2021519051
の第1の修復画像となり得る新しい画像
Figure 2021519051
を得るようにしてもよい。その後、k番目の画像
Figure 2021519051
およびその第1の修復画像
Figure 2021519051
対して、例えば要素を対応して加算するように加算処理を行い、k+1番目の画像
Figure 2021519051
の第1の加算画像を得るようにしてもよい。該加算処理により、最適化された第2の順方向オプティカルフローによるk番目の画像の修復対象領域の修復、例えば、対応する画素値の補完や画素値の調整等を実現することができる。
上記実施例によれば、各画像の第1の修復画像を得ることができ、該第1の修復画像には一部の修復対象領域の画素値が補完(すなわち、修復)され得る。
S303では、得られた前記第1の修復画像に基づいて対応画像のマスク画像を調整し、第1の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断する。
上記実施例で説明したように、画像の第1の修復画像を得た後、k番目の画像の第1の修復画像内の修復対象領域のある画素点が修復され、すなわち、修復された画素値ができた場合、例えば元のマスク値が1であると0に調整し、その逆もまた同じであるように、該k番目の画像のマスク画像における対応する画素点のマスク値を逆転するようにしてもよい。
画像のマスク画像の調整を完了した後、得られた第1の修復画像に対して、各画像に対応するマスク画像には修復対象領域がなくなるまでステップS302を繰り返し実行してもよく、この時画像の順方向ガイドのプロセスが完了し、すなわち、各画像の第1の最適化画像が得られる。
図7は本開示の実施例に係るビデオ修復方法におけるステップS300のフローチャートを示し、ここで前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことは以下を含んでもよい。
S3001では、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得する。
該プロセスはステップS301と同じであり、ここで繰り返し説明しない。
S3002では、前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得る。
本開示の実施例では、得られた第2の逆方向オプティカルフローは、時間フレームの逆方向順序で隣接する2つの画像間のオプティカルフロー、すなわち次の画像から前の画像へのオプティカルフローを表す。従って、得られた第2の逆方向オプティカルフローに基づいて画像に対して逆方向ガイドを行い、つまり、各画像の、対応する第2の逆方向オプティカルフローのオプティカルフロー変化の条件下で得られた新しい画像を特定することができ、該新しい画像は次の画像の第1の修復画像となる。
図8は、本開示の実施例に係るビデオ修復方法におけるステップS3002のフローチャートを示し、本開示の実施例では、前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて各画像の第2の修復画像を得ることは、
前記複数フレームの画像の時間フレームの逆方向順序に従って、1番目の第2の逆方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第2の修復画像を得るステップS30021と、
h番目の画像と前記h番目の画像の修復画像との加算処理を行い、h番目の画像の第2の加算画像を得、h番目の第2の逆方向オプティカルフローで前記h番目の第2の加算画像に対してシフト処理を行い、h+1番目の画像の第2の修復画像を得て、hは1より大きく且つG以下の正整数であり、Gは複数フレームの画像の画像数を表すステップS30022と、を含んでもよい。
ここで、説明すべきものとして、本開示の実施例では、時間フレームの順方向順序に従って画像を
Figure 2021519051
として表し、相応して、時間フレームの逆方向順序に従って画像を
Figure 2021519051
として表すようにしてもよい。また、逆方向順序の1番目の画像を
Figure 2021519051
とし、相応して2番目の画像を
Figure 2021519051
とし、以降同様に、G番目の画像を
Figure 2021519051
とするようにしてもよい。
また、時間フレームの逆方向順序に従って第2の逆方向オプティカルフローを
Figure 2021519051
として表してもよく、ここで、
Figure 2021519051
はi−1番目の画像
Figure 2021519051
とi番目の画像
Figure 2021519051
との間の第2の順方向オプティカルフローを表し、iは1より大きく且つG以下の整数である。相応して、第2の逆方向オプティカルフローを
Figure 2021519051
として表してもよく、ここで
Figure 2021519051
はj+1番目の画像
Figure 2021519051
とj番目の画像
Figure 2021519051
との間の第2の逆方向オプティカルフローを表し、jは1以上且つG未満の整数である。
ステップS30021では、1番目の第2の逆方向オプティカルフロー
Figure 2021519051
のオプティカルフロー変化に基づいて、逆方向順序での1番目の画像
Figure 2021519051
に対してシフト処理を行い、逆方向順序での2番目の画像
Figure 2021519051
の第2の修復画像となり得る新しい画像
Figure 2021519051
を得るようにしてもよい。その後、逆方向順序の2番目の画像
Figure 2021519051
およびその第2の修復画像
Figure 2021519051
に対して、例えば要素を対応して加算するように加算処理を行い、2番目の画像
Figure 2021519051
の第2の加算画像を得るようにしてもよい。該加算処理により、最適化された第2の逆方向オプティカルフローによる最後から2番目の画像の修復対象領域の修復、例えば、対応する画素値の補完や画素値の調整等を実現することができる。
さらに、2番目の第2の逆方向オプティカルフロー
Figure 2021519051
のオプティカルフロー変化によって、逆方向順序の2番目の画像
Figure 2021519051
の第2の加算画像に対してシフト処理を行い、逆方向順序の3番目の画像
Figure 2021519051
の第2の修復画像となり得る新しい画像
Figure 2021519051
を得るようにしてもよい。その後、逆方向順序の3番目の画像
Figure 2021519051
およびその第1の修復画像
Figure 2021519051
に対して、例えば要素を対応して加算するように加算処理を行い、該逆方向順序の3番目の画像
Figure 2021519051
の第1の加算画像を得るようにしてもよい。該加算処理により、最適化された第2の逆方向オプティカルフローによる最後から3番目の画像の修復対象領域の修復、例えば、対応する画素値の補完や画素値の調整等を実現することができる。
同様に、h番目の第2の逆方向オプティカルフロー
Figure 2021519051
のオプティカルフロー変化によって、逆方向順序のh番目の画像
Figure 2021519051
の第2の加算画像に対してシフト処理を行い、逆方向順序のh+1番目の画像
Figure 2021519051
の第2の修復画像となり得る新しい画像
Figure 2021519051
を得るようにしてもよい。その後、逆方向順序のh+1番目の画像
Figure 2021519051
およびその第2の修復画像
Figure 2021519051
に対して、例えば要素を対応して加算するように加算処理を行い、逆方向順序のh+1番目の画像
Figure 2021519051
の第1の加算画像を得るようにしてもよい。該加算処理により、最適化された第2の逆方向オプティカルフローによる最後からh+1番目の画像の修復対象領域の修復、例えば、対応する画素値の補完や画素値の調整等を実現することができる。
上記実施例によれば、各画像の第2の修復画像を得ることができ、該第2の修復画像には一部の修復対象領域の画素値が補完(すなわち、修復)され得る。
S3003では、得られた前記第2の修復画像に基づいて対応画像のマスク画像を調整し、第2の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断する。
上記実施例で説明したように、画像の第2の修復画像を得た後、k番目の画像の第2の修復画像内の修復対象領域のある画素点が修復され、すなわち、修復された画素値ができた場合、例えば元のマスク値が1であると0に調整し、その逆もまた同じであるように、該k番目の画像のマスク画像における対応する画素点のマスク値を逆転するようにしてもよい。
画像のマスク画像の調整が完了した後、得られた第2の修復画像に対して、各画像に対応するマスク画像には修復対象領域がなくなるまでステップS3002を繰り返し実行してもよく、この時画像の逆方向ガイドのプロセスが完了し、すなわち各画像の第2の最適化画像が得られる。
複数フレームの画像の第1の最適化画像および第2の最適化画像を得た後、ステップS400を実行してもよい。図9は、本開示の実施例に係るビデオ修復方法におけるステップS400のフローチャートを示す。ここで、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得ることは、複数フレームの画像の時間フレームの順方向順序に従って、前記順方向の伝播最適化により得られた第1の最適化画像を得るステップS401と、複数フレームの画像の時間フレームの順方向順序に従って、前記逆方向の伝播最適化により得られた第2の最適化画像を得るステップS402と、各画像の第1の最適化画像と第2の最適化画像の平均値に基づいて該画像の修復画像を得て、前記複数フレームの画像の各々の修復画像を得るステップS403と、を含んでもよい。
上記実施例で説明したように、順方向ガイドが完了した時の画像の第1の修復画像を第1の最適化画像として使用し、および逆方向ガイドが完了した時の画像の第2の修復画像を第2の最適化画像として使用するようにしてもよい。
画像に対応する第1の最適化画像および第2の最適化画像を得た後、第1の最適化画像および第2の最適化画像に対して平均処理を行い、同じ画素点の画素値の平均値を取得し、最終的な修復画像を得るようにしてもよい。このようにして、順方向ガイドと逆方向ガイドの2つの方向で得られた最適化画像の結果を組み合わせて、正確度がより高い修復画像を得ることができる。また、本開示の実施例では、マスクの調整と、順方向ガイドおよび逆方向ガイドの繰り返し実行のプロセスにより、画像画素点の完全な修復が可能となる。
また、本開示の実施例は、オプティカルフロー最適化処理を行うオプティカルフロー最適化ネットワークのトレーニングプロセスも提供しており、ここで、上記実施例で説明したように、オプティカルフロー最適化ネットワークは、N個のオプティカルフロー最適化ネットワークモジュールを含んでもよく、本開示の実施例におけるオプティカルフロー最適化ネットワークモジュール、および対応するトレーニング方法は同じであってもよい。以下、1つのオプティカルフロー最適化ネットワークモジュールのトレーニングプロセスにより説明する。
図10は、本開示の実施例に係るオプティカルフロー最適化モジュールのトレーニング方法のフローチャートを示す。ここで、前記オプティカルフロー最適化モジュールにおける各オプティカルフロー最適化ネットワークモジュールをトレーニングするステップは以下を含んでもよい。
S501では、複数群のオプティカルフローサンプル、および各群のオプティカルフローサンプルに対応するマスクサンプルと実際のオプティカルフローを含むトレーニングサンプルを取得する。
本開示の実施例では、オプティカルフロー最適化ネットワークモジュールのトレーニングに使用されるトレーニングサンプルは複数群のオプティカルフローサンプルを含んでもよく、ここで、各群のオプティカルフローサンプルは、対応する複数フレームの画像サンプルのうちの隣接画像間の順方向オプティカルフローおよび/または逆方向オプティカルフローであり、また、トレーニングサンプルには各群のオプティカルフローサンプルに対応するマスクサンプルも含まれ、該マスクサンプルは上記画像サンプルに対応するマスク画像である。また、トレーニングサンプルには、オプティカルフローサンプルに対応する実際のオプティカルフロー、すなわち画像サンプル間の実際のオプティカルフローが含まれてもよい。
S502では、前記オプティカルフロー最適化ネットワークモジュールを用いて、前記オプティカルフローサンプルに対してオプティカルフロー最適化処理を行い、対応する最適化オプティカルフローを得る。
本開示の実施例の初期オプティカルフローネットワークモジュールによって各群のオプティカルフローサンプルを最適化し、具体的な最適化プロセスは上記ステップS200の説明と同じであり、ここで繰り返し説明しない。該プロセスにより、各オプティカルフローサンプルに対応する最適化オプティカルフローを得ることができる。
S503では、前記最適化オプティカルフローと前記実際のオプティカルフローとの比較結果に基づいて、前記最適化オプティカルフローから第1の要求を満たす第1の画素点を選択し、前記第1の画素点の対応するマスク画像におけるマスク値を調整し、新しいマスクサンプルを得る。
オプティカルフローサンプルの最適化オプティカルフローを得た後、本開示の実施例では、最適化オプティカルフローと対応する実際のオプティカルフローにおいて画素点の対応のオプティカルフローの差を得て、その中から第1の要求を満たす第1の画素点を選択するようにしてもよく、例えば、画素点のオプティカルフローの差を大きい順に並べ、その中からオプティカルフローの差が大きい所定比率(例えば、50%)の画素点を、第1の要求を満たす第1の画素点として選択するようにしてもよい。または他の実施例では、所定比率を他の値としてもよく、これについて本開示は具体的に限定しない。
第1の要求を満たす第1の画素点を特定した後、前記最適化オプティカルフローに対応するマスク画像における該第1の画素点のマスク値を修復対象領域に対応するマスク値として決定することができる。すなわち、得られた最適化オプティカルフローのうち、一部の画素点のオプティカルフロー値の誤差が大きい場合、該対応するマスク画像における対応する画素点のマスク値を修復対象領域で特徴付けられるマスク値(例えば、1)に設定し直してもよく、これにより新たしいマスク画像を得ることができる。
S504では、予め設定された損失関数に従って、前記最適化オプティカルフロー、元のマスクサンプルおよび新しいマスクサンプルに基づいて損失値を得る。
ここで、前記予め設定された損失関数の表現式は式(1)で表してもよい。
Figure 2021519051
式中、Lはオプティカルフロー最適化処理の損失関数を表し、Mは元のマスクサンプルであり、
Figure 2021519051
は新しいマスクサンプルを表し、
Figure 2021519051
は得られた最適化オプティカルフローを表し、
Figure 2021519051
は実際のオプティカルフローを表し、
Figure 2021519051
は重み値である。
本開示の実施例では、該損失関数から最適化プロセスの損失値を得ることができる。
S505では、前記損失値がトレーニングの要求を満たす場合、トレーニングが完了したオプティカルフロー最適化ネットワークモジュールを得て、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、前記オプティカルフロー最適化ネットワークモジュールのネットワークパラメータを調整し、オプティカルフローサンプルのオプティカルフロー最適化処理を再実行する。
例えば、得られた損失値が損失閾値未満の場合のみ、トレーニングの要求を満たすと判断し、このときトレーニングを終了することができ、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、ネットワークモジュールのパラメータを調整する。
以上より、本開示の実施例は、同時に複数の連続時間フレームのビデオ画像に対して修復処理を行うことができ、そのうち、まず隣接するフレームの画像間の順方向オプティカルフローおよび逆方向オプティカルフローを最適化し、精度の高いオプティカルフローを取得し、その後、最適化された順方向オプティカルフローおよび逆方向オプティカルフローによってビデオ修復をガイドしており、ビデオ修復の正確度を高めるとともに、フレーム間の連続性および整合性を高めることができる。また、本開示の実施例は修復速度が速く、修復のリアルタイム性が満たされる。
一方、従来の方法は欠失領域に複雑な移動情報が含まれる状況に対応できず、欠失領域に複雑な形状等の詳細情報が含まれる場合、従来の方法ではビデオ修復を好適に実現することができないが、本開示の実施例は複雑な細部が欠失した場合でも、ビデオ画像を好適に修復することができる。
具体的な実施形態の上記方法において、各ステップの記述順序は厳しい実行順序であるというわけではなく、実施プロセスの何の制限にもならず、各ステップの具体的な実行順序はその機能と可能な内在的論理に依存することが当業者に理解される。
本開示で言及される上記各方法の実施例は、原理と論理に違反しない限り、相互に組み合わせて、組み合せ後の実施例を形成することができることが理解され、紙数に限りがあるので、本開示では詳細な説明を省略する。
また、本開示はビデオ修復装置、電子機器、コンピュータ可読記憶媒体およびプログラムをさらに提供し、それらはいずれも本開示で提供されるいずれかのビデオ修復方法を実現するために利用可能であり、それに対応する技術的解決手段および説明については方法部分の対応する記載を参照すればよく、ここでは省略する。
図11は本開示の実施例に係るビデオ修復装置のブロック図を示し、図11に示すように、前記ビデオ修復装置は、
連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得するための取得モジュール10と、前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得るためのオプティカルフロー最適化モジュール20と、前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々がいずれも修復の要求を満たすまで実行するための伝播最適化モジュール30と、順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得るための修復モジュール40と、を含む。
いくつかの可能な実施形態では、前記取得モジュールはさらに、前記複数フレームの画像の各々のマスク画像を取得し、また前記複数フレームの画像の時間フレームの順方向順序に従って、隣接画像間の順方向オプティカルフローを決定し、前記複数フレームの画像の時間フレームの逆方向順序に従って、隣接画像間の逆方向オプティカルフローを決定することと、i番目の画像とi+1番目の画像との間の順方向オプティカルフローにi+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得て、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得て、前記マスク画像は対応画像の修復対象領域を表し、iは1以上且つG未満の正整数で、Gは複数フレームの画像の画像数であることと、に用いられる。
いくつかの可能な実施形態では、前記オプティカルフロー最適化モジュールはさらに、前記第1の順方向オプティカルフローを連結して第1の連結オプティカルフローを得て、前記第1の逆方向オプティカルフローを連結して第2の連結オプティカルフローを得ることと、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行い、前記第1の連結オプティカルフローに対応する第1の最適化オプティカルフロー、および第2の連結オプティカルフローに対応する第2の最適化オプティカルフローを得て、Nは1以上の正整数であることと、前記第1の最適化オプティカルフローに基づいて各第1の順方向オプティカルフローに対応する第2の順方向オプティカルフローを得て、前記第2の最適化オプティカルフローに基づいて各第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることと、に用いられる。
いくつかの可能な実施形態では、前記オプティカルフロー最適化モジュールはさらに、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対して1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第1の最適化サブオプティカルフローを得ることと、前記第1の連結オプティカルフローおよび前記第2の連結オプティカルフローの第iの最適化サブオプティカルフローに対してそれぞれi+1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフローを得て、iは1より大きく且つNより小さい正整数であることとに用いられ、N回目の最適化処理により得られた前記第1の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第1の最適化オプティカルフローとして決定し、得られた前記第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第2の最適化オプティカルフローとして決定し、ここで、各回のオプティカルフロー最適化処理は残差処理およびアップサンプリング処理を含む。
いくつかの可能な実施形態では、前記伝播最適化モジュールは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて1番目の画像以外の画像の第1の修復画像を得ることと、得られた前記第1の修復画像に基づいて対応画像のマスク画像を調整し、第1の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することと、に用いられる第1の伝播最適化ユニットを含む。
いくつかの可能な実施形態では、前記第1の伝播最適化ユニットはさらに、前記複数フレームの画像の時間フレームの順方向順序に従って、1番目の第2の順方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第1の修復画像を得ることと、k番目の画像と前記k番目の画像の修復画像との加算処理を行い、k番目の画像の第1の加算画像を得、k番目の第2の順方向オプティカルフローで前記k番目の第1の加算画像に対してシフト処理を行い、k+1番目の画像の第1の修復画像を得て、kは1より大きく且つGより小さい正整数で、Gは複数フレームの画像の画像数を表すことと、に用いられる。
いくつかの可能な実施形態では、前記伝播最適化モジュールはさらに、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることと、得られた前記第2の修復画像に基づいて対応画像のマスク画像を調整し、第2の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することと、に用いられる第2の伝播最適化ユニットを含む。
いくつかの可能な実施形態では、前記第2の伝播最適化ユニットはさらに、前記複数フレームの画像の時間フレームの逆方向順序に従って、1番目の第2の逆方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第2の修復画像を得ることと、h番目の画像と前記h番目の画像の修復画像との加算処理を行い、h番目の画像の第2の加算画像を得、h番目の第2の逆方向オプティカルフローで前記h番目の第2の加算画像に対してシフト処理を行い、h+1番目の画像の第2の修復画像を得て、hは1より大きく且つG以下の正整数であり、Gは複数フレームの画像の画像数を表すことと、に用いられる。
いくつかの可能な実施形態では、前記修復モジュールはさらに、複数フレームの画像の時間フレームの順方向順序に従って、前記順方向の伝播最適化により得られた第1の最適化画像を得ることと、複数フレームの画像の時間フレームの順方向順序に従って、前記逆方向の伝播最適化により得られた第2の最適化画像を得ることと、各画像の第1の最適化画像と第2の最適化画像の平均値に基づいて該画像の修復画像を得て、前記複数フレームの画像の各々の修復画像を得ることと、に用いられる。
いくつかの可能な実施形態では、前記装置は、前記オプティカルフロー最適化モジュールをトレーニングするためのトレーニングモジュールをさらに含み、前記トレーニングモジュールは、前記オプティカルフロー最適化モジュールに、複数群のオプティカルフローサンプル、および各オプティカルフローサンプルに対応するマスクサンプルと実際のオプティカルフローを含むトレーニングサンプルを入力することと、前記オプティカルフロー最適化モジュールを用いて前記オプティカルフローサンプルに対してオプティカルフロー最適化処理を行い、対応する最適化オプティカルフローを得ることと、前記最適化オプティカルフローと前記実際のオプティカルフローとの比較結果に基づいて、前記最適化オプティカルフローから第1の要求を満たす第1の画素点を選択し、前記第1の画素点のマスク画像におけるマスク値を調整して新しいマスクサンプルを得ることと、予め設定された損失関数に従って、前記最適化オプティカルフロー、元のマスクサンプルおよび新しいマスクサンプルに基づいて損失値を得ることと、前記損失値がトレーニングの要求を満たす場合、トレーニングが完了したオプティカルフロー最適化モジュールを得て、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、前記オプティカルフロー最適化モジュールのネットワークパラメータを調整し、オプティカルフローサンプルのオプティカルフロー最適化処理を再実行することと、に用いられる。
いくつかの可能な実施形態では、前記予め設定された損失関数の表現式は以下のとおりである。
Figure 2021519051
式中、Lはオプティカルフロー最適化処理の損失関数を表し、Mは元のマスクサンプルであり、
Figure 2021519051
は新しいマスクサンプルを表し、
Figure 2021519051
は得られた最適化オプティカルフローを表し、
Figure 2021519051
は実際のオプティカルフローを表し、
Figure 2021519051
は重み値である。
いくつかの実施例では、本開示の実施例で提供された装置に備えた機能またはモジュールは、上記方法実施例に記載の方法を実行するために用いられ、その具体的な実施形態については上記方法実施例の説明を参照すればよく、簡単化するために、ここで重複説明は割愛する。
本開示の実施例は、プロセッサに実行されると上記方法を実現するコンピュータプログラム命令が記憶されているコンピュータ可読記憶媒体をさらに提供する。コンピュータ可読記憶媒体は、揮発性または不揮発性コンピュータ可読記憶媒体であってもよい。
本開示の実施例は、プロセッサと、プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、上記プロセッサは、上記方法を実行するように構成される電子機器をさらに提供する。電子機器は、端末、サーバまたは他の形態の機器として提供されてもよい。
図12は本開示の実施例に係る電子機器800のブロック図を示す。例えば、電子機器800は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット機器、医療機器、フィットネス機器、携帯情報端末などの端末であってもよい。
図12に示すように、電子機器800は処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インタフェース812、センサコンポーネント814、および通信コンポーネント816の1つ以上を含んでもよい。
処理コンポーネント802は通常、電子機器800の全体的な動作、例えば表示、電話の呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント802は、上記方法の全てまたは一部のステップを完了するために、1つ以上のプロセッサ820を含んで命令を実行するようにしてもよい。また、処理コンポーネント802は、他のコンポーネントとの対話のために、1つ以上のモジュールを含むようにしてもよい。例えば、処理コンポーネント802は、マルチメディアコンポーネント808との対話のために、マルチメディアモジュールを含むようにしてもよい。
メモリ804は電子機器800での動作をサポートするために様々なタイプのデータを記憶するように構成される。これらのデータの例は電子機器800において運用するためのあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ804は、例えば静的ランダムアクセスメモリ(SRAM)、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどの様々なタイプの揮発性または非揮発性記憶機器またはそれらの組み合わせによって実現してもよい。
電源コンポーネント806は電子機器800の各コンポーネントに電力を供給する。電源コンポーネント806は電源管理システム、1つ以上の電源、および電子機器800のための電力生成、管理および配分に関連する他のコンポーネントを含んでもよい。
マルチメディアコンポーネント808は前記電子機器800とユーザとの間で出力インタフェースを提供する画面を含む。いくつかの実施例では、画面は液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでもよい。画面がタッチパネルを含む場合、ユーザからの入力信号を受信するために、タッチ画面として実現してもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャを検知するために、1つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関連する持続時間および圧力も検出するようにしてもよい。いくつかの実施例では、マルチメディアコンポーネント808は前面カメラおよび/または後面カメラを含む。電子機器800が動作モード、例えば撮影モードまたは撮像モードになる場合、前面カメラおよび/または後面カメラは外部のマルチメディアデータを受信するようにしてもよい。各前面カメラおよび後面カメラは固定された光学レンズ系であってもよく、または焦点距離および光学ズーム能力を有するものであってもよい。
オーディオコンポーネント810はオーディオ信号を出力および/または入力するように構成される。例えば、オーディオコンポーネント810は、電子機器800が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成されたマイク(MIC)を含む。受信されたオーディオ信号はさらにメモリ804に記憶されるか、または通信コンポーネント816によって送信されてもよい。いくつかの実施例では、オーディオコンポーネント810はさらに、オーディオ信号を出力するためのスピーカーを含む。
I/Oインタフェース812は処理コンポーネント802と周辺インタフェースモジュールとの間でインタフェースを提供し、上記周辺インタフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含んでもよいが、これらに限定されない。
センサコンポーネント814は電子機器800に各面での状態評価を提供するための1つ以上のセンサを含む。例えば、センサコンポーネント814は電子機器800のオン/オフ状態、および、例えば電子機器800の表示装置やキーパッドであるコンポーネントの相対的位置決めを検出してもよくて、センサコンポーネント814はさらに、電子機器800または電子機器800のあるコンポーネントの位置の変化、ユーザと電子機器800との接触の有無、電子機器800の方位または加減速および電子機器800の温度変化を検出してもよい。センサコンポーネント814は、いかなる物理的接触もない場合に近傍の物体の存在を検出するために用いられるように構成された近接センサを含んでもよい。センサコンポーネント814はさらに、CMOSまたはCCDイメージセンサのような、イメージングアプリケーションにおいて使用するための光センサを含んでもよい。いくつかの実施例では、該センサコンポーネント814はさらに、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサを含んでもよい。
通信コンポーネント816は電子機器800と他の機器との間の有線または無線通信を実現するように構成される。電子機器800は通信規格に基づく無線ネットワーク、例えばWiFi、2Gまたは3G、またはそれらの組み合わせにアクセスするようにしてもよい。一例示的実施例では、通信コンポーネント816は放送チャネルによって外部の放送管理システムの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント816はさらに、近距離通信を促進させるために、近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールでは無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)技術および他の技術によって実現できる。
例示的な実施例では、電子機器800は1つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現でき、上記方法を実行するために用いられる。
例示的な実施例では、さらに、非揮発性コンピュータ可読記憶媒体、例えばコンピュータプログラム命令を含むメモリ804が提供され、上記コンピュータプログラム命令は電子機器800のプロセッサ820によって実行して上記方法を完了することができる。
図13は本開示の実施例に係る電子機器1900のブロック図を示す。例えば、電子機器1900はサーバとして提供してもよい。図13を参照すると、電子機器1900は、さらに1つ以上のプロセッサを含む処理コンポーネント1922、および、処理コンポーネント1922によって実行可能な命令、例えばアプリケーションプログラムを記憶するための、メモリ1932を代表とするメモリ資源を含む。メモリ1932に記憶されたアプリケーションプログラムはそれぞれが1グループの命令に対応する1つ以上のモジュールを含んでもよい。また、処理コンポーネント1922は命令を実行し、それによって上記方法を実行するように構成される。
電子機器1900はさらに、電子機器1900の電源管理を実行するように構成された電源コンポーネント1926、電子機器1900をネットワークに接続するように構成された有線または無線ネットワークインタフェース1950、および入出力(I/O)インタフェース1958を含んでもよい。電子機器1900はメモリ1932に記憶されたオペレーティングシステム、例えばWindows ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTMまたは類似するものに基づいて動作できる。
例示的な実施例では、さらに、非揮発性コンピュータ可読記憶媒体、例えばコンピュータプログラム命令を含むメモリ1932が提供され、上記コンピュータプログラム命令は電子機器1900の処理コンポーネント1922によって実行されて上記方法を完了することができる。
本開示はシステム、方法および/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品はプロセッサに本開示の各態様を実現させるためのコンピュータ可読プログラム命令がロードされているコンピュータ可読記憶媒体を含んでもよい。
コンピュータ可読記憶媒体は命令実行機器により使用される命令を保存および記憶可能な有形機器であってもよい。コンピュータ可読記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のさらに具体的な例(非包括的リスト)としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、静的ランダムアクセスメモリ(SRAM)、携帯型コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、機械的符号化装置、例えば命令が記憶されている穿孔カードまたはスロット内突起構造、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ可読記憶媒体は瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波(例えば、光ファイバーケーブルを通過するパルス光)、または電線を経由して伝送される電気信号と解釈されるものではない。
ここで記述したコンピュータ可読プログラム命令はコンピュータ可読記憶媒体から各計算/処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび/または無線ネットワークによって外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび/またはエッジサーバを含むことができる。各計算/処理機器内のネットワークアダプタカードまたはネットワークインタフェースはネットワークからコンピュータ可読プログラム命令を受信し、該コンピュータ可読プログラム命令を転送し、各計算/処理機器内のコンピュータ可読記憶媒体に記憶する。
本開示の動作を実行するためのコンピュータプログラム命令はアセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、C++などのオブジェクト指向プログラミング言語、および「C」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含む1つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、(例えばインターネットサービスプロバイダを利用してインターネットを経由して)外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ可読プログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)またはプログラマブル論理アレイ(PLA)などの電子回路をカスタマイズすることで、該電子回路はコンピュータ可読プログラム命令を実行し、それにより本開示の各態様を実現できるようになる。
なお、ここで本開示の実施例に係る方法、装置(システム)およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照しながら本開示の各態様を説明したが、フローチャートおよび/またはブロック図の各ブロックおよびフローチャートおよび/またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ可読プログラム命令によって実現できることを理解すべきである。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供されてもよく、それにより、これらの命令はコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行された場合、フローチャートおよび/またはブロック図の1つ以上のブロックで指定された機能/動作を実現する手段を創出するような機器が製造される。また、これらのコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体に記憶し、それによってコンピュータ、プログラマブルデータ処理装置および/または他の機器を特定の方式で動作させるようにしてもよく、それにより、中に命令を保存したコンピュータ可読記憶媒体は、フローチャートおよび/またはブロック図の1つ以上のブロックで指定された機能/動作の各態様を実現する命令を含む製品を備える。
コンピュータ可読プログラム命令はコンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードすることにより、コンピュータ、他のプログラマブルデータ処理装置または他の機器において一連の動作ステップを実行させて、コンピュータ実施プロセスを生成するようにしてもよく、それにより、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令はフローチャートおよび/またはブロック図の1つ以上のブロックで指定された機能/動作を実現する。
図面のうちフローチャートおよびブロック図は本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは1つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための1つ以上の実行可能命令を含む。いくつかの置換としての実現形態では、ブロックに表記される機能は図面に付したものと異なる順序で実行してもよい。例えば、二つの連続的なブロックは実質的に同時に実行してもよく、また、係る機能によって、それらは逆な順序で実行してもよい場合がある。なお、ブロック図および/またはフローチャートにおける各ブロック、およびブロック図および/またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことに注意すべきである。
以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に選ばれた用語は、各実施例の原理、実際の適用または市場における技術への技術的改善を好適に解釈するか、または他の当業者に本明細書に披露された各実施例を理解させるためのものである。

Claims (23)

  1. 連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得することと、
    前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることと、
    前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々が修復の要求を満たすまで実行することと、
    順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得ることとを含む、ことを特徴とするビデオ修復方法。
  2. 連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得することは、
    前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、
    前記複数フレームの画像の時間フレームの順方向順序に従って、隣接画像間の順方向オプティカルフローを決定し、前記複数フレームの画像の時間フレームの逆方向順序に従って、隣接画像間の逆方向オプティカルフローを決定することと、
    i番目の画像とi+1番目の画像との間の順方向オプティカルフローにi+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得て、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得て、iは1以上且つG未満の正整数で、Gは複数フレームの画像の画像数であることとを含む、ことを特徴とする請求項1に記載の方法。
  3. 前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行うことは、
    前記第1の順方向オプティカルフローを連結して第1の連結オプティカルフローを得て、前記第1の逆方向オプティカルフローを連結して第2の連結オプティカルフローを得ることと、
    前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行い、前記第1の連結オプティカルフローに対応する第1の最適化オプティカルフロー、および第2の連結オプティカルフローに対応する第2の最適化オプティカルフローを得て、Nは1以上の正整数であることと、
    前記第1の最適化オプティカルフローに基づいて各第1の順方向オプティカルフローに対応する第2の順方向オプティカルフローを得て、前記第2の最適化オプティカルフローに基づいて各第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることとを含む、ことを特徴とする請求項1または2に記載の方法。
  4. 前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行うことは、
    前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対して1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第1の最適化サブオプティカルフローを得ることと、
    前記第1の連結オプティカルフローおよび前記第2の連結オプティカルフローの第iの最適化サブオプティカルフローに対してそれぞれi+1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフローを得て、iは1より大きく且つNより小さい正整数であることと、を含み、
    N回目の最適化処理により得られた前記第1の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第1の最適化オプティカルフローとして決定し、得られた前記第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第2の最適化オプティカルフローとして決定し、ここで、各回のオプティカルフロー最適化処理は残差処理およびアップサンプリング処理を含む、ことを特徴とする請求項3に記載の方法。
  5. 前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行うことは、
    前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、
    前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて1番目の画像以外の画像の第1の修復画像を得ることと、
    得られた前記第1の修復画像に基づいて対応画像のマスク画像を調整し、第1の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することとを含む、ことを特徴とする請求項1から4のいずれか一項に記載の方法。
  6. 前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて各画像の第1の修復画像を得ることは、
    前記複数フレームの画像の時間フレームの順方向順序に従って、1番目の第2の順方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第1の修復画像を得ることと、
    k番目の画像と前記k番目の画像の修復画像との加算処理を行い、k番目の画像の第1の加算画像を得、k番目の第2の順方向オプティカルフローで前記k番目の第1の加算画像に対してシフト処理を行い、k+1番目の画像の第1の修復画像を得て、kは1より大きく且つGより小さい正整数で、Gは複数フレームの画像の画像数を表すこととを含む、ことを特徴とする請求項5に記載の方法。
  7. 前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことは、
    前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、
    前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることと、
    得られた前記第2の修復画像に基づいて対応画像のマスク画像を調整し、第2の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することとを含む、ことを特徴とする請求項1から6のいずれか一項に記載の方法。
  8. 前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることは、
    前記複数フレームの画像の時間フレームの逆方向順序に従って、1番目の第2の逆方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第2の修復画像を得ることと、
    h番目の画像と前記h番目の画像の修復画像との加算処理を行い、h番目の画像の第2の加算画像を得、h番目の第2の逆方向オプティカルフローで前記h番目の第2の加算画像に対してシフト処理を行い、h+1番目の画像の第2の修復画像を得て、hは1より大きく且つG以下の正整数であり、Gは複数フレームの画像の画像数を表すこととを含む、ことを特徴とする請求項7に記載の方法。
  9. 順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得ることは、
    複数フレームの画像の時間フレームの順方向順序に従って、前記順方向の伝播最適化により得られた第1の最適化画像を得ることと、
    複数フレームの画像の時間フレームの順方向順序に従って、前記逆方向の伝播最適化により得られた第2の最適化画像を得ることと、
    各画像の第1の最適化画像と第2の最適化画像の平均値に基づいて該画像の修復画像を得て、前記複数フレームの画像の各々の修復画像を得ることとを含む、ことを特徴とする請求項1から8のいずれか一項に記載の方法。
  10. 前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることを、オプティカルフロー最適化モジュールによって実行することを含み、
    当該方法は、前記オプティカルフロー最適化モジュールをトレーニングすることをさらに含み、前記トレーニングは、
    複数群のオプティカルフローサンプル、および各オプティカルフローサンプルに対応するマスクサンプルと実際のオプティカルフローを含むトレーニングサンプルを取得することと、
    前記オプティカルフロー最適化モジュールを用いて前記オプティカルフローサンプルに対してオプティカルフロー最適化処理を行い、対応する最適化オプティカルフローを得ることと、
    前記最適化オプティカルフローと前記実際のオプティカルフローとの比較結果に基づいて、前記最適化オプティカルフローから第1の要求を満たす第1の画素点を選択し、前記第1の画素点のマスク画像におけるマスク値を調整して新しいマスクサンプルを得ることと、
    予め設定された損失関数に従って、前記最適化オプティカルフロー、元のマスクサンプルおよび新しいマスクサンプルに基づいて損失値を得ることと、
    前記損失値がトレーニングの要求を満たす場合、トレーニングが完了したオプティカルフロー最適化モジュールを得て、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、前記オプティカルフロー最適化モジュールのネットワークパラメータを調整し、オプティカルフローサンプルのオプティカルフロー最適化処理を再実行することとを含む、ことを特徴とする請求項1から9のいずれか一項に記載の方法。
  11. 連続した複数フレームの画像に対して隣接画像間の第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローを取得するための取得モジュールと、
    前記第1の順方向オプティカルフローおよび第1の逆方向オプティカルフローに対してそれぞれオプティカルフロー最適化処理を行い、前記第1の順方向オプティカルフローに対応する第2の順方向オプティカルフロー、および前記第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得るためのオプティカルフロー最適化モジュールと、
    前記第2の順方向オプティカルフローを用いて前記連続した複数フレームの画像に対して順方向の伝播最適化を行い、前記第2の逆方向オプティカルフローを用いて前記連続した複数フレームの画像に対して逆方向の伝播最適化を行うことを、最適化後の連続した複数フレームの画像の各々がいずれも修復の要求を満たすまで実行するための伝播最適化モジュールと、
    順方向の伝播最適化および逆方向の伝播最適化により得られた最適化画像に基づいて、前記連続した複数フレームの画像の修復画像を得るための修復モジュールとを含む、ことを特徴とするビデオ修復装置。
  12. 前記取得モジュールはさらに、前記複数フレームの画像の各々のマスク画像を取得し、また前記複数フレームの画像の時間フレームの順方向順序に従って、隣接画像間の順方向オプティカルフローを決定し、前記複数フレームの画像の時間フレームの逆方向順序に従って、隣接画像間の逆方向オプティカルフローを決定することと、
    i番目の画像とi+1番目の画像との間の順方向オプティカルフローにi+1番目の画像のマスク画像を乗算し、i番目の画像とi+1番目の画像との間の第1の順方向オプティカルフローを得て、i+1番目の画像とi番目の画像との間の逆方向オプティカルフローにi番目の画像のマスク画像を乗算し、i+1番目の画像とi番目の画像との間の第1の逆方向オプティカルフローを得て、前記マスク画像は対応画像の修復対象領域を表し、iは1以上且つG未満の正整数で、Gは複数フレームの画像の画像数であることとに用いられる、ことを特徴とする請求項11に記載の装置。
  13. 前記オプティカルフロー最適化モジュールはさらに、前記第1の順方向オプティカルフローを連結して第1の連結オプティカルフローを得て、前記第1の逆方向オプティカルフローを連結して第2の連結オプティカルフローを得ることと、
    前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対してオプティカルフロー最適化処理をそれぞれN回行い、前記第1の連結オプティカルフローに対応する第1の最適化オプティカルフロー、および第2の連結オプティカルフローに対応する第2の最適化オプティカルフローを得て、Nは1以上の正整数であることと、
    前記第1の最適化オプティカルフローに基づいて各第1の順方向オプティカルフローに対応する第2の順方向オプティカルフローを得て、前記第2の最適化オプティカルフローに基づいて各第1の逆方向オプティカルフローに対応する第2の逆方向オプティカルフローを得ることとに用いられる、ことを特徴とする請求項11または12に記載の装置。
  14. 前記オプティカルフロー最適化モジュールはさらに、前記第1の連結オプティカルフローおよび第2の連結オプティカルフローに対して1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第1の最適化サブオプティカルフローを得ることと、
    前記第1の連結オプティカルフローおよび前記第2の連結オプティカルフローの第iの最適化サブオプティカルフローに対してそれぞれi+1回目のオプティカルフロー最適化処理を行い、前記第1の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフロー、および第2の連結オプティカルフローに対応する第i+1の最適化サブオプティカルフローを得て、iは1より大きく且つNより小さい正整数であることとに用いられ、
    N回目の最適化処理により得られた前記第1の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第1の最適化オプティカルフローとして決定し、得られた前記第2の連結オプティカルフローの第Nの最適化サブオプティカルフローを前記第2の最適化オプティカルフローとして決定し、ここで、各回のオプティカルフロー最適化処理は残差処理およびアップサンプリング処理を含む、ことを特徴とする請求項13に記載の装置。
  15. 前記伝播最適化モジュールは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、
    前記複数フレームの画像の時間フレームの順方向順序に従って、前記第2の順方向オプティカルフローに基づいて1番目の画像以外の画像の第1の修復画像を得ることと、
    得られた前記第1の修復画像に基づいて対応画像のマスク画像を調整し、第1の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することとに用いられる第1の伝播最適化ユニットを含む、ことを特徴とする請求項11から14のいずれか一項に記載の装置。
  16. 前記第1の伝播最適化ユニットはさらに、前記複数フレームの画像の時間フレームの順方向順序に従って、1番目の第2の順方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第1の修復画像を得ることと、
    k番目の画像と前記k番目の画像の修復画像との加算処理を行い、k番目の画像の第1の加算画像を得、k番目の第2の順方向オプティカルフローで前記k番目の第1の加算画像に対してシフト処理を行い、k+1番目の画像の第1の修復画像を得て、kは1より大きく且つGより小さい正整数で、Gは複数フレームの画像の画像数を表すこととに用いられる、ことを特徴とする請求項15に記載の装置。
  17. 前記伝播最適化モジュールは、前記複数フレームの画像の各々の、対応画像の修復対象領域を表すマスク画像を取得することと、
    前記複数フレームの画像の時間フレームの逆方向順序に従って、前記第2の逆方向オプティカルフローに基づいて1番目の画像以外の画像の第2の修復画像を得ることと、
    得られた前記第2の修復画像に基づいて対応画像のマスク画像を調整し、第2の修復画像を得る処理に戻り、調整後のマスク画像は修復対象領域がなくなることを示す場合に、前記複数フレームの画像の各々が前記修復の要求を満たすと判断することとに用いられる第2の伝播最適化ユニットをさらに含む、ことを特徴とする請求項11から16のいずれか一項に記載の装置。
  18. 前記第2の伝播最適化ユニットはさらに、前記複数フレームの画像の時間フレームの逆方向順序に従って、1番目の第2の逆方向オプティカルフローに基づいて1番目の画像に対してシフト処理を行い、2番目の画像の第2の修復画像を得ることと、
    h番目の画像と前記h番目の画像の修復画像との加算処理を行い、h番目の画像の第2の加算画像を得、h番目の第2の逆方向オプティカルフローで前記h番目の第2の加算画像に対してシフト処理を行い、h+1番目の画像の第2の修復画像を得て、hは1より大きく且つG以下の正整数であり、Gは複数フレームの画像の画像数を表すこととに用いられる、ことを特徴とする請求項17に記載の装置。
  19. 前記修復モジュールはさらに、複数フレームの画像の時間フレームの順方向順序に従って、前記順方向の伝播最適化により得られた第1の最適化画像を得ることと、
    複数フレームの画像の時間フレームの順方向順序に従って、前記逆方向の伝播最適化により得られた第2の最適化画像を得ることと、
    各画像の第1の最適化画像と第2の最適化画像の平均値に基づいて該画像の修復画像を得て、前記複数フレームの画像の各々の修復画像を得ることとに用いられる、ことを特徴とする請求項11から18のいずれか一項に記載の装置。
  20. オプティカルフロー最適化モジュールをトレーニングするためのトレーニングモジュールをさらに含み、前記トレーニングモジュールは、前記オプティカルフロー最適化モジュールに、複数群のオプティカルフローサンプル、および各オプティカルフローサンプルに対応するマスクサンプルと実際のオプティカルフローを含むトレーニングサンプルを入力することと、
    前記オプティカルフロー最適化モジュールを用いて前記オプティカルフローサンプルに対してオプティカルフロー最適化処理を行い、対応する最適化オプティカルフローを得ることと、
    前記最適化オプティカルフローと前記実際のオプティカルフローとの比較結果に基づいて、前記最適化オプティカルフローから第1の要求を満たす第1の画素点を選択し、前記第1の画素点のマスク画像におけるマスク値を調整して新しいマスクサンプルを得ることと、
    予め設定された損失関数に従って、前記最適化オプティカルフロー、元のマスクサンプルおよび新しいマスクサンプルに基づいて損失値を得ることと、
    前記損失値がトレーニングの要求を満たす場合、トレーニングが完了したオプティカルフロー最適化モジュールを得て、そうでない場合、得られた損失値がトレーニングの要求を満たすまで、前記オプティカルフロー最適化モジュールのネットワークパラメータを調整し、オプティカルフローサンプルのオプティカルフロー最適化処理を再実行することとに用いられる、ことを特徴とする請求項11から19のいずれか一項に記載の装置。
  21. プロセッサと、
    プロセッサにより実行可能な命令を記憶するためのメモリとを含み、
    前記プロセッサは、請求項1から10のいずれか一項に記載の方法を実行するように構成される、ことを特徴とする電子機器。
  22. コンピュータプログラム命令が記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラム命令は、プロセッサに実行されると請求項1から10のいずれか一項に記載の方法を実現させる、ことを特徴とするコンピュータ可読記憶媒体。
  23. コンピュータ可読コードを含むコンピュータプログラムであって、前記コンピュータ可読コードは、電子機器で実行されると、前記電子機器のプロセッサに請求項1から10のいずれか一項に記載の方法を実現するための命令を実行させる、ことを特徴とするコンピュータプログラム。
JP2021506038A 2019-01-31 2019-12-31 ビデオ修復方法および装置、電子機器、ならびに記憶媒体 Active JP7125541B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910099762.4 2019-01-31
CN201910099762.4A CN109816611B (zh) 2019-01-31 2019-01-31 视频修复方法及装置、电子设备和存储介质
PCT/CN2019/130428 WO2020156009A1 (zh) 2019-01-31 2019-12-31 视频修复方法及装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
JP2021519051A true JP2021519051A (ja) 2021-08-05
JP7125541B2 JP7125541B2 (ja) 2022-08-24

Family

ID=66606244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021506038A Active JP7125541B2 (ja) 2019-01-31 2019-12-31 ビデオ修復方法および装置、電子機器、ならびに記憶媒体

Country Status (6)

Country Link
US (1) US11544820B2 (ja)
JP (1) JP7125541B2 (ja)
KR (1) KR102406354B1 (ja)
CN (1) CN109816611B (ja)
SG (1) SG11202010145WA (ja)
WO (1) WO2020156009A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816611B (zh) 2019-01-31 2021-02-12 北京市商汤科技开发有限公司 视频修复方法及装置、电子设备和存储介质
CN111105382B (zh) * 2019-12-31 2021-11-16 北京大学 视频修复方法
CN111614996B (zh) * 2020-04-07 2022-03-18 上海推乐信息技术服务有限公司 一种视频修复方法和系统
CN113660443A (zh) * 2020-05-12 2021-11-16 武汉Tcl集团工业研究院有限公司 一种视频插帧方法、终端以及存储介质
CN111612721B (zh) * 2020-05-22 2023-09-22 哈尔滨工业大学(深圳) 一种图像修复模型训练、卫星图像修复方法及装置
CN111609868A (zh) * 2020-05-29 2020-09-01 电子科技大学 一种基于改进光流法的视觉惯性里程计方法
CN111738998B (zh) * 2020-06-12 2023-06-23 深圳技术大学 病灶位置动态检测方法及装置、电子设备和存储介质
CN112272311B (zh) * 2020-10-21 2022-08-26 腾讯科技(北京)有限公司 花屏修复方法、装置、终端、服务器及介质
CN112465728B (zh) * 2020-12-07 2022-09-23 华中光电技术研究所(中国船舶重工集团公司第七一七研究所) 视频图像处理方法、系统、电子设备及存储介质
CN112669204B (zh) * 2021-01-04 2024-05-03 北京金山云网络技术有限公司 图像处理方法、图像处理模型的训练方法和装置
CN112862766B (zh) * 2021-01-28 2022-11-04 华北电力大学(保定) 一种基于图像数据扩充技术的绝缘子检测方法及系统
CN114972050A (zh) * 2021-02-27 2022-08-30 华为技术有限公司 一种图像修复方法及装置
US20220301112A1 (en) * 2021-03-19 2022-09-22 Micron Technology, Inc. Modular machine learning models for denoising images and systems and methods for using same
WO2023085759A1 (ko) * 2021-11-09 2023-05-19 삼성전자 주식회사 Ai를 이용하는 영상 부호화 장치 및 영상 복호화 장치, 및 이들에 의한 영상의 부호화 및 복호화 방법
KR102518554B1 (ko) * 2022-04-27 2023-04-06 주식회사세오 신경망을 이용한 수위 예측 방법 및 시스템
CN118118676A (zh) * 2022-11-29 2024-05-31 北京三星通信技术研究有限公司 由电子设备执行的方法、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017155663A1 (en) * 2016-03-11 2017-09-14 Qualcomm Incorporated Recurrent networks with motion-based attention for video understanding
JP2017187954A (ja) * 2016-04-06 2017-10-12 Kddi株式会社 画像合成装置、プログラム及びデータ構造
WO2017213923A1 (en) * 2016-06-09 2017-12-14 Lytro, Inc. Multi-view scene segmentation and propagation
JP2018084997A (ja) * 2016-11-24 2018-05-31 キヤノン株式会社 画像処理装置、画像処理方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2820255A1 (fr) * 2001-01-26 2002-08-02 France Telecom Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants
KR101418116B1 (ko) * 2007-10-24 2014-07-09 고려대학교 산학협력단 프레임 보간 장치 및 그를 포함한 프레임 속도 상향 변환장치
US9396385B2 (en) * 2010-08-26 2016-07-19 Blast Motion Inc. Integrated sensor and video motion analysis method
US9672626B2 (en) * 2014-12-08 2017-06-06 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Method and system for generating adaptive fast forward of egocentric videos
CN105025201B (zh) * 2015-07-29 2017-11-14 武汉大学 一种时空连续的视频背景修复方法
CN106204567B (zh) * 2016-07-05 2019-01-29 华南理工大学 一种自然背景视频抠图方法
CN106973293B (zh) * 2017-04-21 2020-10-27 中国科学技术大学 基于视差预测的光场图像编码方法
US10547871B2 (en) * 2017-05-05 2020-01-28 Disney Enterprises, Inc. Edge-aware spatio-temporal filtering and optical flow estimation in real time
CN107292912B (zh) * 2017-05-26 2020-08-18 浙江大学 一种基于多尺度对应结构化学习的光流估计方法
US10636193B1 (en) * 2017-06-29 2020-04-28 Facebook Technologies, Llc Generating graphical representation of a user's face and body using a monitoring system included on a head mounted display
CN108229290B (zh) * 2017-07-26 2021-03-02 北京市商汤科技开发有限公司 视频物体分割方法和装置、电子设备、存储介质
CN107480646B (zh) * 2017-08-22 2020-09-25 北京工业大学 一种基于双目视觉的车载视频异常运动检测方法
CN108875900B (zh) * 2017-11-02 2022-05-24 北京旷视科技有限公司 视频图像处理方法和装置、神经网络训练方法、存储介质
CN108090919B (zh) * 2018-01-02 2020-12-22 华南理工大学 一种基于超像素光流和自适应学习因子改进的核相关滤波跟踪方法
CN108389217A (zh) * 2018-01-31 2018-08-10 华东理工大学 一种基于梯度域混合的视频合成方法
CN108320020A (zh) * 2018-02-07 2018-07-24 深圳市唯特视科技有限公司 一种基于双向光流的端到端无监督学习方法
CN109086807B (zh) * 2018-07-16 2022-03-18 哈尔滨工程大学 一种基于空洞卷积堆叠网络的半监督光流学习方法
CN109284720A (zh) * 2018-09-28 2019-01-29 大连民族大学 度量视频连续帧与其卷积特征图间差异在视频行为识别中的应用
JP7392227B2 (ja) * 2019-01-15 2023-12-06 ポートランド ステイト ユニヴァーシティ 映像フレーム補間のための特徴ピラミッドワーピング
CN109819229B (zh) * 2019-01-22 2021-02-26 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN109816611B (zh) 2019-01-31 2021-02-12 北京市商汤科技开发有限公司 视频修复方法及装置、电子设备和存储介质
US11526970B2 (en) * 2019-09-04 2022-12-13 Samsung Electronics Co., Ltd System and method for video processing with enhanced temporal consistency
CN112767441B (zh) * 2021-01-08 2023-06-06 南昌航空大学 一种基于残差场和位移场的图像光流优化方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017155663A1 (en) * 2016-03-11 2017-09-14 Qualcomm Incorporated Recurrent networks with motion-based attention for video understanding
JP2019509566A (ja) * 2016-03-11 2019-04-04 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオ理解のための動きベースアテンションを用いたリカレントネットワーク
JP2017187954A (ja) * 2016-04-06 2017-10-12 Kddi株式会社 画像合成装置、プログラム及びデータ構造
WO2017213923A1 (en) * 2016-06-09 2017-12-14 Lytro, Inc. Multi-view scene segmentation and propagation
JP2019525515A (ja) * 2016-06-09 2019-09-05 グーグル エルエルシー マルチビューシーンのセグメンテーションおよび伝播
JP2018084997A (ja) * 2016-11-24 2018-05-31 キヤノン株式会社 画像処理装置、画像処理方法

Also Published As

Publication number Publication date
US11544820B2 (en) 2023-01-03
KR102406354B1 (ko) 2022-06-07
WO2020156009A1 (zh) 2020-08-06
JP7125541B2 (ja) 2022-08-24
SG11202010145WA (en) 2020-11-27
CN109816611A (zh) 2019-05-28
CN109816611B (zh) 2021-02-12
KR20210018850A (ko) 2021-02-18
US20210035268A1 (en) 2021-02-04

Similar Documents

Publication Publication Date Title
JP2021519051A (ja) ビデオ修復方法および装置、電子機器、ならびに記憶媒体
CN113569796B (zh) 关键点检测方法及装置、电子设备和存储介质
CN110647834B (zh) 人脸和人手关联检测方法及装置、电子设备和存储介质
CN110674719B (zh) 目标对象匹配方法及装置、电子设备和存储介质
JP7072119B2 (ja) 画像処理方法および装置、電子機器ならびに記憶媒体
CN110287874B (zh) 目标追踪方法及装置、电子设备和存储介质
CN110837761B (zh) 多模型知识蒸馏方法及装置、电子设备和存储介质
JP7026257B2 (ja) 画像処理方法及び装置、電子機器並びに記憶媒体
JP2021514497A (ja) 顔部認識方法及び装置、電子機器並びに記憶媒体
CN109887515B (zh) 音频处理方法及装置、电子设备和存储介质
US11314965B2 (en) Method and apparatus for positioning face feature points
CN109543537B (zh) 重识别模型增量训练方法及装置、电子设备和存储介质
CN109858614B (zh) 神经网络训练方法及装置、电子设备和存储介质
TW202032425A (zh) 圖像處理方法及裝置、電子設備和儲存介質
JP2022516452A (ja) データ処理方法および装置、電子機器ならびに記憶媒体
CN109903252B (zh) 图像处理方法及装置、电子设备和存储介质
CN109447258B (zh) 神经网络模型的优化方法及装置、电子设备和存储介质
CN115457024A (zh) 冷冻电镜图像处理方法、装置、电子设备及存储介质
US11792518B2 (en) Method and apparatus for processing image
CN110019928B (zh) 视频标题的优化方法及装置
CN117893591B (zh) 光幕模板识别方法及装置、设备、存储介质和程序产品
CN115527035B (zh) 图像分割模型优化方法、装置、电子设备及可读存储介质
CN117893591A (zh) 光幕模板识别方法及装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220812

R150 Certificate of patent or registration of utility model

Ref document number: 7125541

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150