WO2023100665A1

WO2023100665A1 - 画像処理装置、画像処理方法、及びプログラム

Info

Publication number: WO2023100665A1
Application number: PCT/JP2022/042662
Authority: WO
Inventors: 裕也山下
Original assignee: ソニーグループ株式会社
Priority date: 2021-12-01
Filing date: 2022-11-17
Publication date: 2023-06-08

Abstract

本開示は、撮影画像に対する補正の精度を向上させることができるようにする画像処理装置、画像処理方法、及びプログラムに関する。撮影画像を、第１の単位で補正し、撮影画像と、第１の単位の補正で得られる中間補正画像との関係に基づいて、撮影画像に対する補正用のパラメータを推定し、推定されたパラメータを用いて、撮影画像を、第１の単位よりも大きい第２の単位で補正する処理部を備える画像処理装置が提供される。本開示は、例えば、インターネットを介してサービスを提供するクラウドサーバに適用することができる。

Description

画像処理装置、画像処理方法、及びプログラム

　本開示は、画像処理装置、画像処理方法、及びプログラムに関し、特に、撮影画像に対する補正の精度を向上させることができるようにした画像処理装置、画像処理方法、及びプログラムに関する。

　ユーザが撮影した静止画や動画等の撮影画像を自動で編集する機能を有するプログラムが提供されている。例えば、特許文献１には、動画を自動で編集するプログラムとして、テンプレートを指定するものが開示されている。

特開2009-55152号公報

　撮影画像を編集して動画を制作する動画制作サービスを提供するに際しては、撮影画像に対して補正処理を施す場合があり、撮影画像に対する補正の精度を向上させることが求められる。

　本開示はこのような状況に鑑みてなされたものであり、撮影画像に対する補正の精度を向上させることができるようにするものである。

　本開示の一側面の画像処理装置は、撮影画像を、第１の単位で補正し、前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する処理部を備える画像処理装置である。

　本開示の一側面の画像処理方法は、画像処理装置が、撮影画像を、第１の単位で補正し、前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する画像処理方法である。

　本開示の一側面のプログラムは、コンピュータを、撮影画像を、第１の単位で補正し、前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する処理部として機能させるプログラムである。

　本開示の一側面の画像処理装置、画像処理方法、及びプログラムにおいては、撮影画像が、第１の単位で補正され、前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータが推定され、推定された前記パラメータを用いて、前記撮影画像が、前記第１の単位よりも大きい第２の単位で補正される。

　なお、本開示の一側面の画像処理装置は、独立した装置であってもよいし、１つの装置を構成している内部ブロックであってもよい。

本開示を適用した動画制作システムの一実施の形態の構成例を示す図である。カメラの構成例を示すブロック図である。クラウドサーバの構成例を示すブロック図である。端末装置の構成例を示すブロック図である。動作制作サービスの流れを表した全体フローを示す図である。動作制作アルゴリズムの例を示す図である。自動品質補正で行われる補正処理の例を示す図である。クラウドサーバにおける処理部の機能的な構成例を示すブロック図である。補正処理の第１の例の概要を示す図である。学習済みモデルを用いた補正アルゴリズムの例を示す図である。編集パラメータの例を示す図である。補正処理の第１の例で処理される画像の例を示す図である。補正処理の第１の例の流れを説明するフローチャートである。補正処理の第２の例の概要を示す図である。明るさとコントラストのパラメータの例を示す図である。明るさとコントラストのパラメータの例を示す図である。補正処理の第２の例の概要を示す図である。補正処理の第２の例の流れを説明するフローチャートである。補正処理の第２の例を実行する処理部の他の構成例を示す図である。図１９の処理部による補正処理の第２の例の流れを説明するフローチャートである。

＜システム構成例＞
　図１は、本開示を適用した動画制作システムの一実施の形態の構成例を示す図である。

　図１の動画制作システム１は、ユーザが撮影した撮影画像から動画を制作するシステムである。動画制作システム１は、カメラ１０、クラウドサーバ２０、及び端末装置３０から構成される。

　カメラ１０は、動画と静止画を撮影可能なデジタルカメラである。カメラ１０は、デジタルカメラに限らず、スマートフォンやタブレット型端末などの撮影機能を有する機器であってもよい。カメラ１０は、ユーザの操作に従い、被写体像を撮影し、その結果得られる撮影画像を記録する。

　撮影画像は、動画と静止画を含む。以下の説明では、撮影画像としての動画と、動画制作サービスにより自動制作される動画とを区別する必要がある場合、後者を制作動画と呼ぶ。

　カメラ１０により撮影された撮影画像は、クラウドサーバ２０に送信される。カメラ１０は、ネットワーク４０－１を介して、撮影画像をクラウドサーバ２０に送信することができる。あるいは、フラッシュメモリ等のメモリカードや、無線LAN(Local Area Network)等の無線通信などを利用して、カメラ１０から端末装置３０に撮影画像を転送することで、端末装置３０が、ネットワーク４０－２を介して、撮影画像をクラウドサーバ２０に送信してもよい。

　ネットワーク４０－１とネットワーク４０－２は、インターネットや携帯電話網などの通信回線を含む。ネットワーク４０－１とネットワーク４０－２は、同一のネットワークであってもよいし、異なるネットワークであってもよい。以下、ネットワーク４０－１とネットワーク４０－２を区別する必要がない場合、ネットワーク４０と呼ぶ。

　クラウドサーバ２０は、ネットワーク４０を通じて、撮影画像から制作動画を制作(自動制作)する動画制作サービスを提供するサーバである。クラウドサーバ２０は、本開示を適用した画像処理装置の一例である。クラウドサーバ２０は、カメラ１０により撮影された撮影画像を、ネットワーク４０を介して受信する。クラウドサーバ２０は、撮影画像に対する編集等の処理を行うことで制作動画を制作し、ネットワーク４０を介して端末装置３０に送信する。

　端末装置３０は、PC(Personal Computer)、タブレット型端末、スマートフォンなどの機器である。端末装置３０は、ユーザの操作に従い、動画制作サービスに関する設定や制作動画の編集などの処理を行う。端末装置３０は、ネットワーク４０を介してクラウドサーバ２０から送信されてくる制作動画を受信する。端末装置３０は、制作動画を端末内に記録したり、外部に出力したりする。

＜カメラの構成例＞
　図２は、図１のカメラ１０の構成例を示すブロック図である。

　図２に示すように、カメラ１０は、レンズ系１１１、撮像部１１２、カメラ信号処理部１１３、記録制御部１１４、表示部１１５、通信部１１６、操作部１１７、カメラ制御部１１８、メモリ部１１９、ドライバ部１２０、センサ部１２１、音入力部１２２、及び音処理部１２３から構成される。

　レンズ系１１１は、被写体からの入射光(像光)を取り込んで、撮像部１１２に入射させる。撮像部１１２は、CMOS(Complementary Metal Oxide Semiconductor)イメージセンサ等の固体撮像素子を有し、レンズ系１１１によって固体撮像素子の撮像面上に結像された入射光の光量を画素単位で電気信号に変換して画素信号として出力する。

　カメラ信号処理部１１３は、DSP(Digital Signal Processor)や、画像データを一時的に記録するフレームメモリ等から構成される。カメラ信号処理部１１３は、撮像部１１２から出力される画像信号に対し、各種の信号処理を行い、その結果得られる撮影画像の画像データを出力する。このように、レンズ系１１１と、撮像部１１２と、カメラ信号処理部１１３とから撮像系が構成される。

　記録制御部１１４は、撮像系で撮像された撮影画像の画像データを、フラッシュメモリ等のメモリカードを含む記憶媒体に記録する。表示部１１５は、液晶ディスプレイや有機ELディスプレイ等から構成され、撮像系で撮像された撮影画像を表示する。

　通信部１１６は、無線LANやセルラー方式の通信（例えば5G(5th Generation)）を含む無線通信などの所定の通信方式に対応した通信モジュール等から構成され、撮像系で撮像された撮影画像の画像データを、ネットワーク４０等を介してクラウドサーバ２０を含む他の機器に送信する。操作部１１７は、物理的なボタンやタッチパネルなどの操作系からなり、ユーザによる操作に応じて、カメラ１０が有する様々な機能についての操作指令を発する。

　カメラ制御部１１８は、CPU(Central Processing Unit)やマイクロプロセッサ等のプロセッサから構成され、カメラ１０の各部の動作を制御する。メモリ部１１９は、カメラ制御部１１８からの制御に従い、各種のデータを記録する。ドライバ部１２０は、カメラ制御部１１８からの制御に従い、オートフォーカスやズーム等を実現するためにレンズ系１１１を駆動する。

　センサ部１２１は、空間情報や時間情報等のセンシングを行い、そのセンシングの結果得られるセンサ信号を出力する。例えば、センサ部１２１は、ジャイロセンサや加速度センサ等の各種のセンサを含んで構成される。

　音入力部１２２は、マイク等から構成され、ユーザの声や環境音などの音を集音し、その結果得られる音信号を出力する。音処理部１２３は、音入力部１２２から出力される音信号に対し、音信号処理を行う。音処理部１２３からの音信号は、カメラ信号処理部１１３に入力され、カメラ制御部１１８からの制御に従って画像信号と同期して処理されることで、動画の音(音声)として記録される。

＜クラウドサーバの構成例＞
　図３は、図１のクラウドサーバ２０の構成例を示すブロック図である。

　図３に示すように、クラウドサーバ２０において、CPU２１１と、ROM(Read Only Memory)２１２と、RAM(Random Access Memory)２１３は、バス２１４により相互に接続される。バス２１４には、さらに入出力I/F２１５が接続される。入出力I/F２１５には、入力部２１６、出力部２１７、記憶部２１８、及び通信部２１９が接続される。

　入力部２１６は、各種の入力信号を、入出力I/F２１５を介してCPU２１１を含む各部に供給する。例えば、入力部２１６は、キーボード、マウス、マイクなどから構成される。

　出力部２１７は、入出力I/F２１５を介してCPU２１１からの制御に従い、各種の情報を出力する。例えば、出力部２１７は、ディスプレイ、スピーカなどから構成される。

　記憶部２１８は、半導体メモリ、HDD(Hard Disk Drive)等の補助記憶装置として構成される。記憶部２１８は、CPU２１１からの制御に従い、各種のデータやプログラムを記録する。CPU２１１は、記憶部２１８から各種のデータを読み出して処理したり、プログラムを実行したりする。

　通信部２１９は、無線LANやセルラー方式の通信(例えば5G)などの無線通信、又は有線通信に対応した通信モジュールなどから構成される。通信部２１９は、CPU２１１からの制御に従い、ネットワーク４０を介して、カメラ１０及び端末装置３０を含む他の機器と通信を行う。

　なお、図３に示したクラウドサーバ２０の構成は一例であり、例えばGPU(Graphics Processing Unit)等の専用のプロセッサを設けて、画像処理が行われるようにしてもよい。

＜端末装置の構成例＞
　図４は、図１の端末装置３０の構成例を示すブロック図である。

　図４に示すように、端末装置３０において、CPU３１１と、ROM３１２と、RAM３１３は、バス３１４により相互に接続される。バス３１４には、さらに入出力I/F３１５が接続される。入出力I/F３１５には、入力部３１６、出力部３１７、記憶部３１８、及び通信部３１９が接続される。

　入力部３１６は、各種の入力信号を、入出力I/F３１５を介してCPU３１１を含む各部に供給する。例えば、入力部３１６は、操作部３２１を有する。操作部３２１は、キーボード、マウス、マイク、物理的なボタン、タッチパネル等から構成される。操作部３２１は、ユーザによって操作され、その操作に対応する操作信号をCPU３１１に供給する。

　出力部３１７は、入出力I/F３１５を介してCPU３１１からの制御に従い、各種の情報を出力する。例えば、出力部３１７は、表示部３３１、及び音出力部３３２を有する。

　表示部３３１、液晶ディスプレイや有機ELディスプレイなどから構成される。表示部３３１は、CPU３１１からの制御に従い、撮影画像や編集画面等を表示する。音出力部３３２は、スピーカや出力端子に接続されるヘッドホンなどから構成される。音出力部３３２は、CPU３１１からの制御に従い、音信号に応じた音を出力する。

　記憶部３１８は、半導体メモリ等の補助記憶装置として構成される。記憶部３１８は、内部ストレージとして構成されてもよいし、メモリカード等の外部ストレージであってもよい。記憶部３１８は、CPU３１１からの制御に従い、各種のデータやプログラムを記録する。CPU３１１は、記憶部３１８から各種のデータを読み出して処理したり、プログラムを実行したりする。

　通信部３１９は、無線LANやセルラー方式の通信（例えば5G）などの無線通信、又は有線通信などの所定の通信方式に対応した通信モジュールなどから構成される。通信部３１９は、CPU３１１からの制御に従い、ネットワーク４０を介してクラウドサーバ２０を含む他の機器と通信を行う。

　なお、図４に示した端末装置３０の構成は一例であり、例えばGPU等の専用のプロセッサを設けて、画像処理が行われるようにしてもよい。

　以上のように構成される動画制作システム１では、カメラ１０により撮影された撮影画像がクラウドサーバ２０にアップロードされ、クラウドサーバ２０により撮影画像を用いた編集等の処理が行われることで、制作動画が制作される。端末装置３０では、制作動画に関する設定や編集など行われ、完成した制作動画が出力される。

　なお、図１の動画制作システム１では、説明を簡略化するために、１台のカメラ１０と１台の端末装置３０がそれぞれ設けられた構成を示したが、動画制作サービスを利用するユーザごとに、１又は複数台のカメラ１０と１又は複数台の端末装置３０が設けられる。カメラ１０と端末装置３０は、同一のユーザにより操作されてもよいし、異なるユーザにより操作されてもよい。クラウドサーバ２０は、データセンタ等に設置されるが、１台のサーバに限らず、複数台のサーバから構成されるようにして、動画制作サービスを提供してもよい。

＜全体フロー＞
　図５は、動画制作システム１におけるクラウドサーバ２０により提供される動画制作サービスの流れを表した全体フローを示す図である。図５に示した全体フローは、左側から右側に向かう方向を時間の方向として、撮影前と、撮影中と、編集中と、関係者レビューとに分けられる。

　撮影前においては、プロジェクトの作成(Ｓ１)と、撮影画像の自動転送設定(Ｓ２)が行われる。プロジェクトの作成では、ユーザによりプロジェクト名が入力され、制作動画の制作に関する情報を管理するためのプロジェクトが作成される。撮影画像の自動転送設定では、カメラ１０により撮影された撮影画像の自動転送先が設定される。例えば、自動転送先として、クラウドサーバ２０のロケーション情報(URL(Uniform Resource Locator)等)が設定される。

　プロジェクトの作成や自動転送設定は、ユーザの操作によって、カメラ１０又は端末装置３０から行うことができる。あるいは、ユーザが所持するスマートフォン等の他の機器から設定しても構わない。

　撮影中においては、動画の自動制作(Ｓ３)が行われる。動画の自動制作では、クラウドサーバ２０により、カメラ１０から転送された撮影画像を用いた制作動画が制作される。詳細は後述するが、動画の自動制作では、撮影画像を用いて、自動セレクション、自動トリミング、及び自動品質補正などの処理が行われる。

　編集中においては、動画の追加編集(Ｓ４)が行われる。動画の追加編集では、端末装置３０により、ユーザの操作に応じて、制作動画が追加で編集される。この追加編集は必須ではなく、ユーザが、制作動画を編集する必要がないと判断した場合には、追加編集を行う必要はない。

　関係者レビューにおいては、動画の出力と共有(Ｓ５)が行われる。動画の出力と共有では、端末装置３０により、必要に応じて追加編集された制作動画が所定形式で出力されて、関係者に共有される。これにより、当該制作動画が関係者によりレビューされ、レビューの結果に応じて適宜修正された後に納品される。

　図６は、図５の動画の自動制作(Ｓ３)での動画制作時に用いられる動画制作アルゴリズムの例を示す図である。

　図６に示すように、動画制作アルゴリズムには、自動セレクション、自動トリミング、及び自動品質補正などの処理が含まれ、これらの処理が行われることで制作動画が制作される。

　自動セレクションでは、動画や静止画を含む撮影画像(クリップ)がシーンごとにグループ化(グルーピング)され、シーンごとに適切な撮影画像が選択される。自動トリミングでは、動画(クリップ)のトリミング範囲が、インポイント(開始点)とアウトポイント(終了点)により指定される。撮影時にユーザによる操作に応じたショットマーク(図中の旗印)が撮影画像に付与されている場合には、当該マークを中心にして時間的にその前後が切り取られるようにする。クリップとは、クラウドサーバ２０等の機器に取り込まれた撮影画像のことを表す。

　自動品質補正では、撮影画像(クリップ)に対し、各種の補正が施されて品質が向上される。例えば、複数クリップ間の露出補正(明るさ補正)、複数クリップ間の色合い補正(色補正)、音のノイズ除去、手振れ補正、パンやズーム等の動画効果、音声レベルの均一化などの処理が行われる。

　ここでは、動画制作アルゴリズムとして、自動セレクション、自動トリミング、及び自動品質補正を例示したが、制作動画を制作するために必要な処理であれば、それ以外の他の処理が追加されても構わない。

＜自動品質補正の例＞
　図７は、自動品質補正で行われる補正処理の例を示す図である。図７では、補正処理として、撮影画像を含む入力画像の色補正が行われる場合を例示している。

　図７に示すように、本開示を適用した補正処理では、入力画像Ａの補正(例えば色補正)を行うに際して、補正の目標(Exemplar：例えば目標の色味)となる目標画像Ｂを用いた補正を行うことで、補正された補正画像Ｄを出力する。具体的には、本開示を適用した補正処理では、入力画像Ａに対し、画素単位の補正と画像フレーム単位の補正とが、２段階で行われる。

　入力画像Ａは、カメラ１０により撮影された動画や静止画等の撮影画像である。入力画像Ａは、撮影画像に対し、自動セレクションや自動トリミングなどの処理を施したものであっても構わない。目標画像Ｂは、カメラ１０により撮影された撮影画像であってもよいし、撮影画像以外の他の画像(例えば予め用意していた画像)であってもよい。

＜機能的な構成例＞
　図８は、クラウドサーバ２０における処理部２００の機能的な構成例を示すブロック図である。処理部２００は、CPU２１１やGPU等のプロセッサによって、動画制作プログラム等のプログラムが実行されることで実現される。あるいは、処理部２００を専用の回路として実現してもよい。

　図８において、処理部２００では、撮影画像を含む入力画像Ａに対し、第１の単位と第２の単位で２段階の補正が行われる。例えば、第１の単位は画素単位であり、第２の単位は画像フレーム単位である。処理部２００は、画素単位補正部２５１、パラメータ推定部２５２、及び画像フレーム補正部２５３を有する。

　画素単位補正部２５１には、入力画像Ａと目標画像Ｂが入力される。画素単位補正部２５１は、入力画像Ａと目標画像Ｂを用い、画素単位での補正を行い、その結果得られる中間補正画像Ｃを、パラメータ推定部２５２に供給する。画素単位の補正では、入力画像Ａの色補正や明るさ補正等の補正が行われる。

　パラメータ推定部２５２には、入力画像Ａ又は入力画像Ａ及び目標画像Ｂと、画素単位補正部２５１からの中間補正画像Ｃが入力される。パラメータ推定部２５２は、入力画像Ａと中間補正画像Ｃを用い、入力画像Ａの全領域(画像フレーム全体)に対する補正用のパラメータである編集パラメータＰを推定し、画像フレーム補正部２５３に供給する。あるいは、パラメータ推定部２５２は、入力画像Ａ及び目標画像Ｂと中間補正画像Ｃを用い、編集パラメータＰを推定し、画像フレーム補正部２５３に供給する。

　画像フレーム補正部２５３には、入力画像Ａと、パラメータ推定部２５２からの編集パラメータＰが入力される。画像フレーム補正部２５３は、編集パラメータＰを用い、入力画像Ａに対し、画像フレーム単位での補正を行い、その結果得られる補正画像Ｄを出力する。画像フレーム単位の補正では、画素単位の補正に対応した補正として、入力画像Ａの色補正や明るさ補正等の補正が行われる。

　以上のように構成される処理部２００では、入力画像Ａに対し、画素単位補正部２５１による画素単位の補正と、画像フレーム補正部２５３による編集パラメータＰを用いた画像フレーム単位の補正とが行われることで、補正が２段階で行われている。このような２段階の補正を行うことで、撮影画像に対する補正の精度を向上させることができる。例えば、２段階の補正を行うことにより、前段の画素単位の補正のみを行う場合と比べて、補正の破綻を抑制することができる。

　以下、処理部２００で行われる２段階の補正処理として、第１の例と第２の例の２パターンについて説明する。

＜補正処理の第１の例＞
　図９は、図８の処理部２００により実行される補正処理の第１の例の概要を示す図である。図９の説明では、図１０乃至図１２を適宜参照しながら説明する。

　補正処理の第１の例では、撮影画像等の入力画像Ａ１１に対して２段階の補正が行われる。すなわち、補正処理の第１の例では、入力画像Ａ１１と目標画像Ｂ１１を用いた画素単位の補正で得られる中間補正画像Ｃ１１から編集パラメータＰ１１が推定され、当該編集パラメータＰ１１を用いて、入力画像Ａ１１に対して画像フレーム単位の補正が行われる。図９においては、撮影画像等の入力画像Ａ１１に対する補正処理として、色補正が行われる場合を例示する。

　画素単位補正部２５１には、入力画像Ａ１１と目標画像Ｂ１１が入力される。画素単位補正部２５１は、目標画像Ｂ１１を用いて、入力画像Ａ１１を画素単位で色補正し、その結果得られる中間補正画像Ｃ１１を、パラメータ推定部２５２に供給する。

　画素単位の補正処理としては、図１０に示すように、機械学習により学習された学習済みモデル２６１を用いることができる。学習済みモデル２６１に対し、入力画像Ａ１１と目標画像Ｂ１１を入力することで、その出力の補正結果として中間補正画像Ｃ１１を得ることができる。

　学習済みモデル２６１は、学習データとしての画像を入力とし、色補正後の画像を出力として学習したDNN(Deep Neural Network)を用いることができる。このようなDNNをベースにした補正アルゴリズムは、公知の技術を用いることができる。学習済みモデル２６１を用いた色補正が行われることで、入力画像Ａ１１を、目標画像Ｂ１１の色味に変換することができる。

　画素単位の補正処理では、全ての処理又は一部の処理を、学習済みモデル２６１を用いて処理することができる。例えば、学習済みモデル２６１を用いた処理と、入力画像Ａ１１や目標画像Ｂ１１に対する画像処理とを組み合わせた処理が行われてもよい。あるいは、画素単位の補正処理で、学習済みモデル２６１を用いない場合には、画像処理やルールベースの処理などを用いても構わない。

　パラメータ推定部２５２には、入力画像Ａ１１と、画素単位補正部２５１からの中間補正画像Ｃ１１が入力される。パラメータ推定部２５２は、入力画像Ａ１１と中間補正画像Ｃ１１との対応関係から編集パラメータＰ１１を推定し、画像フレーム補正部２５３に供給する。

　編集パラメータＰ１１は、入力画像Ａ１１の全領域(画像フレーム全体)に対する補正用のパラメータである。編集パラメータＰ１１としては、一般的な画像編集ソフトウェアで用いられるパラメータを含めることができる。例えば、トーンカーブ、レベル補正などの画像編集処理で用いられるパラメータを用いることができる。

　図１１のＡ乃至Ｃに示すように、横軸を入力画像Ａ１１のＲＧＢ値とし、縦軸を中間補正画像Ｃ１１のＲＧＢ値としたとき、ＲＧＢ値ごとのトーンカーブ２７１Ｒ，２７１Ｇ，２７１Ｂによって、画像フレーム全体の色味を調整することができる。パラメータ推定部２５２では、このトーンカーブによる色味の調整に関するパラメータを、編集パラメータＰ１１として推定することができる。

　画像フレーム補正部２５３には、入力画像Ａ１１と、パラメータ推定部２５２からの編集パラメータＰ１１が入力される。画像フレーム補正部２５３は、編集パラメータＰ１１を用いて、入力画像Ａ１１を画像フレーム単位で色補正し、その結果得られる補正画像Ｄ１１を出力する。

　このように、画像フレーム補正部２５３では、編集パラメータＰ１１として、一般的な画像編集ソフトウェアに適合したパラメータ(トーンカーブのパラメータ等)を用い、入力画像Ａ１１に対し、補正をかけなおしている。すなわち、画素単位の補正処理では、画像フレームにおいて部分的に補正が破綻している箇所がでてくる恐れがあるが、編集パラメータＰ１１を用いた画像フレーム単位の補正によって、２段階で補正を行うことで、補正の破綻を抑制することができる。

　具体的には、図１２に示すように、入力画像Ａ１１と目標画像Ｂ１１を用いた画素単位の補正で得られる中間補正画像Ｃ１１は、画像フレーム全体としては適切な補正が施されているようにも見えるが、ある部分(例えば手の部分)では補正が破綻している。そこで、２段階での補正により、編集パラメータＰ１１を用い、入力画像Ａ１１を画像フレーム単位で補正することで、補正の破綻が抑制された補正画像Ｄ１１を得ることができる。

　また、編集パラメータＰ１１として、一般的な画像編集ソフトウェアに適合したパラメータを出力可能であるため、画像フレーム補正部２５３では、特定の画像編集ソフトウェアに限られず、各社の画像編集ソフトウェアにより補正処理を行うことができる。また、画像フレーム補正部２５３では、画像編集ソフトウェアにより、編集パラメータＰ１１を用いてトーンカーブを補正しているだけなので、全体的な破綻が生じることはなく、色味のみを補正することができる。

　次に、図１３のフローチャートを参照して、図９に示した構成を有する処理部２００により実行される補正処理の第１の例の流れを説明する。

　ステップＳ１１１において、画素単位補正部２５１は、そこに入力される入力画像Ａ１１と目標画像Ｂ１１を用いた画素単位の補正(例えば色補正)を行い、中間補正画像Ｃ１１を得る。

　ステップＳ１１２において、パラメータ推定部２５２は、入力画像Ａ１１と中間補正画像Ｃ１１との対応関係から編集パラメータＰ１１を推定する。例えば、編集パラメータＰ１１として、トーンカーブのパラメータが推定される。

　ステップＳ１１３において、画像フレーム補正部２５３は、入力画像Ａ１１に対し、編集パラメータＰ１１を用いた画像フレーム単位の補正(例えば色補正)を行い、補正画像Ｄ１１を得る。

　ここでは、例えば、一般的な画像編集ソフトウェアによって、編集パラメータＰ１１としてのトーンカーブのパラメータを用いた色味の調整する補正処理が行われる。ステップＳ１１３の処理が終了すると、一連の補正処理は終了する。

　以上のように、補正処理の第１の例では、目標画像Ｂ１１を用いて入力画像Ａ１１(撮影画像等)が第１の単位(画素単位)で補正され、入力画像Ａ１１と、入力画像Ａ１１と目標画像Ｂ１１から得られた中間補正画像Ｃ１１との関係に基づき編集パラメータＰ１１(トーンカーブ等のパラメータ)が推定され、編集パラメータＰ１１を用いて入力画像Ａ１１(撮影画像等)が第２の単位(画像フレーム単位)で補正される。このような２段階の補正を行うことで、補正の破綻を抑制することができ、補正の精度を向上させることができる。

　入力画像Ａ１１としての撮影画像は、撮影時の被写体や光の状況などで色合い等が、それぞれで異なった状態となる。動画制作システム１においては、動画制作サービスを提供するに際して、このような状態を回避するために、制作動画の制作に用いる撮影画像が決定した時点で、補正処理の第１の例を適用することで、対象の撮影画像の色合いを均一に揃えることができる。これにより、ユーザが制作動画を視聴するときの違和感を軽減し、制作動画の完成度を向上させることができる。このような補正処理が自動で行われない場合に、編集の知識があるユーザであれば、これを手動で行うが、手間と時間がかかってしまう。当該補正処理により、編集の知識があるユーザは自動化により省力化することが可能となる一方で、編集の知識がないユーザであれば、今までできなかったことが可能となる。

　なお、上述した補正処理の第１の例の説明では、補正処理として色補正が行われる場合について説明したが、明るさ補正など他の補正が行われてもよい。例えば、明るさ補正を行う場合、画素単位補正部２５１における学習済みモデル２６１として、明るさ補正後の画像を出力するように学習された学習済みモデルを用い、画像フレーム補正部２５３で用いられる編集パラメータＰ１１として、明るさの調整に関するパラメータが推定されるようにすればよい。

＜補正処理の第２の例＞
　図１４は、図８の処理部２００により実行される補正処理の第２の例の概要を示す図である。図１４の説明では、図１５乃至図１７を適宜参照しながら説明する。

　補正処理の第２の例では、撮影画像等の入力画像Ａ２１に対して２段階の補正を行が行われる。すなわち、補正処理の第２の例では、入力画像Ａ２１と目標画像Ｂ２１のそれぞれを別個に用いた画素単位の補正で得られる中間補正画像Ｃ２１，Ｃ２１から編集パラメータＰ２１，Ｐ２３が推定され、当該編集パラメータＰ２１，Ｐ２３を用いて、入力画像Ａ２１に対して画像フレーム単位の補正が行われる。図１４においては、撮影画像等の入力画像Ａ２１に対する補正処理として、明るさ補正が行われる場合を例示する。

　画素単位補正部２５１－１は、そこに入力される入力画像Ａ２１に対し、画素単位で明るさ補正を行い、その結果得られる中間補正画像Ｃ２１を、パラメータ推定部２５２－１に供給する。

　画素単位の補正処理としては、例えばAE(Automatic Exposure)補正などの自動補正が行われる。この自動補正では、機械学習により学習された学習済みモデルを用いることができる。学習済みモデルに対し、入力画像Ａ２１を入力することで、その出力の補正結果として中間補正画像Ｃ２１を得ることができる。学習済みモデルは、学習データとしての画像を入力とし、明るさ補正後の画像を出力として学習したDNNを用いることができる。このようなDNNをベースにした補正アルゴリズムは、公知の技術を用いることができる。

　画素単位の補正処理では、全ての処理又は一部の処理を、学習済みモデルを用いて処理することができる。例えば、学習済みモデルを用いた処理と、入力画像Ａ２１に対する画像処理とを組み合わせた処理が行われてもよい。あるいは、画素単位の補正処理で、学習済みモデルを用いない場合には、画像処理やルールベースの処理などを用いても構わない。

　パラメータ推定部２５２－１には、入力画像Ａ２１と、画素単位補正部２５１－１からの中間補正画像Ｃ２１が入力される。パラメータ推定部２５２－１は、入力画像Ａ２１と中間補正画像Ｃ２１との対応関係から編集パラメータＰ２１を推定し、画像フレーム補正部２５３－１に供給する。

　編集パラメータＰ２１は、入力画像Ａ２１の全領域(画像フレーム全体)に対する補正用のパラメータである。編集パラメータＰ２１としては、一般的な画像編集ソフトウェアで用いられるパラメータを含めることができる。

　図１５に示すように、編集パラメータＰ２１としては、例えば、明るさ(brightness)やコントラスト(contrast)のパラメータを用いることができる。図１６のＡにおいては、横軸と縦軸を入力と出力として、入出力の明るさの対応関係を、一律にオフセットを付けて調整できることを、図中の実線と破線の関係で表している。図１６のＢにおいては、入出力のコントラストの対応関係の傾きを調整できることを、図中の実線と破線の関係で表している。

　画素単位補正部２５１－２は、そこに入力される目標画像Ｂ２１に対し、画素単位で明るさ補正を行い、その結果得られる中間補正画像Ｃ２２を、パラメータ推定部２５２－２に供給する。画素単位補正部２５１－２では、画素単位補正部２５１－１と同様の画素単位の補正処理が行われる。

　パラメータ推定部２５２－２には、目標画像Ｂ２１と、画素単位補正部２５１－２からの中間補正画像Ｃ２２が入力される。パラメータ推定部２５２－２は、目標画像Ｂ２１と中間補正画像Ｃ２２との対応関係から編集パラメータＰ２２を推定する。パラメータ推定部２５２－２では、パラメータ推定部２５２－１と同様に、明るさに関するパラメータが推定される。

　また、パラメータ推定部２５２－２は、編集パラメータＰ２２と逆方向の補正を行う編集パラメータＰ２３をさらに推定し、画像フレーム補正部２５３－２に供給する。

　すなわち、補正処理の第２の例では、画素単位の補正処理として、上述した補正処理の第１の例のように目標値を入力するような補正アルゴリズムではなく、AE補正等の自動補正を行うアルゴリズムを用いているため、自動補正の結果得られる画像の明るさがほぼ同じであることを前提として処理が行われるようにしている。

　ここで、図１７に示すように、パラメータ推定部２５２－１，２５２－２の後段に、画像フレーム補正部２５４を設けて、画像フレーム補正部２５４によって、編集パラメータＰ２１，Ｐ２２を用いた補正が行われる場合を想定する。画像フレーム補正部２５４－１では、入力画像Ａ２１に対し、編集パラメータＰ２１を用いた明るさ補正が行われ、補正画像Ｄ２１が得られる。また、画像フレーム補正部２５４－２では、編集パラメータＰ２２を用いた明るさ補正が行われ、補正画像Ｄ２２が得られる。

　このような補正で得られた補正画像Ｄ２１と補正画像Ｄ２２とは、似通った明るさの画像となる。図１７に示した画像フレーム補正部２５４による補正処理は実際には実行されないが、当該補正処理で得られる補正画像Ｄ２１，Ｄ２２が似通った明るさになるという関係を利用として、補正処理の第２の例が行われている。

　図１４の説明に戻り、画像フレーム補正部２５３－１には、入力画像Ａ２１と、パラメータ推定部２５２－１からの編集パラメータＰ２１が入力される。画像フレーム補正部２５３－１は、入力画像Ａ２１に対し、編集パラメータＰ２１を用いた明るさ補正を行い、その結果得られる補正画像Ｅ２１を、画像フレーム補正部２５３－２に供給する。

　画像フレーム補正部２５３－２には、画像フレーム補正部２５３－１からの補正画像Ｅ２１と、パラメータ推定部２５２－２からの編集パラメータＰ２３が入力される。画像フレーム補正部２５３－２は、補正画像Ｅ２１に対し、編集パラメータＰ２３を用いた明るさ補正(逆変換)を行い、その結果得られる補正画像Ｆ２１を出力する。

　このように、自動補正の結果得られる画像の明るさがほぼ同じであることを前提として、編集パラメータＰ２１を用いた明るさ補正の後に、編集パラメータＰ２３を用いた明るさ補正を行って、画像の明るさを戻す(逆変換する)ことで、画像の明るさを目標値に近づけている。

　このような自動補正と編集パラメータを用いた補正との２段階での補正では、編集パラメータＰ２１，Ｐ２３を用いて、入力画像Ａ２１を画像フレーム単位で補正することで、補正の破綻が抑制された補正画像Ｆ２１を得ることができる。また、編集パラメータＰ２１と編集パラメータＰ２３としては、明るさに関するパラメータなど、一般的な画像編集ソフトウェアに適合したパラメータが用いられるため、画像フレーム補正部２５３－１と画像フレーム補正部２５３－２では、各社の画像編集ソフトウェアにより補正処理を行うことができる。

　次に、図１８のフローチャートを参照して、図１４に示した構成を有する処理部２００により実行される補正処理の第２の例の流れを説明する。

　ステップＳ１３１において、画素単位補正部２５１－１は、そこに入力される入力画像Ａ２１に対し、AE等の自動補正(例えば明るさ補正)を行い、中間補正画像Ｃ２１を得る。

　ステップＳ１３２において、パラメータ推定部２５２－１は、入力画像Ａ２１と中間補正画像Ｃ２１との対応関係から編集パラメータＰ２１を推定する。例えば、編集パラメータＰ２１としては、「brightness ＋0.2」などの、明るさに関するパラメータが推定される。

　ステップＳ１３１，Ｓ１３２による入力画像Ａ２１に対する処理が完了すると、処理はステップＳ１３６に進められる。

　ステップＳ１３３において、画素単位補正部２５１－２は、そこに入力される目標画像Ｂ２１に対し、AE等の自動補正(例えば明るさ補正)を行い、中間補正画像Ｃ２２を得る。

　ステップＳ１３４において、パラメータ推定部２５２－２は、目標画像Ｂ２１と中間補正画像Ｃ２２との対応関係から編集パラメータＰ２２を推定する。また、ステップＳ１３５において、パラメータ推定部２５２－２は、編集パラメータＰ２２と逆方向の補正を行う編集パラメータＰ２３を推定する。

　例えば、編集パラメータＰ２２として、「brightness -0.1」であるパラメータが推定された場合、当該パラメータを用いた補正とは逆方向の補正を行うための編集パラメータＰ２３として、「brightness ＋0.1」であるパラメータが推定される。

　ステップＳ１３３乃至Ｓ１３５による目標画像Ｂ２１に対する処理が完了すると、処理はステップＳ１３６に進められる。ステップＳ１３１，Ｓ１３２と、ステップＳ１３３乃至Ｓ１３５とは、並列に処理を行うことができる。

　ステップＳ１３６において、画像フレーム補正部２５３－１は、そこに入力される入力画像Ａ２１に対し、編集パラメータＰ２１を用いた補正(例えば明るさ補正)を行い、補正画像Ｅ２１を得る。例えば、「brightness ＋0.2」である編集パラメータＰ２１を用いて入力画像Ａ２１が補正されることで、補正画像Ｅ２１が得られる。

　ステップＳ１３７において、画像フレーム補正部２５３－２は、補正画像Ｅ２１に対し、編集パラメータＰ２３を用いた補正（例えば明るさ補正）を行い、補正画像Ｆ２１を得る。例えば、「brightness ＋0.1」である編集パラメータＰ２３を用いて補正画像Ｅ２１が補正されることで、最終的な補正画像Ｆ２１が得られる。ステップＳ１３７の処理が終了すると、一連の補正処理は終了する。

　以上のように、補正処理の第２の例では、入力画像Ａ２１(撮影画像等)が第１の単位(画素単位)で補正され、入力画像Ａ２１と、入力画像Ａ２１から得られた中間補正画像Ｃ２１との関係に基づき編集パラメータＰ２１(明るさ等に関するパラメータ)が推定されるともに、目標画像Ｂ２１が第１の単位(画素単位)で補正され、目標画像Ｂ２１と、目標画像Ｂ２１から得られた中間補正画像Ｃ２２との関係に基づき編集パラメータＰ２２(明るさ等に関するパラメータ)が推定される。そして、推定された編集パラメータＰ２２を用いた補正と逆方向の補正を行う編集パラメータＰ２３が推定され、推定された編集パラメータＰ２１及び編集パラメータＰ２３を用いて、入力画像Ａ２１(撮影画像等)が第２の単位(画像フレーム単位)で補正される。このような２段階の補正を行うことで、補正の破綻を抑制することができ、補正の精度を向上させることができる。

　入力画像Ａ１１としての撮影画像は、撮影時の被写体や光の状況などで明るさ等が、それぞれで異なった状態となる。動画制作システム１においては、動画制作サービスを提供するに際して、このような状態を回避するために、制作動画の制作に用いる撮影画像が決定した時点で、補正処理の第２の例を適用することで、対象の撮影画像の明るさを均一に揃えることができる。

＜補正処理の第２の例の他の構成＞
　図１９は、補正処理の第２の例を実行する処理部２００の他の構成例を示す図である。

　図１９に示した構成では、図１４に示した構成と比べて、パラメータ推定部２５２－１とパラメータ推定部２５２－２の後段に、パラメータ統合部２５５が設けられた構成となっている。

　パラメータ統合部２５５には、パラメータ推定部２５２－１からの編集パラメータＰ２１と、パラメータ推定部２５２－２からの編集パラメータＰ２３が入力される。

　編集パラメータＰ２１は、入力画像Ａ２１と中間補正画像Ｃ２１との対応関係から推定されたパラメータである。編集パラメータＰ２３は、目標画像Ｂ２１と中間補正画像Ｃ２２との対応関係から推定された編集パラメータＰ２２を用いた補正とは逆方向の補正を行うためのパラメータである。

　パラメータ統合部２５５は、編集パラメータＰ２１と編集パラメータＰ２３を統合した編集パラメータＰ２４を推定し、画像フレーム補正部２５３に供給する。

　画像フレーム補正部２５３には、入力画像Ａ２１と、パラメータ統合部２５５からの編集パラメータＰ２４が入力される。画像フレーム補正部２５３は、入力画像Ａ２１に対し、編集パラメータＰ２４を用いた明るさ補正を行い、その結果得られる補正画像Ｆ２１を出力する。

　次に、図２０のフローチャートを参照して、図１９に示した構成を有する処理部２００により実行される補正処理の第２の例の流れを説明する。

　ステップＳ１５１，Ｓ１５２においては、図１８のステップＳ１３１，Ｓ１３２と同様に、入力画像Ａ２１が自動補正され、入力画像Ａ２１と中間補正画像Ｃ２１との対応関係から編集パラメータＰ２１が推定される。

　ステップＳ１５３乃至Ｓ１５５においては、図１８のステップＳ１３３乃至Ｓ１３５と同様に、目標画像Ｂ２１が自動補正され、目標画像Ｂ２１と中間補正画像Ｃ２２との対応関係から推定される編集パラメータＰ２２の逆方向の補正を行う編集パラメータＰ２３が推定される。

　ステップＳ１５６において、パラメータ統合部２５５は、編集パラメータＰ２１と編集パラメータＰ２３を統合した編集パラメータＰ２４を推定する。例えば、編集パラメータＰ２１として「brightness ＋0.2」、編集パラメータＰ２３として「brightness ＋0.1」であるパラメータがそれぞれ推定された場合、それらのパラメータを統合して、「brightness ＋0.3」である編集パラメータＰ２４が推定される。

　ステップＳ１５７において、画像フレーム補正部２５３は、そこに入力される入力画像Ａ２１に対し、編集パラメータＰ２４を用いた補正を行い、補正画像Ｆ２１を得る。例えば、「brightness ＋0.3」である編集パラメータＰ２４を用いて入力画像Ａ２１が補正されることで、最終的な補正画像Ｆ２１が得られる。ステップＳ１５７の処理が終了すると、一連の補正処理は終了する。

　このように、２つの編集パラメータＰ２１，Ｐ２３を統合して得られる編集パラメータＰ２４を用いて補正処理を行うことで、２つの編集パラメータＰ２１，Ｐ２３ごとに補正処理を行う構成と比べて、補正処理を１つにまとめることができるため、処理負荷を軽減することができる。

　なお、上述した補正処理の第２の例の説明では、補正処理として明るさ補正が行われる場合について説明したが、色補正など他の補正が行われてもよい。例えば、色補正を行う場合には、画素単位補正部２５１における自動補正として、AWB(Auto White Balance)等の自動補正を行い、編集パラメータＰ２１乃至Ｐ２４として、トーンカーブ等のパラメータが推定されるようにすればよい。

＜変形例＞
　上述した説明では、動画制作システム１において、クラウドサーバ２０の処理部２００が補正処理を実行するとして説明したが、クラウドサーバ２０以外の機器で処理が実行されても構わない。例えば、端末装置３０の処理部が、処理部２００に対応した機能を有することで、補正処理の全部又は一部を実行してもよい。

　上述したフローチャートの各ステップの処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、各装置のコンピュータにインストールされる。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体に記録して提供することができる。また、プログラムは、LAN、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体をドライブに装着することにより、入出力I/Fを介して、記憶部にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部で受信し、記憶部にインストールすることができる。その他、プログラムは、ROMや記憶部に、あらかじめインストールしておくことができる。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば並列処理あるいはオブジェクトによる処理)も含む。

　また、プログラムは、１のコンピュータ(プロセッサ)により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されてもよい。

　本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　本明細書において、「自動」と記載した場合、クラウドサーバ２０等の機器が、ユーザの直接的な操作を介さずに処理を行うことを意味し、「手動」と記載した場合、ユーザの直接的な操作を介して処理を行うことを意味する。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、本開示は、以下のような構成をとることができる。

（１）
　撮影画像を、第１の単位で補正し、
　前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、
　推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する
　処理部を備える
　画像処理装置。
（２）
　前記第１の単位は、画素単位であり、
　前記第２の単位は、画像フレーム単位であり、
　前記パラメータは、前記撮影画像の全領域に対する補正用のパラメータである
　前記（１）に記載の画像処理装置。
（３）
　前記処理部は、
　　補正の目標となる目標画像を用いて、前記撮影画像を前記第１の単位で補正し、
　　前記撮影画像と、前記撮影画像と前記目標画像から得られた前記中間補正画像との関係に基づいて、前記パラメータを推定する
　前記（２）に記載の画像処理装置。
（４）
　前記処理部は、機械学習により学習された学習済みモデルを用い、前記撮影画像と前記目標画像から、前記撮影画像を前記第１の単位で補正する
　前記（３）に記載の画像処理装置。
（５）
　前記学習済みモデルは、学習データとしての画像を入力とし、補正後の画像を出力として学習したDNN(Deep Neural Network)である
　前記（４）に記載の画像処理装置。
（６）
　前記処理部は、画像編集ソフトウェアによる前記パラメータを用いた補正処理により、前記撮影画像を前記第２の単位で補正する
　前記（２）乃至（５）のいずれかに記載の画像処理装置。
（７）
　前記パラメータは、トーンカーブに関するパラメータを含む
　前記（６）に記載の画像処理装置。
（８）
　前記処理部は、
　　前記撮影画像を前記第１の単位で補正し、
　　前記撮影画像と、前記撮影画像の補正で得られる第１の中間補正画像との関係に基づいて、前記撮影画像に対する補正用の第１のパラメータを推定し、
　　補正の目標となる目標画像を前記第１の単位で補正し、
　　前記目標画像と、前記目標画像の補正で得られる第２の中間補正画像との関係に基づいて、前記撮影画像に対する補正用の第２のパラメータを推定し、
　　推定された前記第２のパラメータを用いた補正と逆方向の補正を行う第３のパラメータを推定し、
　　推定された前記第１のパラメータ及び前記第３のパラメータを用いて、前記撮影画像を前記第２の単位で補正する
　前記（２）に記載の画像処理装置。
（９）
　前記処理部は、
　　推定された前記第１のパラメータを用いて、前記撮影画像を前記第２の単位で補正し、
　　推定された前記第３のパラメータを用いて、前記第１のパラメータを用いて補正された前記撮影画像を前記第２の単位で補正する
　前記（８）に記載の画像処理装置。
（１０）
　前記処理部は、
　　前記第１のパラメータと前記第３のパラメータを統合した第４のパラメータを推定し、
　　推定された前記第４のパラメータを用いて、前記撮影画像を前記第２の単位で補正する
　前記（８）に記載の画像処理装置。
（１１）
　前記処理部は、前記撮影画像の色又は明るさに関する補正を行う
　前記（１）乃至（１０）のいずれかに記載の画像処理装置。
（１２）
　ユーザが操作するカメラにより撮影された前記撮影画像であって、ネットワークを介して受信した前記撮影画像を処理するサーバとして構成され、
　補正された前記撮影画像に基づき制作された動画を、ネットワークを介してユーザが操作する端末装置に送信する
　前記（１）乃至（１１）のいずれかに記載の画像処理装置。
（１３）
　画像処理装置が、
　撮影画像を、第１の単位で補正し、
　前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、
　推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する
　画像処理方法。
（１４）
　コンピュータを、
　撮影画像を、第１の単位で補正し、
　前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、
　推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する
　処理部として機能させるプログラム。

　１　動画制作システム，　１０　カメラ，　２０　クラウドサーバ，　３０　端末装置，　４０－１，４０－２，４０　ネットワーク，　２００　処理部，　２１１　CPU，　２５１，２５１－１，２５１－２　画素単位補正部，　２５２，２５２－１，２５２－２　パラメータ推定部，　２５３，２５３－１，２５３－２　画像フレーム補正部，　２５５　パラメータ統合部

Claims

　撮影画像を、第１の単位で補正し、
　前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、
　推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する
　処理部を備える
　画像処理装置。
　前記第１の単位は、画素単位であり、
　前記第２の単位は、画像フレーム単位であり、
　前記パラメータは、前記撮影画像の全領域に対する補正用のパラメータである
　請求項１に記載の画像処理装置。
　前記処理部は、
　　補正の目標となる目標画像を用いて、前記撮影画像を前記第１の単位で補正し、
　　前記撮影画像と、前記撮影画像と前記目標画像から得られた前記中間補正画像との関係に基づいて、前記パラメータを推定する
　請求項２に記載の画像処理装置。
　前記処理部は、機械学習により学習された学習済みモデルを用い、前記撮影画像と前記目標画像から、前記撮影画像を前記第１の単位で補正する
　請求項３に記載の画像処理装置。
　前記学習済みモデルは、学習データとしての画像を入力とし、補正後の画像を出力として学習したDNN(Deep Neural Network)である
　請求項４に記載の画像処理装置。
　前記処理部は、画像編集ソフトウェアによる前記パラメータを用いた補正処理により、前記撮影画像を前記第２の単位で補正する
　請求項２に記載の画像処理装置。
　前記パラメータは、トーンカーブに関するパラメータを含む
　請求項６に記載の画像処理装置。
　前記処理部は、
　　前記撮影画像を前記第１の単位で補正し、
　　前記撮影画像と、前記撮影画像の補正で得られる第１の中間補正画像との関係に基づいて、前記撮影画像に対する補正用の第１のパラメータを推定し、
　　補正の目標となる目標画像を前記第１の単位で補正し、
　　前記目標画像と、前記目標画像の補正で得られる第２の中間補正画像との関係に基づいて、前記撮影画像に対する補正用の第２のパラメータを推定し、
　　推定された前記第２のパラメータを用いた補正と逆方向の補正を行う第３のパラメータを推定し、
　　推定された前記第１のパラメータ及び前記第３のパラメータを用いて、前記撮影画像を前記第２の単位で補正する
　請求項２に記載の画像処理装置。
　前記処理部は、
　　推定された前記第１のパラメータを用いて、前記撮影画像を前記第２の単位で補正し、
　　推定された前記第３のパラメータを用いて、前記第１のパラメータを用いて補正された前記撮影画像を前記第２の単位で補正する
　請求項８に記載の画像処理装置。
　前記処理部は、
　　前記第１のパラメータと前記第３のパラメータを統合した第４のパラメータを推定し、
　　推定された前記第４のパラメータを用いて、前記撮影画像を前記第２の単位で補正する
　請求項８に記載の画像処理装置。
　前記処理部は、前記撮影画像の色又は明るさに関する補正を行う
　請求項１に記載の画像処理装置。
　ユーザが操作するカメラにより撮影された前記撮影画像であって、ネットワークを介して受信した前記撮影画像を処理するサーバとして構成され、
　補正された前記撮影画像に基づき制作された動画を、ネットワークを介してユーザが操作する端末装置に送信する
　請求項１に記載の画像処理装置。
　画像処理装置が、
　撮影画像を、第１の単位で補正し、
　前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、
　推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する
　画像処理方法。
　コンピュータを、
　撮影画像を、第１の単位で補正し、
　前記撮影画像と、前記第１の単位の補正で得られる中間補正画像との関係に基づいて、前記撮影画像に対する補正用のパラメータを推定し、
　推定された前記パラメータを用いて、前記撮影画像を、前記第１の単位よりも大きい第２の単位で補正する
　処理部として機能させるプログラム。