WO2022153385A1

WO2022153385A1 - 映像処理装置、映像処理方法、および、映像処理プログラム

Info

Publication number: WO2022153385A1
Application number: PCT/JP2021/000801
Authority: WO
Inventors: 弘員柿沼; 翔大山田; 秀信長田; 浩太日高
Original assignee: 日本電信電話株式会社
Priority date: 2021-01-13
Filing date: 2021-01-13
Publication date: 2022-07-21

Abstract

映像処理装置１であって、同一映像に対して複数の外部処理装置２により並列で画像処理された複数の入力映像を入力する入力部１１と、前記入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する判定部１５と、複数の前記入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する選択部１６と、を備える。

Description

映像処理装置、映像処理方法、および、映像処理プログラム

　本発明は、映像処理装置、映像処理方法、および、映像処理プログラムに関する。

　映像から背景と被写体を分離する被写体抽出などの画像処理では、入力される映像を、一連の連続するフレーム（静止画）として扱い、１枚ずつ処理していく。このとき、シリアルインタフェースから入力される映像をフレームバッファに格納する入力スレッド、フレームバッファの内容を読み取り、画像処理を行い、出力用のフレームバッファに処理結果を書き出すメインスレッド、並びに出力用のフレームバッファの画像を読み出してシリアルインタフェース経由で出力する出力スレッドの、大きく分けて３種類のスレッド処理が実行される。

　特許文献１には、被写体抽出を行う画像処理技術が記載されている。

特許第６７１５２８９号公報

　被写体抽出のように、処理する画像の内容によってメインスレッドの処理に必要なステップ数が異なる場合、その処理時間を固定的に設定することは困難である。そのため、前記３種類のスレッドは非同期で実行されることがある。非同期で３つのスレッドを実行させることで、メインスレッドでの処理時間が長くかかる場合でも、フレームをドロップさせることができ、結果的に逐次処理を保つことが可能となる。

　しかしながら、フレームのドロップが発生した場合、出力スレッドから出力されるフレームが更新されないため、フレームの連続性が失われ、画面に出力される映像は、その瞬間カクついたような状態になる。このようにして発生するフレームのドロップは、映像の内容に依存し、時間的な規則性はない。そして、フレームのドロップは、出力される映像の円滑さを棄損し、主観品質を著しく低下させることにつながる。

　フレームのドロップを回避するためには、パフォーマンスの高いＣＰＵ、および、大容量で帯域の大きいメインメモリを用いるなどのシステムの処理キャパシティを物理的に増強させる方法が考えられる。しかしながら、適切な処理キャパシティを事前に想定するためには、様々な映像でのテストを行う必要があり、作業にコストがかかる問題がある。また、処理キャパシティの物理的な増強には限界があるため、フレームのドロップを回避できない状況も発生する。

　本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、画像処理によってランダムに発生するフレームのドロップを目立たなくし、出力映像の滑らかさを向上することにある。

　上記目的を達成するため、本発明の一態様は、映像処理装置であって、同一映像に対して複数の外部処理装置により並列で画像処理された複数の入力映像を入力する入力部と、　前記入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する判定部と、複数の前記入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する選択部と、を備える。

　本発明の一態様は、映像処理装置が行う映像処理方法であって、同一の映像に対して複数の外部処理装置により並列で画像処理された複数の入力映像を入力する入力ステップと、前記入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する判定ステップと、複数の前記入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する選択ステップと、を行う。

　本発明の一態様は、上記映像処理装置としてコンピュータを機能させる映像処理プログラムである。

　本発明によれば、画像処理によってランダムに発生するフレームのドロップを目立たなくし、出力映像の滑らかさを向上することにある。

実施形態の映像処理装置の一例を示す図である。映像処理装置が出力する映像を説明するための説明図である。画像評価部の処理を示すフローチャートである。画像評価部の処理を示すフローチャートである。ハードウェア構成例である。

　以下、本発明の実施の形態について、図面を参照して説明する。

　図１は、本実施形態の映像処理装置１の構成例を示す構成図である。本実施形態では、映像処理装置１には、複数の外部処理装置２から出力される、複数の入力映像が入力される。

　各外部処理装置２は、同一の映像（元映像）に対して、同様の画像処理（例えば、被写体抽出など）を並行して行い、画像処理後の入力映像を映像処理装置１に出力する。外部処理装置２は、処理パフォーマンスが十分出ていない装置であり、入力映像の各フレームを常に理想的なタイミング（例えば、２９．９７フレーム／秒、５９．９４フレーム／秒）で切り替えられず、ランダムにフレームのドロップが発生してしまう。そのため、１つの外部処理装置２で処理された入力映像をそのまま再生すると、視聴者にとって映像がカクつき、滑らかさに欠けた状態に見える。

　そこで、本実施形態の映像処理装置１は、複数の入力映像を入力し、これらの入力映像の中からフレーム単位で最適なフレームを選択し、選択したフレームを最終出映像として出力する。これにより、本実施形態では、映像のカクつきを低減し、映像の滑らかさを向上することができる。

　図示する映像処理装置１は、入力部１１と、フレーム同期部１２と、画像取得部１３と、評価部１４と、出力部１８と、画像記憶部１９とを備える。

　入力部１１は、同一映像に対して複数の外部処理装置２により並列で画像処理された複数の入力映像を入力する。入力部１１は、ネットワークを介して各外部処理装置２から入力映像を受信し、入力してもよい。

　フレーム同期部１２は、複数の外部処理装置２から出力される入力映像の各フレームを、内部または外部からの同期信号によって時間同期させる。フレーム同期部１２は、例えばＭＭＴ（MPEG Media Transport）を用いて、複数の入力映像の各フレームを同期させてもよい。

　画像取得部１３は、複数の入力映像から、処理対象となる対象フレーム（ｎフレーム目）の画像をそれぞれ取得し、評価部１４に入力するとともに、画像記憶部１９に格納する。画像記憶部１９は、画像取得部１３が取得した、複数の入力映像の各フレームの画像を、所定の期間保存する。

　評価部１４は、入力映像毎に、対象フレームの第１画像と、対象フレームの１フレーム前の直前フレームの第２画像とを比較し、これらの画像に変化があるか否かを評価する。これらの画像に変化がない場合、評価部１４は、対象フレームは更新されていないフレームであると判定し、当該入力映像の重複数を増加する。すなわち、重複数は、各入力映像において、同じ画像が連続して出現した回数を示し、重複数の多さは画像の信頼度の低さを意味する。

　図示する評価部１４は、判定部１５と、選択部１６と、合成部１７とを備える。

　判定部１５は、入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する。判定部１５は、第１画像と第２画像とが異なる場合、重複数を所定値（例えば０）にリセットしてもよい。判定部１５は、重複数が最小の入力映像の第１画像が、重複数が最小より大きい他の入力映像の第１画像と同じ場合、重複数が最小の入力映像の重複数を、前記他の入力映像の重複数に更新してもよい。

　なお、判定部１５は、直前フレームの第２の画像を、画像記憶部１９から取得する。各入力映像の重複数は、映像処理装置１が備える図示しないメモリに記憶される。

　選択部１６は、複数の入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する。本実施形態では、選択部１６は、重複数が最小の入力映像の第１画像を対象フレームの画像として選択する。

　合成部１７は、重複数が最小の入力映像が複数存在する場合、重複数が最小の入力映像の複数の第１画像を合成した合成画像を生成する。例えば、選択部１６が重複数を用いて対象フレームの画像を選択できない場合に、合成部１７は、重複数が最小の複数の入力映像の複数の異なる第１画像を合成し、合成した合成画像を対象フレームの画像としてもよい。合成方法は、例えば、複数の第１画像の画素値を平均化した平均画像としてもよい。

　出力部１８は、選択部１６が選択した第１画像または合成部１７が合成した合成画像を設定した各フレームを、最終出力映像として出力する。

　図２は、映像処理装置１が選択するフレームの具体例を示す説明図である。

　図示する例では、３つの外部処理装置２Ａ、２Ｂ、２Ｃが、同一の元映像３について並行して画像処理を行うものとする。具体的には、外部処理装置２Ａ、２Ｂ、２Ｃには元映像３が入力され、外部処理装置２Ａ、２Ｂ、２Ｃは、元映像３の各フレームについて順次、画像処理（例えば被写体抽出）を実行し、処理結果の入力映像４Ａ、４Ｂ、４Ｃを映像処理装置１に出力する。図２では、元映像３の画像（例えば被写体）を便宜上アルファベットの文字で表現している。

　外部処理装置２Ａ、２Ｂ、２Ｃでは、フレームのドロップ（欠落）が発生している。画像処理におけるフレームのドロップは、外部処理装置２Ａ、２Ｂ、２Ｃの画像処理が遅延することによって、当該装置が備える描画用のメモリの画像が更新されず、結果的に直前のフレームの画像が出力されることにより生じる。すなわち、同じフレームの画像が重複して繰り返し出力され、これにより映像のカクつきが発生する。

　例えば、外部処理装置２Ａの処理結果の入力映像４Ａでは、２フレーム目でフレームのドロップが発生し、１フレーム目と同じフレームが２フレーム目として映像処理装置１に入力される。外部処理装置２Ｂの処理結果の入力映像４Ｂでは、フレームのドロップにより、４フレーム目として３フレーム目と同じフレームが映像処理装置１に入力される。外部処理装置２Ｃの処理結果の入力映像４Ｃでは、フレームのドロップにより、５、６フレーム目として、４フレーム目と同じフレームが映像処理装置１に入力される。

　本実施形態は、フレームのドロップがランダムに発生することを逆手にとった品質向上手法である。映像処理装置１は、複数の外部処理装置２Ａ、２Ｂ、２Ｃが並列で画像処理した入力映像を用い、それぞれの入力映像のフレームの重複数に基づいて、最適な入力映像のフレームを選択する。

　図２に示す具体例では、１フレーム目では、映像処理装置１は、予め設定したいずれかの入力映像４Ａ、４Ｂ、４Ｃの１フレーム目の画像を選択し、最終出力映像５として出力する（パターンａ）。

　２フレーム目以降は、映像処理装置１は、重複数に基づいていずれかの入力映像４Ａ、４Ｂ、４Ｃの画像を選択、または、複数の画像を合成し、選択または合成した画像を最終出力映像５として出力する。

　２フレーム目では、重複数が最小（０）の入力映像４Ｂ、４Ｃの画像Ｂは同じであるため、映像処理装置１は、入力映像４Ｂまたは４Ｃの画像Ｂを選択し、出力する（パターンｃ）。

　３フレーム目では、全ての入力映像４Ａ、４Ｂ、４Ｃの重複数が最小（０）であり、入力映像４Ａは画像Ｂで、入力映像４Ｂ、４Ｃは画像Ｃである。映像処理装置１は、多数決で入力映像４Ｂまたは４Ｃの画像Ｃを選択し、出力する（パターンｄ）。

　４フレーム目では、重複数が最小（０）の入力映像４Ａ、４Ｃの画像Ｄは同じである。映像処理装置１は、入力映像４Ｂまたは４Ｃの画像Ｄを選択し、出力する（パターンｃ）。

　５フレーム目では、重複数が最小（０）の入力映像４Ｂ、４Ｃの画像は異なる。映像処理装置１は、全ての入力映像４Ａ、４Ｂ、４Ｃの画像を比較する。入力映像４Ｂの画像Ｂは、入力映像４Ａの画像Ｂと同じであるため、映像処理装置１は、重複数が最小の入力映像４Ｂの重複数（０）を、入力映像４Ａの大きい方の重複数（１）に更新する（パターンｅ）。そして、映像処理装置１は、重複数が最小（０）のままの入力映像４Ｃの画像Ｅを選択し、出力する（パターンｂ）。

　６フレーム目では、映像処理装置１は、重複数が最小（０）の入力映像４Ｂの画像Ｅを選択し、出力する（パターンｂ）。

　７フレーム目では、重複数が最小（０）の入力映像４Ａ、４Ｂの画像は異なるため、映像処理装置１は、全ての入力映像４Ａ、４Ｂ、４Ｃの画像を比較する。全ての入力映像４Ａ、４Ｂ、４Ｃの画像が異なるため、映像処理装置１は、重複数が最小（０）の入力映像４Ａ、４Ｂの画像Ｇおよび画像Ｆの合成画像を生成し、出力する（パターンｆ）。

　図３Ａおよび図３Ｂは、映像処理装置１の評価部１４の動作を示すフローチャートである。

　画像取得部１３は、複数の外部処理装置２のｎフレーム目の第１画像を取得し、評価部１４に入力するとともに、画像記憶部１９に格納する。評価部１４は、入力された第１画像が１フレーム目の第１画像か否かを判定し（Ｓ１１）、１フレーム目の第１画像の場合（Ｓ１１：ＹＥＳ）、予め設定したいずれかの入力映像の第１画像を選択し、出力部１８に出力する（Ｓ１６：パターンａ）。

　２フレーム目以降の第１画像の場合（Ｓ１１：ＮＯ）、評価部１４は、入力映像の数だけ、Ｓ１２～Ｓ１５の処理を繰り返す。評価部１４は、処理対象のＮフレーム目（対象フレーム）の第１画像と、Ｎ－１フレーム目（直前フレーム）の第２画像とを比較し（Ｓ１２）、第１画像と第２画像とが一致するか否か判定する（Ｓ１３）。

　第１画像と第２画像とが一致するとは、これらの画像の内容が同じであることを示す。第１画像と第２画像とが一致する場合は、入力映像においてフレームのドロップが発生したことを意味する。

　第１画像と第２画像とが異なる場合（Ｓ１３：ＮＯ）、評価部１４は、当該入力映像の重複数を０（所定値）にリセットする（Ｓ１４）。一方、第１画像と第２画像とが一致する場合（Ｓ１３：ＹＥＳ）、評価部１４は、当該入力映像の重複数に１を加算し、重複数を増加する（Ｓ１５）。このように評価部１４は、第１画像と第２画像とを比較し、各入力映像の重複数を更新する。

　評価部１４は、複数の入力映像の重複数を比較し（Ｓ２１）、重複数が最小の入力映像が１つの場合（Ｓ２２：ＹＥＳ）、当該入力映像のＮフレーム目の第１画像を選択し、出力部１８に出力する（Ｓ３０：パターンｂ）。

　重複数が最小の入力映像が複数の場合（Ｓ２２：ＮＯ）、評価部１４は、重複数が最小の入力映像のＮフレーム目の第１画像を比較する（Ｓ２３）。比較対象の全ての第１画像が一致する場合（Ｓ２４：ＹＥＳ）、評価部１４は、重複数が最小のいずれかの入力映像の第１画像をＮフレーム目の画像として選択し、出力部１８に出力する（Ｓ３１：パターンｃ）。

　比較対象の全ての第１画像が一致しない場合（Ｓ２４：ＮＯ）、評価部１４は、内容が一致する第１画像の数をそれぞれカウントし（Ｓ２５）、カウント値が最大となる第１画像が１つか否かを判定する（Ｓ２６）。すなわち、評価部１４は、多数決で第１画像を選択できるか否かを判定する。

　カウント値が最大の第１画像が１つの場合、すなわち多数決で選択できる場合（Ｓ２６：ＹＥＳ）、評価部１４は、カウント値が最大の第１画像を、Ｎフレーム目の画像として選択し、出力部１８に出力する（Ｓ３２：パターンｄ）。

　カウント値が最大の第１画像が複数ある場合、すなわち多数決で選択できない場合（Ｓ２６：ＮＯ）、評価部１４は、全ての入力映像の第１画像を比較する（Ｓ２７）。具体的には、評価部１４は、重複数が最小の入力映像の各第１画像と、重複数が最小より大きい他の入力映像の第１画像と、を比較する。

　重複数が最小の入力映像の第１画像が、他の入力映像の第１画像と一致する場合（Ｓ２８：ＮＯ）、評価部１４は、重複数が最小の入力映像の重複数を、他の入力映像の重複数に更新する（Ｓ２９：パターンｅ）。すなわち、評価部１４は、重複数が最小の入力映像の重複数を大きい方に修正する。そして、評価部１４は、Ｓ２１に戻り以降の処理を行う。

　一方、Ｓ２７で比較した全ての第１画像が異なる場合（Ｓ２８：ＮＯ）、具体的には、重複数が最小の第１画像と一致する他の入力映像の第１画像が存在しない場合、評価部１４は、重複数が最小の異なる複数の第１画像を合成して合成画像を生成する。そして、評価部１４は、合成画像をＮフレーム目の画像として出力部１８に出力する（Ｓ３３：パターンｆ）。

　以上説明した本実施形態の映像処理装置１は、同一映像に対して複数の外部処理装置２により並列で画像処理された複数の入力映像を入力する入力部１１と、前記入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する判定部１５と、複数の前記入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する選択部１６と、を備える。

　このように本実施形態では、複数の入力映像を用いて、これらの入力映像の中からフレーム単位で最適なフレームを選択し、選択したフレームを最終出力映像として出力する。これにより、本実施形態では、１つの入力映像の中でフレームのドロップが発生しても、最終出力映像では、映像のカクつきが目立たず、映像の主観品質を向上することができる。すなわち、本実施形態では、映像のカクつきを低減し、映像の滑らかさを向上することができる。

　上記説明した映像処理装置１は、例えば、図４に示すような汎用的なコンピュータシステムを用いることができる。図示するコンピュータシステムは、CPU（Central Processing Unit、プロセッサ）９０１と、メモリ９０２と、ストレージ９０３（HDD：Hard Disk Drive、SSD：Solid State Drive）と、通信装置９０４と、入力装置９０５と、出力装置９０６とを備える。メモリ９０２およびストレージ９０３は、記憶装置である。このコンピュータシステムにおいて、CPU９０１がメモリ９０２上にロードされた映像処理装置１のプログラムを実行することにより、映像処理装置１の各機能が実現される。

　また、映像処理装置１は、１つのコンピュータで実装されてもよく、あるいは複数のコンピュータで実装されても良い。また、映像処理装置１は、コンピュータに実装される仮想マシンであっても良い。映像処理装置１用のプログラムは、HDD、SSD、USB（Universal Serial Bus）メモリ、CD (Compact Disc)、DVD (Digital Versatile Disc)などのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。

　なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。

　１　：映像処理装置
　１１：入力部
　１２：フレーム同期部
　１３：画像取得部
　１４：評価部
　１５：判定部
　１６：選択部
　１７：合成部
　１８：出力部
　１９：画像記憶部
　２、２Ａ、２Ｂ、２Ｃ：外部処理装置

Claims

　同一映像に対して複数の外部処理装置により並列で画像処理された複数の入力映像を入力する入力部と、
　前記入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する判定部と、
　複数の前記入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する選択部と、を備える
　映像処理装置。
　前記選択部は、重複数が最小の入力映像の第１画像を対象フレームの画像として選択する
　請求項１に記載の映像処理装置。
　前記判定部は、第１画像と第２画像とが異なる場合、重複数を所定値にリセットする
　請求項１または２に記載の映像処理装置。
　重複数が最小の入力映像が複数存在する場合、前記入力映像の複数の第１画像を合成した合成画像を生成する合成部を、備える
　請求項１から３のいずれか１項に記載の映像処理装置。
　前記判定部は、重複数が最小の入力映像の第１画像が、重複数が最小より大きい他の入力映像の第１画像と同じ場合、重複数が最小の入力映像の重複数を、前記他の入力映像の重複数に更新する
　請求項１から４のいずれか１項に記載の映像処理装置。
　映像処理装置が行う、映像処理方法であって、
　同一の映像に対して複数の外部処理装置により並列で画像処理された複数の入力映像を入力する入力ステップと、
　前記入力映像毎に、対象フレームの第１画像と、当該対象フレームの直前フレームの第２画像とを比較し、第１画像と第２画像とが同じ場合、当該入力映像の重複数を増加する判定ステップと、
　複数の前記入力映像の重複数に基づいて、いずれかの入力映像の第１画像を対象フレームの画像として選択する選択ステップと、を行う
　映像処理方法。
　請求項１から５のいずれか１項に記載の映像処理装置としてコンピュータを機能させる映像処理プログラム。