WO2024095366A1

WO2024095366A1 - 画像処理装置、画像処理方法、及びプログラム

Info

Publication number: WO2024095366A1
Application number: PCT/JP2022/040898
Authority: WO
Inventors: 智一掛; 章男大場; 大地小野
Original assignee: 株式会社ソニー・インタラクティブエンタテインメント
Priority date: 2022-11-01
Filing date: 2022-11-01
Publication date: 2024-05-10

Abstract

検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、当該要約画像に基づいて、動画像の内容を検証する画像処理装置である。

Description

画像処理装置、画像処理方法、及びプログラム

　本発明は、動画像を解析する画像処理装置、画像処理方法、及びプログラムに関する。

　ビデオゲームなどのプログラムをテストする場合などにおいては、その処理結果として表示される動画像の内容が想定通りになっているか、映像の乱れなどの不具合が生じていないかといった検証を行うことがある。動画像の内容を検証することで、映像の不具合や想定と異なる表示などを発見することができる。

　動画像の検証を人が目視で行うことは手間がかかり、正確性に欠けることも考えられる。一方で、動画像を構成する１枚１枚のフレーム画像を対象とした解析処理を実行することで動画像の検証を行うこととすると、一般的に画像処理装置の演算量が増加し、時間がかかる傾向にある。

　本発明は上記実情を考慮してなされたものであって、その目的の一つは、動画像の内容の検証を比較的簡易な処理で実行できる画像処理装置、画像処理方法、及びプログラムを提供することにある。

　本発明の一態様に係る画像処理装置は、１つ以上のプロセッサを備える画像処理装置であって、前記一つ以上のプロセッサは、検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、前記要約画像に基づいて、前記動画像の内容を検証する、画像処理装置である。

　本発明の一態様に係る画像処理方法は、検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、前記要約画像に基づいて、前記動画像の内容を検証する、画像処理方法である。

　本発明の一態様に係るプログラムは、検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、前記要約画像に基づいて、前記動画像の内容を検証する、処理をコンピュータに実行させるためのプログラムである。このプログラムは、コンピュータ読み取り可能で非一時的な情報記憶媒体に格納されて提供されてよい。

本発明の実施の形態に係る画像処理装置の構成を示す構成ブロック図である。本発明の実施の形態に係る画像処理装置の機能を示す機能ブロック図である。要約画像の構成の一例を示す図である。シーン遷移を含む対象動画像に基づいて生成される要約画像の例を示す図である。異常な表示を含む対象動画像に基づいて生成される要約画像の例を示す図である。時間とともに移動するオブジェクトを含む対象動画像に基づいて生成される要約画像の例を示す図である。異常な表示を含む対象動画像に基づいて生成される要約画像の別の例を示す図である。

　以下、本発明の実施形態について、図面に基づき詳細に説明する。

　図１は、本発明の一実施形態に係る画像処理装置１０の構成を示す構成ブロック図である。画像処理装置１０は、パーソナルコンピュータやサーバコンピュータ等であって、同図に示されるように、制御部１１と、記憶部１２と、インタフェース部１３と、を含んで構成されている。また、画像処理装置１０は表示装置１４及び操作デバイス１５と接続されている。

　制御部１１は、ＣＰＵ等のプロセッサを少なくとも一つ含み、記憶部１２に記憶されているプログラムを実行して各種の情報処理を実行する。なお、本実施形態において制御部１１が実行する処理の具体例については、後述する。記憶部１２は、ＲＡＭ等のメモリデバイスを少なくとも一つ含み、制御部１１が実行するプログラム、及び当該プログラムによって処理されるデータを格納する。

　インタフェース部１３は、表示装置１４、及び操作デバイス１５との間のデータ通信のためのインタフェースである。画像処理装置１０は、インタフェース部１３を介して有線又は無線のいずれかで表示装置１４、及び操作デバイス１５のそれぞれと接続される。具体的にインタフェース部１３は、画像処理装置１０が供給する映像信号を表示装置１４に送信するためのマルチメディアインタフェースを含むこととする。また、操作デバイス１５に対してユーザーが行った操作内容を示す信号を受信するためのデータ通信インタフェースを含んでいる。

　表示装置１４は、画像処理装置１０から供給される映像信号に応じた映像を画面上に表示する。操作デバイス１５は、例えばキーボードやマウスなどであって、ユーザーからの操作入力を受け付ける。操作デバイス１５は、画像処理装置１０と有線又は無線により接続され、ユーザーから受け付けた操作入力の内容を示す操作信号を画像処理装置１０に対して送信する。

　以下、画像処理装置１０が実現する機能について、図２の機能ブロック図を用いて説明する。図２に示すように、画像処理装置１０は機能的に、対象動画像取得部２１と、要約画像生成部２２と、検証部２３と、を含んで構成されている。これらの機能は、制御部１１が記憶部１２に記憶された１又は複数のプログラムに従って動作することにより実現される。これらのプログラムは、インターネット等の通信ネットワークを介して画像処理装置１０に提供されてもよいし、光ディスク等のコンピュータ読み取り可能な情報記憶媒体に格納されて提供されてもよい。

　対象動画像取得部２１は、本実施形態に係る画像処理装置１０が検証対象とする動画像（以下、対象動画像Ｍという）を取得する。対象動画像取得部２１は、別の画像生成装置によって生成され予め情報記憶媒体に記録された動画像を対象動画像Ｍとして取得してもよいし、画像処理装置１０自身が描画し、表示装置１４の画面に表示した動画像を対象動画像Ｍとして取得してもよい。

　要約画像生成部２２は、対象動画像取得部２１が取得した対象動画像Ｍに基づいて、その内容を表す少なくとも一つの要約画像Ｓを生成する。この要約画像Ｓは静止画像であって、対象動画像Ｍを構成する複数のフレーム画像Ｆに基づいて生成される画像である。さらに、ここでは要約画像Ｓは、各フレーム画像Ｆと同じ大きさ及び形状の画像であることとする。

　具体的に、要約画像生成部２２は、対象動画像Ｍを構成する複数のフレーム画像Ｆのそれぞれから部分画像Ｐを抽出し、抽出した部分画像Ｐを並べて配置することによって要約画像Ｓを生成する。ここで、各フレーム画像から抽出される部分画像Ｐは、互いに異なる領域の画像であって、抽出された部分画像Ｐは要約画像Ｓ内において元のフレーム画像Ｆ内の自身の位置と対応する位置に配置されるものとする。これにより、要約画像Ｓはある期間にわたって表示される対象動画像Ｍの内容を要約して表す一枚の静止画像となる。

　以下では具体例として、要約画像生成部２２は、各フレーム画像Ｆから横方向に並んだ画素列を１列ずつ部分画像Ｐとして取り出して、要約画像Ｓを生成することとする。対象動画像Ｍが６０ｆｐｓで、各フレーム画像Ｆの縦方向の長さが７２０ピクセルである場合、再生時間１２秒分で対象動画像Ｍを構成するフレーム画像Ｆの数が７２０枚（＝６０ｆｐｓ×１２秒）となり、各フレーム画像Ｆの縦方向の長さの値（すなわち、要約画像Ｓを構成する部分画像Ｐの数）に一致することになる。以下では、これらのフレーム画像Ｆを先頭から順にフレーム画像Ｆ（１）、Ｆ（２）、Ｆ（３）、・・・、Ｆ（ｎ）、・・・、Ｆ（７２０）と表記する。また、フレーム画像Ｆ（ｎ）から抽出される部分画像ＰをＰ（ｎ）と表記する。

　要約画像生成部２２は、フレーム画像Ｆ（１）の最上段の横方向に並んだ画素列を部分画像Ｐ（１）として抽出し、この部分画像Ｐ（１）を要約画像Ｓの最上段の画素列とする。さらに、フレーム画像Ｆ（２）の上から２段目の画素列を部分画像Ｐ（２）として抽出し、要約画像Ｓの上から２段目の画素列とする。以下、同様にフレーム画像Ｆ（ｎ）の上からｎ段目の画素列を部分画像Ｐ（ｎ）として抽出し、要約画像Ｓの上からｎ段目の画素列として配置する処理を、７２０枚のフレーム画像Ｆについて繰り返すことによって、縦方向の長さが７２０ピクセルの要約画像Ｓを生成する。図３はこのような要約画像Ｓの構成を模式的に示している。

　この要約画像Ｓは、７２０枚のフレーム画像Ｆのそれぞれから抽出された互いに同じ大きさの部分画像Ｐを含んでいる。各部分画像Ｐは、元のフレーム画像Ｆの互いに異なる位置から抽出されており、要約画像Ｓ内において元のフレーム画像Ｆ内における位置と同じ位置に配置されている。さらに、各部分画像Ｐは元のフレーム画像Ｆの表示順序と同じ順序で並んで配置されている。そのため、時間的に隣接するフレーム画像Ｆから抽出された部分画像Ｐ同士は、要約画像Ｓ内において空間的に隣接して配置されることになる。このような要約画像Ｓは、いわゆるスリットスキャンと呼ばれる画像に類似した画像であり、対象動画像Ｍの時間的な変化の内容を反映した画像となっている。

　検証部２３は、要約画像生成部２２が生成した要約画像Ｓを用いて、対象動画像Ｍの内容を検証する。この検証には、対象動画像Ｍに含まれる異常な表示（すなわち、表示内容の不具合）の検出が含まれることとする。検証部２３は、要約画像Ｓを解析することによって、対象動画像Ｍに異常な表示が含まれている可能性を検出することができる。ここでの異常な表示とは、映像の乱れや想定と異なるタイミングでの画面遷移など、本来意図されている正常な表示とは異なる内容の表示である。

　以下、検証部２３が行う検証処理のいくつかの具体例について説明する。

　まず第１の例として、対象動画像Ｍの再生中に発生するチラつきの有無やシーン遷移を検証する処理について説明する。ここでのチラつきとは、対象動画像Ｍの表示中に、画面の全体が明滅したり、画面の広範囲にわたってそれまでと異なる色の表示が瞬間的に行われたりするような、画面の比較的広い範囲でそれまでと異なる表示や想定されない表示が行われる事象を指している。なお、以下では具体例として、対象動画像Ｍは画面全体の表示内容が別の内容に切り替わるシーン遷移を含むものとし、そのようなシーン遷移が発生するタイミングの情報が予め画像処理装置１０に保持されているものとする。

　前述したように、ここでは部分画像Ｐは水平方向に沿って延伸する画素列であることとしている。そのため、隣接する部分画像Ｐ同士の境界線は水平方向に延伸する直線となる。この例では、シーン遷移が発生するタイミングの直前のフレーム画像Ｆから抽出される部分画像Ｐと直後のフレーム画像Ｆから抽出される部分画像Ｐとは、互いに大きく異なる画素値（輝度値や濃度値など）を持つ可能性が高くなる。そのため、要約画像Ｓのこれらの部分画像Ｐが隣接する位置には、直線状のエッジが現われることになる。このように、検証部２３は隣接する部分画像Ｐの境界線に沿った向きの線を要約画像Ｓの中から検出することによって、対象動画像Ｍの表示中に画面全体の内容がシーン遷移などによって急激に変化しているタイミングを特定できる。

　図４はこのような要約画像Ｓの一例を示している。この図は、ゲームプログラムの実行時に表示される対象動画像Ｍに基づいて生成された要約画像Ｓを示しており、対象動画像Ｍの表示中、時刻ｔ１において背景色が黒のメニュー画面が表示され、時刻ｔ２においてメニュー画面の表示が終了して元のプレイ画面が表示された場合の例を示している。この時刻ｔ１及びｔ２のシーン遷移に対応する位置で、要約画像Ｓ内に境界線Ｌ１及びＬ２が表れている。境界線Ｌ１の上側の画素列は時刻ｔ１より前に表示されていたフレーム画像Ｆから抽出されており、境界線Ｌ１からＬ２までの範囲の画素列は時刻ｔ１以降で時刻ｔ２より前の時間に表示された（すなわち、メニュー画面を表す）フレーム画像Ｆから抽出されており、境界線Ｌ２より下側の画素列は時刻ｔ２以降に表示されたフレーム画像Ｆから抽出されている。なお、この図の例においては説明の便宜のために、時刻ｔ１及びｔ２におけるシーン遷移のタイミングを除いて、対象動画像Ｍの表示内容に変化が生じていないこととしている。実際にはシーン遷移のタイミング以外にも表示内容は時間とともに変化するので、それに伴って部分画像Ｐ同士の境界線をまたいで不連続な変化が要約画像Ｓ内にも現れることになるが、画面全体の表示内容が急激に変化するのでなければ、図４に示すような鮮明な境界線Ｌ１及びＬ２が他の位置に現れることは想定しにくい。

　検証部２３は、この要約画像Ｓに対して画像処理を実行することによって、水平方向に延伸する（すなわち、部分画像Ｐ同士の境界線と平行な向きの）直線を検出する。画像内に表れる直線の検出は、ハフ変換やエッジ検出などの公知の画像処理技術によって実現できる。なお、直線を検出するために、検証部２３はまず要約画像Ｓを二値化するなどの前処理を実行してからエッジ検出などの画像処理を実行してもよい。また、深層学習などの各種の手法を用いて画像処理を実行してもよい。

　前述したように部分画像Ｐの境界線に沿った線（ここでは水平方向に延伸する直線）は、対象動画像Ｍのシーン遷移に対応すると想定される。そのため、このような直線の数、及び位置を特定することで、シーン遷移が正常に発生したか否かを検証できる。

　具体的に、検証部２３は、検出された直線の数、及び位置が想定されるシーン遷移の回数、及びタイミングとずれているかを検証する。想定よりも多い数の水平方向の直線が検出された場合、その位置に対応するタイミングで対象動画像Ｍ内にチラつきなどの表示の異常が発生しているおそれがある。また、水平方向の直線が想定された位置とずれた位置に検出された場合、対象動画像Ｍにおいてシーン遷移のタイミングが想定とずれている可能性がある。このように直線の数、及び位置の検証を行うことで、対象動画像Ｍの表示の異常を検出できる。

　図５は、対象動画像Ｍ内にちらつきが発生している場合の要約画像Ｓの一例を示している。この図の例においては、図４の例と比較して、シーン遷移のタイミングに対応する境界線Ｌ１及びＬ２とは別に、水平線Ｌｘが要約画像Ｓに含まれている。この水平線Ｌｘに対応するタイミングで、対象動画像Ｍの表示中に画面全体が瞬間的にブラックアウトするチラつきが生じている可能性がある。

　次に、検証処理の第２の例として、対象動画像Ｍの表示のカクつきを検出する例について、説明する。ここでのカクつきとは、フレーム落ちなどによって画面の表示内容が想定通り滑らかに変化しない事象を指している。

　対象動画像Ｍ内に時間とともに移動するオブジェクトが含まれている場合、そのオブジェクトが移動する軌跡は要約画像Ｓ内において水平方向の直線（すなわち、部分画像Ｐ同士の境界線に沿った線）と交差する方向の線として現れることが想定される。図６は、このようなオブジェクトの移動の過程を含む要約画像Ｓの一例である。この図の例においては、対象動画像Ｍの表示中、時刻ｔ３までの間は画面左側に静止していたキャラクターオブジェクトＣ１が、時刻ｔ３から時刻ｔ４までの間に画面右側に移動し、その後、再び静止した場合の例を示している。なお、この図の例においては説明のために、キャラクターオブジェクトＣ１以外の背景などは対象動画像Ｍの表示中変化しないこととしている。また、対象動画像Ｍの表示中、キャラクターオブジェクトＣ１の位置は時間とともに変化するが、その外観や形状等は変化しないこととしている。この図においては、時刻ｔ３に対応する部分画像Ｐの境界線Ｌ３、及び時刻ｔ３に対応する部分画像Ｐの境界線Ｌ４がそれぞれ破線で示されている。この境界線Ｌ３及びＬ４で囲まれた領域Ａは、時刻ｔ３から時刻ｔ４までの期間に表示されるフレーム画像Ｆから抽出された部分画像Ｐによって構成されている。この時刻ｔ３からｔ４までの間にキャラクターオブジェクトＣ１が時間とともに右側に移動しているので、その動きを反映して領域Ａ内においてキャラクターオブジェクトＣ１が斜め方向に変形している。すなわち、対象動画像Ｍ内のオブジェクトは、その移動方向に沿って変形した形状となって要約画像Ｓ内に現れることになる。

　ここで、対象動画像Ｍの表示中にカクつきが生じた場合、その中に含まれるオブジェクトの移動の過程が滑らかに（連続的に）表示されず、不連続な変化が生じることになる。このような表示の異常が生じると、そのオブジェクトの輪郭線などの線は、要約画像Ｓ内において連続的に変形した線とならず、カクつきが生じたタイミングに対応する部分画像Ｐの境界線をまたぐ位置で、分断していたり急激に異なる向きに変化したりすると想定される。そこで検証部２３は、部分画像Ｐの境界線と交差する線であって、分断していたり不自然に曲がっていたりする線を検出することによって、対象動画像Ｍにカクつきが生じている可能性があることを検知できる。なお、検証部２３は、Ｈａｍｐｅｌフィルタなどの外れ値検出フィルタを用いて線の傾きの外れ値を検出するなどの手法によって、このような不連続な線を検出することができる。

　図７は、以上説明したように対象動画像Ｍ内でカクつきが発生している場合に要約画像Ｓ内に現れる不連続な線の例を模式的に示している。この図は、要約画像Ｓを二値化して検出された線の部分拡大図を示しており、複数の線が部分画像Ｐの境界線（ここでは水平線）と交差する方向に、かつ互いに並列に延伸している。ここでは、時刻ｔ５から時刻ｔ６の間にカクつきが生じていると想定しており、時刻ｔ５に対応する部分画像Ｐの境界線Ｌ５、及び時刻ｔ６に対応する部分画像Ｐの境界線Ｌ６がそれぞれ破線で示されている。オブジェクトの時間変化などによって要約画像Ｓ内に現れる複数の線は、カクつきが生じているタイミングに対応する要約画像Ｓ内の位置で、同じ向きに曲がっている。このような線の変形が複数の線に共通して発生している場合、対象動画像Ｍ内でカクつきが発生している可能性が考えられる。

　なお、この例における検証処理は、要約画像Ｓの全体を対象として実行してもよいが、要約画像Ｓを複数の領域に分割し、それら複数の領域に対して個別に実行してもよい。具体的に、前述したようにシーン遷移が発生する箇所では、境界線と交差する方向の線は境界線をまたいで連続することはないと想定される。そのため、要約画像Ｓ内に現れる線の連続性を用いてカクつきの有無を検出する場合、このようなシーン遷移を表す境界線と交差する線については、正常に評価することが難しいことがある。そこで、シーン遷移を表す境界線によって要約画像Ｓを分割し、分割された領域のそれぞれについてこれまで説明したようなカクつきの有無を検出する処理を行うことによって、シーン毎に個別に検証を行うことができる。

　具体的に、図４で例示した要約画像Ｓの場合、直線Ｌ１及びＬ２の位置で要約画像Ｓを分割し、得られる３個の分割画像のそれぞれに対して、ここで説明したような線を検出する処理を実行する。これにより、それぞれのシーンを対象にカクつきの有無を検出することができる。

　第３の例として、対象動画像Ｍの表示中に発生するフリーズを検出する例について、説明する。対象動画像Ｍの表示中にフリーズが発生した場合、一定時間表示内容が変化しない状態が継続することになる。この場合、フリーズが発生した期間に対応する部分画像Ｐによって構成される要約画像Ｓ内の領域は、フリーズした状態のフレーム画像Ｆと同様の内容になる。また、カクつきが生じている場合と同様に、フリーズが解消されたタイミングで不連続な変化が生じる可能性がある。そこで検証部２３は、このような要約画像Ｓ内における線の変化を検出することで、対象動画像Ｍにフリーズが発生している可能性を検証することができる。

　また、フリーズが発生していると、フリーズが解消されるタイミングで上述したシーン遷移と類似する画面遷移が生じる可能性もある。そのため、検出部２３は、部分画像Ｐ同士の境界線に沿った線を検出する処理によって、想定とずれた位置に線が検出された場合や想定されていない線が検出された場合に、フリーズが生じていた可能性があると判定できる。

　検証部２３は、以上説明した複数の検証処理を組み合わせて実行してもよい。例えば検証部２３は、まず部分画像Ｐの境界線に沿った線を検出する処理を実行して、チラつきの有無を検証し、その後、その処理で検出された線によって要約画像Ｓを複数の領域に分割する。そして、分割された複数の領域のそれぞれに対して、不連続な線を検出することによって対象動画像Ｍのカクつきの有無を検証する。併せて、複数の領域のそれぞれに対して、フリーズが発生している期間の有無を検証してもよい。

　以上の説明では、１個の要約画像Ｓのみを用いて対象動画像Ｍの検証を行う例について説明した。これに限らず検証部２３は、一つの対象動画像Ｍから複数の要約画像Ｓを生成し、そのそれぞれを対象として検証処理を実行してもよい。例えば、以上の説明では要約画像Ｓの大きさは対象動画像Ｍを構成するフレーム画像Ｆの大きさに一致するので、要約画像Ｓに含めることのできる部分画像Ｐの数はフレーム画像Ｆの大きさによって制約される。そのため、要約画像Ｓを生成する対象となる対象動画像Ｍを構成するフレーム画像Ｆの数も、フレーム画像Ｆの大きさに基づいて決定されている。１枚の要約画像Ｓに含まれる部分画像Ｐの数を超える数のフレーム画像Ｆによって構成される対象動画像Ｍを対象として検証処理を実行する場合、要約画像生成部２２は、対象動画像Ｍの再生時間を複数の期間に分割し、分割された期間のそれぞれを対象として要約画像Ｓを生成することとする。検証部２３は、このようにして生成された要約画像Ｓのそれぞれを対象として前述の検証処理を実行することで、対象動画像Ｍ全体の検証を行うことができる。

　具体例として、前述したように対象動画像Ｍが６０ｆｐｓの動画像で縦方向のサイズが７２０ピクセルの場合、１２秒分に相当する７２０個のフレーム画像Ｆから１個の要約画像Ｓを生成することができる。そこで要約画像生成部２２は、対象動画像Ｍが６０秒間の動画像である場合、時刻０秒から１２秒までの期間を対象に１枚目の要約画像Ｓを、１２秒から２４秒までの期間を対象に２枚目の要約画像Ｓを、というようにして対象動画像Ｍの全体の再生時間のうちの互いに重複しない期間を対象として５枚の要約画像Ｓを生成することとする。検証部２３は、この５枚の要約画像Ｓに対して表示の異常を検出するなどの検証処理を実行する。これにより、再生時間６０秒の対象動画像Ｍの全体について検証処理を実現できる。

　しかしながら、このように互いに重複しない期間を対象として個別に要約画像Ｓを生成すると、異なる期間にまたがって発生する表示の異常などを検出できないおそれがある。例えば前述の例では、ちょうど再生開始から１２秒が経過するタイミング付近で映像のカクつきが発生した場合、そのタイミングの直前のフレーム画像Ｆからは最下段の位置の部分画像Ｐが抽出されて１枚目の要約画像Ｓの最下段に配置され、直後のフレーム画像Ｆからは再上段の位置の部分画像Ｐが抽出されて２枚目の要約画像Ｓの最上段に配置されることになる。そのため、カクつきに起因する不連続な線は１枚目の要約画像Ｓにも２枚目の要約画像Ｓにも現れず、検出することが難しくなる可能性がある。

　そこで要約画像生成部２２は、互いに重複する期間を対象として要約画像Ｓを生成してもよい。一例として、要約画像生成部２２は、前述の対象動画像Ｍの再生開始時点から６秒ごとのタイミングを起点として、それぞれ１２秒分のフレーム画像Ｆを用いて要約画像Ｓを生成すればよい。この場合、６０秒間の対象動画像Ｍから、０秒、６秒、１２秒、１８秒、・・・、４８秒をそれぞれ起点とする９枚の要約画像Ｓが生成される。これらの要約画像Ｓを検証対象とすることで、再生時間が６０秒間の対象動画像Ｍのどのタイミングについても、その前後のフレーム画像Ｆから抽出された部分画像Ｐがいずれかの要約画像Ｓ内において並んで配置されるようにすることができる。なお、以上の例では１枚の要約画像Ｓが対象とする期間のうち２分の１が他の要約画像Ｓと重複することとしたが、より長い期間が他の要約画像Ｓと重複するようにしてもよい。この場合、より多くの数の要約画像Ｓが生成されることとなる。

　また、検証部２３は、新たに生成した要約画像Ｓを予め用意された別の要約画像Ｓと比較することによって、対象動画像Ｍの検証を行うこととしてもよい。以下、この例においては予め用意された別の要約画像Ｓを比較要約画像Ｃという。例えば比較要約画像Ｃは、ある実行環境下において特定のプログラムを実行し、特定の操作入力を行いながら表示装置１４の画面に表示される動画像（ここでは比較用動画像と表記する）を記録することで、その記録された比較用動画像に基づいて生成される要約画像Ｓであるものとする。ここで、比較要約画像Ｃの生成に用いられた比較用動画像は、正常に表示されたものであることが確認できていることとする。

　その後、対象動画像取得部２１は、比較用動画像が表示されたときとは別の実行環境下において、比較用動画像が表示されたときと同じプログラムを実行し、同じ操作入力を行いながら表示装置１４の画面に表示される動画像を記録する。この動画像が検証対象の対象動画像Ｍとなる。ここで、別の実行環境とは、例えば接続される表示装置１４の機種が異なるなど、ハードウェアが比較用動画像の生成時と異なる環境であってもよいし、オペレーティングシステムのバージョンが異なるなど、ソフトウェアが比較用動画像の生成時と異なる環境であってもよい。この場合、実行環境が相違しても対象動画像Ｍの表示内容は比較用動画像と同様のものになることが期待されている。しかしながら、実行環境の相違により、対象動画像Ｍの表示にカクつきが生じるなど、表示内容が比較用動画像と異なるものになる可能性が考えられる。

　そこで検証部２３は、対象動画像Ｍから生成された要約画像Ｓを、比較要約画像Ｃと比較することによって、表示内容に相違が生じているか否かを判定する。例えば検証部２３は、画像全体の類似度を公知の手法によって評価し、類似度が所定値に満たない場合に対象動画像Ｍの表示内容が想定通りでないとの検証を行う。また、上述したように要約画像Ｓに含まれる線を検出する処理を実行し、検出された線の数や位置、向きなどを比較要約画像Ｃから検出された線と比較することによって、対象動画像Ｍに含まれる表示内容の異常を検出してもよい。

　これまでの説明では、各部分画像Ｐは水平方向に沿って並ぶ１列の画素列であり、要約画像Ｓはこれらの部分画像Ｐが垂直方向に沿って並んで配列された、元のフレーム画像Ｆと同じ大きさの静止画像であることとした。しかしながら、要約画像Ｓやそれを構成する各部分画像Ｐの大きさや形状は以上説明したものに限られず、様々なものであってよい。

　具体的に、以上の説明では１個の部分画像Ｐは水平方向に沿って並ぶ１列の画素列であることとしたが、各部分画像Ｐはｎ列（ｎは１以上の整数）の画素列からなる領域であってもよい。また、部分画像Ｐは、水平方向ではなく、垂直方向に延伸する１又は複数の画素列からなる領域の画像であってもよい。この場合、部分画像Ｐの境界線は垂直方向（縦方向）に延伸する直線となる。あるいは、部分画像Ｐは、斜め方向に延伸する画素列であってもよい。

　例えば対象動画像Ｍが縦方向にスクロールするゲームの映像である場合、対象動画像Ｍ内のオブジェクトや背景は主として垂直方向に沿って変化することになる。このような変化は、水平方向に沿って延伸する部分画像Ｐからなる要約画像Ｓでは表現されにくく、垂直方向に沿って延伸する部分画像Ｐを水平方向に沿って配列してなる要約画像Ｓにより顕著に現れると想定される。そこで、要約画像生成部２２は、対象動画像Ｍ内におけるオブジェクトや背景の変化が主としてどの方向に沿って発生するかに応じて、部分画像Ｐの形状や向きを選択してもよい。一般的に、画面変化の方向と交差する向きに沿って並ぶように各部分画像Ｐを配列することによって、要約画像Ｓを用いて画面変化の検証を行いやすくなる。

　また、要約画像生成部２２は、互いに異なる複数の向きに沿って配列される複数の要約画像Ｓを生成し、検証部２３はそれらの要約画像Ｓのそれぞれを対象として検証処理を行ってもよい。これにより、様々な向きの変化を対象として検証を行うことができる。

　また、各部分画像Ｐは必ずしも互いに同じ大きさや同じ形状を有しておらずともよい。例えば、要約画像Ｓは互いに半径が異なる同心円状に部分画像Ｐを配列して構成されてもよい。

　さらに、要約画像生成部２２は、対象動画像Ｍの一部の領域を対象として、要約画像Ｓを生成してもよい。例えば対象動画像Ｍの上辺に沿ってゲームキャラクターのパラメータなどの情報を表示する領域が配置されている場合、当該領域内をオブジェクトが移動したりするわけではなく、急激な時間変化が生じることは少ないと想定される。そこで、このような領域を除いたその他の領域を注目領域として、その中から部分画像Ｐを抽出して要約画像Ｓを生成してもよい。また、対象動画像Ｍの画面中央寄りの領域で比較的大きな変化が生じると想定される場合、外周を除いた中央の領域を注目領域として要約画像Ｓを生成してもよい。この例においては、生成される要約画像Ｓは対象動画像Ｍを構成する各フレーム画像Ｆと同じ大きさにはならず、注目領域と同じ大きさ及び形状を有することになる。

　また、注目領域は必ずしも矩形形状の領域でなくともよく、台形形状などの各種の形状の領域であってもよい。さらにこの場合、要約画像生成部２２は、各フレーム画像Ｆの注目領域内から抽出して得られる部分画像Ｐの形状をアフィン変換などによって変形させてから合成することによって、要約画像Ｓを生成してもよい。これにより、台形形状などの注目領域から抽出される部分画像Ｐを合成して矩形形状の要約画像Ｓを生成することができる。

　以上説明したように、対象動画像Ｍ内の任意の位置及び形状の注目領域を対象として要約画像Ｓを生成することで、より注目したい領域の時間変化を表す要約画像Ｓを生成することができる。特に、重要なオブジェクトが移動可能な範囲やユーザーが注目すると想定される領域などを注目領域として設定することで、その領域に生じている表示上の問題を検出しやすくなる。なお、この例においても、時間的に隣接するフレーム画像Ｆから抽出された部分画像Ｐ同士が要約画像Ｓ内において空間的に隣接するように各部分画像Ｐを配置することによって、検証部２３は要約画像Ｓを用いたシーン遷移の検出などの検証処理を行うことができる。

　また、要約画像生成部２２は、互いに異なる複数の注目領域をそれぞれ対象として要約画像Ｓを生成してもよい。例えば対象動画像Ｍの上側の半分を対象とした要約画像Ｓと、下側の半分を対象とした要約画像Ｓをそれぞれ生成してもよい。このようにして生成された要約画像Ｓのそれぞれを対象として検証部２３が検証処理を行うことで、局所的な範囲で発生している表示の異常を検出しやすくなると考えられる。

　また、要約画像生成部２２は、３次元空間内において自由視点画像を生成するために利用されるＮｅＲＦ（Neural Radiance Fields）などの技術を利用して、部分画像Ｐを抽出する対象となる注目領域の形状や大きさや、各部分画像Ｐをどのように変換して要約画像Ｓ内に配置するかを決定してもよい。仮に２次元平面によって構成される複数のフレーム画像Ｆを奥行き方向に沿って互いに平行に配置したとすると、（ｘ，ｙ，ｔ）の座標軸からなる３次元空間を構成することができる。ここでｘ及びｙは各フレーム画像Ｆの水平方向及び垂直方向の座標軸を表し、ｔは時間軸を表すことになる。要約画像Ｓは、このような３次元空間を所与の投影面に投影した画像に相当する。そこで要約画像生成部２２は、３次元空間内の様子を描画する技術を応用して、どのように投影面を設定するか決定してもよい。これにより、より対象動画像Ｍ内のオブジェクトの動きなどが現れやすい要約画像Ｓを生成することができる。

　以上説明したように、本実施形態に係る画像処理装置１０によれば、要約画像Ｓを解析することによって、比較的効率よく対象動画像Ｍの内容を検証することができる。

　なお、本発明の実施の形態は以上説明したものに限られない。例えば以上の説明においては、各フレーム画像Ｆから抽出される部分画像Ｐの形状及び大きさは互いに同じであることとしたが、部分画像Ｐの大きさは可変であってもよい。例えば要約画像生成部２３は、対象動画像Ｍ内における画面変化が激しい期間については部分画像Ｐの幅（すなわち、各部分画像Ｐが配列される方向の大きさ）を小さくし、画面変化が比較的少ない期間については部分画像Ｐの幅を大きくする。これにより、変化が激しい期間についてはより詳細に変化の内容を反映するような要約画像Ｓを生成できる。

　また、以上の説明においては各フレーム画像Ｆから抽出される部分画像Ｐの位置は他のフレーム画像Ｆから抽出される部分画像Ｐの位置と重ならないように決定することとした。しかしながらこれに限らず、各部分画像Ｐは、隣接する部分画像Ｐと一部が重なるように要約画像Ｓ内に配置されることとしてもよい。一例として、要約画像生成部２２は、各部分画像Ｐが水平方向に延伸する縦３列の画素列である場合、３列のうち上段の画素列は一つ前のフレーム画像Ｆから抽出された部分画像Ｐの下段の画素列と重なり、下段の画素列は一つ後のフレーム画像Ｆから抽出された部分画像Ｐの上段の画素列と重なるように、各部分画像Ｐの位置を決定してもよい。この場合、隣接する二つの部分画像Ｐが重なる位置においては、両者を半透明にして合成するなどの手法で重ね合わせることとする。これにより、より滑らかに変化する要約画像Ｓを生成することができる。

　１０　画像処理装置、１１　制御部、１２　記憶部、１３　インタフェース部、１４　表示装置、１５　操作デバイス、２１　対象動画像取得部、２２　要約画像生成部、２３　検証部。

Claims

　１つ以上のプロセッサを備える画像処理装置であって、
　前記一つ以上のプロセッサは、
　検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、
　前記要約画像に基づいて、前記動画像の内容を検証する、
　画像処理装置。
　請求項１に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記要約画像に基づいて、前記動画像に含まれる表示の異常を検出する、
　画像処理装置。
　請求項２に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記要約画像に含まれる線を検出し、当該検出した線に基づいて前記動画像に含まれる表示の異常を検出する、
　画像処理装置。
　請求項３に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記部分画像の境界線に沿った向きの線を検出することによって、前記動画像に含まれる表示の異常を検出する、
　画像処理装置。
　請求項３に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記部分画像の境界線と交差する向きで、かつ不連続な箇所を有する線を検出することによって、前記動画像に含まれる表示の異常を検出する、
　画像処理装置。
　請求項３に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記部分画像の境界線に沿った向きの線に基づいて、前記要約画像を複数の領域に分割し、当該複数の領域のそれぞれを対象として、当該領域に対応する期間の前記動画像の内容を検証する、
　画像処理装置。
　請求項１に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記要約画像内において前記部分画像の境界線と交差する方向に沿って連続する内容の領域を検出することによって、前記動画像内において表示が変化しない期間を特定する、
　画像処理装置。
　請求項１に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記要約画像と所与の比較画像と比較することによって、前記動画像の内容を検証する、
　画像処理装置。
　請求項１に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記動画像内における注目領域を決定し、前記複数のフレーム画像のそれぞれに含まれる前記注目領域内の一部分の画像を前記部分画像として抽出して、前記要約画像を生成する、
　画像処理装置。
　請求項１に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記複数のフレーム画像のそれぞれから抽出した部分画像に対して所与のアフィン変換を実行してから合成することによって、前記要約画像を生成する、
　画像処理装置。
　請求項１に記載の画像処理装置において、
　前記一つ以上のプロセッサは、
　前記動画像の互いに異なる複数の時点を起点として、当該起点以降に表示されるフレーム画像に基づいて、複数の要約画像を生成し、
　前記複数の要約画像に基づいて、前記動画像の内容を検証する、
　画像処理装置。
　検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、
　前記要約画像に基づいて、前記動画像の内容を検証する、
　画像処理方法。
　検証対象の動画像を構成する複数のフレーム画像のそれぞれから、互いに異なる位置の部分画像を抽出することによって、少なくとも一つの要約画像を生成し、
　前記要約画像に基づいて、前記動画像の内容を検証する、
　処理をコンピュータに実行させるためのプログラム。