JP2021124968A - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2021124968A
JP2021124968A JP2020018167A JP2020018167A JP2021124968A JP 2021124968 A JP2021124968 A JP 2021124968A JP 2020018167 A JP2020018167 A JP 2020018167A JP 2020018167 A JP2020018167 A JP 2020018167A JP 2021124968 A JP2021124968 A JP 2021124968A
Authority
JP
Japan
Prior art keywords
matching
image
area
matching process
display element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020018167A
Other languages
English (en)
Other versions
JP7209653B2 (ja
Inventor
雄太 村田
Yuta Murata
雄太 村田
隆範 清水
Takanori Shimizu
隆範 清水
龍一 林田
Ryuichi Hayashida
龍一 林田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment LLC
Original Assignee
Sony Interactive Entertainment LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment LLC filed Critical Sony Interactive Entertainment LLC
Priority to JP2020018167A priority Critical patent/JP7209653B2/ja
Priority to US17/158,421 priority patent/US11580744B2/en
Publication of JP2021124968A publication Critical patent/JP2021124968A/ja
Application granted granted Critical
Publication of JP7209653B2 publication Critical patent/JP7209653B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences

Abstract

【課題】画面に表示中の動画像を解析して比較的精度よく目的の表示要素を検出することのできる情報処理装置を提供する。
【解決手段】画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得し、取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行する情報処理装置であって、当該複数のフレーム画像に対するマッチング処理の実行結果に基づいて、画面内において表示要素が表示されている領域が特定される情報処理装置である。
【選択図】図2

Description

本発明は、画面に表示中の表示画像を解析する情報処理装置、情報処理方法、及びプログラムに関する。
情報処理装置が表示装置の画面に表示する表示画像を解析し、特定の表示要素を検出したいことがある。例えば、アプリケーションプログラムに対する操作をユーザーの代わりに自動的に実行したいときなどには、アプリケーションプログラムによって画面上に表示される表示画像の中から、ユーザーによる操作の対象となる特定のボタンやアイコンなどの表示要素を検出し、その表示要素が表示されている位置に対して何らかのイベント(クリック操作など)を発生させる必要がある。
上述したような状況において、画面に表示されている表示画像に変化がなければ、単純に表示画像の中から目的とする表示要素と一致する領域を特定すればよい。しかしながら、例えば検出したいアイコンが点滅している場合など、画面に表示されている表示画像が時間とともに変化する場合、単純なマッチング処理で目的の表示要素を検出することは難しいことがある。
本発明は上記実情を考慮してなされたものであって、その目的の一つは、画面に表示中の動画像を解析して比較的精度よく目的の表示要素を検出することのできる情報処理装置、情報処理方法、及びプログラムを提供することにある。
本発明の一態様に係る情報処理装置は、画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得するフレーム画像取得部と、前記取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行するマッチング処理部と、を含み、前記複数のフレーム画像に対する前記マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定されることを特徴とする。
本発明の一態様に係る情報処理方法は、画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得するステップと、前記取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行するステップと、を含み、前記複数のフレーム画像に対する前記マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定されることを特徴とする。
本発明の一態様に係るプログラムは、画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得するステップと、前記取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行するステップと、を含み、前記複数のフレーム画像に対する前記マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定されることを特徴とするプログラムである。このプログラムは、コンピュータ読み取り可能で非一時的な情報記憶媒体に格納されて提供されてよい。
本発明の実施の形態に係る情報処理装置の構成を示す構成ブロック図である。 本発明の実施の形態に係る情報処理装置の機能を示す機能ブロック図である。 操作定義データの内容の一例を示す図である。 本発明の実施の形態に係る情報処理装置が実行する処理の流れの一例を示すフロー図である。
以下、本発明の実施形態について、図面に基づき詳細に説明する。
図1は、本発明の一実施形態に係る情報処理装置1の構成を示す構成ブロック図である。情報処理装置1は、例えば家庭用ゲーム機やパーソナルコンピュータ、スマートフォン等であって、同図に示されるように、制御部11と、記憶部12と、インタフェース部13と、を含んで構成されている。また、情報処理装置1は表示装置14及び操作デバイス15と接続されている。
制御部11は、CPU等のプロセッサを少なくとも一つ含み、記憶部12に記憶されているプログラムを実行して各種の情報処理を実行する。なお、本実施形態において制御部11が実行する処理の具体例については、後述する。記憶部12は、RAM等のメモリデバイスを少なくとも一つ含み、制御部11が実行するプログラム、及び当該プログラムによって処理されるデータを格納する。
インタフェース部13は、表示装置14、及び操作デバイス15との間のデータ通信のためのインタフェースである。情報処理装置1は、インタフェース部13を介して有線又は無線のいずれかで表示装置14、及び操作デバイス15のそれぞれと接続される。具体的にインタフェース部13は、情報処理装置1が供給する映像データを表示装置14に送信するためのマルチメディアインタフェースを含むこととする。また、操作デバイス15に対してユーザーが行った操作内容を示す信号を受信するために、USB(Universal Serial Bus)等のデータ通信インタフェースを含んでいる。
表示装置14は、液晶ディスプレイや有機ELディスプレイ等であって、情報処理装置1から供給される映像信号に応じた画像を画面上に表示する。操作デバイス15は、例えばキーボードやマウス、家庭用ゲーム機のコントローラなどであって、ユーザーからの操作入力を受け付ける。なお、表示装置14、及び操作デバイス15は、いずれも情報処理装置1の筐体内に内蔵されてもよいし、情報処理装置1と有線又は無線により接続される別個の装置であってもよい。操作デバイス15は、情報処理装置1の筐体表面に配置された押しボタンやタッチパネルを含んでもよい。
以下、情報処理装置1が実現する機能について、図2を用いて説明する。図2に示すように、情報処理装置1は機能的に、対象プログラム実行部21と、自動操作実行部22と、対象領域特定部23と、を含んで構成される。これらの機能のそれぞれは、制御部11が記憶部12に記憶されたプログラムに従って動作することにより実現される。このプログラムは、インターネット等の通信ネットワークを介して情報処理装置1に提供されてもよいし、光ディスク等のコンピュータ読み取り可能な情報記憶媒体に格納されて提供されてもよい。また、対象領域特定部23は、フレーム画像取得部23aと、簡略化画像生成部23bと、第1マッチング処理部23cと、第2マッチング処理部23dと、を含んで構成されている。
対象プログラム実行部21は、制御部11が所与のアプリケーションプログラムを実行することによって実現される。以下では、対象プログラム実行部21が実行対象とするプログラムを対象プログラムという。この対象プログラムは、自動操作実行部22による自動操作の対象となるプログラムである。対象プログラム実行部21は、所定時間おきに対象プログラムの処理結果を示すフレーム画像を描画し、表示装置14の画面に表示させる。これにより、対象プログラムの処理結果は時間とともに変化する動画像として表示装置14の画面に表示される。
なお、対象プログラムはウェブアプリであってもよい。この場合、その処理結果を示す表示画像は、ウェブブラウザプログラムによって描画され、表示装置14の画面に表示される。
自動操作実行部22は、対象プログラムとは独立した自動操作プログラムを制御部11が実行することによって実現される。この自動操作プログラムは、対象プログラムに対して予め定められた操作(以下、自動操作という)をユーザーの代わりに自動的に実行する。自動操作プログラムは、対象プログラムのテスト(動作検証)を実行するためのプログラムであってよい。その場合、自動操作プログラムは、対象プログラムに対する自動操作を実行し、その結果対象プログラムによって出力される内容を検証することによって、対象プログラムが想定通りに動作するか否かを検証する。
具体的に自動操作実行部22は、予め定義された操作定義データに従って対象プログラムに対する自動操作を実行する。操作定義データは、どのような条件下でどのような自動操作を実行すべきかを定義したものであって、クリック操作やタップ操作、キー入力などの自動操作の内容や、自動操作の対象を特定する情報を含んでいる。操作定義データは、予めユーザーによって準備され、記憶部12内に格納されてよい。
特に本実施形態において、操作定義データは、対象プログラムによって表示装置14の画面に表示されると想定される所定の表示要素Dに対して、所定の操作入力を行う自動操作の定義を含んでいる。この場合における自動操作は、クリック操作やタップ操作など、画面内の位置を指定する操作であって、表示要素Dは、操作ボタンやアイコンなど、操作の対象となるオブジェクトを含んでいる。なお、表示要素Dは、操作の対象となるオブジェクトだけでなく、その周囲に配置されるラベルなど、後述する対象領域特定部23が検出対象とすべき各種の要素を含んでよい。さらに操作定義データは、自動操作の対象を特定する情報として、表示要素Dの外観を示すテンプレート画像TIを含むものとする。図3は、このようなテンプレート画像TIを含む操作定義データの一例を示している。
ここで、表示要素Dが画面内のどこに表示されるかは、対象プログラムが表示対象とするデータ項目やフォントサイズなどの表示設定により変わる可能性がある。また、画面内に表示されている情報をスクロールさせることが可能な場合など、ユーザーの操作によっても表示要素Dの表示位置は変化する可能性がある。そこで本実施形態では、自動操作実行部22からの要求に応じて、対象領域特定部23が自動操作の対象とすべき領域(対象領域)を特定する。この対象領域は、表示要素Dが表示されていると判定される領域である。自動操作実行部22は、対象領域特定部23が特定した対象領域を指定して、操作定義データによって定義されたクリック操作などの自動動作を実行する。これにより自動操作実行部22は、画面上に表示される特定の操作ボタンを押下したり、特定のメニュー項目を選択したりといった操作を自動的に実行することができる。
さらに、表示要素Dの外観は、時間とともに変化する場合もある。例えば表示要素Dの全体や一部が点滅したり、回転したり、エフェクトが重ねて表示されるなどのアニメーションが表示されることがある。このような場合、静止画像であるテンプレート画像TIとある瞬間に対象プログラムが表示する表示画像に含まれる表示要素Dの外観とは、一致しない可能性がある。そこで本実施形態において対象領域特定部23は、後述するように、時間的に連続して表示される複数のフレーム画像FIのそれぞれを対象として、テンプレート画像TIを用いたマッチング処理を実行して、対象領域を検出する。
なお、対象領域特定部23は、対象プログラムとは独立したプログラムによって実現される。このプログラムは、自動操作実行部22を実現する自動操作プログラムの一部であってもよいし、これとは独立したプログラムであってもよい。いずれにせよ、自動操作実行部22、及び対象領域特定部23が対象プログラムとは独立したプログラムによって実現され、対象プログラムによって表示装置14の画面に表示される表示画像を解析して自動操作を実行する。これにより、対象プログラム自体は自動操作に必要な機能を備える必要がなく、通常のユーザーの操作によって動作することを想定した対象プログラムを改変せずに自動操作を実行することができる。
以下、対象領域特定部23が自動操作の対象となる対象領域を特定する処理の内容について、詳細に説明する。
フレーム画像取得部23aは、対象プログラムによって表示装置14の画面内に表示される表示画像の画像データを取得する。対象プログラムによって表示される表示画像は、前述したように所定のフレームレートで更新される動画像となる。そこでフレーム画像取得部23aは、この動画像を構成する、時間的に連続する複数のフレーム画像FIを順に取得する。
なお、フレーム画像取得部23aは、後述する対象領域の特定が完了するまで、フレーム画像FIの取得を継続してもよい。あるいは、予め定められた数のフレーム画像FIを取得することとし、予め定められた数のフレーム画像FIを取得し終えた後は対象領域の特定処理を終了することとしてもよい。
対象領域特定部23は、フレーム画像取得部23aによって取得された複数のフレーム画像FIのそれぞれに対して、テンプレート画像TIとマッチする領域を検出するマッチング処理を実行する。そして、複数のフレーム画像FIのいずれかからテンプレート画像TIとマッチする領域が検出された場合、その領域を表示要素Dが含まれる対象領域として特定する。ここでのマッチング処理は、テンプレート画像TIと所与の基準以上で類似する領域を対象領域として特定する処理であって、対象領域内の画像はテンプレート画像TIと完全に一致する必要はない。
このマッチング処理は、簡略化画像生成部23b、第1マッチング処理部23c、及び第2マッチング処理部23dによって実現される。このように複数のフレーム画像FIのそれぞれを対象としてマッチング処理を行うことで、対象領域特定部23は、対象プログラムが表示する動画像の中から、時間的に変化する表示要素Dが表示されている領域を特定することができる。
簡略化画像生成部23bは、フレーム画像取得部23aが取得した複数のフレーム画像FIのそれぞれを元画像として、当該元画像を簡略化した簡略化画像RIを生成する。簡略化画像RIは、元画像を縮小して得られる縮小画像であってよい。また、元画像をグレースケール化するなど、色情報を低減させた画像であってもよい。さらに、縮小及び色情報の低減の双方を実施した画像であってもよい。いずれの場合にも、簡略化画像RIは元画像よりもデータ量の少ない画像となり、元画像と比較して後述するマッチング処理を高速に実行可能な画像となる。なお、簡略化画像生成部23bは、自動操作実行部22から提供されるテンプレート画像TIについても、元画像を簡略化画像RIに変換するのと同様の画像処理を実行し、簡略化テンプレート画像RTを生成する。
第1マッチング処理部23cは、簡略化画像生成部23bが生成した簡略化画像RIに対して第1マッチング処理を実行する。この第1マッチング処理は、簡略化画像RIの中から、テンプレート画像TIとマッチする領域を検出する処理である。第1マッチング処理部23cは、前述した簡略化テンプレート画像RTを用いて簡略化画像RIとのマッチング処理を実行する。簡略化画像RIはデータ量が少なくなっているので、元画像に対してマッチング処理を実行する場合よりも高速に第1マッチング処理を実行することができる。
第1マッチング処理部23cは、公知のアルゴリズムを用いてマッチング処理を実行してよい。具体的に第1マッチング処理部23cは、簡略化画像RI内の一部の検査領域を対象として、その検査領域内の部分画像と簡略化テンプレート画像RTとの一致度を評価する処理を、検査領域を移動させながら繰り返す。そして、簡略化テンプレート画像RTとの一致度が所定の閾値以上となる部分領域を、対象領域の候補となる候補領域として特定する。なお、第1マッチング処理部23cは一つの簡略化画像RIの中から複数の部分領域を候補領域として特定してもよい。
第2マッチング処理部23dは、第1マッチング処理部23cによって検出された候補領域と対応する元画像内の領域に対して、テンプレート画像TIとの一致度を評価する第2マッチング処理を実行する。この第2マッチング処理は、候補領域が本当にテンプレート画像TIと一致するかを評価する処理であって、簡略化されていないフレーム画像FI(元画像)とテンプレート画像TIを用いてマッチングを行うことで、第1マッチング処理と比較して高い精度で一致度を評価することができる。また、第2マッチング処理は候補領域のみを対象として実行されるので、フレーム画像FI全体について同様のマッチング処理を行う場合と比較して、所要時間を短縮できる。
この第2マッチング処理の実行結果に基づいて、第2マッチング処理部23dは表示要素Dが表示されている対象領域を特定し、特定された対象領域のフレームが像内における位置の情報を自動操作実行部22に対して通知する。例えば第2マッチング処理部23dは、所定の閾値以上の一致度でテンプレート画像TIと一致すると評価された候補領域を、対象領域として特定する。
なお、第2マッチング処理部23dは、複数のフレーム画像FIの全てについて対象領域を特定する必要はなく、少なくとも一つのフレーム画像FIの中から対象領域を特定できれば、その対象領域の位置に表示要素Dが表示されていると判定してよい。前述したように表示要素Dの外観が時間とともに変化している場合、フレーム画像取得部23aが取得する複数のフレーム画像FIのうち、一部のフレーム画像FIのみにテンプレート画像TIとマッチする領域が含まれ、その他のフレーム画像FIにはテンプレート画像TIとマッチする領域が存在しないことがあり得る。そこで第2マッチング処理部23dは、一つのフレーム画像FIから所定の閾値以上の一致度でテンプレート画像TIと一致する領域が見つかれば、その領域を対象領域として特定してもよい。あるいは、複数のフレーム画像FIのうち、同じ位置に対象領域が存在すると判定されたフレーム画像FIが所定数、あるいは所定割合以上になった場合に、その位置を表示要素Dが含まれる対象領域として特定し、自動操作実行部22に通知することとしてもよい。
このように連続する複数のフレーム画像FIをマッチング処理の対象とし、そのうちの一部のフレーム画像FIのみテンプレート画像TIとマッチする領域が特定されればその領域を表示要素Dが含まれる対象領域として特定することで、マッチング処理における一致度の評価基準として高い基準を要求することができ、誤検出のおそれを低減することができる。
なお、フレーム画像取得部23aは、対象領域を特定するために取得するフレーム画像FIの数を、検出対象とする表示要素Dの種類に応じて変化させてもよい。例えば検出対象の表示要素Dの外観が所定のサイクル(繰り返し周期)で繰り返し変化する場合、1回のサイクルに相当する数のフレーム画像FIをマッチング処理の対象とすれば、その中に一つ以上テンプレート画像TIと高い一致度で一致する領域を含むフレーム画像FIが存在することを期待できる。そのためフレーム画像取得部23aは、繰り返し周期に応じて決定される数のフレーム画像FIを取得すればよい。
具体的にフレーム画像取得部23aが取得するフレーム画像の数は、自動操作実行部22によって指定されてもよい。図3の例では、自動操作の内容、及びテンプレート画像TIに対応付けて、取得対象とするフレーム画像の数が指定されている。ここでは、60fpsのフレームレートで表示装置14の画面が更新されることとし、表示要素Dが1秒サイクルで繰り返しアニメーションすると仮定している。そのため、この自動操作には取得対象とするフレーム画像の数として1秒間のフレーム画像数60が対応付けられている。例えば別の表示要素Dが1.5秒サイクルで繰り返し変化する場合、操作定義データ内においてその表示要素Dにはフレーム画像数90が対応付けられることとなる。
なお、ここでは検出対象とされる複数種類の表示要素Dのそれぞれに対応付けて取得対象のフレーム画像数が対応付けられることとしたが、検出対象の表示要素Dにはその表示要素Dの繰り返し周期が対応付けられて記憶されることとしてもよい。この場合、フレーム画像取得部23aが、検出対象となる表示要素Dに対応付けられた繰り返し周期の長さと、フレームレートとを用いて取得対象のフレーム画像数を算出する。
また、自動操作実行部22が複数種類の対象プログラムを自動操作の対象とする場合、取得対象のフレーム画像数は、検出対象の表示要素Dごとではなく、対象プログラムの種類ごとに予め定められることとしてもよい。この場合、自動操作実行部22は、自動操作の対象としている対象プログラムの種類に応じて、取得対象のフレーム画像数を対象領域特定部23に指定すればよい。
以下、本実施形態において対象領域特定部23が実行する処理の流れの一例について、図4のフロー図を用いて説明する。
対象プログラムの実行中に自動操作を実行すべきタイミングが到来した場合、自動操作実行部22は、実行すべき自動操作の対象となる表示要素Dの外観を示すテンプレート画像TI、及び取得対象となるフレーム画像数を操作定義データから読み出して、対象領域特定部23に対して対象領域の特定を要求する。対象領域特定部23は、この対象領域の特定要求を受け付けると(S1)、まずS1で指定されたテンプレート画像TIに基づいて簡略化テンプレート画像RTを生成する(S2)。
その後、フレーム画像取得部23aがその時点で表示装置14に表示中のフレーム画像FIを取得する(S3)。フレーム画像FIをフレーム画像取得部23aが取得すると、簡略化画像生成部23bがS3で取得したフレーム画像FIを縮小するなどして簡略化画像RIを生成する(S4)。
次に第1マッチング処理部23cが、S4で生成された簡略化画像RIとS2で生成された簡略化テンプレート画像RTを用いて、第1マッチング処理を実行する(S5)。続いて第2マッチング処理部23dが、S5で特定された候補領域について、S3で取得されたフレーム画像FI内の候補領域の画像とS1で指定されたテンプレート画像TIの一致度を評価する第2マッチング処理を実行する(S6)。
S6の第2マッチング処理を終えると対象領域特定部23は、この第2マッチング処理によって対象領域を特定できたか否かを判定する(S7)。具体的に、第2マッチング処理によって所定の閾値以上の高い一致度でテンプレート画像TIと一致すると評価される候補領域が見つかった場合、対象領域特定部23はその時点で見つかった候補領域を対象領域として特定する。この場合対象領域特定部23は、特定された対象領域の位置を示す情報を自動操作実行部22に通知する(S8)。これにより対象領域特定部23によるマッチング処理は終了し、自動操作実行部22は通知された位置を対象として予め定められた自動操作(クリック操作等)を実行する。
一方、S7で対象領域を特定できなかったと判定された場合、対象領域特定部23はS1で指定された数のフレーム画像FIについてマッチング処理を実行したか判定する(S9)。もし指定された数のフレーム画像FIがフレーム画像取得部23aによって取得され、その全てについてマッチング処理を実行し終えている場合、対象領域特定部23は指定された表示要素Dを含む対象領域の特定に失敗したと判断し、その旨を自動操作実行部22に通知して処理を終了する(S10)。対象領域の特定に失敗した旨の通知を受けた自動操作実行部22は、例えば所定のエラーメッセージを出力して自動操作を中断したり、別の自動操作を試行したりするなど、予め定められたエラー処理を実行することになる。
S9でまだ指定された数のフレーム画像FIについてマッチング処理を完了していないと判定された場合、対象領域特定部23はS3に戻って次に表示装置14の画面に表示される新たなフレーム画像FIを対象として、これまで説明したマッチング処理を実行する。これにより対象領域特定部23は、表示要素Dを含む対象領域が特定されるか、又は指定された数のフレーム画像FIについてマッチング処理を実行し終えるまで、順次表示されるフレーム画像FIを対象にマッチング処理を繰り返すことになる。そのため、指定された数のフレーム画像FIが表示される時間の間に変化する動画像の中から、検出対象の表示要素Dが表示される対象領域を特定することができる。
以上説明したように、本実施形態に係る情報処理装置1によれば、対象プログラムによって表示される表示画像の中から、時間とともに変化する表示要素Dを精度よく検出することができる。これにより、対象プログラムを改変することなく対象プログラムに対する自動操作を実行したりすることができる。
なお、本発明の実施の形態は以上説明したものに限られない。例えば以上の説明におけるマッチング処理の流れは一例に過ぎず、これとは異なる手順で複数のフレーム画像FIの中から対象領域を特定してもよい。
また、以上の説明では検出対象となる表示要素Dの外観を示すテンプレート画像TI、及び当該表示要素Dを検出するために取得対象とするフレーム画像の数が操作定義データに予め記録されることとした。これに限らず操作定義データには、簡略化テンプレート画像RTがテンプレート画像TIとともに予め記録されてもよい。また、操作定義データにはマッチング処理の対象とするフレーム画像FI内の領域を指定する情報が含まれてもよい。例えば検出対象の表示要素Dがフレーム画像FI内の一部の領域のみに表示されることが想定される場合、その一部の領域のみをマッチング処理の対象とすることで、処理負荷を軽減し、マッチング処理に要する時間を短縮することができる。そこで検出対象とする複数種類の表示要素Dのそれぞれに対して、その表示要素Dが表示されると想定される領域を指定する情報が予め定義され、対象領域の特定時に対象領域特定部23に対して指定されてもよい。
1 情報処理装置、11 制御部、12 記憶部、13 インタフェース部、14 表示装置、15 操作デバイス、21 対象プログラム実行部、22 自動操作実行部、23 対象領域特定部、23a フレーム画像取得部、23b 簡略化画像生成部、23c 第1マッチング処理部、23d 第2マッチング処理部。

Claims (5)

  1. 画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得するフレーム画像取得部と、
    前記取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行するマッチング処理部と、
    を含み、
    前記複数のフレーム画像に対する前記マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定される
    ことを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記マッチング処理部は、
    前記取得された複数のフレーム画像のそれぞれを元画像として、当該元画像を簡略化した簡略化画像を生成する簡略化画像生成部と、
    前記生成された簡略化画像の中から、前記テンプレート画像とマッチする領域を検出する第1マッチング処理を実行する第1マッチング処理部と、
    前記第1マッチング処理によって検出された前記簡略化画像内の領域と対応する前記元画像内の領域に対して、前記テンプレート画像との一致度を評価する第2マッチング処理を実行する第2マッチング処理部と、
    をさらに含み、
    前記第2マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定される
    ことを特徴とする情報処理装置。
  3. 請求項1又は2に記載の情報処理装置において、
    前記マッチング処理部は、複数種類の表示要素のいずれかを検出対象とし、
    前記フレーム画像取得部は、前記複数種類の表示要素のうち検出対象となる表示要素に応じて定められる数の連続するフレーム画像を、当該検出対象となる表示要素を検出する前記マッチング処理のために取得する
    ことを特徴とする情報処理装置。
  4. 画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得するステップと、
    前記取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行するステップと、
    を含み、
    前記複数のフレーム画像に対する前記マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定される
    ことを特徴とする情報処理方法。
  5. 画面内に表示される動画像を構成する、連続する複数のフレーム画像を取得するステップと、
    前記取得された複数のフレーム画像のそれぞれに対して、検出対象となる表示要素の外観を示すテンプレート画像とマッチする領域を検出するマッチング処理を実行するステップと、
    を含み、
    前記複数のフレーム画像に対する前記マッチング処理の実行結果に基づいて、前記画面内において前記表示要素が表示されている領域が特定される
    ことを特徴とするプログラム。
JP2020018167A 2020-02-05 2020-02-05 情報処理装置、情報処理方法、及びプログラム Active JP7209653B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020018167A JP7209653B2 (ja) 2020-02-05 2020-02-05 情報処理装置、情報処理方法、及びプログラム
US17/158,421 US11580744B2 (en) 2020-02-05 2021-01-26 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020018167A JP7209653B2 (ja) 2020-02-05 2020-02-05 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021124968A true JP2021124968A (ja) 2021-08-30
JP7209653B2 JP7209653B2 (ja) 2023-01-20

Family

ID=77061999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020018167A Active JP7209653B2 (ja) 2020-02-05 2020-02-05 情報処理装置、情報処理方法、及びプログラム

Country Status (2)

Country Link
US (1) US11580744B2 (ja)
JP (1) JP7209653B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059121A (ja) * 2015-09-18 2017-03-23 カシオ計算機株式会社 画像管理装置、画像管理方法及びプログラム
JP2017211791A (ja) * 2016-05-25 2017-11-30 株式会社リコー 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP2018151748A (ja) * 2017-03-10 2018-09-27 オムロン株式会社 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1428378B1 (en) * 2001-09-07 2013-03-20 Intergraph Software Technologies Company Image stabilization using color matching
KR101146926B1 (ko) * 2006-12-20 2012-05-22 엘지전자 주식회사 이동 단말기에서 비디오의 대표 영상 제공 방법
KR101911803B1 (ko) * 2012-08-10 2018-10-26 삼성전자주식회사 휴대용 단말 장치 및 그 동작 방법
US11468071B2 (en) * 2018-11-30 2022-10-11 Rovi Guides, Inc. Voice query refinement to embed context in a voice query
KR102617820B1 (ko) * 2019-01-14 2023-12-22 엘지전자 주식회사 비디오 월

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059121A (ja) * 2015-09-18 2017-03-23 カシオ計算機株式会社 画像管理装置、画像管理方法及びプログラム
JP2017211791A (ja) * 2016-05-25 2017-11-30 株式会社リコー 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP2018151748A (ja) * 2017-03-10 2018-09-27 オムロン株式会社 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム

Also Published As

Publication number Publication date
US20210240995A1 (en) 2021-08-05
US11580744B2 (en) 2023-02-14
JP7209653B2 (ja) 2023-01-20

Similar Documents

Publication Publication Date Title
US20240152548A1 (en) Electronic apparatus for searching related image and control method therefor
US10222955B2 (en) Automatically capturing user interactions and evaluating user interfaces in software programs using field testing
US9756140B2 (en) Tracking user behavior relative to a network page
KR102047568B1 (ko) 웹페이지 렌더링 시간 측정 기법
US10810113B2 (en) Method and apparatus for creating reference images for an automated test of software with a graphical user interface
WO2015039566A1 (en) Method and system for facilitating automated web page testing
WO2011152149A1 (ja) 領域推薦装置、領域推薦方法、及び記録媒体
WO2016206113A1 (en) Technologies for device independent automated application testing
US11455233B2 (en) Performance utilities for mobile applications
CN106462488A (zh) 调试期间的性能优化提示呈现
US20180060222A1 (en) Building signatures of application flows
US9690682B2 (en) Program information generating system, method, and computer program product
KR20140014101A (ko) 제스처 인식을 위한 사용자 인터페이스, 장치 및 방법
JP2010002370A (ja) パターン抽出プログラム、方法及び装置
WO2019019628A1 (zh) 移动应用的测试方法、装置、测试设备及介质
JP2009032099A (ja) シナリオ生成装置およびシナリオ生成プログラム
JP2007094457A (ja) 情報処理装置、情報処理方法及びプログラム
WO2018098960A1 (zh) 一种触屏设备操作方法及触屏设备
JP2021124968A (ja) 情報処理装置、情報処理方法、及びプログラム
US20170277722A1 (en) Search service providing apparatus, system, method, and computer program
JP7106346B2 (ja) 情報処理装置及び情報処理プログラム
CN111324244B (zh) 用于切换图片显示类型的方法和装置
JP2009259275A (ja) シナリオ生成装置およびシナリオ生成プログラム
JP2020166448A (ja) 情報処理装置、情報処理システム、及びプログラム
US20230300387A1 (en) System and Method of Interactive Video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230110

R150 Certificate of patent or registration of utility model

Ref document number: 7209653

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150