JP2004240760A - 操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体 - Google Patents

操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2004240760A
JP2004240760A JP2003029766A JP2003029766A JP2004240760A JP 2004240760 A JP2004240760 A JP 2004240760A JP 2003029766 A JP2003029766 A JP 2003029766A JP 2003029766 A JP2003029766 A JP 2003029766A JP 2004240760 A JP2004240760 A JP 2004240760A
Authority
JP
Japan
Prior art keywords
operation target
image
program
target type
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003029766A
Other languages
English (en)
Inventor
Masaru Miyamoto
勝 宮本
Teruo Hamano
輝夫 浜野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003029766A priority Critical patent/JP2004240760A/ja
Publication of JP2004240760A publication Critical patent/JP2004240760A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

【課題】OS等のプラットフォームに依存せず、操作対象を適切に特定可能な方法等を提供する。
【解決手段】操作手段における操作事象を監視し、操作事象が発生した際に、操作事象直前の画面画像と、操作事象直後の画面画像との差分画像を、操作対象として抽出し、操作事象直後の画面画像を、次の操作事象直前の画面画像とする。特に、操作対象種別データベースを用いて、抽出された差分画像における形状の特徴量に対応する操作対象種別を特定し、該操作対象種別に対応する名前表示領域を特定し、文字認識手段を用いて、名前表示領域に相当する差分画像の領域における文字列を特定し、該文字列を操作対象の名前として抽出する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
近年、操作履歴を収集分析し、得られた傾向を元にして、情報の推薦又はマーケティングに役立てる研究が多くなされている。これらの分析結果は、入力である操作履歴の性質によって大きく変わってくる。できるだけ詳細な操作履歴を把握することができれば、利用者の真の二一ズにマッチした分析結果が得られる可能性がある。
【0003】
1つのアプローチとしては、GUIによる操作画面における対話部品を取得するために、OSに格納されているボタンやメニューなどの対話部品の属性情報データベースを参照するものがある(例えば非特許文献1参照)。これは、OSの対話部品属性情報データベースの部品間の階層関係又は対応関係を記述可能にすることで、より的確で、効率の良い対話部品の属性情報データベースを参照を実現している。
【0004】
【非特許文献1】
山中克弘、岡田世志彦、上窪真一、兼吉昭雄、井関治「GUI対応スクリーンリーダのためのオフスクリーンモデル」情報処理学会第52回(平成8年前期)全国大会講演論文集、vol.5、4S−6、5−189、pp.189−190
【0005】
【発明が解決しようとする課題】
しかしながら、対話部品の属性情報データベースは、OSごとに異なるため、OSなどのプラットフォームが変わると、システムの構成を変える必要がある。また、対話部品の属性情報データベース自身にアクセスできない場合には、利用できない。
【0006】
本発明は、上記の問題を鑑みてなされたものであり、利用者の操作の結果が画面に反映されるシステムにおいて、OS等のプラットフォームに依存せず、操作対象を適切に特定可能な方法を実現することを目的とする。
【0007】
【課題を解決するための手段】
本発明は、利用者によって操作される操作手段と、その操作結果を表示する表示手段とを有するユーザインタフェース装置を用いて、処理装置によって該利用者の操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体に関する。
【0008】
本発明の方法によれば、操作手段における操作事象を監視する第1のステップと、操作事象が発生した際に、操作事象直前の画面画像と、操作事象直後の画面画像との差分画像を、操作対象として抽出する第2のステップと、操作事象直後の画面画像を、次の操作事象直前の画面画像とする第3のステップとを有することを特徴とする。これにより、OS等のプラットフォームに依存せず、操作対象を適切に特定することが可能となる。
【0009】
本発明の方法の他の実施形態によれば、
複数種類の操作対象画像について、該操作対象画像の形状の特徴量に対する操作対象種別との対応関係と、該操作対象種別に対する名前表示領域との対応関係とを予め蓄積した操作対象種別データベースと、画像から文字を認識する文字認識手段とを更に有しており、
第2のステップは、操作対象種別データベースを用いて、第2のステップによって抽出された差分画像における形状の特徴量に対応する操作対象種別を特定し、該操作対象種別に対応する名前表示領域を特定するステップと、文字認識手段を用いて、名前表示領域に相当する差分画像の領域における文字列を特定し、該文字列を操作対象の名前として抽出するステップとを有することも好ましい。これにより、操作対象中に複数の文字列が存在する場合でも、操作対象の名前を特定することが可能となる。
【0010】
また、本発明のプログラムによれば、操作手段における操作事象を監視する第1のステップと、操作事象が発生した際に、操作事象直前の画面画像と、操作事象直後の画面画像との差分画像を、操作対象として抽出する第2のステップと、操作事象直後の画面画像を、次の操作事象直前の画面画像とする第3のステップとしてコンピュータを実行させることを特徴とする。
【0011】
本発明のプログラムの他の実施形態によれば、
複数種類の操作対象画像について、該操作対象画像の形状の特徴量に対する操作対象種別との対応関係と、該操作対象種別に対する名前表示領域との対応関係とを予め蓄積した操作対象種別蓄積プログラムと、画像から文字を認識する文字認識プログラムとを更に有しており、
第2のステップは、操作対象種別プログラムを用いて、第2のステップによって抽出された差分画像における形状の特徴量に対応する操作対象種別を特定し、該操作対象種別に対応する名前表示領域を特定するステップと、
文字認識プログラムを用いて、名前表示領域に相当する差分画像の領域における文字列を特定し、該文字列を操作対象の名前として抽出するステップと
してコンピュータを実行させることも好ましい。
【0012】
更に、本発明は、前述したプログラムを記録した記録媒体であってもよい。
【0013】
【発明の実施の形態】
以下では、本発明の実施の形態について、図面を参照して詳細に説明する。
【0014】
図1は、本発明による第1の実施形態のシステム構成図である。図1は、特に請求項1及び3に係る発明におけるシステム構成を表す。また、図2は、本発明により抽出された差分画像の一例である。
【0015】
図1によれば、マウス及びキーボードとディスプレイとに接続された処理装置は、操作監視部1と、画面管理部2と、差分抽出部3とから構成される。
【0016】
操作監視部1は、操作対象に対する利用者の操作を監視する。特に、操作監視部1は、利用者によるインタフェース装置の操作結果が表示画面に反映されたときを検知する。このとき、操作監視部1は、画面管理部2へ、操作事象直後の画面画像の取り込み要求を出力する。
【0017】
画面管理部2は、画面取り込み部2−1と、操作直前画面バッファ2−2と、操作直後画面バッファ2−3とから構成される。画面管理部2は、操作監視部1からの画像取り込み要求の通知を受けた際に機能する。
【0018】
画面取り込み部2−1は、画像取り込み要求の通知の際に、その時点で表示されている操作直後画像の全体を取り込む。図2によれば、「表示」ボタンがクリックされた際に、その下位に相当するメニューが一覧表示されており、その画像全体が取り込まれる。
【0019】
操作直前画面バッファ2−2は、当該画像取り込み要求の通知以前に、画面取り込み部2−1によって取り込まれた操作直前画像を、一時的に蓄積したものである。従って、差分画像を特定する一連のシーケンスが終了した後で、操作直後画面バッファ2−3に蓄積された画像が、操作直前画面バッファ2−2に蓄積される。
【0020】
操作直後画面バッファ2−3は、当該画像取り込み要求の通知の際に、画像取り込み部2−1によって取り込まれた操作直後画面を、一時的に蓄積したものである。
【0021】
差分抽出部3は、操作直前画面バッファ2−2に蓄積された操作直前画面と、操作直後画面バッファ2−3に蓄積された操作直後画面とを比較し、差分画像を抽出し、これを操作対象の画像として特定する。図2によれば、上部に表された操作直前画像と操作直後画像とを比較し、差分である「表示」ボタンのメニュー部分の画像が抽出される。
【0022】
図3は、図1に基づく操作対象を特定する方法のフローチャートである。
【0023】
(S1)初期画面の画像を、画面取り込み部2−1が取り込み、操作直前画面バッファに代入し、S2に進む。
(S2)操作監視部1が操作事象を監視しており、操作事象が発生したらS3へ進む。発生していなかったら、S2自身に戻って、引き続き操作事象を監視する。
(S3)操作直後の画面の画像を、画面取り込み部2−1が取り込み、操作直後画面バッファに代入し、S4に進む。
(S4)差分抽出部3が、操作直前画面バッファ2−2と操作直後画面バッファ2−3の画像を比較し、差分画像を抽出し、これを操作対象の画像として特定し、S5へ進む。
(S5)差分抽出部3が、次回の差分抽出のために、操作直後画面バッファ2−3に蓄積されている画像のデータを、操作直前画面バッファ2−2に代入し、S2へ戻る。
【0024】
図4は、本発明による第2の実施形態のシステム構成図である。図4は、特に請求項2及び4に係る発明におけるシステム構成を表す。図4は、図1と比較して、名前特定部4以外の部分は、図1と全く同様であるので、その部分の説明は省略する。また、図5は、差分画像の一例である。
【0025】
図4の構成は、操作対象中に複数の文字列が存在する揚合でも、操作対象の名前を特定することが可能なものである。
【0026】
名前特定部4は、操作対象種別判定部4−1と、操作対象種別データベース4−2と、文字認識部4−3とから構成される。名前特定部4は、差分抽出部3によって抽出された差分画像を入力とする。例えば、図5に表された差分画像を入力とする。
【0027】
操作対象種別判定部4−1は、操作対象種別データベース4−2を用いて、差分抽出部3によって抽出された差分画像における形状の特徴量に対応する操作対象種別を特定し、該操作対象種別に対応する名前表示領域を特定する。特に、蓄積登録されている操作種別のうち、画像の特徴量が最も近いものを、操作対象種別として取得する。
【0028】
操作対象種別データベース4−2は、複数種類の操作対象画像について、該操作対象画像の形状の特徴量に対する操作対象種別との対応関係と、該操作対象種別に対する名前表示領域との対応関係とを予め蓄積したものである。
【0029】
表1は、操作対象種別データベース4−2によって登録蓄積されている操作種別を表す。表1によれば、形状の特徴量及び名前表示領域が、言葉で表現されているけれども、画像の大きさ又は位置を表現した数値や、色を表現した数値などを利用しても構わない。
【0030】
【表1】
Figure 2004240760
【0031】
文字認識部4−3は、操作対象種別判定部4−1が特定した操作種別に対応する名前表示領域を、操作対象種別データベース4−2から取得する。差分画像において、取得した名前表示領域に相当する部分を特定し、当該部分の画像における文字を認識する。認識された文字列を、操作対象の名前として特定する。
【0032】
例えば、図5(a)によれば、形状の特徴量は「長方形で、文字列が箇条書き」であって、操作対象種別は「メニュー(反転なし)」であるので、名前表示領域は「最上部」である「表示(V)」が操作対象として特定される。
【0033】
また、図5(b)によれば、形状の特徴量は「長方形で、文字列が箇条書き、反転された文字列が存在」であって、操作対象種別は「メニュー(反転あり)」であるので、名前表示領域は「反転している領域」である「検索(F)」が操作対象として特定される。
【0034】
図6は、図4に基づく操作対象を特定する方法のフローチャートである。尚、S2−1からS2−3以外は、図3と同様であるので説明を省略する。
【0035】
(S2−1)操作対象種別判定部4−1が、差分抽出部3が操作対象として抽出した差分画像を入力として、操作対象種別データベース4−2に登録されている操作種別のうち、画像の特徴量が最も近いものを、操作対象種別として特定し、S2−2に進む。
(S2−2)文字認識部4−3が、操作対象種別判定部4−1が特定した操作種別に対応する名前表示領域を、操作対象種別データベース4−2から取得し、S2−3へ進む。
(S2−3)文字認識部4−3が、差分画像のおいて、取得した名前表示領域に対応する部分を特定し、当該部分の画像に対して、文字認識を行う。認識された文字列を、操作対象の名前として特定し、S5へ進む。
【0036】
【発明の効果】
上述のように、本発明によれば、利用者の操作の結果が画面に反映されるシステムにおいて、操作直前画面と操作直後画面との差分画像を用いて操作対象を特定することにより、OS等のプラットフォームに依存せずに、操作対象を適切に特定することが可能となる。また、画像から文字列を認識する手段を用いることにより、操作対象中に複数の文字列が存在する場合でも、操作対象の名前を特定することが可能となる。
【図面の簡単な説明】
【図1】本発明による第1の実施形態のシステム構成図である。
【図2】ディスプレイに表示された表示情報の一例である。
【図3】図1に基づく操作対象を特定する方法のフローチャートである。
【図4】本発明による第2の実施形態のシステム構成図である。
【図5】差分画像の一例である。
【図6】図4に基づく操作対象を特定する方法のフローチャートである。
【符号の説明】
1 操作監視部
2 画面管理部
2−1 画面取り込み部
2−2 操作直前画面バッファ
2−3 操作直後画面バッファ
3 差分抽出部
4 名前特定部
4−1 操作対象種別判定部
4−2 操作対象種別データベース(DB)
4−3 文字認識部

Claims (5)

  1. 利用者によって操作される操作手段と、その操作結果を表示する表示手段とを有するユーザインタフェース装置を用いて、処理装置によって該利用者の操作対象を特定する方法であって、
    前記操作手段における操作事象を監視する第1のステップと、
    前記操作事象が発生した際に、操作事象直前の画面画像と、操作事象直後の画面画像との差分画像を、前記操作対象として抽出する第2のステップと、
    前記操作事象直後の画面画像を、次の前記操作事象直前の画面画像とする第3のステップと
    を有することを特徴とする操作対象を特定する方法。
  2. 複数種類の操作対象画像について、該操作対象画像の形状の特徴量に対する操作対象種別との対応関係と、該操作対象種別に対する名前表示領域との対応関係とを予め蓄積した操作対象種別データベースと、
    画像から文字を認識する文字認識手段とを更に有しており、
    前記第2のステップは、
    前記操作対象種別データベースを用いて、前記第2のステップによって抽出された前記差分画像における形状の特徴量に対応する前記操作対象種別を特定し、該操作対象種別に対応する名前表示領域を特定するステップと、
    前記文字認識手段を用いて、前記名前表示領域に相当する前記差分画像の領域における文字列を特定し、該文字列を操作対象の名前として抽出するステップとを有することを特徴とする請求項1における操作対象を特定する方法。
  3. 利用者によって操作される操作手段と、その操作結果を表示する表示手段とを有するユーザインタフェース装置を用いて、該利用者の操作対象を特定するプログラムであって、
    前記操作手段における操作事象を監視する第1のステップと、
    前記操作事象が発生した際に、操作事象直前の画面画像と、操作事象直後の画面画像との差分画像を、前記操作対象として抽出する第2のステップと、
    前記操作事象直後の画面画像を、次の前記操作事象直前の画面画像とする第3のステップと
    してコンピュータを実行させることを特徴とする操作対象を特定するプログラム。
  4. 複数種類の操作対象画像について、該操作対象画像の形状の特徴量に対する操作対象種別との対応関係と、該操作対象種別に対する名前表示領域との対応関係とを予め蓄積した操作対象種別蓄積プログラムと、
    画像から文字を認識する文字認識プログラムとを更に有しており、
    前記第2のステップは、
    前記操作対象種別プログラムを用いて、前記第2のステップによって抽出された前記差分画像における形状の特徴量に対応する前記操作対象種別を特定し、該操作対象種別に対応する名前表示領域を特定するステップと、
    前記文字認識プログラムを用いて、前記名前表示領域に相当する前記差分画像の領域における文字列を特定し、該文字列を操作対象の名前として抽出するステップと
    してコンピュータを実行させることを特徴とする請求項3における操作対象を特定するプログラム。
  5. 請求項3又は4に記載のプログラムを記録した記録媒体。
JP2003029766A 2003-02-06 2003-02-06 操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体 Pending JP2004240760A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003029766A JP2004240760A (ja) 2003-02-06 2003-02-06 操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003029766A JP2004240760A (ja) 2003-02-06 2003-02-06 操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2004240760A true JP2004240760A (ja) 2004-08-26

Family

ID=32956854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003029766A Pending JP2004240760A (ja) 2003-02-06 2003-02-06 操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2004240760A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015096404A1 (en) * 2013-12-24 2015-07-02 Tencent Technology (Shenzhen) Company Limited Information processing method, apparatus and payment system
US9811870B2 (en) 2013-12-24 2017-11-07 Tencent Technology (Shenzhen) Company Limited Information processing method, apparatus and payment system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0545041A (ja) * 1991-08-09 1993-02-23 Sharp Corp 冷凍冷蔵庫の庫内管理装置
JPH09102013A (ja) * 1995-10-04 1997-04-15 Nec Corp 手書文字・図形読取装置
JP2000163602A (ja) * 1998-11-26 2000-06-16 Hitachi Ltd 入力履歴蓄積装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0545041A (ja) * 1991-08-09 1993-02-23 Sharp Corp 冷凍冷蔵庫の庫内管理装置
JPH09102013A (ja) * 1995-10-04 1997-04-15 Nec Corp 手書文字・図形読取装置
JP2000163602A (ja) * 1998-11-26 2000-06-16 Hitachi Ltd 入力履歴蓄積装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015096404A1 (en) * 2013-12-24 2015-07-02 Tencent Technology (Shenzhen) Company Limited Information processing method, apparatus and payment system
US9811870B2 (en) 2013-12-24 2017-11-07 Tencent Technology (Shenzhen) Company Limited Information processing method, apparatus and payment system

Similar Documents

Publication Publication Date Title
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
US8571358B2 (en) Methods and apparatuses for facilitating content-based image retrieval
US9665798B2 (en) Device and method for detecting specified objects in images using metadata
US9053357B2 (en) Identifying images using face recognition
US11157550B2 (en) Image search based on feature values
JP2018152094A (ja) 画像ベース検索
JP2004234228A (ja) 画像検索装置、画像検索装置におけるキーワード付与方法、及びプログラム
WO2009014361A2 (en) Method, system, and computer readable recording medium for filtering obscene contents
TW201415264A (zh) 取證系統、取證方法及取證程式
JP7132046B2 (ja) 検索装置、検索方法及びプログラム
US20150154718A1 (en) Information processing apparatus, information processing method, and computer-readable medium
TW201415402A (zh) 取證系統、取證方法及取證程式
CN114428881A (zh) 媒资视频的推送方法及装置、存储介质及电子设备
JPH11250106A (ja) 内容基盤の映像情報を利用した登録商標の自動検索方法
JP2013152543A (ja) 画像蓄積プログラム、方法および装置
US10191976B2 (en) System and method of detecting common patterns within unstructured data elements retrieved from big data sources
CN111597936A (zh) 基于深度学习的人脸数据集标注方法、系统、终端及介质
JP6499750B2 (ja) 顔照合システムおよび顔照合方法
CN108334602B (zh) 数据标注方法和装置、电子设备、计算机存储介质
JP2007304771A (ja) 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法
JP2004240760A (ja) 操作対象を特定する方法、プログラム及び該プログラムを記録した記録媒体
CN111008304B (zh) 关键词的生成方法和装置、存储介质及电子装置
CN114266921A (zh) 图像描述信息获取方法、装置、服务器及存储介质
JP2006171931A (ja) テキストマイニング装置およびテキストマイニングプログラム
JP4228685B2 (ja) 情報検索端末

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071023

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080311