JP5408623B2 - 検索式提供方法、プログラム、及び、検索式提供システム - Google Patents
検索式提供方法、プログラム、及び、検索式提供システム Download PDFInfo
- Publication number
- JP5408623B2 JP5408623B2 JP2010032345A JP2010032345A JP5408623B2 JP 5408623 B2 JP5408623 B2 JP 5408623B2 JP 2010032345 A JP2010032345 A JP 2010032345A JP 2010032345 A JP2010032345 A JP 2010032345A JP 5408623 B2 JP5408623 B2 JP 5408623B2
- Authority
- JP
- Japan
- Prior art keywords
- xpath
- search
- node
- elements
- screen part
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
td/table[@id='TotalOrder']/tbody/tr[5]/td[2] ・・・(式1)
式1は、ノード226のXPathをダイレクトXPathによって表示したものである。数1のうち、先頭の文字列の”/html”は、「ルートノード201は一つのhtmlノード202を子ノードとして持ち、そのhtmlノード202が選択される」を意味する。また、”/”ノードを1番目のノードと数え、”html”ノードを2番目のノードと数えた場合に、6番目のノードと7番目のノードである”tbody/tr[2]”は、「tbodyノード210は、複数のtrノードを子ノードとして持ち、その複数のtrノードのうち、第2番目のtrノード214が選択される」を意味する。
//tr[td/b/text()='合計']/td[2] ・・・(式3)
式2と式3とは、ともに数1が指定するノードと同じノードを指定する。式2のうち先頭から2番目のスラッシュと4番目のスラッシュとの間の”/table[@id='TotalOrder']”は、「htmlノード202の配下にある全tableノードのうち、id属性が’TotalOrder’に等しいtableノードが選択される」を意味する。
/html/body/form/table/tbody/tr[2]/td/table[@id='TotalOrder']/
tbody/tr[td[1]/b/text()='合計']/td[2] ・・・(式5)
以上のように、ユーザ401は、XPath生成プログラム423のウィンドウ画面406によって、目的のGUI部位405に対応するXPath候補を、ロバストネススコアの高い順に瞬時に取得することができる。
ここで、XPath Xと省略配列rから新たなXPath Yを生成する演算”*”を式7のように定義する。
ただし、(Xk,rk)は、rkがtrueである場合、ノードXkを省略することを意味し、rkがfalseである場合、ノードXkを省略しないことを意味する。例えば、ri(i=2,...,k)=trueであり、ri(i=k+1,...,n−1)=falseである場合、演算X*rによって生成されるXPath Yは式8である。
工程807において、XPath生成プログラム423は、省略配列ri(i=2,...,n−1)を、省略配列qi(i=2,...,n−1)にコピーする。
Q=/Q2/.../Qm ・・・(式10)
工程904において、XPath生成プログラム423は、カウンタkを2に初期化し、カウンタ上限Lをmin(n,m)に初期化する。なお、カウンタ上限Lは、カウンタkの上限値である。また、min(n,m)は、n及びmのうち、小さい方の値を返す関数である。
例えば、図3の領域503に示されるターゲットGUIの値がPであり、領域508に示されるキャプションGUIの値がQであり、領域509に示される値がQのコンテンツ情報である場合、Pは、工程908において式12のように更新される。
tbody/tr[td[1]/b/text()='合計']/td[2] ・・・(式12)
工程908において、XPath Pの11ノード目の”tr[5]”は、”tr[td[1]/b/text()='合計'”に、更新される。すなわち、工程908の更新前のXPath Pは、「idが'TotalOrder'のテーブルの”tbody”に含まれる5番目の”tr”の2番目の”td”」という意味であったが、工程908の更新後は、「idが”TotalOrder”のテーブルの中で、”tbody"に含まれる一つ目の”td”に”text()='合計'”を持つ”tr”の2番目の”td”」という意味になる。
(ノード1)”/”(ルート)
(ノード2)”html”
(ノード3)”body”
(ノード4)”form”
(ノード5)”table”
(ノード6)”tbody”
(ノード7)”tr[2]”
(ノード8)”td”
(ノード9)”table[@id='TotalOrder']”
(ノード10)”tbody”
(ノード11)”tr[td[1]/b/text()='合計']”
(ノード12)”td[2]”
の12個のノードがあるため、u1=12である。
判定1111において、XPath生成プログラム423は、カウンタkがNより小さい場合、XPath候補リストの次のXPath候補のロバストネススコアを算出するため、工程1114に移行する。そして、工程1114においてカウンタkをインクリメントし、工程1105に戻る。
402 PC
403 ディスプレイ
404 発注システムのウィンドウ画面
405 GUI部位
406 XPath生成プログラムのウィンドウ画面
501 選択ボタン
502〜504、507〜509 領域
505 チェックボックス
506 選択ボタン
510 XPath生成ボタン
511 XPath候補リスト
517 係数入力ボタン
Claims (9)
- 木構造によって実装されるアプリケーションを実行する計算機が、前記アプリケーションによって表示された画面の中の画面部位を指定する検索式を提供する検索式提供方法であって、
前記検索式は、前記木構造の各々の階層に対応する複数の要素を、前記階層の順に含み、
前記複数の要素は、各々属性を備え、
前記方法は、
前記計算機が、ユーザによって選択された前記画面部位を取得し、
前記計算機が、前記取得された画面部位を一意に指定する前記検索式のうち、すべての前記階層に対応する要素を含む前記検索式を取得し、
前記計算機が、前記取得された検索式に含まれる前記複数の要素を少なくとも一つ省略し、
前記計算機が、前記省略された検索式のうち、前記画面部位を一意に指定する前記検索式を抽出することによって、前記検索式の複数の候補を生成し、
前記計算機が、前記生成された複数の候補ごとに、前記要素の個数、又は、前記検索式に含まれる前記要素のうち所定の前記属性を備える前記要素の個数に、各々所定の係数を乗じることによって、一つ以上の特徴量を求め、
前記計算機が、前記求められた一つ以上の特徴量を、加算することによって前記複数の候補の頑健性を算出し、
前記計算機が、前記算出された頑健性と、前記複数の候補とを表示することを特徴とする検索式提供方法。 - 前記複数の属性は、前記木構造における前記要素の相対的な位置を示す数字が含まれることを示す前記属性と、前記画面部位を一意に示す名前が前記要素に含まれることを示す前記属性と、前記画面部位に表示される文字列が前記要素に含まれることを示す前記属性とのうち、少なくとも一つであることを特徴とする請求項1に記載の検索式提供方法。
- 前記方法は、
前記計算機が、前記ユーザによって選択された第1の前記画面部位と、前記ユーザによって選択され、前記第1の画面部位の表題が表示された第2の前記画面部位とを取得し、
前記計算機が、前記取得された第1の画面部位を指定する第1の前記検索式と、前記取得された第2の画面部位を指定する第2の前記検索式との共通する要素のうち、最も下位の要素を、前記第2の検索式のうち、最も下位の要素によって表現することによって、前記第1の検索式の複数の候補を生成することを特徴とする請求項1に記載の検索式提供方法。 - 前記アプリケーションが、HTML又はXMLによって実装されることを特徴とする請求項3に記載の検索式提供方法。
- 木構造によって実装されるアプリケーションを実行する計算機に、前記アプリケーションによって表示された画面の中の画面部位を指定する検索式を提供させるプログラムであって、
前記検索式は、前記木構造の各々の階層に対応する複数の要素を、前記階層の順に含み、
前記複数の要素は、各々属性を備え、
前記プログラムは、
前記計算機に、ユーザによって選択された前記画面部位を取得させ、
前記計算機に、前記取得された画面部位を一意に指定する前記検索式のうち、すべての前記階層に対応する要素を含む前記検索式を取得させ、
前記計算機に、前記取得された検索式に含まれる要素を少なくとも一つ省略させ、
前記計算機に、前記省略された検索式のうち、前記画面部位を一意に指定する前記検索式を抽出させることによって、前記検索式の複数の候補を生成させ、
前記計算機に、前記生成された複数の候補ごとに、前記要素の個数、又は、前記検索式に含まれる前記要素のうち所定の前記属性を備える前記要素の個数に、各々所定の係数を乗じることによって、一つ以上の特徴量を求めさせ、
前記計算機に、前記求められた一つ以上の特徴量を、加算することによって前記複数の候補の頑健性を算出させ、
前記計算機に、前記算出された頑健性と、前記複数の候補とを表示させることを特徴とするプログラム。 - 前記複数の属性は、前記木構造における前記要素の相対的な位置を示す数字が含まれることを示す前記属性と、前記画面部位を一意に示す名前が前記要素に含まれることを示す前記属性と、前記画面部位に表示される文字列が前記要素に含まれることを示す前記属性とのうち、少なくとも一つであることを特徴とする請求項5に記載のプログラム。
- 前記プログラムは、
前記計算機に、前記ユーザによって選択された第1の前記画面部位と、前記ユーザによって選択され、前記第1の画面部位の表題が表示された第2の前記画面部位とを取得させ、
前記計算機に、前記取得された第1の画面部位を指定する第1の前記検索式と、前記取得された第2の画面部位を指定する第2の前記検索式との共通する要素のうち、最も下位の要素を、前記第2の検索式のうち、最も下位の要素によって表現することによって、前記第1の検索式の複数の候補を生成することを特徴とする請求項5に記載のプログラム。 - 前記アプリケーションが、HTML又はXMLなどの言語によって実装されることを特徴とする請求項7に記載のプログラム。
- 木構造によって実装されるアプリケーションを実行する計算機が、前記アプリケーションによって表示された画面の中の画面部位を指定する検索式を提供する検索式提供システムであって、
前記検索式は、前記木構造の各々の階層に対応する複数の要素を、前記階層の順に含み、
前記複数の要素は、各々属性を備え、
前記計算機は、
ユーザによって選択された前記画面部位を取得し、
前記取得された画面部位を一意に指定する前記検索式のうち、すべての前記階層に対応する要素を含む前記検索式を取得し、
前記取得された検索式に含まれる前記複数の要素を少なくとも一つ省略し、
前記省略された検索式のうち、前記画面部位を一意に指定する前記検索式を抽出することによって、前記検索式の複数の候補を生成し、
前記生成された複数の候補ごとに、前記要素の個数、又は、前記検索式に含まれる前記要素のうち所定の前記属性を備える前記要素の個数に、各々所定の係数を乗じることによって、一つ以上の特徴量を求め、
前記求められた一つ以上の特徴量を、加算することによって前記複数の候補の頑健性を算出し、
前記算出された頑健性と、前記複数の候補とを表示することを特徴とする検索式提供システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010032345A JP5408623B2 (ja) | 2010-02-17 | 2010-02-17 | 検索式提供方法、プログラム、及び、検索式提供システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010032345A JP5408623B2 (ja) | 2010-02-17 | 2010-02-17 | 検索式提供方法、プログラム、及び、検索式提供システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170503A JP2011170503A (ja) | 2011-09-01 |
JP5408623B2 true JP5408623B2 (ja) | 2014-02-05 |
Family
ID=44684587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010032345A Expired - Fee Related JP5408623B2 (ja) | 2010-02-17 | 2010-02-17 | 検索式提供方法、プログラム、及び、検索式提供システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5408623B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133168A (zh) * | 2016-12-01 | 2018-06-08 | 北京新唐思创教育科技有限公司 | 一种文本识别中的公式搜索方法及其装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5325177B2 (ja) | 2010-08-09 | 2013-10-23 | 株式会社日立製作所 | ウェブアプリケーションの操作記録方法およびシステム |
JP7386889B2 (ja) * | 2019-04-30 | 2023-11-27 | ウォークミー リミテッド | Gui要素の複数の代替表記を使用したgui要素獲得 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3168829B2 (ja) * | 1993-10-30 | 2001-05-21 | 富士ゼロックス株式会社 | 検索式作成支援システム |
JP2001337955A (ja) * | 2000-05-22 | 2001-12-07 | Touuroomu Inc | ロバスト化装置及び方法 |
JP4267336B2 (ja) * | 2003-01-30 | 2009-05-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造パターン候補を生成する方法、システムおよびプログラム |
JP5413198B2 (ja) * | 2007-11-21 | 2014-02-12 | 日本電気株式会社 | ユーザインタフェース認識装置、ユーザインタフェース認識方法およびプログラム |
-
2010
- 2010-02-17 JP JP2010032345A patent/JP5408623B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133168A (zh) * | 2016-12-01 | 2018-06-08 | 北京新唐思创教育科技有限公司 | 一种文本识别中的公式搜索方法及其装置 |
CN108133168B (zh) * | 2016-12-01 | 2021-04-30 | 北京新唐思创教育科技有限公司 | 一种文本识别中的公式搜索方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2011170503A (ja) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7644375B1 (en) | Dynamic path flow reports | |
CN103098051B (zh) | 搜索引擎优化助理 | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US8862574B2 (en) | Providing a search-result filters toolbar | |
US8584009B2 (en) | Automatically propagating changes in document access rights for subordinate document components to superordinate document components | |
US20100228738A1 (en) | Adaptive document sampling for information extraction | |
CN101211336B (zh) | 可视化生成查询文件的系统及方法 | |
KR20190092614A (ko) | 데이터 목록을 이용하는 웹사이트 구축 디바이스, 시스템, 및 방법 | |
JP2007272892A (ja) | リアルタイムアップデートを行う階層的クラスタリング | |
US8302075B1 (en) | Methods and systems for selective code collapse | |
JP5408623B2 (ja) | 検索式提供方法、プログラム、及び、検索式提供システム | |
JP5056133B2 (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
JP2007034772A (ja) | Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム | |
US20120221298A1 (en) | Design Assist Device, Method, and Program | |
JP2007257369A (ja) | 情報検索装置 | |
KR20130021482A (ko) | Html 테이블의 셀 단위 편집 방법 | |
JP4959032B1 (ja) | ウェブページ解析装置およびウェブページ解析用プログラム | |
KR101985014B1 (ko) | 탐색적 데이터 시각화 시스템 및 그 방법 | |
JP5564442B2 (ja) | 文章検索装置 | |
JP2009199164A (ja) | 文書管理装置、文書管理方法及び記録媒体 | |
JP5477006B2 (ja) | 検索装置、及び、プログラム | |
JP6589317B2 (ja) | 書換装置、処理方法とそのプログラム、および、情報処理装置 | |
JP2012128802A (ja) | 検索アルゴリズム評価システム | |
JP4703705B2 (ja) | 構造化データ検索プログラム及び構造化データ検索装置 | |
WO2017134760A1 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130716 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130913 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131029 |
|
LAPS | Cancellation because of no payment of annual fees |