JPWO2017158748A1 - Webページ比較装置、Webページ比較方法、記録媒体およびプログラム - Google Patents
Webページ比較装置、Webページ比較方法、記録媒体およびプログラム Download PDFInfo
- Publication number
- JPWO2017158748A1 JPWO2017158748A1 JP2016541465A JP2016541465A JPWO2017158748A1 JP WO2017158748 A1 JPWO2017158748 A1 JP WO2017158748A1 JP 2016541465 A JP2016541465 A JP 2016541465A JP 2016541465 A JP2016541465 A JP 2016541465A JP WO2017158748 A1 JPWO2017158748 A1 JP WO2017158748A1
- Authority
- JP
- Japan
- Prior art keywords
- web page
- data
- comparison
- web pages
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000009877 rendering Methods 0.000 claims abstract description 37
- 238000000605 extraction Methods 0.000 claims abstract description 28
- 239000000284 extract Substances 0.000 claims abstract description 7
- 239000000470 constituent Substances 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
以下に本発明の一実施形態にかかるWebページ比較システム1を説明する。図1はWebページ比較システム1のハードウェア構成を示した図である。Webページ比較システム1はコンピュータ10と、コンピュータ10に接続された表示装置12と、コンピュータ10に接続された操作装置13を備える。
2位:class属性
3位:<h1>タグ
4位:<h2>タグ
座標(5,5)
座標(2,6)
座標(5,16)
座標(7,1)
座標(18,8)
座標(7,10)
座標(18,19)
座標(5,5)
座標(2,6)
座標(5,16)
上述した実施形態は、本発明の技術的思想の範囲内で様々に変形することができる。以下にそれらの変形の例を示す。なお、以下の2以上の変形例が組み合わされてもよい。
Claims (10)
- 複数のWebページの各々に関し、Webページ記述用言語で記述されたデータに従いレンダリングエンジンにより描画されたWebページの表示内容を表す表示データと、当該Webページの描画において前記レンダリングエンジンが決定した当該Webページに含まれる複数の構成要素の各々のレイアウトを示すレイアウトデータとを取得するデータ取得手段と、
前記複数のWebページの各々に関し、当該Webページの表示領域を、当該Webページに関する前記レイアウトデータが示すレイアウトに基づき予め定められた規則に従い特定される点を通る縦線および横線で分割する分割手段と、
前記複数のWebページの各々に関し前記分割手段による分割により得られた複数の分割表示領域の各々を、前記複数のWebページの間で対応付ける対応付手段と、
前記対応付手段により対応付けられた複数の分割表示領域におけるWebページの表示内容を比較し、当該比較の結果を示す比較結果データを生成する比較手段と
を備えるWebページ比較装置。 - 前記データ取得手段は、前記複数のWebページの各々に関し当該Webページに含まれる複数の構成要素の各々に付された属性を示す属性データを取得し、
前記データ取得手段が取得したレイアウトデータのうち、特定の属性を示す属性データが付された構成要素に関するレイアウトデータを抽出する抽出手段を備え、
前記分割手段は、前記抽出手段により抽出されたレイアウトデータを用いて前記分割を行う
請求項1に記載のWebページ比較装置。 - 前記抽出手段は、前記データ取得手段が取得した表示データが表すWebページの面積に応じて定まる数の属性データを予め定められた規則に従い抽出し、当該抽出した属性データが付された構成要素に関するレイアウトデータを抽出する
請求項2に記載のWebページ比較装置。 - 前記比較手段は、前記比較において、比較対象の分割表示領域に表示される画素または画素群を比較する
請求項1に記載のWebページ比較装置。 - 前記比較手段は、前記比較において、比較対象の分割表示領域に表示される文字を認識し、認識した文字を比較する
請求項1に記載のWebページ比較装置。 - 前記比較手段は、比較対象のWebページのうちの一のWebページの表示データを、前記比較において表示内容が一致する分割表示領域と表示内容が一致しない分割表示領域とで異なる表示態様となるように変更したデータを前記比較結果データとして生成する
請求項1に記載のWebページ比較装置。 - 前記比較手段は、比較対象のWebページのうちの一のWebページの表示データを、当該Webページの表示領域を構成する複数の分割表示領域の各々において、前記比較において一致する部分と一致しない部分とで異なる表示態様となるように変更したデータを前記比較結果データとして生成する
請求項1に記載のWebページ比較装置。 - データ処理装置が、複数のWebページの各々に関し、Webページ記述用言語で記述されたデータに従いレンダリングエンジンにより描画されたWebページの表示内容を表す表示データと、当該Webページの描画において前記レンダリングエンジンが決定した当該Webページに含まれる複数の構成要素の各々のレイアウトを示すレイアウトデータとを取得するステップと、
前記データ処理装置が、前記複数のWebページの各々に関し、当該Webページの表示領域を、当該Webページに関する前記レイアウトデータが示すレイアウトに基づき予め定められた規則に従い特定される点を通る縦線および横線で分割するステップと、
前記データ処理装置が、前記複数のWebページの各々に関し前記分割するステップにおける分割により得られた複数の分割表示領域の各々を、前記複数のWebページの間で対応付けるステップと、
前記データ処理装置が、前記対応付けるステップにおいて対応付けた複数の分割表示領域におけるWebページの表示内容を比較し、当該比較の結果を示す比較結果データを生成するステップと
を備えるWebページ比較方法。 - コンピュータに、
複数のWebページの各々に関し、Webページ記述用言語で記述されたデータに従いレンダリングエンジンにより描画されたWebページの表示内容を表す表示データと、当該Webページの描画において前記レンダリングエンジンが決定した当該Webページに含まれる複数の構成要素の各々のレイアウトを示すレイアウトデータとを取得する処理と、
前記複数のWebページの各々に関し、当該Webページの表示領域を、当該Webページに関する前記レイアウトデータが示すレイアウトに基づき予め定められた規則に従い特定される点を通る縦線および横線で分割する処理と、
前記複数のWebページの各々に関し前記分割により得られた複数の分割表示領域の各々を、前記複数のWebページの間で対応付ける処理と、
前記対応付ける処理において対応付けた複数の分割表示領域におけるWebページの表示内容を比較し、当該比較の結果を示す比較結果データを生成する処理と
を実行させるためのプログラムを前記コンピュータに読み取り可能に持続的に記憶する記録媒体。 - コンピュータに、
複数のWebページの各々に関し、Webページ記述用言語で記述されたデータに従いレンダリングエンジンにより描画されたWebページの表示内容を表す表示データと、当該Webページの描画において前記レンダリングエンジンが決定した当該Webページに含まれる複数の構成要素の各々のレイアウトを示すレイアウトデータとを取得する処理と、
前記複数のWebページの各々に関し、当該Webページの表示領域を、当該Webページに関する前記レイアウトデータが示すレイアウトに基づき予め定められた規則に従い特定される点を通る縦線および横線で分割する処理と、
前記複数のWebページの各々に関し前記分割により得られた複数の分割表示領域の各々を、前記複数のWebページの間で対応付ける処理と、
前記対応付ける処理において対応付けた複数の分割表示領域におけるWebページの表示内容を比較し、当該比較の結果を示す比較結果データを生成する処理と
を実行させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/058241 WO2017158748A1 (ja) | 2016-03-16 | 2016-03-16 | Webページ比較装置、Webページ比較方法、記録媒体およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6014794B1 JP6014794B1 (ja) | 2016-10-25 |
JPWO2017158748A1 true JPWO2017158748A1 (ja) | 2018-03-29 |
Family
ID=57145233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016541465A Active JP6014794B1 (ja) | 2016-03-16 | 2016-03-16 | Webページ比較装置、Webページ比較方法、記録媒体およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6014794B1 (ja) |
WO (1) | WO2017158748A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579912A (zh) * | 2022-03-08 | 2022-06-03 | 阿里巴巴(中国)有限公司 | 页面布局方法、装置、设备及介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4700637B2 (ja) * | 2007-02-28 | 2011-06-15 | 関西電力株式会社 | Web文書分割方法、システム及びプログラム |
US8849725B2 (en) * | 2009-08-10 | 2014-09-30 | Yahoo! Inc. | Automatic classification of segmented portions of web pages |
-
2016
- 2016-03-16 WO PCT/JP2016/058241 patent/WO2017158748A1/ja active Application Filing
- 2016-03-16 JP JP2016541465A patent/JP6014794B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP6014794B1 (ja) | 2016-10-25 |
WO2017158748A1 (ja) | 2017-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101472844B1 (ko) | 적응적 문서 디스플레이 장치 및 방법 | |
US8904285B2 (en) | Keyword extraction apparatus and program | |
US9529438B2 (en) | Printing structured documents | |
US20170132484A1 (en) | Two Step Mathematical Expression Search | |
JP2009140058A (ja) | 情報提供プログラム、情報提供装置、及び情報提供方法 | |
US10558745B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2018072903A (ja) | 文字認識装置、文字認識方法、文字認識プログラム | |
JP5629509B2 (ja) | 情報処理装置、情報閲覧装置、情報処理方法、およびプログラム | |
JP2016162200A5 (ja) | 情報処理システム、サーバ、制御方法、及びコンピュータプログラム | |
US9778823B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
US20080037051A1 (en) | Document display processor, computer readable medium storing document display processing program, computer data signal and document display processing method | |
JP5551986B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN112417826B (zh) | Pdf在线编辑方法、装置、电子设备和可读存储介质 | |
JP2011086050A (ja) | 情報処理端末及びコンピュータプログラム | |
JP6014794B1 (ja) | Webページ比較装置、Webページ比較方法、記録媒体およびプログラム | |
US20170270218A1 (en) | Mapping of Defined Regions Within a Webpage | |
JP5881937B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5112045B2 (ja) | 情報編集装置、情報編集方法、およびプログラム | |
JP6322086B2 (ja) | 表示制御装置、表示装置、プログラム、記録媒体 | |
US20120260161A1 (en) | Method for classifying and organizing content in related web pages and freely reconstructing and displaying the content | |
JP2004157668A (ja) | 検索システム、検索方法および検索プログラム | |
JP5612975B2 (ja) | セリフデータ生成装置、セリフデータ生成方法、及びプログラム | |
JP6152633B2 (ja) | 表示制御装置及びプログラム | |
JP3941610B2 (ja) | 情報抽出方法、情報抽出装置および情報抽出プログラム | |
JP5528410B2 (ja) | ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6014794 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |