JP2014081958A - アノテーション付与方法、アノテーション復元方法、アノテーション付与装置及びアノテーション復元装置 - Google Patents
アノテーション付与方法、アノテーション復元方法、アノテーション付与装置及びアノテーション復元装置 Download PDFInfo
- Publication number
- JP2014081958A JP2014081958A JP2014008130A JP2014008130A JP2014081958A JP 2014081958 A JP2014081958 A JP 2014081958A JP 2014008130 A JP2014008130 A JP 2014008130A JP 2014008130 A JP2014008130 A JP 2014008130A JP 2014081958 A JP2014081958 A JP 2014081958A
- Authority
- JP
- Japan
- Prior art keywords
- annotation
- content
- xpath
- information
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【解決手段】アノテーション付与方法であって、コンピュータに、構造を有するコンテンツ上のいずれかの位置についてアノテーションを付与する際に、コンテンツにおける位置の下位側の構造をアノテーションと関連づけて記憶する、処理を実行させることにより上記課題を解決する。
【選択図】 図7
Description
図4は本実施例のシステムの一例の構成図である。図4に示すシステムは、利用者端末10、コンテンツサーバ20、アノテーション情報管理サーバ30、ネットワーク50を有する。利用者端末10、コンテンツサーバ20及びアノテーション情報管理サーバ30はネットワーク50を介してデータ通信可能に接続されている。ネットワーク50は、例えばインターネットやLANなど、データ通信可能な如何なる通信網であってもよい。
図6は利用者端末の一例の構成図である。利用者端末10は、それぞれバスBで相互に接続された入力装置61、出力装置62、ドライブ装置63、補助記憶装置64、主記憶装置65、演算処理装置66及びインターフェース装置67を有する。
図7は利用者端末の一例の処理ブロック図である。利用者端末10は、Web資源取得部71、Web資源解析結果準備部72、アノテーション情報格納部73、アノテーション付与部74、アノテーション構造位置取得部75、アノテーション埋め込み部76、アノテーション情報取得部77、アノテーション復元部78、アノテーション構造位置取得部79、アノテーション埋め込み部80を有している。
図8はアノテーションDBに格納されるアノテーション情報の一例の構成図である。図8のアノテーションDB31は、URL、XPath、特徴XPath、特徴情報、アノテーション内容が対応付けられたレコードを有している。アノテーションDB31に含まれるULRはアノテーションを付与したWebページのコンテンツのURLである。XPathはアノテーションが付与されたWebページのコンテンツ上の構造位置である。
図9は特徴XPathについて説明する為の説明図である。図9はアノテーションが付与されたWebページのコンテンツ上の構造位置がXPath「/HTML/BODY/TABLE」である例を表している。アノテーション構造位置取得部75はXPath「/HTML/BODY/TABLE」により表される対象ノードを頂点とし、末端までの全てのXPathを抽出する。
図13はアノテーション付与処理の一例のフローチャートである。アノテーション付与部74は利用者からWebページに対するアノテーション付与要求があると、ステップS1に進み、ブラウザ11に対するマウス操作で、利用者にアノテーションの付与位置を選択させる。ステップS2に進み、アノテーション付与部74は例えばブラウザ11に対するキーボード操作で、利用者にアノテーション内容であるコメントを入力させる。
図15は、本実施例のアノテーションプログラムを適用したブラウザの一例の構成図である。図15のブラウザ200は、典型的な構成を示したものであり、説明に不要なCSSの処理やPDFプラグイン等の細かい部分を省略している。
10 利用者端末
11 ブラウザ
12 プラグイン
20 コンテンツサーバ
21 コンテンツ
22 スクリプト
30 アノテーション情報管理サーバ
31 アノテーションDB
50 ネットワーク
61 入力装置
62 出力装置
63 ドライブ装置
64 補助記憶装置
65 主記憶装置
66 演算処理装置
67 インターフェース装置
68 記録媒体
71 Web資源取得部
72 Web資源解析結果準備部
73 アノテーション情報格納部
74 アノテーション付与部
75 アノテーション構造位置取得部
76 アノテーション埋め込み部
77 アノテーション情報取得部
78 アノテーション復元部
79 アノテーション構造位置取得部
80 アノテーション埋め込み部
100、101 対象ノード
150 HTML文書
200 ブラウザ
201 HTMLパーサ
202 DOMツリー
203 レンダリングエンジン
204 ユーザインタフェース
205 Javascriptプログラム
206 Javascriptエンジン
210 アノテーションプログラム
Claims (7)
- アノテーション付与方法であって、
コンピュータに、
構造を有するコンテンツ上のいずれかの位置についてアノテーションを付与する際に、前記コンテンツにおける前記位置の下位側の構造を前記アノテーションと関連づけて記憶する、
処理を実行させることを特徴とするアノテーション付与方法。 - 記憶される前記位置の下位側の構造は、前記位置の下位側の複数のパスの中から出現頻度に応じて選択された1つのパスに関する構造である、ことを特徴とする請求項1記載のアノテーション付与方法。
- 記憶される前記位置の下位側の構造は、前記位置の下位側の複数のパスの中から出現頻度が最も少ない1つのパスに関する構造である、ことを特徴とする請求項1記載のアノテーション付与方法。
- 記憶される前記位置の下位側の構造は、前記位置を頂点とする木構造の一部であることを特徴とする請求項1記載のアノテーション付与方法。
- アノテーション復元方法であって、
コンピュータに、
コンテンツについてアノテーションが付与された位置の下位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記構造に合致する構造が含まれることを検出すると、前記位置に対応づけてアノテーションを出力する、
処理を実行させることを特徴とするアノテーション復元方法。 - 構造を有するコンテンツ上のいずれかの位置についてアノテーションを付与する際に、前記コンテンツにおける前記位置の下位側の構造を前記アノテーションと関連づけて記憶部に記憶させる手段、
を備えたことを特徴とするアノテーション付与装置。 - コンテンツについてアノテーションが付与された位置の下位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記構造に合致する構造が含まれることが検出されると、前記位置に対応づけてアノテーションを表示部に出力する制御を行う手段、
を備えたことを特徴とするアノテーション復元装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014008130A JP5765452B2 (ja) | 2014-01-20 | 2014-01-20 | アノテーション付与復元方法及びアノテーション付与復元装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014008130A JP5765452B2 (ja) | 2014-01-20 | 2014-01-20 | アノテーション付与復元方法及びアノテーション付与復元装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010075512A Division JP5712496B2 (ja) | 2010-03-29 | 2010-03-29 | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014081958A true JP2014081958A (ja) | 2014-05-08 |
JP5765452B2 JP5765452B2 (ja) | 2015-08-19 |
Family
ID=50786034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014008130A Expired - Fee Related JP5765452B2 (ja) | 2014-01-20 | 2014-01-20 | アノテーション付与復元方法及びアノテーション付与復元装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5765452B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147529A (zh) * | 2018-02-13 | 2019-08-20 | 珠海金山办公软件有限公司 | 恢复pdf注释评论的方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110384A (ja) * | 1997-07-01 | 1999-04-23 | Hitachi Ltd | 構造化文書検索表示方法及び装置 |
JP2004046745A (ja) * | 2002-07-15 | 2004-02-12 | Internatl Business Mach Corp <Ibm> | データ処理方法、差分計算方法、これを用いた指示情報生成システム及びプログラム |
JP2004303097A (ja) * | 2003-03-31 | 2004-10-28 | Fujitsu Ltd | 構造化文書の部分文書抽出プログラムおよび部分文書抽出方法 |
JP2007140836A (ja) * | 2005-11-17 | 2007-06-07 | Toshiba Corp | 電子文書表示装置及び電子文書表示方法 |
WO2007119567A1 (ja) * | 2006-03-31 | 2007-10-25 | Justsystems Corporation | 文書処理装置および文書処理方法 |
JP2009140020A (ja) * | 2007-12-03 | 2009-06-25 | Fujitsu Ltd | アノテーションプログラム、アノテーション装置及びアノテーション方法 |
JP2010044708A (ja) * | 2008-08-18 | 2010-02-25 | Fujitsu Ltd | Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 |
JP2011209886A (ja) * | 2010-03-29 | 2011-10-20 | Fujitsu Ltd | アノテーション方法、アノテーションプログラム及びアノテーション装置 |
-
2014
- 2014-01-20 JP JP2014008130A patent/JP5765452B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110384A (ja) * | 1997-07-01 | 1999-04-23 | Hitachi Ltd | 構造化文書検索表示方法及び装置 |
JP2004046745A (ja) * | 2002-07-15 | 2004-02-12 | Internatl Business Mach Corp <Ibm> | データ処理方法、差分計算方法、これを用いた指示情報生成システム及びプログラム |
JP2004303097A (ja) * | 2003-03-31 | 2004-10-28 | Fujitsu Ltd | 構造化文書の部分文書抽出プログラムおよび部分文書抽出方法 |
JP2007140836A (ja) * | 2005-11-17 | 2007-06-07 | Toshiba Corp | 電子文書表示装置及び電子文書表示方法 |
WO2007119567A1 (ja) * | 2006-03-31 | 2007-10-25 | Justsystems Corporation | 文書処理装置および文書処理方法 |
JP2009140020A (ja) * | 2007-12-03 | 2009-06-25 | Fujitsu Ltd | アノテーションプログラム、アノテーション装置及びアノテーション方法 |
JP2010044708A (ja) * | 2008-08-18 | 2010-02-25 | Fujitsu Ltd | Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 |
JP2011209886A (ja) * | 2010-03-29 | 2011-10-20 | Fujitsu Ltd | アノテーション方法、アノテーションプログラム及びアノテーション装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147529A (zh) * | 2018-02-13 | 2019-08-20 | 珠海金山办公软件有限公司 | 恢复pdf注释评论的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5765452B2 (ja) | 2015-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9436711B2 (en) | Method and apparatus for preserving analytics while processing digital content | |
US8683311B2 (en) | Generating structured data objects from unstructured web pages | |
US7299407B2 (en) | Marking and annotating electronic documents | |
JP4716612B2 (ja) | Html文書に表示されるデータオブジェクトのソースをリダイレクトする方法 | |
KR101908162B1 (ko) | 통합 개발 환경에서의 라이브 브라우저 툴 제공 기법 | |
US9304979B2 (en) | Authorized syndicated descriptions of linked web content displayed with links in user-generated content | |
CN107391675B (zh) | 用于生成结构化信息的方法和装置 | |
US20150178476A1 (en) | System and method of monitoring font usage | |
AU2012225130A1 (en) | System and methods for facilitating the synchronization of data | |
CN102124481A (zh) | 在具有广告的网页中嵌入宏 | |
US20150227276A1 (en) | Method and system for providing an interactive user guide on a webpage | |
US9984052B2 (en) | Verifying content of resources in markup language documents | |
US20060173815A1 (en) | Facilitating Identification of Entire Web Pages When Each Web Page is Rendered From Multiple Portions and Interest is Expressed Based on Content of the Portions | |
CN114118038A (zh) | 表格文档在线编辑方法、装置、设备及介质 | |
JP2008090404A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
CN107590288B (zh) | 用于抽取网页图文块的方法和装置 | |
JP5098605B2 (ja) | アノテーションプログラム、アノテーション装置 | |
JP5063877B2 (ja) | 情報処理装置およびコンピュータプログラム | |
JP5712496B2 (ja) | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 | |
CN114021042A (zh) | 网页内容的提取方法、装置、计算机设备和存储介质 | |
US20120310893A1 (en) | Systems and methods for manipulating and archiving web content | |
JP5765452B2 (ja) | アノテーション付与復元方法及びアノテーション付与復元装置 | |
JP2006065467A5 (ja) | ||
JP2006065467A (ja) | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 | |
JP5391738B2 (ja) | アノテーションプログラム、アノテーション装置及びアノテーション方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150601 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5765452 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |