JP5712496B2 - アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 - Google Patents
アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 Download PDFInfo
- Publication number
- JP5712496B2 JP5712496B2 JP2010075512A JP2010075512A JP5712496B2 JP 5712496 B2 JP5712496 B2 JP 5712496B2 JP 2010075512 A JP2010075512 A JP 2010075512A JP 2010075512 A JP2010075512 A JP 2010075512A JP 5712496 B2 JP5712496 B2 JP 5712496B2
- Authority
- JP
- Japan
- Prior art keywords
- annotation
- node
- content
- position information
- tree structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図4は本実施例のシステムの一例の構成図である。図4に示すシステムは、利用者端末10、コンテンツサーバ20、アノテーション情報管理サーバ30、ネットワーク50を有する。利用者端末10、コンテンツサーバ20及びアノテーション情報管理サーバ30はネットワーク50を介してデータ通信可能に接続されている。ネットワーク50は、例えばインターネットやLANなど、データ通信可能な如何なる通信網であってもよい。
図6は利用者端末の一例の構成図である。利用者端末10は、それぞれバスBで相互に接続された入力装置61、出力装置62、ドライブ装置63、補助記憶装置64、主記憶装置65、演算処理装置66及びインターフェース装置67を有する。
図7は利用者端末の一例の処理ブロック図である。利用者端末10は、Web資源取得部71、Web資源解析結果準備部72、アノテーション情報格納部73、アノテーション付与部74、アノテーション構造位置取得部75、アノテーション埋め込み部76、アノテーション情報取得部77、アノテーション復元部78、アノテーション構造位置取得部79、アノテーション埋め込み部80を有している。
図8はアノテーションDBに格納されるアノテーション情報の一例の構成図である。図8のアノテーションDB31は、URL、XPath、特徴XPath、特徴情報、アノテーション内容が対応付けられたレコードを有している。アノテーションDB31に含まれるULRはアノテーションを付与したWebページのコンテンツのURLである。XPathはアノテーションが付与されたWebページのコンテンツ上の構造位置である。
図9は特徴XPathについて説明する為の説明図である。図9はアノテーションが付与されたWebページのコンテンツ上の構造位置がXPath「/HTML/BODY/TABLE」である例を表している。アノテーション構造位置取得部75はXPath「/HTML/BODY/TABLE」により表される対象ノードを頂点とし、末端までの全てのXPathを抽出する。
図13はアノテーション付与処理の一例のフローチャートである。アノテーション付与部74は利用者からWebページに対するアノテーション付与要求があると、ステップS1に進み、ブラウザ11に対するマウス操作で、利用者にアノテーションの付与位置を選択させる。ステップS2に進み、アノテーション付与部74は例えばブラウザ11に対するキーボード操作で、利用者にアノテーション内容であるコメントを入力させる。
図15は、本実施例のアノテーションプログラムを適用したブラウザの一例の構成図である。図15のブラウザ200は、典型的な構成を示したものであり、説明に不要なCSSの処理やPDFプラグイン等の細かい部分を省略している。
10 利用者端末
11 ブラウザ
12 プラグイン
20 コンテンツサーバ
21 コンテンツ
22 スクリプト
30 アノテーション情報管理サーバ
31 アノテーションDB
50 ネットワーク
61 入力装置
62 出力装置
63 ドライブ装置
64 補助記憶装置
65 主記憶装置
66 演算処理装置
67 インターフェース装置
68 記録媒体
71 Web資源取得部
72 Web資源解析結果準備部
73 アノテーション情報格納部
74 アノテーション付与部
75 アノテーション構造位置取得部
76 アノテーション埋め込み部
77 アノテーション情報取得部
78 アノテーション復元部
79 アノテーション構造位置取得部
80 アノテーション埋め込み部
100、101 対象ノード
150 HTML文書
200 ブラウザ
201 HTMLパーサ
202 DOMツリー
203 レンダリングエンジン
204 ユーザインタフェース
205 Javascriptプログラム
206 Javascriptエンジン
210 アノテーションプログラム
Claims (6)
- コンピュータによって実行されるアノテーション復元方法であって、
前記コンピュータが、
コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第1のノードを頂点としたときに前記木構造の末端となる複数の第2のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第1のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得ステップと、
前記コンテンツの木構造に対して前記第1のノードの位置を示す構造位置情報による前記第1のノードの検索を行い、前記第1のノードの位置を示す構造位置情報による前記第1のノードの検索により前記第1のノードが特定できない場合、前記特徴構造位置情報による前記第1のノードの検索を行う検索ステップと、
前記検索により前記第1のノードが特定された場合、特定された前記第1のノードに前記アノテーションを復元する第1復元ステップと、
を実行するアノテーション復元方法。 - 請求項1に記載のアノテーション復元方法において、
前記アノテーション情報取得ステップは、前記木構造の末端となる複数の第2のノードの位置を示す構造位置情報のうち、前記木構造における出現回数が最も少ない前記特徴構造位置情報がアノテーション情報として格納された前記アノテーションデータベースから前記アノテーション情報を取得する、アノテーション復元方法。 - 請求項1又は2に記載のアノテーション復元方法において、
前記検索により前記第1のノードが複数特定された場合、特定された前記第1のノードを頂点としたときの前記構造位置情報に含まれるタグの種類ごとの出現回数を抽出し、前記アノテーションが付与された前記コンテンツの木構造上の第1のノードを頂点としたときの前記構造位置情報に含まれるタグの種類ごとの出現回数と最も一致度が高い前記検索により特定された前記第1のノードに前記アノテーションを復元する第2復元ステップを更に有する、アノテーション復元方法。 - コンピュータによって実行されるアノテーション付与方法であって、
前記コンピュータが、
コンテンツに対するアノテーションの付与を受け付けた場合、前記アノテーションが付与された、前記コンテンツの木構造上の第1のノードを頂点としたときに前記木構造の末端となる複数の第2のノードの位置を示す構造位置情報を抽出し、
前記構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報として抽出し、
前記特徴構造位置情報と前記構造位置情報とを、前記アノテーションの復元に使用するアノテーション情報として記憶する、ことを実行するアノテーション付与方法。 - コンピュータに、
コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第1のノードを頂点としたときに前記木構造の末端となる複数の第2のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第1のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得ステップと、
前記コンテンツの木構造に対して前記第1のノードの位置を示す構造位置情報による前記第1のノードの検索を行い、前記第1のノードの位置を示す構造位置情報による前記第1のノードの検索により前記第1のノードが特定できない場合、前記特徴構造位置情報による前記第1のノードの検索を行う検索ステップと、
前記検索により前記第1のノードが特定された場合、特定された前記第1のノードに前記アノテーションを復元する第1復元ステップと、
を実行させるためのアノテーション復元プログラム。 - コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第1のノードを頂点としたときに前記木構造の末端となる複数の第2のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第1のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得手段と、
前記コンテンツの木構造に対して前記第1のノードの位置を示す構造位置情報による前記第1のノードの検索を行い、前記第1のノードの位置を示す構造位置情報による前記第1のノードの検索により前記第1のノードが特定できない場合、前記特徴構造位置情報による前記第1のノードの検索を行う検索手段と、
前記検索により前記第1のノードが特定された場合、特定された前記第1のノードに前記アノテーションを復元する第1復元手段と、
を有するアノテーション復元装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010075512A JP5712496B2 (ja) | 2010-03-29 | 2010-03-29 | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010075512A JP5712496B2 (ja) | 2010-03-29 | 2010-03-29 | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014008130A Division JP5765452B2 (ja) | 2014-01-20 | 2014-01-20 | アノテーション付与復元方法及びアノテーション付与復元装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011209886A JP2011209886A (ja) | 2011-10-20 |
JP5712496B2 true JP5712496B2 (ja) | 2015-05-07 |
Family
ID=44940899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010075512A Expired - Fee Related JP5712496B2 (ja) | 2010-03-29 | 2010-03-29 | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5712496B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014044564A (ja) * | 2012-08-27 | 2014-03-13 | Nec Corp | 文書管理装置、文書管理システム、文書管理方法及び文書管理プログラム |
JP5765452B2 (ja) * | 2014-01-20 | 2015-08-19 | 富士通株式会社 | アノテーション付与復元方法及びアノテーション付与復元装置 |
JP2018018551A (ja) * | 2017-11-01 | 2018-02-01 | 日本電気株式会社 | 文書管理装置、文書管理システム、文書管理方法及び文書管理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4418620B2 (ja) * | 2002-07-15 | 2010-02-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ処理方法、これを用いた指示情報生成システム及びプログラム |
JP2004303097A (ja) * | 2003-03-31 | 2004-10-28 | Fujitsu Ltd | 構造化文書の部分文書抽出プログラムおよび部分文書抽出方法 |
JP4880980B2 (ja) * | 2005-11-17 | 2012-02-22 | 株式会社東芝 | 電子文書表示装置及び電子文書表示方法 |
JP5098605B2 (ja) * | 2007-12-03 | 2012-12-12 | 富士通株式会社 | アノテーションプログラム、アノテーション装置 |
-
2010
- 2010-03-29 JP JP2010075512A patent/JP5712496B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011209886A (ja) | 2011-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9436711B2 (en) | Method and apparatus for preserving analytics while processing digital content | |
JP4716612B2 (ja) | Html文書に表示されるデータオブジェクトのソースをリダイレクトする方法 | |
US20090100154A1 (en) | Automatically instrumenting a set of web documents | |
US20100030752A1 (en) | System, methods and applications for structured document indexing | |
CN107391675B (zh) | 用于生成结构化信息的方法和装置 | |
US7844897B1 (en) | Blog template generation | |
US20090172520A1 (en) | Method of managing web services using integrated document | |
US20090006471A1 (en) | Exposing Specific Metadata in Digital Images | |
US9984052B2 (en) | Verifying content of resources in markup language documents | |
CN102124481A (zh) | 在具有广告的网页中嵌入宏 | |
JP2008090404A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
CN114021042A (zh) | 网页内容的提取方法、装置、计算机设备和存储介质 | |
CN112052364A (zh) | 敏感信息检测方法、装置、设备与计算机可读存储介质 | |
JP5098605B2 (ja) | アノテーションプログラム、アノテーション装置 | |
JP5063877B2 (ja) | 情報処理装置およびコンピュータプログラム | |
JP5712496B2 (ja) | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 | |
JP5765452B2 (ja) | アノテーション付与復元方法及びアノテーション付与復元装置 | |
JP2006065467A5 (ja) | ||
JP2006065467A (ja) | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 | |
JP5391738B2 (ja) | アノテーションプログラム、アノテーション装置及びアノテーション方法 | |
JP2009110506A (ja) | 情報処理装置及び情報処理プログラム | |
JP2005339379A (ja) | 情報表示システム及び情報表示方法 | |
JP2005148861A (ja) | 情報取得プログラム、情報取得方法および情報取得装置 | |
JP2010257114A (ja) | アノテーションプログラム、アノテーション装置及びアノテーション方法 | |
JP2005339376A (ja) | Web情報変換装方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140610 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140808 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140902 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141202 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20141210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5712496 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |