JP5765452B2 - Annotation addition / restoration method and annotation addition / restoration apparatus - Google Patents

Annotation addition / restoration method and annotation addition / restoration apparatus Download PDF

Info

Publication number
JP5765452B2
JP5765452B2 JP2014008130A JP2014008130A JP5765452B2 JP 5765452 B2 JP5765452 B2 JP 5765452B2 JP 2014008130 A JP2014008130 A JP 2014008130A JP 2014008130 A JP2014008130 A JP 2014008130A JP 5765452 B2 JP5765452 B2 JP 5765452B2
Authority
JP
Japan
Prior art keywords
annotation
content
information
xpath
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014008130A
Other languages
Japanese (ja)
Other versions
JP2014081958A (en
Inventor
照宣 粂
照宣 粂
西野 文人
文人 西野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014008130A priority Critical patent/JP5765452B2/en
Publication of JP2014081958A publication Critical patent/JP2014081958A/en
Application granted granted Critical
Publication of JP5765452B2 publication Critical patent/JP5765452B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、利用者からの付与要求に基づき、コンテンツに基づく表示にアノテーションを付与し、利用者からの参照要求に基づき、コンテンツに基づく表示にアノテーションを復元させるアノテーション付与復元法及びアノテーション付与復元装置に関する。 The present invention is based on the grant request from the user, the annotation is applied to the display based on the content, based on the reference request from the user, annotated restored side Ho及 beauty annotated to restore annotations to display based on the content The present invention relates to a restoration device.

近年、インターネットやイントラネット等のネットワーク上のコンテンツ(例えばHTMLデータ)に基づく表示(例えばWebページ)に二次情報としてアノテーション(注釈)を付与するWebアノテーション技術が、よく利用されるようになった。なお、アノテーションとは、コンテンツ(HTMLデータ)に基づく表示(Webページ)に貼り付けられる内容をいう。   In recent years, Web annotation technology that adds annotation (annotation) as secondary information to a display (for example, a Web page) based on content (for example, HTML data) on a network such as the Internet or an intranet has been frequently used. Note that the annotation refers to content pasted on a display (Web page) based on content (HTML data).

Webアノテーション技術は、ネットワーク上のコンテンツに対してコンテンツの作者と異なる別の第三者が、コンテンツに変更を加えることなく、Webページに対して付箋(コメントや意見など)、下線、マーカ等のアノテーションを付与し、Webページの閲覧(参照)時に、Webページに付与したアノテーションを復元させるものである。   Web annotation technology is a technology that allows another third party who is different from the content creator to add content (such as comments and opinions), underlines, markers, etc. An annotation is given, and the annotation given to the Web page is restored when browsing (referring to) the Web page.

図1は付箋紙のような形式のアノテーションが表示されたWebページの一例の画面イメージ図である。図1中、アノテーション1はWebページ上に付箋紙のような形式で表示されている。   FIG. 1 is a screen image diagram of an example of a Web page on which an annotation in the form of a sticky note is displayed. In FIG. 1, annotation 1 is displayed on a Web page in a form like a sticky note.

Webアノテーション技術はアノテーション1が付与されたときに、アノテーション1が付与されたWebページの所在情報(例えばURL)を保持しておき、そのURLで指定されるWebページの閲覧時に、Webページに付与したアノテーション1を復元することにより、時間をおいてのWebページの閲覧や、アノテーション1を付与したアノテータと異なる第三者によるWebページの閲覧であっても、アノテーション1を復元できる。このようなWebアノテーション技術は、情報共有、校正支援、レビュー支援、調査支援、広告システムなど、広く利用されている。   The Web annotation technology retains location information (for example, URL) of the Web page to which the annotation 1 is added when the annotation 1 is added, and is given to the Web page when browsing the Web page specified by the URL. By restoring the annotation 1, the annotation 1 can be restored even when browsing the Web page with time or browsing the Web page by a third party different from the annotator to which the annotation 1 is added. Such Web annotation technology is widely used for information sharing, proofreading support, review support, survey support, advertising systems, and the like.

従来、Webページに対してアノテーション1を付与し、アノテーション1を複数の利用者で共有する場合は、仲介サーバにWebページの所在情報と、Webページに付与されたアノテーション1の構造位置情報及び内容とを登録しておく。構造位置情報はアノテーション1が付与されたWebページのコンテンツ上の位置を表している。なお、構造位置情報は木構造のパス表現(XPath)で表現される。   Conventionally, when annotation 1 is assigned to a web page and annotation 1 is shared by a plurality of users, the location information of the web page on the intermediary server and the structure position information and content of the annotation 1 attached to the web page And are registered. The structure position information represents the position on the content of the Web page to which the annotation 1 is assigned. The structure position information is represented by a tree structure path expression (XPath).

利用者が所在情報を指定してWebページを要求すると、仲介サーバはWebサーバからコンテンツを取得する。仲介サーバは利用者により指定された所在情報に対応するアノテーション1が登録されていれば、構造位置情報で表現されるコンテンツ上の位置にアノテーション1を復元して利用者のクライアントに送信する。このように、従来のWebアノテーション技術では、Webページに付与されたアノテーション1を複数の利用者で共有していた(例えば引用文献1参照)。   When a user specifies location information and requests a Web page, the mediation server acquires content from the Web server. If the annotation 1 corresponding to the location information designated by the user is registered, the mediation server restores the annotation 1 to the position on the content expressed by the structural position information and transmits it to the user's client. As described above, in the conventional Web annotation technology, the annotation 1 given to the Web page is shared by a plurality of users (see, for example, cited document 1).

特開2003−150542号公報JP 2003-150542 A

従来のWebアノテーション技術は、アノテーションを付与したWebページのコンテンツ上の位置をXPathで表現している。従来のWebアノテーション技術では、アノテーションを復元する場合、登録しておいたXPathを利用して、アノテーションを復元するコンテンツ上の位置を特定する。   In the conventional Web annotation technology, the position on the content of the Web page to which the annotation is added is expressed by XPath. In the conventional Web annotation technology, when restoring an annotation, the registered XPath is used to specify the position on the content where the annotation is restored.

ところで、Webアノテーション技術はコンテンツの作者と異なる別の第三者がWebページにアノテーションを付与するものである。したがって、作者は付与されたアノテーションに関係なく、コンテンツの内容を変更することもある。コンテンツの内容が変更されると、コンテンツの木構造が変化してしまい、登録しておいたXPathの意味が無くなってしまう。XPathの意味が無くなってしまうと、従来のWebアノテーション技術ではアノテーションを復元するコンテンツ上の位置を特定できなくなるという問題があった。   By the way, in the Web annotation technology, another third party different from the content creator gives an annotation to the Web page. Therefore, the author may change the contents of the content regardless of the assigned annotation. When the contents are changed, the tree structure of the contents changes, and the registered XPath has no meaning. If the meaning of XPath disappears, the conventional Web annotation technology has a problem that the position on the content where the annotation is restored cannot be specified.

図2はXPath取得時のコンテンツ及び木構造を表した説明図である。図2(A)はXPath取得時のコンテンツを表している。図2(B)は図2(A)に示したコンテンツの木構造を表している。図2のコンテンツにおいて、タグ<TABLE>を表すXPathは「/HTML/BODY/TABLE」となる。   FIG. 2 is an explanatory diagram showing content and a tree structure when XPath is acquired. FIG. 2A shows the content when XPath is acquired. FIG. 2B shows a tree structure of the content shown in FIG. In the content of FIG. 2, XPath representing the tag <TABLE> is “/ HTML / BODY / TABLE”.

図3は内容が変更されたコンテンツ及び木構造を表した説明図である。図3(A)は内容が変更されたコンテンツを表している。図3(B)は図3(A)に示したコンテンツの木構造を表している。図3のコンテンツにおいて、タグ<TABLE>を表すXPathは「/HTML/BODY/DIV/TABLE」となる。   FIG. 3 is an explanatory diagram showing content and a tree structure whose contents are changed. FIG. 3A shows content whose contents have been changed. FIG. 3B shows a tree structure of the content shown in FIG. In the content of FIG. 3, XPath indicating the tag <TABLE> is “/ HTML / BODY / DIV / TABLE”.

このように、図2に示すコンテンツが図3に示す内容に変更された場合、XPath取得時に登録しておいたXPath「/HTML/BODY/TABLE」は図3のコンテンツに存在しなくなるため、アノテーションを復元するコンテンツ上の位置を特定できなくなる。   As described above, when the content shown in FIG. 2 is changed to the content shown in FIG. 3, the XPath “/ HTML / BODY / TABLE” registered when the XPath is acquired does not exist in the content shown in FIG. It becomes impossible to specify the position on the content to restore.

従来のWebアノテーション技術では、タグ<TABLE>が変更により削除されてしまった場合を除き、コンテンツ内に存在しているにもかかわらず、アノテーションを復元するコンテンツ上の位置を特定できないという問題があった。   In the conventional Web annotation technology, there is a problem that the position on the content where the annotation is restored cannot be specified even though the tag <TABLE> has been deleted due to the change even though it exists in the content. It was.

なお、Webアノテーション技術において、アノテーション付与とアノテーション復元との間には時間的なずれがある。このため、アノテーションを付与してから復元するまでの間にコンテンツの構造が変化することは、Webアノテーション技術において避けることができない。   In the Web annotation technology, there is a time lag between annotation assignment and annotation restoration. For this reason, it is unavoidable in the Web annotation technology that the structure of the content changes from when the annotation is added to when the annotation is restored.

本発明は、コンテンツが変更されたとしても、アノテーションを復元するコンテンツ上の位置を特定できるアノテーション付与復元法及びアノテーション付与復元装置を提供することを目的とする。 The present invention also as content is changed, and an object thereof is to provide a annotated restore lateral Ho及 beauty annotated restoring apparatus that can identify the position on the content to restore the annotations.

上記課題を解決するため、本発明の一実施形態は、アノテーション付与復元方法であって、コンピュータに、構造を有するコンテンツ上のいずれかの位置についてアノテーションを付与する際に、前記コンテンツにおける前記位置の上位側の構造の記憶情報及び下位側の構造の記憶情報を前記アノテーションと関連づけて記憶する処理と前記コンテンツについてアノテーションが付与された位置の上位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記上位側の構造に合致する構造が含まれることを検出できなければ、アノテーションが付与された位置の下位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記下位側の構造に合致する構造が含まれるかの検出を行い、記憶された前記下位側の構造に合致する構造が含まれることを検出すると、前記位置に対応づけてアノテーションを出力する処理を実行させ、記憶される前記位置の下位側の構造は、前記位置の下位側の複数のパスの中から出現頻度に応じて選択された1つのパスに関する構造であることを特徴とする。 In order to solve the above-mentioned problem, an embodiment of the present invention is an annotation assignment / restoration method, wherein when an annotation is given to a computer at any position on content having a structure, the position of the position in the content is determined. a process of storing the information stored in the storage information and the lower structure of the upper side of the structure in association with the annotation, based on the stored information of the upper side of the structure of the position annotated for the content, annotations restore If it is not detected that the content matching the stored higher-order structure is included in the content of the content, the content to be reconstructed based on the storage information of the lower-order structure at the position where the annotation is added Whether a structure that matches the stored subordinate structure is included It performs output when it detects that includes structure that matches the stored the lower side of the structure, the position to be executed and a process of outputting the annotation in association with, the lower side of the position to be stored structure Is a structure relating to one path selected according to the appearance frequency from a plurality of paths on the lower side of the position.

なお、本発明の一実施形態の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。   In addition, what applied the component, the expression, or arbitrary combinations of the component of one Embodiment of this invention to a method, an apparatus, a system, a computer program, a recording medium, a data structure, etc. is also effective as an aspect of this invention. .

上述の如く、本発明の一実施形態によれば、コンテンツが変更されたとしても、アノテーションを復元するコンテンツ上の位置を特定できる。   As described above, according to an embodiment of the present invention, even if the content is changed, the position on the content where the annotation is restored can be specified.

付箋紙のような形式のアノテーションが表示されたWebページの一例の画面イメージ図である。It is a screen image figure of an example of the web page on which the annotation of a format like a sticky note is displayed. XPath取得時のコンテンツ及び木構造を表した説明図である。It is explanatory drawing showing the content at the time of XPath acquisition, and the tree structure. 内容が変更されたコンテンツ及び木構造を表した説明図である。It is explanatory drawing showing the content and the tree structure in which the content was changed. 本実施例のシステムの一例の構成図である。It is a block diagram of an example of the system of a present Example. 本実施例のシステムの他の例の構成図である。It is a block diagram of the other example of the system of a present Example. 利用者端末の一例の構成図である。It is a block diagram of an example of a user terminal. 利用者端末の一例の処理ブロック図である。It is a processing block diagram of an example of a user terminal. アノテーションDBに格納されるアノテーション情報の一例の構成図である。It is a block diagram of an example of the annotation information stored in annotation DB. 特徴XPathについて説明する為の説明図である。It is explanatory drawing for demonstrating the characteristic XPath. 特徴情報について説明する為の説明図である。It is explanatory drawing for demonstrating feature information. XPathにより対象ノードが特定できない例を表した説明図である。It is explanatory drawing showing the example which cannot identify an object node by XPath. 特徴XPathを用いたワイルドカード検索により複数の対象ノードが特定される例を表した説明図である。It is explanatory drawing showing the example in which a some target node is specified by the wild card search using the characteristic XPath. アノテーション付与処理の一例のフローチャートである。It is a flowchart of an example of an annotation provision process. アノテーション復元処理の一例のフローチャートである。It is a flowchart of an example of an annotation restoration process. 本実施例のアノテーションプログラムを適用したブラウザの一例の構成図である。It is a block diagram of an example of the browser to which the annotation program of a present Example is applied.

次に、本発明を実施するための形態を、以下の実施例に基づき図面を参照しつつ説明していく。   Next, modes for carrying out the present invention will be described based on the following embodiments with reference to the drawings.

(システム構成)
図4は本実施例のシステムの一例の構成図である。図4に示すシステムは、利用者端末10、コンテンツサーバ20、アノテーション情報管理サーバ30、ネットワーク50を有する。利用者端末10、コンテンツサーバ20及びアノテーション情報管理サーバ30はネットワーク50を介してデータ通信可能に接続されている。ネットワーク50は、例えばインターネットやLANなど、データ通信可能な如何なる通信網であってもよい。
(System configuration)
FIG. 4 is a block diagram of an example of the system of the present embodiment. The system illustrated in FIG. 4 includes a user terminal 10, a content server 20, an annotation information management server 30, and a network 50. The user terminal 10, the content server 20, and the annotation information management server 30 are connected via a network 50 so that data communication is possible. The network 50 may be any communication network capable of data communication, such as the Internet or a LAN.

利用者端末10はブラウザ11がインストールされている。ブラウザ11はプラグイン12により拡張機能が追加されている。コンテンツサーバ20はWebページ等のコンテンツ21を格納している。アノテーション情報管理サーバ30はアノテーションDB31を有し、アノテーション情報を管理している。   A browser 11 is installed on the user terminal 10. The browser 11 has an extended function added by a plug-in 12. The content server 20 stores content 21 such as Web pages. The annotation information management server 30 has an annotation DB 31 and manages annotation information.

図5は本実施例のシステムの他の例の構成図である。図5に示すシステムは、図4のシステムと同様、利用者端末10、コンテンツサーバ20、アノテーション情報管理サーバ30及びネットワーク50を有する。なお、図5のブラウザ11はプラグイン12により拡張機能が追加されていない。また、図5のシステムは、コンテンツサーバ20に、スクリプト22が一部を構成するコンテンツ21を格納している点で、図4のシステムと異なっている。   FIG. 5 is a configuration diagram of another example of the system of this embodiment. The system shown in FIG. 5 includes a user terminal 10, a content server 20, an annotation information management server 30, and a network 50, as in the system of FIG. Note that the browser 11 in FIG. 5 does not have an extended function added by the plug-in 12. Further, the system of FIG. 5 is different from the system of FIG. 4 in that the content server 20 stores the content 21 of which the script 22 constitutes a part.

図4のシステムはプラグイン12により本実施例に掛かるアノテーション機能を実現している。図5のシステムはスクリプト22により本実施例に掛かるアノテーション機能を実現している。   The system of FIG. 4 implements the annotation function according to the present embodiment by the plug-in 12. The system of FIG. 5 implements the annotation function according to the present embodiment by the script 22.

(利用者端末10の構成)
図6は利用者端末の一例の構成図である。利用者端末10は、それぞれバスBで相互に接続された入力装置61、出力装置62、ドライブ装置63、補助記憶装置64、主記憶装置65、演算処理装置66及びインターフェース装置67を有する。
(Configuration of user terminal 10)
FIG. 6 is a configuration diagram of an example of a user terminal. The user terminal 10 includes an input device 61, an output device 62, a drive device 63, an auxiliary storage device 64, a main storage device 65, an arithmetic processing device 66, and an interface device 67 that are mutually connected by a bus B.

入力装置61はキーボードやマウスなどである。入力装置61は各種信号を入力するために用いられる。出力装置62はディスプレイ装置などである。出力装置62は各種ウインドウやデータ等を表示するために用いられる。インターフェース装置67はモデム、LANカードなどである。インターフェース装置67はネットワーク50に接続する為に用いられる。   The input device 61 is a keyboard or a mouse. The input device 61 is used for inputting various signals. The output device 62 is a display device or the like. The output device 62 is used to display various windows and data. The interface device 67 is a modem, a LAN card, or the like. The interface device 67 is used for connecting to the network 50.

本実施例に掛かるアノテーションプログラムは利用者端末10を制御する各種プログラムの少なくとも一部である。アノテーションプログラムは、例えばアノテーションプログラムを記録した記録媒体68の配布やネットワーク50からのプログラムのダウンロードなどによって提供される。アノテーションプログラムを記録した記録媒体68は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。   The annotation program according to the present embodiment is at least a part of various programs that control the user terminal 10. The annotation program is provided, for example, by distributing a recording medium 68 on which the annotation program is recorded, downloading a program from the network 50, or the like. The recording medium 68 on which the annotation program is recorded is information such as a CD-ROM, a flexible disk, a magneto-optical disk, etc., a recording medium for recording information optically, electrically or magnetically, a ROM, a flash memory, etc. Various types of recording media such as a semiconductor memory for electrical recording can be used.

アノテーションプログラムを記録した記録媒体68がドライブ装置63にセットされるとアノテーションプログラムは、記録媒体68からドライブ装置63を介して補助記憶装置64にインストールされる。ネットワーク50からダウンロードされたアノテーションプログラムは、インターフェース装置67を介して補助記憶装置64にインストールされる。補助記憶装置64はインストールされたアノテーションプログラムを格納すると共に必要なファイル、データ等を格納する。   When the recording medium 68 on which the annotation program is recorded is set in the drive device 63, the annotation program is installed in the auxiliary storage device 64 from the recording medium 68 via the drive device 63. The annotation program downloaded from the network 50 is installed in the auxiliary storage device 64 via the interface device 67. The auxiliary storage device 64 stores the installed annotation program and also stores necessary files and data.

主記憶装置65には、補助記憶装置64から読み出されたアノテーションプログラムが格納される。そして、演算処理装置66は主記憶装置65に格納されたアノテーションプログラムに従って、後述するような各種処理を実現している。   The main storage device 65 stores the annotation program read from the auxiliary storage device 64. The arithmetic processing unit 66 implements various processes as will be described later in accordance with the annotation program stored in the main storage device 65.

(利用者端末10の処理ブロック)
図7は利用者端末の一例の処理ブロック図である。利用者端末10は、Web資源取得部71、Web資源解析結果準備部72、アノテーション情報格納部73、アノテーション付与部74、アノテーション構造位置取得部75、アノテーション埋め込み部76、アノテーション情報取得部77、アノテーション復元部78、アノテーション構造位置取得部79、アノテーション埋め込み部80を有している。
(Processing block of user terminal 10)
FIG. 7 is a processing block diagram of an example of a user terminal. The user terminal 10 includes a Web resource acquisition unit 71, a Web resource analysis result preparation unit 72, an annotation information storage unit 73, an annotation assignment unit 74, an annotation structure position acquisition unit 75, an annotation embedding unit 76, an annotation information acquisition unit 77, an annotation A restoration unit 78, an annotation structure position acquisition unit 79, and an annotation embedding unit 80 are included.

Web資源取得部71は、Web資源であるコンテンツの所在情報(URL)を指定されたときに、指定されたURLのコンテンツを、コンテンツサーバ20から取得する。Web資源解析結果準備部72は、取り出されたコンテンツをそのままWeb資源解析結果とすることも可能であるが、通常、コンテンツをパージングした結果である木構造をWeb資源解析結果として保持する。   When the location information (URL) of the content that is the Web resource is specified, the Web resource acquisition unit 71 acquires the content of the specified URL from the content server 20. The Web resource analysis result preparation unit 72 can use the extracted content as the Web resource analysis result as it is, but normally holds the tree structure that is the result of parsing the content as the Web resource analysis result.

アノテーション付与部74は、利用者からコンテンツに基づく表示(Webページ)に対するアノテーション付与の操作を受け付ける。アノテーション構造位置取得部75はアノテーション付与の操作に基づき、利用者がアノテーションを付与したWebページのコンテンツ上の位置を表す構造位置情報(XPath)を取得する。アノテーション埋め込み部76はアノテーション構造位置取得部75が取得した構造位置情報に基づき、アノテーション内容をWeb資源解析結果の指定された位置に埋め込む。アノテーション付与部74は、Web資源解析結果をレンダリングエンジンに渡し、描画させることで、アノテーションが付与されたWebページの表示を行うことができる。   The annotation assigning unit 74 accepts an operation for giving an annotation to a display (Web page) based on content from a user. The annotation structure position acquisition unit 75 acquires structure position information (XPath) representing the position on the content of the Web page to which the user has added the annotation, based on the operation for adding the annotation. The annotation embedding unit 76 embeds the annotation content at the specified position of the Web resource analysis result based on the structure position information acquired by the annotation structure position acquisition unit 75. The annotation giving unit 74 can display the Web page to which the annotation is given by passing the Web resource analysis result to the rendering engine and drawing it.

また、アノテーション情報格納部73は利用者に付与されたアノテーションを復元する為のアノテーション情報をアノテーションDB31に格納させる。アノテーション情報には、アノテーションを付与したWebページのコンテンツのURL、アノテーションの構造位置情報であるXPath、後述の特徴XPath、後述の特徴情報、アノテーション内容が含まれる。   The annotation information storage unit 73 stores annotation information for restoring the annotation given to the user in the annotation DB 31. The annotation information includes the URL of the content of the Web page to which the annotation has been added, XPath that is the structure position information of the annotation, feature XPath that will be described later, feature information that will be described later, and annotation content.

アノテーション情報取得部77は取得したコンテンツに対応するアノテーション情報がアノテーションDB31に格納されていれば、アノテーションDB31からコンテンツに対応するアノテーション情報を取得する。   If the annotation information corresponding to the acquired content is stored in the annotation DB 31, the annotation information acquisition unit 77 acquires the annotation information corresponding to the content from the annotation DB 31.

そして、アノテーション構造位置取得部79はアノテーション情報に指示されているアノテーションの構造位置を探し出す。アノテーション埋め込み部80はアノテーション構造位置取得部79が探し出した構造位置に基づき、アノテーション内容をWeb資源解析結果の指定された位置に埋め込む。アノテーション復元部78は、Web資源解析結果をレンダリングエンジンに渡すことで、アノテーションが復元されたWebページを表示させることができる。   Then, the annotation structure position acquisition unit 79 searches for the annotation structure position specified in the annotation information. The annotation embedding unit 80 embeds the annotation content at the specified position of the Web resource analysis result based on the structure position searched by the annotation structure position acquisition unit 79. The annotation restoration unit 78 can display the web page in which the annotation is restored by passing the web resource analysis result to the rendering engine.

(アノテーションDBの構成)
図8はアノテーションDBに格納されるアノテーション情報の一例の構成図である。図8のアノテーションDB31は、URL、XPath、特徴XPath、特徴情報、アノテーション内容が対応付けられたレコードを有している。アノテーションDB31に含まれるULRはアノテーションを付与したWebページのコンテンツのURLである。XPathはアノテーションが付与されたWebページのコンテンツ上の構造位置である。
(Composition of annotation DB)
FIG. 8 is a configuration diagram of an example of annotation information stored in the annotation DB. The annotation DB 31 in FIG. 8 has a record in which URL, XPath, feature XPath, feature information, and annotation content are associated. The ULR included in the annotation DB 31 is the URL of the content of the Web page to which the annotation has been added. XPath is the structural position on the content of the Web page to which the annotation is assigned.

特徴XPath及び特徴情報は、XPathによりアノテーションが付与されたWebページのコンテンツ上の構造位置が特定できなかったときに、アノテーションが付与されたWebページのコンテンツ上の構造位置を検索する為に利用するものである。特徴XPath及び特徴情報の詳細は後述する。アノテーション内容はアノテーションに記述された情報である。   The feature XPath and the feature information are used to search the structure position on the content of the annotated Web page when the structure position on the content of the Web page annotated with the XPath cannot be specified. Is. Details of the feature XPath and feature information will be described later. The annotation content is information described in the annotation.

(特徴XPath及び特徴情報)
図9は特徴XPathについて説明する為の説明図である。図9はアノテーションが付与されたWebページのコンテンツ上の構造位置がXPath「/HTML/BODY/TABLE」である例を表している。アノテーション構造位置取得部75はXPath「/HTML/BODY/TABLE」により表される対象ノードを頂点とし、末端までの全てのXPathを抽出する。
(Feature XPath and feature information)
FIG. 9 is an explanatory diagram for explaining the feature XPath. FIG. 9 shows an example in which the structure position on the content of the Web page with the annotation is XPath “/ HTML / BODY / TABLE”. The annotation structure position acquisition unit 75 uses the target node represented by XPath “/ HTML / BODY / TABLE” as a vertex, and extracts all XPaths up to the end.

図9の例では、XPath「/TABLE/TR/TD」が2回、XPath「/TABLE/TR/TD/P」が1回、抽出される。アノテーション構造位置取得部75は抽出されたXPathの内、最も出現回数の少ないXPathを特徴XPathとする。図9の例では、XPath「/TABLE/TR/TD/P」が特徴XPathとなる。   In the example of FIG. 9, XPath “/ TABLE / TR / TD” is extracted twice and XPath “/ TABLE / TR / TD / P” is extracted once. The annotation structure position acquisition unit 75 sets the XPath having the smallest number of appearances among the extracted XPaths as the feature XPath. In the example of FIG. 9, XPath “/ TABLE / TR / TD / P” is the characteristic XPath.

図9に示すように、アノテーション構造位置取得部75は対象ノードに含まれるXPathの内、最も出現回数の少ないXPathを特徴XPathとして抽出する。最も出現回数の少ないXPathを特徴XPathとして抽出する理由は、対象ノードの特徴を最も表していると考えられるからである。   As illustrated in FIG. 9, the annotation structure position acquisition unit 75 extracts an XPath having the smallest number of appearances among the XPaths included in the target node as a feature XPath. The reason why the XPath having the smallest number of appearances is extracted as the feature XPath is because it is considered that the feature of the target node is most representative.

なお、図9では対象ノードに含まれるXPathの内、最も出現回数の少ないXPathを特徴XPathとして抽出したが、最も出現回数の多いXPathや平均的な出現回数のXPathなど、様々なバリエーションも考えられる。   In FIG. 9, among the XPaths included in the target node, the XPath with the smallest number of appearances is extracted as the feature XPath. However, various variations such as the XPath with the largest number of appearances and the XPath with the average number of appearances are possible. .

XPathとして、出現回数が少ないものを用いる場合は、再現位置を特定しやすくなるが、コンテンツの内容が変更された時に、特徴パスに関連する部分が変更される可能性が高くなり、特徴パスを発見できない可能性が上がる。XPathとして、出現回数が多いものを用いる場合は、逆にコンテンツの内容が変更された場合でも特徴パスを発見することが可能であるが、他でも頻繁に使われるパスである可能性が高く、正しい再現位置を特定しにくくなる。平均値を使う場合は、上記特徴の中間となる。   When using an XPath with a small number of appearances, it becomes easier to specify the reproduction position, but when the content is changed, the portion related to the feature path is likely to be changed, and the feature path is changed. Increases the possibility of not being found. When using an XPath that has a large number of appearances, it is possible to find a feature path even if the content is changed, but it is highly likely that the path is frequently used elsewhere. It becomes difficult to specify the correct reproduction position. When using an average value, it is intermediate between the above features.

例えば、アノテーションシステムを使い画面構成を複数人で検討する場合など、正しい再現位置に確実に戻すことが必要な場面では、少ないものを特徴パスとすることで、精度の高い情報提供ができる。また、足跡システムのように、再現位置のズレよりも情報があることを通知することが重要なシステムでは、多いものを選択すると良い。   For example, in cases where it is necessary to reliably return to the correct reproduction position, such as when an annotation system is used to examine the screen configuration by a plurality of people, it is possible to provide highly accurate information by using as few feature paths. Further, in a system such as a footprint system in which it is important to notify that there is information rather than a deviation of the reproduction position, it is preferable to select a large number.

図10は特徴情報について説明する為の説明図である。図10はアノテーションが付与されたWebページのコンテンツ上の構造位置がXPath「/HTML/BODY/TABLE」である例を表している。アノテーション構造位置取得部75は対象ノードに含まれるタグの種類と数とを特徴情報として抽出する。   FIG. 10 is an explanatory diagram for explaining the feature information. FIG. 10 shows an example in which the structure position on the content of the Web page with the annotation is XPath “/ HTML / BODY / TABLE”. The annotation structure position acquisition unit 75 extracts the type and number of tags included in the target node as feature information.

図10の例では、タグ<TABLE>が1回、タグ<TR>が1回、タグ<TD>が3回、タグ<P>が1回、抽出される。アノテーション構造位置取得部75は抽出されたタグの種類と数とを特徴情報とする。なお、アノテーション構造位置取得部75と同様な手順にてアノテーション構造位置取得部79も特徴情報を抽出する。   In the example of FIG. 10, the tag <TABLE> is extracted once, the tag <TR> is extracted once, the tag <TD> is extracted three times, and the tag <P> is extracted once. The annotation structure position acquisition unit 75 uses the type and number of the extracted tags as feature information. The annotation structure position acquisition unit 79 also extracts feature information in the same procedure as the annotation structure position acquisition unit 75.

図11はXPathにより対象ノードが特定できない例を表した説明図である。ここで言う対象ノードとは、アノテーション情報に含まれているXPathで表されるノードである。   FIG. 11 is an explanatory diagram showing an example in which the target node cannot be specified by XPath. The target node mentioned here is a node represented by XPath included in the annotation information.

図11(A)は、アノテーション内容を付与したときのコンテンツを表している。図11(A)は図9に示すコンテンツと同様である。したがって、図11(A)に示すコンテンツはアノテーション情報に含まれるXPathが「/HTML/BODY/TABLE」となる。図11(A)に示すコンテンツはアノテーション情報に含まれる特徴XPathが「/TABLE/TR/TD/P」となる。また、図11(A)に示すコンテンツはアノテーション情報に含まれる特徴情報が「タグ<TABLE>1回、タグ<TR>1回、タグ<TD>3回、タグ<P>1回」となる。   FIG. 11A shows content when annotation content is added. FIG. 11A is the same as the content shown in FIG. Therefore, in the content shown in FIG. 11A, the XPath included in the annotation information is “/ HTML / BODY / TABLE”. In the content shown in FIG. 11A, the feature XPath included in the annotation information is “/ TABLE / TR / TD / P”. In the content shown in FIG. 11A, the feature information included in the annotation information is “tag <TABLE> once, tag <TR> once, tag <TD> three times, tag <P> once”. .

図11(B)は内容が変更されたコンテンツを表している。図11(B)のコンテンツは図11(A)に示す変更前のコンテンツから取得したXPath「/HTML/BODY/TABLE」が存在していない。したがって、アノテーション構造位置取得部79は図11(A)に示す変更前のコンテンツから取得したXPathで検索したとしても、図11(B)のコンテンツに含まれる対象ノードを特定できない。   FIG. 11B shows content whose contents have been changed. In the content of FIG. 11B, the XPath “/ HTML / BODY / TABLE” acquired from the content before change shown in FIG. 11A does not exist. Therefore, even if the annotation structure position acquisition unit 79 searches with the XPath acquired from the content before change shown in FIG. 11A, the target node included in the content of FIG. 11B cannot be specified.

本実施例のシステムでは、アノテーション情報に含まれる特徴XPath「/TABLE/TR/TD/P」でワイルドカード検索「//特徴XPath」を行うことにより対象ノードを特定できる。   In the system of this embodiment, the target node can be specified by performing a wild card search “// feature XPath” with the feature XPath “/ TABLE / TR / TD / P” included in the annotation information.

なお、本実施例のシステムでは特徴XPath「/TABLE/TR/TD/P」でワイルドカード検索「//特徴XPath」を行うことにより対象ノードを特定しようとした場合、複数の対象ノードが特定されることがある。特徴XPathを用いたワイルドカード検索「//特徴XPath」により複数の対象ノードが特定された場合は、図12に示すように特徴情報を用いて1つの対象ノードを特定する。   In the system of the present embodiment, when the target node is specified by performing the wild card search “// feature XPath” with the feature XPath “/ TABLE / TR / TD / P”, a plurality of target nodes are specified. Sometimes. When a plurality of target nodes are specified by the wild card search “// feature XPath” using the feature XPath, one target node is specified using the feature information as shown in FIG.

図12は特徴XPathを用いたワイルドカード検索により複数の対象ノードが特定される例を表した説明図である。図12(A)は図11(A)と同様であるため、説明を省略する。図12(B)は内容が変更されたコンテンツを表している。図12(B)のコンテンツは、変更前のコンテンツから取得したXPath「/HTML/BODY/TABLE」が存在していない。したがって、アノテーション構造位置取得部79は変更前のコンテンツから取得したXPathで検索したとしても、図12(B)のコンテンツに含まれる対象ノードを特定できない。   FIG. 12 is an explanatory diagram showing an example in which a plurality of target nodes are specified by a wild card search using the feature XPath. FIG. 12A is similar to FIG. 11A, and thus the description is omitted. FIG. 12B shows content whose contents have been changed. In the content of FIG. 12B, the XPath “/ HTML / BODY / TABLE” acquired from the content before the change does not exist. Therefore, even if the annotation structure position acquisition unit 79 searches with the XPath acquired from the content before the change, it cannot identify the target node included in the content of FIG.

そこで、アノテーション構造位置取得部79は変更前のコンテンツから抽出した特徴XPath「/TABLE/TR/TD/P」でワイルドカード検索「//特徴XPath」を行うが、2つの対象ノード100、101を特定してしまう。   Therefore, the annotation structure position acquisition unit 79 performs a wild card search “// feature XPath” with the feature XPath “/ TABLE / TR / TD / P” extracted from the content before the change. I will identify.

そこで、アノテーション構造位置取得部79は特定した対象ノード100、101に含まれるタグの種類と数とを特徴情報として抽出する。図12(B)の場合、対象ノード100は「タグ<TABLE>1回、タグ<TR>1回、タグ<TD>3回、タグ<P>1回」となる。また、対象ノード101は「タグ<TABLE>1回、タグ<TR>1回、タグ<TD>3回、タグ<P>3回」となる。   Therefore, the annotation structure position acquisition unit 79 extracts the types and number of tags included in the identified target nodes 100 and 101 as feature information. In the case of FIG. 12B, the target node 100 is “tag <TABLE> once, tag <TR> once, tag <TD> three times, tag <P> once”. The target node 101 is “tag <TABLE> once, tag <TR> once, tag <TD> three times, tag <P> three times”.

アノテーション構造位置取得部79は対象ノード100、101から抽出した特徴情報とアノテーション情報に含まれる特徴情報とを比較し、アノテーション情報に含まれる特徴情報との一致度が高い、言い換えれば一致する特徴情報の含有率が最も高い対象ノードを対象ノードとして特定する。   The annotation structure position acquisition unit 79 compares the feature information extracted from the target nodes 100 and 101 with the feature information included in the annotation information, and has a high degree of matching with the feature information included in the annotation information, in other words, matching feature information. The target node having the highest content ratio is identified as the target node.

図12(B)の場合、アノテーション構造位置取得部79は対象ノード100、101から抽出した特徴情報とアノテーション情報に含まれる特徴情報とを比較し、対象ノード100を特定できる。   In the case of FIG. 12B, the annotation structure position acquisition unit 79 can identify the target node 100 by comparing the feature information extracted from the target nodes 100 and 101 with the feature information included in the annotation information.

(利用者端末10の処理手順)
図13はアノテーション付与処理の一例のフローチャートである。アノテーション付与部74は利用者からWebページに対するアノテーション付与要求があると、ステップS1に進み、ブラウザ11に対するマウス操作で、利用者にアノテーションの付与位置を選択させる。ステップS2に進み、アノテーション付与部74は例えばブラウザ11に対するキーボード操作で、利用者にアノテーション内容であるコメントを入力させる。
(Processing procedure of user terminal 10)
FIG. 13 is a flowchart of an example of the annotation assignment process. If there is an annotation assignment request for a Web page from the user, the annotation assignment unit 74 proceeds to step S1 and causes the user to select an annotation assignment position by a mouse operation on the browser 11. In step S <b> 2, the annotation assigning unit 74 causes the user to input a comment that is an annotation content by, for example, a keyboard operation on the browser 11.

ステップS3に進み、アノテーション構造位置取得部75はアノテーションの付与位置(対象ノード)のXPathを取得する。ステップS4に進み、アノテーション構造位置取得部75は対象ノードを頂点とし、末端までの全てのXPathを抽出する。   In step S3, the annotation structure position acquisition unit 75 acquires the XPath of the annotation assignment position (target node). In step S4, the annotation structure position acquisition unit 75 extracts all XPaths up to the end with the target node as a vertex.

ステップS5に進み、アノテーション構造位置取得部75はステップS4で抽出したXPathの内、最も出現回数の少ないXPathを特徴XPathとして抽出する。アノテーション構造位置取得部75はステップS6に進み、アノテーションの付与位置に含まれるタグの種類と数(出現回数)とを特徴情報として抽出する。   In step S5, the annotation structure position acquisition unit 75 extracts the XPath having the smallest number of appearances among the XPaths extracted in step S4 as the feature XPath. In step S6, the annotation structure position acquisition unit 75 extracts the type and number (number of appearances) of tags included in the annotation attachment position as feature information.

そして、ステップS7に進み、アノテーション情報格納部73はXPath、特徴XPath、特徴情報及びアノテーション内容をアノテーション情報としてアノテーションDB31に格納する。ステップS8に進み、アノテーション埋め込み部76はステップS3でアノテーション構造位置取得部75が取得したXPathに基づき、アノテーション内容をコンテンツのWeb資源解析結果の指定された位置に埋め込む。   In step S7, the annotation information storage unit 73 stores the XPath, the feature XPath, the feature information, and the annotation content in the annotation DB 31 as annotation information. In step S8, the annotation embedding unit 76 embeds the annotation content at the specified position of the Web resource analysis result of the content based on the XPath acquired by the annotation structure position acquisition unit 75 in step S3.

その後、アノテーション付与部74は、アノテーション内容が埋め込まれたWeb資源解析結果をレンダリングエンジンに渡すことで、アノテーションが付与されたコンテンツのWebページを表示させることができる。   Thereafter, the annotation assigning unit 74 can display the Web page of the content to which the annotation is added by passing the Web resource analysis result in which the annotation content is embedded to the rendering engine.

図14はアノテーション復元処理の一例のフローチャートである。Web資源取得部71は例えばブラウザ11に対するキーボード操作で、使用者からWebページのURLの指定があると、ステップS11に進み、WebページのURLをブラウザ11から取得する。   FIG. 14 is a flowchart of an example of the annotation restoration process. For example, when the user designates the URL of the Web page by a keyboard operation on the browser 11, the Web resource acquisition unit 71 proceeds to Step S <b> 11 and acquires the URL of the Web page from the browser 11.

Web資源取得部71は取得したURLのWebページに対応したコンテンツをコンテンツサーバ20から取得する。Web資源解析結果準備部72は、取得したコンテンツをパージングした結果である木構造をWeb資源解析結果として保持する。   The Web resource acquisition unit 71 acquires content corresponding to the Web page with the acquired URL from the content server 20. The Web resource analysis result preparation unit 72 holds a tree structure as a result of parsing the acquired content as a Web resource analysis result.

ステップS12に進み、アノテーション情報取得部77はステップS11で取得したURLに対応するアノテーション情報をアノテーションDB31から取得する。ステップS13に進み、アノテーション構造位置取得部79はアノテーション情報に含まれるXPathによる復元位置(対象ノード)の検索を行う。   In step S12, the annotation information acquisition unit 77 acquires annotation information corresponding to the URL acquired in step S11 from the annotation DB 31. In step S13, the annotation structure position acquisition unit 79 searches for a restoration position (target node) using XPath included in the annotation information.

ステップS14に進み、アノテーション構造位置取得部79はステップS13の検索により復元位置を特定できればステップS20に進み、特定した復元位置に基づき、Web資源解析結果の指定された位置にアノテーション内容を埋め込む。   In step S14, the annotation structure position acquisition unit 79 proceeds to step S20 if the restoration position can be identified by the search in step S13, and embeds the annotation content at the designated position in the Web resource analysis result based on the identified restoration position.

ステップS14において、アノテーション構造位置取得部79はステップS13の検索により復元位置を特定できなければステップS15に進み、アノテーション情報に含まれる特徴XPathによる復元位置のワイルドカード検索を行う。   In step S14, the annotation structure position acquisition unit 79 proceeds to step S15 if the restoration position cannot be specified by the search in step S13, and performs a wildcard search of the restoration position using the feature XPath included in the annotation information.

ステップS16に進み、アノテーション構造位置取得部79はステップS15のワイルドカード検索により復元位置を特定できればステップS20に進み、特定した復元位置に基づき、Web資源解析結果の指定された位置にアノテーション内容を埋め込む。   In step S16, the annotation structure position acquisition unit 79 proceeds to step S20 if the restoration position can be identified by the wild card search in step S15, and embeds the annotation content at the designated position in the Web resource analysis result based on the identified restoration position. .

ステップS16において、アノテーション構造位置取得部79はステップS15のワイルドカード検索により複数の復元位置を特定してしまい、1つの復元位置を特定できなければステップS17に進み、特定した複数の復元位置のそれぞれについて、復元位置に含まれるタグ毎の出現回数を特徴情報として抽出する。アノテーション構造位置取得部79はステップS17で抽出した特徴情報とアノテーション情報に含まれる特定情報とを比較して、ステップS17で抽出した特徴情報の内、アノテーション情報に含まれる特定情報と一致する特定情報を特定できれば、ステップS20に進む。   In step S16, the annotation structure position acquisition unit 79 identifies a plurality of restoration positions by the wild card search in step S15. If one restoration position cannot be identified, the process proceeds to step S17, and each of the plurality of identified restoration positions is determined. The number of appearances for each tag included in the restoration position is extracted as feature information. The annotation structure position acquisition unit 79 compares the feature information extracted in step S17 with the specific information included in the annotation information, and among the feature information extracted in step S17, specific information that matches the specific information included in the annotation information. If it can be specified, the process proceeds to step S20.

アノテーション構造位置取得部79は特定した復元位置に基づき、Web資源解析結果の指定された位置にアノテーション内容を埋め込む。また、アノテーション構造位置取得部79はステップS17で抽出した特徴情報の内、アノテーション情報に含まれる特定情報と一致する特定情報を特定できなければ、ステップS19に進み、アノテーション情報に含まれる特徴情報との一致度が高い、言い換えれば一致する特徴情報の含有率が最も高い特定情報を特定する。   Based on the identified restoration position, the annotation structure position acquisition unit 79 embeds the annotation content at the designated position of the Web resource analysis result. If the annotation structure position acquisition unit 79 cannot identify the specific information that matches the specific information included in the annotation information among the characteristic information extracted in step S17, the process proceeds to step S19, and the feature information included in the annotation information Specific information having the highest degree of coincidence, in other words, having the highest content ratio of the matching feature information is specified.

ステップS19に続いてステップS20に進み、アノテーション構造位置取得部79は特定した復元位置に基づき、Web資源解析結果の指定された位置にアノテーション内容を埋め込む。   Progressing to step S20 following step S19, the annotation structure position acquisition unit 79 embeds the annotation content at the specified position of the Web resource analysis result based on the specified restoration position.

その後、アノテーション復元部78は、アノテーション内容が埋め込まれたWeb資源解析結果をレンダリングエンジンに渡すことで、アノテーションが付与されたWebページを表示させることができる。   Thereafter, the annotation restoration unit 78 can display the Web page with the annotation by passing the Web resource analysis result in which the annotation content is embedded to the rendering engine.

(アノテーションプログラムがブラウザ11に適用された例)
図15は、本実施例のアノテーションプログラムを適用したブラウザの一例の構成図である。図15のブラウザ200は、典型的な構成を示したものであり、説明に不要なCSSの処理やPDFプラグイン等の細かい部分を省略している。
(An example in which the annotation program is applied to the browser 11)
FIG. 15 is a configuration diagram of an example of a browser to which the annotation program of this embodiment is applied. The browser 200 in FIG. 15 shows a typical configuration, and details such as CSS processing and PDF plug-in that are unnecessary for the description are omitted.

ネットワークを経由して受信されたHTML文書150をHTMLパーサ201は解析して、木構造(DOMツリー)202を生成する。これと同時に、Javascript(登録商標)エンジン206はHTML文書150中にあったJavascriptプログラム205を実行し、DOMツリー202の中身を書き換える。書き換えられたDOMツリー202はレンダリングエンジン203に送られる。   The HTML parser 201 analyzes the HTML document 150 received via the network, and generates a tree structure (DOM tree) 202. At the same time, the JavaScript (registered trademark) engine 206 executes the JavaScript program 205 in the HTML document 150 and rewrites the contents of the DOM tree 202. The rewritten DOM tree 202 is sent to the rendering engine 203.

レンダリングエンジン203は送られてきたDOMツリー202を画面で見える形に変換する。そして、ユーザインタフェース204を介したユーザの操作等によってJavascriptエンジン206はDOMツリー202を書き換え、表示させる内容を変化させる。   The rendering engine 203 converts the received DOM tree 202 into a form that can be seen on the screen. Then, the Java engine 206 rewrites the DOM tree 202 and changes the contents to be displayed by a user operation or the like via the user interface 204.

アノテーションプログラム210は、典型的にブラウザ200の中に保持される(すなわち、ブラウザ200に組込まれる、あるいは機能拡張として付け加えられる形で実現される)。   The annotation program 210 is typically held in the browser 200 (ie, implemented in a form that is incorporated into the browser 200 or added as a function extension).

そして、読み込まれたHTML文書150のJavascriptプログラム205が実行されるのに追加して、アノテーションプログラム210は実行され、DOMツリー202を書き換える。なお、アノテーションプログラム210が参照するアノテーションDB等のデータはブラウザ200の外部に保持される。   Then, in addition to the Javascript program 205 of the read HTML document 150 being executed, the annotation program 210 is executed and rewrites the DOM tree 202. Note that data such as the annotation DB referred to by the annotation program 210 is held outside the browser 200.

アノテーションプログラム210を保持する別の実施形態としては、読み込まれるHTML文書に、アノテーションプログラム210を保持しておくことが考えられる。この実施形態では、適用できるWebページが限定されるが、ブラウザ200にアノテーションプログラム210を保持するのと同じ効果を持たせることができる。   As another embodiment for holding the annotation program 210, it is conceivable to hold the annotation program 210 in a read HTML document. In this embodiment, the applicable Web pages are limited, but the same effect as that in which the annotation program 210 is held in the browser 200 can be provided.

本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。   The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.

1 アノテーション
10 利用者端末
11 ブラウザ
12 プラグイン
20 コンテンツサーバ
21 コンテンツ
22 スクリプト
30 アノテーション情報管理サーバ
31 アノテーションDB
50 ネットワーク
61 入力装置
62 出力装置
63 ドライブ装置
64 補助記憶装置
65 主記憶装置
66 演算処理装置
67 インターフェース装置
68 記録媒体
71 Web資源取得部
72 Web資源解析結果準備部
73 アノテーション情報格納部
74 アノテーション付与部
75 アノテーション構造位置取得部
76 アノテーション埋め込み部
77 アノテーション情報取得部
78 アノテーション復元部
79 アノテーション構造位置取得部
80 アノテーション埋め込み部
100、101 対象ノード
150 HTML文書
200 ブラウザ
201 HTMLパーサ
202 DOMツリー
203 レンダリングエンジン
204 ユーザインタフェース
205 Javascriptプログラム
206 Javascriptエンジン
210 アノテーションプログラム
DESCRIPTION OF SYMBOLS 1 Annotation 10 User terminal 11 Browser 12 Plug-in 20 Content server 21 Content 22 Script 30 Annotation information management server 31 Annotation DB
DESCRIPTION OF SYMBOLS 50 Network 61 Input device 62 Output device 63 Drive device 64 Auxiliary storage device 65 Main storage device 66 Arithmetic processing device 67 Interface device 68 Recording medium 71 Web resource acquisition part 72 Web resource analysis result preparation part 73 Annotation information storage part 74 Annotation provision part 75 Annotation structure position acquisition unit 76 Annotation embedding unit 77 Annotation information acquisition unit 78 Annotation restoration unit 79 Annotation structure position acquisition unit 80 Annotation embedding unit 100, 101 Target node 150 HTML document 200 Browser 201 HTML parser 202 DOM tree 203 Rendering engine 204 User Interface 205 Javascript program 206 Javascript engine 2 0 annotation program

Claims (4)

アノテーション付与復元方法であって、
コンピュータに、
構造を有するコンテンツ上のいずれかの位置についてアノテーションを付与する際に、前記コンテンツにおける前記位置の上位側の構造の記憶情報及び下位側の構造の記憶情報を前記アノテーションと関連づけて記憶する処理と
前記コンテンツについてアノテーションが付与された位置の上位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記上位側の構造に合致する構造が含まれることを検出できなければ、アノテーションが付与された位置の下位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記下位側の構造に合致する構造が含まれるかの検出を行い、記憶された前記下位側の構造に合致する構造が含まれることを検出すると、前記位置に対応づけてアノテーションを出力する処理を実行させ
記憶される前記位置の下位側の構造は、前記位置の下位側の複数のパスの中から出現頻度に応じて選択された1つのパスに関する構造であること
を特徴とするアノテーション付与復元方法。
Annotation restoration method,
On the computer,
When annotating for any position on the content having the structure, the process of storing information stored in the storage information and the lower structure of the upper side of the structure of the position in the content in association with the annotation,
Based on the storage information of the structure on the upper side of the position where the annotation is assigned to the content, it is not possible to detect that the content that matches the stored structure on the upper side is included in the content to be restored. Based on the storage information of the structure on the lower side of the position where the annotation is added, the content to be restored is detected whether the structure matching the stored structure on the lower side is included and stored. wherein when detecting that includes structure that matches the lower side of the structure, to execute a process of outputting the annotation in association with the position,
Structure of the lower side of the position to be stored, annotated restore wherein the structure der Rukoto for one path selected in accordance with the frequency of occurrence from among a plurality of paths of the lower side of the position.
記憶される前記位置の下位側の構造は、前記位置の下位側の複数のパスの中から出現頻度が最も少ない1つのパスに関する構造である、こと
を特徴とする請求項1記載のアノテーション付与復元方法。
The annotation addition / restoration according to claim 1, wherein the stored structure on the lower side of the position is a structure related to one path having the lowest appearance frequency among a plurality of paths on the lower side of the position. Method.
記憶される前記位置の下位側の構造は、前記位置を頂点とする木構造の一つであることを特徴とする請求項1記載のアノテーション付与復元方法。 2. The annotation addition / restoration method according to claim 1, wherein the stored structure on the lower side of the position is one of tree structures having the position as a vertex. 構造を有するコンテンツ上のいずれかの位置についてアノテーションを付与する際に、前記コンテンツにおける前記位置の上位側の構造の記憶情報及び下位側の構造の記憶情報を前記アノテーションと関連づけて記憶部に記憶させる手段
前記コンテンツについてアノテーションが付与された位置の上位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記上位側の構造に合致する構造が含まれることを検出できなければ、アノテーションが付与された位置の下位側の構造の記憶情報に基づいて、アノテーション復元対象のコンテンツ中に、記憶された前記下位側の構造に合致する構造が含まれるかの検出を行い、記憶された前記下位側の構造に合致する構造が含まれることを検出すると、前記位置に対応づけてアノテーションを表示部に出力する制御を行う手段と、を備え
記憶される前記位置の下位側の構造は、前記位置の下位側の複数のパスの中から出現頻度に応じて選択された1つのパスに関する構造であること
を特徴とするアノテーション付与復元装置。
When annotating for any position on the content having the structure, and stores the information stored in the storage information and the lower structure of the upper side of the structure of the position in the content storage unit in association with the annotation and means,
Based on the storage information of the structure on the upper side of the position where the annotation is assigned to the content, it is not possible to detect that the content that matches the stored structure on the upper side is included in the content to be restored. Based on the storage information of the structure on the lower side of the position where the annotation is added, the content to be restored is detected whether the structure matching the stored structure on the lower side is included and stored. And a means for controlling to output an annotation to the display unit in association with the position when it is detected that a structure that matches the structure on the lower side is included ,
The annotation addition / restoration device according to claim 1, wherein the stored structure on the lower side of the position is a structure related to one path selected according to the appearance frequency from a plurality of paths on the lower side of the position .
JP2014008130A 2014-01-20 2014-01-20 Annotation addition / restoration method and annotation addition / restoration apparatus Expired - Fee Related JP5765452B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014008130A JP5765452B2 (en) 2014-01-20 2014-01-20 Annotation addition / restoration method and annotation addition / restoration apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014008130A JP5765452B2 (en) 2014-01-20 2014-01-20 Annotation addition / restoration method and annotation addition / restoration apparatus

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010075512A Division JP5712496B2 (en) 2010-03-29 2010-03-29 Annotation restoration method, annotation assignment method, annotation restoration program, and annotation restoration apparatus

Publications (2)

Publication Number Publication Date
JP2014081958A JP2014081958A (en) 2014-05-08
JP5765452B2 true JP5765452B2 (en) 2015-08-19

Family

ID=50786034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014008130A Expired - Fee Related JP5765452B2 (en) 2014-01-20 2014-01-20 Annotation addition / restoration method and annotation addition / restoration apparatus

Country Status (1)

Country Link
JP (1) JP5765452B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147529B (en) * 2018-02-13 2023-06-30 珠海金山办公软件有限公司 Method and device for recovering PDF comment

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3832693B2 (en) * 1997-07-01 2006-10-11 株式会社日立製作所 Structured document search and display method and apparatus
JP4418620B2 (en) * 2002-07-15 2010-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション Data processing method, instruction information generation system and program using the same
JP2004303097A (en) * 2003-03-31 2004-10-28 Fujitsu Ltd Partial document extraction program and partial document extraction method of structured document
JP4880980B2 (en) * 2005-11-17 2012-02-22 株式会社東芝 Electronic document display device and electronic document display method
JP4878624B2 (en) * 2006-03-31 2012-02-15 株式会社ジャストシステム Document processing apparatus and document processing method
JP5098605B2 (en) * 2007-12-03 2012-12-12 富士通株式会社 Annotation program, annotation device
JP5187064B2 (en) * 2008-08-18 2013-04-24 富士通株式会社 Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method
JP5712496B2 (en) * 2010-03-29 2015-05-07 富士通株式会社 Annotation restoration method, annotation assignment method, annotation restoration program, and annotation restoration apparatus

Also Published As

Publication number Publication date
JP2014081958A (en) 2014-05-08

Similar Documents

Publication Publication Date Title
US9436711B2 (en) Method and apparatus for preserving analytics while processing digital content
JP4157708B2 (en) Method, apparatus, and computer program for providing content to client
US8683311B2 (en) Generating structured data objects from unstructured web pages
US9171182B2 (en) Dynamic data masking
US7299407B2 (en) Marking and annotating electronic documents
JP4716612B2 (en) Method for redirecting the source of a data object displayed in an HTML document
US9213777B2 (en) Method and apparatus for archiving dynamic webpages based on source attributes
CN107391675B (en) Method and apparatus for generating structured information
US20150178476A1 (en) System and method of monitoring font usage
US9984052B2 (en) Verifying content of resources in markup language documents
US20090172520A1 (en) Method of managing web services using integrated document
CN102124481A (en) Embedding macros in web pages with advertisements
US20150227276A1 (en) Method and system for providing an interactive user guide on a webpage
JP2008090404A (en) Document retrieval apparatus, method and program
CN104252447A (en) File behavior analysis method and device
JP5063877B2 (en) Information processing apparatus and computer program
JP5098605B2 (en) Annotation program, annotation device
US8577912B1 (en) Method and system for robust hyperlinking
JP5712496B2 (en) Annotation restoration method, annotation assignment method, annotation restoration program, and annotation restoration apparatus
CN114021042A (en) Webpage content extraction method and device, computer equipment and storage medium
JP2007122398A (en) Method for determining identity of fragment, and computer program
JP5765452B2 (en) Annotation addition / restoration method and annotation addition / restoration apparatus
JP2006065467A5 (en)
JP2012145970A (en) Portlet support system, apparatus, method and program
JP5391738B2 (en) Annotation program, annotation apparatus, and annotation method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150601

R150 Certificate of patent or registration of utility model

Ref document number: 5765452

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees