JP5712496B2

JP5712496B2 - アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置

Info

Publication number: JP5712496B2
Application number: JP2010075512A
Authority: JP
Inventors: 照宣粂; 西野　文人; 文人西野
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2010-03-29
Filing date: 2010-03-29
Publication date: 2015-05-07
Anticipated expiration: 2030-03-29
Also published as: JP2011209886A

Description

本発明は、利用者からの付与要求に基づき、コンテンツに基づく表示にアノテーションを付与し、利用者からの参照要求に基づき、コンテンツに基づく表示にアノテーションを復元させるアノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置に関する。

近年、インターネットやイントラネット等のネットワーク上のコンテンツ（例えばＨＴＭＬデータ）に基づく表示（例えばＷｅｂページ）に二次情報としてアノテーション（注釈）を付与するＷｅｂアノテーション技術が、よく利用されるようになった。なお、アノテーションとは、コンテンツ（ＨＴＭＬデータ）に基づく表示（Ｗｅｂページ）に貼り付けられる内容をいう。

Ｗｅｂアノテーション技術は、ネットワーク上のコンテンツに対してコンテンツの作者と異なる別の第三者が、コンテンツに変更を加えることなく、Ｗｅｂページに対して付箋（コメントや意見など）、下線、マーカ等のアノテーションを付与し、Ｗｅｂページの閲覧（参照）時に、Ｗｅｂページに付与したアノテーションを復元させるものである。

図１は付箋紙のような形式のアノテーションが表示されたＷｅｂページの一例の画面イメージ図である。図１中、アノテーション１はＷｅｂページ上に付箋紙のような形式で表示されている。

Ｗｅｂアノテーション技術はアノテーション１が付与されたときに、アノテーション１が付与されたＷｅｂページの所在情報（例えばＵＲＬ）を保持しておき、そのＵＲＬで指定されるＷｅｂページの閲覧時に、Ｗｅｂページに付与したアノテーション１を復元することにより、時間をおいてのＷｅｂページの閲覧や、アノテーション１を付与したアノテータと異なる第三者によるＷｅｂページの閲覧であっても、アノテーション１を復元できる。このようなＷｅｂアノテーション技術は、情報共有、校正支援、レビュー支援、調査支援、広告システムなど、広く利用されている。

従来、Ｗｅｂページに対してアノテーション１を付与し、アノテーション１を複数の利用者で共有する場合は、仲介サーバにＷｅｂページの所在情報と、Ｗｅｂページに付与されたアノテーション１の構造位置情報及び内容とを登録しておく。構造位置情報はアノテーション１が付与されたＷｅｂページのコンテンツ上の位置を表している。なお、構造位置情報は木構造のパス表現（ＸＰａｔｈ）で表現される。

利用者が所在情報を指定してＷｅｂページを要求すると、仲介サーバはＷｅｂサーバからコンテンツを取得する。仲介サーバは利用者により指定された所在情報に対応するアノテーション１が登録されていれば、構造位置情報で表現されるコンテンツ上の位置にアノテーション１を復元して利用者のクライアントに送信する。このように、従来のＷｅｂアノテーション技術では、Ｗｅｂページに付与されたアノテーション１を複数の利用者で共有していた（例えば引用文献１参照）。

特開２００３−１５０５４２号公報

従来のＷｅｂアノテーション技術は、アノテーションを付与したＷｅｂページのコンテンツ上の位置をＸＰａｔｈで表現している。従来のＷｅｂアノテーション技術では、アノテーションを復元する場合、登録しておいたＸＰａｔｈを利用して、アノテーションを復元するコンテンツ上の位置を特定する。

ところで、Ｗｅｂアノテーション技術はコンテンツの作者と異なる別の第三者がＷｅｂページにアノテーションを付与するものである。したがって、作者は付与されたアノテーションに関係なく、コンテンツの内容を変更することもある。コンテンツの内容が変更されると、コンテンツの木構造が変化してしまい、登録しておいたＸＰａｔｈの意味が無くなってしまう。ＸＰａｔｈの意味が無くなってしまうと、従来のＷｅｂアノテーション技術ではアノテーションを復元するコンテンツ上の位置を特定できなくなるという問題があった。

図２はＸＰａｔｈ取得時のコンテンツ及び木構造を表した説明図である。図２（Ａ）はＸＰａｔｈ取得時のコンテンツを表している。図２（Ｂ）は図２（Ａ）に示したコンテンツの木構造を表している。図２のコンテンツにおいて、タグ＜ＴＡＢＬＥ＞を表すＸＰａｔｈは「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」となる。

図３は内容が変更されたコンテンツ及び木構造を表した説明図である。図３（Ａ）は内容が変更されたコンテンツを表している。図３（Ｂ）は図３（Ａ）に示したコンテンツの木構造を表している。図３のコンテンツにおいて、タグ＜ＴＡＢＬＥ＞を表すＸＰａｔｈは「／ＨＴＭＬ／ＢＯＤＹ／ＤＩＶ／ＴＡＢＬＥ」となる。

このように、図２に示すコンテンツが図３に示す内容に変更された場合、ＸＰａｔｈ取得時に登録しておいたＸＰａｔｈ「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」は図３のコンテンツに存在しなくなるため、アノテーションを復元するコンテンツ上の位置を特定できなくなる。

従来のＷｅｂアノテーション技術では、タグ＜ＴＡＢＬＥ＞が変更により削除されてしまった場合を除き、コンテンツ内に存在しているにもかかわらず、アノテーションを復元するコンテンツ上の位置を特定できないという問題があった。

なお、Ｗｅｂアノテーション技術において、アノテーション付与とアノテーション復元との間には時間的なずれがある。このため、アノテーションを付与してから復元するまでの間にコンテンツの構造が変化することは、Ｗｅｂアノテーション技術において避けることができない。

本発明は、コンテンツが変更されたとしても、アノテーションを復元するコンテンツ上の位置を特定できるアノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置を提供することを目的とする。

上記課題を解決するため、本発明の一実施形態は、コンピュータによって実行されるアノテーション復元方法であって、前記コンピュータが、コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第１のノードを頂点としたときに前記木構造の末端となる複数の第２のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第１のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得ステップと、前記コンテンツの木構造に対して前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索を行い、前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索により前記第１のノードが特定できない場合、前記特徴構造位置情報による前記第１のノードの検索を行う検索ステップと、前記検索により前記第１のノードが特定された場合、特定された前記第１のノードに前記アノテーションを復元する第１復元ステップと、を実行するアノテーション復元方法である。

なお、本発明の一実施形態の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。

上述の如く、本発明の一実施形態によれば、コンテンツが変更されたとしても、アノテーションを復元するコンテンツ上の位置を特定できる。

付箋紙のような形式のアノテーションが表示されたＷｅｂページの一例の画面イメージ図である。ＸＰａｔｈ取得時のコンテンツ及び木構造を表した説明図である。内容が変更されたコンテンツ及び木構造を表した説明図である。本実施例のシステムの一例の構成図である。本実施例のシステムの他の例の構成図である。利用者端末の一例の構成図である。利用者端末の一例の処理ブロック図である。アノテーションＤＢに格納されるアノテーション情報の一例の構成図である。特徴ＸＰａｔｈについて説明する為の説明図である。特徴情報について説明する為の説明図である。ＸＰａｔｈにより対象ノードが特定できない例を表した説明図である。特徴ＸＰａｔｈを用いたワイルドカード検索により複数の対象ノードが特定される例を表した説明図である。アノテーション付与処理の一例のフローチャートである。アノテーション復元処理の一例のフローチャートである。本実施例のアノテーションプログラムを適用したブラウザの一例の構成図である。

次に、本発明を実施するための形態を、以下の実施例に基づき図面を参照しつつ説明していく。

（システム構成）
図４は本実施例のシステムの一例の構成図である。図４に示すシステムは、利用者端末１０、コンテンツサーバ２０、アノテーション情報管理サーバ３０、ネットワーク５０を有する。利用者端末１０、コンテンツサーバ２０及びアノテーション情報管理サーバ３０はネットワーク５０を介してデータ通信可能に接続されている。ネットワーク５０は、例えばインターネットやＬＡＮなど、データ通信可能な如何なる通信網であってもよい。

利用者端末１０はブラウザ１１がインストールされている。ブラウザ１１はプラグイン１２により拡張機能が追加されている。コンテンツサーバ２０はＷｅｂページ等のコンテンツ２１を格納している。アノテーション情報管理サーバ３０はアノテーションＤＢ３１を有し、アノテーション情報を管理している。

図５は本実施例のシステムの他の例の構成図である。図５に示すシステムは、図４のシステムと同様、利用者端末１０、コンテンツサーバ２０、アノテーション情報管理サーバ３０及びネットワーク５０を有する。なお、図５のブラウザ１１はプラグイン１２により拡張機能が追加されていない。また、図５のシステムは、コンテンツサーバ２０に、スクリプト２２が一部を構成するコンテンツ２１を格納している点で、図４のシステムと異なっている。

図４のシステムはプラグイン１２により本実施例に掛かるアノテーション機能を実現している。図５のシステムはスクリプト２２により本実施例に掛かるアノテーション機能を実現している。

（利用者端末１０の構成）
図６は利用者端末の一例の構成図である。利用者端末１０は、それぞれバスＢで相互に接続された入力装置６１、出力装置６２、ドライブ装置６３、補助記憶装置６４、主記憶装置６５、演算処理装置６６及びインターフェース装置６７を有する。

入力装置６１はキーボードやマウスなどである。入力装置６１は各種信号を入力するために用いられる。出力装置６２はディスプレイ装置などである。出力装置６２は各種ウインドウやデータ等を表示するために用いられる。インターフェース装置６７はモデム、ＬＡＮカードなどである。インターフェース装置６７はネットワーク５０に接続する為に用いられる。

本実施例に掛かるアノテーションプログラムは利用者端末１０を制御する各種プログラムの少なくとも一部である。アノテーションプログラムは、例えばアノテーションプログラムを記録した記録媒体６８の配布やネットワーク５０からのプログラムのダウンロードなどによって提供される。アノテーションプログラムを記録した記録媒体６８は、ＣＤ−ＲＯＭ、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ＲＯＭ、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。

アノテーションプログラムを記録した記録媒体６８がドライブ装置６３にセットされるとアノテーションプログラムは、記録媒体６８からドライブ装置６３を介して補助記憶装置６４にインストールされる。ネットワーク５０からダウンロードされたアノテーションプログラムは、インターフェース装置６７を介して補助記憶装置６４にインストールされる。補助記憶装置６４はインストールされたアノテーションプログラムを格納すると共に必要なファイル、データ等を格納する。

主記憶装置６５には、補助記憶装置６４から読み出されたアノテーションプログラムが格納される。そして、演算処理装置６６は主記憶装置６５に格納されたアノテーションプログラムに従って、後述するような各種処理を実現している。

（利用者端末１０の処理ブロック）
図７は利用者端末の一例の処理ブロック図である。利用者端末１０は、Ｗｅｂ資源取得部７１、Ｗｅｂ資源解析結果準備部７２、アノテーション情報格納部７３、アノテーション付与部７４、アノテーション構造位置取得部７５、アノテーション埋め込み部７６、アノテーション情報取得部７７、アノテーション復元部７８、アノテーション構造位置取得部７９、アノテーション埋め込み部８０を有している。

Ｗｅｂ資源取得部７１は、Ｗｅｂ資源であるコンテンツの所在情報（ＵＲＬ）を指定されたときに、指定されたＵＲＬのコンテンツを、コンテンツサーバ２０から取得する。Ｗｅｂ資源解析結果準備部７２は、取り出されたコンテンツをそのままＷｅｂ資源解析結果とすることも可能であるが、通常、コンテンツをパージングした結果である木構造をＷｅｂ資源解析結果として保持する。

アノテーション付与部７４は、利用者からコンテンツに基づく表示（Ｗｅｂページ）に対するアノテーション付与の操作を受け付ける。アノテーション構造位置取得部７５はアノテーション付与の操作に基づき、利用者がアノテーションを付与したＷｅｂページのコンテンツ上の位置を表す構造位置情報（ＸＰａｔｈ）を取得する。アノテーション埋め込み部７６はアノテーション構造位置取得部７５が取得した構造位置情報に基づき、アノテーション内容をＷｅｂ資源解析結果の指定された位置に埋め込む。アノテーション付与部７４は、Ｗｅｂ資源解析結果をレンダリングエンジンに渡し、描画させることで、アノテーションが付与されたＷｅｂページの表示を行うことができる。

また、アノテーション情報格納部７３は利用者に付与されたアノテーションを復元する為のアノテーション情報をアノテーションＤＢ３１に格納させる。アノテーション情報には、アノテーションを付与したＷｅｂページのコンテンツのＵＲＬ、アノテーションの構造位置情報であるＸＰａｔｈ、後述の特徴ＸＰａｔｈ、後述の特徴情報、アノテーション内容が含まれる。

アノテーション情報取得部７７は取得したコンテンツに対応するアノテーション情報がアノテーションＤＢ３１に格納されていれば、アノテーションＤＢ３１からコンテンツに対応するアノテーション情報を取得する。

そして、アノテーション構造位置取得部７９はアノテーション情報に指示されているアノテーションの構造位置を探し出す。アノテーション埋め込み部８０はアノテーション構造位置取得部７９が探し出した構造位置に基づき、アノテーション内容をＷｅｂ資源解析結果の指定された位置に埋め込む。アノテーション復元部７８は、Ｗｅｂ資源解析結果をレンダリングエンジンに渡すことで、アノテーションが復元されたＷｅｂページを表示させることができる。

（アノテーションＤＢの構成）
図８はアノテーションＤＢに格納されるアノテーション情報の一例の構成図である。図８のアノテーションＤＢ３１は、ＵＲＬ、ＸＰａｔｈ、特徴ＸＰａｔｈ、特徴情報、アノテーション内容が対応付けられたレコードを有している。アノテーションＤＢ３１に含まれるＵＬＲはアノテーションを付与したＷｅｂページのコンテンツのＵＲＬである。ＸＰａｔｈはアノテーションが付与されたＷｅｂページのコンテンツ上の構造位置である。

特徴ＸＰａｔｈ及び特徴情報は、ＸＰａｔｈによりアノテーションが付与されたＷｅｂページのコンテンツ上の構造位置が特定できなかったときに、アノテーションが付与されたＷｅｂページのコンテンツ上の構造位置を検索する為に利用するものである。特徴ＸＰａｔｈ及び特徴情報の詳細は後述する。アノテーション内容はアノテーションに記述された情報である。

（特徴ＸＰａｔｈ及び特徴情報）
図９は特徴ＸＰａｔｈについて説明する為の説明図である。図９はアノテーションが付与されたＷｅｂページのコンテンツ上の構造位置がＸＰａｔｈ「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」である例を表している。アノテーション構造位置取得部７５はＸＰａｔｈ「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」により表される対象ノードを頂点とし、末端までの全てのＸＰａｔｈを抽出する。

図９の例では、ＸＰａｔｈ「／ＴＡＢＬＥ／ＴＲ／ＴＤ」が２回、ＸＰａｔｈ「／ＴＡＢＬＥ／ＴＲ／ＴＤ／Ｐ」が１回、抽出される。アノテーション構造位置取得部７５は抽出されたＸＰａｔｈの内、最も出現回数の少ないＸＰａｔｈを特徴ＸＰａｔｈとする。図９の例では、ＸＰａｔｈ「／ＴＡＢＬＥ／ＴＲ／ＴＤ／Ｐ」が特徴ＸＰａｔｈとなる。

図９に示すように、アノテーション構造位置取得部７５は対象ノードに含まれるＸＰａｔｈの内、最も出現回数の少ないＸＰａｔｈを特徴ＸＰａｔｈとして抽出する。最も出現回数の少ないＸＰａｔｈを特徴ＸＰａｔｈとして抽出する理由は、対象ノードの特徴を最も表していると考えられるからである。

なお、図９では対象ノードに含まれるＸＰａｔｈの内、最も出現回数の少ないＸＰａｔｈを特徴ＸＰａｔｈとして抽出したが、最も出現回数の多いＸＰａｔｈや平均的な出現回数のＸＰａｔｈなど、様々なバリエーションも考えられる。

ＸＰａｔｈとして、出現回数が少ないものを用いる場合は、再現位置を特定しやすくなるが、コンテンツの内容が変更された時に、特徴パスに関連する部分が変更される可能性が高くなり、特徴パスを発見できない可能性が上がる。ＸＰａｔｈとして、出現回数が多いものを用いる場合は、逆にコンテンツの内容が変更された場合でも特徴パスを発見することが可能であるが、他でも頻繁に使われるパスである可能性が高く、正しい再現位置を特定しにくくなる。平均値を使う場合は、上記特徴の中間となる。

例えば、アノテーションシステムを使い画面構成を複数人で検討する場合など、正しい再現位置に確実に戻すことが必要な場面では、少ないものを特徴パスとすることで、精度の高い情報提供ができる。また、足跡システムのように、再現位置のズレよりも情報があることを通知することが重要なシステムでは、多いものを選択すると良い。

図１０は特徴情報について説明する為の説明図である。図１０はアノテーションが付与されたＷｅｂページのコンテンツ上の構造位置がＸＰａｔｈ「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」である例を表している。アノテーション構造位置取得部７５は対象ノードに含まれるタグの種類と数とを特徴情報として抽出する。

図１０の例では、タグ＜ＴＡＢＬＥ＞が１回、タグ＜ＴＲ＞が１回、タグ＜ＴＤ＞が３回、タグ＜Ｐ＞が１回、抽出される。アノテーション構造位置取得部７５は抽出されたタグの種類と数とを特徴情報とする。なお、アノテーション構造位置取得部７５と同様な手順にてアノテーション構造位置取得部７９も特徴情報を抽出する。

図１１はＸＰａｔｈにより対象ノードが特定できない例を表した説明図である。ここで言う対象ノードとは、アノテーション情報に含まれているＸＰａｔｈで表されるノードである。

図１１（Ａ）は、アノテーション内容を付与したときのコンテンツを表している。図１１（Ａ）は図９に示すコンテンツと同様である。したがって、図１１（Ａ）に示すコンテンツはアノテーション情報に含まれるＸＰａｔｈが「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」となる。図１１（Ａ）に示すコンテンツはアノテーション情報に含まれる特徴ＸＰａｔｈが「／ＴＡＢＬＥ／ＴＲ／ＴＤ／Ｐ」となる。また、図１１（Ａ）に示すコンテンツはアノテーション情報に含まれる特徴情報が「タグ＜ＴＡＢＬＥ＞１回、タグ＜ＴＲ＞１回、タグ＜ＴＤ＞３回、タグ＜Ｐ＞１回」となる。

図１１（Ｂ）は内容が変更されたコンテンツを表している。図１１（Ｂ）のコンテンツは図１１（Ａ）に示す変更前のコンテンツから取得したＸＰａｔｈ「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」が存在していない。したがって、アノテーション構造位置取得部７９は図１１（Ａ）に示す変更前のコンテンツから取得したＸＰａｔｈで検索したとしても、図１１（Ｂ）のコンテンツに含まれる対象ノードを特定できない。

本実施例のシステムでは、アノテーション情報に含まれる特徴ＸＰａｔｈ「／ＴＡＢＬＥ／ＴＲ／ＴＤ／Ｐ」でワイルドカード検索「／／特徴ＸＰａｔｈ」を行うことにより対象ノードを特定できる。

なお、本実施例のシステムでは特徴ＸＰａｔｈ「／ＴＡＢＬＥ／ＴＲ／ＴＤ／Ｐ」でワイルドカード検索「／／特徴ＸＰａｔｈ」を行うことにより対象ノードを特定しようとした場合、複数の対象ノードが特定されることがある。特徴ＸＰａｔｈを用いたワイルドカード検索「／／特徴ＸＰａｔｈ」により複数の対象ノードが特定された場合は、図１２に示すように特徴情報を用いて１つの対象ノードを特定する。

図１２は特徴ＸＰａｔｈを用いたワイルドカード検索により複数の対象ノードが特定される例を表した説明図である。図１２（Ａ）は図１１（Ａ）と同様であるため、説明を省略する。図１２（Ｂ）は内容が変更されたコンテンツを表している。図１２（Ｂ）のコンテンツは、変更前のコンテンツから取得したＸＰａｔｈ「／ＨＴＭＬ／ＢＯＤＹ／ＴＡＢＬＥ」が存在していない。したがって、アノテーション構造位置取得部７９は変更前のコンテンツから取得したＸＰａｔｈで検索したとしても、図１２（Ｂ）のコンテンツに含まれる対象ノードを特定できない。

そこで、アノテーション構造位置取得部７９は変更前のコンテンツから抽出した特徴ＸＰａｔｈ「／ＴＡＢＬＥ／ＴＲ／ＴＤ／Ｐ」でワイルドカード検索「／／特徴ＸＰａｔｈ」を行うが、２つの対象ノード１００、１０１を特定してしまう。

そこで、アノテーション構造位置取得部７９は特定した対象ノード１００、１０１に含まれるタグの種類と数とを特徴情報として抽出する。図１２（Ｂ）の場合、対象ノード１００は「タグ＜ＴＡＢＬＥ＞１回、タグ＜ＴＲ＞１回、タグ＜ＴＤ＞３回、タグ＜Ｐ＞１回」となる。また、対象ノード１０１は「タグ＜ＴＡＢＬＥ＞１回、タグ＜ＴＲ＞１回、タグ＜ＴＤ＞３回、タグ＜Ｐ＞３回」となる。

アノテーション構造位置取得部７９は対象ノード１００、１０１から抽出した特徴情報とアノテーション情報に含まれる特徴情報とを比較し、アノテーション情報に含まれる特徴情報との一致度が高い、言い換えれば一致する特徴情報の含有率が最も高い対象ノードを対象ノードとして特定する。

図１２（Ｂ）の場合、アノテーション構造位置取得部７９は対象ノード１００、１０１から抽出した特徴情報とアノテーション情報に含まれる特徴情報とを比較し、対象ノード１００を特定できる。

（利用者端末１０の処理手順）
図１３はアノテーション付与処理の一例のフローチャートである。アノテーション付与部７４は利用者からＷｅｂページに対するアノテーション付与要求があると、ステップＳ１に進み、ブラウザ１１に対するマウス操作で、利用者にアノテーションの付与位置を選択させる。ステップＳ２に進み、アノテーション付与部７４は例えばブラウザ１１に対するキーボード操作で、利用者にアノテーション内容であるコメントを入力させる。

ステップＳ３に進み、アノテーション構造位置取得部７５はアノテーションの付与位置（対象ノード）のＸＰａｔｈを取得する。ステップＳ４に進み、アノテーション構造位置取得部７５は対象ノードを頂点とし、末端までの全てのＸＰａｔｈを抽出する。

ステップＳ５に進み、アノテーション構造位置取得部７５はステップＳ４で抽出したＸＰａｔｈの内、最も出現回数の少ないＸＰａｔｈを特徴ＸＰａｔｈとして抽出する。アノテーション構造位置取得部７５はステップＳ６に進み、アノテーションの付与位置に含まれるタグの種類と数（出現回数）とを特徴情報として抽出する。

そして、ステップＳ７に進み、アノテーション情報格納部７３はＸＰａｔｈ、特徴ＸＰａｔｈ、特徴情報及びアノテーション内容をアノテーション情報としてアノテーションＤＢ３１に格納する。ステップＳ８に進み、アノテーション埋め込み部７６はステップＳ３でアノテーション構造位置取得部７５が取得したＸＰａｔｈに基づき、アノテーション内容をコンテンツのＷｅｂ資源解析結果の指定された位置に埋め込む。

その後、アノテーション付与部７４は、アノテーション内容が埋め込まれたＷｅｂ資源解析結果をレンダリングエンジンに渡すことで、アノテーションが付与されたコンテンツのＷｅｂページを表示させることができる。

図１４はアノテーション復元処理の一例のフローチャートである。Ｗｅｂ資源取得部７１は例えばブラウザ１１に対するキーボード操作で、使用者からＷｅｂページのＵＲＬの指定があると、ステップＳ１１に進み、ＷｅｂページのＵＲＬをブラウザ１１から取得する。

Ｗｅｂ資源取得部７１は取得したＵＲＬのＷｅｂページに対応したコンテンツをコンテンツサーバ２０から取得する。Ｗｅｂ資源解析結果準備部７２は、取得したコンテンツをパージングした結果である木構造をＷｅｂ資源解析結果として保持する。

ステップＳ１２に進み、アノテーション情報取得部７７はステップＳ１１で取得したＵＲＬに対応するアノテーション情報をアノテーションＤＢ３１から取得する。ステップＳ１３に進み、アノテーション構造位置取得部７９はアノテーション情報に含まれるＸＰａｔｈによる復元位置（対象ノード）の検索を行う。

ステップＳ１４に進み、アノテーション構造位置取得部７９はステップＳ１３の検索により復元位置を特定できればステップＳ２０に進み、特定した復元位置に基づき、Ｗｅｂ資源解析結果の指定された位置にアノテーション内容を埋め込む。

ステップＳ１４において、アノテーション構造位置取得部７９はステップＳ１３の検索により復元位置を特定できなければステップＳ１５に進み、アノテーション情報に含まれる特徴ＸＰａｔｈによる復元位置のワイルドカード検索を行う。

ステップＳ１６に進み、アノテーション構造位置取得部７９はステップＳ１５のワイルドカード検索により復元位置を特定できればステップＳ２０に進み、特定した復元位置に基づき、Ｗｅｂ資源解析結果の指定された位置にアノテーション内容を埋め込む。

ステップＳ１６において、アノテーション構造位置取得部７９はステップＳ１５のワイルドカード検索により複数の復元位置を特定してしまい、１つの復元位置を特定できなければステップＳ１７に進み、特定した複数の復元位置のそれぞれについて、復元位置に含まれるタグ毎の出現回数を特徴情報として抽出する。アノテーション構造位置取得部７９はステップＳ１７で抽出した特徴情報とアノテーション情報に含まれる特定情報とを比較して、ステップＳ１７で抽出した特徴情報の内、アノテーション情報に含まれる特定情報と一致する特定情報を特定できれば、ステップＳ２０に進む。

アノテーション構造位置取得部７９は特定した復元位置に基づき、Ｗｅｂ資源解析結果の指定された位置にアノテーション内容を埋め込む。また、アノテーション構造位置取得部７９はステップＳ１７で抽出した特徴情報の内、アノテーション情報に含まれる特定情報と一致する特定情報を特定できなければ、ステップＳ１９に進み、アノテーション情報に含まれる特徴情報との一致度が高い、言い換えれば一致する特徴情報の含有率が最も高い特定情報を特定する。

ステップＳ１９に続いてステップＳ２０に進み、アノテーション構造位置取得部７９は特定した復元位置に基づき、Ｗｅｂ資源解析結果の指定された位置にアノテーション内容を埋め込む。

その後、アノテーション復元部７８は、アノテーション内容が埋め込まれたＷｅｂ資源解析結果をレンダリングエンジンに渡すことで、アノテーションが付与されたＷｅｂページを表示させることができる。

（アノテーションプログラムがブラウザ１１に適用された例）
図１５は、本実施例のアノテーションプログラムを適用したブラウザの一例の構成図である。図１５のブラウザ２００は、典型的な構成を示したものであり、説明に不要なＣＳＳの処理やＰＤＦプラグイン等の細かい部分を省略している。

ネットワークを経由して受信されたＨＴＭＬ文書１５０をＨＴＭＬパーサ２０１は解析して、木構造（ＤＯＭツリー）２０２を生成する。これと同時に、Ｊａｖａｓｃｒｉｐｔ（登録商標）エンジン２０６はＨＴＭＬ文書１５０中にあったＪａｖａｓｃｒｉｐｔプログラム２０５を実行し、ＤＯＭツリー２０２の中身を書き換える。書き換えられたＤＯＭツリー２０２はレンダリングエンジン２０３に送られる。

レンダリングエンジン２０３は送られてきたＤＯＭツリー２０２を画面で見える形に変換する。そして、ユーザインタフェース２０４を介したユーザの操作等によってＪａｖａｓｃｒｉｐｔエンジン２０６はＤＯＭツリー２０２を書き換え、表示させる内容を変化させる。

アノテーションプログラム２１０は、典型的にブラウザ２００の中に保持される（すなわち、ブラウザ２００に組込まれる、あるいは機能拡張として付け加えられる形で実現される）。

そして、読み込まれたＨＴＭＬ文書１５０のＪａｖａｓｃｒｉｐｔプログラム２０５が実行されるのに追加して、アノテーションプログラム２１０は実行され、ＤＯＭツリー２０２を書き換える。なお、アノテーションプログラム２１０が参照するアノテーションＤＢ等のデータはブラウザ２００の外部に保持される。

アノテーションプログラム２１０を保持する別の実施形態としては、読み込まれるＨＴＭＬ文書に、アノテーションプログラム２１０を保持しておくことが考えられる。この実施形態では、適用できるＷｅｂページが限定されるが、ブラウザ２００にアノテーションプログラム２１０を保持するのと同じ効果を持たせることができる。

本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

１アノテーション
１０利用者端末
１１ブラウザ
１２プラグイン
２０コンテンツサーバ
２１コンテンツ
２２スクリプト
３０アノテーション情報管理サーバ
３１アノテーションＤＢ
５０ネットワーク
６１入力装置
６２出力装置
６３ドライブ装置
６４補助記憶装置
６５主記憶装置
６６演算処理装置
６７インターフェース装置
６８記録媒体
７１Ｗｅｂ資源取得部
７２Ｗｅｂ資源解析結果準備部
７３アノテーション情報格納部
７４アノテーション付与部
７５アノテーション構造位置取得部
７６アノテーション埋め込み部
７７アノテーション情報取得部
７８アノテーション復元部
７９アノテーション構造位置取得部
８０アノテーション埋め込み部
１００、１０１対象ノード
１５０ＨＴＭＬ文書
２００ブラウザ
２０１ＨＴＭＬパーサ
２０２ＤＯＭツリー
２０３レンダリングエンジン
２０４ユーザインタフェース
２０５Ｊａｖａｓｃｒｉｐｔプログラム
２０６Ｊａｖａｓｃｒｉｐｔエンジン
２１０アノテーションプログラム

Claims

コンピュータによって実行されるアノテーション復元方法であって、
前記コンピュータが、
コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第１のノードを頂点としたときに前記木構造の末端となる複数の第２のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第１のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得ステップと、
前記コンテンツの木構造に対して前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索を行い、前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索により前記第１のノードが特定できない場合、前記特徴構造位置情報による前記第１のノードの検索を行う検索ステップと、
前記検索により前記第１のノードが特定された場合、特定された前記第１のノードに前記アノテーションを復元する第１復元ステップと、
を実行するアノテーション復元方法。
請求項１に記載のアノテーション復元方法において、
前記アノテーション情報取得ステップは、前記木構造の末端となる複数の第２のノードの位置を示す構造位置情報のうち、前記木構造における出現回数が最も少ない前記特徴構造位置情報がアノテーション情報として格納された前記アノテーションデータベースから前記アノテーション情報を取得する、アノテーション復元方法。
請求項１又は２に記載のアノテーション復元方法において、
前記検索により前記第１のノードが複数特定された場合、特定された前記第１のノードを頂点としたときの前記構造位置情報に含まれるタグの種類ごとの出現回数を抽出し、前記アノテーションが付与された前記コンテンツの木構造上の第１のノードを頂点としたときの前記構造位置情報に含まれるタグの種類ごとの出現回数と最も一致度が高い前記検索により特定された前記第１のノードに前記アノテーションを復元する第２復元ステップを更に有する、アノテーション復元方法。
コンピュータによって実行されるアノテーション付与方法であって、
前記コンピュータが、
コンテンツに対するアノテーションの付与を受け付けた場合、前記アノテーションが付与された、前記コンテンツの木構造上の第１のノードを頂点としたときに前記木構造の末端となる複数の第２のノードの位置を示す構造位置情報を抽出し、
前記構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報として抽出し、
前記特徴構造位置情報と前記構造位置情報とを、前記アノテーションの復元に使用するアノテーション情報として記憶する、ことを実行するアノテーション付与方法。
コンピュータに、
コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第１のノードを頂点としたときに前記木構造の末端となる複数の第２のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第１のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得ステップと、
前記コンテンツの木構造に対して前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索を行い、前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索により前記第１のノードが特定できない場合、前記特徴構造位置情報による前記第１のノードの検索を行う検索ステップと、
前記検索により前記第１のノードが特定された場合、特定された前記第１のノードに前記アノテーションを復元する第１復元ステップと、
を実行させるためのアノテーション復元プログラム。
コンテンツに付与されたアノテーションの復元時、前記アノテーションが付与された、前記コンテンツの木構造上の第１のノードを頂点としたときに前記木構造の末端となる複数の第２のノードの位置を示す構造位置情報のうち、前記木構造における出現回数を基に選択された特徴構造位置情報と、前記コンテンツの木構造上の前記第１のノードの位置を示す構造位置情報とを含むアノテーション情報として格納されたアノテーションデータベースから前記アノテーション情報を取得するアノテーション情報取得手段と、
前記コンテンツの木構造に対して前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索を行い、前記第１のノードの位置を示す構造位置情報による前記第１のノードの検索により前記第１のノードが特定できない場合、前記特徴構造位置情報による前記第１のノードの検索を行う検索手段と、
前記検索により前記第１のノードが特定された場合、特定された前記第１のノードに前記アノテーションを復元する第１復元手段と、
を有するアノテーション復元装置。