JP5384837B2 - 文書に注釈を付するシステムと方法 - Google Patents

文書に注釈を付するシステムと方法 Download PDF

Info

Publication number
JP5384837B2
JP5384837B2 JP2008032611A JP2008032611A JP5384837B2 JP 5384837 B2 JP5384837 B2 JP 5384837B2 JP 2008032611 A JP2008032611 A JP 2008032611A JP 2008032611 A JP2008032611 A JP 2008032611A JP 5384837 B2 JP5384837 B2 JP 5384837B2
Authority
JP
Japan
Prior art keywords
document
sub
user
annotation
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008032611A
Other languages
English (en)
Other versions
JP2008204453A (ja
Inventor
ホン リーチャン
エイチ チー エド
ライ ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2008204453A publication Critical patent/JP2008204453A/ja
Application granted granted Critical
Publication of JP5384837B2 publication Critical patent/JP5384837B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

以下は、一般に、文書に注釈を付し、その後そのような注釈を共有し、注釈付文書コレクションを探索するための方法、装置、および製造品に関連する。
ウェブページのソーシャルタグ付けを可能にするウェブサービスが今日、インターネット上で利用可能である。例えば、ヤフーのマイウェブ(MyWeb)やデリシャス(del.icio.us)などである。そのようウェブベースサービスを使用すると、ユーザは、興味あるウェブ文書(ウェブページなど)にタグを付け、ウェブ文書を共有または後で再び呼び出すことが可能である。これは、ユーザがウェブ文書をブックマークに記憶しておき、自由に選択されたタグ(またはキーワード)のセットをそのウェブ文書に付加することによって行い得る。ユーザは、自分のブックマークまたはタグを他のユーザと共有すると決めることも可能で、それらを、後で他のユーザが探索したり、ブラウズしたりすることが可能である。
ユーザが、他のユーザによって定義・共有されたタグを経由して、ブックマークに記憶されたページを発見し得ることに加えて、ソーシャルタグ付加から得られたデータは、また、文書探索を強化するのにも使用し得る。しかし、ソーシャルタグ付加システムは、タグ付けされたウェブページのコンテンツの性質(例えば、ウェブページのコンテンツがダイナミックであるとか、または、あるウェブページのコンテンツが別のウェブページのそれと同様であり得るとかの性質)を考慮しないので、限定的である。例えば、ユーザが、ウェブ文書に付いている、以前に定義され、そして他のユーザと共有されたタグをレビューし、更新しない限り、URL(ユニバーサル・リソース・ロケータ)に関連した各ユーザ指定タグは、同じままである。これは、URLで示されたウェブページの基底コンテンツのサブ文書エレメントが変化するときでさえも同様で、何故そのタグが文書に付されたかの理由が不正確になったり、あるいは全く反映されなくなったりする。
さらに、利用可能なソーシャルタグ付加システムは、公開ウェブ文書間の類似性を考慮していない。例えば、相異なるウェブサイトが同一または極めて類似のニュース記事を公開することもあり得る。この場合、利用可能なソーシャルタグ付加システムは、相異なるウェブ文書の公開コンテンツ間の類似性が考慮しないので、タグを同様なコンテンツに伝搬するようには適応していない。タグを付けた情報をそのように伝搬していければ、同様なコンテンツで公開された情報にタグを付けるユーザの努力が、有利に簡素化される筈である。また、利用可能なソーシャルタグ付加システムは、ウェブブラウザ(またはリーダ)内で統合が行われていない。その代わり、利用可能なソーシャルタグ付けシステムでは、ユーザは、現在読んでいるウェブ文書とは独立なウェブページにアクセスする必要がある。相互運用性をそのように欠いているので、ウェブ文書に対してタグを新たに付加したり、またはレビューしたりしているとき同時にそのウェブ文書を参照するというユーザ能力が損なわれている。
米国特許第6,360,951号
従って、サブ文書エレメント(ウェブ文書のパラグラフなど)のその場(in situ)タグ付加と、そのようなタグ付加されたデータ(または、より一般的には注釈されたデータ)の共有とをサポートするためのシステムと方法に対するニーズが依然として存在する。ウェブ文書のサブ文書エレメントにタブを付加するソリューションであって、ウェブブラウザと統合化されたソリューションがあれば、ウェブページに注釈を付加するために必要とされる認知的対話的オーバーヘッドの量が有利に減少する筈である。さらに、ウェブページのソーシャルタグ付けを容易にする統合ソリューションが提供されれば、ユーザは、相互協力やタグ付加されたデータの共有が有利に行い易くなる筈である。また、同様なコンテンツを有するウェブページにタグを自動的に伝搬したり、ウェブページのダイナミック性を考慮したりすることによって、タグとウェブページのサブ文書エレメントとの間の関連性の一貫性が維持される。
さらに、タグ付加された(または、より一般的には注釈が付加された)文書のコレクションを相互協力的タグ付加(または、より一般的には相互協力的注釈付加)によって探索するための改良されたシステムと方法に対するニーズが依然として存在する。従って、文書のタグベースのコレクションを探索するための改良されたシステムと方法を提供し、そのような文書コレクションを探索する確度および/または精度を増すことは、有利な筈である。
本開示のこれらと他の態様は、添付図面と関連させて以下の説明を読めば、容易に明快になることと思われる。なお、同じ様な部分には同じ参照数字を付してある。
A.用語の定義
以下で定義される用語は、特許請求の範囲と図面と含む本特許出願明細書を通じて、その示された意味を有する。
「文書」または「ウェブ文書」は、電子データのコレクションが閲覧されるときどのようにフォーマットにされているかに依拠して可変数のページを規定し得る電子データのコレクション、例えば、ウェブブラウザを使って閲覧し得る文書(例えば、ウェブページ、イメージ、ワード文書、およびポータブル・ドキュメント・フォーマット(pdf)形式の文書)を意味するのに本明細書では使用される。文書を構成する電子データは、静的および/または動的コンテンツから成り得る。
「サブ文書エレメント」は、単独に取り出されるとき、文書全体より小さいサイズの文書構造のエレメントを意味するのに本明細書では使用される。サブ文書エレメントは、ワード、イメージ、フレーズ、センテンス、パラグラフ、ページ、節、および章のセットから選択されるタイプであり得る。
「共同ユーザ」は、汎用コンピュータの「ユーザ」(アクセスコントロールおよび/またはブロックを使用して許可される)に認識または知悉され得るユーザ(例えば、個人または個人の代理)またはユーザのグループ(例えば、グループまたは組織内の配信リスト)であって、例えば、ユーザまたはログインネームのような識別子を使用して汎用コンピュータのユーザに知悉、または知悉させられ得るユーザを意味するのに本明細書では使用される。
B.ダイナミック注釈と探索のための操作環境
図1は、本明細書に開示の実施の形態を実行するための例示の操作環境100を示す。この例示の操作環境において、汎用コンピュータ104は、インターネットのようなネットワーク102上で共に通信し得るが、クライアント側またはサーバ側のいずれかの操作を実行するようにプログラムされている。当業者なら分かることであるが、クライアントサーバ配置の別法が存在する。例えば、中央ターミナルベース配置またはこれらの組み合わせ配置である。クライアント側操作は、クライアント側アプリケーションモジュール106をロードした汎用コンピュータ104で実行される。モジュール106は、注釈プラグイン108とウェブブラウザ110(例えば、インターネットエクスプローラ、ファイアフォックス、またはサファリ)を備える。サーバ側操作は、一個または複数個のサーバ側アプリケーションモジュール112をロードした汎用コンピュータで実行される。モジュール112は、一個または複数個の注釈モジュール114、ページタグ付加モジュール116、ウェブページ(またはウェブ文書)サーバ118、およびタグベース探索サーバ120のうちの一個またはそれらの組み合わせを備える。
図2は、本明細書に開示の実施の形態、例えば、図1に示される実施の形態を実行するための汎用コンピュータ104を示す。汎用コンピュータ104は、ハードウェア212とソフトウェア214とを備える。ハードウェア212は、プロセッサ(すなわち、CPU)216、メモリ218(ROM、RAMなど)、持続的記憶装置220(例えば、CD−ROM、ハードドライブ、フロッピー(登録商標)ドライブ、テープドライブなど)、ユーザI/O222、およびネットワークI/O224で構成される。ユーザI/O222は、カメラ204、マイクロフォン208、スピーカ206、キーボード226、ポインティングデバイス228(例えば、ポインティングスティック、マウスなど)、およびディスプレイ230を備え得る。ネットワークI/O224は、例えば、インターネットのようなネットワーク102に接続し得る。汎用コンピュータ104のソフトウェア214は、オペレーティングシステムソフトウェア236とアプリケーションソフト240を備え、クライアント側アプリケーションモジュール106またはサーバ側アプリケーションモジュール112の命令を含み得る。ソフトウェア214は、一般に、メモリ218に読み込まれ、プロセッサ216に指定された操作を実行させる。ソフトウェア214は、クライアント側アプリケーションモジュール106またはサーバ側アプリケーションモジュール112の命令とともにアプリケーションソフト240を含む。
C.ダイナミック注釈エレメントと操作
図3は、図1に示される例示の操作環境100における注釈サーバ113と注釈クライアント(複数を含む)111とによって実行される諸操作を示すフローチャートである。注釈サーバ113と注釈クライアント(複数を含む)111とにより、サブ文書エレメントのダイナミック注釈が可能となる。例示であって、限定目的ではないが、本明細書に記載の例は、ウェブページのパラグラフなるサブ文書エレメントの注釈に関する。当業者なら分かるように、相異なるサブ文書エレメントと文書、またはこれらの組み合わせも、本発明で可能となるダイナミック注釈の操作を行う時に代わりに使用し得る。
最初に302で、クライアント側アプリケーションモジュール106のウェブブラウザ110が注釈プラグイン108で初期化される。これには、サーバ側アプリケーションモジュール112と通信するための操作と、文書を増補するための操作とが含まれ、(a)ウェブブラウザ110を使って表示される文書の注釈のユーザ指定と、(b)ユーザ注釈と共同ユーザ注釈のデータの表示とが双方行われ得る。一般に、304と306との間のクライアント側で実行される操作と、305と307との間のサーバ側で実行される操作は、注釈でウェブページを増補することとユーザ注釈のための準備とに関し、一方、306と308との間のクライアント側で実行される操作と、307と309との間のサーバ側で実行される操作は、増補されたウェブページのユーザ注釈に関する。別の一つの実施の形態では、注釈プラグイン108の機能は、文書をユーザに送る前に注釈機能で文書を増補するプロキシサーバ(ネットワーク102上で操作)で提供し得る。
310で、ウェブブラウザ110は、ユーザリクエストを受理し、ウェブページをロードしてディスプレイする。312で、リクエストされたウェブページが、例えば、そのウェブページを記憶しているウェブページサーバ118のようなサーバのネットワーク102上に位置を識別するURL(ユニバーサル・リソース・ロケータ)を使用してアクセスされる。314で、312でのウェブページリクエストに呼応した注釈プラグイン108が、ウェブサーバ128経由で注釈サブレット126とリクエストされたウェブページとを通信させ(例えば、そのURLを送信して)、サービスがサーバ側注釈モジュール114で実行されるようにリクエストし、リクエストされたウェブページのコンテンツと同様なコンテンツに対してユーザと識別された共同ユーザとが行った注釈を識別する。
316で、サーバ側注釈モジュール114は、ウェブページサーバ118から当該ウェブページのコピーを(例えば、314で提供されたURLを使用して)検索する。別法として、312で検索されたウェブページのコピーを、314でのサービスリクエストに従ってクライアント側アプリケーションモジュール106で提供し得る。318で、サーバ側注釈モジュール114が、検索されたウェブページに一個または複数個のウェブページサブ文書エレメントを識別する。これらのサブ文書エレメントは、パラグラフのような単一のタイプでもよく、またはパラグラフと節のような諸タイプの組み合わせでもよい。320で、318で識別されたサブ文書エレメントであって、ユーザと選択された共同ユーザに関連しているサブ文書エレメントに対して、類似度測定が、類似度計算器124を使用して計算される。類似度は、一個または複数個の因子(ユニークな識別子または指紋として作用する)、例えば、(a)サブ文書エレメントに出現するワードの長さ、(b)サブ文書エレメントに出現する最初のn個のワードの最初の文字、(c)サブ文書エレメントに出現する同様なノンストップのワードの頻度、および(d)暗号ハッシュ関数の一つであるMD5(メッセージ・ダイジェスト・アルゴリズム5)に基づいて計算し得る。実施の形態の一つでは、類似度(または指紋)は、関連サブ文書エレメントに対して計算されるハッシュ値である。計算後は、注釈サーバ113に記憶された注釈済みサブ文書エレメントの指紋を、318で識別された、検索されたウェブページのサブ文書エレメントの指紋に対して比較し得る。
322で、ユーザまたは共同ユーザが以前に注釈したウェブページサブ文書エレメント(関連した注釈と類似度を有する)であって、320で計算された類似度と同等の類似度(すなわち、同一または同様な指紋である可能性が高いと考えられる)でデータベース122に記憶されているウェブページサブ文書エレメントが、識別される。324で、322で識別されたサブ文書エレメントの記憶された注釈データが、クライアント側アプリケーションモジュール106に提供される。
326で、ウェブページが増補され、ディスプレイと(さらなる)注釈が行われるが、それは、326(A)で、ウェブページ上の各ワードを別々に選択可能とするステップと、326(B)で、サブ文書エレメントの終わりにユーザネームのラベルと、322で識別されたサブ文書エレメントの関連する記憶されたユーザの注釈データであって、テキスト注釈(例えば、タグ、キーワード、またはコメント)、グラフィック注釈(例えば、グラフィックアイコン)、またはオーディオ/ビデオ注釈(例えば、オーディオまたはビデオクリップへのリンク)を含む注釈データとを挿入するステップと、326(C)で、322で識別された記憶・注釈されたデータと関連したウェブページのサブ文書エレメントのコンテンツに注釈(例えば、テキスト、グラフィックス、オーディオ、またはビデオを含み得るハイライトしたもの)を挿入するステップとで行われる。326(B)と326(C)とで、それぞれ、ウェブページに挿入された注釈は、サブ文書エレメントがデータベース122に322で記憶された注釈データのサブ文書エレメントに類似している(またはそのマッチングする指紋を有している)とき、318で識別・検索されたウェブページのサブ文書エレメント(またはサブ文書エレメントの組み合わせ、例えば、サブ文書エレメントの組み合わせで規定された文書の章)に付加し得る。
326での実施の形態の一つで、注釈プラグイン108は、ウェブページのHTMLコンテンツを増補することによって(例えば、AJAXを使用して)ウェブページ上の各ワードを選択可能にし得る。それは、(a)326(A)で、ウェブページの文書オブジェクトモデル(DOM)ツリーを、ウェブページがウェブブラウザ110でロードされる前にウェブページの各ワードをHTML(ハイパーテキストマークアップ言語)タグ<スパン>で囲むことによって変更するステップと、(b)326(D)で、ウェブページでユーザが実行したワード選択を検出するため各サブ文書エレメントにイベントリスナ、例えば、マウスイベントリスナを付加するステップとで行われる。
図4は、外接ボックス長方形を使用してサブ文書エレメントの諸ワードが個々に選択可能(および/または注釈可能)とされた例示的テキストコンテンツ402を示す。例えば、外接ボックス404内でマウスなどのポインティングデバイスで選択(および/または注釈)するユーザが、ワード「San」を選択したと決定したとする。ユーザの好みに依存するが、すでにワードに関連しているダイナミック操作を設定し、選択(および/または注釈)操作に超える優先性を持たせ得る。例えば、ワード「San」がハイパーリンクと関連していたイベントにおいて、上位優先性がハイパーリンクに与えられているときは、そのリンクが辿られる。そうでなく、より高い優先性が注釈プラグインに関連した操作に与えられているときは、選択(および/または注釈)操作が実行される。別の実施の形態では、フレーズやセンテンスのような、より高いレベルの構成物が、フレーズまたはセンテンスを囲むとき、外接ボックス(どんな数の相異なる形状をも取り得る)内で選択可能(および/または注釈可能)とされる。
326でウェブページを増補した後、ウェブページが330でディスプレイされ、ユーザに利用可能にされるが、その目的は、(a)ユーザまたは識別された共同ユーザが同じようなコンテンツに対して以前に付加した注釈を見たり、(b)さらに注釈を加えたりするためである。332で、注釈プラグインに内蔵のイベントハンドラが、表示されたウェブページで示されたユーザから受け取ったインプットに関連したイベントを受理し、これに応答する。注釈されるべきサブ文書エレメントの部分を示すイベントにより、データベース122にある注釈を(注釈に関連したサブ文書エレメントの類似度(または指紋)とともに)、それぞれ、334で送信し、342で記憶し、そして340でこれらの注釈をユーザに対してウェブページ上にディスプレイすることが行われる。例えば、図5は、その後に挿入されたユーザネームラベル504とともにサブ文書エレメント502を示す。この例では、ユーザは、先ず、テキストの最初(すなわち「CHI」)にマウスのポインタを合わせ、次いでマウスのポインタがテキスト文の最後(すなわち「2007」)に移動するまで左マウスボタンを押し続けて、下線が引かれたテキストをハイライトすることによって文書の注釈付けを行った。
ユーザによるワード選択を示すイベントにより、イベントハンドラは、ウェブページにタグコメントフィールドを開き、そのフィールド内に選択されたワードをタグとして挿入する(そして実施の形態の一つではネームラベルフィールドにも挿入する)。選択されたタグまたはキーワードを保存するということを示すイベントにより、イベントハンドラは、保存されるタグおよび/またはキーワードをサーバ側注釈モジュール114に送信し、336でエラーチェック(スペルおよび/または句読法エラーの訂正、矛盾点の解消、および/または特定の注釈の終端ワード削除を含む)を行い、その後に342で(ワード選択に関連したサブ文書エレメントの類似度(または指紋)とともに)記憶する。336で訂正された注釈は、338で注釈クライアント111に送り戻され、その後340でディスプレイされる。例えば、図6は、サブ文書エレメント602と、その後のユーザネームラベル604(図5に示されるものと同じ)とを示し、その間にワード選択がサブ文書エレメント602にタグ付けするために行われる。
具体的に説明すると、図6には、ビューアに表示されたウェブページのタグ付けをユーザが実行する際の一連のイメージフレームが示される。フレーム600では、サブ文書エレメント602の増補は、ユーザネームラベル604を後で挿入することと、サブ文書エレメント602の個々のワードを選択可能とすることによって行われる。フレーム606では、ワード「San」を選択するユーザインプットに応答し、ディスプレイされた文書は、選択されたワード「San」をユーザネームラベル604の後に続いている(すなわち、選択されたワードに関連するサブ文書エレメントの後に続いている、またはこれに関連する)タグコメントフィールド607に挿入することによってさらに増補されている。フレーム608では、表示された文書は、選択されたワードである「Jose,」、「April」、「28th,」、「2007」、「May」、および「3rd,」でさらに増補されている。「save」ボタン605がクリックされると、選択された(またはタイプされた)注釈文が、注釈サーバ113によって実施の形態の一つでは(または示されていないが、別の実施の形態では注釈プラグイン108によって)図3の336で訂正され(例えば、最初はワードの一部であると考えられていたコンマが除去され)、その後で選択されたワードが最終的に決定され、フレーム610に示されるようにユーザネームラベル604の後に続いて示される。別の実施の形態では(図示せず)、共同ユーザに関連したキーワードのリストと、最も頻繁におよび/または最も最近に使用されたキーワードの選択可能のリスト(ウェブページに、例えば、ユーザと共同ユーザのキーワードの後に続いて追加された)を、同様に選択可能とし、タグコメントフィールド607に追加し得る。さらに別の実施の形態では、選択れたワードを、最終決定が行われる前にタグコメントフィールド607に配置せず、代わりに、直ちに、フレーム610に示される形式で配置する。
有利なことであるが、ウェブページに注釈を加えた後、そのユーザ注釈は、データベース122にある注釈サーバ113に記憶され、同様なコンテンツを有するウェブページにその注釈を伝搬することが可能となる。換言すれば、注釈が伝搬するのは、注釈サーバ113が、記憶された注釈を注釈クライアント111に提供し、記憶されたコンテンツと同様なコンテンツを含む文書にその注釈を加える時である。さらに、注釈サーバ113は、クライアント111には、サブ文書エレメントのコンテンツの指紋とマッチしていない記憶された注釈についてはこれらを伝搬しない。たとえ、そのコンテンツが、ウェブページのサブ文書エレメントの注釈と指紋とが最初に記録されたときに閲覧中のウェブページに以前存在していた場合でも、そうである。
D.注釈の作成・共有のためのユーザインターフェイス
図7は、注釈を作成し、共有するための例示的ユーザインターフェイス700を示す。ユーザインターフェイス700のトップには、「remove」と「add」コマンドを含む制御エリア702があり、ユーザは、共同ユーザを指定して、その共同ユーザの注釈が、ユーザが閲覧中の文書中にディスプレイされるのを見たいかどうかを決め得る。
さらに、エリア702で、ユーザは、ユーザのページレベルタグ付けを指定し、指定された共同ユーザのページレベルタグを見ることが可能である。ページレベルのタグ付けは、サブ文書レベルでのタグ付けとは相異なって、単にタグ、キーワード、またはコメントをウェブページ(またはURL)と関連付けするものである。サブ文書エレメントのタグ付と同様に、ページレベルのタグ付けは、706に記録される。これは、実施の形態の一つでは、エリア702の「Save Page Tag」および「Update Page Tag」というコマンドを使い、ページタグサーブレット138によってウェブサーバ136経由でデータベース140にアクセスすることを含む(これは、別の実施の形態では、サーバ側注釈モジュール114と統合して、または一緒に操作し得る)。
制御エリア702の下には、文書エリア704がある。文書エリア704では、ウェブページコンテンツが増補され、それは、この例では、ユーザ(「lichan_hong」)と選択された共同ユーザ(「edhchi」と「kooltag」)に関連した注釈を含む。従って、制御エリア702と文書エリア704とを調べることによって、ユーザは、ディスプレイされた文書がページレベルで、および/またはサブ文書レベルで注釈されているかどうかを知ることが可能である。
E.タグベースの探索
ウェブベースの注釈サービス、例えば、クライアント側注釈モジュール106で利用可能となったものを使用して、ユーザは、ウェブ文書をブックマークに記憶し、ページレベルで文書ブックマークに(そして、別の実施の形態では、サブ文書エレメントレベルで文書エレメントに)タグまたはキーワードのセットを付加する(または、より一般的には、例えば、ハイライトしたりコメントを付けたりすることによる注釈付加する)能力が与えられる。従って、ユーザは、ユーザのタグのセットを使用して、ユーザの個人的ブックマークコレクションからその文書を探索し、検索し得る。さらに、ユーザは、自身のブックマーク(そして、関連タグまたはキーワード)をすべてのユーザに完全公開して、または選択された共同ユーザに半公開して共有するかを決定し得る。共有されたブックマークは、そうすれば他のユーザがブラウズしたり、探索したりするのが可能となる。ユーザが一所懸命に創り上げた文書ブックマークコレクションをこのように協力的に共有することによって、ユーザは、ユーザが共有する(すなわち、協力的に開発された)ブックマークコレクションを使用して諸々のブックマークに記憶された文書を発見するという便益を享受し得る。
図1に示された実施の形態の一つでは、データベース122と140に格納された協力的に共有されたブックマークコレクションは、ウェブブラウザ110上で作動するユーザインターフェイスを通じてタグベースの探索サーバ120を使用して探索し得る。ブックマークに記憶された文書を発見するための照会がユーザによって行い得る前に、ユーザのグループに関連したブックマークコレクションが処理され、キャッシュメモリに記憶され、ブックマークコレクション中のブックマークに記憶された文書に対するタグプロフィールと文書プロフィールが識別される。一般に、選択されたタグオブジェクト(例えば、TAG2)と選択された文書オブジェクト(例えば、URL1)に対するタグプロフィールと文書プロフィールは、エントリノードとしてバイグラフ(bigraph)中のその選択されたタグまたは文書オブジェクトを使用する活性化拡散を行って構成される。
図8は、タグベースの探索サービスで実行される操作を示すフローチャートで、タグと文書のプロフィールを識別し(802,804,806,808,810,および812で)、タグベースの照会に結果を提供する(814,816,818,および820で)ものである。最初に802で、ブックマークコレクションが識別される。これは、実施の形態の一つでは、文書識別子(例えば、URL)のリストとすることができる。この場合、ブックマークコレクション中の各ブックマークは、タグのセット(例えば、[URL1,TAG2,TAG6,…,TAGN])に関連したURL付の文書を識別するのである。804で、ブックマークコレクションはURL/TAGペアのセット(例えば、[URL1,TAG2]、[URL1,TAG6]、…[URL1,TAGN])に分解(すなわち、変換)される。[URL,TAG]タプルの形式のURL/TAGペアが与えられると、タグに対するバイグラフ(すなわち、二次元グラフ)が、806で構成される。バイグラフが構成されると、バイグラフはマトリックスとして表現される(808で)。別法としては、バイグラフは、例えば、隣接リストを使用して示し得る。
図9は、902の箇所でブックマークコレクションの例を示す。これは、904の箇所で識別され(図8の802で規定されたように)、そしてURL/TAGペアに処理され(図8の804で規定されたように)、906の箇所でバイグラフに処理され(図8の806で規定されたように)、そして908の箇所で、906に示されるバイグラフに対して、URLを識別する列とタグを識別する行とから成るマトリックスに処理される(図8の808で規定されたように)。
810で、バイグラフ行列(または、より一般的にはn次元行列)を使用して、バイグラフのノード範囲に対してタグプロフィールと文書プロフィールとを計算する。これらのプロフィールは、ベクトルAとして活性化拡散を繰り返し使用してプロフィールを計算することによって得られる。具体的には、以下の通りである。

[数1]
A[1] = E;
A[2] =αM*A[1]+βE;



A[n] =αM*A[n-1]+βE;

式中、
A[1],A[2],…A[n]は、URLとタグの繰り返し計算されたプロフィールベ
クトルで、
Eは、タグまたは文書エントリノードを表す単位ベクトルで、
Mは、選択されたエントリノードに従って列または行で配列されたバイグラフ(または、より一般的にはn次元グラフ)のマトリックス表現で、
αとβは、活性化拡散を調整するためのパラメータである。
活性化拡散を「n」ステップだけ繰り返して実行した後(ステップ「n」の数は、精度および/または性能に依存して変え得る)、活性化拡散は、バイグラフのタグ側またはバイグラフの文書側で停止され、従って、タグまたは文書エントリノードEに対するタグプロフィールベクトルまたは文書プロフィールベクトルを提供する。タグプロフィールベクトルと文書プロフィールベクトルにおける得られた重みパターンは、「タグプロフィール」と「文書プロフィール」をそれぞれ規定する。図10は、「n」=4ステップ、エントリノードEとして文書1(すなわち、URL1)、パラメータα=1、パラメータβ=0、文書D1に対して得られたタグプロフィールベクトルA[4]TAGおよび得られた文書プロフィールベクトルA[3]DOCを有する活性化拡散の例を示す。
図10に示されるように、各繰返し計算(すなわち、n=2、n=3、n=4)の後、得られた文書とタグのプロフィールベクトルが、初期エントリベクトルに対する最も興味あるタグまたは文書を識別する。この場合、ユーザは文書DOC1に興味を示したのである。すなわち、初期エントリベクトルは、DOC1に1の重みを割り当てたのである。ステップn=2で、図10は、DOC1がTAG1、TAG2、およびTAG3と関連していることを示す。図10はさらにステップn=3で、活性化拡散計算は、興味ある文書DOC1、DOC2、DOC3、およびDOC4を識別する。この場合各文書は、それぞれ、興味性の重み3、2、1、および1で関連している。最後に、ステップn=4で、活性化拡散計算は、得られたタグプロフィールベクトルA[4]TAGを識別し、TAG2とTAG3が、DOC1=1であるオリジナル文書エントリベクトルに対する最も高く重み付けされたタグであることを示す。
タグプロフィールと文書プロフィールとが、810で計算された後、それらは、実施の形態の一つではキャッシュメモリに記憶され(812で)、後で検索・探索目的に供される。別の実施の形態では、そのようなタグと文書のプロフィールは、オンデマンドでリアルタイムに計算される。ユーザは、ウェブブラウザ110を通して入手可能の図11に図示の探索インタフェース1100を使用して文書コレクションを探索し得る。探索インタフェース1100を使用すると、ユーザは、キーワードおよび/またはタグを(1102で)指定可能であり、次いでこれを使用して、関連したタグと文書(1104で)を識別する(1106で)。これは、1102でキーワードおよび/またはタグを取り、キャッシュメモリに記憶された活性化拡散計算(図8の812で)で、どんな他の文書とタグが関連し、興味あるものであるかを探し出すことによって行われる。文書プロフィールベクトルに規定された活性化拡散された文書は、1104にディスプレイされ、タグプロフィールベクトルに規定された活性化拡散されたタグは、1106にディスプレイされる。これらは、活性化拡散の重みに従って類似度でランク付けされた順序でディスプレイされる。
前記の探索結果は、1104に表示されたどの文書が適切であるかを、例えば、「適切性フィードバック」として技術に既知の方法を使用して規定することによって、ユーザがさらに改良し得る。実施の形態の一つでは、ユーザは、選択ボックスをクリックすることによって自分の興味を示す。選択される文書は、キャッシュメモリに記憶された計算結果(図8の812で)中に探し出し得るが、プロフィールベクトルにある対応する関連タグと文書も、将来の探索を通知するのに使用し得る。別法として、ユーザは、関連タグを指定し、それらのタグに対応するキャッシュメモリに記憶された計算結果(812での)を探し出し、現在の興味プロフィールに追加し、次いでこれを使用して、将来の探索を通知することもし得る。
より一般的には、キャッシュメモリに記憶された(812で)後は、タグプロフィールと文書プロフィールとは、検索、探索、および推薦事項のための相異なる類似度計算とルックアップの基礎を形成する。例えば、図8に示される実施の形態では、選択されたタグまたは文書に係わる関連したタグまたは文書を識別するようにという探索リクエストを受け取ると(814で)、選択されたタグまたは文書に対応するタグプロフィールまたは文書プロフィールがキャッシュメモリから取り出される(816で)。別法として816で、選択されたタグまたは文書が、812でキャッシュメモリに記憶された活性化拡散計算プロフィールに存在しない場合は、812でキャッシュメモリに記憶されたデータにあるタグおよび/または文書であって、行方不明のタグまたは文書と最も類似のもののプロフィールが選択される。ステップ816で、文書(およびタグ)の間の類似性は、例えば、文書ワードベクトルのコサイン類似性計算、または他の類似性計算、例えば、ユークリッド距離または他のベクトル距離計量を使用して決定し得る。
820で、識別されたタグプロフィールおよび/または文書プロフィールが分類され、関連したタグおよび/または文書が重要度に従ってランク付けされる。ランク付けされた、これらの非常に類似性の高いタグおよび/または文書は、例えば、図11に示されるユーザインターフェイス1100でリターンして提示される。図示のユーザインターフェイス1100は、各文書リンク(例えば「Dive into Greasemonkey」)とともに、最も高頻度で文書に付加されたタグのリスト(例えば、greasemonkey 65,firefox 54,javascript 33,programming 27,reference 18、およびweb 18)を含む。別の一つの実施の形態では、816で識別されたタグプロフィールまたは文書プロフィールが、818でシステムに含まれる他のすべての文書またはタグのプロフィールと対照して比較され、類似性の高いプロフィールが見出される。従って、選択されたタグおよび/または文書と対応または同様な識別されたタグおよび/または文書のプロフィールを使用して、816で識別されたものに加えて、または別のものとして、820で同様なタグまたは文書が識別される。
換言すれば、814,816,818,および820で、ユーザがある文書に関連した情報を見出したいと思えば、タグベースの探索サーバは以下のことを実行し得る。すなわち、(a)文書がそのキャッシュに記憶された(812で)活性化拡散計算によるプロフィールに既に存在すると仮定して、対応する文書プロフィールをルックアップし、そして適切性に従って、例えば、最高から最低までの重み付けで配列されたそのプロフィールで選択された文書を選択し、リターンし、ディスプレイすること(文書の配列は、さらに、ある閾値以上に重み付けされたもののみを残すようにフィルタ処理され得る)、(b)対応する文書プロフィールを使用し、これをシステムに含まれる他のすべての文書プロフィールと対照して比較し、類似性の高い文書プロフィールを見出し、そして、その後、適切性に従って配列されたそれらのプロフィールで選択された文書を選択し、リターンし、ディスプレイすること、および/または(c)情報検索技法、例えば、文書ワードベクトルの従来のコサイン類似性測定の計算を使用して、ユーザ指定文書がキャッシュに記憶された(812で)活性化拡散計算によるプロフィールに既に存在しないときは、URL/TAGバイグラフに最も類似度の高い文書を見出し、そしてその後に、(a)または(b)のいずれかの手順を使用して、関連する文書を選択し、リターンし、ディスプレイすることを実行し得る。別法として、814,816,818,および820で、ユーザがあるタグと関連した情報を見出したいと思えば、文書に対して実行された同様な操作を、タグと対応するタグプロフィール対して代わりに実行する。
別の実施の形態では、キーワード探索を使用し、キャッシュされた(812で)活性化拡散計算によるプロフィールに文書またはタグを識別し得る。これらのプロフィールを、後で使用し、関連した文書とタグを識別するのである。さらに他の実施の形態では、複数のキーワードが探索基準として提供されるとき、複数のキーワードに対応するタグと文書に関連したプロフィールベクトルが、一緒に合計され、ランク付けが行われ、その後、興味ある文書とタグを識別するために使用される。別法として、相異なるキーワードに対応するプロフィールベクトルが相異なるように重み付けられ、その後で一緒に合計され、ランク付けが行われ、その後、興味ある文書とタグを識別するために使用される。プロフィールベクトルのそのような合計をさらに使用し、結果を一層改良し得るが、それは、追加的キーワードおよび/または文書をプロフィールベクトルのセットに加えることによって行われ、当該ベクトルのセットは、最終的に一緒に合計され、ランク付けが行われ、その後、興味ある文書とタグを識別するために使用されるのである。
別のさらなる実施の形態では、本明細書に示された例示的実施の形態は、文書とタグとの間という二つの変数関係を越えて拡張し得る。そのような別法の実施の形態では、グラフは、例えば、二つの相異なる変数の間(例えば、文書とユーザの間)、または三つ以上の変数の間(例えば、文書、タグ、およびユーザの間)にて定義し得る。本技法は、三つ以上の変数に対しても有効である。なぜなら、活性化拡散技法を、これらの相異なる変数に対して実行し、キャッシュメモリに記憶し得るからである(例えば、タグプロフィール、文書プロフィール、およびユーザプロフィールが得られる)。
さらに、前述の実施の形態においては、ブックマークコレクションの共有について議論が行われたが、当業者ならば、別法として、ブックマークコレクション共有の代わりに、個々のブックマークの好みを記録するメタデータを備える文書のコレクションを各文書と共有することについても議論が成り立つことが分かるであろう。
F.雑
上記の説明を考慮すれば、ウェブページに注釈を付するための実施の形態は、以下の諸ステップ、すなわち、ユーザによってディスプレイ用に選択された文書を検索するステップと、検索された文書のコンテンツにサブ文書エレメントを配置するステップと、配置されたサブ文書エレメントの各々に対して類似度を計算するステップと、注釈されるサブ文書エレメントと配置されたサブ文書エレメントの類似度であって、それらの間に対応性を示す類似度を識別するステップと、前記検索された文書の前記配置されたサブ文書エレメントを、同等の類似度を有するそれらの注釈されるサブ文書エレメントで増補するステップと、注釈で増補された前記検索された文書をディスプレイするステップとを備える方法によって実行し得る。
さらに、上記の説明を考慮すれば、前述の実施の形態は、以下の機能を備える。すなわち、前記一つまたは複数のサブ文書エレメントを、ワード、イメージ、フレーズ、センテンス、パラグラフ、ページ、節、および章から成る群から選択し得る。前記増補は、構成エレメントの各注釈をネームラベルと関連させて行い得る。前記ネームラベルは、前記ユーザまたは共同ユーザのものとし得る。前記文書はウェブページであるとし得る。各ワードに対する外接ボックスが、前記ウェブページに規定され得る。前記ウェブページにワード選択を示すユーザ入力イベントが識別され、前記ウェブページは、識別されたワード選択で自動的にタグが付され得る。ユーザ入力イベントが自動的に識別され、前記ウェブページに一つまたは複数個のワードのハイライトを示す。そして、前記類似度は、サブ文書エレメントをユニークに識別するユニーク識別子であるとし得る。
前述の仕様明細を使用して、本明細書に開示の諸実施の形態は、マシン(またはシステム)、プロセス(または方法)、または製造品として実装され、標準プログラミングおよび/またはエンジニアリング技法を使用することによって、プログラミングソフトウェア、ファームウェア、ハードウェア、またはこれらの組み合わせを製造し得る。当業者ならば分かることであるが、前記仕様明細に記載された諸フローチャートは相異なる可能な実施の形態の理解に便ならしめる意図で提供されたものである。従って、諸ステップの順序を変えること、一つまたは複数個のステップを並行的に実施すること、および/またはステップ数を追加したり、省略したりして実施することは、別の実施の形態で行い得る。
得られたプログラム(複数を含む)は、コンピュータ可読プログラムコードを有し、一種または複数種のコンピュータ使用可能の媒体、例えば、メモリ装置または伝送装置内に内蔵することによって、開示の実施の形態に基づいてコンピュータプログラム製品または製造品を作製し得る。従って、本明細書に使用される「製造品」および「コンピュータプログラム製品」は、どのようなコンピュータ使用可能の媒体、例えば、どのようなメモリ装置または伝送装置上に実装されるコンピュータプログラム存在品(恒久的、一時的、または過渡的)を網羅するものとする。
開示の実施の形態を具現化するマシンは、CPU、メモリ/記憶装置、通信リンク、通信/伝送装置、サーバ、I/O装置を含む一個または複数個の処理システムを備え得るが、これらに限定されない。または、ソフトウェア、ファームウェア、ハードウェア、またはこれらのコンビネーションまたはサブコンビネーションを含む一個または複数個の処理システムのサブコンポーネントまたは個々のパーツであって、特許請求の範囲に示された開示の実施の形態を具現化するものも含む。当業者なら理解することであるが、前記メモリ装置は、固定(ハード)ディスクドライブ、フロッピー(登録商標)ディスク(またはディスケット)、光ディスク、磁気テープ、RAM、ROM、Promのような半導体メモリを含むが、これらに限定されない。伝送装置は、インターネット、イントラネット、電子掲示板およびメッセージ/ノート交換、電話/モデムベースのネットワーク通信、通常有線/ケーブル通信ネットワーク、携帯電話通信、電波通信、衛星通信、および他の固定または移動ネットワークシステム/通信リンクを含むが、これらに限定されない。
例示の操作環境における注釈サーバと注釈クライアント(複数を含む)の実施の形態の説明図である。 図1に示される実施の形態のような本明細書に開示の実施の形態を実行するための汎用コンピュータの説明図である。 図1に示される例示の操作環境における注釈サーバと注釈クライアント(複数を含む)とによって実行される諸操作を示すフローチャートである。 サブ文書エレメントのワードが、外接ボックス長方形を使用して個々に選択可能とされたテキストコンテンツの例を示す図である。 ユーザのネームラベルが後で挿入されたサブ文書エレメントを示す図である。 ビューアに表示されたウェブページにユーザがタグ付けするとき一連の画像フレームを示す図である。 ウェブ文書に付加する注釈を作成し、共有するためのユーザインターフェイスの例を示す図である。 タグベースの探索サービスで実行される操作を示すフローチャートである。 図8に概略示されたように処理されたブックマークコレクションの例を示す図である。 4ステップに等しい「n」ステップで行われる活性化拡散の例を示す図である。 ウェブブラウザを通して利用可能とし得るタグベースの探索インタフェースを示す図である。
符号の説明
100 操作環境、102 ネットワーク、104 汎用コンピュータ、106 クライアント側アプリケーションモジュール、108 注釈プラグイン、110 ウェブブラウザ、112 サーバ側アプリケーションモジュール、114 注釈モジュール、116 ページ−タグ付加モジュール、118 ウェブページサーバ、120 タグベースの探索サーバ、212 ハードウェア、214 ソフトウェア、216 プロセッサ、218 メモリ、220 固定記憶装置、222 ユーザI/O、224 ネットワークI/O、204 カメラ、208 マイクロフォン、206 スピーカ、228 ポインティング装置、230 ディスプレイ、226 キーボード。

Claims (3)

  1. コンピュータによって実施される文書に注釈を付する方法が、
    ユーザによってディスプレイ用に選択された文書を検索するステップと、
    前記検索された文書のコンテンツにサブ文書エレメントを確認するステップと、
    前記検索された文書からのサブ文書エレメントを、1つ以上のさらなる文書の注釈されたサブ文書エレメントと比較するステップであって、注釈されたサブ文書エレメントはそれぞれが、少なくとも1つの注釈に関連づけられている、ステップと、
    前記検索された文書中のサブ文書エレメントの1つと同等の類似度を有する少なくとも1つの注釈されたサブ文書エレメントを識別するステップと、
    前記検索された文書を、前記少なくとも1つの注釈されたサブ文書エレメントに関連づけられた注釈を、前記同等の類似度を有する検索された文書の前記サブ文書エレメントに続いて挿入することにより増補するステップと、
    前記注釈で増補された前記検索された文書をディスプレイするステップとを備え
    前記類似度が、前記サブ文書エレメントに出現するワードの長さと、前記サブ文書エレメントに出現する最初のn個のワードの最初の文字と、サブ文書エレメントに出現する同様なノンストップのワードの頻度と、暗号ハッシュ関数との少なくとも1つに基づいて算出されることを特徴とする方法。
  2. 請求項1に基づく方法において、構成エレメントの各注釈が、前記サブ文書エレメントの終端部のユーザネームラベルを含むことを特徴とする方法。
  3. 請求項1に基づく方法が、
    前記検索された文書を表すウェブページに各ワードに対する外接ボックスを規定するステップと、
    ウェブページでワード選択またはハイライトを示すユーザ入力イベントを識別するステップと、
    前記識別されたワード選択で前記ウェブページを自動的にタグ付けするステップをさらに備えることを特徴とする方法。
JP2008032611A 2007-02-16 2008-02-14 文書に注釈を付するシステムと方法 Active JP5384837B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US89046407P 2007-02-16 2007-02-16
US60/890,464 2007-02-16
US11/837,837 2007-08-13
US11/837,837 US20080201632A1 (en) 2007-02-16 2007-08-13 System and method for annotating documents

Publications (2)

Publication Number Publication Date
JP2008204453A JP2008204453A (ja) 2008-09-04
JP5384837B2 true JP5384837B2 (ja) 2014-01-08

Family

ID=39707521

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008032611A Active JP5384837B2 (ja) 2007-02-16 2008-02-14 文書に注釈を付するシステムと方法
JP2008032613A Active JP5307417B2 (ja) 2007-02-16 2008-02-14 文書に注釈を付するシステムと方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008032613A Active JP5307417B2 (ja) 2007-02-16 2008-02-14 文書に注釈を付するシステムと方法

Country Status (2)

Country Link
US (2) US8276060B2 (ja)
JP (2) JP5384837B2 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9361295B1 (en) 2006-11-16 2016-06-07 Christopher C. Andrews Apparatus, method and graphical user interface for providing a sound link for combining, publishing and accessing websites and audio files on the internet
US10296561B2 (en) 2006-11-16 2019-05-21 James Andrews Apparatus, method and graphical user interface for providing a sound link for combining, publishing and accessing websites and audio files on the internet
US20110055713A1 (en) * 2007-06-25 2011-03-03 Robert Lee Gruenewald Interactive delivery of editoral content
US9081852B2 (en) * 2007-10-05 2015-07-14 Fujitsu Limited Recommending terms to specify ontology space
US20090119572A1 (en) * 2007-11-02 2009-05-07 Marja-Riitta Koivunen Systems and methods for finding information resources
US8019772B2 (en) * 2007-12-05 2011-09-13 International Business Machines Corporation Computer method and apparatus for tag pre-search in social software
US10699242B2 (en) * 2008-01-16 2020-06-30 International Business Machines Corporation Automated surfacing of tagged content adjunct to vertical applications
US20090187818A1 (en) * 2008-01-22 2009-07-23 International Business Machines Corporation Method and system of interface comment mapping
US20090249224A1 (en) * 2008-03-31 2009-10-01 Microsoft Corporation Simultaneous collaborative review of a document
US7930306B2 (en) * 2008-04-30 2011-04-19 Msc Intellectual Properties B.V. System and method for near and exact de-duplication of documents
US20100042615A1 (en) * 2008-08-12 2010-02-18 Peter Rinearson Systems and methods for aggregating content on a user-content driven website
US8892630B1 (en) 2008-09-29 2014-11-18 Amazon Technologies, Inc. Facilitating discussion group formation and interaction
US9083600B1 (en) 2008-10-29 2015-07-14 Amazon Technologies, Inc. Providing presence information within digital items
US8706685B1 (en) * 2008-10-29 2014-04-22 Amazon Technologies, Inc. Organizing collaborative annotations
US20100153835A1 (en) * 2008-12-17 2010-06-17 Business Objects, S.A. Linking annotations to document objects
US8417706B2 (en) * 2009-06-16 2013-04-09 Isentium Technologies Inc. Method for responding to a plurality of electronic messages
US20100332967A1 (en) * 2009-06-25 2010-12-30 Yahoo! Inc. System and method for automatically generating web page augmentation
CN101694666B (zh) * 2009-07-17 2011-03-30 刘二中 文件内容的特征词的输入和处理方法
US8745067B2 (en) * 2009-08-12 2014-06-03 Google Inc. Presenting comments from various sources
US8645363B2 (en) * 2009-08-12 2014-02-04 Google Inc. Spreading comments to other documents
US9542484B2 (en) * 2009-09-29 2017-01-10 Sap Se Updating ontology while maintaining document annotations
JP4957821B2 (ja) * 2010-03-18 2012-06-20 コニカミノルタビジネステクノロジーズ株式会社 会議システム、情報処理装置、表示方法および表示プログラム
US20110251837A1 (en) * 2010-04-07 2011-10-13 eBook Technologies, Inc. Electronic reference integration with an electronic reader
US20110264541A1 (en) * 2010-04-23 2011-10-27 Sanof Deen Mohamedsadakathulla Generation and distribution of user structured web content and advertisement, by creating a database matrix cloud across the internet
US9582575B2 (en) * 2010-07-09 2017-02-28 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for linking items to a matter
US20120078979A1 (en) * 2010-07-26 2012-03-29 Shankar Raj Ghimire Method for advanced patent search and analysis
US9262390B2 (en) * 2010-09-02 2016-02-16 Lexis Nexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents
US8543911B2 (en) * 2011-01-18 2013-09-24 Apple Inc. Ordering document content based on reading flow
US9632994B2 (en) * 2011-03-11 2017-04-25 Microsoft Technology Licensing, Llc Graphical user interface that supports document annotation
US9251130B1 (en) 2011-03-31 2016-02-02 Amazon Technologies, Inc. Tagging annotations of electronic books
US10270831B2 (en) 2011-04-04 2019-04-23 Soundlink, Inc. Automated system for combining and publishing network-based audio programming
US20140081972A1 (en) * 2011-05-27 2014-03-20 Infrasight Labs Ab System for observing and analyzing configurations using dynamic tags and queries
US20130031455A1 (en) 2011-07-28 2013-01-31 Peter Griffiths System for Linking to Documents with Associated Annotations
US9483454B2 (en) * 2011-10-07 2016-11-01 D2L Corporation Systems and methods for context specific annotation of electronic files
CN103102014A (zh) * 2011-11-11 2013-05-15 江苏美尚生态景观股份有限公司 一种采用生态沟渠保护水质的方法
CN103102013A (zh) * 2011-11-11 2013-05-15 江苏美尚生态景观股份有限公司 采用水生植物组合物修复生态湿地水质的方法
US20130174033A1 (en) * 2011-12-29 2013-07-04 Chegg, Inc. HTML5 Selector for Web Page Content Selection
US8850301B1 (en) * 2012-03-05 2014-09-30 Google Inc. Linking to relevant content from an ereader
JP5820320B2 (ja) * 2012-03-27 2015-11-24 株式会社東芝 情報処理端末及び方法、並びに、情報管理装置及び方法
CN102708192B (zh) * 2012-05-15 2017-11-28 华为技术有限公司 一种文档共享的方法及系统、设备
US10372779B2 (en) * 2012-09-13 2019-08-06 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Frequent content continuity visual assistance in content browsing
US20140281870A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Document collaboration and notification of changes using different notification mechanisms
US9116894B2 (en) 2013-03-14 2015-08-25 Xerox Corporation Method and system for tagging objects comprising tag recommendation based on query-based ranking and annotation relationships between objects and tags
US20140281889A1 (en) * 2013-03-15 2014-09-18 Varda Treibach-Heck Research data collector and organizer (rdco)
US9542473B2 (en) * 2013-04-30 2017-01-10 Microsoft Technology Licensing, Llc Tagged search result maintainance
US10459991B2 (en) * 2015-04-23 2019-10-29 International Business Machines Corporation Content contribution validation
KR20180072661A (ko) * 2015-11-17 2018-06-29 점보 테크놀로지 컴퍼니 리미티드 웹 페이지 주석 및 커뮤니티 공유 시스템
US10489492B2 (en) * 2015-12-10 2019-11-26 Dropbox, Inc. Sending feature-instruction notifications to user computing devices
US11030259B2 (en) * 2016-04-13 2021-06-08 Microsoft Technology Licensing, Llc Document searching visualized within a document
US9922017B2 (en) 2016-05-19 2018-03-20 International Business Machines Corporation Misaligned annotation processing
US10095747B1 (en) 2016-06-06 2018-10-09 @Legal Discovery LLC Similar document identification using artificial intelligence
US10776399B1 (en) 2016-06-06 2020-09-15 Casepoint LLC Document classification prediction and content analytics using artificial intelligence
US10740407B2 (en) 2016-12-09 2020-08-11 Microsoft Technology Licensing, Llc Managing information about document-related activities
US10726074B2 (en) 2017-01-04 2020-07-28 Microsoft Technology Licensing, Llc Identifying among recent revisions to documents those that are relevant to a search query
US10699112B1 (en) * 2018-09-28 2020-06-30 Automation Anywhere, Inc. Identification of key segments in document images
CN114827073A (zh) * 2021-01-29 2022-07-29 Zoom视频通讯公司 语音邮件垃圾信息检测
JP7445318B2 (ja) 2022-02-28 2024-03-07 ロゴスサイエンス株式会社 サービス提供システム

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5239466A (en) * 1990-10-04 1993-08-24 Motorola, Inc. System for selectively routing and merging independent annotations to a document at remote locations
US7171016B1 (en) * 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
WO2000016221A1 (en) * 1998-09-15 2000-03-23 Microsoft Corporation Interactive playlist generation using annotations
US6941321B2 (en) * 1999-01-26 2005-09-06 Xerox Corporation System and method for identifying similarities among objects in a collection
US6922699B2 (en) * 1999-01-26 2005-07-26 Xerox Corporation System and method for quantitatively representing data objects in vector space
US6598054B2 (en) * 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US6687878B1 (en) * 1999-03-15 2004-02-03 Real Time Image Ltd. Synchronizing/updating local client notes with annotations previously made by other clients in a notes database
US9141717B2 (en) * 1999-03-22 2015-09-22 Esdr Network Solutions Llc Methods, systems, products, and devices for processing DNS friendly identifiers
US6615199B1 (en) * 1999-08-31 2003-09-02 Accenture, Llp Abstraction factory in a base services pattern environment
US6360951B1 (en) * 1999-12-16 2002-03-26 Xerox Corporation Hand-held scanning system for heuristically organizing scanned information
GB0023938D0 (en) * 2000-09-29 2000-11-15 British Telecomm Information access
JP3664475B2 (ja) * 2001-02-09 2005-06-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理方法、情報処理システム、プログラムおよび記録媒体
US7043702B2 (en) * 2001-03-15 2006-05-09 Xerox Corporation Method for visualizing user path through a web site and a path's associated information scent
US7043535B2 (en) * 2001-03-30 2006-05-09 Xerox Corporation Systems and methods for combined browsing and searching in a document collection based on information scent
US6907459B2 (en) * 2001-03-30 2005-06-14 Xerox Corporation Systems and methods for predicting usage of a web site using proximal cues
JP4008679B2 (ja) * 2001-08-16 2007-11-14 沖電気工業株式会社 情報管理装置及び情報管理システム
JP4351405B2 (ja) * 2001-08-29 2009-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション トランスコーディングシステム及びアノテーション管理装置
US6968085B2 (en) * 2001-09-10 2005-11-22 Xerox Corporation Document matching and annotation lifting
JP2003131555A (ja) * 2001-10-24 2003-05-09 Eigyotatsu Kofun Yugenkoshi 文書自己決定方式による外国語学習システム及びその方法
AU2003210795A1 (en) * 2002-02-01 2003-09-02 John Fairweather System and method for analyzing data
US7257774B2 (en) * 2002-07-30 2007-08-14 Fuji Xerox Co., Ltd. Systems and methods for filtering and/or viewing collaborative indexes of recorded media
JP4021290B2 (ja) * 2002-09-20 2007-12-12 株式会社リコー 情報処理装置、情報処理方法、及び情報処理プログラム
JP2004206658A (ja) * 2002-10-29 2004-07-22 Fuji Xerox Co Ltd 表示制御方法、情報表示処理システム、クライアント端末、管理サーバ、プログラム
US7028053B2 (en) * 2003-01-16 2006-04-11 Xerox Corporation Apparatus and methods for accessing a collection of content portions
US7315857B2 (en) * 2004-05-13 2008-01-01 International Business Machines Corporation Method and system for propagating annotations using pattern matching
US7164789B2 (en) * 2003-08-11 2007-01-16 Palo Alto Research Center Incorporated Three-dimensional active vision with glyph address carpet
US20050060643A1 (en) * 2003-08-25 2005-03-17 Miavia, Inc. Document similarity detection and classification system
WO2005029353A1 (ja) * 2003-09-18 2005-03-31 Fujitsu Limited 注釈管理システム、注釈管理方法、文書変換サーバ、文書変換プログラム、電子文書付加プログラム
US7667703B2 (en) * 2003-12-19 2010-02-23 Palo Alto Research Center Incorporated Systems and method for turning pages in a three-dimensional electronic document
US7148905B2 (en) * 2003-12-19 2006-12-12 Palo Alto Research Center Incorporated Systems and method for annotating pages in a three-dimensional electronic document
JP2007529822A (ja) * 2004-03-15 2007-10-25 ヤフー! インコーポレイテッド 信頼性ネットワークからのユーザ注釈を一体化したサーチシステム及び方法
US20070067297A1 (en) * 2004-04-30 2007-03-22 Kublickis Peter J System and methods for a micropayment-enabled marketplace with permission-based, self-service, precision-targeted delivery of advertising, entertainment and informational content and relationship marketing to anonymous internet users
US7707265B2 (en) * 2004-05-15 2010-04-27 International Business Machines Corporation System, method, and service for interactively presenting a summary of a web site
JP4466210B2 (ja) * 2004-06-10 2010-05-26 ソニー株式会社 プログラム、コンピュータおよびデータ処理方法
JP2006004298A (ja) * 2004-06-18 2006-01-05 Fuji Xerox Co Ltd 文書処理装置、文書処理方法及び文書処理プログラム
US7519573B2 (en) * 2004-08-23 2009-04-14 Fuji Xerox Co., Ltd. System and method for clipping, repurposing, and augmenting document content
US20070118794A1 (en) * 2004-09-08 2007-05-24 Josef Hollander Shared annotation system and method
US7966327B2 (en) * 2004-11-08 2011-06-21 The Trustees Of Princeton University Similarity search system with compact data structures
US7577902B2 (en) * 2004-12-16 2009-08-18 Palo Alto Research Center Incorporated Systems and methods for annotating pages of a 3D electronic document
US7898541B2 (en) * 2004-12-17 2011-03-01 Palo Alto Research Center Incorporated Systems and methods for turning pages in a three-dimensional electronic document
JP4208081B2 (ja) * 2004-12-27 2009-01-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 複数のウェブサイトにパーソナライズされた価値を追加するためのシステム、ウェブサーバ、方法およびプログラム
US7702611B2 (en) * 2005-01-07 2010-04-20 Xerox Corporation Method for automatically performing conceptual highlighting in electronic text
US20070022098A1 (en) * 2005-07-25 2007-01-25 Dale Malik Systems and methods for automatically updating annotations and marked content of an information search
US7668787B2 (en) * 2006-06-27 2010-02-23 Xerox Corporation Method, apparatus, and program product for efficiently adding entities and relationships in a comprehension state of a collection of information
WO2008045792A2 (en) * 2006-10-06 2008-04-17 Technorati, Inc. Methods and apparatus for conversational advertising
US20080147821A1 (en) * 2006-12-19 2008-06-19 Dietrich Bradley W Managed peer-to-peer content backup service system and method using dynamic content dispersal to plural storage nodes

Also Published As

Publication number Publication date
JP2008204453A (ja) 2008-09-04
JP5307417B2 (ja) 2013-10-02
US8276060B2 (en) 2012-09-25
US20080201651A1 (en) 2008-08-21
US20080201632A1 (en) 2008-08-21
JP2008204455A (ja) 2008-09-04

Similar Documents

Publication Publication Date Title
JP5384837B2 (ja) 文書に注釈を付するシステムと方法
JP5222581B2 (ja) 文書に注釈を付するシステムと方法
US8745039B2 (en) Method and system for user guided search navigation
JP4837040B2 (ja) ブログ文書のランク付け
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US8819003B2 (en) Query refinement based on user selections
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
US10162802B1 (en) Systems and methods for syndicating and hosting customized news content
US8554800B2 (en) System, methods and applications for structured document indexing
AU2010343183B2 (en) Search suggestion clustering and presentation
US8762326B1 (en) Personalized hot topics
US20090089278A1 (en) Techniques for keyword extraction from urls using statistical analysis
US20100100607A1 (en) Adjusting Content To User Profiles
US20130339840A1 (en) System and method for logical chunking and restructuring websites
US7698329B2 (en) Method for improving quality of search results by avoiding indexing sections of pages
JP2010257453A (ja) サーチクエリデータを用いて文書にタグ付けするシステム
US7895337B2 (en) Systems and methods of generating a content aware interface
US10235459B1 (en) Creating entries in at least one of a personal cache and a personal index
EP1962202A2 (en) System and method for annotating documents
JP5379627B2 (ja) 検索制御装置、検索制御方法、及びプログラム
EP1962201A2 (en) System and method for annotating documents using a viewer
JP5416023B2 (ja) 閲覧端末及び方法
JP5525424B2 (ja) 文書検索装置、文書検索方法及び文書検索プログラム
US10909127B2 (en) Method and server for ranking documents on a SERP
US9898544B2 (en) Guided web navigation tool

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131003

R150 Certificate of patent or registration of utility model

Ref document number: 5384837

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250