JP2003114906A - ユーザ定義可能なパーソナリティを備えたメタ文書管理システム - Google Patents

ユーザ定義可能なパーソナリティを備えたメタ文書管理システム

Info

Publication number
JP2003114906A
JP2003114906A JP2002235923A JP2002235923A JP2003114906A JP 2003114906 A JP2003114906 A JP 2003114906A JP 2002235923 A JP2002235923 A JP 2002235923A JP 2002235923 A JP2002235923 A JP 2002235923A JP 2003114906 A JP2003114906 A JP 2003114906A
Authority
JP
Japan
Prior art keywords
document
personality
service
entity
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002235923A
Other languages
English (en)
Other versions
JP4365074B2 (ja
Inventor
James G Shanahan
ジー シャナハン ジェームズ
Gregory T Grefenstette
ティー グレフェンステット グレゴリー
Christer Fernstrom
フェルンシュトローム クリステル
Laurence Hubert
ユベール ローレンス
Nicolas Guerin
ゲラン ニコラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2003114906A publication Critical patent/JP2003114906A/ja
Application granted granted Critical
Publication of JP4365074B2 publication Critical patent/JP4365074B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ユーザのニーズに合わせて文書の内容を動的
に拡充する。 【解決手段】 このシステムで用いるメタ文書100
は、この文書の内容である文書コンテンツ102に加
え、1以上のパーソナリティ104を含んでいる。各パ
ーソナリティ104は、1組の文書サービスリクエスト
410に対応づけられている。リクエスト410は、例
えば指定分野の関連文献の検索などのサービスを要求す
るものなどである。このシステムのスケジューラ204
は、定期的にメタ文書100内の文書サービスリクエス
ト410を実行する。これにより、そのリクエスト41
0を満足するネットワークサービス206が実行され
る。このサービスの実行結果は、例えば関連文献を載せ
たウェブページへのURLなどある。この結果が、コン
テンツ管理部208により、例えば文書マークアップ1
08などとしてメタ文書100に組み込まれる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、概略的には文書の
管理及び利用に関し、特に情報に対するリクエストを生
成し、応答を探索し、検索し、パッケージ化することで
その文書のコンテンツ(内容)を拡充する一方、読解や
他の文書との関係の理解、コンテンツの生成を助けるエ
ージェント、として振る舞う文書の管理及び利用に関す
る。特に本発明は、ユーザ定義可能なパーソナリティ
(性格)を備えたメタ文書サーバに関連する。
【0002】
【従来の技術及び発明が解決しようとする課題】文書管
理による知識(ナレッジ)管理は知識の創成やライフサ
イクルの共有の重要な部分を構成する。知識の創成や共
有の典型的なモデルは循環的なものであり、3つの主要
なステップから構成される。すなわち、合成(サーチ、
収集、獲得、同化)、共有(提示、公開/配布)、サー
ビス提供(意志決定や革新的な創造のための文書利用の
支援)の3つである。
【0003】たいていのシステムは、文書のことを静的
なもの、たとえば権限を与えられたユーザにより何らか
の操作がなされたときにのみ、新たなコンテンツが取得
できるもの、と捉えている。文書が新たな情報を獲得す
るには、その文書を読んで修正したり、その文書のコン
テンツを変化させる(例えばハイパーリンクを付加する
など)プログラムを実行したりするなどのユーザの決定
が必要である。このように文書を受動的なリポジトリと
してみる見方は、ユーザが画面の前にいてシステムを操
作しないと文書が変わらないままであるという、現在の
状況をもたらしている。
【0004】統計的に能動的に文書コンテンツを拡充
(内容豊富化)する既存の手法にもかかわらず、文書拡
充サービスのユビキタス化(いつでもどこでも利用でき
るようにすること)を可能とするよりよい文書拡充アー
キテクチャを提供する必要性がなおも存在する。よりよ
い文書拡充アーキテクチャは、自動的にそのようなサー
ビスを付与したり、監視したり、ユーザに対して提案し
たりすることで、そのようなサービスを使いやすくする
方法を効果的に提供することができるであろう。
【0005】
【課題を解決するための手段】本発明では、文書コンテ
ンツを拡充するためのシステムとそのための方法を提供
する。このシステムは、拡充(エンリッチ)テーマを特
定する文書サービスリクエストの集合を規定するパーソ
ナリティを指定するためのユーザインタフェースを備え
る。ユーザ管理部は、文書コンテンツとそのユーザイン
タフェースで指定されたパーソナリティとを受け取る。
ユーザ管理部は、その文書コンテンツとパーソナリティ
とを備えるメタ文書を形成する。スケジューラは、その
集合から1つの文書サービスリクエストを選択し、選択
した文書サービスを満足するよう、サービスプロバイダ
との通信を開始し、この通信を管理する。コンテンツ管
理部は、選択した文書サービスについての結果を、文書
マークアップとしての前記メタ文書に統合する。ユーザ
インタフェースとユーザ管理部とスケジューラとコンテ
ンツ管理部とが協動して、新たなパーソナリティを生成
したり推薦したり、既存のパーソナリティを修正したり
する。この協動処理では、代数的な計算の組、文書参照
の組、既定のパーソナリティの組、学習パーソナリティ
の組、知識レベル、及びパーソナリティの分類の中の1
つまたは複数の組み合わせが用いられる。
【0006】
【発明の実施の形態】以下、本発明の実施の形態(以下
実施形態という)について、図面を参照して説明する。
同じ又は類似の部分には、図面間で同じ符号を付す。
【0007】A.用語の定義 以下で定義する用語は、本願明細書において、そこに示
した意味を持つ。
【0008】「アノテーション付け」は、ここでは、文
書又は文書内の領域にあるエンティティと、テキストセ
グメント(断片)、画像、埋込データ(例えばグリ
フ)、又はリンクの集合との間の参照情報を生成するこ
とを意味する。
【0009】「コンテンツ検索」とは、ここでは、1又
は複数の一連のリンクをたどってそのコンテンツを検索
することにより取得したコンテンツからなるアノテーシ
ョン(注釈)を意味する。なお、検索したコンテンツは
その検索の後フィルタリング又は再フォーマットしても
よい。
【0010】「文書」は、ここでは、電子的(例えばデ
ジタル)又は物理的(例えば紙)な情報の記録を示すた
めに用いられる。電子的な形態では、文書は、画像デー
タ、音声データ、ビデオデータを含み得る。画像データ
は、テキスト、グラフィック図形、ビットマップ画像を
含みうる。
【0011】文書「マークアップ」は、文書に付与され
たアノテーションを示すために用いられる。
【0012】「文書の精神(soul)」は、ここでは、無
限又はあらかじめ指定された有限の時間である延長期間
(extended period)の間、文書に付与され続けているパ
ーソナリティを指し示すのに用いられる。
【0013】「拡充(エンリッチ)」は、ここでは、あ
らかじめ規定したパーソナリティに合わせて文書にアノ
テーション付けを行うことを指し示すために用いられ
る。
【0014】「エンティティ」は、ここでは、文書中に
見いだされる何か(例えば人の名前、場所、医学用語、
画像データ、グラフィックスエンティティ(グラフィッ
ク図形データ、音声データ又はビデオデータを含み得
る)など)を示すために用いられ、画像、テキスト、埋
込データ、HTMLなどの形とすることができる。
【0015】「情報空間」は、ここでは、エンティテ
ィ、文書セグメント、文書、あるいは一組の文書群、に
関連したアノテーション全体の集合を指し示すのに用い
られる。
【0016】「語彙集(lexicon)」は、ここでは、自然
言語集合において生起しうる単語の集合を示すデータ構
造、プログラム、オブジェクト又はデバイスを意味す
る。語彙集はその語彙集が示す単語を「受け入れる」と
言い、この場合その単語は、「受け入れ可能」であると
言ったり、その語彙集に「含まれる」又はその語彙集の
中に「生起する」と言う。
【0017】「リンク」は、ここでは、例えばテキスト
セグメントや画像セグメントに関連づけられたURL
(Uniform Resource Locator)などである。
【0018】「パーソナリティ」という用語は、テーマ
に関するサービスの集合を示すのに用いる。ここで、サ
ービスは文書を拡充するために適用される。
【0019】「サービス」は、ある文書の現在の状態に
おけるコンテンツやメタデータに基づき新たなマークア
ップを提供するプログラムを意味する。例えば、そのプ
ログラムは、文書中の各エンティティを識別し、各エン
ティティに対し当該エンティティに関係するデータ(例
えばデータベース内にあるデータ)でアノテーション付
けする。例えば、サービスは、外部の情報により文書を
拡充するか、新たなサービスを追加するか、の少なくと
も一方を行う。
【0020】「テキストセグメント」は、文書中の連続
したバイト列、又はそのような断片のグループを意味す
る。
【0021】B.概略的な特徴 メタ文書100すなわち「文書の精神」のブロック図が
図1に示される。メタ文書100は、識別子101、コ
ンテンツ部分102(ユーザにより生成又は取得された
文書)、パーソナリティ104を含んでいる。パーソナ
リティ104は1又は複数の文書サービスリクエスト1
06とエンティティデータベース111の組である。エ
ンティティデータベース111は1又は複数の個別のエ
ンティティデータベースを含んでいてもよい。ここで、
個々の個別のエンティティデータベースは、それぞれエ
ンティティの1つのクラス(例えば人名、市の名称、業
務(ビジネス)の名称など))を識別する。一つの例で
は、パーソナリティ104はエンティティデータベース
111を含まず、その代わりにエンティティを識別する
ための文書サービスリクエストを含む。別の例では、エ
ンティティデータベース111は、文書中心的なエンテ
ィティ群(すなわち、文書コンテンツ102に対して排
他的に関連するエンティティ群)を含む。ここでそれら
文書中心的なエンティティ群は、ユーザ又はシステムに
より指定される。当業者には分かるように、メタ文書1
00の一部を構成する文書サービスリクエスト106と
エンティティデータベース111は、文書サービスリク
エスト及びエンティティデータベースの実体的コンテン
ツを含んでいても良いし、(例えばサービスデータベー
ス210の中にある)文書サービスリクエストやエンテ
ィティデータベースへの参照情報を含んでいても良い
し、その両方でも良い。識別子101は、他の管理デー
タ、例えば作成者、所有者、サイズ、アクセス権限など
を含んでもよい。
【0022】B.1 知識管理サイクル 図2は、メタ文書管理システム201を例示する図であ
る。このメタ文書管理システム201の中で、メタ文書
100が知識明確化(結晶化)プロセスの結果として生
成され、このプロセスはその文書の一生の間続く。典型
的には、メタ文書の一生は、関心の焦点と目的により始
まり、その関心の焦点と目的は合成フェーズの管理と向
上を助ける。合成フェーズでは、メタ文書100は、あ
らかじめ規定された文書サービスリクエストの集合によ
って独立的に、あるいは特定の又はカスタマイズされた
指示に従って、書き手又は読み手の情報ニーズを予想
し、文書コンテンツに関係する情報のサーチ、収集、同
化、組織化といった、時には退屈な仕事を実行する。
【0023】合成フェーズの動作は、1又は複数の文書
サービスリクエスト106のアクティべーション(起
動)によって起こる。文書サービスリクエスト106の
起動は、ユーザがメタ文書を作成したりメタ文書に対し
て作業(編集など)をしたりしている間や、ユーザがメ
タ文書を脇に置いたためそのサービスリクエストがコン
ピュータの空き時間や使用されていないネットワーク帯
域幅などを利用できるようになったとき、などに行うこ
とができる。ユーザが文書に対して作業を行っていると
きに文書サービスリクエスト106を起動させれば、そ
のメタ文書にそのユーザの好み(ユーザが好む設定情報
など)について学習させることができるという付加的な
利点がある。文書サービスリクエスト106は、スケジ
ューラ204により自動的に、又はユーザの操作によっ
て、起動することもできる。
【0024】知識管理サイクルの次のフェーズは、合成
フェーズの間に作成された情報の共有に関連している。
例えば、この共有フェーズは、合成フェーズの間に収集
された情報を、ユーザ(すなわち当該文書を利用するで
あろう人又はコミュニティ(共同体))にとって役立つ
フォーマット(書式)のメタ文書100のコンテンツへ
と統合する処理を含んでいる。文書コンテンツは、その
文書に対してパーソナリティを割り当てることによっ
て、当該ユーザのために更に拡充することができる。パ
ーソナリティは、その文書コンテンツの理解を助けた
り、そのコンテンツについての更に新しい更新事項を例
えば定期的に提供したりする情報によって、その文書を
マークアップするものである。このサイクルの最後であ
るサービス提供ステップでは、定期的な更新を取り扱
う。この更新では、メタ文書は、あらかじめ規定された
文書サービスリクエストを、ユーザのために実行する。
例えば、メタ文書は、指定された都市の気温の情報を最
新のものに保つことができる。
【0025】B.2 サービス 再び図2を参照すると、1又は複数のメタ文書100
は、メタ文書サーバ200内のメタ文書データベース2
02に格納されている。別の実施例では、文書参照情報
(例えばURL)がメタ文書データベース202に格納
され、それに対応するコンテンツはネットワークファイ
ルサーバ220にて参照される。メタ文書サーバ200
内の各メタ文書100は、1組の文書サービスリクエス
トを備える。これら文書サービスリクエストは、各メタ
文書100がスケジュールデーモンすなわちスケジュー
ラ204の制御の下で実行するものである。スケジュー
ラ204は、あらかじめ定められているタイムスケジュ
ールに従って、各メタ文書データベース202内のメタ
文書を目覚めさせる。スケジューラ204は、メタ文書
100内のコンテンツ、文書サービスリクエスト10
6、及びエンティティデータベース111にアクセスす
るソフトウエア機構の中に実装することができる。
【0026】図3に示すように、スケジューラ204が
メタ文書100を目覚めさせた後、そのメタ文書100
が、現在の自分の文書サービスリクエスト群301の組
のことをスケジューラ204に報せる。メタ文書サーバ
200が使用できる資源(例えばそれぞれ特定の文書サ
ービスリクエストを実行する、すなわち満たすことがで
きるサービスプロバイダなど)に応じて、スケジューラ
204は、実行すべき文書サービスリクエスト106
(矢印300で示す)を決定する。つづいて、スケジュ
ーラ204は、それら文書サービスリクエスト106を
実行するために、指定されたサービスプロバイダ206
を、サービスデータベース210を用いて呼び出す。
【0027】サービスデータベース210は、ルックア
ップ(索引)してサービスプロバイダを選択するための
「サービスプロバイダメソッド」(各サービスに対応す
る認証データを含む)を有する。また、サービスデータ
ベース210は、当該メタ文書内のエンティティデータ
ベース111、又はサービスデータベース210内にあ
るか又はネットワークサービス206として利用可能で
あるエンティティデータベース、を用いて文書コンテン
ツ内のエンティティを識別するための「エンティティメ
ソッド」を含む。またサービスデータベース210は、
ユーザに対し、新たな拡充、正規表現、語彙集、カテゴ
ライザ(カテゴリ分類手段)のことを通知するための
「通知(ノーティフィケーション)メソッド」を有す
る。別の実施例としては、サービスデータベース210
は、コンテンツ権管理メソッドを有するようにすること
もできる。
【0028】文書サービスリクエストを満足させるとい
うことは、サービスデータベース210から(例えばサ
ービスプロバイダの選択候補のリストから、サービスプ
ロバイダを選択するなどにより)サービスプロバイダに
アクセスすることを意味する。ここで、サービスデータ
ベース210は、文書コンテンツ102(矢印302で
示す)と文書マークアップ108(矢印304で示す)
にアクセスするためにスケジューラにより呼び出される
いくつかのプロセス(又はプログラム)を有する。サー
ビスプロバイダ206から受け取った結果は、コンテン
ツ管理部208により、元のメタ文書100に統合され
る。すなわち、これらのプロセスは、特定文書向けのマ
ークアップ(矢印306で示される)と、新たな文書サ
ービスリクエスト106(矢印308で示される)との
うちの少なくとも一方を生成することで終了し、これら
両者はコンテンツ管理部208によりメタ文書100に
付加される。
【0029】B.3 パーソナリティ メタ文書サーバ200は、カスタマイズ可能な方式の、
文書ベースでの知識の創成及び共有のためのエンド・ト
ゥ・エンド(端末間)のソリューションを提供する。カ
スタマイズは、メタ文書サーバ内のパーソナリティのメ
カニズムにより提供される。パーソナリティは、文書に
対して割り当てられ、これによりユーザが知識を取得
し、共有し、利用するのを支援する。これは、現今のウ
ェブ・ポータルのようなグローバルビュー(包括表示画
面)とは対照的に、文書世界ビュー(a document view o
f the world:文書の観点から世界を見た状態を示すビ
ュー)を生成する。1又は複数のパーソナリティを文書
に付加することができる。各パーソナリティは、テーマ
的にか、文脈的にか、あるいはその両方で、文書サービ
スリクエスト106の集まりをコード表現する。ここ
で、それら文書サービスリクエストは、当該文書が、自
律的に文書作成者又は読者のために機能することを可能
にする。すなわち例えば、その文書の作成者及び読者の
両方の情報ニーズを予測し、その文書が情報世界におけ
る他の部分(すなわち当該文書以外の部分)と連結した
状態を維持し、情報世界における他の部分により更新さ
れるようにする。
【0030】メタ文書100には、例えば次に例示する
ようなパーソナリティ104が付与される。例えば(a)
「探究的」というパーソナリティは、そのコンテンツで
言及されている人々の事跡記録を見つけるなど、文書コ
ンテンツに含まれる概念についてのさらなる情報を情報
を見つけるための文書サービスリクエストの集合に対応
し、(b)「多言語的」というパーソナリティは、その文
書に含まれる単語や用語、句などの訳をサーチするため
のもの、(c)「プライベート」というパーソナリティ
は、当該文書のメタデータが他の文書に対して不可視と
なるようにするためのもの、(d)「科学的」というパー
ソナリティは、その文書のコンテンツに引用されている
論文のオンライン版をサーチするためのもの、(e)「系
統的」というパーソナリティは、その文書と似たコンテ
ンツを含んでいる文書を探すためのもの、である。
【0031】B.4 エンティティの識別及び利用のた
めの方法 図3に示すように、パーソナリティ104は1又は複数
の文書サービスリクエスト106を指定する。各サービ
スリクエストは、(a)文書コンテンツ102中のエンテ
ィティを認識するメソッド、及び(b)認識したエンティ
ティを用いてサービスにアクセスするメソッド、を含ん
でいる。
【0032】エンティティは、固有名(例えば人、場
所、組織など)、時間、位置、量、引用文献(例えば書
籍の題名)、アドレス、などを含む。エンティティは、
正規表現、語彙集、キーワード、ルールなどのなかの1
つ又はそれらの組み合わせなどといった、公知の様々な
手法を用いて認識することができる。語彙集(lexicon)
は、例えば、<entity-string, part-of-speech-tag, en
tity-type>という形式のタプルからなるデータベースで
ある。ここで、「entity-string(エンティティ文字
列)」は、当該エンティティを構成する文字列(例えば
人名「John Smith」など)である。「part-of-speech-t
ag(品詞タグ)」は、そのエンティティの文法上の用法
(例えば名詞、名詞句、動詞など)を示すものであり、
これはなくてもよい。「entity-type(エンティティタ
イプ)」は、エンティティについての所定の複数の分類
(すなわちカテゴリ)(例えば人、組織、会社の名前、
など)のうちの1又は複数のものに、当該エンティティ
が属しているか否かを示すものである。連続するテキス
ト文字列が、語彙集に属するものとして「受け入れられ
る」場合は、その文字列はエンティティと認識される。
【0033】エンティティは、文字列マッチング又は正
規表現を用いて認識することができる。例えば、英語表
記の人名は、先頭が大文字である2つの語として認識す
ることができる。正規表現は、実際の文書コンテンツの
原文の言葉(すなわち単語群)で、又はそのコンテンツ
原文に関連づけられた言語学的マークアップの言葉で、
表現することができる。この言語学的マークアップに
は、品詞タグ(例えば)名詞句、名詞など)や浅い構文
解析(shallow parse)のタグなどが含まれ得る。
【0034】エンティティ認識のための別の手段とし
て、いくつかのルールを用いることができる。例えば、
「『英単語』の先頭が大文字であり、かつ語彙集(又は
辞書又はシソーラス)に載っていない場合、その英単語
は固有名(固有名詞)である」というルールは、固有名
を認識するのに用いることができる。
【0035】図4は、メタ文書100が、当該文書10
0内で指定されたパーソナリティ104を用いて拡充さ
れている例を示す。あらかじめ定めた時刻ごと又は、あ
らかじめ指定した時間間隔ごとに、スケジューラ204
が起動し、文書サービスリクエスト410を識別する。
そしてスケジューラは、当該文書サービスリクエストに
ついての、参照情報412により参照されるメソッド
を、サービスデータベース210にて呼び出す。サービ
スデータベース210内の、参照される文書サービスリ
クエストのメソッド群の中には、正規表現、語彙集、サ
ービスプロバイダ選択、各サービスに関連する認証デー
タ、及びコンテンツ権管理などが含まれる。参照情報4
12が示すメソッドを実行するときには、ネットワーク
サービス群206から、サービスデータベース210に
格納されている「会社名」というエンティティタイプの
中から個別のエンティティを識別するサービスが識別さ
れる。
【0036】識別されたサービスがいったんスケジュー
ラ204により実行されると、該サービスの結果がコン
テンツ管理部208に提供され、コンテンツ管理部20
8はこれにより以下の例示するタスクのうちの1又は複
数を実行する。これらのタスクとしては、(a)矢印41
4で示すように文書サービスリクエスト410にマーク
付けするタスク、(b)これ以上の入力は待たないが実行
されるのを待つように文書サービスリクエスト416に
マーク付けするタスク、(c)会社名エンティティタイプ
の中から選ばれるエンティティを挿入するタスク(この
エンティティは、文書コンテンツ102だけでなく、そ
の文書コンテンツ102におけるそのエンティティ41
8のところに現れる)、がある。
【0037】スケジューラがその後文書サービスリクエ
スト416を識別したとき、スケジューラは、同様に、
サービスデータベース210から、418にて識別され
た会社名エンティティを確認するために株価検索(stock
quote)サービスを利用するメソッド420を識別す
る。この株価検索の結果も、同様に文書マークアップ1
08に挿入されるとともに、エンティティ418に直接
にリンクされる。このエンティティ418は、文書コン
テンツ中の場所にリンクされる。また、418にて株価
検索の結果を挿入する代わりに、リクエスト416によ
り識別されたサービスが、文書マークアップ108とし
て挿入され、文書コンテンツ102内のその識別された
エンティティにユーザがアクセスするときに起動される
ようにしてもよい。
【0038】C.パーソナリティの作成と修正 この節は、個別のパーソナリティ、又はパーソナリティ
のグループ群の形成及び/又はカスタマイズに関連する
(なお「A及び/又はB」なる表現は、「A及びBの少
なくとも一方」を意味するものとする)。当業者なら
ば、ここに記載したパーソナリティの形成及び/又はカ
スタマイズのための複数の異なる方法が、それぞれ個々
に用いられるほか、複数のものを組み合わせて用いるこ
ともできることを理解できるであろう。
【0039】図5は、図2に示されるメタ文書サーバ2
00に直接的にアクセスするためのクライアントインタ
フェース1010を例示した図である。このようなクラ
イアントインタフェースは、ユーザコンピュータ226
やモバイル・コンピューティング・デバイス219で動
作させることができる。ある形態では、クライアントイ
ンタフェース1010は、従来のインターネット又はウ
ェブのブラウザにて、メタ文書サーバ200のアドレス
(例えばURL)を指定することにより呼び出される。
別の形態では、クライアントインタフェースは、例えば
アプリケーションに特化したプログラムを用いてアクセ
スされるようにしてもよい。
【0040】ユーザ管理部214を介してログイン画面
(図示省略)にログインした後、ユーザは、メタ文書デ
ータベース202にアップロードされ格納されるべき文
書の位置を欄1012に指定することが可能になる。1
012に示される指定された参照文書が文書データベー
ス202にアップロードされ格納された後、パーソナリ
ティウインドウ1014からパーソナリティ1016が
選択される。
【0041】パーソナリティ1016が選択されると、
メタ文書サーバは、そのパーソナリティに指定される文
書サービスに従って、即座に、又は後の時点で、あるい
はその両方で、アップロードされたその文書のコンテン
ツを後で示す方法で拡充する。文書コンテンツが、選択
されたパーソナリティに示される文書サービスにより即
座にアノテーション付けされる場合は、結果がウインド
ウ1018と、ウインドウ1020のグローバル・サー
ビス結果に表示される。
【0042】ウインドウ1014内のパーソナリティ
は、プライベート(個人)のパーソナリティ、共有のパ
ーソナリティ、又は公共のパーソナリティなどの様々な
観点で整理することができる。これらのパーソナリティ
は、図2に示したパーソナリティデータベース212に
記録されている。共有のパーソナリティには、様々な異
なるアクセス権限(例えば、あるユーザたちにはパーソ
ナリティの読み出しと修正を許可し、他のユーザにはパ
ーソナリティの読み出しのみを許可するなど)を付与す
ることができる。
【0043】さらに、ウインドウ1014では、1又は
複数のパーソナリティを選択し、アップロードされた文
書を、それらパーソナリティを用いて同時に拡充するこ
とができる。1つの例では、これは、図5のアナリスト
パーソナリティ1016に示されるように、1つのパー
ソナリティ、又は複数のパーソナリティを含むフォルダ
を選択することにより達成される。また、アップロード
された文書コンテンツに適用されるべき特定のパーソナ
リティ群を選択できるようにすることもできる。図6
は、図5に示したウインドウ1014の建築パーソナリ
ティについての部分を拡大して示した図であり、ここで
は藁梱製の家とタイヤ製の家のパーソナリティ110
2,1104が選択されている。
【0044】インタフェース1010上でボタン102
2を押下することにより、ユーザにプロパティウインド
ウが表示される。図7は、図5でプロパティ・コンフィ
ギュレーション ボタン1022が選択されたときに表
示されるプロパティウインドウ1210の例を示す図で
ある。ウインドウ1210では、ユーザは、1212を
選択することでデフォルトのパーソナリティを指定する
か、1214を選択することで文書がメタ文書サーバ2
00にアップロードされたときに推薦されたパーソナリ
ティを得るか、のいずれかを選ぶことができる。ユーザ
が使用可能な1212のデフォルトパーソナリティに
「なし」があり、これが選択された場合、ユーザは、文
書のアップロードの後でウインドウ1014から手動で
パーソナリティを指定するように要求される。さらに、
プロパティウインドウ1210は、ユーザが、ボタン1
216を選択することで、特定のパーソナリティの作成
又は修正(又はその両方)を行えるようにしている。こ
の点についての詳細は、以下に説明する。
【0045】C.1 概要 パーソナリティの作成/修正についての1つの実施例で
は、図7に示すボタン1216が選択されると、図8に
示すような2つのサブウインドウ1312及び1314
を備えるウインドウ1310が現れる。第1のサブウイ
ンドウ1312は、すべての使用可能なパーソナリティ
のリストを表示し、第2のサブウインドウ1314は、
サブウインドウ1312から選択されたパーソナリティ
に対して使用可能なサービスのカテゴリ群のリストを表
示する。図8に示した例では、1316の「ビジネスウ
ォッチング(動向観察)」パーソナリティが選択されて
いる。サブウインドウ1314に示される各カテゴリ
は、ユーザが1又は複数の特定の文書サービス(例えば
情報検索サービス1318)を指定できるように、選択
可能となっている。
【0046】図9は、特定のカテゴリ群に対してサーチ
が選択できる情報検索サービス1318のウインドウ1
400を例示している。図9に示される例では、140
4及び1408にそれぞれ示されるコンピューティング
と人々のカテゴリが選択されている。拡充の処理の間、
それら選択されたサービスのみが呼び出される。さら
に、サービスによって実行されるサーチも、指定された
カテゴリの範囲に限定される。すなわち、選択されたサ
ービスにより実行されるサーチは、情報コンテンツにつ
いての情報プロバイダのディレクトリ(例えばGoogle(T
M))での、指定されたカテゴリに限定される。例えば、
サービス1408は、情報プロバイダ「Google」のコン
テンツの「人々」カテゴリに限定される。
【0047】さらに、図9の例では、選択されたサービ
ス群が、更新(リフレッシュ)指定1450にて、定期
的に、すなわち例えば1452〜1455にそれぞれ示
すように毎日、毎週、毎月、または自動的に、更新され
るように指定できる。1455の自動的更新の期間は、
例えば、(a)ブラウザのアクセスログの履歴(例えばユ
ーザが最近当該サービス群のアドレスにアクセスしたの
はいつかなど)や、(b)サービスから受け取る結果をあ
る期間にわたって監視し、その応答の頻度が変化する
と、より頻繁に更新するようにその更新期間を設定する
方式、などを用いて(あるいはそれらを組み合わせて)
求めることができる。また、選択されたサービスは、1
451及び1456にそれぞれ示すように、全く更新し
ない(すなわち一回の動作を実行する)、またはあらか
じめ指定された期間の終わりまで(例えば2003年ま
で)更新する、などというように指定することもでき
る。図示しない別の例では、選択されたサービスに対
し、ある指定された目的が期限切れになるまで(例えば
人が未成年の間)更新されるように指定することもでき
る。図示しないさらに別の例では、選択されたサービス
に対し、関係のある結果が得られなくなるまで更新され
るように指定することもできる。また、図9の例では、
各サービスに対して1440にてコストを規定すること
ができる。この例では、1442では無料の指定がなさ
れ、1444では支払いを行う旨の指定がなされてい
る。後者の支払いについては上限額を規定することがで
きる。
【0048】パーソナリティの作成/修正のための別の
例では、図7のウインドウでボタン1216が選択され
たときに、図10に例示するようなウインドウ1502
が表示される。この例では、ユーザは、1504でパー
ソナリティの名前を指定することができ、この指定した
パーソナリティを、(a)1506にて、既存のパーソナ
リティに修正を加える方式、又は(b)1508にて、選
択されたファイル及び/又はフォルダの組を利用する方
式、(c)1510にて、選択されたファイル又はウェブ
サイトからのコンテンツを用いる方式、のいずれかの方
式によって作成することができる。
【0049】C.2 代数演算の利用 1つの実施例では、図10の1506での修正にて、代
数演算を用いて既存のパーソナリティ群から所望のパー
ソナリティを作成することにより、所望のパーソナリテ
ィを指定することができる。2以上のパーソナリティの
組をマージ(結合)したり、加算したり、減算したり、
組み立てたり(すなわち組立演算子を用いて複数のパー
ソナリティを組み立てた場合、1つのパーソナリティの
結果を他のパーソナリティの入力として用いることがで
きる)、交差(共通部分抽出)したりするなどの代数演
算により、パーソナリティを作成することができる。例
えば、きわめて包括的・一般的な「テクノロジーウォッ
チ(動向観察)」パーソナリティには、コンピュータサ
イエンスへの参照(リファレンス)を含めないことが望
ましい。図11は、複数のパーソナリティ同士を160
2により加算したり、1604により一方から他方を減
算したりして、新たな修正されたパーソナリティを形成
するためのユーザインタフェース1600の例が示され
ている。
【0050】1つの実施例では、パーソナリティはサー
ビスSと語彙集Lのタプル(すなわち複数の要素からな
る順序付きの集合)[SI,LJ]の集まりを用いて定義
される。第1のパーソナリティAと第2のパーソナリテ
ィBのマージは、Aのタプル[SI A,LJ A]とBのタプ
ル[SK B,LM B]との合併(論理和)を形成することに
より、形成することができる。それらパーソナリティ内
のどのサービスSI A,SK Bも同じ場合は、新たなサービ
スが[SI A,LN]を構成する。ここで、LNはLJ AとL
M Bの合併である。さらに、第1のパーソナリティAか
ら、既存のパーソナリティBを削除して、新たなパーソ
ナリティを作成することにより、第1のパーソナリティ
Aに限定を加えることができる。これには、例えば、
(a)パーソナリティA及びBの両方で同じサービスをす
べて削除する処理、又は(b)そのサービスに対応する語
彙集LAから語彙集LBを減算する処理、又はその両方の
処理を行えばよい。また、選択されたパーソナリティ内
のサービス群に対し、後で概説する技術を適用すること
で、新たなパーソナリティのサービス群を選択及び/又
は組織することもできる。
【0051】C.3 リンクのリストの利用 別の実施例では、メタ文書サーバは、パーソナリティ
を、指定された文書又はこれに対する参照の組を用い
て、オン・デマンドで自動的に生成する。例えば、文書
の組は、あるパーソナルコンピュータの中のあるフォル
ダにあるすべてのファイルを用いて規定することができ
るであろう。ここで、それらファイルの集合は、他のコ
ンテンツに対するリンク又は参照を表すテキストコンテ
ンツを含み得る(例えばハイパーリンクを用いるな
ど)。また、文書の集合は、SQLクエリーのようなあ
らかじめ規定されたクエリー(問い合わせ)を用いるこ
とで、特定することができる。またさらに別の例では、
文書の集合は、メタ文書情報空間内のすべての文書を含
み得る。
【0052】有利なことに、生成されたパーソナリティ
群はユーザ中心的なもの(ユーザを中心としたもの)に
なっている。これは、それらパーソナリティ群が、ユー
ザによって明示的に選択された情報を基礎にしているか
らである。1つの例では、このパーソナリティ自動生成
のためのサービスは、ウインドウ1502の1508で
呼び出される。ユーザが1509により文書の集合を指
定し、1512によりそのサービスのリクエストを起動
すると、図12に表されたフロー図に示されたプロセス
が、メタ文書サーバによりパーソナリティ生成のために
実行される。別の例として、メタ文書サーバが、例えば
サーチなどで特定された文書の集まりを受け取り、自分
でこのプロセスを利用するような例も可能であることが
理解できるであろう。
【0053】まずステップ1702において、パーソナ
リティ作成プロセスが、特定の文書の集合、及び/又
は、文書の集合を含んだフォルダ群、を取得する。この
文書の集合は、レベルN=0の文書集合と規定される。
ステップ1704では、レベルNの文書集合から、すべ
てのリンクが抽出される。ステップ1706では、それ
ら抽出されたリンクが指し示すコンテンツがフェッチ
(取り込み)され、レベルN+1の文書集合を規定する
のに用いられる。ステップ1708では、更に下のレベ
ルまで降りる必要がある場合はステップ1704に戻
り、そうでない場合はステップ1702〜1706によ
り規定されたレベルNの文書集合を用いて拡張文書が規
定される。
【0054】もっと包括的に言えば、N文書集合の集ま
りが、拡張文書として参照される。この拡張文書は、文
書群のリストとして見ることができ、ユーザに選択され
た文書群と、これら選択された文書にリンクした文書群
とから構成される。図13は、拡張文書1800の例を
示しており、この例ではレベルN=0の文書集合180
1から2レベル降りることによって求められる拡張文書
を示している。すなわち、拡張文書1800は、レベル
N=0の文書集合1801と、レベルN=1の文書集合
1803と、レベルN=2の文書集合1805とから構
成されている。この例では、レベルN=0の文書集合1
801は、3つのリンクを持つ単一の文書から構成され
ており、各リンクはレベルN=1の文書集合1803の
文書を参照している。
【0055】図12及び図13を参照すると、エンティ
ティ抽出部1802は、ステップ1710にて、拡張文
書1800(これはエンティティ抽出部が作成すること
もできる)を用いてエンティティデータベース1804
を構築する。エンティティ抽出部1802は、人や製
品、都市の名前、日付、名詞句などのエンティティタイ
プを抽出するための包括的なルールを有している。この
包括的ルールは、エンティティそれ自体を特定するもの
ではなく、例えば、指定された英語名詞の周囲の文脈を
用いて、先頭が大文字になったその英語名詞は都市の名
前よりも人の名前である可能性が高いことを検出できる
といったような、包括的エンティティを特定するもので
ある。
【0056】更に、抽出されたエンティティには、その
エンティティが参照を行った場所を逆に指し示すよう
に、索引付けがなされる。更にエンティティデータベー
スは、そのエンティティの利用に関連する文脈情報を含
む。
【0057】次に、エンティティデータベース1804
は、サービス生成部1806により利用され、これによ
り文書サービス群(すなわち文書サービスリクエスト
群)1808を生成する。エンティティデータベース1
804と文書サービスリクエスト群1808との組合せ
は、次に、新たなパーソナリティを規定するのに用いら
れる。そして、この新たなパーソナリティを、メタ文書
サーバにアップロードされ上述のように拡充された文書
に対し、適用することができる。
【0058】ステップ1714では、サービス生成部1
806が、拡張文書1800内のすべて問合せ(クエ
リ)可能なフォーム(書式)を識別し、抽出する。問合
せ可能なフォームは、例えば、1又は複数のタグにより
識別することができる。1つの例では、拡張文書180
0の各ページは、XML(eXtensible Markup Language)
及びHTML(HyperText Markup Language)のフォーム
を見つけるためにスキャンされる。例えば、フォーム
は、トグルボタンやメニューなどの選択フィールドや入
力フィールドを含んでいる。HTMLのフォームは、例
えば、W3C(WorldWide Web Consortium)による「XF
orms 1.0」(これはインターネット上ので公開
されている)に説明されている。
【0059】ステップ1716では、サービス生成部1
806は、識別した各フォーム毎に、少なくとも1つの
サービスを作成する。1ページに複数のフォームが含ま
れる場合は、サービス生成部1806は、それから生成
される可能性のある異なるすべてのクエリ組合せのため
に、複数のサービスを生成することになる。サービス作
成のための動作については、以下に更に詳細に説明す
る。
【0060】ステップ1716では、サービス生成部1
806は、ステップ1714で作成されたサービスのう
ち、あまり有用性の向上をもたらさなさそうものをフィ
ルタリングにより取り除く。有用性の向上にあまり又は
全く役に立たないサービスは、結果を全く返さないか、
あるいは関係のない結果を返す。(フォームから引き出
された)サービスをパーソナリティに組み込むことの有
用性を測定する方法については、後で説明する。どのア
プローチ手法も、ブール空間(Boolean space)又はベク
トル空間の検索モデルに依拠する。
【0061】最後に、ステップ1718で、フィルタ済
み(すなわちフィルタリングで除去されずに残った)サ
ービス群とエンティティデータベースとを用いてパーソ
ナリティが規定される。エンティティデータベース内の
エンティティは、そのエンティティに関連したサービス
を用いて(例えば単語の有用性を測定するなどにより)
測定された有用性を提供するタイプのエンティティに限
定されている。更なる改良として、サービスは、そのサ
ービス自身が付加価値をもたらす(例えば、関連する結
果を返すなど)ことができるエンティティタイプに関す
るものに限定することもできる。情報プロバイダについ
て質問するサービスなどのサービスを実行した後の結果
をフィルタリングしランク付けすることにより、関連す
る結果又は付加的有用性を求めることができる。
【0062】1つの実施例では、そのサービスについて
パーソナリティを付加する対象である文書コンテンツに
関連した情報プロバイダからクエリーに対して返される
結果のフィルタリング及びランク付けは、以下の手順で
行われる。すなわち、その情報プロバイダーから、サマ
リー(要約)群とハイパーリンク群を関連性に従って順
に並べたリストを取得し、クエリーが対象としている
(向けられている)文書コンテンツに含まれるエンティ
ティ群の周囲の文脈と、そのサマリー群との間の類似度
計算を実行し、計算した類似度に基づき結果をランク付
けし、最高度のランクの結果のみをフィルタリングによ
り取り出す。
【0063】別の実施例では、サマリー群に加え、ハイ
パーリンク群により参照される文書コンテンツも用いて
類似度計算を実行する。また、情報プロバイダから取得
したコンテンツと、関連する文書コンテンツとの間の類
似度を、コサイン距離法(cosine distance metric)や相
関度を用いて測ることもできる。
【0064】当業者ならば分かるように、コサイン距離
法を用いる前に、文書コンテンツは特徴群(例えば単語
や、単語からなる句)に変換され、ステミング(stemmi
ng:語の基底形・語幹などから変化形を求めること)処
理される。またこれも当業者なら分かるように、距離測
定は、最初に抽出した特徴群をLSI(Latent Semantic
Indexing:潜在的意味インデキシング法)により縮小特
徴空間をなすように再マッピングしたものに基づき実行
することができる。
【0065】1つの実施例では、ステップ1716での
フィルタリングにより得られたサービス群をステップ1
718でパッケージ化することにより作成されたパーソ
ナリティは、それらサービス群のハイパーリンク群を用
いて、ランク付けされ、階層的に複数のグループへ分か
れるように組織化される。このようなランク付け及び組
織化は、公知のランク付け技術、(凝集的)クラスタリ
ング技術、又はハイパーリンク技術を用いることで実行
することができる。ハイパーリンク技術の一例は、Klei
nbergによる"Authoritative Sources In A Hyperlinked
Environment"(ハイパーリンク環境における確かなソ
ース),IBM Technical Report RJ 10076,May 1997 に開
示されている。
【0066】別の実施例では、ステップ1702で指定
された、ハイパーリンクを持つ文書群の組織構造は、ス
テップ1718において1又は複数のパーソナリティを
作成するのに用いられる(例えば、文書群の階層構造の
集まりの中の各枝に対し、パーソナリティが作成され
る)。これらのパーソナリティは、例えば、図6に示す
ように組織化することができる。当業者ならば分かるよ
うに、図12を用いて説明したステップ群は完全に、又
は部分的に自動化することができる。
【0067】別の実施例では、拡張文書1800は、包
括的パーソナリティを付加することによりさらに発展さ
せることができる。包括的パーソナリティは、例えば、
拡張文書の1又は複数のレベルに対し適用することがで
き、レベルN=0のオリジナルの文書コンテンツの周囲
の情報空間をさらに拡張する必要性が存在するか否かに
のみ依存している。例えば、1つの例では、包括的パー
ソナリティは、拡張文書が参照する文書の数が所定のし
きい値より少ない場合にのみ適用される。
【0068】C.3.1 サービス作成 1つの実施例では、ステップ1714で作成される各サ
ービスは、次の(a)〜(d)に示すプロパティ(特性)を持
つように作成される。すなわち、(a)サービスは、入力
として、例えば文書参照(例えばURL)により指定さ
れる新たなテキストセグメントを取り入れるように指定
される。(b)サービスは、その新たなテキストセグメン
トに含まれるエンティティやこれらエンティティのオフ
セット情報を認識したり、あるいは他のサービスから認
識されたエンティティやそれらの位置情報を取得したり
するためのメソッドを有する。(c)サービスは、その新
たなテキストセグメントから認識されたエンティティ
を、(i)検索で得たNレベルの文書集合のコンテンツの
概念(コンセプト)、(ii)認識されたエンティティとフ
ォームを含むクエリーの一例(すなわちそのために作成
した具体的な例)、(iii)(b)で認識したエンティティ群
とクエリー例(ii)に対する結果(書式を整え、フィルタ
リングされたものが望ましい)、のうちの少なくとも1
つと関連づけるためのメソッドを含む。(d)サービス
は、(b)で認識されたエンティティ群とそれら各エンテ
ィティの最初のオフセット情報とを有するリストと、
(c)で新たに関連づけされた情報とを返すメソッドを備
える。別の実施例として、指定されたハイパーリンクの
ためのサービスがすでに存在する場合には、新たなサー
ビスの生成は行わず、その既存のサービスを利用するこ
とも好適である。
【0069】ここで(c)(ii)の場合、フォームの例示は
次のように行われる。すなわち、もしそのフォームが1
つの入力フィールドを持ち、送信ボタンを全く持たない
か1つだけしか持たない場合、その入力フィールドに
は、認識された概念又はエンティティが入れられ、その
後フォーム送信プロトコル(例えばXForms1.0
に示されるGET又はPOST)がその入力された入力
フィールドに対して実行される。フォームが複数のフィ
ールドを持つ場合、認識された複数のエンティティ又は
コンセプト(概念)とそれらフィールドとの間で生じ得
るすべての組合せが、送信のために生成される。ここ
で、それらは返信のためのヌル(空白)でない結果を生
成するのみである。また、フォームの各フィールドに、
インターネット上の「www.roboform.com」に開示されて
いるような自動的な手法を用いて入力することもでき
る。
【0070】一例として、図14に示すような、入力フ
ィールド1901とトグルボタン1902〜1905を
持つフォーム1900を考える。この例では、フォーム
1900は、科学的題材についてのコンテンツプロバイ
ダのフロントエンドである。このフォームは、ユーザが
自分の質問(クエリー)を入力するためのテキストフィ
ールド1901と、ユーザがどのフォルダに関する質問
かをシステムに対して示すためのトグルボタン1902
〜1905(例えば全フォルダを示すトグルボタン19
02を選択すると、システムは当該コンテンツプロバイ
ダ全体をサーチする)と、を含んでいる。この例では、
図15に示される以下の4つのサービスが作成されるこ
とになる。各サービスは、入力フィールド1901と、
4つのトグルボタン1902〜1905の中の1つが選
択状態になったものと、を含む。各サービスは、特定の
エンティティタイプに関連づけられており、この特定の
タイプは以下に示す方法を用いて求められる。
【0071】C.3.2 フィルタリング・サービス 上で説明したようなフィルタリングの目的は、作成はし
たが全く又はほとんど役に立たないサービス群を除くこ
とである。更に詳しく言えば、エンティティデータベー
スと抽出されたサービスのリストとが与えられた場合、
サービスのリストの有用性を求めるためのものとして、
3つの異なる有用性測定手法を次に説明する。当業者な
らば分かるように、それら3つの有用性測定手法は、単
独でも、複数を組み合わせた態様でも利用できる。大略
的に言えば、各有用性測定手法は、エンティティデータ
ベース内のエンティティに対するそれらサービスの潜在
的な有用性に応じて、それらサービスをランク付けす
る。
【0072】第1の有用性測定手法を図16に基づき説
明する。図16には、ステップ1710で生成されたエ
ンティティデータベースを用いる、ステップ1714で
生成されたフィルタリングサービスのステップ1716
における動作についてのフローチャートである。まずス
テップ2140で、サービスのリスト(サービスリスト
と呼ぶ)とエンティティデータベースとを受け取る。エ
ンティティデータベースは、拡張文書における各エンテ
ィティの生起頻度の情報を含んでいるものとする。
【0073】各サービスは、コンテンツプロバイダから
提供される情報サービスへのアクセスのための手段を提
供する。そのサービスリスト内の各サービスによりアク
セスされるコンテンツプロバイ群により提供されるデー
タベース群のエンティティデータベースに含まれるエン
ティティの頻度が、ステップ2142〜2146で計算
される。より詳しく説明すると、ステップ2142〜2
146では、あるサービスに含まれる各エンティティの
頻度に関係する以下の統計量が計算される。すなわち、
(a) fij:エンティティ(すなわち「特徴」)fj を含
む、コンテンツプロバイダのデータベースCP_DBi
内の文書の数と、(b) wij:コンテンツプロバイダのデ
ータベースCP_DBi 内のすべての文書についての各
特徴fjの重みの総和、である。ステップ2144で
は、コンテンツプロバイダが、<エンティティ,頻度,
重み>の形式のタプルのリストとして表現される。ここ
で、頻度と重みは、それぞれ上で定義したfとwのこと
である。拡張文書は、同様のリストを用いて表現される
が、ただしこの場合は、fは当該エンティティが生起す
る(すなわち含まれる)文書の数を示し、wは各エンテ
ィティの全文書に対する重みの総和を示す。
【0074】1つの実施例では、サービス群におけるエ
ンティティの頻度に関連する情報は、システムを定期的
に走らせることにより、各サービス毎に取得することが
できる。このシステムは、各特徴fj についてコンテン
ツプロバイダCP_DBi で実行されるクエリーを作成
し、そのクエリーに対して返される結果からfij及びw
ijの値を抽出するという処理を実行する。fij及びwij
の値を抽出する手段は、ラッパーアプローチ(wrapper
approach)又は隠れマルコフモデル(HMM)を用いて
自動的に構築することができる。
【0075】ラッパーを生成する方法は、ヨーロッパ特
許出願 EP 1072985 A2に開示されている。ラッパー生成
に関する更なる情報は、チドロフスキ(Chidlovski)他
による“Automatic Wrapper Generation for Web Searc
h Engines”,Proc. 1st Intern. Conf. on Web-Age Inf
ormation Management, WAIM'2000, LNCS Series, Shang
hai, China, June 2000、“Wrapper Generation via Gr
ammer Induction”, 11th European Conference on Mac
hine Learning, ECML'00, Lect.Notes Comp. Science,
Vol. 1810, Barcelona, Spain, May 2000 に開示されて
いる。
【0076】別の実施例では、コンテンツプロバイダか
らサマリーをエクスポートしてサービス群におけるエン
ティティ群の統計量に関する情報を求めるために、ST
ARTSプロトコルを用いる。STARTSは、スタン
フォード大学がコーディネートしたインターネットサー
チのためのプロトコル案であり、私的及び公的な構成を
含んでいる。STARTSは、コンテンツプロバイダ
が、エンティティ統計量fij及びwijを含んだサマリー
をエクスポートすべきであると明記している。STAR
TSプロトコルの詳細は、グラヴァノ(Gravano)他に
よる“STARTS:Stanford Proposal for Internet meta-s
earching”,Proceedings of the 1997 ACMSIGMOD Confe
rence,1997 に開示されている。
【0077】ステップ2152では、いくつかのよく知
られた類似度測定手法を用いて、各サービスと拡張文書
との類似度が求められる。例えばコサイン距離測定法を
用いることができる。また、ステップ2152で類似度
を求めるのに相関法を用いてもよい。距離の計算に関す
る更なる背景情報を知るには、マニング(Manning)と
シュッツェ(Schutze)による“Foundations of Statis
tical Natural Language Processing”,MIT Press, 199
9などがある。
【0078】更に別の実施例では、エンティティとこれ
に対応する頻度(すなわちエンティティと重みについて
の類似度)を、LSI(潜在的意味インデキシング)を
用いてリマッピングすることで(LSIに関する背景情
報については、インターネットのhttp://www.cs.utk.ed
u/〜lsi/で入手できるDumas が作成した記事を参照され
たい)、縮小した特徴空間を規定するようにし、これに
より類義語や多義語(すなわち同じ語が文脈に応じて異
なる解釈を持つ場合)に関する問題を克服する。次にこ
の実施例では、この縮小した特徴空間の中で類似度計算
を行う。
【0079】ステップ2154では、先頭からN個のサ
ービス(すなわち類似度が高い方からN個)が、サービ
スとして選択され、新たなパーソナリティに組み込まれ
る。図17は、1つの拡張文書と2つのサービスA及び
Bがある場合のこの選択プロセスをグラフ表現した図で
ある。グラフの横軸はエンティティデータベース内の各
エンティティ(すなわちe1・・・en)を表しており、
縦軸は各エンティティの重み付き生起頻度を表す。ここ
に示した例では、サービスAの拡張文書に対する類似度
は、サービスBのそれよりも高いものになっている。
【0080】別の有用性測定法では、エンティティの統
計データを取得したあとで、図18に示すフローチャー
トで説明する有用性測定方法を用いて、リスト中のサー
ビスに対してランク付けを行う。図18は、ステップ1
716におけるフィルタリングサービスの処理方法を示
す。まずステップ2355で、サービスのリストとエン
ティティデータベースが取得される。ステップ2356
で、そのサービスリストの中で次のサービスが選択さ
れ、ステップ2357でエンティティデータベースから
次のエンティティが取り出される。ステップ2358で
は、選択されたサービスについてのクエリーが、上述の
ように選択されたエンティティを用いて作成される。ス
テップ2359では、そのクエリーがサービスに対して
送信される。ステップ2359におけるそのサービスの
結果のうちの先頭からN個を用いて、ステップ2360
にて、選択されたエンティティとそれら先頭からN個の
結果とに関係する文脈情報と、そのエンティティと、の
類似度が次式に従って計算される。
【0081】
【数1】 ここで、"entity"はエンティティデータベース内のエン
ティティの1つであり、"service"はサービスであり、"
doc"は先頭からN個の結果のうちの1つである。"Entit
yUtility( )"は"entity"と"service"との類似度測定値
(これが有用性に関係する)であり、"Similarity( )"
は"entity"と"doc"との類似度である。右辺の総和演算
は、そのサービスの結果のうちの先頭からN個の結果に
含まれる文書"doc" について行われる。
【0082】さらに詳しくいえば、上式の"entity"はエ
ンティティ文字列とその周囲の文脈の両方を示す。簡単
のために、1つのエンティティは拡張文書の中の1カ所
にのみ生起するものと仮定する。この場合、エンティテ
ィの周囲の文脈は、文や句などを区切る公知のパーズ
(構文解析)技術を用いて様々の方法で求めることがで
きる。例えば、エンティティの周囲の文脈を求める手法
には、(a)拡張文書の一部分を構成する1つの文書全体
のテキストコンテンツを「文脈」とする方法、(b)その
エンティティの文字列が生起する(すなわち、含まれ
る)文を「文脈」とする方法、(c)そのエンティティが
生起するパラグラフ(段落)を「文脈」とする方法、
(d)エンティティが生起するトピックテキスト(公知の
トピック(話題)検出技術を用いて検出することができ
る)を文脈とする方法、などがある。
【0083】また上式において、"doc"は、そのサービ
スの結果のページに(結果リストの要素として)現れる
文書サマリーか、又はそのサマリーの元になった文書全
体を指し示す。類似度計算は、どちらの形態を用いても
実行できる。この式では、各エンティティ(エンティテ
ィに文脈を付加したものとして表される)と結果文書"d
oc"(文書コンテンツ全体又はそのサマリーとして表さ
れる)とについての類似度が求められる。
【0084】このような類似度の計算のために、エンテ
ィティと結果文書はまず次のように処理される。(a)ス
トップワード(stop word)を除去し、(b)ポーターのステ
ミング手段(Porter's stemmer)のようなステミング技術
を用いて各単語のステミングを行う。つぎに、コサイン
法などの類似度測定法を用いて、エンティティと結果文
書との類似度をテキストの特徴群に基づいて計算する。
【0085】別の実施例では、LSIを用いてテキスト
の特徴群を縮小特徴空間に変換する。このLSI変換
は、上述のようにして抽出されたエンティティ頻度デー
タベースとエンティティとを用いて計算される。LSI
を用いて特徴群を変換した後、コサイン距離法などの類
似度測定法を用いて、エンティティ(及びその文脈)と
結果文書"doc"との類似度を計算する。
【0086】1つのエンティティが複数文脈で生起する
(すなわちそのエンティティは文書又は拡張文書内の複
数の場所に存在する)例では、エンティティとこれに対
応する文脈の各位置は、個別的に取り扱われる(すなわ
ち異なるのエンティティとして取り扱われる)。
【0087】ステップ2361でエンティティデータベ
ースの最後のエンティティについて調べ終わったと判定
すると、求めた類似度EntityUtilityを、選択したサー
ビスに関係するすべてのエンティティについて次式に従
って総和する(ステップ2362)。
【0088】
【数2】 ここで"E"はエンティティデータベース中のエンティテ
ィであり、"service"はサービスである。ステップ23
63では、この演算がすべてのサービスについて実行さ
れた場合、先頭からN個のサービスが、フィルタリング
結果のサービスを示すサービス有用度として最高度の有
用度を持つものとして選択される。そうでない場合は、
ステップ2356に戻ってリストの次のサービスを取り
出し同様の処理を繰り返す。
【0089】サービス群は、階層構造、フラット構造な
ど様々なやり方で組織化できる。これらのやり方で表さ
れたサービス群は、クラスタ化され、各クラスタからそ
れぞれ1つずつ代表サービスが選択される。この例で
は、エンティティデータベース内の各エンティティをそ
れぞれ1つの次元として、多次元グラフを規定する。拡
張文書及びサービス群において生起する各エンティティ
の頻度がそれぞれプロットされる。クラスタ群が形成さ
れ1つのサービスに関連づけられる。これらクラスタは
サービス群を階層的に組織化するのに用いることができ
る。
【0090】別の実施例では、ステップ2363の次
に、拡張文書に対し包括的サービスが提供される。この
包括的サービスは、拡張文書のコンテンツを用いて、特
定の主題に特化した情報プロバイダにではなく、汎用情
報プロバイダに対して質問を行う。上述の例ではすべて
のエンティティタイプについてのサービス有用性(Serv
iceUtility)を求めたが、別の実施例として、1つのエ
ンティティタイプについてのサービス有用性を計算する
こともできる。この実施例では、サービスの有用性を、
特定のタイプのエンティティに対して求めることもでき
る。例えば、図15に示したようにエンティティタイプ
「生物学」2002とサービス2004についてサービ
ス有用性が計算される。
【0091】C.4 予め定めたパーソナリティと知識
レベルの利用 さらに別の実施例では、ある分野における相対的な能力
または既存の知識レベルを図10の知識レベル選択部分
1516で指定してもよい。指定された知識レベル15
16は、例えば入力欄1504で指定された所定のパー
ソナリティから、レベルが異なる複数のサービスプロバ
イダにアクセスする新たなパーソナリティ群を作成する
のに用いることができる。例えば、医学情報を指向する
パーソナリティが指定されている場合において、誰かの
知識が初心者(すなわち一般人)レベルである場合、そ
のパーソナリティのなかで、より基礎的な情報プロバイ
ダが指定され、より基礎的で説明的なサービスが指定さ
れる。さらに、知識レベルは、パーソナリティの作成に
用いられるエンティティをエンティティデータベースに
入れたりエンティティデータベースから除いたりするの
に用いることができる。例えば、医学分野の専門家は、
当該分野の初心者が興味を持つであろうエンティティと
同じエンティティには興味を持たないであろう。
【0092】所望のパーソナリティの知識レベルを用い
るほかに、図10の1514に示されるように、要求さ
れるパーソナリティのタイプに対するヒント(すなわち
主題のヒント)を与えることもできる。ヒントを受け取
ると、メタ文書サーバは、所望のパーソナリティに対す
るヒントを、当該ヒントの主題に特に関連する1組の処
理に対して関係づける。一般に、ヒント1514は、図
10で指定されるパーソナリティ群を作成するための様
々な方法のどれを改良するのにも利用することができ
る。ヒント1514と知識レベルとは、個別に用いるこ
ともできるし、両者を組み合わせて用いることもでき
る。
【0093】1つの特定の例では、医学のパーソナリテ
ィのヒント1514がメタ文書サーバに対し、1508
のハイパーリンク又は1510の名前により指し示され
る文書コンテンツとともに指定された場合、メタ文書サ
ーバ200は、以下に示すものに関係するコンテンツを
拡充するサービスを指定することにより、パーソナリテ
ィを作成する。すなわち、(a) その文書コンテンツに言
及された薬剤についての一般的な製剤・調剤ガイドへの
アクセス、(b) その文書コンテンツに言及されている項
目とユーザとに関係する医学記録、(c) 医学データベー
スにある、その文書コンテンツに言及されている項目に
関連する画像やビデオクリップなど、(d) その文書コン
テンツに言及されたいずれかの病気の患者のコミュニテ
ィへのリンク、(e) その文書コンテンツに言及されてい
る製品の代替品、(f) オンライン薬局へのリンク(コネ
クション)、(g) その文書コンテンツに言及されるいず
れかのエリアにおける最新の研究へのリンク(コネクシ
ョン)、(h) その文書コンテンツに言及されているいず
れかの会社の情報、及び(i) その文書コンテンツ内にあ
る項目に関係するその他の医学的情報、などである。
【0094】別の特定の例では、建築のパーソナリティ
であるというヒント1514が与えられた場合、メタ文
書サーバ200は、1508のハイパーリンク又は15
10の名前により指し示される文書コンテンツを指定す
ることと、以下に示すものに関係するコンテンツを拡充
するサービスを指定することとにより、パーソナリティ
を作成する。すなわち、(a) その文書コンテンツに示さ
れる項目(例えば住所)に関する建築基準、土地使用区
分法規、不動産鑑定その他の法律関係文書、(b) その文
書コンテンツに言及された項目(例えば建物や資材)の
画像(写真、図面、青写真など)、(c) その文書コンテ
ンツに関係する記録(例えばソーシャル(社会)、施工
者、賃借権など)、(d) 類似の世界の建築物、そのよう
な建築物を建築している建築家、(e) 隣の建築物、テナ
ントなど、(f) ある条件(例えば地震や耐火性などにつ
いてのもの)のもとでのそのエリア(地区)/建築物の
シミュレーション、(g) その文書コンテンツに言及され
たエリアの地図、(h) その文書コンテンツに言及された
エリアに設けたセンサ装置(例えばウェブカメラ(web c
ams)、温度計など)、及び(i) その文書コンテンツに言
及された資材についてのコスト、供給業者、小売業者、
配送料、技術仕様、チュートリアル(教材)などであ
る。
【0095】C.5 情報抽出技術の利用 上に説明したメタ文書サーバは、複数の異なるサービス
の結果により文書コンテンツを拡充(例えばマークアッ
プ)する。例えば、サービスの結果は、文書のリスト、
要約のリスト、抽出された情報(典型的には極めて簡単
な構造的性質を持つ)などである。例えば、サービスの
結果は、株価検索、個人等の事跡の記載項目などを含
む。この節では、構造化されていないテキストからもっ
と洗練された性質を持つ情報を抽出する方法を説明す
る。質問回答システム(question answering)などの情報
抽出技術を用いて実現される。
【0096】ある情報抽出技術では、1つのパーソナリ
ティに関連する1又は複数の語彙集と共に用いることが
できる予め定められた質問群を用いて、パーソナリティ
群の作成及び/又は修正を行う。各質問フォームは、情
報検索と構文又はパターンのマッチング技術とを組み合
わせて利用した公知の質問回答システムを用いて、満足
される新たな文書サービスリクエストを作成するのに用
いられる。
【0097】1つの実施例では、質問フォームは、図1
0の1520でユーザが入力した質問を用いて自動的に
生成することができる。例えば、入力された質問が「肝
臓切除のための処置は何か」であり、1504で指定さ
れたパーソナリティが、"liver"(肝臓)という語を含む
身体器官の語彙を含んでいる場合、メタ文書サーバは、
1504の質問にある身体器官(例えば肝臓)を識別
し、その器官を指定の語彙の包括的シンボル表現に置き
換える。この例では、「肝臓」("liver")という語は
包括的シンボル<BODY_ORGAN>(身体器官)に置換され、
これにより「<BODY_ORGAN>(〈身体器官〉)の切除のた
めの処置は何か?」という質問フォームが作成される。
上述の例と同じ質問を用いて、指定されたパーソナリテ
ィにおいて規定されている代替用の語彙がいくつあるか
に応じて、代替的な質問フォームを形成することができ
る。したがって、同じ質問でありながら、異なる語彙を
用いることで、外科的処置の例を求めるために、「肝臓
の<SURGICAL_PROCEDURE>(〈外科的処置〉)のための処
置は何か」という質問フォームを規定することができ
る。
【0098】さらに別の質問フォームは、パーソナリテ
ィが身体器官と外科的処置の両方の語彙を含んでいる場
合、上述の同じ質問を用いて作成できる。この場合、
「〈BODY_ORGAN〉(〈身体器官〉)の〈SURGICAL_PROCE
DURE〉(〈外科的処置〉)のための処置は何か」という
質問フォームとなる。作成しうるすべての質問フォーム
が生成されると、各質問フォームは、パーソナリティに
対して新たな文書サービスとして付加される。付加され
た各文書サービスは、文書コンテンツ102又はマーク
アップ108において見つかるいずれかのエンティティ
を備える質問フォームの例を提示する(すなわち特定の
例を作成する)。ここでそのエンティティは、その質問
フォーム内の包括的シンボルにより識別される語彙にも
含まれる。例えば、文書コンテンツが、これもまた身体
器官の語彙の一部であるエンティティ「腎臓」("kidne
y")を含んでいるとする。この例の場合に例示される質
問は、「腎臓切除のための処置は何か?」というものに
なるだろう。一つの例では、結果として得られるこれら
の質問を有用性で評価する。
【0099】文書が、例示されたクエリーを含むパーソ
ナリティで拡充された場合、その例示クエリーを含む文
書サービスリクエストは、質問回答技術(question answ
ering technique)を用いて回答すなわち結果を作成する
ことにより、それを満足する。上述の例の回答は、「腎
摘出術(nephrectomy)」となるであろう。質問回答技
術の例は、2000年11月13〜16日に米国メリー
ランド州ゲーサーズバーグ(Geithersburg)で開催された
第9回Text REtrieval Conference(TRRC-9)の予稿集に
発表されたクーパー(Cooper)他による"A Simple Ques
tion AnsweringSystem"に示されている。
【0100】文書サービスリクエストが例示のクエリー
を満足する回答を求めると、その文書サービスは、当該
文書内の当該エンティティにその例示クエリーと回答と
をリンク付けすることにより、その文書を拡充する。上
述の例では、エンティティ「腎臓」("kidney")が、例
示クエリー(すなわち「腎臓切除のための処置は何か
?」)と回答(すなわち「腎摘出術(nephrectom
y)」)にリンクされる。1つの例では、例示クエリー
と回答は、図5に示すように、ユーザが認識したエンテ
ィティ1032の近くにポインタ1030を持ってきた
ときに、ポップアップウインドウ1028に表示される
(例えば図5の例では、認識されたエンティティ"Xero
x"と例示クエリー"What is <COMPANY NAME>'s stock pr
ice?"(<会社名>の株価は?))。
【0101】ユーザが指定した質問に対して複数の包括
的シンボルを付加できる場合は、ただ1つの文書サービ
スリクエストがただ1つのもっとも包括的な質問フォー
ム(例えば「<BODY_ORGAN>(身体器官)の<SURGICAL_PR
OCEDURE>(外科的処置)のための処置は何か?」)に対
して指定される、という選択肢をユーザに与えることも
可能である。また、識別した複数の質問フォームのすべ
て、又はそのうちの選択したものに対して文書サービス
リクエストが指定される、という選択肢をユーザに与え
ることも可能である。さらに、複数の回答と複数の情報
ソース(源)とを選択対象としてユーザに与えることも
できる。
【0102】図19は、例示クエリーに対する回答を識
別するための1実施例を示すフローチャートである。ま
ずステップ2402で、メタ文書サーバ200がその例
示の質問を受け取る。ステップ2404で質問のタイプ
が判定され、ステップ2406でクエリーへと変換され
る。ステップ2408では、識別した質問タイプを扱う
のに適した情報サービスに対して、そのクエリーが送信
される。ステップ2410では、そのクエリーについて
の先頭からN個の結果の部分が、例えばサマライザ(要
約システム)を用いて抽出される。ステップ2412で
は、そのクエリーに対し抽出された先頭からN個の結果
の部分に対し品詞タグが付加され、その部分に対して浅
い構文解析(shallow parse)が実行される。ステップ2
414では、抽出したクエリーについての先頭からN個
の結果であるパッセージ(一節)群に含まれる各語につ
いて、その具体例の質問と、判定した質問タイプとを用
いて、関連性の重みが計算される。ステップ2416で
は、抽出したパッセージ群に含まれる複数の文、又はそ
れらの文の部分において、計算した関連性の重みが最高
度である語群を持つものが、その例示の質問に対する回
答案として選択される。
【0103】C.6 ラーニング・パーソナリティの利
用 メタ文書サーバ200は、eラーニング(電子的学習)
パーソナリティを提供する。このパーソナリティは、例
えば、図5のパーソナリティウインドウ1014におい
て利用できる。eラーニングパーソナリティが文書に適
用されると、そのパーソナリティ内の各サービスは、そ
の文書のコンテンツを分析し、当該サービスに特有のエ
ンティティと概念と組合せ(コンビネーション)とを認
識する。そして各サービスは、それらエンティティ、概
念、又は組合せを、例えばウェブベースのデータベース
サーチにより見つかる新たなコンテンツにリンク付けし
たり、そのサーチを準備して、(クリック等により)ア
クティベートされるとそのサーチを実行するように設定
したリンクを挿入したりする。パーソナリティサービス
は、単純なサーチに限定されるものではなく、分析され
たコンテンツに依存するどんな処理でも実行することが
できる。
【0104】図20は、文書コンテンツを拡充するため
にeラーニング・パーソナリティが選択されたときに利
用できるサービスのリスト2502を示す。eラーニン
グサービス2504及び2506は、その文書内で見つ
かった単語、又は複数単語からなる表現を、その単語等
の定義や翻訳にそれぞれリンク付けする。このサービス
は、辞書にアクセスする前に、レンマ化(lemmatizatio
n:語の変化形(過去形など)から基底形を求めること)
やステミング(基底系から変化形を求めること)を実行
するようにしてもよい。さらに、このサービスは、その
コンテンツの要素の周囲の、それら単語又は複数単語表
現の文脈を用いて、表示される定義や翻訳の数を制限す
るように構成することもできる。別のeラーニング・サ
ービス2508は、各テキスト単位(すなわち文書、段
落、句、単語)を、その要素に関係するチュートリアル
にリンク付けする。さらに別のeラーニング・サービス
2510は、各テキスト単位を、識別された主題に関係
する専門家の情報にリンク付けする。さらに別のeラー
ニング・サービス2512,2514,2516は、各
テキスト単位を、そのテキスト単位の主題に関連するイ
ンタラクティブ講座、利用可能なオンライン講座、オン
ライン学習リソースに、それぞれリンク付けする。
【0105】有利なことに、パーソナリティは、指定さ
れた文書について、複数の独立した言語学習タスクを準
備し、実行する。文書コンテンツに対してパーソナリテ
ィが適用された場合、そのパーソナリティに含まれる選
択された各サービスは、その指定文書のコンテンツを分
析し、そのサービスに特有のエンティティや概念、組合
せを認識する。そしてこのサービスは、それらエンティ
ティ、概念、組合せを、例えばウェブベースのデータベ
ースサーチにより見つかる新たなコンテンツにリンク付
けしたり、又はそのサーチを準備し、(クリック等によ
り)アクティベート(起動)されるとそのサーチを実行
するリンクを挿入したりする。
【0106】1つの変形例では、eラーニングパーソナ
リティは、次のようなサービスを含むようにすることも
できる。すなわち、このサービスは、ユーザの過去の動
作を追跡して(あるいはユーザ・プロファイルにアクセ
スして)、同じエンティティが別の文書にリンク付けさ
れている場合には、新たな情報を生成する。e学習パー
ソナリティを言語の学習に特化した実施例も考えられ
る。この実施例では、メタ文書サーバ200は、この明
細書に示す文書拡充機構を用いた、コンピュータ支援に
よる言語学習環境を提供する。図21は、文書コンテン
ツ拡充のために言語学習パーソナリティが選択されたと
きに利用できるサービスのリスト2602の例を示して
いる。
【0107】さらに詳しく説明すると、言語学習パーソ
ナリティは、図21に例示されるサービスのうちの複数
を実行するパーソナリティを用いて規定される。図21
に示すサービスのリスト2602には、以下に示すもの
が含まれる。(a) サービス2604及び2606:これ
らは、その文書内で見つかった単語、又は複数単語から
なる表現を、その単語等の定義や翻訳にそれぞれリンク
付けする(このとき、例えば、辞書にアクセスする前に
レンマ化やステミングを実行したり、その要素の文脈を
用いて表示する定義の数を制限したりすることも可能で
ある)。(b) サービス2608: これは、各文や各句
を、それら各文や句の構造の文法的説明にリンク付けす
る(このとき、読者の母国語によるその構造の文章での
説明や、その構造に対応する文章、音声、映像での文法
レッスンにリンク付けすることも可能である。(c) サー
ビス2610:これは、単語や複数単語表現、句、文な
どの各テキスト単位を、同じテキスト単位が現在のもの
とは異なる文脈に現れる例に対してリンク付けする(例
えば、同じテキスト単位をもつ、似ているが異なるテキ
スト部分を検索するなどにより行う。検索された要素
(テキスト単位)は、異なる文脈の比較が容易にできる
ように、例えば注目している類似の構造がユーザの視野
の中央部にくるようにした書式で、提示される)。(d)
サービス2612:これは、単語や複数単語表現、句、
文などの各テキスト単位を、当該要素に関係するインタ
ラクティブ文法演習にリンク付けする。(e) サービス2
614及び2616:これは、当該文書コンテンツに対
応したコンテンツ固有の言語教習リソースにリンク付け
する。他の学習トピックについても、類似のアプローチ
をとることができる。
【0108】C.7 コンテンツの自動的な挿入及び/
又はリンク付け 図7には、表示欄1220に、文書拡充を、リンク(1
222)によって行うか、コンテンツの挿入(122
4)によって行うか、リンクかコンテンツ挿入かを自動
判定する(1226)かを選択的に指定するための仕組
みを例示している。どちらのケースでも、リンクは、文
書コンテンツ102において認識されたエンティティか
ら、リモートの場所(1222の場合)にあるコンテン
ツ又はサービスへ、又はメタ文書の文書マークアップ1
08にあるコンテンツへと引っ張られる。
【0109】図22に示す別の実施例では、ユーザが、
指定されたコンテンツや文書から認識されたエンティテ
ィに対するパーソナリティ及び/又はサービスの振る舞
い(service behavior)を、選択的に指定できるようにす
る。この実施例では、例えばユーザは、図5に示される
拡充された文書1018の一部分を選択し、例えばグロ
ーバル・サービス結果における株価検索の結果1026
を選択することができる。この一連の動作の結果、公知
のポインタ選択技術により、図22に示される株価検索
オプション設定ウインドウ2710が表示される。
【0110】オプション設定ウインドウ2710では、
ユーザは、特定のサービスの振る舞いを適用する適用先
を、入力欄2712にて、選択されたすべての文書、現
在選択されている1つの文書、又は選択のみ、のいずれ
かに指定することができる。さらに、オプション設定ウ
インドウ2710により、ユーザは、入力項目2716
で指定された形式で挿入された、リンクされた情報を、
静的なものとするか、動的に更新するかを、入力項目2
714にて指定することができる。例えば、情報は、上
述のようにリンクとして、又はコンテンツとして、挿入
される。挿入されるコンテンツは、脚注として、又は文
書の末尾のコンテンツリストの1つとして、挿入するこ
とができる。動的にアクセスされるコンテンツは、リン
ク又はコンテンツがアクセスされるたびごとに、再計算
される(これには例えばマイクロソフト社のOLEのよ
うな手法を用いることができる)。静的にアクセスされ
るコンテンツは、入力項目2718で指定された周期
(例えば一月ごと、一日ごと、一時間ごと)で再計算さ
れる。
【0111】有利なことに、ユーザはサービスのデフォ
ルトの振る舞いを修正することができる。このとき、変
更を、ユーザが管理するすべての文書に適用するか、、
現在(カレント)の文書のみに適用するか、1又は複数
の識別されたエンティティを含む文書の現在の選択に適
用するか、を指定する。それら変更は、変更のレベルに
応じて、特定のメタ文書のプロパティとして、又はユー
ザのプロファイルの一部として、格納される。
【0112】リンク付けするか、コンテンツを検索しメ
タ文書に挿入するかは、各パーソナリティごとに指定で
き、また図22の入力項目2724又は図7の入力項目
1226で指定されればそれを自動的に判定するように
することもできる。リンク付けするかコンテンツを挿入
するかの自動判定は、そのユーザのメタ文書サーバ20
0との過去のインタラクションの履歴からの情報を用い
て実行される。入力項目2724にて指定のパーソナリ
ティに、又は入力項目1226にてあるパーソナリティ
のプロパティとして、リンク付け又はコンテンツ挿入を
自動的に行うことが指定されている場合、情報をリンク
として挿入するかコンテンツとして挿入するかの判定
が、その情報がユーザのインタラクションの履歴の中に
あるか外にあるかに応じて行われる。もしユーザのイン
タラクションの履歴の外にある場合は、リンクが挿入さ
れる。一方、ユーザのインタラクションの履歴の中にあ
る場合は、コンテンツが検索されメタ文書に挿入され
る。
【0113】ユーザのインタラクションの履歴は、ユー
ザによりアクセスされたリンクの履歴を用いて、又はそ
のユーザにとって興味のある概念のリストを用いて、あ
るいはそれら履歴及びリストの両方を用いて、特定する
ことができる。ユーザにとって興味のある概念のリスト
は、例えば、頻繁にたどられるリンクを用いて、又は電
子メール履歴を記録することにより作成されたユーザプ
ロファイルから、又は、Xerox社が開発した"Knowledge
Pump"(知識ポンプ)のようなリコメンダ(推薦)シス
テムを用いて、求めることができる。このような処理モ
ードでは、エンティティ閲覧パターンからのユーザのイ
ンタラクション履歴からの情報は、文書コンテンツを拡
充するか否かを判定するのに用いられる。
【0114】C.8 テキスト・カテゴライザ 図23に示されるテキスト・カテゴライザ(カテゴリ分
けシステム)3610のようなテキスト分類システムの
目的は、文書3612を1又は複数のクラス3620の
組へと分類することである。クラス3620は、カテゴ
リーとも呼ぶ。動作としては、テキスト・カテゴライザ
3610は、1つの文書に対して、クラスの集合に含ま
れる1又は複数のクラスを割り当てる。ここで、これら
クラスは、知識ベース3622内に表現されたオントロ
ジー((ontology:存在意義、存在論)の中で規定され
る。オントロジーの一例としては、DMOZオントロジ
ー(インターネットのdmoz.orgに公開されている)があ
る。
【0115】更に、テキスト・カテゴライザ3610は
前処理モジュール3614と概略推論(approximate rea
soning)モジュール3618を備える。テキスト前処理
モジュール3614の目的は、テキスト・カテゴライザ
3610が文書分類のタスクを正確に、自動的に、効率
的に、効果的に実行できるような形態に、文書3612
を変換することである。前処理モジュール3614で作
成された文書表現3624は、特徴とこれに関係する重
みとの組を含んでいる。
【0116】HTMLからテキストへの翻訳、トークン
化(tokenization:字句解析)、ステミング、ストップ
ワード除去、構文解析技術、エンティティ認識、などの
自然言語処理分野の公知技術の異なる複数の組合せを、
特徴3624の集合を生成するのに用いることができ
る。したがって、テキスト前処理モジュール3612
は、文書3612から特徴3616の集合を生成するた
めに、HTML・テキスト・コンバータ、トークン化手
段、ステミング手段、文法ベースの特徴生成手段、特徴
生成手段、単語頻度分析手段、名詞句分析手段(又は抽
出手段)のようないくつかのコンポーネントを備えるよ
うな構成とすることができる。
【0117】各特徴に関連する重み値は、正規化頻度計
数(normalized frequency count)からもっと高度な重み
付け方式までの、公知の様々な方式のどれを用いても計
算できる。高度な重み付け方式では、文書内の各用語の
頻度、位置、リファレンス(基準)コーパスにおける各
用語の頻度、用語のidf(inverse document frequenc
y:文書群において、あるキーワードが多くの文書中に
現れる普遍的なキーワードだった場合には idf は小さ
くなり、逆に、特定の文書にしか現れない場合には idf
は大きくなる)などの様々な測定値の集まりに基づ
き、ケインさんを行う。マニングとシュッツェによる教
科書“Foundations of Statistical NaturalLanguage P
rocessing”,MIT Press, 1999,Cambridge, MAには、モ
ジュール3614により実行されるテキスト前処理の更
に詳細な説明が示されている。
【0118】概略推論モジュール3618は、知識ベー
ス3622に格納されたルール(又は他の知識形式)の
用語群にて表現されるようなカテゴリ群を、文書表現
(例えば特徴とこれに対応する重み)3624と関連づ
けて処理することで、入力文書3612に対しクラスラ
ベル3620を割り当てる。1つの実施例では、前処理
モジュールが、文書3612を、スペースや句読点文字
などにより区切られたトークンのリストに変換する。ス
トップワード(すなわちカテゴリ分けの質を高めない
語)に対応するトークンは、そのトークンのリストから
除かれる。そのリストに残ったトークンに対し、ポータ
ー(Porter)のステミングアルゴリズムを用いてステミン
グが施される。そして、このステミング結果の単語リス
トからストップワードが除去され、用語/単語のリスト
ができる。最後に、この用語のリストが、<用語,頻度
>タプルから構成される頻度分布に変換され、用語(す
なわち文書表現3624)の集合を規定する。ここで、
頻度は、その文書においてその用語が現れる回数を示
す。
【0119】次に、概略推論モジュール3618は、知
識ベース3622にアクセスする。ここで、知識ベース
3622は変数(すなわち文書特徴とこれに関連する頻
度)を記録する。この変数は、文書3612、又は該文
書を変換した表現3624から、オントロジーのクラス
への写像を形作る関数を定義するのに用いられる。この
ような知識ベースの1つの例は、それら記録される変数
同士の関係を記述するルールの集合を用いて表現され
る。典型的には、各クラスは1つのルールによって表現
される。その関数を写像する際、推論エンジン3618
は、文書を、知識ベース3622に格納された各クラス
ルールと照合し、どのアクションを信頼すべきかに関す
る結論を引き出すのに意志決定手段(decision maker)
を用いる。
【0120】知識ベース3622と概略推論モジュール
3618とによって表わされるような機能は、以下に示
すものを含んだ様々なモデルタイプを用いて規定するこ
とができる。すなわち、確率モデル、ファジー集合/フ
ァジー論理モデル、ブール値論理モデル、最近隣接アプ
ローチ(nearest neighbor approach)、及びニューラ
ルネットワーク、などである。なお、これらのうちのい
くつかについては、後で詳しく説明する。
【0121】図23に示した要素の他に、カテゴライザ
3610に学習モジュールを設けることもできる。学習
モジュールの正確な構成は、文書の集合をカテゴリのリ
ストに写像(マッピング)するために概略推論モジュー
ル3618に使用されるモデル(確率モデル、ファジー
モデルなど)に依存することになる。学習モジュール
は、各クラスごとに分類された文書の例を入力とし、こ
れに対応する知識ベースを生成する。
【0122】C.9 パーソナリティの推薦 メタ文書サーバ200は、図2に示したパーソナリティ
推薦部216により、パーソナリティを推薦するサービ
スを提供する。1つの例では、パーソナリティは、ユー
ザがメタ文書サーバ200にアップロードし、図7に示
すパーソナリティ・プロパティ1214をそのユーザが
選択した後に、各文書毎に推薦される。ユーザがパーソ
ナリティ・プロパティ1214を選択すると、パーソナ
リティ推薦部216は、ユーザによってアップロードさ
れた各文書毎に、パーソナリティを推薦する。パーソナ
リティを推薦することにより、パーソナリティ推薦部2
16は、ユーザの支援を行う。すなわちこの支援処理で
は、ユーザが、アップロードされた文書(アップロード
文書と呼ぶ)の文書コンテンツとその他の文脈情報(例
えばその文書に対してなされたアクション(操作・処
理))を分析して、そのアップロード文書に対して複数
の文書拡充テーマのうちのどれを適用すべきかを判断す
ること、を支援する。
【0123】1つの実施例では、パーソナリティ推薦部
216に推薦されたパーソナリティは、ユーザの確認な
しにアップロード文書に対して自動的に付加され、これ
ら文書は即座にメタ文書サーバによって拡充される。ま
たこの代わりに、推薦されたパーソナリティが受け入れ
可能であるとの確認をユーザが行った後に限り、パーソ
ナリティ推薦部216によって推薦されたパーソナリテ
ィをメタ文書に付加するようにしてもよい。
【0124】どのパーソナリティ(又は複数のパーソナ
リティ)を文書に付加するものとして推薦するかを決定
するために、メタ文書サーバ200は、アップロード文
書3712をパーソナリティ推薦システム216の入力
として用いる。このパーソナリティ推薦システムの一例
を図24に詳細に示す。大略的に言えば、図24に示す
パーソナリティ推薦システム3700は、図23に示し
た文書カテゴライザ3610に似ている。両者の相違
は、後者が1又は複数のカテゴリを含むリストを割り当
てるのに対し、前者は1又は複数のパーソナリティ37
20を含むリストを割り当てる点である。パーソナリテ
ィ推薦部3700は、パーソナリティを推薦するためル
ールや、メタ文書サーバ200に対して既にアップロー
ドされユーザからパーソナリティの付与を受けている文
書を用いてパーソナリティ・オントロジーを進化させる
ためのルールを学習することができる。
【0125】更に詳しく言えば、図24に示すパーソナ
リティ推薦システム3700は、図23に示したテキス
ト・カテゴライザの変形である。知識ベース3722
は、(例えば、適用されうる各パーソナリティごとに手
動で選択された特徴と重み付けを用いて)ユーザ固有の
パーソナリティ又は一般に利用可能なパーソナリティを
含むパーソナリティデータベース212からのデータ
と、それらパーソナリティが過去に割り当てられたメタ
文書データベース202内の文書群とを手動で用いて規
定することができる。
【0126】またこの代わりに、知識ベースは、機械学
習技術により選ばれる特徴と重み付けを用いて半自動的
又は自動的に規定することもできる。特徴と重み付けの
自動的な学習を行う場合は、学習モジュール3730
は、メタ文書データベース202に存在するメタ文書を
用いて、知識ベース3722をトレーニングする。次
に、学習モジュール3730は、ユーザプロファイル・
データベース3708を用いて知識ベース3722を検
査する。ユーザプロファイル・データベース3708
は、パーソナリティデータベース212やメタ文書デー
タベース202の一部を含むものであり、ユーザが以前
にパーソナリティを適用したことのあるメタ文書への参
照情報を含んでいる。
【0127】処理では、パーソナリティ推薦部3700
の前処理モジュール361が、アップロード文書371
2から特徴3616を抽出する。次に、概略推論モジュ
ール3618が、知識ベース3722を用いてパーソナ
リティのリスト3720を導き出す。これら抽出された
特徴は、標準的な技術(例えば上述のベイズ推論(Bayes
ian inference)やコサイン距離法など)を再び用いて、
指定された文書コンテンツの拡充についての推薦のため
に、新たな文書を分類したり、可能性のあるリスト37
20のパーソナリティ群をランク付けしたりするのに活
用される。概略推論モジュール3618は、例えば、ラ
ンキングにおいてあるしきい値を超えるすべてのパーソ
ナリティ、又は先頭からN個(Nは1以上)のパーソナ
リティを推薦する。
【0128】パーソナリティ推薦部3700の変形で
は、ある新たな文書に対してランク付けされたパーソナ
リティ群は、ユーザのプロファイルを用いて再ランク付
けされる。例えば、概略推論モジュール3618がある
文書にビジネスとスポーツのパーソナリティを付加して
いるが、データベース3708におけるユーザ自身のプ
ロファイルはそのユーザが今まで一度もビジネス・パー
ソナリティを適用したことがないことを示している場合
は、学習システム3701がランク付けを変更し、スポ
ーツ・パーソナリティのみを提案したり、スポーツ・パ
ーソナリティにビジネス・パーソナリティよりも高い優
先度を付与したりする。このようにして、ユーザのメタ
文書サーバ200とのインタラクション履歴を用いて、
そのユーザに合ったパーソナリティ推薦を行うことがで
きる。
【図面の簡単な説明】
【図1】 本発明に係る実施形態におけるメタ文書の概
念図である。
【図2】 メタ文書サーバを有するシステムのブロック
図である。
【図3】 本発明の1つの実施形態におけるメタ文書拡
充を概念的に示す図である。
【図4】 図3に示したメタ文書拡充の一例を示す図で
ある。
【図5】 図2に示したメタ文書サーバにアクセスする
ためのクライアントインタフェースを例示した図であ
る。
【図6】 藁梱製の家及びタイヤ製の家のパーソナリテ
ィが選択された建築パーソナリティのための、図5に示
したウインドウ1014を拡大して示す図である。
【図7】 図5においてプロパティ構成ボタン1022
が選択されたときに表示される、プロパティウインドウ
1210の一例を示す図である。
【図8】 パーソナリティを生成/修正するためのクラ
イアントインタフェースの一例を示す図である。
【図9】 図8のユーザインタフェースで規定されるサ
ーチエンジンで実行されるサーチのプロパティ(属性)
を指定するためのクライアントウインドウの例を示す図
である。
【図10】 パーソナリティを生成/修正するためのク
ライアントインタフェースの別の例を示す図である。
【図11】 複数グループのパーソナリティに対して演
算操作を施すことでパーソナリティを生成/修正するた
めのクライアントインタフェースの例を示す図である。
【図12】 パーソナリティを生成するためのステップ
群を示したフローチャートである。
【図13】 2レベル下がることにより生成される拡張
文書1800の例を示す図である。
【図14】 サービスを作成するのに用いるフォームを
例示した図である。
【図15】 図14に例示したフォームを用いて生成さ
れる4つのサービスの例を説明するための図である。
【図16】 図12における動作1716でのフィルタ
サービスのための1つの方法を表すフローチャートであ
る。
【図17】 最高類似度方式を用いてサービスを選択す
る選択プロセスをグラフで表す図である。
【図18】 図12における動作1716でのフィルタ
サービスのための別の方法を表すフローチャートであ
る。
【図19】 例を用いた質問の答えを識別する1つの実
施例を表すフローチャートである。
【図20】 文書コンテンツを拡充するのにeラーニン
グパーソナリティが選択されたときに使用できるサービ
スのリストの例を示す図である。
【図21】 文書コンテンツを拡充するのに言語学習パ
ーソナリティが選択されたときに使用できるサービスの
リストの例を示す図である。
【図22】 指定されたコンテンツまたは文書から認識
されるエンティティに対する振る舞い及び/又はパーソ
ナリティを選択的に指定するためのクライアントインタ
フェースを例示した図である。
【図23】 テキストカテゴリ分け装置の例を示す図で
ある。
【図24】 パーソナリティ推薦装置の例を示す図であ
る。
【符号の説明】
100 メタ文書、101 文書ID、102 文書コ
ンテンツ、104 パーソナリティ、106 文書サー
ビスリクエスト、108 文書マークアップ、111
エンティティデータベース、204 スケジューラ、2
06 ネットワークサービス群、208 コンテンツ管
理部、210 サービスデータベース。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 グレゴリー ティー グレフェンステット フランス ジェール リュー ドゥ ラ リベラシオン 25 (72)発明者 クリステル フェルンシュトローム フランス サン イスミエ シュマン デ ドモアゼル 23 (72)発明者 ローレンス ユベール フランス サン ベルナール ドゥ トゥ ヴェ ル ギヨ (72)発明者 ニコラ ゲラン フランス グルノーブル ブルヴァー ド ゥ マレシャル ルクレール 15 Fターム(参考) 5B009 SA00 VA02 VC01 5B075 KK07 ND03 ND40 NR02 NR20 UU06

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文書コンテンツを拡充するためのシステ
    ムであって、 拡充テーマを特定する文書サービスリクエストの集合を
    規定するパーソナリティを指定するためのユーザインタ
    フェースと、 文書コンテンツと前記パーソナリティとを受け取り、そ
    の文書コンテンツとパーソナリティとを備えるメタ文書
    を形成するユーザ管理部と、 前記集合から文書サービスリクエストを選択し、この選
    択した文書サービスリクエストを満たすためにサービス
    プロバイダとの通信を開始し、この通信を管理するスケ
    ジューラと、 前記選択した文書サービスリクエストに対する結果を文
    書マークアップとして前記メタ文書に統合するコンテン
    ツ管理部と、 を備え、前記ユーザインタフェース、前記ユーザ管理
    部、前記スケジューラ、及び前記コンテンツ管理部が協
    動して、代数的計算の組、文書参照の組、あらかじめ規
    定したパーソナリティの組、学習パーソナリティの組、
    知識レベル、及びパーソナリティの分類、の中の1つま
    たは複数の組み合わせが用いて、新たなパーソナリティ
    の作成又は推薦、又は既存のパーソナリティの修正を行
    うように構成した文書拡充システム。
  2. 【請求項2】 請求項1記載のシステムであって、 特定された文書の集合から拡張文書を生成し、その拡張
    文書からエンティティデータベースを構築するエンティ
    ティ抽出部と、 前記拡張文書から求められる各フォームごとにサービス
    リクエストを作成し、この作成したサービスリクエスト
    と前記エンティティデータベースとを用いて新たなパー
    ソナリティを規定するサービス生成部と、 を更に備える文書拡充システム。
  3. 【請求項3】 請求項1記載のシステムであって、 ユーザが規定した質問を受け取るための手段と、 ユーザが規定した質問に含まれる語彙を識別する手段
    と、 識別した語彙を包括的シンボルに置き換えて包括的質問
    を規定する手段と、 前記包括的質問を新たなパーソナリティ又は既存のパー
    ソナリティの一方に付加する手段と、 を備える文書拡充システム。
JP2002235923A 2001-08-13 2002-08-13 ユーザ定義可能なパーソナリティを備えた文書拡充システム Expired - Lifetime JP4365074B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US31185701P 2001-08-13 2001-08-13
US60/311,857 2001-08-13
US09/683,236 US6732090B2 (en) 2001-08-13 2001-12-05 Meta-document management system with user definable personalities
US09/683,236 2001-12-05

Publications (2)

Publication Number Publication Date
JP2003114906A true JP2003114906A (ja) 2003-04-18
JP4365074B2 JP4365074B2 (ja) 2009-11-18

Family

ID=26978111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002235923A Expired - Lifetime JP4365074B2 (ja) 2001-08-13 2002-08-13 ユーザ定義可能なパーソナリティを備えた文書拡充システム

Country Status (4)

Country Link
US (1) US6732090B2 (ja)
EP (1) EP1284461A1 (ja)
JP (1) JP4365074B2 (ja)
BR (1) BRPI0203479B1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023878A (ja) * 2004-07-07 2006-01-26 Quin Land Co Ltd データ抽出システム
JP2008508639A (ja) * 2004-08-02 2008-03-21 株式会社ジャストシステム 所望の機能を実現する排他プラグインを追加するための文書処理及び管理方法
JP2009205397A (ja) * 2008-02-27 2009-09-10 Internatl Business Mach Corp <Ibm> 検索エンジン、検索システム、検索方法およびプログラム
JP2015092412A (ja) * 2015-02-02 2015-05-14 富士通株式会社 アノテーション制御方法、アノテーション制御プログラム及びアノテーション制御システム
JP2017527879A (ja) * 2014-07-18 2017-09-21 マイクロソフト テクノロジー ライセンシング,エルエルシー 向上したドキュメント生産性のためのエンティティ認識
JP2020013521A (ja) * 2018-07-20 2020-01-23 カーベーセー グループ エンフェーKBC Groep NV 改善された要求ハンドリング
US11972490B2 (en) 2018-07-20 2024-04-30 Kbc Groep Nv Determining a category of a request by word vector representation of a natural language text string with a similarity value

Families Citing this family (326)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
EP0993739A1 (en) * 1997-05-21 2000-04-19 E.S.P. Communications, Inc. System, method and apparatus for "caller only" initiated two-way wireless communication with caller generated billing
EP1049030A1 (en) * 1999-04-28 2000-11-02 SER Systeme AG Produkte und Anwendungen der Datenverarbeitung Classification method and apparatus
US20020174201A1 (en) * 1999-09-30 2002-11-21 Ramer Jon E. Dynamic configuration of context-sensitive personal sites and membership channels
US7536561B2 (en) * 1999-10-15 2009-05-19 Ebrary, Inc. Method and apparatus for improved information transactions
US8311946B1 (en) 1999-10-15 2012-11-13 Ebrary Method and apparatus for improved information transactions
US20040148274A1 (en) * 1999-10-15 2004-07-29 Warnock Christopher M. Method and apparatus for improved information transactions
US6981040B1 (en) 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
EP1128278B1 (en) * 2000-02-23 2003-09-17 SER Solutions, Inc Method and apparatus for processing electronic documents
US7716163B2 (en) 2000-06-06 2010-05-11 Microsoft Corporation Method and system for defining semantic categories and actions
US7712024B2 (en) 2000-06-06 2010-05-04 Microsoft Corporation Application program interfaces for semantically labeling strings and providing actions based on semantically labeled strings
US7788602B2 (en) 2000-06-06 2010-08-31 Microsoft Corporation Method and system for providing restricted actions for recognized semantic categories
US7770102B1 (en) 2000-06-06 2010-08-03 Microsoft Corporation Method and system for semantically labeling strings and providing actions based on semantically labeled strings
US7660737B1 (en) 2000-07-18 2010-02-09 Smartpenny.Com, Inc. Economic filtering system for delivery of permission based, targeted, incentivized advertising
EP1182577A1 (en) * 2000-08-18 2002-02-27 SER Systeme AG Produkte und Anwendungen der Datenverarbeitung Associative memory
US9177828B2 (en) 2011-02-10 2015-11-03 Micron Technology, Inc. External gettering method and device
US20020169735A1 (en) * 2001-03-07 2002-11-14 David Kil Automatic mapping from data to preprocessing algorithms
US7032174B2 (en) * 2001-03-27 2006-04-18 Microsoft Corporation Automatically adding proper names to a database
WO2002084590A1 (en) * 2001-04-11 2002-10-24 Applied Minds, Inc. Knowledge web
US7778816B2 (en) 2001-04-24 2010-08-17 Microsoft Corporation Method and system for applying input mode bias
US20020169738A1 (en) * 2001-05-10 2002-11-14 Giel Peter Van Method and system for auditing an enterprise configuration
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US7284191B2 (en) 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US7130861B2 (en) 2001-08-16 2006-10-31 Sentius International Corporation Automated creation and delivery of database content
US8112529B2 (en) 2001-08-20 2012-02-07 Masterobjects, Inc. System and method for asynchronous client server session communication
US20090006543A1 (en) * 2001-08-20 2009-01-01 Masterobjects System and method for asynchronous retrieval of information based on incremental user input
DK1288792T3 (da) * 2001-08-27 2012-04-02 Bdgb Entpr Software Sarl Fremgangsmåde til automatisk indeksering af dokumenter
US7451390B2 (en) * 2001-09-10 2008-11-11 Fujitsu Limited Structured document processing system, method, program and recording medium
WO2003040963A1 (en) * 2001-11-02 2003-05-15 Medical Research Consultants L.P. Knowledge management system
DE10157487C1 (de) * 2001-11-23 2003-06-18 Sgl Carbon Ag Faserverstärkter Verbundkörper für Schutzpanzerungen, seine Herstellung und Verwendungen
US20030125929A1 (en) * 2001-12-10 2003-07-03 Thomas Bergstraesser Services for context-sensitive flagging of information in natural language text and central management of metadata relating that information over a computer network
US7052277B2 (en) * 2001-12-14 2006-05-30 Kellman A.C.T. Services, Inc. System and method for adaptive learning
US6965900B2 (en) * 2001-12-19 2005-11-15 X-Labs Holdings, Llc Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents
US7072883B2 (en) * 2001-12-21 2006-07-04 Ut-Battelle Llc System for gathering and summarizing internet information
US7243092B2 (en) * 2001-12-28 2007-07-10 Sap Ag Taxonomy generation for electronic documents
US20030128236A1 (en) * 2002-01-10 2003-07-10 Chen Meng Chang Method and system for a self-adaptive personal view agent
US7062711B2 (en) * 2002-01-30 2006-06-13 Sharp Laboratories Of America, Inc. User interface and method for providing search query syntax help
WO2003065180A2 (en) * 2002-02-01 2003-08-07 John Fairweather System and method for creating a distributed network architecture
DE10204657A1 (de) * 2002-02-05 2003-08-07 Rohde & Schwarz Nachrichtenanalyseeinrichtung und Verfahren zum Anzeigen von Nachrichten
US20030195834A1 (en) * 2002-04-10 2003-10-16 Hillis W. Daniel Automated online purchasing system
US8069175B2 (en) * 2002-04-10 2011-11-29 Google Inc. Delegating authority to evaluate content
US7844610B2 (en) * 2003-12-12 2010-11-30 Google Inc. Delegated authority evaluation system
US7707496B1 (en) 2002-05-09 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting dates between calendars and languages based upon semantically labeled strings
US6941318B1 (en) * 2002-05-10 2005-09-06 Oracle International Corporation Universal tree interpreter for data mining models
US7219164B2 (en) * 2002-05-17 2007-05-15 University Of Miami Multimedia re-editor
EP1506663B1 (en) * 2002-05-17 2007-05-16 NTT DoCoMo, Inc. De-fragmentation of transmission sequences
US7707024B2 (en) 2002-05-23 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting currency values based upon semantically labeled strings
US20040205580A1 (en) * 2002-05-23 2004-10-14 Mindflash Technologies, Inc. Method and system for document management
US7742048B1 (en) 2002-05-23 2010-06-22 Microsoft Corporation Method, system, and apparatus for converting numbers based upon semantically labeled strings
US7281245B2 (en) * 2002-06-05 2007-10-09 Microsoft Corporation Mechanism for downloading software components from a remote source for use by a local software application
US7827546B1 (en) 2002-06-05 2010-11-02 Microsoft Corporation Mechanism for downloading software components from a remote source for use by a local software application
US7356537B2 (en) 2002-06-06 2008-04-08 Microsoft Corporation Providing contextually sensitive tools and help content in computer-generated documents
US20030236773A1 (en) * 2002-06-19 2003-12-25 Wen Say Ling Input system and method with dynamic database adjustment function
US20040003341A1 (en) * 2002-06-20 2004-01-01 Koninklijke Philips Electronics N.V. Method and apparatus for processing electronic forms for use with resource constrained devices
US7003522B1 (en) * 2002-06-24 2006-02-21 Microsoft Corporation System and method for incorporating smart tags in online content
US7716676B2 (en) 2002-06-25 2010-05-11 Microsoft Corporation System and method for issuing a message to a program
US7209915B1 (en) 2002-06-28 2007-04-24 Microsoft Corporation Method, system and apparatus for routing a query to one or more providers
JP3783665B2 (ja) * 2002-08-05 2006-06-07 ブラザー工業株式会社 画像形成装置及びネットワークシステム
US6999962B2 (en) * 2002-08-13 2006-02-14 Xerox Corporation Shared document repository with coupled recommender system
US7185271B2 (en) * 2002-08-20 2007-02-27 Hewlett-Packard Development Company, L.P. Methods and systems for implementing auto-complete in a web page
FI112998B (fi) * 2002-08-21 2004-02-13 Nokia Corp Menetelmä ja laite tiedonsiirtoon
US7283989B1 (en) * 2002-09-27 2007-10-16 At&T Bls Intellectual Property, Inc. System and method for use of application metadata
US7130844B2 (en) * 2002-10-31 2006-10-31 International Business Machines Corporation System and method for examining, calculating the age of an document collection as a measure of time since creation, visualizing, identifying selectively reference those document collections representing current activity
US7954043B2 (en) * 2002-12-02 2011-05-31 International Business Machines Corporation Concurrent editing of a file by multiple authors
US7392231B2 (en) * 2002-12-03 2008-06-24 International Business Machines Corporation Determining utility functions from ordenal rankings
US8012025B2 (en) * 2002-12-13 2011-09-06 Applied Minds, Llc Video game controller hub with control input reduction and combination schemes
US7765206B2 (en) * 2002-12-13 2010-07-27 Metaweb Technologies, Inc. Meta-Web
US20040133574A1 (en) * 2003-01-07 2004-07-08 Science Applications International Corporaton Vector space method for secure information sharing
US7124955B2 (en) * 2003-01-28 2006-10-24 American Express Travel Related Services Company, Inc. Compact or convenient transaction cards
US7703000B2 (en) * 2003-02-13 2010-04-20 Iparadigms Llc Systems and methods for contextual mark-up of formatted documents
US7783614B2 (en) 2003-02-13 2010-08-24 Microsoft Corporation Linking elements of a document to corresponding fields, queries and/or procedures in a database
US20040199584A1 (en) * 2003-03-05 2004-10-07 Evan Kirshenbaum Method and system for customized configuration of an appearance of a website for a user
US20040186705A1 (en) * 2003-03-18 2004-09-23 Morgan Alexander P. Concept word management
US20040190774A1 (en) * 2003-03-28 2004-09-30 Baker Daniel P. Method for classifying and accessing writing composition examples
EP1611546B1 (en) 2003-04-04 2013-01-02 Icosystem Corporation Methods and systems for interactive evolutionary computing (iec)
US7243085B2 (en) * 2003-04-16 2007-07-10 Sony Corporation Hybrid personalization architecture
US7711550B1 (en) 2003-04-29 2010-05-04 Microsoft Corporation Methods and system for recognizing names in a computer-generated document and for providing helpful actions associated with recognized names
US20040231526A1 (en) * 2003-05-21 2004-11-25 Schreiber Foods, Inc. Method and apparatus for shaping a body of cheese into a plurality of curved bodies of cheese
CA2468481A1 (en) * 2003-05-26 2004-11-26 John T. Forbis Multi-position rail for a barrier
US7739588B2 (en) * 2003-06-27 2010-06-15 Microsoft Corporation Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
CN1567303A (zh) * 2003-07-03 2005-01-19 富士通株式会社 结构文档信息块的自动分割方法和装置
JP4073841B2 (ja) * 2003-07-24 2008-04-09 富士フイルム株式会社 電子メール・サーバ
US7779345B2 (en) 2003-07-30 2010-08-17 Aol Inc. Reverse mapping method and apparatus for form filling
US7333960B2 (en) 2003-08-01 2008-02-19 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US7296027B2 (en) 2003-08-06 2007-11-13 Sbc Knowledge Ventures, L.P. Rhetorical content management with tone and audience profiles
US20050033811A1 (en) 2003-08-07 2005-02-10 International Business Machines Corporation Collaborative email
US7213036B2 (en) 2003-08-12 2007-05-01 Aol Llc System for incorporating information about a source and usage of a media asset into the asset itself
US7499531B2 (en) * 2003-09-05 2009-03-03 Emc Corporation Method and system for information lifecycle management
US8103873B2 (en) * 2003-09-05 2012-01-24 Emc Corporation Method and system for processing auditory communications
US8209185B2 (en) * 2003-09-05 2012-06-26 Emc Corporation Interface for management of auditory communications
US7457396B2 (en) * 2003-09-05 2008-11-25 Emc Corporation Automated call management
US7676358B2 (en) * 2003-09-24 2010-03-09 International Business Machines Corporation System and method for the recognition of organic chemical names in text documents
US9489853B2 (en) * 2004-09-27 2016-11-08 Kenneth Nathaniel Sherman Reading and information enhancement system and method
US20060075345A1 (en) * 2004-09-27 2006-04-06 Sherman Kenneth N Progressive reference system, method and apparatus
US9547994B2 (en) * 2003-10-01 2017-01-17 Kenneth Nathaniel Sherman Progressive reference system, method and apparatus
US7165119B2 (en) 2003-10-14 2007-01-16 America Online, Inc. Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter
US7640232B2 (en) 2003-10-14 2009-12-29 Aol Llc Search enhancement system with information from a selected source
US20050108316A1 (en) * 2003-11-18 2005-05-19 Sbc Knowledge Ventures, L.P. Methods and systems for organizing related communications
US20050125254A1 (en) * 2003-12-03 2005-06-09 Roy Schoenberg Key maintenance method and system
US7464330B2 (en) * 2003-12-09 2008-12-09 Microsoft Corporation Context-free document portions with alternate formats
US20050131918A1 (en) * 2003-12-12 2005-06-16 W. Daniel Hillis Personalized profile for evaluating content
US7373373B2 (en) 2003-12-12 2008-05-13 Arinc Incorporated Systems and methods for host/client communications
US7299110B2 (en) 2004-01-06 2007-11-20 Honda Motor Co., Ltd. Systems and methods for using statistical techniques to reason with noisy data
US7415106B2 (en) * 2004-03-09 2008-08-19 Sbc Knowledge Ventures, Lp Network-based voice activated auto-attendant service with B2B connectors
US7383500B2 (en) * 2004-04-30 2008-06-03 Microsoft Corporation Methods and systems for building packages that contain pre-paginated documents
US7631254B2 (en) * 2004-05-17 2009-12-08 Gordon Peter Layard Automated e-learning and presentation authoring system
EP1605369A1 (en) * 2004-06-07 2005-12-14 ArchiveOnline AB Document database
WO2006001008A2 (en) * 2004-06-24 2006-01-05 Amir Lavi System for facilitating search over a network
US9268780B2 (en) 2004-07-01 2016-02-23 Emc Corporation Content-driven information lifecycle management
US8229904B2 (en) * 2004-07-01 2012-07-24 Emc Corporation Storage pools for information management
US8244542B2 (en) * 2004-07-01 2012-08-14 Emc Corporation Video surveillance
US7707037B2 (en) * 2004-07-01 2010-04-27 Emc Corporation Archiving of surveillance data
US20060004579A1 (en) * 2004-07-01 2006-01-05 Claudatos Christopher H Flexible video surveillance
US8180742B2 (en) * 2004-07-01 2012-05-15 Emc Corporation Policy-based information management
US8180743B2 (en) 2004-07-01 2012-05-15 Emc Corporation Information management
US7444287B2 (en) * 2004-07-01 2008-10-28 Emc Corporation Efficient monitoring system and method
US20060004818A1 (en) * 2004-07-01 2006-01-05 Claudatos Christopher H Efficient information management
US7707220B2 (en) * 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
EP1782285A1 (en) * 2004-07-06 2007-05-09 Icosystem Corporation Methods and apparatus for query refinement using genetic algorithms
US7603349B1 (en) * 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US20060048053A1 (en) * 2004-08-30 2006-03-02 Xerox Corporation Individually personalized customized report document system
US20060048042A1 (en) * 2004-08-30 2006-03-02 Xerox Corporation Individually personalized customized report document system with user feedback
US8244726B1 (en) 2004-08-31 2012-08-14 Bruce Matesso Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids
US8626514B2 (en) * 2004-08-31 2014-01-07 Emc Corporation Interface for management of multiple auditory communications
US20060073461A1 (en) * 2004-09-22 2006-04-06 Gillaspy Thomas R Method and system for estimating educational resources
US8386453B2 (en) * 2004-09-30 2013-02-26 Google Inc. Providing search information relating to a document
US7617450B2 (en) 2004-09-30 2009-11-10 Microsoft Corporation Method, system, and computer-readable medium for creating, inserting, and reusing document parts in an electronic document
JP5001846B2 (ja) * 2004-10-13 2012-08-15 ブルームバーグ・ファイナンス・エル・ピー ニュース見出しを管理するためのシステム及び方法
US7412442B1 (en) * 2004-10-15 2008-08-12 Amazon Technologies, Inc. Augmenting search query results with behaviorally related items
US8631347B2 (en) * 2004-11-15 2014-01-14 Microsoft Corporation Electronic document style matrix
US7617229B2 (en) * 2004-12-20 2009-11-10 Microsoft Corporation Management and use of data in a computer-generated document
US7617451B2 (en) * 2004-12-20 2009-11-10 Microsoft Corporation Structuring data for word processing documents
US20060136816A1 (en) * 2004-12-20 2006-06-22 Microsoft Corporation File formats, methods, and computer program products for representing documents
US7752632B2 (en) * 2004-12-21 2010-07-06 Microsoft Corporation Method and system for exposing nested data in a computer-generated document in a transparent manner
US7770180B2 (en) * 2004-12-21 2010-08-03 Microsoft Corporation Exposing embedded data in a computer-generated document
US20060149710A1 (en) * 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US7386569B2 (en) * 2005-01-11 2008-06-10 International Business Machines Corporation Systems, methods, and media for aggregating electronic document usage information
US7433866B2 (en) * 2005-01-11 2008-10-07 International Business Machines Corporation Systems, methods, and media for awarding credits based on provided usage information
US7421426B2 (en) * 2005-01-11 2008-09-02 International Business Machines Corporation Systems, methods, and media for utilizing electronic document usage information with search engines
US20060195361A1 (en) * 2005-10-01 2006-08-31 Outland Research Location-based demographic profiling system and method of use
US20060161621A1 (en) * 2005-01-15 2006-07-20 Outland Research, Llc System, method and computer program product for collaboration and synchronization of media content on a plurality of media players
US20070189544A1 (en) * 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
US7562117B2 (en) * 2005-09-09 2009-07-14 Outland Research, Llc System, method and computer program product for collaborative broadcast media
US20060229058A1 (en) * 2005-10-29 2006-10-12 Outland Research Real-time person-to-person communication using geospatial addressing
US7542816B2 (en) * 2005-01-27 2009-06-02 Outland Research, Llc System, method and computer program product for automatically selecting, suggesting and playing music media files
US7489979B2 (en) * 2005-01-27 2009-02-10 Outland Research, Llc System, method and computer program product for rejecting or deferring the playing of a media file retrieved by an automated process
US7337170B2 (en) * 2005-01-18 2008-02-26 International Business Machines Corporation System and method for planning and generating queries for multi-dimensional analysis using domain models and data federation
US20060173828A1 (en) * 2005-02-01 2006-08-03 Outland Research, Llc Methods and apparatus for using personal background data to improve the organization of documents retrieved in response to a search query
US20070276870A1 (en) * 2005-01-27 2007-11-29 Outland Research, Llc Method and apparatus for intelligent media selection using age and/or gender
US20060179056A1 (en) * 2005-10-12 2006-08-10 Outland Research Enhanced storage and retrieval of spatially associated information
US20060173556A1 (en) * 2005-02-01 2006-08-03 Outland Research,. Llc Methods and apparatus for using user gender and/or age group to improve the organization of documents retrieved in response to a search query
US7598855B2 (en) 2005-02-01 2009-10-06 Location Based Technologies, Inc. Apparatus and method for locating individuals and objects using tracking devices
US20070229350A1 (en) * 2005-02-01 2007-10-04 Scalisi Joseph F Apparatus and Method for Providing Location Information on Individuals and Objects using Tracking Devices
US20060179044A1 (en) * 2005-02-04 2006-08-10 Outland Research, Llc Methods and apparatus for using life-context of a user to improve the organization of documents retrieved in response to a search query from that user
US7921365B2 (en) 2005-02-15 2011-04-05 Microsoft Corporation System and method for browsing tabbed-heterogeneous windows
US7840564B2 (en) 2005-02-16 2010-11-23 Ebrary System and method for automatic anthology creation using document aspects
US7680781B1 (en) * 2005-03-04 2010-03-16 Teradata Us, Inc. Automatic search query generation and results set management
US20060253210A1 (en) * 2005-03-26 2006-11-09 Outland Research, Llc Intelligent Pace-Setting Portable Media Player
US20060223637A1 (en) * 2005-03-31 2006-10-05 Outland Research, Llc Video game system combining gaming simulation with remote robot control and remote robot feedback
WO2006107347A2 (en) * 2005-03-31 2006-10-12 Lehman Brothers Inc. System and method for grouping a collection of documents using document series
US20060223635A1 (en) * 2005-04-04 2006-10-05 Outland Research method and apparatus for an on-screen/off-screen first person gaming experience
US20060256008A1 (en) * 2005-05-13 2006-11-16 Outland Research, Llc Pointing interface for person-to-person information exchange
US20060241864A1 (en) * 2005-04-22 2006-10-26 Outland Research, Llc Method and apparatus for point-and-send data transfer within an ubiquitous computing environment
US20060253421A1 (en) * 2005-05-06 2006-11-09 Fang Chen Method and product for searching title metadata based on user preferences
US20060259948A1 (en) * 2005-05-12 2006-11-16 International Business Machines Corporation Integrated document handling in distributed collaborative applications
US20060259574A1 (en) * 2005-05-13 2006-11-16 Outland Research, Llc Method and apparatus for accessing spatially associated information
US20060256007A1 (en) * 2005-05-13 2006-11-16 Outland Research, Llc Triangulation method and apparatus for targeting and accessing spatially associated information
US20070150188A1 (en) * 2005-05-27 2007-06-28 Outland Research, Llc First-person video-based travel planning system
US20060271286A1 (en) * 2005-05-27 2006-11-30 Outland Research, Llc Image-enhanced vehicle navigation systems and methods
WO2006130612A2 (en) * 2005-05-31 2006-12-07 Ipifini, Inc. Computer program for identifying and automating repetitive user inputs
US7359897B2 (en) * 2005-06-02 2008-04-15 Toshiba Corporation System and method for document management and retrieval
US20070022128A1 (en) * 2005-06-03 2007-01-25 Microsoft Corporation Structuring data for spreadsheet documents
US20060277452A1 (en) * 2005-06-03 2006-12-07 Microsoft Corporation Structuring data for presentation documents
US8175511B1 (en) * 2005-06-08 2012-05-08 Globalenglish Corporation Techniques for intelligent network-based teaching
US10699593B1 (en) * 2005-06-08 2020-06-30 Pearson Education, Inc. Performance support integration with E-learning system
US8805781B2 (en) * 2005-06-15 2014-08-12 Geronimo Development Document quotation indexing system and method
US8768911B2 (en) * 2005-06-15 2014-07-01 Geronimo Development System and method for indexing and displaying document text that has been subsequently quoted
US20080032719A1 (en) * 2005-10-01 2008-02-07 Outland Research, Llc Centralized establishment-based tracking and messaging service
US20060186197A1 (en) * 2005-06-16 2006-08-24 Outland Research Method and apparatus for wireless customer interaction with the attendants working in a restaurant
US7433869B2 (en) * 2005-07-01 2008-10-07 Ebrary, Inc. Method and apparatus for document clustering and document sketching
US7853618B2 (en) 2005-07-21 2010-12-14 The Boeing Company Methods and apparatus for generic semantic access to information systems
US20070027895A1 (en) * 2005-07-27 2007-02-01 Lexmark International, Inc. Systems and methods for providing customized multi-function device interfaces using user authentication
US7580924B1 (en) * 2005-07-28 2009-08-25 Xilinx, Inc. Method and system for collection, analysis, and display of semiconductor manufacturing information
US7739305B1 (en) 2005-07-28 2010-06-15 Xilinx, Inc. Network appliance for data collection and processing from multiple locations and data schema therefor
JP4702940B2 (ja) * 2005-09-09 2011-06-15 キヤノン株式会社 ドキュメント管理システム及びその制御方法
US7783971B2 (en) * 2005-09-13 2010-08-24 Microsoft Corporation Graphic object themes
US8001526B2 (en) * 2005-09-15 2011-08-16 Microsoft Corporation Hierarchical property storage
US20070061351A1 (en) * 2005-09-13 2007-03-15 Microsoft Corporation Shape object text
US20070061349A1 (en) * 2005-09-15 2007-03-15 Microsoft Corporation Hierarchically describing shapes
US7721205B2 (en) * 2005-09-15 2010-05-18 Microsoft Corporation Integration of composite objects in host applications
EP1927058A4 (en) * 2005-09-21 2011-02-02 Icosystem Corp SYSTEM AND METHOD FOR SUPPORTING THE PRODUCT DESIGN AND QUANTIFYING ACCEPTANCE
US8176101B2 (en) 2006-02-07 2012-05-08 Google Inc. Collaborative rejection of media for physical establishments
US7788590B2 (en) 2005-09-26 2010-08-31 Microsoft Corporation Lightweight reference user interface
US7992085B2 (en) 2005-09-26 2011-08-02 Microsoft Corporation Lightweight reference user interface
US7577522B2 (en) * 2005-12-05 2009-08-18 Outland Research, Llc Spatially associated personal reminder system and method
US20070106627A1 (en) * 2005-10-05 2007-05-10 Mohit Srivastava Social discovery systems and methods
US20070083323A1 (en) * 2005-10-07 2007-04-12 Outland Research Personal cuing for spatially associated information
US7586032B2 (en) * 2005-10-07 2009-09-08 Outland Research, Llc Shake responsive portable media player
US20070088680A1 (en) * 2005-10-14 2007-04-19 Microsoft Corporation Simultaneously spawning multiple searches across multiple providers
US9495349B2 (en) * 2005-11-17 2016-11-15 International Business Machines Corporation System and method for using text analytics to identify a set of related documents from a source document
US20070112833A1 (en) * 2005-11-17 2007-05-17 International Business Machines Corporation System and method for annotating patents with MeSH data
US20060227047A1 (en) * 2005-12-13 2006-10-12 Outland Research Meeting locator system and method of using the same
US20070192363A1 (en) * 2005-12-19 2007-08-16 Microsoft Corporation Document-centric application environment
US20070075127A1 (en) * 2005-12-21 2007-04-05 Outland Research, Llc Orientation-based power conservation for portable media devices
US7685198B2 (en) * 2006-01-25 2010-03-23 Yahoo! Inc. Systems and methods for collaborative tag suggestions
US7953740B1 (en) 2006-02-13 2011-05-31 Amazon Technologies, Inc. Detection of behavior-based associations between search strings and items
JP2007219880A (ja) * 2006-02-17 2007-08-30 Fujitsu Ltd 評判情報処理プログラム、方法及び装置
WO2007109444A2 (en) * 2006-03-17 2007-09-27 Schmitt William C Common format learning device
US8762418B1 (en) 2006-05-31 2014-06-24 Oracle America, Inc. Metadata that allows refiltering and data reclassification without accessing the data
US7502807B2 (en) * 2006-06-30 2009-03-10 Microsoft Corporation Defining and extracting a flat list of search properties from a rich structured type
US20080005685A1 (en) * 2006-06-30 2008-01-03 Clemens Drews Interface mechanism for quickly accessing recently used artifacts in a computer desktop environment
US20080005226A1 (en) * 2006-07-03 2008-01-03 Srinivasan Subbian A method and system for one-to-one communication through proxy
US20080005227A1 (en) * 2006-07-03 2008-01-03 Srinivasan Subbian Method and system for content processing
US20080005228A1 (en) * 2006-07-03 2008-01-03 Srinivasan Subbian Method and system for communicating to networks using mobile phones
US20100198697A1 (en) 2006-07-21 2010-08-05 Videoegg, Inc. Fixed Position Interactive Advertising
US7783622B1 (en) * 2006-07-21 2010-08-24 Aol Inc. Identification of electronic content significant to a user
US9208500B2 (en) 2006-07-21 2015-12-08 Microsoft Technology Licensing, Llc Fixed position multi-state interactive advertisement
US8732019B2 (en) 2006-07-21 2014-05-20 Say Media, Inc. Non-expanding interactive advertisement
US20090018920A1 (en) * 2006-07-21 2009-01-15 Videoegg, Inc. Interaction Prompt for Interactive Advertising
US7792830B2 (en) * 2006-08-01 2010-09-07 International Business Machines Corporation Analyzing the ability to find textual content
AU2007290431B2 (en) * 2006-08-30 2012-03-01 Thomson Reuters Enterprise Centre Gmbh Document-centric workflow based on document contents, metadata, and context
CN101145152B (zh) * 2006-09-14 2010-08-11 国际商业机器公司 在特定上下文内自动精细化本体的系统和方法
JP2008083856A (ja) * 2006-09-26 2008-04-10 Toshiba Corp 情報処理装置、情報処理方法及び情報処理プログラム
US7890442B2 (en) * 2006-10-20 2011-02-15 International Business Machines Corporation Method and system for autocompletion of multiple fields in electronic forms
US7562088B2 (en) * 2006-12-27 2009-07-14 Sap Ag Structure extraction from unstructured documents
US20080183691A1 (en) * 2007-01-30 2008-07-31 International Business Machines Corporation Method for a networked knowledge based document retrieval and ranking utilizing extracted document metadata and content
US7792816B2 (en) * 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
US8166389B2 (en) * 2007-02-09 2012-04-24 General Electric Company Methods and apparatus for including customized CDA attributes for searching and retrieval
US8386478B2 (en) 2007-03-07 2013-02-26 The Boeing Company Methods and systems for unobtrusive search relevance feedback
US9111189B2 (en) * 2007-10-31 2015-08-18 Location Based Technologies, Inc. Apparatus and method for manufacturing an electronic package
US8497774B2 (en) 2007-04-05 2013-07-30 Location Based Technologies Inc. Apparatus and method for adjusting refresh rate of location coordinates of a tracking device
US8102256B2 (en) 2008-01-06 2012-01-24 Location Based Technologies Inc. Apparatus and method for determining location and tracking coordinates of a tracking device
US8224355B2 (en) * 2007-11-06 2012-07-17 Location Based Technologies Inc. System and method for improved communication bandwidth utilization when monitoring location information
US8244468B2 (en) * 2007-11-06 2012-08-14 Location Based Technology Inc. System and method for creating and managing a personalized web interface for monitoring location information on individuals and objects using tracking devices
US8774827B2 (en) 2007-04-05 2014-07-08 Location Based Technologies, Inc. Apparatus and method for generating position fix of a tracking device in accordance with a subscriber service usage profile to conserve tracking device power
US20080262883A1 (en) * 2007-04-19 2008-10-23 Weiss Stephen J Systems and methods for compliance and announcement display and notification
US9633028B2 (en) 2007-05-09 2017-04-25 Illinois Institute Of Technology Collaborative and personalized storage and search in hierarchical abstract data organization systems
US9128954B2 (en) * 2007-05-09 2015-09-08 Illinois Institute Of Technology Hierarchical structured data organization system
US10042898B2 (en) 2007-05-09 2018-08-07 Illinois Institutre Of Technology Weighted metalabels for enhanced search in hierarchical abstract data organization systems
US9342588B2 (en) * 2007-06-18 2016-05-17 International Business Machines Corporation Reclassification of training data to improve classifier accuracy
US8521511B2 (en) 2007-06-18 2013-08-27 International Business Machines Corporation Information extraction in a natural language understanding system
US9058319B2 (en) * 2007-06-18 2015-06-16 International Business Machines Corporation Sub-model generation to improve classification accuracy
US8285539B2 (en) * 2007-06-18 2012-10-09 International Business Machines Corporation Extracting tokens in a natural language understanding application
US9251137B2 (en) * 2007-06-21 2016-02-02 International Business Machines Corporation Method of text type-ahead
US8918437B2 (en) * 2007-07-17 2014-12-23 International Business Machines Corporation Fragment reconstitution in a content management system
US8654974B2 (en) * 2007-10-18 2014-02-18 Location Based Technologies, Inc. Apparatus and method to provide secure communication over an insecure communication channel for location information using tracking devices
US8543898B2 (en) * 2007-11-09 2013-09-24 Oracle International Corporation Techniques for more efficient generation of XML events from XML data sources
US8250062B2 (en) * 2007-11-09 2012-08-21 Oracle International Corporation Optimized streaming evaluation of XML queries
US8316035B2 (en) 2008-01-16 2012-11-20 International Business Machines Corporation Systems and arrangements of text type-ahead
US8086557B2 (en) * 2008-04-22 2011-12-27 Xerox Corporation Method and system for retrieving statements of information sources and associating a factuality assessment to the statements
US8359532B2 (en) * 2008-04-28 2013-01-22 International Business Machines Corporation Text type-ahead
US8275803B2 (en) 2008-05-14 2012-09-25 International Business Machines Corporation System and method for providing answers to questions
US8332394B2 (en) * 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
US20090307203A1 (en) * 2008-06-04 2009-12-10 Gregory Keim Method of locating content for language learning
US8429196B2 (en) * 2008-06-06 2013-04-23 Oracle International Corporation Fast extraction of scalar values from binary encoded XML
US20100031190A1 (en) * 2008-07-29 2010-02-04 Yahoo! Inc. System and method for copying information into a target document
US8090794B1 (en) * 2008-08-25 2012-01-03 Intuit Inc. Technique for customizing displayed content
US7730061B2 (en) * 2008-09-12 2010-06-01 International Business Machines Corporation Fast-approximate TFIDF
US8321514B2 (en) * 2008-12-30 2012-11-27 International Business Machines Corporation Sharing email
US8914359B2 (en) * 2008-12-30 2014-12-16 Microsoft Corporation Ranking documents with social tags
EP2427820A4 (en) * 2009-05-04 2013-11-27 Aptara Inc METHOD AND SYSTEM FOR CITATION VERIFICATION
US8332763B2 (en) * 2009-06-09 2012-12-11 Microsoft Corporation Aggregating dynamic visual content
WO2011005854A1 (en) * 2009-07-07 2011-01-13 Chacha Search, Inc. Method and system of providing search tools
US8832133B2 (en) * 2009-08-24 2014-09-09 Microsoft Corporation Answering web queries using structured data sources
US9152883B2 (en) * 2009-11-02 2015-10-06 Harry Urbschat System and method for increasing the accuracy of optical character recognition (OCR)
US9213756B2 (en) * 2009-11-02 2015-12-15 Harry Urbschat System and method of using dynamic variance networks
US9158833B2 (en) * 2009-11-02 2015-10-13 Harry Urbschat System and method for obtaining document information
US8321357B2 (en) * 2009-09-30 2012-11-27 Lapir Gennady Method and system for extraction
US8521744B2 (en) * 2009-11-13 2013-08-27 Electronics And Telecommunications Research Institute Apparatus and method for authoring data in communication system
US20110125734A1 (en) * 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
US9152702B2 (en) * 2010-04-09 2015-10-06 Yahoo! Inc. System and method for selecting search results facets
JP2012027723A (ja) * 2010-07-23 2012-02-09 Sony Corp 情報処理装置、情報処理方法及び情報処理プログラム
US8340425B2 (en) * 2010-08-10 2012-12-25 Xerox Corporation Optical character recognition with two-pass zoning
EP2612257A4 (en) 2010-09-03 2016-09-07 Iparadigms Llc SYSTEMS AND METHODS FOR ANALYZING DOCUMENTS
CN103221952B (zh) 2010-09-24 2016-01-20 国际商业机器公司 词法答案类型置信度估计和应用的方法和系统
WO2012040356A1 (en) 2010-09-24 2012-03-29 International Business Machines Corporation Providing question and answers with deferred type evaluation using text with limited structure
US8892550B2 (en) 2010-09-24 2014-11-18 International Business Machines Corporation Source expansion for information retrieval and information extraction
US20120078062A1 (en) 2010-09-24 2012-03-29 International Business Machines Corporation Decision-support application and system for medical differential-diagnosis and treatment using a question-answering system
US8943051B2 (en) 2010-09-24 2015-01-27 International Business Machines Corporation Lexical answer type confidence estimation and application
US9569724B2 (en) 2010-09-24 2017-02-14 International Business Machines Corporation Using ontological information in open domain type coercion
EP2622592A4 (en) 2010-09-28 2017-04-05 International Business Machines Corporation Providing answers to questions using multiple models to score candidate answers
EP2622510A4 (en) 2010-09-28 2017-04-05 International Business Machines Corporation Providing answers to questions using logical synthesis of candidate answers
EP2622428A4 (en) 2010-09-28 2017-01-04 International Business Machines Corporation Providing answers to questions using hypothesis pruning
AU2011316586B2 (en) 2010-10-12 2015-07-30 Wespeke, Inc. Language learning exchange
US8732660B2 (en) * 2011-02-02 2014-05-20 Novell, Inc. User input auto-completion
US8266245B1 (en) * 2011-10-17 2012-09-11 Google Inc. Systems and methods for incremental loading of collaboratively generated presentations
US10430388B1 (en) 2011-10-17 2019-10-01 Google Llc Systems and methods for incremental loading of collaboratively generated presentations
US8996350B1 (en) 2011-11-02 2015-03-31 Dub Software Group, Inc. System and method for automatic document management
RU2479017C1 (ru) * 2011-12-27 2013-04-10 Закрытое акционерное общество "Фирма "АйТи". Информационные технологии" Система аналитического выявления проблемных вопросов в нормах правового регулирования
US10331785B2 (en) * 2012-02-17 2019-06-25 Tivo Solutions Inc. Identifying multimedia asset similarity using blended semantic and latent feature analysis
US9836545B2 (en) 2012-04-27 2017-12-05 Yahoo Holdings, Inc. Systems and methods for personalized generalized content recommendations
US8996530B2 (en) * 2012-04-27 2015-03-31 Yahoo! Inc. User modeling for personalized generalized content recommendations
US9785883B2 (en) 2012-04-27 2017-10-10 Excalibur Ip, Llc Avatars for use with personalized generalized content recommendations
WO2014012565A1 (en) 2012-07-20 2014-01-23 Microsoft Corporation Color coding of layout structure elements in a flow format document
US9245428B2 (en) 2012-08-02 2016-01-26 Immersion Corporation Systems and methods for haptic remote control gaming
US10621880B2 (en) 2012-09-11 2020-04-14 International Business Machines Corporation Generating secondary questions in an introspective question answering system
US9992243B2 (en) 2012-09-17 2018-06-05 International Business Machines Corporation Video conference application for detecting conference presenters by search parameters of facial or voice features, dynamically or manually configuring presentation templates based on the search parameters and altering the templates to a slideshow
US9665550B2 (en) * 2012-11-30 2017-05-30 Michael E. Lee Expert based integrated annotation software interface and database using e-book technology
JP6070936B2 (ja) 2013-01-31 2017-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法及びプログラム
US9256341B2 (en) 2013-03-20 2016-02-09 Microsoft Technology Licensing, Llc Tracking changes in collaborative authoring environment
US9547417B2 (en) * 2013-03-29 2017-01-17 Deere & Company Retracting shortcut bars, status shortcuts and edit run page sets
US9727656B2 (en) * 2013-07-04 2017-08-08 Excalibur Ip, Llc Interactive sitemap with user footprints
US10776375B2 (en) 2013-07-15 2020-09-15 Microsoft Technology Licensing, Llc Retrieval of attribute values based upon identified entities
JP6326786B2 (ja) * 2013-11-29 2018-05-23 ブラザー工業株式会社 プログラム、情報処理装置、および通信システム
US10824787B2 (en) 2013-12-21 2020-11-03 Microsoft Technology Licensing, Llc Authoring through crowdsourcing based suggestions
US11514399B2 (en) 2013-12-21 2022-11-29 Microsoft Technology Licensing, Llc Authoring through suggestion
US20150347357A1 (en) * 2014-05-30 2015-12-03 Rovi Guides, Inc. Systems and methods for automatic text recognition and linking
US9928410B2 (en) * 2014-11-24 2018-03-27 Samsung Electronics Co., Ltd. Method and apparatus for recognizing object, and method and apparatus for training recognizer
US9785620B2 (en) * 2015-02-05 2017-10-10 Salesforce.Com, Inc. Creating linked communications
US10013433B2 (en) * 2015-02-24 2018-07-03 Canon Kabushiki Kaisha Virtual file system
US11916916B2 (en) 2015-06-04 2024-02-27 Wymsical, Inc. System and method for authenticating, storing, retrieving, and verifying documents
US10341353B1 (en) * 2015-06-04 2019-07-02 Wymsical, Inc. System and method for issuing, authenticating, storing, retrieving, and verifying documents
US10564794B2 (en) 2015-09-15 2020-02-18 Xerox Corporation Method and system for document management considering location, time and social context
US9817814B2 (en) * 2015-12-31 2017-11-14 Accenture Global Solutions Limited Input entity identification from natural language text information
US10467318B2 (en) * 2016-02-25 2019-11-05 Futurewei Technologies, Inc. Dynamic information retrieval and publishing
US10404549B2 (en) 2016-07-28 2019-09-03 At&T Intellectual Property I, L.P. Applying machine learning to heterogeneous data of existing services to generate a new service
US10572595B2 (en) * 2017-04-13 2020-02-25 Baidu Usa Llc Global normalized reader systems and methods
KR102004978B1 (ko) * 2018-03-14 2019-07-30 주식회사 한글과컴퓨터 튜토리얼 기능이 구비된 전자 문서 편집 장치 및 이의 동작 방법
CN109002483A (zh) * 2018-06-22 2018-12-14 平安科技(深圳)有限公司 文档管理方法、装置、计算机设备及存储介质
US10929453B2 (en) * 2018-08-09 2021-02-23 Nec Corporation Verifying textual claims with a document corpus
CN109522411B (zh) * 2018-11-12 2022-10-28 南京德磐信息科技有限公司 一种基于神经网络的写作辅助方法
JP2021022123A (ja) * 2019-07-26 2021-02-18 キヤノン株式会社 ディスプレイを搭載した電子機器、その制御方法、情報処理システム及びプログラム
US11783224B2 (en) 2019-12-06 2023-10-10 International Business Machines Corporation Trait-modeled chatbots
CN111125566B (zh) * 2019-12-11 2021-08-31 贝壳找房(北京)科技有限公司 信息获取方法和装置、电子设备和存储介质
US11822622B2 (en) * 2020-05-08 2023-11-21 Docusign, Inc. Machine learned feature recommendation engine in a digital transaction management platform
US11947571B2 (en) * 2021-04-20 2024-04-02 Microsoft Technology Licensing, Llc Efficient tagging of content items using multi-granular embeddings

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5940614A (en) 1991-04-18 1999-08-17 International Business Machines Corporation Hypertext control method and apparatus for displaying help information in an interactive data processing system
US5367621A (en) 1991-09-06 1994-11-22 International Business Machines Corporation Data processing method to provide a generalized link from a reference point in an on-line book to an arbitrary multimedia object which can be dynamically updated
US5359514A (en) 1993-08-03 1994-10-25 International Business Machines Corporation Method and apparatus for facilitating comprehension of on-line documents
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
US5963205A (en) * 1995-05-26 1999-10-05 Iconovex Corporation Automatic index creation for a word processor
US5930787A (en) 1995-09-27 1999-07-27 Sharp Kabushiki Kaisha Method for retrieving related word information, information processing apparatus, method for controlling related information display, and related information display apparatus
SG70025A1 (en) 1996-08-14 2000-01-25 Nippon Telegraph & Telephone Method and system for preparing and registering homepages interactive input apparatus for multimedia informations and recording medium including interactive input programs of the multimedia informations
US6189019B1 (en) * 1996-08-14 2001-02-13 Microsoft Corporation Computer system and computer-implemented process for presenting document connectivity
US6029182A (en) * 1996-10-04 2000-02-22 Canon Information Systems, Inc. System for generating a custom formatted hypertext document by using a personal profile to retrieve hierarchical documents
US5999929A (en) * 1997-09-29 1999-12-07 Continuum Software, Inc World wide web link referral system and method for generating and providing related links for links identified in web pages
US6092074A (en) 1998-02-10 2000-07-18 Connect Innovations, Inc. Dynamic insertion and updating of hypertext links for internet servers
US6178430B1 (en) * 1998-05-11 2001-01-23 Mci Communication Corporation Automated information technology standards management system
US6324551B1 (en) 1998-08-31 2001-11-27 Xerox Corporation Self-contained document management based on document properties
US6493702B1 (en) 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
EP1087306A3 (en) 1999-09-24 2004-11-10 Xerox Corporation Meta-documents and method of managing them
WO2001031479A1 (en) 1999-10-27 2001-05-03 Zapper Technologies Inc. Context-driven information retrieval
US7757168B1 (en) 2000-04-07 2010-07-13 Xerox Corporation Meta-document and method of managing
US20010047365A1 (en) * 2000-04-19 2001-11-29 Hiawatha Island Software Co, Inc. System and method of packaging and unpackaging files into a markup language record for network search and archive services

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023878A (ja) * 2004-07-07 2006-01-26 Quin Land Co Ltd データ抽出システム
JP2008508639A (ja) * 2004-08-02 2008-03-21 株式会社ジャストシステム 所望の機能を実現する排他プラグインを追加するための文書処理及び管理方法
JP2009205397A (ja) * 2008-02-27 2009-09-10 Internatl Business Mach Corp <Ibm> 検索エンジン、検索システム、検索方法およびプログラム
US8930372B2 (en) 2008-02-27 2015-01-06 International Business Machines Corporation Search engine, search system, search method, and search program product
JP2017527879A (ja) * 2014-07-18 2017-09-21 マイクロソフト テクノロジー ライセンシング,エルエルシー 向上したドキュメント生産性のためのエンティティ認識
US11120210B2 (en) 2014-07-18 2021-09-14 Microsoft Technology Licensing, Llc Entity recognition for enhanced document productivity
JP2015092412A (ja) * 2015-02-02 2015-05-14 富士通株式会社 アノテーション制御方法、アノテーション制御プログラム及びアノテーション制御システム
JP2020013521A (ja) * 2018-07-20 2020-01-23 カーベーセー グループ エンフェーKBC Groep NV 改善された要求ハンドリング
JP7206072B2 (ja) 2018-07-20 2023-01-17 カーベーセー グループ エンフェー 改善された要求ハンドリング
US11972490B2 (en) 2018-07-20 2024-04-30 Kbc Groep Nv Determining a category of a request by word vector representation of a natural language text string with a similarity value

Also Published As

Publication number Publication date
EP1284461A1 (en) 2003-02-19
JP4365074B2 (ja) 2009-11-18
US20030033287A1 (en) 2003-02-13
BRPI0203479B1 (pt) 2015-06-09
US6732090B2 (en) 2004-05-04
BR0203479A (pt) 2003-05-13

Similar Documents

Publication Publication Date Title
JP4365074B2 (ja) ユーザ定義可能なパーソナリティを備えた文書拡充システム
US6820075B2 (en) Document-centric system with auto-completion
US6778979B2 (en) System for automatically generating queries
US6928425B2 (en) System for propagating enrichment between documents
US7284191B2 (en) Meta-document management system with document identifiers
US7133862B2 (en) System with user directed enrichment and import/export control
US7117432B1 (en) Meta-document management system with transit triggered enrichment
Kowalski Information retrieval architecture and algorithms
US20050022114A1 (en) Meta-document management system with personality identifiers
JP3717808B2 (ja) 情報検索システム
JP2011154739A (ja) 文書探索サービス提供方法及びシステム
Kruschwitz Intelligent document retrieval: exploiting markup structure
Hollink Semantic annotation for retrieval of visual resources
Wambua et al. Interactive search through iterative refinement
Mamoon et al. Interactive visualization of retrieved information
Sugiyama Studies on Improving Retrieval Accuracy in Web Information Retrieval
Ozioko et al. LIS 303 INFORMATION RETRIEVAL (CATALOGUING II)
Šimko et al. State-of-the-art: Semantics acquisition and crowdsourcing
Rowe Exploiting captions for Web data mining
Balog et al. Understanding Information Needs
Penev Search in personal spaces
Rowe Exploiting Captions for Web Data Mining by Neil C. Rowe
Jucan et al. Ontology-Based Modeling and Recommendation Techniques for Adaptive Hypermedia Systems
Tseng Modelling users' contextual querying behaviour for web image searching
Tan et al. Multi-media based web mining for an information resource

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090728

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4365074

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term