JP3998706B2 - ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア - Google Patents

ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア Download PDF

Info

Publication number
JP3998706B2
JP3998706B2 JP2007505309A JP2007505309A JP3998706B2 JP 3998706 B2 JP3998706 B2 JP 3998706B2 JP 2007505309 A JP2007505309 A JP 2007505309A JP 2007505309 A JP2007505309 A JP 2007505309A JP 3998706 B2 JP3998706 B2 JP 3998706B2
Authority
JP
Japan
Prior art keywords
information
identifier
feature information
document data
thing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007505309A
Other languages
English (en)
Other versions
JPWO2007032095A1 (ja
Inventor
田村卓郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BITS Co Ltd
Original Assignee
BITS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BITS Co Ltd filed Critical BITS Co Ltd
Application granted granted Critical
Publication of JP3998706B2 publication Critical patent/JP3998706B2/ja
Publication of JPWO2007032095A1 publication Critical patent/JPWO2007032095A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンピュータシステムによってドキュメントデータ中に関連情報を表示する方法、システム及びコンピュータシステムにこの方法を実行させるためのソフトウェアプログラムに関する。
コンピュータの一般化による情報の電子化と、インターネットの普及による情報の流通による相乗効果により、利用可能な情報量が爆発的に増大している。例えば、バイオテクノロジーの分野においても、ゲノムプロジェクトをはじめとする巨大プロジェクトや測定技術などの科学技術の発達によって大量の情報が日々生み出されている。このような膨大な電子情報(テキストデータ)には、種々の研究、開発等に有益な体系的情報が含まれていることが多いため、その情報を活用する方法が検討されている。
例えば、インターネット上で広く普及している技術であるハイパーリンクを利用する方法がある。これは、テキストデータに含まれる特定の文字列等にハイパーリンクを埋め込み、ユーザがこの文字列等にカーソルを合わせてクリックすることで関連する他の情報を表示させるものである。この方法を利用することで、テキスト中の文字列等に関連した情報を瞬時に表示することができ、ユーザの利便性は向上する。
また、指定された範囲のテキストデータを自動翻訳するシステム(ソフトウェア)や、テキストデータに含まれる特定の文字列等にアノテーション(注釈)を与えるシステム(ソフトウェア)、及びテキストデータのコンテキストを解析したりシソーラス辞書を利用することで要約(抄録)を作成するシステム(ソフトウェア)なども実用化されている。これらのシステムを利用することで、外国語の文献、難解な用語等が頻出するテキスト、長文のテキスト等を有効活用できるようになる。
このような情報処理の方法としては、例えば、以下の先行文献が参考になる。
先行文献1:特開平5−313877号公報
先行文献2:特開平8−292958号公報
先行文献3:特開2000−10981号公報
先行文献4:特開2002−207727号公報
先行文献5:特開2003−6186号公報
しかしながら、上記した従来の方法は、何れも解決すべき課題が存在し、多くの電子情報が十分活用されないまま埋もれているのが現状である。
例えば、ハイパーリンクを利用する方法では、情報の提供者(テキストの作成者、発信者等)によってリンク元の文字列等とリンク先としての他の情報とが予め設定されているため、表示される情報が画一的であるという問題がある。ユーザがリンク元とリンク先とを独自に設定することも可能であるが、個々の文字列等毎に作業を繰り返す必要があるため、大量のドキュメントデータには不向きである。
また、自動翻訳やアノテーション付与、要約作成等のシステムは、予め用意された辞書データやルールなどに従ってテキストデータを画一的に加工しているに過ぎず、ユーザが欲しい情報が得られないおそれがある。
さらに、上記した従来の方法では、ユーザがドキュメントデータに含まれる複数の関連する事物について同一の情報(リンク先)を設定したい場合でも、ユーザがシソーラス辞書等を参照しながら作業することになり、統一的な処理は困難である。
本発明は、上記課題を解決するためになされたもので、大量のドキュメントデータについて、事物やキーワード毎に個別に作業を行うことなく、ユーザが参照したい特徴情報をそのドキュメント上に統一的に表示させ、ドキュメントデータの有効利用を図ることができる方法及びシステムを提供することを目的とする。
本発明の第1の主要な観点によれば、入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御手段を備えたコンピュータシステムによってドキュメントデータ中に関連情報を表示する方法であって、前記記憶装置は、遺伝子、生物種、学校、人物、企業、疾病、事件等の複数の事物の種類の情報(事物種類情報)、各事物に含まれる情報若しくは事物を特定する情報からなる事物の要素の情報(事物要素情報)、事物要素に含まれる及び/若しくは事物要素を特定する文字列、記号、数値などのテキストデータからなる識別子、ドキュメントデータ上に表示する事物の特徴情報(ファセット)の種類、及び前記事物要素と特徴情報の種類とに関連付けられた当該特徴情報、を事物の識別情報に関連付けて格納するデータライブラリと、前記制御手段によって実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と、を備え、前記制御手段が、コンピュータソフトウェアを読み出して実行させることで、前記入力装置から、ドキュメントデータから抽出する事物種類及びドキュメントデータ中に表示する特徴情報の種類の選択を受け付ける選択受付工程と、前記データライブラリから、選択に係る事物に含まれる情報若しくは事物を特定する情報からなる事物要素と、この事物要素に含まれる及び/若しくは事物要素を特定する識別子と、を検索する検索工程と、読出し手段によって読み出されたドキュメントデータから、前記検索工程で検索された識別子を特定し事物要素として識別する識別子特定工程と、前記データライブラリから、前記識別された事物要素の特徴情報を検索する特徴情報検索工程と、検索された特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示する特徴情報表示工程とを実行することを特徴とする方法が提供される。
ここで、「事物」とは、遺伝子、タンパク質、化学物質、生物種、臓器、細胞組織、等の実在する一般的な物と、人物、大学、企業、国、地方(地域)、政党等の固有の物と、疾病、事件、宗教、政治思想、歴史などの抽象的な事象、などが全て含まれる。また、「特徴情報」とは、例えば「遺伝子」という事物に対しては、遺伝子座(Locus)、サイズ、GCコンテンツ、絶対発現量、組織特異的発現頻度、生物学的機能、構造情報、局在情報などの情報を、また「特定の研究者」を事物とする場合には、その年齢、性別、所属研究機関、専門分野、インパクトファクターなどの情報を、夫々テキストデータ(数値や定義、解説等)、図表などで視覚的に表したものである。
例えば、事物として「遺伝子」が選択され、特徴情報として「組織特異的発現頻度」が選択された場合に、ドキュメントデータ中で検出された遺伝子を表す識別子の側に、対象遺伝子の組織特異的発現量を表すグラフを表示する。これにより、例えば、疾病に至る遺伝子の相互作用に関するドキュメント中に現れる遺伝子について、組織特異的発現の情報を参照しながら、元々記述された内容を容易に解釈することが可能となる。特に、バイオテクノロジーなどの未解明の領域が多い研究分野では、既知の情報であっても相互参照することで新たな知見を見出すことが少なくないため、本発明によって研究者等のユーザに非常に有益な情報を提供できることになる。
また、本発明の第2の主要な観点によれば、入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御手段を備え、ドキュメントデータ中に関連情報を表示する情報処理システムであって、前記記憶装置は、遺伝子、生物種、学校、人物、企業、疾病、事件等の複数の事物の種類の情報(事物種類情報)、各事物に含まれる情報若しくは事物を特定する情報からなる事物の要素の情報(事物要素情報)、事物要素に含まれる及び/若しくは事物要素を特定する文字列、記号、数値などのテキストデータからなる識別子、ドキュメントデータ上に表示する事物の特徴情報(ファセット)の種類、及び前記事物要素と特徴情報の種類とに関連付けられた当該特徴情報、を事物の識別情報に関連付けて格納するデータライブラリと、前記制御手段によって実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と、を備え、前記入力装置から、ドキュメントデータから抽出する事物種類及びドキュメントデータ中に表示する特徴情報の種類の選択を受け付ける選択受付手段と、前記データライブラリから、選択に係る事物に含まれる情報若しくは事物を特定する情報からなる事物要素と、この事物要素に含まれる及び/若しくは事物要素を特定する識別子と、を検索する検索手段と、読出し手段によって読み出されたドキュメントデータから、前記検索手段が検索した識別子を特定し事物要素として識別する識別子特定手段と、前記データライブラリから、前記識別された事物要素の特徴情報を検索する特徴情報検索手段と、検索された特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示する特徴情報表示手段とを有することを特徴とするシステムが提供される。
このような構成によれば、コンピュータシステムによって上記した第1の主要な観点におけるドキュメントデータ管理方法を好適に実現できるドキュメントデータ管理システムを得ることができる。
さらに、本発明の第3の主要な観点によれば、入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御手段を備えたコンピュータシステムの前記記憶装置に格納され、このコンピュータシステムをドキュメントデータ中に関連情報を表示させる情報処理システムとして機能させるためのコンピュータソフトウェアであって、前記記憶装置は、遺伝子、生物種、学校、人物、企業、疾病、事件等の複数の事物の種類の情報(事物種類情報)、各事物に含まれる情報若しくは事物を特定する情報からなる事物の要素の情報(事物要素情報)、事物要素に含まれる及び/若しくは事物要素を特定する文字列、記号、数値などのテキストデータからなる識別子、ドキュメントデータ上に表示する事物の特徴情報(ファセット)の種類、及び前記事物要素と特徴情報の種類とに関連付けられた当該特徴情報、を事物の識別情報に関連付けて格納するデータライブラリと、前記制御手段によって実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と、を備え、前記コンピュータソフトウェアが、前記入力装置から、ドキュメントデータから抽出する事物種類及びドキュメントデータ中に表示する特徴情報の種類の選択を受け付ける手順と、前記データライブラリから、選択に係る事物に含まれる情報若しくは事物を特定する情報からなる事物要素と、この事物要素に含まれる及び/若しくは事物要素を特定する識別子と、を検索する手順と、読出し手段によって読み出されたドキュメントデータから、前記検索された識別子を特定し事物要素として識別する手順と、前記データライブラリから、前記識別された事物要素の特徴情報を検索する手順と、検索された特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示する手順とを前記コンピュータシステムに実行させることを特徴とするコンピュータソフトウェアが提供される。
このような構成によれば、コンピュータシステムにインストールされて実行されることで、上記した第2の主要な観点におけるドキュメントデータ管理システムを構築し、第1の主要な観点におけるドキュメントデータ管理方法を好適に実現させることができるコンピュータソフトウェアを得ることができる。
本発明によれば、大量のドキュメントデータについて、事物やキーワード毎に個別に作業を行うことなく、ユーザが参照したい特徴情報をそのドキュメント上に統一的に表示させ、ドキュメントデータの有効利用を図ることができる。これにより、従来は、事物や事物に含まれる/事物を特定する要素等の特徴情報や専門知識等を保有する一部のユーザだけが可能であった内容の把握や新たな発見を、一般ユーザでも容易に実践することが可能となる。
以下、本発明の最良の実施形態を、図面を参照して具体的に説明する。
図1は、本発明の一実施形態に係るドキュメントデータ管理システムの概略構成を示す図である。このシステム1は、通信ネットワークを介して接続される利用者用クライアントシステム2及び情報提供サーバシステム3によって構成される。利用者用クライアントシステム2及び情報提供サーバシステム3は、何れも汎用のコンピュータシステムを利用できる。
利用者用クライアントシステム2は、制御手段としてのCPU5に、RAM6、HDDやROMなどの記憶装置7、及び入出力インタフェース(I/F)8が通信バス9を介して接続され、この入出力I/F8に、LEDディスプレイなどのディスプレイ装置10、マウスやキーボードなどの入力装置11、モデム等の通信デバイス12、CD−ROMやDVD−ROMなどのリムーバブル記録媒体用のドライブ13等が接続されたハードウェア構成を有する。後述する本発明の特徴的な処理機能は、前記記憶装置7のプログラム格納部14にインストールされたコンピュータソフトウェア(情報表示ソフトウェア15やシステムソフトウェア16)がCPU5によってRAM6上に呼び出され、OS(オペレーションシステム)と協働して実行されることで実現される。
また記憶装置7は、前記プログラム格納部14の他、システムソフトウェア16の動作を補助する利用情報格納部17を備えている。この利用情報格納部17は、電子化された事物、この事物に含まれる若しくは事物を特定する情報である1以上の要素、各事物に対して提供される情報の種類(ファセット)、各要素の識別子、各要素のファセットにおけるデータなどの情報を格納するものである。ここで、種類(ファセット)は、表示する特徴情報の種類(グラフ、フォント、図表等)、大きさ、色などの付加情報を指す。利用情報格納部17に格納されるデータについては後述する。
前記情報表示ソフトウェア15は、例えばWebブラウザの様なソフトウェアであり、ドキュメントデータを取得すると、通信ネットワーク経由で情報提供サーバシステム3と交信して後述するサービス情報格納部20に格納された特徴情報を取得して、利用者用クライアントシステム2のディスプレイ装置10に表示するデータを生成するものである。
システムソフトウェア16は、ユーザが入力装置11で入力した情報の受け付け、前記利用情報格納部17の情報の暗号化・復号化処理、ドキュメントデータの所定位置に特徴情報を埋め込む処理等を行うものである。このシステムソフトウェア16の詳細な機能はフローチャートを参照して後述する。
一方、前記情報提供サーバシステム3は、WWWネットワークを通じて利用者用クライアントシステム2に対して情報を提供するWebサーバの機能を備えている。この情報提供サーバシステム3は、利用者用クライアントシステム2と同様のハードウェア構成を備えており(図示は省略)、記憶装置には、事物の特徴情報を事物の識別情報(ID)に関連付けて格納する前記サービス情報格納部20とユーザログイン情報等を格納するユーザ情報データベース(DB)21とを備えている。また、情報提供サーバシステム3は、利用者用クライアントシステム2の情報表示ソフトウェア15からアクセスされた場合に、サービス情報格納部20から必要な情報を検索して受け渡す情報提供ソフトウェア22を備えている。
次に、図2を参照して前記利用情報格納部17及びサービス情報格納部20に格納されるデータを具体的に説明する。これらは、以下に列挙するテーブル、格納部が事物IDなどで相互にデータ参照可能なリレーショナルデータベースで構成される。
まず、利用情報格納部17は、事物種類情報テーブル17a、ユーザ用無効識別子情報テーブル17b、ファミリー識別子情報テーブル17c、事物要素情報テーブル17d、事物ファセット情報テーブル17e、事物要素識別子情報テーブル17f、ユーザ用事物要素識別子情報テーブル17g及び事物要素間情報テーブル17hを備えている。
事物種類情報テーブル17aには、注目する情報の種類である事物の種類に関するマスタIDである事物ID、事物名称及び事物の定義が格納される。事物としては、例えば、遺伝子、タンパク質、化学物質、生物種、臓器、細胞組織、人物、企業、大学、疾病、事件などが挙げられる。ユーザ用無効識別子情報テーブル17bには、特定の種類(属性)の事物において、ユーザが常に無効としたい識別子が格納される。ファミリー識別子情報テーブル17cには、特定の種類の事物において、先頭指定文字数以上の共通部分を有し、末尾または空白を挟んだ末尾が一連の数値あるいは一連のアルファベットである識別子について、先頭の共通部分を一連の事物要素に関連した識別子(ファミリー識別子)が格納される。事物要素情報テーブル17dには、対象事物に含まれる個々の要素に関する情報(事物ID、要素ID、代表要素名)が格納される。例えば、事物「遺伝子」の要素としては、「AKAP10」「AKIP」「AKT1」「ALDH1A1」などがある。
事物ファセット情報テーブル17eには、事物ID、ファセットID、ファセットデータアクセスURL及び表示データオプションが格納される。すなわち、対象事物に関して提供可能な情報(ファセット)の種類を格納する。例えば、「遺伝子」という事物に対するファセットとして「サイズ」「機能」「絶対発現量」などである。ここで、ファセットデータアクセスURLは、事物ID、要素ID、ファセットID、表示データオプションを元にファセットデータにアクセスするためのURLである。また、表示データオプションは、ファセットデータの表示において選択可能なオプションである。例えば、表示サイズ、表示色、上限・下限、直線・対数メモリ、表示データをクリックされた際にジャンプする先を示すハイパーリンク等の、対象ファセットの表示形態において選択可能なオプションの情報である。
事物要素識別子情報テーブル17fには、事物ID、要素ID、その要素IDを表す識別子が格納される。ここには、要素IDで識別される要素の代表要素名及び別名が格納される。例えば、代表識別子「ALDH1A1」を持つ要素の識別子として、「ALDH1A1」、「ALDC」「ALDH1」「AL1A1_HUMAN」「P00352」「M31994」「ENAG00000165092」「EC1.2.1.36」などが登録される。本テーブル17fに格納されるレコードを、事物IDで分類される要素ID毎に纏めたものが、その事物についての識別子辞書となる。
また、この事物要素識別子情報テーブル17fには、先頭指定文字数以上の共通部分を持ち、末尾または空白を挟んだ末尾が一連の数値あるいは一連のアルファベットである複数の識別子について、先頭の共通部分を一連の事物要素に関連付けた識別子(ファミリー識別子)が登録される。これにより、ドキュメントデータ中の識別子の認識率を向上させることができる。
例えば、事物「蛋白質」には要素として「Keratin1」「Keratin2」「Keratin3」・・・が存在するが、ドキュメントデータ中ではこれらが区別されずに単に「Keratin」と記載されることが多い。この「Keratin」を「Keratin1」「Keratin2」等のファミリー識別子として登録することにより、一連の「Keratin」をドキュメントデータ中の識別子「Keratin」に対応付けることが可能となる。このようなファミリー識別子は、一般の多義識別子の場合と同一のユーザインタフェースにより、複数の関連付けられた事物要素の情報やファセットデータを表示し、また、デフォルトを選択することが可能である。
ユーザ用事物要素識別子情報テーブル17gには、特定の種類の事物において、ユーザが独自に定義した識別子と、当該識別子に関連した事物要素のIDとが格納される。事物要素間情報テーブル17hには、同一または異なる種類の事物における2つの異なる事物要素とその間の関係を格納される。要素間の関係としては、方向性の有無や関係の強度等が含まれる。
また、サービス情報格納部20は、オリジナル情報テーブル20a、データ生成情報テーブル20b、オリジナル要素情報テーブル20c、ファセット情報テーブル20d、及びID変換情報テーブル20eを備えている。
オリジナル情報テーブル20aには、オリジナル情報ID、オリジナル情報サイトのURL及びオリジナル情報の定義が格納される。データ生成情報テーブル20bには、オリジナルの情報からファセットデータを生成するための情報(ファセットID、オリジナル情報ID及びデータ変換条件)が格納される。オリジナル要素情報テーブル20cには、オリジナル情報ID、オリジナル要素ID及びオリジナルデータが格納される。
ファセット情報テーブル20dには、対象要素に対して対象ファセットで提供される情報が格納される。ID変換情報テーブル20eには、要素IDとそれに対応したオリジナル要素IDが格納され、ファセット情報とオリジナルの要素情報との対応付けを行う。
上記した情報のうち、オリジナル情報テーブル20a、データ生成情報テーブル20b、オリジナル要素情報テーブル20c及びID変換情報テーブル20eの情報を元に、オリジナルの情報から、ファセット情報を生成することが可能となる。なお、事物要素に対応するオリジナル要素情報が存在せず、ファセットデータが生成できない場合は、情報提供ソフトウェア22が、ファセットデータが存在しないことを示すテキストやイメージ(「データなし」の文字や「?」のアイコン等)を生成することにより、ファセットデータが存在しないことを明示するようにしてもよい。
これらの情報は、公開鍵暗号を用いて暗号化することにより、データ開発者・作成者が開発した識別子辞書やファセットデータが、開発者が予期しない改ざんを受けることを避けることが好ましい。すなわち、データ開発者等が開発したオリジナルデータを秘密鍵で暗号化し、システムソフトウェア16が、この開発者から公開された公開鍵を用いて、情報を復号化してこれを用いることが有効である。
このような簡潔なデータ構造およびデータ間の独立性により、また、暗号化処理により、第三者が本システムでの利用を目的として、事物要素、識別子辞書、ファセットデータ等を独立に、あるいはセットとして容易に開発し、提供することが可能になる。
ここで、対象となるファセットとしては、例えば、事物「生物種」の各要素に対するファセット「生物種イメージ」(後述する図9(b)参照)の様に、1レコードずつ作製したり、測定されたりしたものの他に、例えば、事物「遺伝子」におけるファセット「サイズ」の様に、各要素について存在するオリジナルの情報から情報処理的に生成されるものがある。
次に、図3のフローチャートを参照して、前記システムソフトウェア16が実行する情報処理の工程を説明する。以下の説明においては、情報提供対象の事物として「遺伝子」を、情報を付加する内容であるファセットとして、「サイズ」を指定した例を示す。
まず、情報表示ソフトウェア15が電子化されたドキュメントデータを取得してディスプレイ装置10に表示すると、(ステップS1)、ユーザからそのドキュメントデータに含まれるどの事物についてどういう種類の情報(ファセット)を付加情報として得たいかの選択を受け付ける(ステップS2)。この例では、「遺伝子」という事物について「サイズ」というファセットが選択される。システムソフトウェア16は、利用情報格納部17から、選択された事物(遺伝子)に対応する識別子辞書(図2の事物要素識別子情報テーブル17i参照)をロードする(ステップS3)。この識別子は、対象とする事物(遺伝子)に含まれる特定の要素を識別可能なタームやIDの集合であり、1つの要素を特定する複数の識別子が存在する。
次いで、システムソフトウェア16は、ドキュメントデータの中から前記識別子を探索(マッピング)し、対象事物の要素として識別する(ステップS4)。なお、ドキュメント中に埋め込まれた非表示情報も探索対象とすることもできる。このマッピングによって識別された要素に隣接してその要素に関する特徴情報を、選択されたファセット(サイズ)に従って、静的あるいは動的に提供する情報提供ソフトウェア22へのリンクを埋め込む(ステップS5)。情報表示ソフトウェア15は、ドキュメントデータ中に埋め込まれたリンクに従って特徴情報を取得し、ドキュメントデータ表示の中に展開して、あるいはドキュメントデータ表示にオーバーラップして特徴情報を表示する(ステップS6)。なお、ステップS4で探索された識別子が複数の要素を同時に示す多義識別子である場合は、前記情報表示ソフトウェア15は、多義識別子であることを示すテキスト(「多義識別子」「M」という文字)やイメージ(アイコン等)を表示したり、この識別子が示す複数の要素を並べて表示したり、さらに、表示対象とする要素を選択可能なユーザインターフェース(選択メニューなど)を生成してディスプレイ装置10に表示する。情報表示ソフトウェア15は、この選択メニュー等で選択された要素について特徴情報の表示処理を実行する。
また、特徴情報を表示した後、ユーザから事物の変更を受け付けた場合(ステップS7)には、前記システムソフトウェア16及び情報表示ソフトウェア15は、変更された事物に基づいて上記ステップS3〜S6の処理を実行する。さらに、ファセットの変更を受け付けた場合(ステップS8)には、変更にかかるファセットに従ってステップS4〜S6の処理を実行する。また、新しいドキュメントデータを取得した場合で(ステップS9)、同一の事物及びファセット情報が引き続き選択されている場合には、新しいドキュメントデータに対してステップS4〜S6の処理が実行される。
次に、図4〜図16の表示画面等の例を参照して、本発明の動作及び機能を具体的に説明する。
まず、図4は、利用者用クライアントシステム2におけるユーザインタフェースの例である。本実施例において、ユーザインタフェースは、Webブラウザにおいてツールバー30として実装されている。このツールバー30は、情報の表示/非表示を切り替えるチェックボックス31、事物を選択するプルダウンボタン32、ファセットを選択するプルダウンボタン33、識別子マッピングを再実行するボタン34、認識された識別子のハイライト表示/非表示の切換ボタン35、マッピング情報パネルの表示/非表示の切換ボタン36、及び動作オプションを設定するためのダイアログボックスを開くためのオプションボタン37を備える。ここで、前記再実行ボタン34は、識別子マッピングのパラメータを変更して再実行する際に便利である。例えば、後述する図11の識別子認識状況のテーブル表示において、多義識別子でデフォルト表示する事物要素を設定した後に、マッピングを再実行する場合である。このように、複数のコマンドをツールバーに実装することにより、簡便に機能を利用することが可能となる。
また、事物を選択するプルダウンボタン32をクリックするとプルダウンメニュー38が表示される。また、事物として「Gene Symbol」が選択されている際に、ファセット選択プルダウンボタン33をクリックするとプルダウンメニュー39が表示される。このインタフェースによって、1種類の事物と、ファセットとが選択可能である。
図5は、図4のユーザインタフェースにおいてオプションボタン37をクリックした場合に表示される動作オプション設定ダイアログボックス40の例である。この動作オプション設定ダイアログボックス40は3つのタブによって切り替えられる設定項目Display41と、Activate42と、Dictionary43とを有する。この図では、Display設定タブ41を開いた例を示している。このタブ41では、ファセット情報をドキュメントデータ内に埋め込んで表示するか、オーバーラップして表示するかを選択するオーバーラップ設定ボックス45、ドキュメントデータ中で要素として認識された識別子をハイライト表示するかどうかを設定するハイライトテキスト設定ボックス46、複数の事物(47a)及び複数のファセット(47b)で指定されるファセット情報を表示するかの設定ボックス47、ドキュメントデータ上の同じ位置で長い識別子と短い識別子とが認識された場合に、認識範囲が他の識別子の認識範囲内である識別子(短い識別子)を無視し、長い識別子を優先的に表示させるオプション設定ボックス48、及びドキュメントデータ中において、同一の要素が複数個認識された場合に、1個目の要素についてのみファセット情報を表示させるかのオプション設定ボックス49を有する。
ここで、前記ハイライトテキスト設定46では、テキスト色及び背景色の設定46a、46bも用意されている。また、複数の事物あるいはファセットデータを表示する場合の表示順序は、表示情報選択リストボックス47a、47bにおける表示順序により決定される。これらのリストボックス47a、47bにおける表示順序は、表示順変更ボタン47cにより変更できる。さらに、例えば、事物「遺伝子」において同じ位置で「kinesin」と「kinesin receptor」という複数の識別子が認識された場合に、前記識別子優先表示オプション設定49がonにされていると、前者の「kinesin」の識別子は無視される。
図6は、図5の動作オプション設定ダイアログボックス40において、Activateタブ42を開いた例である。ここでは、図4のユーザインタフェース及び図5の動作オプション設定ダイアログボックス40のDisplayタブ41において表示する事物リストに表示する事物、及びファセットリストに表示するファセットを選択する項目50、51を有する。
また、ファセット表示におけるオプションを設定する項目52〜60を有する。具体的には、ファセットデータ生成のためのパラメータとして、生成するタイプの設定52、表示サイズの設定53、及び生成パラメータ54〜60の設定を有する。生成タイプとしては、テキスト、グラフ(円、棒、折れ線、複数の棒、パイその他)、イメージ、カスタムが指定可能である。また、それぞれの生成タイプに対応した、生成パラメータが指定できる。例えば、グラフの生成においては、色の指定54、グラフの向き55、最大値56、最小値57、標準化する/しないの設定58、対数変換(logN)する/しないの設定59、ルーラの表示/非表示の設定60などが指定可能である。また、設定内容をその場で確認できるサンプル61も表示される。
図7は、図5又は図6の動作オプション設定ダイアログボックス40において、Dictionaryタブ43を開いた例である。この画面では、前記利用情報格納部17に格納される、指定した事物に対応した識別子の辞書において、ユーザが追加した識別子や、無効にしたい特定の識別子を設定できるユーザインタフェースを提供する。
そのため、このユーザインタフェースでは、対象となる事物に対応した辞書名を表示・変更するテキストボックス63、新規登録したい識別子を入力するテキストボックス64、及び無効化された識別子を一覧表示するテキストボックス65を備えている。
識別子を追加する場合には、識別子入力テキストボックス64にユーザの識別情報と対応する要素IDを入力して登録する。なお、この識別子入力テキストボックス64を使用して追加した識別子を削除することも可能である。
また、特定の識別子を無効化(属性を登録)したい場合には、無効化識別子を追加するボタン66をマウスでクリックし、図示しない入力ボックスを表示させる。無効化が選択されると、前記ユーザ用無効識別子情報テーブル17bにその識別子のIDが登録され、前記情報表示ソフトウェア15がこのテーブル17bを参照して特徴情報を表示するかを判別する。なお、ユーザは、無効化済識別子表示テキストボックス65から、無効化を解除したい識別子を選択して、削除ボタン67をクリックすることで個別に無効化を解除することもできる。
例えば、ユーザが参照するドキュメントデータにおいて、ある事物の識別子が、別の意味を持つターム等と同一である場合に、ユーザが意図した事物と異なる事物とが同一の事物と認識され、共通の特徴情報がドキュメントデータ中に表示されるおそれがある。具体的には、事物が「ヒト遺伝子」である場合、ヒト遺伝子「peptide deformylase-like protein」を指す識別子には、adobe社のドキュメントファイル形式の名称である「PDF(Portable Document Format)」と同一の「PDF」が含まれる。そのため、後者を含むドキュメントデータでは前者だけを識別することはできない。そこで、このような場合には、当該識別子「PDF」を無効にできるようにした。
また、このユーザインタフェースでは、ユーザによる特定の識別子の追加若しくは無効化の設定が、永続的、一連の処理(セッション)中の複数のドキュメントデータ、若しくは現在表示中の特定のドキュメントデータ、の何れかであるかも選択できるように設計するのが好ましい。なお、ユーザが常にその識別子を無効にしたい場合は、無効識別子を利用情報格納部17に別途格納し、システムソフトウェア16が識別子辞書を利用する際に制限する機能が有効である。
また、一連のセッション中に、あるいは当該ドキュメントデータ中で、特定の識別子を無効にするためのユーザインタフェースとしては、情報表示ソフトウェア15によって当該識別子が識別されることにより表示されるファセットデータを、マウスで右クリックすることでポップアップメニューを表示させ、このメニューの中に実行コマンド(セッション中無効、ページ中で無効)を用意することが効果的である。
図8は、利用者用クライアントシステム2の情報表示ソフトウェア(Webブラウザ等)15やシステムソフトウェア16が稼動してドキュメントデータを表示した例である。この例では、事物「Protein」、ファセット「BM」が選択されている。ここで、BMは、10の生体組織における遺伝子発現頻度パターンデータである。表示されたドキュメントデータから「Protein」を表す「CDC2」「CDK1」などの識別子68、68が識別されてハイライト表示されると共に、これらの識別子68の隣に、ファセットデータである10組織での発現頻度パターンを示す棒グラフ69が表示されている。この例で示した棒グラフ69などのファセットデータは、前記情報提供ソフトウェア22がオリジナル要素情報テーブル20cを参照して動的に生成する。即ち、この利用者用クライアントシステム2から要求された時点で生成することが可能である。そのためユーザは、利用者用クライアントシステム2において設定を変えて、リアルタイムで表示形態を変更することが可能である。
ユーザは、識別子68をマウスで左クリックすることにより、事物情報の管理者(データ開発者若しくは提供者)が設定した事物要素へのハイパーリンクを、また、ファセットデータ(棒グラフ69)をマウスで左クリックすることにより、ファセットデータの管理者(データ開発者あるいは提供者)が設定したファセットデータへのハイパーリンクを、夫々利用することができる。また、マウスの右クリックにより表示されるポップアップメニューには、事物情報の管理者(データ開発者あるいは提供者)が設定した事物情報リソースや事物要素へのハイパーリンク、及びファセットデータの管理者が設定したファセットデータ情報へのハイパーリンクを利用することが可能になる。また、複数の意味を有する多義識別子のリスト表示とリストからの選択、特定の識別子の無効化、ユーザによるクレーム報告のためのコマンド等が利用可能である。多義識別子の選択および識別子の無効化処理の対象については、永続的、一連の処理(セッション)中の複数のドキュメントデータ、若しくは現在表示中の特定のドキュメントデータ、の何れかをユーザが選択できるコマンドをメニューアイテムとして用意するのが好ましい。
図9は、オリジナル要素情報テーブル20cから動的に生成可能なファセットデータの例である。例えば、テキスト70a、円グラフ70b、棒グラフ70c、染色体上の位置情報であるローカス情報70d、メモリ付き棒グラフ70e、複数棒グラフ70f、パイグラフ70gなどである。それぞれ、表示サイズ、色の指定、縦横表示の指定、オリジナル情報における下限・上限値指定や直線・対数変換指定等が可能である(図6参照)。
図10(a)〜(c)は、利用者用クライアントシステム2の情報表示ソフトウェア(Webブラウザ等)15やシステムソフトウェア16を稼動させてドキュメントデータを表示する例である。この例では、事物「Species(生物種)」、ファセット「Picture」が選択されている。図10(a)の情報表示オフの状態から、チェックボックス72をマウスでクリックすると、図10(b)の情報表示オンの状態になる。この状態では、図10(c)で拡大して示すように、ドキュメントデータ中の生物の学名(識別子)73の側に各生物のイメージ(特徴情報)74が夫々表示される。
図11は、利用者用クライアントシステム2で処理した情報の履歴を管理し、集計して利用可能とする機能を示す図である。この図では、事物として「遺伝子」(gene)において、複数のページで、「Cdc2」「Cdk1」「Cdk2」の各遺伝子が認識された例を示す。この履歴管理機能は、過去に処理したドキュメントデータ(ページ)において認識された要素情報が、図11(a)に示すように、事物76又はページ77の単位でツリー表示される。このツリーから事物又はページをマウスでクリックすると、該当する事物若しくはページが表示される。また、図11(b)に示すように、認識された要素を集計して表形式で表示させることもできる。
図12は、多義識別子の処理を説明するための図である。要素の名称を識別子とする場合は、多義語など1の識別子が複数の要素に対応する場合がある。この様な場合、ドキュメントデータの中で認識した識別子が複数の要素に対応することを、例えばアイコン80で表示するのが好ましい。ユーザが、このアイコン80にマウスのポインタを合わせたり右クリックすると、対応する要素の代表的な名称(=代表識別子)と特徴情報とを含むポップアップ画面81を表示し、ユーザがリストの中から特定の要素を選択できるようにする。この画面81で特定の要素が選択された場合には、アイコン80が選択された要素の特徴情報に変更されたり、選択された要素の特徴情報がアイコン80に併記される。
また、このように特定の事物を選択させる場合は、その事物と識別子との関連付けが、永続的、一連の処理(セッション)中の複数のドキュメントデータ、若しくは現在表示中の特定のドキュメントデータ、の何れかであるかをユーザが選択できるコマンドをメニューアイテムとして用意するのが好ましい。この場合、テキストマイニングの手法によって、当該複数事物の中で、対象ドキュメントにふさわしい事物を選択候補の上位に表示したり、デフォルトの選択候補とすることも有効である。
一方、図12の紙面左側の表示部82には、紙面右側のドキュメントデータの該当ページにおいて認識された識別子のリスト82aや要素選択のインタフェース82bが表示される。認識された識別子の中には、上記した多義識別子も含まれる。この表示部82は、対象ドキュメントに存在する要素や、その多義性の情報を提供する有効なインタフェースとなる。
図13は、辞書情報表示機能を示す図である。この図の表示画面は、前記利用情報格納部17(事物要素識別子情報テーブル17f)に格納される識別子の辞書に関する情報の表示部83、及びサービス情報格納部20(ファセット情報テーブル20d)に格納されたファセットデータに関する情報の表示部84を備えている。このような識別子辞書に含まれる識別子の数や事物要素の数、識別子辞書の構築に用いたリソースの情報等を、テキスト、イメージ、リソース情報を提供するWebサイトやその他の関連情報を取得できるハイパーリンクはユーザに有益な情報となる。
図14は、事物「蛋白質」において、ドキュメントデータ中で認識された事物要素である各種蛋白質のヒトゲノム上の存在位置を、情報パネルのマップタブ86に表示したヒト全染色体概略図上で表示した例である。また図15は、同じくドキュメントデータ中で認識された各種蛋白質の種類における事物要素全体における分子量の分布(対数頻度)を情報パネルのマップタブ87に表示した例である。このように、情報パネルのマップタブでは、選択されている事物に対応して利用可能なマップをプルダウンメニューから選択して、ドキュメントデータ中で認識された識別子を、地図、図表、グラフなど、事物に応じた情報にマッピングすることで、認識された事物要素の概要を容易に知ることができる情報を提供できる。
なお、この発明は上記の実施形態に限定されるものではなく、発明の要旨を変更しない範囲で種々変形可能である。
例えば、上記の実施形態では、本システム1を利用者用クライアントシステム2と情報提供サーバシステム3とで構成したが、利用者用クライアントシステムだけで構成することもできる。この場合は、図16に示すように、利用者用クライアントシステム200にサービス情報格納部20及び情報提供ソフトウェア22を備えるように構成する。この場合の特徴情報は、WWWを通じてWEBサーバからダウンロードしてもよいし、CD−ROMなどの記憶媒体から導入してもよい。
また、利用情報格納部17に格納した識別子辞書の情報について、事物種類情報の管理者(作成者を含む。以下同様)に対して報告する機能を備えてもよい。この機能は、前記利用情報格納部17に格納される識別子辞書に存在しない識別子や、識別子に対応する要素IDの誤り、若しくは識別子に対応する要素IDにより表示されるファセットデータに対するクレーム(不備、不足等)を、ユーザが事物種類情報の管理者に対して報告する機能である。これにより、識別子辞書の精度を高めることができる。
これを実現するユーザインタフェースとして、識別子辞書に存在しない識別子の報告は、ユーザの識別子登録における登録確認ダイアログボックスに用意する新規識別子報告ダイアログボックスが有効である。また、識別子に対応する要素IDの誤り、及びファセットデータに対するクレームについては、情報表示ソフトウェア15によって当該識別子が識別されることにより表示されるファセットデータをマウスで右クリックすることによりポップアップメニューを表示させ、このメニュー中にクレームダイアログボックスをオープンする機能を用意することが効果的である。
また、本発明においては、ファセット(特徴情報)として複数の事物若しくは要素の間の関係を表示するようにしてもよい。例えば、図17に示すように、ドキュメントデータから抽出された識別子によって特定される事物(Protein)において、複数(図示の例では5個)のタンパク質(要素)間の相互作用を特徴情報として識別子の近傍に埋め込んで若しくはオーバーラップして表示する。このような複数要素間の関係は、図2の事物要素間情報テーブル17hに格納される。これにより、個々の事物若しくは要素だけを参照した場合には得られない(得られにくい)新たな知見を得るための有益な情報を提供できる。
図1は、本発明の実施形態のシステム構成を示す概略図である。 図2は、同、各データベースの関係を示すスキーマ概略図である。 図3は、同、処理工程を示すフローチャートである。 図4は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例を示す図である。 図5は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例を示す図である。 図6は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例を示す図である。 図7は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例を示す図である。 図8は、利用者用クライアントシステムにおけるシステム動作例を示す図である。 図9は、ファセットデータの一例を示す図である。 図10は、利用者用クライアントシステムにおけるシステム動作例を示す図である。 図11は、履歴機能の動作例を示す図である。 図12は、利用者用クライアントシステムにおけるシステム動作例(多義識別子の処理)を示す図である。 図13は、利用者用クライアントシステムにおけるシステム動作例(辞書情報表示機能)を示す図である。 図14は、利用者用クライアントシステムにおけるシステム動作例(ヒトゲノム上の存在位置)を示す図である。 図15は、利用者用クライアントシステムにおけるシステム動作例(分子量の分布)を示す図である。 図16は、本発明の変形例のシステム構成を示す概略図である。 図17は、特徴情報の他の表示例を示す図である。

Claims (18)

  1. 入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御手段を備えたコンピュータシステムによってドキュメントデータ中に関連情報を表示する方法であって、
    前記記憶装置は、
    遺伝子、生物種、学校、人物、企業、疾病、事件等の複数の事物の種類の情報(事物種類情報)、各事物に含まれる情報若しくは事物を特定する情報からなる事物の要素の情報(事物要素情報)、事物要素に含まれる及び/若しくは事物要素を特定する文字列、記号、数値などのテキストデータからなる識別子、ドキュメントデータ上に表示する事物の特徴情報(ファセット)の種類、及び前記事物要素と特徴情報の種類とに関連付けられた当該特徴情報、を事物の識別情報に関連付けて格納するデータライブラリと、
    前記制御手段によって実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と、を備え、
    前記制御手段が、コンピュータソフトウェアを読み出して実行させることで、
    前記入力装置から、ドキュメントデータから抽出する事物種類及びドキュメントデータ中に表示する特徴情報の種類の選択を受け付ける選択受付工程と、
    前記データライブラリから、選択に係る事物に含まれる情報若しくは事物を特定する情報からなる事物要素と、この事物要素に含まれる及び/若しくは事物要素を特定する識別子と、を検索する検索工程と、
    読出し手段によって読み出されたドキュメントデータから、前記検索工程で検索された識別子を特定し事物要素として識別する識別子特定工程と、
    前記データライブラリから、前記識別された事物要素の特徴情報を検索する特徴情報検索工程と、
    検索された特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示する特徴情報表示工程と
    を実行することを特徴とする方法。
  2. 請求項1の方法において、
    前記データライブラリは、識別子として、少なくとも事物若しくは事物要素の名称と、その同義語とを格納するものであることを特徴とする方法。
  3. 請求項2の方法において、
    前記特徴情報表示工程は、ドキュメントデータ上で特定した識別子に複数の事物若しくは事物要素が対応する場合に、前記データライブラリを参照して当該複数の事物若しくは事物要素の特徴情報をディスプレイ装置に一覧表示し、この一覧表示からユーザが選択した1以上の特徴情報をドキュメントデータ上に埋め込んで若しくはオーバーラップして表示するものであることを特徴とする方法。
  4. 請求項1の方法において、
    前記データライブラリは、複数の事物要素で共通する1以上の識別子を格納するものであり、
    前記検索工程は、データライブラリから検索された識別子に複数の事物要素が関連付けられている場合に、該当する複数の事物要素をディスプレイ装置に一覧表示して1以上の事物要素の選択を受け付ける事物要素選択受付工程を備え、
    前記特徴情報検索工程は、識別された事物要素のうち、前記事物要素選択受付工程で選択された1以上の事物要素の特徴情報をデータライブラリから検索するものである
    を有することを特徴とする方法。
  5. 請求項1の方法において、
    前記データライブラリは、特定の識別子について、特徴情報を表示する対象若しくは対象外となる属性を格納するものであり、
    前記特徴情報表示工程は、制御手段が、ドキュメントデータ上で特定された識別子について前記データライブラリを参照して特徴情報を表示するかを判別する工程を実行する
    ことを特徴とする方法。
  6. 請求項1の方法において、
    さらに、前記制御手段が、
    事物、識別子及び特徴情報の少なくとも何れかの情報を、この情報の作成者若しくは管理者から取得して記憶装置に格納する工程と、
    データライブラリに格納されていない事物や識別子の情報、識別子と事物要素との関連付けが不正確若しくは不十分である場合の当該識別子及び事物要素の情報、の何れかを入力装置を通じて受け付ける修正情報受付工程と、
    受け付けた修正情報を前記情報の作成者若しくは管理者に通知する工程と
    を実行することを特徴とする方法。
  7. 請求項1の方法において、
    前記データライブラリは、関連性の高い複数の識別子同士を関連付けて格納するものであり、
    前記特徴情報検索工程は、識別子特定工程でドキュメントデータの中から特定された識別子が、前記関連付けられた複数の識別子の何れかである場合に、前記データライブラリを参照して、当該識別子によって特定される事物要素の特徴情報を検索するものである
    ことを特徴とする方法。
  8. 請求項1の方法において、
    さらに、前記制御手段が、データライブラリに格納された事物種類情報、事物要素情報、識別子、特徴情報の種類、若しくは特徴情報の少なくとも何れかを一覧表示する工程を実行することを特徴とする方法。
  9. 請求項1の方法において、
    前記データライブラリは、複数の事物要素に対応する1の識別子を格納するものであり、
    前記特徴情報検索工程は、識別子特定工程でドキュメントデータの中から特定された当該識別子に対応する複数の事物要素を表示してユーザからの選択を受け付け、選択された事物要素に関する特徴情報を検索するものである
    ことを特徴とする方法。
  10. 請求項1の方法において、
    さらに、前記制御手段が、前記識別子特定工程で特定された識別子に基づいて関連する事物を特定し、この事物の情報を当該事物に応じた地図、図表、グラフなどの形式で表示する工程を実行することを特徴とする方法。
  11. 請求項1の方法において、
    さらに、前記制御手段が、ドキュメントデータの中から特定された識別子に基づいて特定された複数の事物のリストを作成し、当該ドキュメントデータ中における各識別子若しくは事物の登場頻度や、選択された情報の種類で特定される情報をテーブル形式で表示する工程を実行することを特徴とする方法。
  12. 請求項1の方法において、
    さらに、前記制御手段が、
    ドキュメントデータの中で特定された識別子及びこの識別子に関連する事物の履歴情報を事物若しくは識別子の識別情報に関連付けて前記記憶装置に格納する工程と、
    事物若しくは処理対象のドキュメントデータの単位で、表示履歴をディスプレイ装置に表示する工程と
    を実行することを特徴とする方法。
  13. 請求項1の方法において、
    前記ドキュメントデータは、ハイパーテキスト形式のデータであり、
    前記特徴情報表示工程は、特徴情報をハイパーテキスト中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示するものである
    ことを特徴とする方法。
  14. 請求項1の方法において、
    前記特徴情報検索工程は、データライブラリに格納された情報に基づいて特徴情報を動的に生成するものであることを特徴とするシステム。
  15. 請求項1の方法において、
    前記特徴情報検索工程は、特徴情報として、ドキュメントデータから特定された識別子に基づいて特定される事物と他の事物との間の関係を前記データライブラリから検索するものであることを特徴とする方法。
  16. 請求項1の方法において、
    前記コンピュータシステムは、通信ネットワークを介して接続される情報提供サーバシステムと、情報表示クライアントシステムとから構成され、
    前記情報提供サーバシステムの記憶装置は、データライブラリのうち、前記事物種類情報と事物要素情報と識別子とを事物の識別情報に関連付けて格納するサービス情報格納部を備え、
    前記情報表示クライアントシステムの記憶装置は、データライブラリのうち、各事物の特徴情報の種類及び特徴情報を事物の識別情報に関連付けて格納する利用情報格納部を備えた
    ことを特徴とする方法。
  17. 入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御手段を備え、ドキュメントデータ中に関連情報を表示する情報処理システムであって、
    前記記憶装置は、
    遺伝子、生物種、学校、人物、企業、疾病、事件等の複数の事物の種類の情報(事物種類情報)、各事物に含まれる情報若しくは事物を特定する情報からなる事物の要素の情報(事物要素情報)、事物要素に含まれる及び/若しくは事物要素を特定する文字列、記号、数値などのテキストデータからなる識別子、ドキュメントデータ上に表示する事物の特徴情報(ファセット)の種類、及び前記事物要素と特徴情報の種類とに関連付けられた当該特徴情報、を事物の識別情報に関連付けて格納するデータライブラリと、
    前記制御手段によって実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と、を備え、
    前記入力装置から、ドキュメントデータから抽出する事物種類及びドキュメントデータ中に表示する特徴情報の種類の選択を受け付ける選択受付手段と、
    前記データライブラリから、選択に係る事物に含まれる情報若しくは事物を特定する情報からなる事物要素と、この事物要素に含まれる及び/若しくは事物要素を特定する識別子と、を検索する検索手段と、
    読出し手段によって読み出されたドキュメントデータから、前記検索手段が検索した識別子を特定し事物要素として識別する識別子特定手段と、
    前記データライブラリから、前記識別された事物要素の特徴情報を検索する特徴情報検索手段と、
    検索された特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示する特徴情報表示手段と
    を有することを特徴とするシステム。
  18. 入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御手段を備えたコンピュータシステムの前記記憶装置に格納され、このコンピュータシステムをドキュメントデータ中に関連情報を表示させる情報処理システムとして機能させるためのコンピュータソフトウェアであって、
    前記記憶装置は、
    遺伝子、生物種、学校、人物、企業、疾病、事件等の複数の事物の種類の情報(事物種類情報)、各事物に含まれる情報若しくは事物を特定する情報からなる事物の要素の情報(事物要素情報)、事物要素に含まれる及び/若しくは事物要素を特定する文字列、記号、数値などのテキストデータからなる識別子、ドキュメントデータ上に表示する事物の特徴情報(ファセット)の種類、及び前記事物要素と特徴情報の種類とに関連付けられた当該特徴情報、を事物の識別情報に関連付けて格納するデータライブラリと、
    前記制御手段によって実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と、を備え、
    前記コンピュータソフトウェアが、
    前記入力装置から、ドキュメントデータから抽出する事物種類及びドキュメントデータ中に表示する特徴情報の種類の選択を受け付ける手順と、
    前記データライブラリから、選択に係る事物に含まれる情報若しくは事物を特定する情報からなる事物要素と、この事物要素に含まれる及び/若しくは事物要素を特定する識別子と、を検索する手順と、
    読出し手段によって読み出されたドキュメントデータから、前記検索された識別子を特定し事物要素として識別する手順と、
    前記データライブラリから、前記識別された事物要素の特徴情報を検索する手順と、
    検索された特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示する手順と
    を前記コンピュータシステムに実行させることを特徴とするコンピュータソフトウェア。
JP2007505309A 2005-09-16 2005-11-30 ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア Active JP3998706B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005269441 2005-09-16
JP2005269441 2005-09-16
PCT/JP2005/021992 WO2007032095A1 (ja) 2005-09-16 2005-11-30 ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア

Publications (2)

Publication Number Publication Date
JP3998706B2 true JP3998706B2 (ja) 2007-10-31
JPWO2007032095A1 JPWO2007032095A1 (ja) 2009-03-19

Family

ID=37864701

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007505309A Active JP3998706B2 (ja) 2005-09-16 2005-11-30 ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア
JP2007535389A Active JP4150415B2 (ja) 2005-09-16 2006-07-12 ドキュメントデータ表示処理方法、ドキュメントデータ表示処理システム及びドキュメントデータ表示処理用のソフトウェアプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007535389A Active JP4150415B2 (ja) 2005-09-16 2006-07-12 ドキュメントデータ表示処理方法、ドキュメントデータ表示処理システム及びドキュメントデータ表示処理用のソフトウェアプログラム

Country Status (4)

Country Link
US (2) US20090210787A1 (ja)
EP (2) EP1956498A4 (ja)
JP (2) JP3998706B2 (ja)
WO (2) WO2007032095A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009009202A (ja) * 2007-06-26 2009-01-15 Bits Co Ltd 電子文書の提供方法及びコンピュータプログラム
US20090319945A1 (en) * 2008-06-19 2009-12-24 International Business Machines Corporation Interface for using desired state commands on a copy services mangement system
US9195755B1 (en) * 2009-03-31 2015-11-24 Emc Corporation Relevancy radar
IN2012DN06634A (ja) 2010-01-29 2015-10-23 Lexisnexis Division Of Reed Elsevier Inc
US20120151310A1 (en) * 2010-12-13 2012-06-14 El-Kalliny Ahmed M Method and system for identifying and delivering contextually-relevant information to end users of a data network
US9542494B2 (en) * 2011-10-11 2017-01-10 Microsoft Technology Licensing, Llc Proactive delivery of related tasks for identified entities
US20130110605A1 (en) * 2011-10-30 2013-05-02 Bank Of America Corporation Product recognition promotional offer matching
CN102508897B (zh) * 2011-11-03 2013-08-21 匡晓明 通用信息收藏的方法与系统
US9141715B2 (en) * 2012-01-03 2015-09-22 International Business Machines Corporation Automated hyperlinking in electronic communication
JP2013196141A (ja) * 2012-03-16 2013-09-30 Ntt Docomo Inc 端末装置、情報表示システムおよび情報表示方法
US20140180934A1 (en) * 2012-12-21 2014-06-26 Lex Machina, Inc. Systems and Methods for Using Non-Textual Information In Analyzing Patent Matters
JP2014186463A (ja) * 2013-03-22 2014-10-02 Yahoo Japan Corp 関連情報抽出装置、関連情報抽出方法および関連情報抽出プログラム
CN103514286A (zh) * 2013-09-30 2014-01-15 鸿富锦精密工业(深圳)有限公司 好友推荐系统及方法
JP6757115B2 (ja) * 2014-09-24 2020-09-16 株式会社オウケイウェイヴ 回答検索システム
US10180985B2 (en) * 2015-02-19 2019-01-15 At&T Intellectual Property I, L.P. Apparatus and method for automatically redirecting a search
CN106951492B (zh) * 2017-03-14 2020-09-22 Oppo广东移动通信有限公司 文件搜索方法、装置和电子设备
JP7181834B2 (ja) * 2019-05-13 2022-12-01 株式会社オウケイウェイヴ 回答検索システム、データ送受信装置及び回答検索装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02297188A (ja) * 1989-03-14 1990-12-07 Sharp Corp 文書作成支援装置
JPH08212230A (ja) * 1995-01-31 1996-08-20 Toshiba Corp 文書検索方法及び文書検索装置
JP3734101B2 (ja) * 1995-07-17 2006-01-11 シャープ株式会社 ハイパーメディア構築支援装置
US5873107A (en) * 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
US5926808A (en) * 1997-07-25 1999-07-20 Claritech Corporation Displaying portions of text from multiple documents over multiple databases related to a search query in a computer network
JP2000010981A (ja) 1998-06-19 2000-01-14 Fuji Xerox Co Ltd リンク識別方法及び電子ドキュメントシステム
JP2001109654A (ja) * 1999-10-12 2001-04-20 Fuji Xerox Co Ltd 電子読書支援システム
US7559034B1 (en) * 2000-10-19 2009-07-07 DG FastChannel, Inc. Method and system for using a hyperlink, banner, or graphical icon to initiate the overlaying of an object on a window
JP2002207727A (ja) 2000-11-10 2002-07-26 Fujitsu Ltd クライアント装置、そのプログラムを記録した記録媒体、及びそのプログラム
JP2003006186A (ja) 2001-06-22 2003-01-10 Hitachi Eng Co Ltd 文書管理方法及びその装置
US6883138B2 (en) * 2001-08-08 2005-04-19 Xerox Corporation Methods and systems for generating enhanced thumbnails usable for document navigation
JP2003196194A (ja) * 2002-09-30 2003-07-11 Fujitsu Ltd リンク処理方法及び装置
US20040073531A1 (en) * 2002-10-09 2004-04-15 International Business Machines Corporation Method, system and program product for automatically linking web documents
JP2004272678A (ja) * 2003-03-10 2004-09-30 Casio Comput Co Ltd 情報表示制御装置及びプログラム
JP2004295485A (ja) * 2003-03-27 2004-10-21 Sanyo Electric Co Ltd 診療支援装置、診療支援方法、診療支援プログラム及び電子カルテ
JP4322721B2 (ja) 2004-03-19 2009-09-02 シャープ株式会社 電荷検出回路およびそれを備えた画像センサ
US7428698B2 (en) * 2004-07-08 2008-09-23 International Business Machines Corporation Differential dynamic delivery of content historically likely to be viewed

Also Published As

Publication number Publication date
EP1956498A4 (en) 2009-08-05
US20090240560A1 (en) 2009-09-24
JPWO2007032142A1 (ja) 2009-03-19
WO2007032142A1 (ja) 2007-03-22
WO2007032095A1 (ja) 2007-03-22
EP1950670A4 (en) 2010-03-31
JP4150415B2 (ja) 2008-09-17
EP1950670A1 (en) 2008-07-30
US20090210787A1 (en) 2009-08-20
EP1956498A1 (en) 2008-08-13
JPWO2007032095A1 (ja) 2009-03-19

Similar Documents

Publication Publication Date Title
JP3998706B2 (ja) ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア
Hoe‐Lian Goh et al. A checklist for evaluating open source digital library software
Van Eck et al. Visualizing bibliometric networks
Staden et al. The staden package, 1998
CN104428764B (zh) 基于计算机的系统和提供引用推荐的计算机实现的方法
Leydesdorff et al. Mapping the geography of science: Distribution patterns and networks of relations among cities and institutes
CN101739390B (zh) 基于技术设计文档的数据转换
US10423697B2 (en) User interface with navigation controls for the display or concealment of adjacent content
US20120066580A1 (en) System for extracting relevant data from an intellectual property database
US9311360B2 (en) Association of data to a biological sequence
US20170109442A1 (en) Customizing a website string content specific to an industry
Bailey et al. GAIA: framework annotation of genomic sequence
US20100029580A1 (en) Method for Diagnosing Non-Small Cell Lung Carcinoma
JP2006004298A (ja) 文書処理装置、文書処理方法及び文書処理プログラム
Richardson et al. EMAGE: electronic mouse atlas of gene expression
US8612431B2 (en) Multi-part record searches
JP2006185412A (ja) 情報処理装置、情報処理方法及びそのプログラム
Preece et al. Managing information quality in e-science using semantic web technology
Ranwez et al. PhyloExplorer: a web server to validate, explore and query phylogenetic trees
Yoon et al. A conference paper exploring system based on citing motivation and topic
KR102043434B1 (ko) 조사 보고서 작성 장치 및 조사 보고서 작성 디스플레이 방법
Kumar et al. Implementation of MVC (Model-View-Controller) design architecture to develop web based Institutional repositories: A tool for Information and knowledge sharing
Shen et al. A Catalogue Service for Internet GIS ervices Supporting Active Service Evaluation and Real‐Time Quality Monitoring
Dudda et al. Scoping review and evidence mapping of interventions aimed at improving reproducible and replicable science: Protocol
JP2014092836A (ja) 図面管理サーバ及びこれを用いた図面管理システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070807

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3998706

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130817

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250