JP2000155756A - 構造化文書保存方法並びにデータ中継装置及びデータ送受信装置 - Google Patents

構造化文書保存方法並びにデータ中継装置及びデータ送受信装置

Info

Publication number
JP2000155756A
JP2000155756A JP10255411A JP25541198A JP2000155756A JP 2000155756 A JP2000155756 A JP 2000155756A JP 10255411 A JP10255411 A JP 10255411A JP 25541198 A JP25541198 A JP 25541198A JP 2000155756 A JP2000155756 A JP 2000155756A
Authority
JP
Japan
Prior art keywords
structured document
important
user
document
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10255411A
Other languages
English (en)
Other versions
JP3715444B2 (ja
Inventor
Seiji Maeda
誠司 前田
Toshiki Kitsu
俊樹 岐津
Osamu Torii
修 鳥井
Tatsunori Kanai
達徳 金井
Takeshi Yokogawa
健 横川
Hiroshi Yao
浩 矢尾
Hisako Tanaka
久子 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP25541198A priority Critical patent/JP3715444B2/ja
Priority to US09/342,268 priority patent/US6973458B1/en
Publication of JP2000155756A publication Critical patent/JP2000155756A/ja
Priority to US11/220,841 priority patent/US7103604B2/en
Application granted granted Critical
Publication of JP3715444B2 publication Critical patent/JP3715444B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ユーザに負担をかけずに構造化文書のうち重
要な内容を含む部分を自動的に保存するための構造化文
書保存方法を提供すること。 【解決手段】 要求された構造化文書を提供するサーバ
装置から取得した構造化文書を処理するユーザシステム
のために該取得した構造化文書を部分的に自動保存する
ための構造化文書保存方法であって、ユーザシステムが
要求した構造化文書を取得し、予め指定された所定の抽
出基準に基づき前記取得した構造化文書から重要部分を
抽出して保存するとともに、該取得した構造化文書を前
記ユーザシステムに渡すことを特徴とする。例えば、構
造化文書から指定されたタグに該当する構造化部分を抜
き出して保存する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、WWWに蓄積され
ている文書や電子メール等の構造化文書を交換するシス
テムに用いられ、その構造化文書を自動保存する機能を
有するデータ中継装置及びデータ送受信装置並びに構造
化文書保存方法に関する。
【0002】
【従来の技術】構造化文書とは、文書中に組み込まれた
タグと呼ばれる区切りなどを用いて、文章の構造を表現
することができる文書である。また、構造化文書の中に
はDTD(Document Type Defini
tion)と呼ばれる文書構造を規定する方法を提供す
るものもある。このような文書としては、SGML文
書、XML文書、HTML文書や、電子メールあるいは
電子ニュースで伝送される構造化文書等がある。このよ
うな構造化文書では、その文書の構造を容易に解析する
ことができる。
【0003】World Wide Web(ワールド
ワイドウェブ;以下、WWWと略す)、電子メール、電
子ニュース等では、インターネットやイントラネットな
どの通信路を介して構造化文書を交換する。
【0004】以下、WWWシステムについて説明する。
【0005】WWWでは、構造化文書配信サーバである
WWWサーバおよび構造化文書表示装置であるブラウザ
を通信路を介して接続し、構造化文書を交換する。構造
化文書を参照する場合には、ブラウザはWWWサーバに
対し必要としている構造化文書の送信を要求し、WWW
サーバはその応答として構造化文書を送信する。WWW
で交換される構造化文書は、WWWページと呼ばれるこ
ともある。
【0006】通常のWWWでは、通信路のデータ伝送量
の増大とWWWサーバへの負荷の集中を抑えるために、
WWWサーバとブラウザとの間にプロキシサーバと呼ば
れるデータ中継装置を置くことが多い。このプロキシサ
ーバは、ブラウザとWWWサーバの中間に位置し、ブラ
ウザからの要求をWWWサーバに中継する機能を持つ。
【0007】プロキシサーバは、ブラウザから構造化文
書の送信要求を受信し、代わりにWWWサーバに構造化
文書の送信要求を送信する。次に、WWWサーバより送
信された構造化文書をブラウザに転送する。プロキシサ
ーバは、WWWサーバとブラウザとの間に1台だけ配置
しても良いし、複数配置しても良い。
【0008】このようなプロキシサーバの中には転送す
る複数の構造化文書を、プロキシサーバ内に一時的に保
存する機能を持つものがある。このような複数の構造化
文書を一時的に保存する機能を持つデータ転送装置のこ
とをキャッシュサーバと呼ぶこともある。
【0009】複数の構造化文書を一時的に保存するプロ
キシサーバでは、ブラウザから送信要求があった構造化
文書を一時的に保存しておく。同じ構造化文書に対して
ブラウザより送信要求があった場合には、再度、WWW
サーバに送信要求を転送するのではなく、代わりに一時
的に保存しておいた構造化文書をブラウザに送信する。
【0010】その際に、一時的に保存してある構造化文
書が最新であるかWWWサーバに確認する機能を持つプ
ロキシサーバも存在する。
【0011】通常、プロキシサーバでは、ある決められ
た一定量だけ複数の構造化文書を保存する。一時的に構
造化文書を保存するに際しては、その構造化文書が、ど
のブラウザからの要求によるものであるかを区別しな
い。一定量を越える構造化文書を保存しようとした場合
には、ある規則に従い、一時的に保存してある構造化文
書を削除する。この際に用いられる規則としては、構造
化文書のうち最後に参照された時刻の古い順に構造化文
書を削除するというような単純な規則が良く用いられて
いる。構造化文書を一時的に保存する記憶装置として
は、例えば磁気ディスク装置などが用いられている。
【0012】ブラウザなどの表示装置においても、一定
量の複数の構造化文書を一時的に保存する機能を持つも
のがある。このようなブラウザでは、ユーザが要求した
構造化文書がブラウザ内に一時的に保存してある構造化
文書である場合には、再度、WWWサーバに送信要求を
転送するのではなく、代わりに一時的に保存しておいた
構造化文書を表示する。
【0013】その際に、一時的に保存しておいた構造化
文書が最新であるかWWWサーバやプロキシサーバに確
認する機能を持つものもある。
【0014】通常、このようなブラウザでは、ある決め
られた一定量だけ複数の構造化文書を保存する。その一
定量を越える構造化文書を保存しようとした場合には、
ある規則に従い、一時的に保存してある構造化文書を削
除する。この際に用いられる規則としては、例えば構造
化文書のうち最後に参照された時刻の古い順に削除する
というような単純な規則が良く用いられている。構造化
文書を一時的に保存する記憶装置としては、例えば磁気
ディスク装置などが用いられている。
【0015】次に、電子メールシステムについて説明す
る。
【0016】電子メールシステムは、電子メールサーバ
と電子メール送受信装置などで構成され、それぞれはイ
ンターネットやイントラネットなどの通信路を介して接
続される。
【0017】電子メールの送信者は、電子メール送受信
装置を用いて電子メールを作成し、受信者のアドレスを
指定して電子メールを送信する。電子メールを受信した
電子メールサーバは、送信者が指定した受信者のアドレ
スにしたがって、宛先の電子メールサーバに、または直
接送信できない場合には、該電子メールを中継する電子
メールサーバを検索し、電子メールを転送する。
【0018】宛先の電子メールサーバは、転送されてき
た電子メールを宛先ユーザ毎に分類して格納する。電子
メールの受信者は、電子メール送受信装置を用いて電子
メールサーバより、受信された電子メールを受信し、電
子メールを閲覧する。最終的に電子メールは電子メール
格納サーバあるいは電子メール送受信装置あるいはそれ
ら両方に格納される。このような電子メールの文書とし
て構造化文書が用いられる場合がある。
【0019】通常、電子メールは、電子メールサーバに
附属の電子メール保存装置の容量分だけ格納することが
でき、それを超える場合には電子メールサーバは電子メ
ールを受信することが出来ない。この場合には、通常は
ユーザが明示的に該ユーザ宛の電子メールを削除する。
【0020】次に、電子ニュースシステムについて説明
する。
【0021】電子ニュースシステムは、電子ニュースサ
ーバと電子ニュース送受信装置などで構成され、それぞ
れはインターネットやイントラネットなどの通信路を介
して接続される。
【0022】電子ニュース記事の投稿者は、電子ニュー
ス送受信装置を用いて電子ニュース記事を作成し、電子
ニュースサーバに送信する。電子ニュース記事を受信し
た電子ニュースサーバは、バケツリレー式に通信路で接
続されている電子ニュースサーバに電子ニュース記事を
送信する。なお、電子ニュースサーバは、受信した電子
ニュース記事の一覧を保持しており、一度受信した電子
ニュース記事を重複して受信しないようになっている。
【0023】電子ニュース記事の購読者は、電子ニュー
ス送受信装置を用いて電子ニュースサーバから電子ニュ
ース記事を受信する。
【0024】通常、電子ニュース記事は、電子ニュース
サーバに附属の電子ニュース記事保存装置の容量分だけ
格納することができ、それを超える場合には電子ニュー
スサーバは電子ニュース記事を受信することが出来な
い。この場合には、電子ニュースサーバ上で稼働してい
る電子ニュースシステムが自動的に、もしくは電子ニュ
ースサーバの管理者が明示的に、電子ニュース記事を削
除する。
【0025】
【発明が解決しようとする課題】従来、WWWは、 (1)構造化文書配信サーバであるWWWサーバおよび
構造化文書表示装置であるブラウザを通信路を介して接
続し、構造化文書を交換する形態 (2)構造化文書配信サーバであるWWWサーバと構造
化文書表示装置であるブラウザの間に、構造化文書の要
求と応答を中継する1つまたは複数のプロキシサーバを
配置し、これらを介して接続し、構造化文書を交換する
形態 (3)構造化文書配信サーバであるWWWサーバと構造
化文書表示装置であるブラウザの間に、構造化文書を一
時的に保存する1つまたは複数のプロキシサーバを配置
し、これらを介して接続し、構造化文書を交換する形態
であった。
【0026】しかし、上記の(1)のようにWWWサー
バとブラウザの間にプロキシサーバが存在しない場合に
は、直接構造化文書が送信されてくるため、ユーザはそ
れを受信した時点で、重要な項目を含む文書かどうかを
判断し、必要に応じてその文書を保存しなければならな
いという問題があった。
【0027】また、上記の(2)のようにWWWサーバ
とブラウザの間にプロキシサーバが存在する場合でも、
プロキシサーバが単に要求と応答を中継する機能しか持
たない場合には、ブラウザに直接構造化文書が送信され
てくるため、ユーザはそれを受信した時点で、重要な項
目を含む文書かどうかを判断し、必要に応じてその文書
を保存しなければならないという問題があった。
【0028】また、上記の(3)のようにWWWサーバ
とブラウザの間に構造化文書を一時的に保存する機能を
有するプロキシサーバが配置されている場合やブラウザ
自身が受信した構造化文書を一時的に保存する機能を有
する場合、プロキシサーバやブラウザなどで一時的に保
存された構造化文書は、ある規則に従い削除される。こ
の際に用いられる規則としては、その構造化文書が参照
された時刻の古い順に削除するというような単純な規則
が一般的である。そのため、構造化文書内に重要な内容
が含まれていた場合においても、その文書が重要である
かどうかを判断せずに削除してしまうので、後に重要な
内容を含む構造化文書を参照することができないという
問題があった。
【0029】一方、重要な内容を含む構造化文書がすぐ
に削除されることを防ぐために、より多くの構造化文書
を保存する方法もあるが、この場合、保存するために多
くの容量を持った記憶装置を必要とするという問題があ
った。
【0030】さらに、この場合、保存した構造化文書が
多いために、重要な内容を含む構造化文書を参照または
検索する時に非常に時間がかかるという問題があった。
【0031】また同様に、電子メールに含まれる構造化
文書も電子メールサーバもしくは電子メール送受信装置
に接続されている記憶装置の容量分だけ保存することが
できるが、それを超える場合には電子メールを受信する
ことが出来ない。そのため、ユーザが明示的に電子メー
ルを削除しなければならないが、その場合、ユーザがそ
の構造化文書の重要性を確認しながら削除を行わなけれ
ばならないという問題があった。
【0032】この場合も、重要な内容を含む構造化文書
がすぐに削除されることを防ぐために、より多くの構造
化文書を保存する方法もあるが、この場合、保存するた
めに多くの容量を持った記憶装置を必要とするという問
題があった。さらに、この場合、保存した構造化文書が
多いために、重要な内容を含む構造化文書を参照または
検索する時に非常に時間がかかるという問題があった。
【0033】また同様に、電子ニュース記事に含まれる
構造化文書も、電子ニュースサーバに附属の電子ニュー
ス記事保存装置の容量分だけ格納することができるが、
それを超える場合には電子ニュース記事を受信すること
が出来ない。そのため、電子ニュースサーバ上で稼働し
ている電子ニュースシステムが自動的に、もしくは電子
ニュースサーバの管理者が明示的に電子ニュース記事を
削除しなければならないが、電子ニュース記事に含まれ
る構造化文書内に重要な内容が含まれていた場合におい
ても、その文書が重要であるかどうかを判断せずに削除
してしまうので、後に重要な内容を含む構造化文書を参
照することができないという問題があった。
【0034】この場合も、重要な内容を含む構造化文書
がすぐに削除されることを防ぐために、より多くの構造
化文書を保存する方法もあるが、この場合、保存するた
めに多くの容量を持った記憶装置を必要とするという問
題があった。さらに、この場合、保存した構造化文書が
多いために、重要な内容を含む構造化文書を参照または
検索する時に非常に時間がかかるという問題があった。
【0035】本発明は、上記事情を考慮してなされたも
ので、ユーザに負担をかけずに構造化文書のうち重要な
内容を含む部分を自動的に保存するための構造化文書保
存方法並びにデータ中継装置及びデータ送受信装置を提
供することを目的とする。
【0036】
【課題を解決するための手段】本発明(請求項1)は、
要求された構造化文書を提供するサーバ装置から取得し
た構造化文書を処理するユーザシステムのために該取得
した構造化文書を部分的に自動保存するための構造化文
書保存方法であって、ユーザシステムの要求に応じてサ
ーバ装置により提供された構造化文書を取得し、予め指
定された所定の抽出基準に基づき前記取得した構造化文
書の構造を利用して該構造化文書から重要部分(重要項
目)を抽出して保存するとともに、該取得した構造化文
書を前記ユーザシステムに渡すことを特徴とする。
【0037】構造化文書は、例えば、SGML文書、X
ML文書、HTML文書や、電子メールあるいは電子ニ
ュースで伝送される構造化文書などである。
【0038】サーバ装置は、例えば、WWWサーバ、電
子メールサーバ、電子ニュースサーバなどである。
【0039】例えば、本発明の構造化文書保存方法に係
るモジュール(ここでは構造化文書保存モジュールと呼
ぶ)をプロキシサーバなどのデータ中継装置に一機能と
して搭載して実現する場合、構造化文書の要求や構造化
文書の配信の流れは例えば次のようになる。なお、この
場合、ユーザシステムは、例えば、WWWページブラウ
ザあるいは電子メールブラウザあるいは電子ニュースブ
ラウザなどが起動するユーザ端末もしくはクライアント
システムなどである。ユーザ端末システム→(取得要求
転送)→プロキシサーバ→(取得要求転送)→WWWサ
ーバ→(構造化文書配信)→プロキシサーバ{重要部分
の抽出・保存}→(構造化文書配信)→ユーザ端末シス
テム{取得した構造化文書の表示等}また、例えば、構
造化文書保存モジュールをユーザ端末もしくはクライア
ントシステムなどのデータ送受信装置に一機能として搭
載する場合、構造化文書の要求や構造化文書の配信の流
れは例えば次のようになる。なお、この場合、ユーザシ
ステムは、例えば、データ送受信装置上で起動するWW
Wページブラウザあるいは電子メールブラウザあるいは
電子ニュースブラウザなどのアプリケーションもしくは
プロセスなどであり、構造化文書保存モジュールも同じ
データ送受信装置上で起動するアプリケーションもしく
はプロセスなどとなる。ユーザ端末上で起動しているブ
ラウザなどのアプリケーション→(取得要求)→ユーザ
端末上で起動している構造化文書保存モジュールに相当
するアプリケーション→(取得要求転送)→WWWサー
バ→(構造化文書転送)→ユーザ端末上で起動している
構造化文書保存モジュールに相当するアプリケーション
{重要部分の抽出・保存}→(構造化文書)→ユーザ端
末上で起動しているブラウザなどのアプリケーション
{取得した構造化文書の表示など} この場合、取得要求のメッセージの転送や、構造化文書
をユーザシステムに渡すための通信は、ユーザ端末等の
内部での通信(例えばプロセス間の通信)となる。端末
内部の通信は、実際にメッセージや文書などのデータの
受け渡しを行う代わりに、当該データが記憶されている
位置を示す情報を受け渡しするようにしてもよい。
【0040】なお、構造化文書保存モジュールを独立し
た装置として実現してもよい。
【0041】重要部分を抽出するための所定の抽出基準
は、例えば、ユーザから抽出すべき項目の分類ごとにタ
グの指定および/または単語の指定として与えられる。
そして、例えば、取得した構造化文書からユーザ指定の
タグに一致する部分やユーザ指定の単語を含む部分を抽
出し、その部分を文書構造を維持して保存する(例えば
当該開始タグと終了タグに挟まれた部分を保存する)。
【0042】本発明では、まず、ユーザが例えばブラウ
ザなどのアプリケーション経由で所望の構造化文書をサ
ーバ装置に要求する。その構造化文書がサーバ装置から
送られてくる途中で、構造化文書保存モジュールは、そ
の構造化文書を取り上げ、アプリケーションにかかわら
ずその中身を見て、重要部分を抽出し所定の記憶装置に
保存する。
【0043】構造化文書は、重要部分の抽出が行われて
から(もしくは構造化文書保存モジュールが構造化文書
を読み込んでから)、ユーザ(ブラウザ等)に渡され
る。
【0044】ユーザ(ブラウザ等)は、サーバ装置から
転送されてきたものとして、該構造化文書を受け取る。
そして、例えば、その表示などを行う。
【0045】本発明によれば、ユーザに代わって、受信
した構造化文書内からユーザにとって重要である項目を
自動的に抽出し記憶装置に保存することができる。構造
化文書内の重要部分の抽出・保存作業は自動的に行われ
るので、ユーザは、受信した構造化文書ごとに自ら重要
な項目を抽出し保存する煩わしさから開放され、また抽
出し忘れることも保存し忘れることも防ぐことができ
る。
【0046】なお、ユーザがある項目についての抽出を
中止した場合(すなわち、そのように抽出基準を変更し
た場合)でも、そのときまでに抽出された重要部分は、
削除されずに保存されているため、後に再び、該重要部
分が必要になった場合でも、該重要部分の読み出し、検
索などの操作が可能である。
【0047】本発明においては、好ましくは、取得した
前記構造化文書から重要部分を抽出する際、構造化され
ている単位での抽出を行い、抽出された前記構造化文書
の重要部分を保存する際、複数の構造化文書から別々に
抽出された複数の重要部分を内部構造として持たせるよ
うにした構造化されたデータベースに保存するようにし
てもよい。すなわち、例えば保存する際に、文書という
単位は残さず、複数の文書から抽出した重要部分のみが
データベースになるようにしてもよい。
【0048】また、上記の場合に、好ましくは、同一の
文書から抽出された複数の重要部分を前記データベース
に保存する際、該同一の文書から抽出された複数の重要
部分の相互間の関連を示すリンク情報を作成して保存す
るようにしてもよい。すなわち、保存する際に文書とい
う単位を残さない場合に、1つの文書から抽出した複数
の重要部分間の関連が分からなくならないように、リン
クして保存すると好ましい。これによって、どの重要部
分とどの重要部分がもともと同一の文書にあったもので
あるかを容易に知ることができる。
【0049】また、好ましくは、前記取得した構造化文
書を前記ユーザシステムに渡す際、該構造化文書におけ
る重要部分として抽出された部分に、その部分が重要部
分として抽出されたことをユーザに提示するための所定
の情報を付加した上で、該構造化文書を前記ユーザシス
テムに渡すようにしてもよい。所定の情報は、例えば、
所定のタグである。例えば、反転、強調、網かけなどを
指示するタグを付加しておけば、ユーザ側で該構造化文
書を表示した際に、重要部分として抽出された部分を他
の部分とは区別して表示させることができるので、ユー
ザは、重要部分として抽出された部分を容易に把握する
ことができる。また、ユーザは、抽出された重要部分を
確認することができ、ユーザの意図通りに重要部分の抽
出・保存が行われているかどうかを確認することができ
る。
【0050】また、好ましくは、構造化文書から重要部
分を抽出するための前記所定の抽出基準には、少なくと
も重要部分として抽出する部分の持つべきタグおよび/
または単語の指定を含み、対象となる構造化文書につい
て参照すべき文書型定義情報(例えば、Documen
t Type Definition;DTD)が指定
されている場合には、該対象となる構造化文書からの重
要部分の抽出に用いるタグおよび/または単語を、該指
定された文書型定義情報に含まれるタグおよび/または
単語とするようにしてもよい。
【0051】DTDは、ある構造化文書の中で、どのよ
うなタグを用いることが出来るか、それらのタグの階層
関係はどのようになっているかなどを定義し、構造化文
書の論理構造を明確に定義するものである。構造化文書
の抽出タグ名を指定する際に、抽出する構造化文書の参
照するDTDが指定されている場合には、DTDによっ
て構造化文書内に含まれるタグ名の種類が決まるので、
構造化文書内に含まれる可能性のあるタグのみを抽出タ
グ名に指定できるようにすると好ましい。これによっ
て、抽出すべきものとして指定するタグ名の設定の誤り
を防ぐことができる。
【0052】また、好ましくは、構造化文書から重要部
分を抽出するための前記所定の抽出基準には、少なくと
も重要部分として抽出する部分の持つべきタグおよび/
または単語の指定を含み、前記指定されたタグおよび/
または単語に関して所定の類語データベースを検索して
得たタグおよび/または単語に対する類語をも用いて、
前記構造化文書から重要部分を抽出するようにしてもよ
い。このように類語を用いるのを前記所定の抽出基準と
して類語を用いることが指定されている場合とすること
もできる。これによって、重要部分の取りこぼしを防ぐ
など、より効果的な抽出・保存ができる。
【0053】また、好ましくは、前記ユーザシステムか
ら、構造化文書から重要部分を抽出するための前記所定
の抽出基準の内容についての指定、追加、変更または削
除の要求を受け、該要求に従って前記所定の抽出基準の
内容を新規登録、追加、変更または削除するようにして
もよい。
【0054】本発明によれば、ユーザは、抽出・保存さ
せたい重要な項目に関する条件などの指定、追加、変
更、削除を行うことができ、ユーザは必要に応じて、適
切な重要な項目を自動的に抽出・保存させることができ
る。
【0055】また、好ましくは、前記所定の抽出基準に
基づいて重要部分が抽出され前記構造化文書を受け取っ
た前記ユーザシステムにおいて該構造化文書を表示した
際に(該ユーザシステムに対して)ユーザから該所定の
抽出基準の内容を変更するための指示が入力された場合
に該指示(ユーザシステムを介して構造化文書保存モジ
ュールに与えられる)に従って、前記抽出に用いた所定
の抽出基準の内容を変更するようにしてもよい。例え
ば、ユーザ側で受け取った構造化文書を表示した際に、
ユーザは、その抽出結果を見て判断するなどして抽出基
準の内容を変更すべきと考えた場合には、変更内容につ
いての指示を入力し、これが当該抽出基準の内容に反映
される。
【0056】また、好ましくは、前記取得した構造化文
書から重要部分を抽出して保存する際、予め指定された
所定の生成基準に基づいて、抽出された前記重要部分に
関連のある付加情報(付加項目)を生成し、抽出された
該重要部分と生成された該付加情報とを対応付けて保存
するようにしてもよい。
【0057】本発明によれば、ユーザに代わって、受信
した構造化文書内からユーザにとって重要である項目を
自動的に抽出し、抽出した項目に関連がある付加情報
(例えば、構造化文書の重要情報を抽出した日時、構造
化文書が存在する位置(例えば、URL)、構造化文書
の重要項目以外の項目(すべてでもよいし指定してもよ
い)が存在する位置など)を生成し、両者を対応付けて
記憶装置に保存することができる。抽出、生成、保存の
作業は自動的になされるので、ユーザは、閲覧した構造
化文書ごとに自力で重要部分や付加情報を抽出し保存す
る煩わしさから開放され、抽出し忘れることも保存し忘
れることも防ぐことができる。
【0058】また、好ましくは、取得した前記構造化文
書から重要部分を抽出する際に構造化されている単位で
の抽出を行うとともに、前記重要部分に関連のある付加
情報を構造化されたデータとして生成し、抽出された前
記重要部分と生成された前記付加情報とを保存する際、
複数の構造化文書から別々に抽出された複数の重要部分
および付加情報を内部構造として持たせるようにした構
造化されたデータベースに保存するようにしてもよい。
【0059】なお、本発明においては、抽出・保存され
た重要部分、または重要部分および付加情報をユーザが
検索できる機能を設けることが好ましい。これによっ
て、あらかじめ保存してある構造化文書内の重要部分や
付加情報の中から所望の情報を得ることが可能となる。
また、例えば、ユーザにとって重要な項目を抽出・保存
するための抽出基準の指示の仕方が不十分であったため
に、ユーザにとって重要である項目が抽出されなかった
場合、付加情報として構造化文書が存在する位置を保持
していれば、再度構造化文書全体の転送を要求すること
で、所望の情報を得ることが可能となる。
【0060】なお、以上の請求項1〜請求項10に関し
て説明した上記の各種事項は基本的に請求項11以降の
発明についても成り立つものである。
【0061】本発明(請求項11)は、要求された構造
化文書を提供するサーバ装置から取得した構造化文書を
処理するユーザシステムのために該取得した構造化文書
を部分的に自動保存するための構造化文書保存方法であ
って、ユーザシステムの要求に応じてサーバ装置により
提供された構造化文書を取得し、予め指定された所定の
抽出基準に基づき前記取得した構造化文書の構造を利用
して該構造化文書から重要部分を抽出し、該重要部分に
前記要求を出したユーザの識別情報を対応付けて保存す
るとともに、該取得した構造化文書を前記ユーザシステ
ムに渡すことを特徴とする。
【0062】このためには、抽出した重要部分にユーザ
識別情報を付して保存するようにしてもよいし、抽出し
た重要部分をユーザ毎に分離して保存するようにしても
よい。
【0063】本発明によれば、ユーザが指定した抽出す
べき重要な項目を自動的に構造化文書から抽出し保存す
るが、抽出した重要部分をユーザとの対応を取って保存
することにより、特定のユーザが保存するよう指定した
重要な項目の読み出し、検索が容易になる。
【0064】好ましくは、保存されているある重要部分
に対してあるユーザからのアクセスが発生した場合に、
該重要部分に対応して保存されているアクセス制御情報
(例えば、アクセス許可リスト)に基づいて該重要部分
を該ユーザがアクセス可能か否かを判断し、アクセス可
能であると判断された場合に、該重要部分を該ユーザに
送信するようにしてもよい。アクセス制御情報には、例
えば、その重要部分をアクセス可能なユーザが記述され
ている。なお、アクセス可能でないと判断された場合に
は、該重要部分の該ユーザへの送信を拒否することにな
る。また、好ましくは、前記重要部分は、構造化された
単位で抽出されて、複数の構造化文書から別々に抽出さ
れた複数の重要部分を内部構造として持たせるようにし
た構造化されたデータベースに保存されたものであり、
前記アクセス制御情報は、各重要部分ごとに作成された
該重要部分の所有者となるユーザの識別情報および該重
要部分に対するアクセスを許可されたユーザの識別情報
のリストを記述した内容を持つ構造化されたデータであ
って、各重要部分に対応付けて前記構造化されたデータ
ベースに保存されたものであるようにしてもよい。この
ように、保存した重要部分毎に、アクセス制御情報を持
つことによって、保存した重要部分を複数のユーザ間
で、容易に共有することが可能になり、記憶装置の効率
的な利用が可能となる。
【0065】また、好ましくは、あるアクセス制御情報
に対する内容変更の要求をあるユーザから受けた場合、
そのアクセス制御情報に基づいて該ユーザに該アクセス
制御情報の内容を変更する権限があるか否かを判断し、
変更する権限があると判断された場合に、該アクセス制
御情報を要求された内容に従って変更するようにしても
よい。例えば、アクセス制御情報は各重要部分ごとに用
意され、アクセス制御情報にはその重要部分の所有者と
なるユーザ(例えば、その重要部分を抽出するもととな
った構造化文書の取得を要求したユーザ)および該所有
者以外で該重要部分に対するアクセスを許可されたユー
ザのリストが記述され、その重要部分の所有者のみが変
更の権限を有するものとする。例えば、そのアクセス制
御情報に変更を要求したユーザが所有者として登録され
ている場合には、該ユーザに該アクセス制御情報の内容
を変更する権限があると判断し、該アクセス制御情報を
要求された内容に従って変更するようにしてもよい。
【0066】なお、アクセス制御情報は、重要項目のデ
ータベースとは別に保存するようにしてもよい。
【0067】また、本発明(請求項15)のように、請
求項11〜14の発明において、前記取得した構造化文
書から重要部分が抽出された場合に、既に同一の構造化
文書から同一の重要部分が抽出され保存されているなら
ば、該取得した構造化文書から抽出された重要部分を新
たに保存することはせずに、該既に保存されている同一
の重要部分に対応するアクセス制御情報に対して、前記
要求を出したユーザが少なくとも該同一の重要部分をア
クセス可能となるように、該ユーザの識別情報を付加す
るようにしてもよい。
【0068】この場合に、好ましくは、前記取得した構
造化文書から重要部分が抽出された場合に、既に同一の
構造化文書から同一の重要部分が抽出され保存されてお
り、かつ、該既に保存されている同一の重要部分に対応
するアクセス制御情報によって既に前記要求を出したユ
ーザが少なくとも該同一の重要部分をアクセス可能とな
っているならば、該取得した構造化文書から抽出された
重要部分の新たな保存も該アクセス制御情報に対する前
記要求を出したユーザの識別情報の付加もせずに、該取
得した構造化文書を前記ユーザシステムに渡すようにし
てもよい。
【0069】例えば、複数のユーザが同一の重要項目抽
出条件を設定しており(もしくは設定した重要項目抽出
条件の少なくとも一部に共通するものがあり)、かつ該
複数のユーザが同一の構造化文書を要求した場合に、ユ
ーザ間で共通の重要項目が抽出されることから、受信し
た構造化文書から抽出された重要項目のうちユーザ間で
共通の重要項目についてはこれを共有できる形態で保存
することにより、記憶装置のより効率的な利用が可能と
なる。
【0070】好ましくは、前記重要部分は、構造化され
た単位で抽出されて、複数の構造化文書から別々に抽出
された複数の重要部分を内部構造として持たせるように
した構造化されたデータベースに保存されたものであ
り、前記アクセス制御情報は、各重要部分ごとに作成さ
れた該重要部分の所有者となるユーザの識別情報および
該重要部分に対するアクセスを許可されたユーザの識別
情報のリストを記述した内容を持つ構造化されたデータ
であって、各重要部分に対応付けて前記構造化されたデ
ータベースに保存されたものであり、前記既に保存され
ている同一の重要部分に対応するアクセス制御情報に対
して前記要求を出したユーザの識別情報を付加する際、
該既に保存されている同一の重要部分に対応するアクセ
ス制御情報に該要求を出したユーザの識別情報を、少な
くとも前記アクセスを許可されたユーザの識別情報とし
て(前記アクセスを許可されたユーザの識別情報とし
て、または前記所有者となるユーザの識別情報および前
記アクセスを許可されたユーザの識別情報の両方とし
て)付加するようにしてもよい。
【0071】あるいは、好ましくは、前記重要部分は、
構造化された単位で抽出されて、複数の構造化文書から
別々に抽出された複数の重要部分を内部構造として持た
せるようにした構造化されたデータベースに保存された
ものであり、前記アクセス制御情報は、各重要部分ごと
に作成された、該重要部分の所有者となるユーザの識別
情報および該重要部分に対するアクセスを許可されたユ
ーザの識別情報のリストを記述した内容を持つ構造化さ
れたデータであって、各重要部分に対応付けて前記構造
化されたデータベースに保存されたものであり、前記既
に保存されている同一の重要部分に対応するアクセス制
御情報に対して前記要求を出したユーザの識別情報を付
加する際、該既に保存されている同一の重要部分に対応
するアクセス制御情報とは別に、該要求を出したユーザ
の識別情報を少なくとも前記所有者となるユーザの識別
情報として(前記所有者となるユーザの識別情報とし
て、または前記所有者となるユーザの識別情報および前
記アクセスを許可されたユーザの識別情報の両方とし
て)記述した新たなアクセス制御情報を作成して、これ
を該既に保存されている同一の重要部分に対応付けて保
存するようにしてもよい。
【0072】あるいは、好ましくは、前記重要部分は、
構造化された単位で抽出されて、複数の構造化文書から
別々に抽出された複数の重要部分を内部構造として持た
せるようにした構造化されたデータベースに保存された
ものであり、前記アクセス制御情報は、各重要部分ごと
に作成された該重要部分にアクセス可能なユーザの識別
情報のリストを記述した内容を持つ構造化されたデータ
であって、各重要部分に対応付けて前記構造化されたデ
ータベースに保存されたものであり、前記既に保存され
ている同一の重要部分に対応するアクセス制御情報に対
して前記要求を出したユーザの識別情報を付加する際、
該既に保存されている同一の重要部分に対応するアクセ
ス制御情報に該要求を出したユーザの識別情報を付加す
るようにしてもよい。
【0073】また、好ましくは、保存されているある重
要部分に対する編集要求があった場合に、該重要部分に
対応するアクセス制御情報の内容が複数のユーザの該重
要部分に対するアクセスを可能とする状態になっている
ならば、該重要部分のデータを複写して別途同一の内容
を持つ重要部分を生成するとともに、該編集要求を出し
たユーザが該生成された重要部分に対して編集可能とな
るような形で該ユーザの識別情報を含んだアクセス制御
情報を作成して、これら生成された重要部分と作成され
たアクセス制御情報とを対応付けて保存するようにして
もよい。
【0074】もちろん、請求項11〜請求項20の各々
の発明に対しても、請求項2〜請求項10の発明を適宜
組み合わせて適用することができる。
【0075】また、本発明(請求項21)に係るデータ
中継装置(文書内重要項目抽出装置)は、データ送受信
装置が要求した構造化文書を通信路を介して該当するサ
ーバ装置から取得する手段と、予め指定された所定の抽
出基準に基づき前記取得した構造化文書の構造を利用し
て該構造化文書から重要部分を抽出して保存する手段
と、前記取得した構造化文書を前記データ送受信装置に
転送する手段とを備えたことを特徴とする。
【0076】また、本発明(請求項22)に係るデータ
送受信装置(文書内重要項目抽出装置)は、要求された
構造化文書を通信路を介して該当するサーバ装置から取
得する手段と、予め指定された所定の抽出基準に基づき
前記取得した構造化文書の構造を利用して該構造化文書
から重要部分を抽出して保存する手段と、前記取得した
構造化文書を表示する手段とを備えたことを特徴とす
る。
【0077】また、本発明(請求項23)に係るデータ
中継装置(文書内重要項目抽出装置)は、データ送受信
装置が要求した構造化文書を通信路を介して該当するサ
ーバ装置から取得する手段と、予め指定された所定の抽
出基準に基づき前記取得した構造化文書の構造を利用し
て該構造化文書から重要部分を抽出し、該重要部分に前
記要求を出したユーザの識別情報を対応付けて保存する
手段と、前記取得した構造化文書を前記データ送受信装
置に転送する手段とを備えたことを特徴とする。
【0078】また、本発明(請求項24)に係るデータ
送受信装置(文書内重要項目抽出装置)は、要求された
構造化文書を通信路を介して該当するサーバ装置から取
得する手段と、予め指定された所定の抽出基準に基づき
前記取得した構造化文書の構造を利用して該構造化文書
から重要部分を抽出し、該重要部分に前記要求を出した
ユーザの識別情報を対応付けて保存する手段と、前記取
得した構造化文書を表示する手段とを備えたことを特徴
とする。
【0079】なお、装置に係る本発明は方法に係る発明
としても成立し、方法に係る本発明は装置に係る発明と
しても成立する。
【0080】また、装置または方法に係る本発明は、コ
ンピュータに当該発明に相当する手順を実行させるため
の(あるいはコンピュータを当該発明に相当する手段と
して機能させるための、あるいはコンピュータに当該発
明に相当する機能を実現させるための)プログラムを記
録したコンピュータ読取り可能な記録媒体としても成立
する。
【0081】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
【0082】本発明における重要項目抽出装置は、基本
的な機能として、重要項目を指定する機能と、通信路を
介して送信されてくる構造化文書から、該重要項目に基
づいて自動的に重要項目を抽出し、保存する機能とを提
供するものである。また、保存した重要項目に対する検
索機能をも提供することができるものである。また、保
存した重要項目を、複数のユーザで共有する機能をも提
供することができるものである。さらに、重要項目に関
連する付加項目を自動的に生成し、抽出した重要項目と
組にして保存する機能をも提供することができるもので
あり、この場合に、さらに検索機能や共有機能をも提供
することができるものである。
【0083】ここで、構造化文書とは、タグと呼ばれる
文書の構造を表現するためのテキストとタグ以外のデー
タとが混在する文書のことである。構造化文書には、例
えば、SGML文書、XML文書、HTML文書や、電
子メールあるいは電子ニュースで伝送される構造化文書
等がある。
【0084】構造化文書は、タグによって、その論理的
構造が決定される。各タグは、特定の符号で開始し、特
定の符号で終了する。タグには、開始タグ、終了タグ、
空タグなどが存在する。また、各タグは、タグ名や属性
名、属性値を持つ。同一のタグ名を持つ開始タグおよび
終了タグに囲まれた領域のことを項目と呼ぶ。ある項目
の中に別の項目を含むことが可能である(すなわち階層
構造が可能である)。
【0085】例えば、XML文書と呼ばれる構造化文書
では、タグの開始を表す符号は < であり、タグの終了を表す符号は > であり、開始タグは <タグ名 属性名=属性値…> 終了タグは </タグ名> 空タグは <タグ名 属性名=属性値…/> でそれぞれ定義される。
【0086】また、構造化文書には、文書型定義(Do
cument Type Definition;DT
D)と呼ばれる、文書構造を定義する文書を関連づける
ことが出来るものもある。DTDは、ある構造化文書の
中で、どのようなタグを用いることが出来るか、それら
のタグの階層関係はどのようになっているかなどを定義
し、構造化文書の論理構造を明確に定義するものであ
る。
【0087】以下、第1の実施形態では、本発明の文書
内重要項目抽出装置について、重要項目抽出装置の具体
的な構成と動作例、重要項目の抽出方法の設定手順例、
抽出した重要項目の表示方法例、抽出する重要項目の変
更方法例について、それぞれ詳細に説明する。
【0088】第2の実施形態では、付加項目生成機能を
備えた文書内重要項目抽出装置を構造化文書を送受信す
るデータ送受信装置で実現した例、検索機能を備えた文
書内重要項目抽出装置を構造化文書を送受信するデータ
送受信装置で実現した例、付加項目生成機能と検索機能
を備えた文書内重要項目抽出装置を構造化文書を送受信
するデータ送受信装置で実現した例、付加項目生成機能
を備えた文書内重要項目抽出装置を構造化文書を送受信
するデータ中継装置で実現した例、検索機能を備えた文
書内重要項目抽出装置を構造化文書を送受信するデータ
中継装置で実現した例、付加項目生成機能と検索機能を
備えた文書内重要項目抽出装置を構造化文書を送受信す
るデータ中継装置で実現した例について、それぞれ詳細
に説明する。
【0089】第3の実施形態では、抽出した重要項目を
ユーザ毎に保存する例、ユーザ毎に抽出した重要項目を
複数のユーザ間で共有する例、ユーザ毎に抽出した重要
項目を共有する際に、アクセス許可情報を付加して重要
項目に対するアクセス権を変更することを可能にする例
について、それぞれ詳細に説明する。
【0090】(第1の実施形態)まず、本発明の第1の
実施形態について説明する。
【0091】本実施形態における文書内重要項目抽出装
置では、「重要項目」を1つあるいは複数指定する機能
を設ける。各重要項目は任意の名前を付けて識別し、1
つの重要項目について1つまたは複数の抽出方法を指定
できる機能を設ける。「重要項目の抽出方法」の指定
は、構造化文書の「タグ名」あるいは「単語」などを指
定することにより行う。
【0092】本実施形態における文書内重要項目抽出装
置では、指定されたタグ名や単語などが構造化文書内に
含まれている場合には、構造化文書全体もしくは構造化
文書中の指定されたタグの部分のみを保存する。
【0093】構造化文書を解析する場合、すでに文書構
造がタグによって構造化されているので、タグを用いて
容易に解析することができる。また、抽出された重要項
目の範囲を特定する場合においても、重要項目を含むタ
グ全体を範囲とすることによって、容易に特定すること
ができる。このため、抽出処理の負担は非常に軽量であ
ると言える。
【0094】このようにすれば、多くの構造化文書の中
から重要項目のみあるいは重要項目を含む構造化文書の
みを効果的に保存することができる。
【0095】本実施形態におけるデータ送受信装置(ク
ライアント装置)では、構造化文書を表示する際に、文
書内重要項目抽出装置が抽出し保存する部分を明示的に
表示する機能を設ける。
【0096】このようにすれば、ユーザは構造化文書中
の重要項目を容易に識別することができる。また、逆に
重要項目であるのにもかかわらず表示されない場合に
は、文書内重要項目抽出装置が抽出に失敗していること
も確認することができる。
【0097】重要項目を明示的に表示する方法として
は、例えば、重要項目を他の文書中の文字色と異なる色
で表示したり、他の文書中の背景色と異なる色で表示し
たりするなど、様々な方法がある。
【0098】本実施形態におけるデータ送受信装置で
は、文書内重要項目抽出装置が自動的に抽出し保存する
部分を明示的に指定、追加、変更、削除できる機能を設
ける。
【0099】例えば、マウスのような位置指示装置(ポ
インティングデバイス)等を用いて構造化文書中の領域
を指定することで、その部分が重要項目であることを文
書内重要項目抽出装置に指定する。さらに、他の重要項
目と同じ意味の項目があった場合には、その項目を重要
項目として追加する。あるいは、重要項目として指定さ
れている項目のうち、後に重要項目で無いと判断された
項目があった場合には、重要項目としてその項目を抽出
しないように変更する。また、データ送受信装置が重要
項目として明示的に表示している部分が重要項目でない
場合には、ユーザは該当部分の自動抽出機能を削除する
ことを指定する。
【0100】このようにすれば、ユーザは重要項目の指
定、追加、変更、削除を容易に指定することができる。
【0101】重要項目の指定をする場合、例えば、構造
化文書から『電話』のタグを「電話番号」という重要項
目で指定することができる。さらに「TEL」という名
前のついたタグも同様に電話番号を表現する重要項目で
あった場合には、「電話番号」という重要項目に「TE
L」のタグを追加する。また、TELのタグは電話番号
を表現しないとユーザが判断した場合には、「電話番
号」という重要項目のうち「TEL」のタグは抽出しな
いように変更する。さらに、電話番号という重要項目が
不要になった場合には、「電話番号」という重要項目を
削除する。
【0102】本実施形態の文書内重要項目抽出装置で
は、重要項目を抽出する設定を削除した場合において
も、すでに抽出し保存した重要項目は保存し続けられ
る。ある時点で不要になった重要項目であっても、保存
済みの項目は継続して保存されるので、検索などの機能
を継続して使用することができる。
【0103】以下では、本実施形態をより詳しく説明す
る。
【0104】(実施形態1−1)図1に、本実施形態に
係る文書内重要項目抽出装置を用いたネットワーク・ス
テムの構成例を示す。
【0105】図1は、(i)WWWページ作成者10
1、WWWサーバ104、プロキシサーバ107および
WWWページブラウザ113で構成されるWWWシステ
ム、(ii)電子メール送信者102、送信側電子メール
サーバ105、受信側電子メールサーバ108および電
子メールブラウザ114で構成される電子メールシステ
ム、(iii )電子ニュース記事送信者103、送信側電
子ニュースサーバ106、受信側電子ニュースサーバ1
09および電子ニュースブラウザ115で構成される電
子ニュースシステムの3種類のシステム、および、(i
v)各システム上で交換される構造化文書より重要項目
を自動的に抽出する文書内重要項目抽出装置110から
なるシステム構成の例である。
【0106】また、図1の例では、ユーザは、WWWペ
ージブラウザ113、電子メールブラウザ114および
電子ニュースブラウザ115が動作するクライアント1
12を用いて所望の操作を行う。
【0107】まず、図1のWWWシステムに関する動作
を、図2のフローチャートを参照しながら説明する。
【0108】通常、WWWサーバ104上のWWWペー
ジは、WWWページ作成者101によって作成され、W
WWサーバ104に保存されている。
【0109】始めに、ユーザは、クライアント112上
のアプリケーションであるWWWページブラウザ113
に対して、WWWサーバ104内に保存されているWW
Wページを表示するように指示する(ステップS20
1)。このとき、直接WWWページの保存されているW
WWサーバ104を指示することや、すでにWWWペー
ジブラウザ113上で表示されているWWWページに含
まれるハイパーリンクを指定することができる。
【0110】ユーザからの指示を受けたWWWページブ
ラウザ113は、プロキシサーバ107にユーザの指定
するWWWページの送信要求を通知する(図1中、r1
17)(ステップS202)。プロキシサーバ107で
は、同様に、WWWサーバ104にWWWページの送信
要求を通知する(r118)(ステップS203)。W
WWサーバ104は、要求されたWWWページをプロキ
シサーバ107に送信する(r119)(ステップS2
04)。
【0111】プロキシサーバ107は、受信したWWW
ページを文書内重要項目抽出装置110に入力する(r
120)(ステップS205)。文書内重要項目抽出装
置110は、構造化文書であるWWWページの構造を解
析し、その中にユーザの指定した重要項目が含まれてい
るか検索する(ステップS206)。重要項目が見つか
ったか判断し(ステップS207)、重要項目が見つか
った場合には、重要項目を抽出し記録装置111に保存
するとともに(ステップS208)、重要項目が抽出さ
れたことを示すタグを、WWWページに追加する(ステ
ップS209)。このとき、WWWページに重要項目が
含まれていない場合には、記録装置111には何も保存
しない。記録装置111には例えば固定ディスク装置が
用いられる。
【0112】重要項目の抽出が終了した後、文書内重要
項目抽出装置110は、プロキシサーバ107にWWW
ページを出力する(r121)。プロキシサーバ107
は、WWWページをWWWページブラウザ113に転送
する(r122)(ステップS210)。
【0113】WWWページを受信したWWWページブラ
ウザ113は、WWWページを表示する(ステップS2
11)。このとき、WWWページに重要項目が含まれて
いた場合には、抽出されたことを示すタグが文書内重要
項目抽出装置110によって付加されているので、その
抽出領域を例えば強調表示や反転表示や網かけ表示など
によって明示的に表示する。
【0114】次に、電子メールシステムにおける動作
を、図3のフローチャートを参照しながら説明する。
【0115】電子メールは、電子メール送信者102に
よって、送信側電子メールサーバ105に送信され(r
123)、送信側電子メールサーバ105は、電子メー
ルの受信者であるユーザの受信側電子メールサーバ10
8に電子メールを送信する(r124)。
【0116】ユーザは、クライアント112上の電子メ
ールブラウザ114に対して、受信側電子メールサーバ
108に保存されている電子メールを表示するように指
示する(ステップS301)。
【0117】ユーザからの指示を受けた電子メールブラ
ウザ114は、受信側メールサーバ108に電子メール
の送信要求を通知する(r125)(ステップS30
2)。
【0118】受信側電子メールサーバ108は、送信要
求のあった電子メールを文書内重要項目抽出装置110
に入力する(r126)(ステップS303)。文書内
重要項目抽出装置110は、構造化文書である電子メー
ルの構造を解析し、その中にユーザの指定した重要項目
が含まれているか検索する(ステップS304)。重要
項目が見つかったか判断し(ステップS305)、重要
項目が見つかった場合には、重要項目を抽出し記録装置
111に保存するとともに(ステップS306)、重要
項目が抽出されたことを示すタグを、電子メールに追加
する(ステップS307)。このとき、電子メールに重
要項目が含まれていない場合には、記録装置111には
何も保存しない。
【0119】重要項目の抽出が終了した後、文書内重要
項目抽出装置110は、受信側電子メールサーバ108
に電子メールを出力する(r127)。受信側電子メー
ルサーバ108は、電子メールを電子メールブラウザ1
14に転送する(r128)(ステップS308)。
【0120】電子メールを受信した電子メールブラウザ
114は、電子メールを表示する(ステップS30
9)。このとき、電子メールに重要項目が含まれていた
場合には、抽出されたことを示すタグが文書内重要項目
抽出装置110によって付加されているので、その抽出
領域を例えば強調表示や反転表示や網かけ表示などによ
って明示的に表示する。
【0121】次に、電子ニュースシステムにおける動作
を、図4のフローチャートを参照しながら説明する。
【0122】電子ニュース記事は、電子ニュース記事送
信者103によって、送信側電子ニュースサーバ106
に投稿される(r129)。投稿されたニュース記事
は、送信側電子ニュースサーバ106からユーザの受信
側電子ニュースサーバ109に転送される(r13
0)。
【0123】ユーザは、クライアント112上の電子ニ
ュースブラウザ115に対して、受信側電子ニュースサ
ーバ109内に保存されている電子ニュース記事を表示
するように指示する(ステップS401)。
【0124】ユーザからの指示を受けた電子ニュースブ
ラウザ115は、電子ニュースサーバ109に電子ニュ
ース記事の送信要求を通知する(r131)(ステップ
S402)。
【0125】受信側電子ニュースサーバ109は、送信
要求のあった電子ニュース記事を文書内重要項目抽出装
置110に入力する(r132)(ステップS40
3)。文書内重要項目抽出装置110は、構造化文書で
ある電子ニュース記事の構造を解析し、その中にユーザ
の指定した重要項目が含まれているか検索する(ステッ
プS404)。重要項目が見つかったか判断し(ステッ
プS405)、重要項目が見つかった場合には、重要項
目を抽出し記録装置111に保存するとともに(ステッ
プS406)、重要項目が抽出されたことを示すタグ
を、電子ニュース記事に追加する(ステップS40
7)。このとき、電子メール記事に重要項目が含まれて
いない場合には、記録装置111には何も保存しない。
【0126】重要項目の抽出が終了した後、文書内重要
項目抽出装置110は、受信側電子ニュースサーバ10
9に電子ニュース記事を出力する(r133)。電子ニ
ュースサーバ109は、電子ニュース記事を電子ニュー
スブラウザ115に転送する(r134)(ステップS
408)。
【0127】電子ニュース記事を受信した電子ニュース
ブラウザ115は、電子ニュース記事を表示する(ステ
ップS409)。このとき、電子ニュース記事に重要項
目が含まれていた場合には、抽出されたことを示すタグ
が文書内重要項目抽出装置110によって付加されてい
るので、その抽出領域を例えば強調表示や反転表示や網
かけ表示などによって明示的に表示する。
【0128】以上のようにして、構造化文書は、サーバ
からユーザの使用するクライアントへ送信され、その途
中で文書内重要項目抽出装置が動作し、所望の重要項目
を自動的に抽出し、保存する。
【0129】なお、図1では、文書内重要項目抽出装置
110をプロキシサーバ107と受信側電子メールサー
バ108と受信側電子ニュースサーバ109で共用して
いるが、文書内重要項目抽出装置110をそれぞれに専
用に設けるようにしてもよい。
【0130】また、例えばプロキシサーバ107と受信
側電子メールサーバ108と受信側電子ニュースサーバ
109を用いないシステムにおいて、文書内重要項目抽
出装置110をクライアント112と接続するようにし
てもよい。また、クライアント112が複数存在する場
合に、それらで文書内重要項目抽出装置110を共用す
るようにしてもよいし、クライアント112ごとに専用
に文書内重要項目抽出装置110を設けるようにしても
よい。
【0131】また、図1では、文書内重要項目抽出装置
110は独立した装置として示されているが、文書内重
要項目抽出装置110が、各データ中継サーバ(図1で
は、プロキシサーバ107と受信側電子メールサーバ1
08と受信側電子ニュースサーバ109)のそれぞれに
実装するようにしてもよい。この場合、図2〜図4の手
順において、文書内重要項目抽出装置110とデータ中
継サーバとの間のやり取りが、例えば文書内重要項目抽
出プロセスとデータ中継サーバプロセスとの間の通信に
なる。
【0132】また、文書内重要項目抽出装置110をデ
ータ送受信装置(図1ではクライアント112)に実装
するようにしてもよい。この場合、図2〜図4の手順に
おいて、文書内重要項目抽出装置110とデータ中継サ
ーバとの間のやり取りの代わりに、例えば文書内重要項
目抽出プロセスとブラウザプロセスとの間での通信が行
われる。また、この場合、図1のようにデータ中継装置
(図1では、プロキシサーバ107と受信側電子メール
サーバ108と受信側電子ニュースサーバ109)を利
用することも、データ中継装置を利用しないことも可能
である。
【0133】なお、上記のバリエーションについては、
後述する第2、第3の実施形態に対しても同様のことが
成立する。
【0134】次に、図5および図6を参照しながら「重
要項目の抽出方法」を設定するための構成と方法につい
て説明する。
【0135】まず、図5に、重要項目の抽出方法を設定
するための、文書内重要項目抽出装置110の抽出機能
部分およびデータ送受信装置(クライアント装置)に関
する構成の一例を示す。
【0136】文書内重要項目抽出装置110は、類語デ
ータベース501、抽出方法データベース502、重要
項目データベース503を持っている。
【0137】類語データベース501には、重要項目と
して設定される一般的な用語の類語が格納されている。
例えば、「会議」の類語として「打合せ」や「ミーティ
ング」という単語が格納されている。
【0138】抽出方法データベース502には、ユーザ
が設定した「重要項目の抽出方法」が格納され、文書内
重要項目抽出装置110が構造化文書より重要項目を抽
出する際に参照される。
【0139】重要項目データベース503には、文書内
重要項目抽出装置110により自動的に抽出された重要
項目が、構造化された形式で、かつ、後から検索できる
ように、格納されている。
【0140】ユーザは、データ送受信装置であるクライ
アント112内の重要項目抽出方法設定アプリケーショ
ン506を用いて、文書内重要項目抽出装置110と通
信し、重要項目の抽出方法を設定する。重要項目の抽出
には、構造化文書の構造を決定するタグの名称を用いる
方法と、構造化文書の全文から対応する単語を検索する
方法との二通りを行うことができる。これらの方法の一
方を用いて抽出することも、双方を同時に用いて抽出す
ることもできる。
【0141】重要項目の抽出方法は、重要項目の「分
類」とその「抽出方法」とによって構成される。複数の
重要項目の分類を指定することができるとともに、1つ
の重要項目の分類に対して複数の抽出方法を指定するこ
とができる。
【0142】次に、図6を参照しながら「重要項目の抽
出方法」を設定するための手順について説明する。
【0143】ユーザは、重要項目抽出方法設定アプリケ
ーション506を用いて重要項目の抽出方法を設定す
る。図6の設定手順では、はじめに、重要項目の「分
類」を指定する(ステップS601)。分類には、例え
ば「会議通知」という名称をつけることができる。次
に、1つまたは複数の抽出方法を設定する。
【0144】ステップS602〜S608は所望の抽出
方法を設定するためのループ処理であり、設定したい抽
出方法の種類数だけループする。
【0145】まず、抽出方法を指定する(ステップS6
02)。
【0146】構造化文書の構造を決定するタグの名称を
用いた方法で抽出を行う場合には、構造化文書内の抽出
タグ名を指定する(ステップS603)。このとき、抽
出タグ名の類語が類語データベース501に存在する場
合(ステップS605)には、全ての類語を抽出タグ名
として抽出する方法を指定することもできる(ステップ
S606)。類語を用いることが指定された場合には、
文書内重要項目抽出装置110が構造化文書内の重要項
目を抽出する際に、抽出タグ名として類語全てを用いて
検索する(ステップS607)。
【0147】構造化文書の全文から対応する単語を検索
する方法で抽出を行う場合には、抽出単語を指定する
(ステップS604)。このとき、抽出単語の類語が類
語データベース501に存在する場合(ステップS60
5)には、全ての類語を検索する抽出単語として指定す
ることもできる(ステップS606)。類語を用いるこ
とが指定された場合には、文書内重要項目抽出装置11
0が構造化文書内の重要項目を抽出する際に、抽出単語
として類語全てを用いて検索する(ステップS60
7)。
【0148】また、構造化文書の抽出タグ名を指定する
際に、抽出する構造化文書の参照するDTDが指定され
ている場合には、DTDによって構造化文書内に含まれ
るタグ名の種類が決まるので、構造化文書内に含まれる
可能性のあるタグのみを抽出タグ名に指定できるように
するのが好ましい。このようにすれば、重要項目のタグ
名の設定の誤りを防ぐことができる。
【0149】なお、他の抽出方法を繰り返し指定するこ
とができる(ステップS608)。
【0150】さて、上記のようにして重要項目の分類お
よび該分類に対する1または複数の抽出方法を設定する
と、重要項目抽出方法設定アプリケーション506は、
文書内重要項目抽出装置110に、その設定を通知する
(ステップS609)。文書内重要項目抽出装置110
は、その設定を抽出方法データベース502に格納する
(ステップS610)。
【0151】なお、ステップS601以降を繰り返すこ
とによって、複数の分類を設定することができる。
【0152】次に、図5および図7を参照しながら文書
内重要項目抽出装置の重要項目の抽出手順について説明
する。
【0153】図7に、文書内重要項目抽出装置110の
重要項目の抽出手順を示す。なお、この抽出手順の説明
においては、図8に示す構造化文書の例、図9に示す抽
出処理途中の構造化文書の状態の例、図10に示す抽出
方法の設定例、図11に示す類語データベースの例、図
12に示す抽出結果の例も併せて用いる。なお、図8
(a)、図9(a)、図10(a)、図12(a)が対
応しており、また図8(b)、図9(b)、図10
(b)、図12(b)が対応している。
【0154】文書内重要項目抽出装置110の入力に
は、WWWページ、電子メール、電子ニュース記事がテ
キストファイルであるので、テキストファイルまたはテ
キストを格納したメモリを用いる。
【0155】入力されたテキストは、通常、図8(a)
に例示する構造化文書801あるいは図8(b)に例示
する構造化文書802のように、タグを用いて構造化さ
れている。そこで、タグを用いて、図9(a)に例示す
る文書構造901や図9(b)に例示する文書構造90
2のように、文書構造を解析する(ステップS70
1)。
【0156】続いて、文書内重要項目抽出装置110
は、ユーザにより設定された重要項目抽出方法、例えば
図10(a)に例示する重要項目抽出方法1001や図
10(b)に例示する重要項目抽出方法1002、を抽
出方法データベース502より読み出し(ステップS7
02)、重要項目の抽出を行う。このとき、重要項目抽
出方法が、重要項目抽出方法1002のように複数指定
されていた場合には、全ての重要項目抽出方法に関して
繰り返し抽出を行う(ステップS716)。
【0157】続いて、抽出方法として構造化文書のタグ
の名称を用いた方法が指定されているか判断する(ステ
ップS703)。重要項目抽出方法1001のように抽
出方法として構造化文書の構造を決定するタグの名称を
用いた方法が指定されている場合には、抽出タグ名が解
析された文書構造に含まれるか検索する(ステップS7
04)。本具体例においては、文書構造901には抽出
方法に指定されている抽出タグ名である<meetin
g>が含まれているので(ステップS706)、抽出タ
グ<meeting>およびその下位層の構造1201
を重要項目として抽出し、重要項目データベース503
に格納する(ステップS714)。
【0158】重要項目抽出方法1002のように抽出方
法として構造化文書の全文より対応する単語を検索する
方法が指定されている場合には、抽出単語が解析された
文書構造に含まれるか検索する(ステップS705)。
本具体例においては、文書構造902には抽出方法に指
定されている抽出単語である「価格」が含まれていない
ので、重要項目データベース503には何も格納しない
(ステップS707)。しかし、本具体例においては、
抽出方法に類語を用いることが指定されているので(ス
テップS709)、類語による検索を行う(ステップS
711)。図11に例示する類語データベース1101
を参照すると、文書構造902には指定されている抽出
単語の類語(1101)のうち「特価」という類語が含
まれているので、抽出単語である特価を含むタグ<コメ
ント>およびその下位層の構造1202を重要項目とし
て抽出し、重要項目データベース503に格納する(ス
テップS715)。
【0159】以上の処理は、全ての重要項目について検
索が行われるまで繰り返し実行される(ステップS71
7)。
【0160】次に、図5、図10、図13、図14を参
照しながら文書内重要項目抽出装置の重要項目の格納手
順を説明する。
【0161】文書内重要項目抽出装置110が重要項目
を格納する重要項目データベース503には、構造化さ
れたデータを格納することのできるデータベースを用い
る。例えば、オブジェクト指向データベースを用いるこ
とができる。
【0162】図13に、重要項目データベース503の
内部構造の一例を示す。なお、図13の内容は、図8に
例示した2つの構造化文書から、図10に例示した抽出
方法の設定で分類「会議」と分類「価格」に対する重要
項目を抽出し、併せて分類「商品名」についてタグ名=
<商品名>で重要項目を抽出した結果に対応するもので
ある。
【0163】重要項目データベース1315には、重要
項目抽出方法の設定の際に用いた重要項目の分類すなわ
ち「会議」1302、「商品名」1308、「価格」1
311を格納しておく。
【0164】抽出方法データベース502に格納された
重要項目抽出方法によって文書内重要項目抽出装置11
0が抽出した重要項目は、抽出に用いられた重要項目抽
出方法の「分類」の下に格納すると効果的である。この
ように格納することによって、各重要項目抽出方法によ
って抽出された重要項目を区別することが可能になる。
例えば、図10(a)に例示した抽出方法1001で抽
出された重要項目は、分類「会議」1302の下に格納
する。
【0165】また、同一構造化文書より抽出された重要
項目には、各々の重要項目を相互に関係付けるリンクを
付加するようにするのが好ましい。例えば、分類「商品
名」1308に分類された重要項目1309と分類「価
格」1311に分類された重要項目1312とが同一構
造化文書より抽出された場合には、重要項目1309と
重要項目1312とを、リンク1314によって関係付
けることができる。このように重要項目間をリンクによ
り関係付けることによって、ある構造化文書内から異な
る重要項目抽出方法によって格納された重要項目間の関
係を保存することができるので、重要項目を検索する際
に、複数の重要項目が同一構造化文書内に含まれていた
という関係を利用することができる。
【0166】図14に、重要項目データベース503の
内部構造の他の例を示す。図14の例は、図13にさら
に抽出された重要項目が追加された例を示している。
【0167】図14の例では、他の構造化文書から分類
「会議」1302に関する重要項目1325が抽出さ
れ、分類「会議」1302の下に重要項目1325が追
加・格納されている様子を表している。また、他の構造
化文書から分類「商品名」1308に関する重要項目1
320と分類「価格」1311に関する重要項目132
2が抽出され、それぞれ分類「会議」1302や分類
「価格」1311の下に追加・格納されている様子を表
している。さらに、分類「商品名」1308に分類され
た重要項目1320と分類「価格」1311に分類され
た重要項目1322とが同一構造化文書より抽出された
ので、これら重要項目1320と重要項目1322とが
リンク1324によって関係付けられている様子を表し
ている。
【0168】(実施形態1−2)次に、データ送受信装
置(図1のクライアント112)における、ブラウザ
(図1のWWWブラウザ113、電子メールブラウザ1
14および電子ニュースブラウザ115)の構造化文書
の表示の方法と、重要項目の抽出方法の指定・追加・変
更・削除の方法についてそれぞれ説明する。
【0169】WWWブラウザ113と電子メールブラウ
ザ114と電子ニュースブラウザ115での各操作は同
じであるので、以下では、WWWブラウザ113上での
操作を例にとって説明する。
【0170】まず、図15、図16、図17を参照しな
がら、新たに重要項目を指定するための操作例について
説明する。
【0171】図15に、WWWブラウザ113で重要項
目が含まれていない構造化文書を表示する例を示す。図
15では、構造化文書の題目1601、構造化文書の内
容1602、構造化文書の記書き部分1603は、いず
れも重要項目を含んでいないため、構造化文書が作成さ
れた状態のままで表示される。
【0172】このとき、構造化文書の記書き部分160
3をWWWブラウザ113上で新たに重要項目として指
定するものとする。
【0173】ユーザは、例えば位置指示装置であるマウ
スポインタ1604を用いて、構造化文書の記書き部分
1603を領域指定し、重要項目指定ボタン1605を
押す。図16に、記書き部分1603が領域指定された
様子を示す。
【0174】領域が指定され重要項目指定ボタン160
5が押されると、WWWブラウザ113は、図17に例
示する重要項目指定画面を表示し、構造化文書内からユ
ーザにより領域指定された部分のタグを検索し抽出名入
力部分1802を設定する。ユーザは重要項目名入力部
分1801に重要項目名を入力する。同様に、抽出方法
としてタグ名を用いる場合にはタグ抽出指定ボタン18
03を押し、単語を用いる場合には単語抽出指定ボタン
1804を押す。さらに、重要項目の保存方法として、
重要項目を含む構造化文書全体を保存する場合には全文
保存指定ボタン1805を押し、重要項目であるタグの
みを保存する場合にはタグ保存指定ボタン1806を押
す。最後に、入力内容決定ボタン1807を押し、入力
内容を決定し、文書内重要項目抽出装置110に重要項
目の抽出を指定する。
【0175】次に、図16、図18を参照しながら、構
造化文書の記書き部分1603を既存の重要項目に追加
するための操作例について説明する。
【0176】ユーザは、図15の表示状態から、図16
のように例えば位置指示装置であるマウスポインタ16
04を用いて構造化文書の記書き部分1603を領域指
定し、重要項目追加ボタン1606を押す。
【0177】領域が指定され重要項目追加ボタン160
6が押されると、WWWブラウザ113は、図18に示
す重要項目追加画面を表示し、構造化文書内からユーザ
により領域指定された部分のタグを検索し抽出名入力部
分2002を設定する。ユーザは重要項目名入力部分2
001に既存の重要項目名を入力する。同様に、抽出方
法としてタグ名を用いる場合にはタグ抽出指定ボタン2
003を押し、単語を用いる場合には単語抽出指定ボタ
ン2004を押す。さらに、重要項目の保存方法とし
て、重要項目を含む構造化文書全体を保存する場合には
全文保存指定ボタン2005を押し、重要項目であるタ
グのみを保存する場合にはタグ保存指定ボタン2006
を押す。最後に、入力内容決定ボタン2007を押し、
入力内容を決定し、文書内重要項目抽出装置110に重
要項目の抽出を指定する。
【0178】次に、図16、図19を参照しながら、構
造化文書の記書き部分1603が既存の重要項目である
場合にその重要項目を変更するための操作例について説
明する。
【0179】ユーザは、図15の表示状態から、図16
のように例えば位置指示装置であるマウスポインタ16
04を用いて構造化文書の記書き部分1603を領域指
定し、重要項目変更ボタン1607を押す。
【0180】領域が指定され重要項目変更ボタン160
7が押されると、WWWブラウザ113は、図19に示
す重要項目変更画面を表示し、該当する重要項目名を重
要項目名入力部分2201に設定する。同様に、抽出名
を抽出名入力部分2202に設定し、抽出方法としてタ
グ名を用いている場合にはタグ抽出指定ボタン2203
を設定し、単語を用いている場合には単語抽出指定ボタ
ン2204を設定する。さらに、重要項目の保存方法と
して、重要項目を含む構造化文書全体を保存する場合に
は全文保存指定ボタン2205を設定し、重要項目であ
るタグのみを保存する場合にはタグ保存指定ボタン22
06を設定する。
【0181】ユーザは、該当重要項目の設定内容を変更
し、入力内容決定ボタン2207を押し、入力内容を決
定し、文書内重要項目抽出装置110に重要項目の抽出
方法の変更を指定する。
【0182】次に、図16、図20を参照しながら、構
造化文書の記書き部分1603が既存の重要項目である
場合にその重要項目を削除するための操作例について説
明する。
【0183】ユーザは、図15の表示状態から、図16
のように例えば位置指示装置であるマウスポインタ16
04を用いて、構造化文書の記書き部分1603を領域
指定し、重要項目削除ボタン1608を押す。
【0184】領域が指定され重要項目削除ボタン160
8が押されると、WWWブラウザ113は、図20に示
す重要項目変更画面を表示し、該当する重要項目名を重
要項目名入力部分2401に設定する。同様に、抽出名
を抽出名入力部分2402に設定し、抽出方法としてタ
グ名を用いている場合にはタグ抽出指定ボタン2403
を設定し、単語を用いている場合には単語抽出指定ボタ
ン2404を設定する。さらに、重要項目の保存方法と
して、重要項目を含む構造化文書全体を保存する場合に
は全文保存指定ボタン2405を設定し、重要項目であ
るタグのみを保存する場合にはタグ保存指定ボタン24
06を設定する。
【0185】ユーザは、該当重要項目の設定内容を確認
し削除を行う場合には、入力内容決定ボタン2407を
押し、文書内重要項目抽出装置110に重要項目の抽出
の削除を指定する。
【0186】本実施形態によれば、本文書内重要項目抽
出装置をWWWサーバなどの構造化文書配信装置から配
信される構造化文書を閲覧する際に用いると、文書内重
要項目抽出装置は、ユーザに代わって、受信した構造化
文書内からユーザにとって重要である項目を自動的に抽
出し、記憶装置に保存する。構造化文書内の重要項目の
抽出、保存作業は、文書内重要項目抽出装置によって自
動的に行われるので、ユーザは、受信した構造化文書ご
とに自ら重要項目を抽出、保存する煩わしさから開放さ
れ、抽出し忘れることも保存し忘れることもなくなる。
【0187】また、本実施形態に係る文書内重要項目抽
出装置をWWWサーバなどの構造化文書配信装置から配
信される構造化文書を閲覧する際に用いると、ユーザが
利用するブラウザなどのデータ送受信装置において、抽
出された重要項目が確認でき、ユーザの意図通りに重要
項目の抽出、保存が行われているかどうかを確認するこ
とが出来る。また、データ送受信装置において、重要項
目抽出方法設定アプリケーションを用いることにより、
抽出すべき重要項目の指定、追加、変更、削除を行うこ
とが出来、ユーザは必要に応じて、適切な重要項目を自
動的に抽出することが可能となる。
【0188】(第2の実施形態)次に、本発明の第2の
実施形態について説明する。
【0189】第1の実施形態では、文書内重要項目抽出
装置の持つ基本的な機能として、構造化文書から重要項
目を抽出して保存する機能について説明したが、本実施
形態では、構造化文書から抽出した重要項目を保存する
機能に加えて、当該抽出した重要項目に関連のある付加
項目を新たに生成し、当該抽出した重要項目と当該生成
した付加項目とを対応付けてもしくは組にして保存する
機能についても説明する。重要項目に関連のある付加項
目としては、様々なものが生成可能であるが、例えば、
構造化文書から重要項目を抽出した日時を生成し保存し
ておくことにより、後から情報の新しさを容易に知るこ
とができる。
【0190】また、本実施形態では、文書内重要項目抽
出装置に、検索機能を設けることについても説明する。
検索機能が提供されていれば、ユーザは以前に保存した
重要項目や付加項目の中から必要な情報を効率よく探し
出すことができるようになる。なお、ここでは、検索機
能を第2の実施形態として説明するが、第1の実施形態
で説明した文書内重要項目抽出装置に検索機能(重要項
目を検索対象とする)を設けることもできる。
【0191】第1の実施形態でも述べたように、本文書
内重要項目抽出装置は、構造化文書を送受信するデータ
送受信装置(図1では、クライアント112)で実現す
る方式と構造化文書を送受信するデータ中継装置(図1
では、プロキシサーバ107と受信側電子メールサーバ
108と受信側電子ニュースサーバ109)で実現する
方式が考えられる。また、後者の代わりに、データ中継
装置の外部に、本文書内重要項目抽出装置を独立した装
置として設け、データ中継装置と文書内重要項目抽出装
置との間で情報のやり取りを行う方法や、さらにデータ
中継装置の外部に独立した装置として設けられた文書内
重要項目抽出装置を複数のデータ中継装置で共有する方
法もある。
【0192】さて、本文書内重要項目抽出装置は、基本
的な機能として、構造化文書配信装置(図1では、WW
Wサーバ104、送信側電子メールサーバ105、送信
側電子ニュースサーバ106)から通信路を経由して配
信される構造化文書を受信し、受信した構造化文書内か
ら重要項目を自動的に抽出し、記録装置に保存する機能
を有する。
【0193】構造化文書内の項目のうち、どのような条
件を満たす項目が文書内重要項目抽出装置のユーザにと
って重要であるかについては、ユーザが文書内重要項目
抽出装置に対して指示をする。ユーザから指示が行われ
たら、以後、文書内重要項目抽出装置は、指示内容にし
たがって、構造化文書内から重要項目の抽出、記録装置
への保存を行う。
【0194】ユーザから文書内重要項目抽出装置に対し
て、構造化文書内の重要項目が満たすべき条件を指示す
る方法は、例えば、以下に示すような方法が考えられ
る。 (1)構造化文書内の「タグ名」で与える方法 (2)構造化文書内の「タグの属性名」で与える方法 (3)構造化文書内の「タグの属性値」で与える方法 (4)構造化文書内の「タグ以外のテキスト中に含まれ
るキーワード」で与える方法 (5)上記の(1)〜(4)の一部または全部を組み合
わせた方法 構造化文書内の項目のうち、どのような条件を満たす項
目がユーザにとって重要であるかをまとめた情報は、テ
ーブルの形式で文書内重要項目抽出装置内の記憶装置に
保存し、このテーブルを参照したい場合には、適宜、記
憶装置から読み出すものとする。このテーブルのことを
「構造化文書内重要項目条件テーブル」と呼ぶものとす
る。
【0195】上記の(1)のように、構造化文書内の重
要項目がタグ名で与えられた場合には、文書内重要項目
抽出装置は、当該与えられたタグ名を持つ項目を構造化
文書内から抽出し、記録装置に保存する。
【0196】上記の(2)のように、構造化文書内の重
要項目がタグの属性名で与えられた場合には、文書内重
要項目抽出装置は、当該与えられたタグの属性名を持つ
項目を抽出し、記録装置に保存する。
【0197】上記の(3)のように、構造化文書内の重
要項目がタグの属性値で与えられた場合には、文書内重
要項目抽出装置は、当該与えられたタグの属性値を持つ
項目を抽出し、記録装置に保存する。
【0198】上記の(4)のように、構造化文書内の重
要項目がタグ以外のテキスト中に含まれるキーワードで
与えられた場合には、文書内重要項目抽出装置は、当該
与えられたキーワードを含む項目を抽出し、記録装置に
保存する。
【0199】いずれの場合にも、記録装置に保存するデ
ータは、構造化文書の項目の集合になっており、構造化
文書になっている。
【0200】次に、本実施形態に係る、付加項目を生成
し保存する機能を有する文書内重要項目抽出装置は、構
造化文書配信装置から通信路を経由して配信される構造
化文書を受信し、受信した構造化文書内から重要項目を
自動的に抽出し、また抽出した重要項目に関連のある付
加項目を自動的に生成し、両者を対応付けてもしくは組
にして記録装置に保存する。
【0201】どのような条件を満たす項目を付加項目と
して生成するかについては、ユーザが文書内重要項目抽
出装置に(付加項目指示機能を利用して)指示する。ユ
ーザから指示が行われたら、以後、文書内重要項目抽出
装置は、指示内容にしたがって、構造化文書内から付加
項目の生成、記録装置への保存を行う。
【0202】ユーザから文書内重要項目抽出装置に対し
て、抽出された構造化文書内の重要項目に関連する付加
項目を指示する方法は、例えば、以下に示すような方法
が考えられる。 (1)付加項目は「重要項目を抽出した日時」であると
指示する方法 (2)付加項目は「構造化文書が存在する位置」である
と指示する方法 (3)付加項目は「抽出された重要項目以外の項目が存
在する位置」であると指示する方法 (4)上記の(1)〜(3)の一部または全部を組み合
わせた方法 構造化文書内の重要項目に関連する付加項目をまとめた
情報は、テーブルの形式で文書内重要項目抽出装置内の
記録装置に保存し、このテーブルを参照したい場合に
は、適宜、記録装置から読み出すものとする。このテー
ブルのことを「構造化文書内重要項目関連付加項目条件
テーブル」と呼ぶことにする。
【0203】上記の(1)のように、構造化文書内の重
要項目に関連のある付加項目が、構造化文書の重要項目
を抽出した日時である場合には、その日時を、記録装置
に保存する項目形式のデータすなわちタグ付きのデータ
形式で生成し、記録装置に保存する。
【0204】上記の(2)のように、構造化文書内の重
要項目に関連のある付加項目が、構造化文書が存在する
位置である場合には、対象とする構造化文書がどの構造
化文書配信装置内のどの構造化文書であるかを検索し、
記憶装置に保存する項目形式のデータすなわちタグ付き
のデータを生成し、記録装置に保存する。
【0205】上記の(3)のように、構造化文書内の重
要項目に関連のある付加項目が、抽出した重要項目以外
の項目が存在する位置である場合には、対象とする構造
化文書内の項目がどの構造化文書配信装置内のどの構造
化文書内のどの項目であるかを検索し、記録装置に保存
する項目形式のデータすなわちタグ付きのデータを生成
し、記録装置に保存する。
【0206】いずれの場合にも、記録装置に保存するデ
ータは、タグ付きデータ(項目)の集合になっており、
構造化文書になっている。
【0207】次に、本実施形態に係る、検索機能を有す
る文書内重要項目抽出装置は、記録装置に保存してある
重要項目の検索(付加項目を生成し保存する機能を有し
ない場合)または重要項目や付加項目の検索(付加項目
を生成し保存する機能を有する場合)を行うことが可能
である。
【0208】ユーザが、検索したい重要項目が満たすべ
き条件を、文書内重要項目抽出装置に指示すると、文書
内重要項目抽出装置は、検索条件に合致する重要項目
を、記録装置にすでに保存されている重要項目の中から
検索する。合致する重要項目が見つかった場合には当該
重要項目を表示し、見つからなかった場合には見つから
なかった旨を表示する。
【0209】文書内重要項目抽出装置の記録装置に保存
されている項目は、以下に示す2種類がある。 (1)受信した構造化文書内から抽出した重要項目 (2)抽出された重要項目に関連する付加項目 検索の対象となる項目は、上記の2種類の項目の両方で
ある。
【0210】ユーザから文書内重要項目抽出装置に検索
する項目を指示する方法は、例えば以下に示す方法が考
えられる。 (1)項目の「タグ名」で与える方法 (2)項目の「タグの属性名」で与える方法 (3)項目の「タグの属性値」で与える方法 (4)項目の「タグ以外のテキスト中に含まれるキーワ
ード」で与える方法 (5)上記の(1)〜(4)の一部または全部を組み合
わせた方法 上記の(1)のように、ユーザの検索したい項目が項目
のタグ名で与えられた場合には、記録装置の中に保存さ
れている項目の中から、該与えられたタグ名を持つ項目
を検索し、読み出す。
【0211】上記の(2)のように、ユーザの検索した
い項目が項目のタグの属性名で与えられた場合には、記
録装置の中に保存されている項目の中から、該与えられ
たタグの属性名を持つ項目を検索し、読み出す。
【0212】上記の(3)のように、ユーザが検索した
い項目が項目のタグの属性値で与えられた場合には、記
録装置の中に保存されている項目の中から、該与えられ
たタグの属性値を持つ項目を検索し、読み出す。
【0213】上記の(4)のように、ユーザが検索した
い項目が項目のタグ以外のテキスト中に含まれるキーワ
ードで与えられた場合には、記録装置の中に保存されて
いる項目の中から、該与えられたキーワードを含む項目
を検索し、読み出す。
【0214】次に、重要項目および付加項目を記録装置
に格納する際のデータ形式について説明する。
【0215】図21に、重要項目および付加項目を格納
する重要項目・付加項目データベースの一例を示す。
【0216】この例では、 ・構造化文書の中から重要項目として、<date>タ
グで囲まれた会議開催日と ・<place>で囲まれた会議開催場所とを抽出し、
抽出した重要項目に関連する付加項目として、 ・構造化文書がもともと存在していた場所を表すURL
と ・重要項目の抽出を行った日を作成し、それぞれ<UR
L>、<extractday>という名前のタグで囲
んでいる。
【0217】抽出した重要項目は<main>というタ
グで囲み、作成した付加項目は<sub>というタグで
囲んで、全体として1つの構造化文書になるようにして
ある。
【0218】検索を行う際には、 (1)抽出した重要項目のみの検索 (2)作成した付加項目のみの検索 (3)抽出した重要項目、作成した付加情報の違いを意
識しない検索 の3つを適宜使い分けることが可能である。
【0219】構造化文書がホームページの場合には、<
URL>タグの中身は文字通りURLになり、構造化文
書がメールやニュースである場合には、<URL>タグ
の中身は、メールやニュースの送信者のメールアドレス
にしておく。
【0220】以下では、本実施形態の文書内重要項目抽
出装置の構成・動作についてより詳しく説明する。ま
ず、文書内重要項目抽出装置をデータ送受信装置(図1
では、クライアント112)で実施する形態について説
明し、次に、文書内重要項目抽出装置をデータ中継装置
(図1では、プロキシサーバ107と受信側電子メール
サーバ108と受信側電子ニュースサーバ109)で実
施する形態について説明する。
【0221】(実施形態2−1)図22に、本実施形態
(2−1)に係る、重要項目を抽出し保存する機能と付
加項目を生成し保存する機能と検索機能とを有する文書
内重要項目抽出装置の構成例を示す。本構成例は、文書
内重要項目抽出装置をデータ送受信装置で実現したもの
である。
【0222】なお、重要項目を抽出し保存する機能を有
する文書内重要項目抽出装置は、図22の構成から、構
造化文書内重要項目関連付加項目指示制御部126、付
加項目指示部150、検索指示制御部127、検索指示
部160を省いた構成に相当する。
【0223】また、重要項目を抽出し保存する機能と付
加項目を生成し保存する機能を有する文書内重要項目抽
出装置は、図22の構成から、検索指示制御部127、
検索指示部160を省いた構成に相当する。
【0224】また、重要項目を抽出し保存する機能と検
索機能を有する文書内重要項目抽出装置は、図22の構
成から、構造化文書内重要項目関連付加項目指示制御部
126、付加項目指示部150を省いた構成に相当す
る。
【0225】なお、これら一部の機能を有しないものに
ついては、その詳細な説明は省略する。
【0226】図22に示されるように、本文書内重要項
目抽出装置110は、構造化文書処理部120、構造化
文書閲覧部130、重要項目指示部140、付加項目指
示部150、検索指示部160を備え、通信路170を
介してネットワークと接続されている。
【0227】構造化文書処理部120は、構造化文書要
求解析部121、構造化文書受信部122、構造化文書
内重要項目抽出部123、構造化文書内重要項目関連付
加項目生成部124、構造化文書内重要項目指示制御部
125、構造化文書内重要項目関連付加項目指示制御部
126、検索指示制御部127、記憶部制御部128、
記憶部129を備えている。
【0228】構造化文書閲覧部130は、構造化文書要
求入力部131、構造化文書表示部132を備えてい
る。
【0229】重要項目指示部140は、重要項目指示入
力部141、重要項目指示実行結果表示部142を備え
ている。
【0230】付加項目指示部150は、付加項目指示入
力部151、付加項目指示実行結果表示部152を備え
ている。
【0231】検索指示部160は、検索指示入力部16
1、検索結果表示部162を備えている。
【0232】<構造化文書閲覧部130>構造化文書閲
覧部130は、ユーザからの構造化文書閲覧要求を受け
付け、構造化文書処理部120に対して構造化文書配信
要求を送信する。また、構造化文書処理部120から送
信される構造化文書を受信、表示する。
【0233】構造化文書要求入力部131は、ユーザが
構造化文書閲覧要求を入力する部分である。ユーザが構
造化文書閲覧要求を行う方法には、URLを指定する方
法などがある。
【0234】構造化文書表示部132は、構造化文書処
理部120から構造化文書閲覧部130に送信される構
造化文書を表示する部分である。
【0235】<重要項目指示部140>重要項目指示部
140は、構造化文書処理部120が受信する構造化文
書内の項目のうち、どのような条件を満たす項目が文書
内重要項目抽出装置のユーザにとって重要であるかを、
ユーザから構造化文書処理部120に指示するための部
分である。
【0236】ユーザは、構造化文書処理部120が受信
する構造化文書内の項目のうち、どのような条件を満た
す項目が自分にとって重要であるかを、重要項目指示入
力部141に入力する。
【0237】ユーザが重要項目指示入力部141に入力
する内容には、例えば以下のようなものが考えられる。 (1)構造化文書内重要項目条件テーブルに新たな条件
を追加する。 (2)構造化文書内重要項目条件テーブルにすでに保存
されている条件を、新しい条件に変更する。 (3)構造化文書内重要項目条件テーブルにすでに保存
されている条件のうち、あるものを削除する。 (4)構造化文書内重要項目条件テーブルの内容を、重
要項目指示実行結果表示部142に表示する。
【0238】重要項目指示実行結果表示部142は、構
造化文書処理部120から重要項目指示部140に送信
されたデータを表示する。構造化文書処理部120から
重要項目指示部140に送信されるデータとは、具体的
には以下の2つが考えられる。 (1)ユーザが重要項目指示入力部141に入力した指
示が成功したかどうかを示す情報 (2)現在構造化文書処理部120に登録されている構
造化文書内重要項目条件テーブルの内容 <付加項目指示部150>付加項目指示部150は、構
造化文書処理部120が構造化文書内から抽出した重要
項目に関連する付加項目がどのような条件を満たすべき
かを、ユーザから構造化文書処理部120に指示するた
めの部分である。
【0239】ユーザは、構造化文書処理部120が構造
化文書内から抽出した重要項目に関連する付加項目がど
のような条件を満たすべきかを、付加項目指示入力部1
51に入力する。
【0240】ユーザが付加項目指示入力部151に入力
する内容は、例えば以下のようなものが考えられる。 (1)構造化文書内重要項目関連付加項目条件テーブル
に、新たな条件を追加する。 (2)構造化文書内重要項目関連付加項目条件テーブル
にすでに保存されている条件を、新しい条件に変更す
る。 (3)構造化文書内重要項目関連付加項目条件テーブル
にすでに保存されている条件のうち、あるものを削除す
る。 (4)構造化文書内重要項目関連付加項目条件テーブル
の内容を、付加項目指示実行結果表示部に表示する。
【0241】付加項目指示実行結果表示部152は、構
造化文書処理部120から付加項目指示部150に送信
されたデータを表示する。構造化文書処理部120から
付加項目指示部150に送信されるデータとは、具体的
には以下の2つが考えられる。 (1)ユーザが付加項目指示入力部151に入力した指
示が成功したかどうかを示す情報 (2)現在構造化文書処理部120に登録されている構
造化文書内重要項目関連付加項目条件テーブルの内容 <検索指示部160>検索指示部160は、ユーザが検
索したいと思っている項目が満たすべき条件を、ユーザ
から構造化文書処理部120に指示するための部分であ
る。
【0242】ユーザは、構造化文書処理部120内に保
存されている項目のうち、自分が検索したいと思ってい
る項目が満たすべき条件を検索指示入力部161に入力
する。
【0243】検索結果表示部162は、構造化文書処理
部120から検索指示部160に送信されたデータを表
示する。
【0244】構造化文書処理部120から検索指示部1
60に送信されるデータとは、具体的には以下の2つが
考えられる。 (1)ユーザが検索指示入力部161に入力した指示が
成功したかどうかを示す情報 (2)構造化文書処理部120で検索を行い、条件に合
致した項目の組 <通信路170>通信路170は、構造化文書閲覧部1
30から構造化文書処理部120に対して送信された構
造化文書配信要求を中継し、WWWサーバや電子メール
サーバや電子ニュースサーバなどの構造化文書配信装置
に対して送信する。また、WWWサーバや電子メールサ
ーバや電子ニュースサーバなどの構造化文書配信装置か
ら送信された構造化文書を中継し、構造化文書処理部1
20に対して送信する。
【0245】なお、図1のようにデータ中継装置(図1
では、プロキシサーバ107と受信側電子メールサーバ
108と受信側電子ニュースサーバ109)を利用する
ことも、データ中継装置を利用しないことも可能であ
る。
【0246】<構造化文書処理部120>構造化文書処
理部120は、WWWサーバや電子メールサーバなどの
構造化文書配信装置から送信された構造化文書を受信
し、受信した構造化文書を構造化文書閲覧部130に転
送するとともに、受信した構造化文書内から重要項目を
抽出し、抽出した重要項目に関連する付加項目を生成
し、両者を組にした上で記憶部129に保存する。同じ
文書名を持つ構造化文書を以前にも受信している場合に
は、再度抽出、生成を再度行う必要があるのかどうかの
確認を行う必要がある。また、構造化文書処理部120
は、ユーザが重要項目指示部140や付加項目指示部1
50を利用して指定する方法にしたがって、重要項目と
付加項目の追加、変更、削除を行う。さらに、構造化文
書処理部120は、ユーザが検索したい項目を検索指示
部160を利用して構造化文書処理部120に通知する
と、ユーザの要求に合致する項目を記憶部129に保存
されている項目の中から検索し、読み出した上で、検索
指示部160に転送する。
【0247】<<構造化文書要求解析部121>>構造
化文書要求解析部121は、構造化文書閲覧部130か
ら送信された構造化文書配信要求を受信し、要求された
構造化文書がどの構造化文書配信装置上に存在するかを
解析し、通信路160を経由して、要求された構造化文
書が存在するWWWサーバや電子メールサーバなどの構
造化文書配信装置に対して、または要求された構造化文
書が存在する構造化文書配信装置と構造化文書内重要項
目抽出装置110との間に位置するプロキシサーバなど
のデータ中継装置に対して、構造化文書配信要求を送信
する。
【0248】<<構造化文書受信部122>>構造化文
書受信部122は、WWWサーバや電子メールサーバな
どの構造化文書配信装置から通信路110を経由して構
造化文書処理部120に送信された構造化文書を受信
し、受信した構造化文書の複写を行う。複写した構造化
文書の一方は、構造化文書閲覧部130に転送し、他方
は構造化文書内重要項目抽出部123に転送する。
【0249】<<構造化文書内重要項目抽出部123>
>構造化文書内重要項目抽出部123は、構造化文書受
信部122から送信された構造化文書を受信し、構造化
文書内重要項目条件テーブルの内容にしたがい、構造化
文書内から重要項目の抽出を行う。構造化文書内重要項
目抽出部123は、構造化文書内重要項目条件テーブル
の内容を一時保持するための記憶領域を持つ。
【0250】ここでもし、構造化文書内重要項目抽出部
123が構造化文書内重要項目条件テーブルの内容を保
持している場合には、このテーブルが最新のものである
かどうかを記憶部制御部128に問い合わせ、もし最新
のものでない場合には、記憶部制御部128に対して最
新のテーブル送信を要求し、構造化文書内重要項目抽出
部123内に最新の構造化文書内重要項目条件テーブル
を保持する。また、構造化文書内重要項目抽出部123
が構造化文書内重要項目条件テーブルの内容を保持して
いない場合には、記憶部制御部128に対して最新のテ
ーブル送信を要求し、構造化文書内重要項目抽出部12
3内に最新の構造化文書内重要項目条件テーブルを保持
する。
【0251】受信した構造化文書が以前に受信した構造
化文書と同じ文書名を持つ構造化文書であった場合に
は、再度重要項目の抽出を行う必要があるかどうかを確
認する。確認とは、具体的には以下に示す3つの方法が
考えられる。 (1)今回受信した構造化文書の内容が1番最近更新さ
れた日時が、前回構造化文書から重要項目の抽出を行っ
た日時よりも後であるかどうかを確認する。 (2)前回重要項目の抽出を行った日時よりも後に、構
造化文書内重要項目条件テーブルの内容に変化があった
かどうかを確認する。 (3)上記の(1)と(2)の両方を行う。
【0252】確認を行った結果、再度重要項目の抽出を
行う必要があると判断された場合には、構造化文書内重
要項目抽出部123は、構造化文書内重要項目条件テー
ブルの内容にしたがって、構造化文書からユーザにとっ
て重要な項目をすべて抽出する。
【0253】抽出作業が終了したら、構造化文書内重要
項目抽出部123は、抽出を行う前の構造化文書と、抽
出した重要項目すべてを、構造化文書内重要項目関連付
加項目生成部124に送信する。
【0254】<<構造化文書内重要項目関連付加項目生
成部124>>構造化文書内重要項目関連付加項目生成
部124は、構造化文書内重要項目抽出部123から送
信された構造化文書と構造化文書から抽出された重要項
目とを受信し、構造化文書内重要項目関連付加項目条件
テーブルの内容にしたがい、付加項目の生成を行う。構
造化文書内重要項目関連付加項目生成部124は、構造
化文書内重要項目関連付加項目条件テーブルの内容を一
時保持するための記憶領域を持つ。
【0255】ここでもし、構造化文書内重要項目関連付
加項目生成部124が構造化文書内重要項目関連付加項
目条件テーブルの内容を保持している場合には、このテ
ーブルが最新のものであるかどうかを記憶部制御部12
8に問い合わせ、もし最新のものでない場合には、記憶
部制御部128に対して最新のテーブル送信を要求し、
構造化文書内重要項目関連付加項目生成部124内に最
新の構造化文書内重要項目関連付加項目条件テーブルの
内容を保持する。また、構造化文書内重要項目関連付加
項目生成部124が構造化文書内重要項目関連付加項目
条件テーブルの内容を保持していない場合には、記憶部
制御部128に対して最新のテーブル送信を要求し、構
造化文書内重要項目関連付加項目生成部124内に最新
の構造化文書内重要項目関連付加項目条件テーブルの内
容を保持する。
【0256】受信した構造化文書が以前に受信した構造
化文書と同じ文書名を持つ構造化文書であった場合に
は、再度重要項目の抽出を行う必要があるかどうかを確
認する。確認とは、具体的には以下に示す3つの方法が
考えられる。 (1)今回受信した構造化文書の内容が1番最近更新さ
れた日時が、前回構造化文書から重要項目の抽出を行っ
た日時よりも後であるかどうかを確認する。 (2)前回重要項目の抽出を行った日時よりも後に、構
造化文書内重要項目条件テーブルの内容に変化があった
かどうかを確認する。 (3)上記の(1)と(2)の両方を行う。
【0257】ただし、(1)に示す確認作業が構造化文
書内重要項目抽出部123ですでになされている場合に
は、再度行う必要はない。
【0258】確認を行った結果、再度付加項目の生成を
行う必要があると判断された場合には、構造化文書内重
要項目関連付加項目生成部124は、構造化文書内重要
項目関連付加項目条件テーブルの内容にしたがって、構
造化文書内重要項目抽出部123で抽出した重要項目に
関連する付加項目を生成する。
【0259】生成作業が終了したら、構造化文書内重要
項目関連付加項目生成部124は、構造化文書内重要項
目抽出部123が抽出した構造化文書内重要項目と、構
造化文書内重要項目関連付加項目生成部124が生成し
た構造化文書内重要項目関連付加項目とをまとめて、記
憶部制御部128に送信し、記憶部制御部128に対し
て、抽出、生成した項目の記憶部129への保存を指示
する。
【0260】<<構造化文書内重要項目指示制御部12
5>>構造化文書内重要項目指示制御部125は、重要
項目指示部140から送信される指示内容を受信し、受
信した内容にしたがって構造化文書内重要項目条件テー
ブルの操作を行う。
【0261】構造化文書内重要項目指示制御部125
で、重要項目指示部140から送信された指示内容を受
信し、受信した内容の解析を行う。重要項目指示部14
0から送信される指示内容とは、例えば以下のようなも
のが考えられる。 (1)構造化文書内重要項目条件テーブルに新たな条件
を追加する。 (2)構造化文書内重要項目条件テーブルにすでに保存
されている条件を、新しい条件に変更する。 (3)構造化文書内重要項目条件テーブルにすでに保存
されている条件のうち、あるものを削除する。 (4)構造化文書内重要項目条件テーブルの内容を、重
要項目指示実行結果出力部141に表示する。
【0262】重要項目指示部140から送信される指示
内容が、構造化文書内重要項目条件テーブルへの新たな
条件の追加であった場合には、構造化文書内重要項目条
件テーブルへ条件の追加を記憶部制御部128に対して
指示する。構造化文書内重要項目指示制御部125から
記憶部制御部128に対して行った指示に対する返答を
受信し、重要項目指示部140に送信する。
【0263】構造化文書内重要項目指示制御部125か
ら記憶部制御部128に対して行った指示に対する返答
とは具体的には、例えば、以下に示す2つが考えられ
る。 (1)新しい条件の追加に成功した。 (2)記憶部129に空き領域がないなどの理由で、新
しい条件の追加に失敗した。
【0264】重要項目指示部140から送信される指示
内容が、構造化文書内重要項目条件テーブルにすでに保
存されている条件の変更であった場合には、構造化文書
内重要項目条件テーブルへ条件の変更を記憶部制御部1
28に対して指示する。構造化文書内重要項目指示制御
部125から記憶部制御部128に対して行った指示に
対する返答を受信し、重要項目指示部140に送信す
る。
【0265】構造化文書内重要項目指示制御部125か
ら記憶部制御部128に対して行った指示に対する返答
とは具体的には、例えば、以下に示す2つが考えられ
る。 (1)条件の変更に成功した。 (2)テーブル上に変更しようとしている条件が見つか
らないなどの理由で、新しい条件の追加に失敗した。
【0266】重要項目指示部140から送信される指示
内容が、構造化文書内重要項目条件テーブルにすでに保
存されている条件の削除であった場合には、構造化文書
内重要項目条件テーブルから条件を削除することを記憶
部制御部128に対して指示する。構造化文書内重要項
目指示制御部125から記憶部制御部128に対して行
った指示に対する返答を受信し、重要項目指示部140
に送信する。
【0267】構造化文書内重要項目指示制御部125か
ら記憶部制御部128に対して行った指示に対する返答
とは、具体的には、例えば、以下に示す2つが考えられ
る。 (1)条件の削除に成功した。 (2)削除すべき条件がテーブル上に見つからないなど
の理由で、条件の変更に失敗した。
【0268】重要項目指示部140から送信される指示
内容が、構造化文書内重要項目条件テーブルの内容の重
要項目指示実行結果出力部141への表示であった場合
には、構造化文書内重要項目条件テーブルの記憶部12
9からの読み出しと、重要項目指示部140への送信を
記憶部制御部128に対して指示する。構造化文書内重
要項目指示制御部125から記憶部制御部128に対し
て行った指示に対する返答を受信し、重要項目指示部1
40に送信する。
【0269】構造化文書内重要項目指示制御部125か
ら記憶部制御部128に対して行った指示に対する返答
をとは、具体的には、例えば、以下に示す2つが考えら
れる。 (1)テーブルの内容 (2)記憶部129からのテーブルの読み出しに失敗し
たなどの理由で、テーブルの読み出し、転送に失敗した
旨を示す情報 <<構造化文書内重要項目関連付加項目指示制御部12
6>>構造化文書内重要項目関連付加項目指示制御部1
26は、付加項目指示部150から送信される指示内容
を受信し、受信した内容にしたがって構造化文書内重要
項目関連付加項目条件テーブルの操作を行う。
【0270】構造化文書内重要項目関連付加項目指示制
御部126で、付加項目指示部150から送信された指
示内容を受信し、受信した内容の解析を行う。
【0271】付加項目指示部150から送信される指示
内容とは、例えば以下のようなものが考えられる。 (1)構造化文書内重要項目関連付加項目条件テーブル
に新たな条件を追加する。 (2)構造化文書内重要項目関連付加項目条件テーブル
にすでに保存されている条件を、新しい条件に変更す
る。 (3)構造化文書内重要項目関連付加項目条件テーブル
にすでに保存されている条件のうち、あるものを削除す
る。 (4)構造化文書内重要項目関連付加項目条件テーブル
の内容を、付加項目指示実行結果表示部152に表示す
る。
【0272】付加項目指示部150から送信される指示
内容が、構造化文書内重要項目関連付加項目条件テーブ
ルへの新たな条件の追加であった場合には、構造化文書
内重要項目条件テーブルへ条件の追加を記憶部制御部1
28に対して指示する。構造化文書内重要項目関連付加
項目指示制御部126から記憶部制御部128に対して
行った指示に対する返答を受信し、付加項目指示部15
0に送信する。
【0273】構造化文書内重要項目関連付加項目指示制
御部126から記憶部制御部128に対して行った指示
に対する返答とは具体的には、例えば、以下に示す2つ
が考えられる。 (1)新しい条件の追加に成功した。 (2)記憶部129に空き領域がないなどの理由で、新
しい条件の追加に失敗した。
【0274】付加項目指示部150から送信される指示
内容が、構造化文書内重要項目関連付加項目条件テーブ
ルにすでに保存されている条件の変更であった場合に
は、構造化文書内重要項目条件テーブルの条件の変更を
記憶部制御部128に対して指示する。構造化文書内重
要項目関連付加項目指示制御部126から記憶部制御部
128に対して行った指示に対する返答を受信し、付加
項目指示部150に送信する。
【0275】構造化文書内重要項目関連付加項目指示制
御部126から記憶部制御部128に対して行った指示
に対する返答とは具体的には、例えば、以下に示す2つ
が考えられる。 (1)新しい条件の追加に成功した。 (2)テーブル上に変更しようとしている条件が見つか
らないなどの理由で、新しい条件の追加に失敗した。
【0276】付加項目指示部150から送信される指示
内容が、構造化文書内重要項目関連付加項目条件テーブ
ルにすでに保存されている条件の削除であった場合に
は、構造化文書内重要項目条件テーブルからの条件の削
除を記憶部制御部128に対して指示する。構造化文書
内重要項目関連付加項目指示制御部126から記憶部制
御部128に対して行った指示に対する返答を受信し、
付加項目指示部150に送信する。
【0277】構造化文書内重要項目関連付加項目指示制
御部126から記憶部制御部128に対して行った指示
に対する返答とは具体的には、例えば、以下に示す2つ
が考えられる。 (1)新しい条件の追加に成功した。 (2)テーブル上に削除しようとしている条件が見つか
らないなどの理由で、新しい条件の追加に失敗した。
【0278】付加項目指示部150から送信される指示
内容が、構造化文書内重要項目関連付加項目条件テーブ
ルの内容の付加項目指示実行結果表示部152への表示
であった場合には、構造化文書内重要項目条件テーブル
の記憶部129からの読み出しと、付加項目指示部15
0への送信を記憶部制御部128に対して指示する。構
造化文書内重要項目関連付加項目指示制御部126から
記憶部制御部128に対して行った指示に対する返答を
受信し、付加項目指示部150に送信する。
【0279】構造化文書内重要項目関連付加項目指示制
御部126から記憶部制御部128に対して行った指示
に対する返答とは、具体的には、例えば、以下に示す2
つが考えられる。 (1)テーブルの内容 (2)記憶部129からのテーブルの読み出しに失敗し
たなどの理由で、テーブルの読み出し、転送に失敗した
旨を示す情報 <<検索指示制御部127>>検索指示制御部127
は、検索指示部160から送信される検索条件を受信
し、検索条件の解析をする。検索条件に合致する項目の
記憶部129からの読み出しを記憶部制御部128に指
示し、指示した結果記憶部制御部128から送信される
情報を検索指示部160に送信する。
【0280】検索指示部160から送信される検索条件
は、例えば、以下に示すような方法で与えられる。 (1)重要項目のタグ名で与えられる。 (2)重要項目のタグの属性名で与えられる。 (3)重要項目のタグの属性値で与えられる。 (4)重要項目のタグ以外のテキスト中に含まれるキー
ワードで与えられる。 (5)上記の(1)〜(4)の一部または全部の組み合
わせで与える。
【0281】また、指示した結果記憶部制御部128か
ら送信される情報とは、具体的には以下の2つが考えら
れる。 (1)検索条件に合致する項目の組 (2)検索条件に合致する項目が存在しないことを示す
情報 <<記憶部制御部128>>記憶部制御部128は、構
造化文書内重要項目関連付加項目生成部124、構造化
文書内重要項目指示制御部125、構造化文書内重要項
目関連付加項目指示制御部126、検索指示制御部12
7から送信される、記憶部129からのデータの読み出
し、転送要求や、記憶部129へのデータの書き込み要
求を受け付け、実行する。
【0282】記憶部制御部128は、これから記憶部1
29に書き込むデータや記憶部129から読み出したデ
ータを一時保持するための記憶領域を持つ。記憶部12
9からの読み出し、転送を指示されたデータがすでに記
憶領域上に存在する場合には、再度記憶部129からの
読み出しは行わずに、転送のみを行えばよい。
【0283】記憶部129からの読み出し、記憶部12
9への書き込みに失敗した場合には、その旨を通知す
る。
【0284】<<記憶部129>>記憶部129は、デ
ータの保存を行う。データとは具体的には以下のもので
ある。 (1)構造化文書から抽出した重要項目 (2)構造化文書から抽出した重要項目に関連する付加
項目 (3)構造化文書内重要項目条件テーブル (4)構造化文書内重要項目関連付加項目条件テーブル さて、次に、ユーザにとって重要な項目が満たすべき条
件を新たに構造化文書内重要項目条件テーブルに追加し
たい場合に行う手続きについて説明する。
【0285】図23に、この手続きのフローチャートの
一例を示す。
【0286】ユーザは、重要項目指示部140の重要項
目指示入力部141に、自分にとって重要な構造化文書
内の項目が満たすべき条件と、この条件を新たに構造化
文書内重要項目条件テーブルに追加したい旨を入力す
る。入力された指示内容は、重要項目指示部140から
構造化文書処理部120に転送される(ステップS10
1)。
【0287】構造化文書処理部120の構造化文書内重
要項目指示制御部125は、重要項目指示部140から
送信された指示内容を受信する。構造化文書内重要項目
指示制御部125が受信した指示内容を解析し、指示内
容が、構造化文書内重要項目条件テーブルへの新しい条
件の追加であることを知る(ステップS102)。
【0288】重要項目指示部140は、引き続き、記憶
部制御部128に対して、構造化文書内重要項目条件テ
ーブルへの新しい条件の追加を指示する(ステップS1
03)。
【0289】記憶部制御部128は、構造化文書内重要
項目条件テーブルへの新しい条件の追加を行う。追加に
成功した場合には成功した旨を、追加に失敗した場合に
は失敗した旨を、構造化文書内重要項目指示制御部12
5に送信する(ステップS104、S105、S10
6)。
【0290】構造化文書内重要項目指示制御部125
は、記憶部制御部128から受信した内容を重要項目指
示部140に送信する(ステップS107)。
【0291】重要項目指示部140は、構造化文書内重
要項目指示制御部125から送信された内容を受信し、
重要項目指示実行結果表示部142に表示する(ステッ
プS108)。
【0292】なお、構造化文書内重要項目条件テーブル
の条件の変更、削除、構造化文書内重要項目条件テーブ
ル表示に関しては省略する。
【0293】次に、構造化文書から抽出した重要項目に
関連する付加項目が満たすべき条件を新たに構造化文書
内重要項目条件テーブルに追加したい場合に行う手続き
について説明する。
【0294】図24に、この手続きのフローチャートの
一例を示す。
【0295】ユーザは、付加項目指示部150の付加項
目指示入力部151に、構造化文書から抽出した重要項
目に関連する付加項目が満たすべき条件と、この条件を
新たに構造化文書内重要項目関連付加項目条件テーブル
に追加したい旨を入力する。入力された指示内容は、付
加項目指示部150から構造化文書処理部120に転送
される(ステップS201)。
【0296】構造化文書処理部120の構造化文書内重
要項目関連付加項目指示制御部126は、付加項目指示
部150から送信された指示内容を受信する。構造化文
書内重要項目関連付加項目指示制御部126が受信した
指示内容を解析し、指示内容が構造化文書内重要項目関
連付加項目条件テーブルへの新しい条件の追加であるこ
とを知る(ステップS202)。
【0297】付加項目指示部150は、引き続き、記憶
部制御部128に対して、構造化文書内重要項目関連付
加項目条件テーブルへの新しい条件の追加を指示する
(ステップS203)。
【0298】記憶部制御部128は、構造化文書内重要
項目関連付加項目条件テーブルへの新しい条件の追加を
行う。追加に成功した場合には成功した旨を、追加に失
敗した場合には失敗した旨を、構造化文書内重要項目関
連付加項目指示制御部126に送信する(ステップS2
04、S205、S206)。
【0299】構造化文書内重要項目関連付加項目指示制
御部126は、記憶部制御部128から受信した内容を
付加項目指示部150に送信する(ステップS20
7)。
【0300】付加項目指示部150は、構造化文書内重
要項目関連付加項目指示制御部126から送信された内
容を受信し、付加項目指示実行結果表示部152に表示
する(ステップS208)。
【0301】なお、構造化文書内重要項目関連付加項目
条件テーブルの条件の変更、削除、構造化文書内重要項
目関連付加項目条件テーブル表示に関しては省略する。
【0302】次に、ユーザが構造化文書の閲覧要求を出
してから構造化文書内重要項目抽出装置に重要項目と付
加項目が保存されるまでに行う手続きについて説明す
る。
【0303】図25に、この手続きのフローチャートの
一例を示す。
【0304】構造化文書閲覧部130のユーザは、自分
が閲覧したいと思っている構造化文書の閲覧要求を構造
化文書要求入力部131に入力する。構造化文書閲覧部
130は、ユーザの入力を受け付け、構造化文書配信要
求を構造化文書処理部120に対して送信する(ステッ
プS301)。
【0305】構造化文書処理部120の構造化文書要求
解析部121は、構造化文書閲覧部130から送信され
た構造化文書配信要求を受信し、要求された構造化文書
がどの構造化文書配信装置上に存在するかを解析し、通
信路160を経由して、要求された構造化文書が存在す
るWWWサーバや電子メールサーバなどの構造化文書配
信装置に対して、または要求された構造化文書が存在す
るWWWサーバや電子メールサーバなどの構造化文書配
信装置と構造化文書処理部120の間に位置する構造化
文書送受信装置に対して、構造化文書配信要求を送信す
る(ステップS302)。
【0306】構造化文書配信要求を受信した構造化文書
配信装置は、要求された構造化文書を通信路110など
を経由して構造化文書処理部120に送信する(ステッ
プS303)。
【0307】構造化文書処理部120内の構造化文書受
信部122は、WWWサーバや電子メールサーバなどの
構造化文書配信装置から通信路170を経由して構造化
文書処理部120に送信された構造化文書を受信し、受
信した構造化文書の複写を行う。複写した構造化文書の
1方は、構造化文書閲覧部130に転送し、他方は構造
化文書内重要項目抽出部123に送信する(ステップS
304)。
【0308】構造化文書閲覧部130は、構造化文書処
理部120から送信された構造化文書を受信し、構造化
文書表示部132に表示する。また、構造化文書内重要
項目抽出部123は、構造化文書受信部122から送信
された構造化文書を受信する(ステップS305)。
【0309】次に、最新の構造化文書内重要項目条件テ
ーブルを構造化文書内重要項目抽出部123内に用意す
る。受信した構造化文書から重要項目の抽出を行う必要
があるかどうかの確認を行う(ステップS307)。
【0310】もし重要項目の抽出を行う必要がある場合
には、最新の構造化文書内重要項目条件テーブルの内容
にしたがって構造化文書内から重要項目をすべて抽出す
る。抽出作業が終了したら、抽出を行う前の構造化文書
と、抽出した重要項目すべてを、構造化文書内重要項目
関連付加項目生成部124に送信する(ステップS30
8)。
【0311】構造化文書内重要項目関連付加項目生成部
124は、構造化文書内重要項目抽出部123から送信
された、構造化文書と、抽出した重要項目すべてを受信
する。次に、最新の構造化文書内重要項目条件テーブル
を構造化文書内重要項目関連付加項目生成部124内に
用意する。付加項目の生成を行う必要があるかどうかの
確認を行う(ステップS309)。
【0312】もし付加項目の生成を行う必要がある場合
には、最新の構造化文書内重要項目条件テーブルの内容
にしたがって、重要項目に関連のある付加項目をすべて
抽出する(ステップS310)。
【0313】生成作業が終了したら、構造化文書内重要
項目関連付加項目生成部124は、構造化文書内重要項
目抽出部123が抽出した構造化文書内重要項目と、構
造化文書内重要項目関連付加項目生成部124が生成し
た構造化文書内重要項目関連付加項目をまとめて、記憶
部制御部128に送信し、記憶部制御部128に対し
て、これらの項目の記憶部129への保存を指示する
(ステップS311)。
【0314】記憶部制御部128は、構造化文書内重要
項目抽出部123が抽出した構造化文書内重要項目と、
構造化文書内重要項目関連付加項目生成部124が生成
した構造化文書内重要項目関連付加項目を、これから記
憶部129に書き込むデータを一時保持するための記憶
領域に受信し、受信した項目を記憶部129へ保存す
る。もし記憶部129へ保存しようとしている項目に対
応する構造化文書名が、すでに記憶部129へ保存され
ている項目に対応する構造化文書名と同じであった場
合、以前に保存した項目を保持したまま別の記憶領域に
新しい項目を保存するか、それとも以前に項目が保存し
てあった領域に新しい項目を上書きするか両方の方法が
考えられる(ステップS312)。
【0315】次に、ユーザが文書内重要項目抽出装置内
に格納されている項目の検索を行う際に行う手続きにつ
いて説明する。
【0316】図26に、この手続きのフローチャートの
一例を示す。
【0317】ユーザが、構造化文書処理部120内に保
存されている項目のうち、自分が検索したいと思ってい
る項目が満たすべき条件を検索指示部160の検索指示
入力部161に入力する。検索指示部160は、ユーザ
が入力した内容を構造化文書処理部120に送信する
(ステップS401)。
【0318】検索指示制御部127は、検索指示部16
0から送信される検索条件を受信し、検索条件の解析を
する(ステップS402)。
【0319】検索条件に合致する項目が記憶されている
かどうか判定する(ステップS403)。
【0320】検索条件に合致する項目が記憶されている
場合、この項目の記憶部129からの読み出しを記憶部
制御部128に指示する。検索条件に合致する項目が存
在する場合、検索指示部160から読み出しを指示され
た項目は、データを一時保持するための記憶領域上にあ
るかも知れないし、記憶部129上にしか存在しないか
も知れない。記憶部制御部128は、検索指示部160
から読み出しを指示された項目を、必要があれば記憶部
129から読み出し、検索指示制御部127に送信する
(ステップS404)。
【0321】検索条件に合致する項目が存在しない場合
には、その旨を検索指示制御部127に送信する(ステ
ップS405)。
【0322】検索指示制御部127は受信した内容を検
索指示部160に送信する(ステップS406)。
【0323】検索指示部160は送信された内容を受信
し、検索結果表示部162に表示する(ステップS40
7)。
【0324】(実施形態2−2)図27に、本実施形態
(2−2)に係る、重要項目を抽出し保存する機能と付
加項目を生成し保存する機能と検索機能を有する文書内
重要項目抽出装置を含む、構造化文書保存・検索システ
ムの構成例を示す。本構成例は、文書内重要項目抽出装
置をデータ中継装置で実現したものである。
【0325】なお、重要項目を抽出し保存する機能を有
する文書内重要項目抽出装置は、図27の構成から、構
造化文書内重要項目関連付加項目指示制御部226、付
加項目指示部250、検索指示制御部227、検索指示
部260を省いた構成に相当する。
【0326】また、重要項目を抽出し保存する機能と付
加項目を生成し保存する機能を有する文書内重要項目抽
出装置は、図22の構成から、検索指示制御部227、
検索指示部260を省いた構成に相当する。
【0327】また、重要項目を抽出し保存する機能と検
索機能を有する文書内重要項目抽出装置は、図27の構
成から構造化文書内重要項目関連付加項目指示制御部2
26、付加項目指示部250を省いた構成に相当する。
【0328】なお、これら一部の機能を有しないものに
ついては、その詳細な説明は省略する。
【0329】図27に示されるように、本構造化文書保
存・検索システムは、文書内重要項目抽出装置220、
構造化文書閲覧装置210、通信路270、構造化文書
送受信装置280からなる。
【0330】文書内重要項目抽出装置220は、構造化
文書閲覧装置要求解析部221、構造化文書受信部22
2、構造化文書内重要項目抽出部223、構造化文書内
重要項目関連付加項目生成部224、構造化文書内重要
項目指示制御部225、構造化文書内重要項目関連付加
項目指示制御部226、検索指示制御部227、記憶部
制御部228、記憶部229を備えている。
【0331】[構造化文書閲覧装置210]構造化文書
閲覧装置210は、構造化文書閲覧部230、重要項目
指示部240、付加項目指示部250、検索指示部26
0を備えている。
【0332】構造化文書閲覧部230は、構造化文書要
求入力部231、構造化文書表示部232を備えてい
る。
【0333】重要項目指示部240は、重要項目指示入
力部241、重要項目指示実行結果表示部242を備え
ている。
【0334】付加項目指示部250は、付加項目指示入
力部251、付加項目指示実行結果表示部252を備え
ている。
【0335】検索指示部260は、検索指示入力部26
1、検索結果表示部262を備えている。
【0336】<構造化文書閲覧部230>構造化文書閲
覧部230は、ユーザからの構造化文書閲覧要求を受け
付け、構造化文書送受信装置280に対して構造化文書
配信要求を送信する。また、構造化文書送受信装置28
0から送信される構造化文書を受信、表示する。
【0337】構造化文書要求入力部231は、ユーザが
構造化文書閲覧要求を入力する部分である。ユーザが構
造化文書閲覧要求を行う方法には、URLを指定する方
法などがある。
【0338】構造化文書表示部232は、構造化文書送
受信装置280から構造化文書閲覧部230に送信され
る構造化文書を表示する部分である。
【0339】<重要項目指示部240>重要項目指示部
240は、文書内重要項目抽出装置220が受信する構
造化文書内の項目のうち、どのような条件を満たす項目
が文書内重要項目抽出装置のユーザにとって重要である
かを、ユーザから文書内重要項目抽出装置220に指示
するための部分である。
【0340】ユーザは、文書内重要項目抽出装置220
が受信する構造化文書内の項目のうち、どのような条件
を満たす項目が自分にとって重要であるかを、重要項目
指示入力部241に入力する。
【0341】重要項目指示実行結果表示部242は、構
造化文書送受信装置280から重要項目指示部240に
送信されたデータを表示する。
【0342】<付加項目指示部250>付加項目指示部
250は、文書内重要項目抽出装置220が構造化文書
内から抽出した重要項目に関連する付加項目がどのよう
な条件を満たすべきかを、ユーザから文書内重要項目抽
出装置220に指示するための部分である。
【0343】ユーザは、文書内重要項目抽出装置220
が構造化文書内から抽出した重要項目に関連する付加項
目がどのような条件を満たすべきかを付加項目指示入力
部251に入力する。
【0344】付加項目指示実行結果表示部252は、構
造化文書送受信装置280から付加項目指示部250に
送信されたデータを表示する。
【0345】<検索指示部260>検索指示部260
は、ユーザが検索したいと思っている項目が満たすべき
条件を、ユーザから文書内重要項目抽出装置220に指
示するための部分である。
【0346】ユーザは、文書内重要項目抽出装置220
内に保存されている項目のうち、自分が検索したいと思
っている項目が満たすべき条件を検索指示入力部261
に入力する。
【0347】検索結果表示部262は、構造化文書送受
信装置280から検索指示部260に送信されたデータ
を表示する。
【0348】通信路270は、構造化文書閲覧部230
から文書内重要項目抽出装置220に対して送信された
構造化文書配信要求を中継し、WWWサーバや電子メー
ルサーバなどの構造化文書配信装置に対して送信する。
また、WWWサーバや電子メールサーバなどの構造化文
書配信装置から送信された構造化文書を中継し、文書内
重要項目抽出装置220に対して送信する。
【0349】[構造化文書受信装置280]構造化文書
受信装置280は、文書内重要項目抽出装置220と構
造化文書閲覧装置210の中間に位置し、文書内重要項
目抽出装置220と構造化文書閲覧装置210間で送受
信されるデータを中継する。
【0350】[文書内重要項目抽出装置220]文書内
重要項目抽出装置220は、WWWサーバや電子メール
サーバなどの構造化文書配信装置から送信された構造化
文書を受信し、受信した構造化文書を、構造化文書送受
信装置280を経由して構造化文書閲覧装置210に転
送すると同時に、受信した構造化文書内から重要項目を
抽出し、抽出した重要項目に関連する付加項目を生成
し、両者を組にした上で記憶部に保存する。同じ文書名
を持つ構造化文書を以前にも受信している場合には、再
度抽出、生成を再度行う必要があるのかどうかの確認を
行う必要がある。また、文書内重要項目抽出装置220
は、ユーザが重要項目指示部240、付加項目指示部2
50を利用して指定する方法にしたがって、重要項目と
付加項目の追加、変更、削除を行う。さらに文書内重要
項目抽出装置220は、ユーザが検索したい項目を検索
指示部260を利用して文書内重要項目抽出装置220
に通知すると、ユーザの要求に合致する項目を記憶部2
29に保存されている項目の中から検索し、読み出した
上で、構造化文書送受信装置280を経由して検索指示
部260に転送する。
【0351】<<構造化文書閲覧装置要求解析部221
>>構造化文書閲覧装置要求解析部221は、構造化文
書閲覧部230から構造化文書送受信装置280を経由
して文書内重要項目抽出装置220に送信された内容を
受信し、受信した内容の解析を行った上で、しかるべき
場所に転送する。
【0352】構造化文書閲覧部230から文書内重要項
目抽出装置220に送信される内容とは、具体的には、
以下に示す4つが考えられる。 (1)構造化文書閲覧部230から送信された構造化文
書配信要求 (2)重要項目指示部240から送信された重要項目指
示 (3)付加項目指示部250から送信された付加項目指
示 (4)検索指示部260から送信された検索指示 構造化文書閲覧部230から文書内重要項目抽出装置2
20に送信された内容が、構造化文書閲覧部230から
送信された構造化文書配信要求である場合、要求された
構造化文書がどの構造化文書配信装置上に存在するかを
解析し、通信路260を経由して、要求された構造化文
書が存在するWWWサーバや電子メールサーバなどの構
造化文書配信装置に対して、または要求された構造化文
書が存在する構造化文書配信装置と構造化文書内重要項
目抽出装置210の間に位置する構造化文書送受信に対
して、構造化文書配信要求を送信する。
【0353】構造化文書閲覧部230から文書内重要項
目抽出装置220に送信された内容が、重要項目指示部
240から送信された重要項目指示である場合、構造化
文書内重要項目指示制御部225へ転送する。
【0354】構造化文書閲覧部230から文書内重要項
目抽出装置220に送信された内容が、付加項目指示部
250から送信された付加項目指示である場合、構造化
文書内重要項目関連付加項目指示制御部226へ転送す
る。
【0355】構造化文書閲覧部230から文書内重要項
目抽出装置220に送信された内容が、検索指示部26
0から送信された検索指示である場合、検索指示制御部
227へ転送する。
【0356】<<構造化文書受信部222>>構造化文
書受信部222は、WWWサーバや電子メールサーバな
どの構造化文書配信装置から通信路270を経由して文
書内重要項目抽出装置220に送信された構造化文書を
受信し、受信した構造化文書の複写を行う。複写した構
造化文書の1方は、構造化文書送受信装置280を経由
して構造化文書閲覧装置210に転送し、他方は構造化
文書内重要項目抽出部223に転送する。
【0357】<<構造化文書内重要項目抽出部223>
>構造化文書内重要項目抽出部223は、構造化文書受
信部222から送信された構造化文書を受信し、構造化
文書内重要項目条件テーブルの内容にしたがい、構造化
文書内から重要項目の抽出を行う。構造化文書内重要項
目抽出部223は、構造化文書内重要項目条件テーブル
の内容を一時保持するための記憶領域を持つ。
【0358】受信した構造化文書が以前に受信した構造
化文書と同じ文書名をもつ構造化文書である場合には、
再度重要項目の抽出を行う必要があるかどうかを確認す
る。確認を行った結果、再度重要項目の抽出を行う必要
があると判断された場合には、構造化文書内重要項目抽
出部223は、最新の構造化文書内重要項目条件テーブ
ルの内容にしたがって、構造化文書からユーザにとって
重要な項目をすべて抽出する。
【0359】抽出作業が終了したら、構造化文書内重要
項目抽出部223は、抽出を行う前の構造化文書と、抽
出した重要項目すべてを、構造化文書内重要項目関連付
加項目生成部224に送信する。
【0360】<<構造化文書内重要項目関連付加項目生
成部224>>構造化文書内重要項目関連付加項目生成
部224は、構造化文書内重要項目抽出部223から送
信された構造化文書と構造化文書から抽出された重要項
目を受信し、構造化文書内重要項目関連付加項目条件テ
ーブルの内容にしたがい、付加項目の生成を行う。構造
化文書内重要項目関連付加項目生成部224は、構造化
文書内重要項目関連付加項目条件テーブルの内容を一時
保持するための記憶領域を持つ。
【0361】受信した構造化文書が以前に受信した構造
化文書と同じ文書名を持つ構造化文書であった場合に
は、再度重要項目の抽出を行う必要があるかどうかを確
認する。確認を行った結果、再度付加項目の生成を行う
必要があると判断された場合には、構造化文書内重要項
目関連付加項目生成部224は、最新の構造化文書内重
要項目関連付加項目条件テーブルの内容にしたがって、
構造化文書内重要項目抽出部223で抽出した重要項目
に関連する付加項目を生成する。
【0362】生成作業が終了したら、構造化文書内重要
項目関連付加項目生成部224は、構造化文書内重要項
目抽出部223が抽出した構造化文書内重要項目と、構
造化文書内重要項目関連付加項目生成部224が生成し
た構造化文書内重要項目関連付加項目をまとめて、記憶
部制御部228に送信し、記憶部制御部228に対し
て、抽出、生成した項目の記憶部229への保存を指示
する。
【0363】<<構造化文書内重要項目指示制御部22
5>>構造化文書内重要項目指示制御部225は、構造
化文書閲覧装置要求解析部221から送信される指示内
容を受信し、受信した内容にしたがって構造化文書内重
要項目条件テーブルの操作を行う。
【0364】<<構造化文書内重要項目関連付加項目指
示制御部226>>構造化文書内重要項目関連付加項目
指示制御部226は、構造化文書閲覧装置要求解析部2
21から送信される指示内容を受信し、受信した内容に
したがって構造化文書内重要項目関連付加項目条件テー
ブルの操作を行う。
【0365】<<検索指示制御部227>>検索指示制
御部227は、構造化文書閲覧装置要求解析部221か
ら送信される指示内容を受信し、検索条件の解析をす
る。検索条件に合致する項目の記憶部229からの読み
出しを記憶部制御部228に指示し、指示した結果記憶
部制御部228から送信される情報を構造化文書送受信
装置280を経由して検索指示部260に送信する。
【0366】<<記憶部制御部228>>記憶部制御部
228は、構造化文書内重要項目関連付加項目生成部2
24、構造化文書内重要項目指示制御部225、構造化
文書内重要項目関連付加項目指示制御部226、検索指
示制御部227から送信される、記憶部229からのデ
ータの読み出し、転送要求や、記憶部229へのデータ
の書き込み要求を受け付け、実行する。
【0367】記憶部制御228は、これから記憶部22
9に書き込むデータや記憶部229から読み出したデー
タを一時保持するための記憶領域を持つ。記憶部229
からの読み出し、転送を指示されたデータがすでに記憶
領域上に存在する場合には再度記憶部229からの読み
出しは行わずに、転送のみを行えばよい。
【0368】記憶部229からの読み出し、記憶部22
9への書き込みに失敗した場合には、その旨を通知す
る。
【0369】<<記憶部229>>記憶部229は、デ
ータの保存を行う。データとは具体的には以下のもので
ある。 (1)構造化文書から抽出した重要項目 (2)構造化文書から抽出した重要項目に関連する付加
項目 (3)構造化文書内重要項目条件テーブル (4)構造化文書内重要項目関連付加項目条件テーブル 次に、ユーザにとって重要な項目が満たすべき条件を新
たに構造化文書内重要項目条件テーブルに追加したい場
合に行う手続きについて説明する。
【0370】図28に、この手続きのフローチャートの
一例を示す。
【0371】ユーザは、重要項目指示部240の重要項
目指示入力部241に、自分にとって重要な構造化文書
内の項目が満たすべき条件と、この条件を新たに構造化
文書内重要項目条件テーブルに追加したい旨を入力す
る。入力された指示内容は、重要項目指示部240から
構造化文書送受信装置280を経由して文書内重要項目
抽出装置220に転送される(ステップS501)。
【0372】文書内重要項目抽出装置220の構造化文
書閲覧装置要求解析部221は、重要項目指示部240
から送信された指示内容を受信する。構造化文書閲覧装
置要求解析部221が受信した指示内容を解析し、構造
化文書内重要項目指示制御部225に転送する(ステッ
プS502)。
【0373】構造化文書内重要項目指示制御部225
は、構造化文書閲覧装置要求解析部221から転送され
た指示内容を受信し、指示内容を解析し、指示内容が、
構造化文書内重要項目条件テーブルへの新しい条件の追
加であることを知る(ステップS503)。
【0374】重要項目指示部240は、引き続き、記憶
部制御部228に対して、構造化文書内重要項目条件テ
ーブルへの新しい条件の追加を指示する(ステップS5
04)。
【0375】記憶部制御部228は、構造化文書内重要
項目条件テーブルへの新しい条件の追加を行う。追加に
成功した場合には成功した旨を、追加に失敗した場合に
は失敗した旨を、構造化文書内重要項目指示制御部22
5に送信する(ステップS505、S506、S50
7)。
【0376】構造化文書内重要項目指示制御部225
は、記憶部制御部228から受信した内容を、構造化文
書閲覧装置要求解析部221へ転送する(ステップS5
08)。
【0377】構造化文書閲覧装置要求解析部221は、
構造化文書内重要項目指示制御部225から受信した内
容を、構造化文書送受信装置280を経由して重要項目
指示部240に送信する(ステップS509)。
【0378】重要項目指示部240は、構造化文書閲覧
装置要求解析部221から送信された内容を受信し、重
要項目指示実行結果表示部242に表示する(ステップ
S510)。
【0379】なお、構造化文書内重要項目条件テーブル
の条件の変更、削除、構造化文書内重要項目条件テーブ
ル表示に関しては省略する。
【0380】次に、構造化文書から抽出した重要項目に
関連する付加項目が満たすべき条件を新たに構造化文書
内重要項目条件テーブルに追加したい場合に行う手続き
について説明する。
【0381】図29に、この手続きのフローチャートの
一例を示す。
【0382】ユーザは、付加項目指示部250の付加項
目指示入力部251に、構造化文書から抽出した重要項
目に関連する付加項目が満たすべき条件と、この条件を
新たに構造化文書内重要項目関連付加項目条件テーブル
に追加したい旨を入力する。入力された指示内容は、付
加項目指示部250から構造化文書送受信装置280を
経由して文書内重要項目抽出装置220に転送される
(ステップS601)。
【0383】文書内重要項目抽出装置220の構造化文
書閲覧装置要求解析部221は、付加項目指示部250
から送信された指示内容を受信する。構造化文書閲覧装
置要求解析部221が受信した指示内容を解析し、構造
化文書内重要項目関連付加項目指示制御部226に転送
する(ステップS602)。
【0384】構造化文書内重要項目関連付加項目指示制
御部226は、構造化文書閲覧装置要求解析部221か
ら転送された指示内容を受信し、指示内容を解析し、指
示内容が、構造化文書内重要項目関連付加項目条件テー
ブルへの新しい条件の追加であることを知る(ステップ
S603)。
【0385】付加項目指示部250は引き続き、記憶部
制御部228に対して、構造化文書内重要項目関連付加
項目条件テーブルへの新しい条件の追加を指示する(ス
テップS604)。
【0386】記憶部制御部228は、構造化文書内重要
項目関連付加項目条件テーブルへの新しい条件の追加を
行う。追加に成功した場合には成功した旨を、追加に失
敗した場合には失敗した旨を、構造化文書内重要項目関
連付加項目指示制御部226に送信する(ステップS6
05、S606、S607)。
【0387】構造化文書内重要項目関連付加項目指示制
御部226は、記憶部制御部228から受信した内容を
構造化文書閲覧装置要求解析部221へ転送する(ステ
ップS608)。
【0388】構造化文書閲覧装置要求解析部221は、
構造化文書内重要項目関連付加項目指示制御部226か
ら受信した内容を、構造化文書送受信装置280を経由
して付加項目指示部250に送信する(ステップS60
9)。
【0389】付加項目指示部250は、構造化文書閲覧
装置要求解析部221から送信された内容を受信し、付
加項目指示実行結果表示部252に表示する(ステップ
S610)。
【0390】なお、構造化文書内重要項目関連付加項目
条件テーブルの条件の変更、削除、構造化文書内重要項
目関連付加項目条件テーブル表示に関しては省略する。
【0391】次に、ユーザが構造化文書の閲覧要求を出
してから構造化文書内重要項目抽出装置に重要項目と付
加項目が保存されるまでに行う手続きについて説明す
る。
【0392】図30に、この手続きのフローチャートの
一例を示す。
【0393】構造化文書閲覧部230のユーザは、自分
が閲覧したいと思っている構造化文書の閲覧要求を構造
化文書要求入力部231に入力する。構造化文書閲覧部
230は、ユーザの入力を受け付け、構造化文書配信要
求を文書内重要項目抽出装置220に対して送信する
(ステップS701)。
【0394】文書内重要項目抽出装置220の構造化文
書閲覧装置要求解析部221は、構造化文書閲覧部23
0から送信された構造化文書配信要求を受信し、要求さ
れた構造化文書がどの構造化文書配信装置上に存在する
かを解析し、通信路260を経由して、要求された構造
化文書が存在するWWWサーバや電子メールサーバなど
の構造化文書配信装置に対して、または要求された構造
化文書が存在するWWWサーバや電子メールサーバなど
の構造化文書配信装置と文書内重要項目抽出装置220
の間に位置する構造化文書送受信装置に対して、構造化
文書配信要求を送信する(ステップS702)。
【0395】構造化文書配信要求を受信した構造化文書
配信装置は、要求された構造化文書を通信路270など
を経由して文書内重要項目抽出装置220に送信する
(ステップS703)。
【0396】文書内重要項目抽出装置220内の構造化
文書受信部222は、サーバや電子メールサーバなどの
構造化文書配信装置から通信路270を経由して文書内
重要項目抽出装置220に送信された構造化文書を受信
し、受信した構造化文書の複写を行う。複写した構造化
文書の1方は、構造化文書送受信装置280を経由して
構造化文書閲覧装置210に転送する。他方は構造化文
書内重要項目抽出部223に送信する(ステップS70
4)。
【0397】構造化文書閲覧部230は、文書内重要項
目抽出装置220から構造化文書送受信装置280を経
由して送信された構造化文書を受信し、構造化文書表示
部232に表示する。また、構造化文書内重要項目抽出
部223は、構造化文書受信部222から送信された構
造化文書を受信する(ステップS705)。
【0398】次に、最新の構造化文書内重要項目条件テ
ーブルを構造化文書内重要項目抽出部223内に用意す
る。受信した構造化文書から重要項目の抽出を行う必要
があるかどうかの確認を行う(ステップS707)。
【0399】もし重要項目の抽出を行う必要がある場合
には、最新の構造化文書内重要項目条件テーブルの内容
にしたがって構造化文書内から重要項目をすべて抽出す
る。抽出作業が終了したら、抽出を行う前の構造化文書
と、抽出した重要項目すべてを、構造化文書内重要項目
関連付加項目生成部224に送信する(ステップS70
8)。
【0400】構造化文書内重要項目関連付加項目生成部
224は、構造化文書内重要項目抽出部223から送信
された、構造化文書と、抽出した重要項目すべてを受信
する。次に、最新の構造化文書内重要項目条件テーブル
を構造化文書内重要項目関連付加項目生成部224内に
用意する。付加項目の生成を行う必要があるかどうかの
確認を行う(ステップS709)。
【0401】もし付加項目の生成を行う必要がある場合
には、最新の構造化文書内重要項目条件テーブルの内容
にしたがって、重要項目に関連のある付加項目をすべて
抽出する。(ステップS710)。
【0402】生成作業が終了したら、構造化文書内重要
項目関連付加項目生成部224は、構造化文書内重要項
目抽出部223が抽出した構造化文書内重要項目と、構
造化文書内重要項目関連付加項目生成部224が生成し
た構造化文書内重要項目関連付加項目をまとめて、記憶
部制御部228に送信し、記憶部制御部228に対し
て、これらの項目の記憶部229への保存を指示する
(ステップS711)。
【0403】記憶部制御部228は、構造化文書内重要
項目抽出部223が抽出した構造化文書内重要項目と、
構造化文書内重要項目関連付加項目生成部224が生成
した構造化文書内重要項目関連付加項目を、これから記
憶部229に書き込むデータを一時保持するための記憶
領域に受信し、受信した項目を記憶部229へ保存す
る。もし記憶部229へ保存しようとしている項目に対
応する構造化文書名が、すでに記憶部229へ保存しよ
うとしている項目に対応する構造化文書名が、すでに記
憶部229へ保存されている項目に対応する構造化文書
名と同じであった場合、以前に保存した項目を保持した
まま別の記憶領域に新しい項目を保存するか、それとも
以前に項目が保存してあった領域に新しい項目を上書き
するか両方の方法が考えられる(ステップS712)。
【0404】次に、ユーザが文書内重要項目抽出装置内
に格納されている項目の検索を行う際に行う手続きにつ
いて説明する。
【0405】図31に、この手続きのフローチャートの
一例を示す。
【0406】ユーザが、文書内重要項目抽出装置220
内に保存されている項目のうち、自分が検索したいと思
っている項目が満たすべき条件を検索指示部260の検
索指示入力部261に入力する。検索指示部260は、
ユーザが入力した内容を構造化文書送受信装置280を
経由して文書内重要項目抽出装置220に送信する(ス
テップS801)。
【0407】文書内重要項目抽出装置220の構造化文
書閲覧装置要求解析部221は、検索指示部260から
送信された指示内容を受信する。構造化文書閲覧装置要
求解析部221が受信した指示内容を解析し、検索指示
制御部227に転送する(ステップS802)。
【0408】検索指示制御部227は、検索指示部26
0から送信される検索条件を受信し、検索条件の解析を
する(ステップS803)。
【0409】検索条件に合致する項目が記憶されている
かどうか判定する(ステップS804)。
【0410】検索条件に合致する項目が記憶されている
場合、この項目の記憶部229からの読み出しを記憶部
制御部228に指示する。検索指示部260から読み出
しを指示された項目は、データを一時保持するための記
憶領域上にあるかも知れないし、記憶部229上にしか
存在しないかも知れない。記憶部制御部228は、検索
指示部260から読み出しを指示された項目を、必要が
あれば記憶部229から読み出し、検索指示制御部22
7に送信する(ステップS805)。
【0411】検索条件に合致する項目が存在しない場合
には、その旨を検索指示制御部227に送信する(ステ
ップS806)。
【0412】検索指示制御部227は、記憶部制御部2
28から受信した内容を構造化文書閲覧装置要求解析部
221へ転送する(ステップS807)。
【0413】構造化文書閲覧装置要求解析部221は、
検索指示制御部227から受信した内容を、構造化文書
送受信装置280を経由して付加項目指示部250に送
信する(ステップS808)。
【0414】検索指示部260は送信された内容を受信
し、検索結果表示部262に表示する(ステップS80
9)。
【0415】本実施形態によれば、本文書内重要項目抽
出装置をWWWサーバなどの構造化文書配信装置から配
信される構造化文書を閲覧する際に用いると、文書内重
要項目抽出装置は、ユーザに代わって、受信した構造化
文書内からユーザにとって重要である項目を自動的に抽
出し、抽出した項目に関連がある付加項目(構造化文書
の重要項目を抽出した日時、構造化文書が存在する位
置、構造化文書の重要項目以外の項目が存在する位置な
ど)を生成し、両者を組にした上で記憶装置に保存す
る。抽出、生成、保存の作業は文書内重要項目抽出装置
によって自動的になされるので、ユーザは、閲覧した構
造化文書ごとに自力で重要項目を抽出、保存する煩わし
さから開放され、抽出し忘れることも保存し忘れること
もなくなる。
【0416】また、本実施形態に係る文書内重要項目抽
出装置は、上記方法で構造化文書の重要項目を検索する
と、あらかじめ保存してある構造化文書内の重要項目や
構造化文書内の重要項目に関連のある付加項目の中から
所望の情報を得ることが可能となる。ユーザにとって重
要な項目を文書内重要項目抽出装置に指示する際、指示
の仕方が不十分であったために、ユーザにとって重要で
ある項目が構造化文書内から抽出されなかった場合、構
造化文書内の重要項目に関連する付加項目として、構造
化文書が存在する位置を保持していれば、再度構造化文
書全体の転送を構造化文書配信装置に依頼することで、
所望の情報を得ることが可能となる。
【0417】(第3の実施形態)次に、本発明の第3の
実施形態について説明する。
【0418】本実施形態では、文書内重要項目抽出装置
で抽出した重要項目を保存する際に、その重要項目を抽
出したユーザ毎に分離して保存する。このようにするこ
とで、後にユーザが設定した重要項目を読み出したり、
検索したりするときに、重要項目を取り出しやすくな
る。
【0419】このような文書内重要項目抽出装置につい
ては、実施形態3−1,3−2で説明する。なお、実施
形態3−1は、文書内重要項目抽出装置をデータ送受信
装置において実現した形態(ユーザの利用するクライア
ントで動作している構成)であり、実施形態3−2は、
文書内重要項目抽出装置をデータ中継装置において実現
した形態(ユーザの利用するクライアントから独立して
いる構成)である。
【0420】また、本実施形態では、上記のように文書
内重要項目抽出装置で抽出した重要項目をユーザ毎に格
納するとともに、その重要項目に対するアクセス許可リ
ストを付加する機能を提供する。これにより、あるユー
ザに関して抽出され、保存されている重要項目を、異な
るユーザ間で共有することが可能になる。
【0421】このような文書内重要項目抽出装置につい
ては、実施形態3−3,3−4で説明する。実施形態3
−3は、文書内重要項目抽出装置をデータ送受信装置に
おいて実現した形態であり、実施形態3−4は、文書内
重要項目抽出装置をデータ中継装置において実現した形
態である。
【0422】また、本実施形態では、上記のようにユー
ザ毎に保存されている重要項目に対してアクセス許可リ
ストを付加する機能を提供するとともに、そのアクセス
許可リストを変更する機能を提供する。これにより、あ
るユーザに関して抽出され、保存されている重要項目を
異なるユーザ間で共有している状態を変更し、適切に共
有することが可能となる。
【0423】このような文書内重要項目抽出装置につい
ては、実施形態3−5,3−6で説明する。実施形態3
−5は、文書内重要項目抽出装置をデータ送受信装置に
おいて実現した形態であり、実施形態3−6は、文書内
重要項目抽出装置をデータ中継装置において実現した形
態である。
【0424】また、本実施形態では、複数のユーザの要
求によって同一の構造化文書から同一の重要項目が抽出
される場合に、このユーザ間で共通の重要項目について
はこれを共有できる形態で保存するようにする機能を提
供する。
【0425】このような文書内重要項目抽出装置につい
ては、実施形態3−7で説明する。実施形態3−7は、
文書内重要項目抽出装置をデータ中継装置において実現
した形態である。
【0426】(実施形態3−1)図32に、本実施形態
(3−1)に係る文書内重要項目抽出装置の構成例を示
す。
【0427】本実施形態の文書内重要項目抽出装置10
400は、ユーザインタフェース部10401、ユーザ
認証部10402、構造化文書要求受信部10403、
構造化文書送信部10404、重要項目抽出部1040
5、構造化文書送受信部10406、重要項目格納部1
0407を備えている。
【0428】ユーザインタフェース部10401は、ユ
ーザとのインタフェースを司る部分であり、ユーザとの
情報の入出力を可能とするため、キーボード、マウスな
どの入力装置、ディスプレイ、スピーカーなどの出力装
置を備えている。
【0429】ユーザ認証部10402は、文書内重要項
目抽出装置10400に、アクセスしてくるユーザを認
証する部分である。ユーザを認証する手段としては、例
えば、パスワードを用いる認証方式などが利用できる。
認証するための情報は、ユーザインタフェース部104
01を介して渡される。
【0430】構造化文書要求受信部10403は、ユー
ザからの要求を、ユーザインタフェース部10401経
由で、構造化文書送受信部10406にユーザ情報とと
もに渡す部分である。
【0431】構造化文書送受信部10406は、構造化
文書要求受信部10403から渡されるユーザの要求に
従って、必要となる構造化文書を外部に対して要求し、
該当する構造化文書を受信する部分である。
【0432】重要項目抽出部10405は、構造化文書
送受信部10406から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受けとり、構造化文書
内の重要項目を抽出し、重要項目格納部10407に格
納するとともに、構造化文書を構造化文書送信部104
04へ送る部分である。また、構造化文書要求受信部1
0403より、重要項目の要求があった場合には、重要
項目格納部10407より要求された該重要項目を構造
化文書送信部10404へ送る。
【0433】重要項目の抽出は、予めユーザが指定した
キーワードや構造化文書に附属しているタグを基に行う
方法が考えられる。例えば、構造化文書の中に、ユーザ
が指定したタグが含まれている部分、およびキーワード
が含まれている部分が存在した場合には、その該当する
部分を抽出する。あるいは、これらのタグ、キーワード
が含まれている構造化文書全体を対象としても良い。抽
出した情報は、後に検索が可能なように、重要項目だけ
でなく、構造化文書の作成された日時、構造化文書を受
信した日時、どこから構造化文書を受信したかを示す場
所に関する情報なども併せて記憶しても良い。
【0434】重要項目格納部10407は、重要項目抽
出部10405の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部10407には、それを記録する
ための媒体が附属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0435】構造化文書送信部10404は、重要項目
抽出部10405より送られてきた構造化文書を、ユー
ザインタフェース部10401を介してユーザへ送信す
る部分である。
【0436】次に、文書内重要項目抽出装置10400
の動作について説明する。
【0437】図33に、文書内重要項目抽出装置104
00の動作アルゴリズムの一例を示す。
【0438】ユーザインタフェース部10401がユー
ザからのリクエストを受け付ける(ステップS1090
1)。ユーザインタフェース部10401は、受け付け
たリクエストを構造化文書要求受信部10403に渡す
(ステップS10902)。
【0439】構造化文書要求受信部10403は、ユー
ザ認証部10402を起動し、リクエストを出したユー
ザをユーザインタフェース部10401を起動して認証
する(ステップS10903)。構造化文書要求受信部
10403は、構造化文書送受信部10406に対し、
ユーザ情報とユーザのリクエストを伝える(ステップS
10904)。
【0440】構造化文書送受信部10406は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS10905)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部10406は、受信
した構造化文書とユーザ情報を重要項目抽出部1040
5に渡す(ステップS10906)。
【0441】重要項目抽出部10405は、受信した構
造化文書に重要項目が含まれているかどうかを検索する
(ステップS10907)。重要項目が含まれている場
合には、重要項目を抽出し(ステップS10909)、
重要項目格納部10407を起動し、そのユーザに対応
した場所に抽出した重要項目を格納する(ステップS1
0910)。重要項目が含まれていなかった場合には、
何もしない。重要項目抽出部10405は、構造化文書
送信部10404に、受信した構造化文書を渡す(ステ
ップS10911)。
【0442】構造化文書送信部10404は、ユーザイ
ンタフェース部10401に受信した構造化文書を渡し
(ステップS10912)、ユーザインタフェース部1
0401は、受信した構造化文書をユーザに渡す(ステ
ップS10913)。
【0443】文書内重要項目抽出装置10400は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置10400
を構成する各部分10401〜10407の動作を記述
したプログラムをCPUで実行することにより、その機
能を得ることが出来る。
【0444】また、文書内重要項目抽出装置10400
を構成する各部分10401〜10407は、それぞ
れ、もしくはその一部を、文書内重要項目抽出装置10
400と同様に、CPUとメモリ装置と通信装置から構
成し、それぞれの動作を記述したプログラムをCPUで
実行することにより、それぞれの機能が得られ、その集
合体として構成することも可能である。
【0445】以上のように、本実施形態によれば、予
め、ユーザが重要と考えるキーワードや構造化文書のタ
グを指定しておくことにより、受信した構造化文書か
ら、文書内重要項目抽出装置が、ユーザに代わって重要
項目を抽出することが可能となり、ユーザの手間を大き
く削減することが可能となる。
【0446】(実施形態3−2)図34に、本実施形態
(3−2)に係る文書内重要項目抽出装置の構成例を示
す。
【0447】本実施形態の文書内重要項目抽出装置10
200は、ユーザ認証部10202、構造化文書要求受
信部10203、構造化文書送信部10204、重要項
目抽出部10205、構造化文書送受信部10206、
重要項目格納部10207を備えている。
【0448】ユーザ認証部10202は、重要項目抽出
装置10200に、ブラウザなどを用いてアクセスして
くるユーザ10201を認証する部分である。ユーザを
認証する手段としては、例えば、パスワードを用いる認
証方式などが利用できる。
【0449】構造化文書要求受信部10203は、ユー
ザ10201からの要求を、構造化文書送受信部102
06にユーザ情報とともに渡す部分である。
【0450】構造化文書送受信部10206は、構造化
文書要求受信部10203から渡されるユーザ1020
1の要求に従って、必要となる構造化文書を外部に対し
て要求し、該当する構造化文書を受信する部分である。
【0451】重要項目抽出部10205は、構造化文書
送受信部10206から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受けとり、構造化文書
内の重要項目を抽出し、重要項目格納部10207に格
納するとともに、構造化文書を構造化文書送信部102
04へ送る部分である。また、構造化文書要求受信部1
0203より、重要項目の要求があった場合には、重要
項目格納部10207より要求された該重要項目を構造
化文書送信部10204へ送る。
【0452】重要項目の抽出は、予めユーザ10201
が指定したキーワードや構造化文書に附属しているタグ
を基に行う方法が考えられる。例えば、構造化文書の中
に、ユーザ10201が指定したタグが含まれている部
分、およびキーワードが含まれている部分が存在した場
合には、その該当する部分を抽出する。あるいは、これ
らのタグ、キーワードが含まれている構造化文書全体を
対象としても良い。抽出した情報は、後に検索が可能な
ように、重要項目だけでなく、構造化文書の作成された
日時、構造化文書を受信した日時、どこから構造化文書
を受信したかを示す場所に関する情報なども合わせて記
憶しても良い。
【0453】重要項目格納部10207は、重要項目抽
出部10205の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部10207には、それを記録する
ための媒体が附属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0454】構造化文書送信部10204は、重要項目
抽出部10205より送られてきた構造化文書を、ユー
ザ10201へ送信する部分である。
【0455】次に、文書内重要項目抽出装置10200
の動作について説明する。
【0456】図35に、文書内重要項目抽出装置102
00の動作アルゴリズムの一例を示す。
【0457】構造化文書要求受信部10203は、ユー
ザからのリクエストを受信する(ステップS1080
1)。リクエストを受信した構造化文書要求受信部10
203は、ユーザ認証部10202を起動し、リクエス
トを出したユーザを認証する(ステップS1080
2)。
【0458】構造化文書要求受信部10203は、認証
されたユーザ情報とユーザのリクエストを構造化文書送
受信部10206に伝える(ステップS10803)。
【0459】構造化文書送受信部10206は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS10804)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部10206は、受信
した構造化文書とユーザ情報を重要項目抽出部1020
5に渡す(ステップS10805)。
【0460】重要項目抽出部10205は、受信した構
造化文書に重要項目が含まれているかどうかを検索する
(ステップS10806)。重要項目が含まれている場
合には、重要項目を抽出し(ステップS10808)、
重要項目格納部10207を起動し、そのユーザに対応
した場所に抽出した重要項目を格納する(ステップS1
0809)。重要項目が含まれていなかった場合には、
何もしない。重要項目抽出部10205は、構造化文書
送信部10204に、受信した構造化文書を渡す(ステ
ップS10810)。構造化文書送信部は10204
は、重要項目抽出部より渡された構造化文書をユーザに
送信する(ステップS10811)。
【0461】文書内重要項目抽出装置10200は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置10200
を構成する各部分10201〜10207の動作を記述
したプログラムをCPUで実行することにより、その機
能を得ることが出来る。
【0462】また、文書内重要項目抽出装置10200
を構成する各部分10201〜10207は、それぞ
れ、もしくはその一部を、文書内重要項目抽出装置10
200と同様に、CPUとメモリ装置と通信装置から構
成し、それぞれの動作を記述したプログラムをCPUで
実行することにより、それぞれの機能が得られ、その集
合体として構成することも可能である。
【0463】以上のように、本実施形態によれば、予
め、文書内重要項目抽出装置を利用するユーザ毎に、ユ
ーザが重要と考えるキーワードや構造化文書のタグを指
定しておくことにより、文書内重要項目抽出装置が、送
られてきた構造化文書から、ユーザ毎にユーザに代わっ
て重要項目を抽出することが可能となり、ユーザの手間
を大きく削減することが可能となる。
【0464】(実施形態3−3)図36に、本実施形態
(3−3)に係る文書内重要項目抽出装置の構成例を示
す。
【0465】本実施形態の文書内重要項目抽出装置10
500は、ユーザインタフェース部10501、ユーザ
認証部10502、構造化文書要求受信部10503、
構造化文書送信部10504、重要項目抽出部1050
5、構造化文書送受信部10506、重要項目格納部1
0507、アクセス許可判定部10508を備えてい
る。
【0466】ユーザインタフェース部10501は、ユ
ーザとのインタフェースを司る部分であり、ユーザとの
情報の入出力を可能とするため、キーボード、マウスな
どの入力装置、ディスプレイ、スピーカーなどの出力装
置を備えている。
【0467】ユーザ認証部10502は、文書内重要項
目抽出装置10500にアクセスしてくるユーザを認証
する部分である。ユーザを認証する手段としては、例え
ば、パスワードを用いる認証方式などが利用できる。
【0468】構造化文書要求受信部10503は、ユー
ザからの要求を、構造化文書送受信部10506にユー
ザ情報とともに渡す部分である。
【0469】構造化文書送受信部10506は、構造化
文書要求受信部10503から渡されるユーザの要求に
従って、必要となる構造化文書を外部に対して要求し、
該当する構造化文書を受信する部分である。
【0470】重要項目抽出部10505は、構造化文書
送受信部10506から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受けとり、構造化文書
内の重要項目を抽出し、重要項目格納部10507に格
納するとともに、構造化文書を構造化文書送信部105
04へ送る部分である。また、構造化文書要求受信部1
0503より、重要項目の要求があった場合には、重要
項目格納部10307より要求された該重要項目を構造
化文書送信部10504へ送る。
【0471】重要項目の抽出は、予めユーザが指定した
キーワードや構造化文書に附属しているタグを基に行う
方法が考えられる。例えば、構造化文書の中に、ユーザ
が指定したタグが含まれている部分、およびキーワード
が含まれている部分が存在した場合には、その該当する
部分を抽出する。あるいは、これらのタグ、キーワード
が含まれている構造化文書全体を対象としても良い。抽
出した情報は、後に検索が可能なように、重要項目だけ
でなく、構造化文書の作成された日時、構造化文書を受
信した日時、どこから構造化文書を受信したかを示す場
所に関する情報なども合わせて記憶しても良い。
【0472】重要項目格納部10507は、重要項目抽
出部10505の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部10507には、それを記録する
ための媒体が附属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0473】構造化文書送信部10504は、重要項目
抽出部10505より送られてきた構造化文書を、ユー
ザへ送信する部分である。
【0474】アクセス許可判定部10508は、重要項
目抽出部10505より、重要項目を読み出す際のアク
セス許可を判断する部分である。アクセス許可判定部1
0508は、重要項目抽出部10505より、ある重要
項目の読み出し要求と、読み出し要求を出したユーザ情
報を与えられると、内部に持つアクセス許可リストに従
い、読み出しの可、不可を判断し、判断結果を重要項目
抽出部10505に返す。
【0475】ここで、図37に、抽出された重要項目
と、それに対応するアクセス許可リストの格納例を示
す。この例は、「会議」という重要項目を抽出したもの
である。「会議」に対応するキーワードとしては、「m
eeting」があり、文書重要項目抽出装置1050
0では、このキーワードが構造化文書内に含まれている
かどうかを調べ、含まれている場合には抽出し、図37
のような形態で格納する。このとき、重要項目だけでな
く、抽出した重要項目に関するアクセス許可リストを作
成し、抽出した重要項目との対応がわかるよう、格納す
る。この例では、「会議」に対して抽出された重要項目
1は、重要項目の所有者はユーザ“foo”であり、こ
の重要項目に対して、アクセスが許可されているのは、
ユーザ“foo”とユーザ“bar”である。同様に、
抽出された重要項目2に関しては、所有者はユーザ
“A”であり、アクセスが許可されているのは、ユーザ
“A”、“B”、“C”である。
【0476】なお、ここでは、構造化文書の要求を出し
たユーザが所有者となる。
【0477】次に、ユーザが外部に対して構造化文書の
リクエストを出したときの文書内重要項目抽出装置10
500の動作について説明する。
【0478】図38に、ユーザが外部に対して構造化文
書のリクエストを出したときの文書内重要項目抽出装置
10500の動作アルゴリズムの一例を示す。
【0479】ユーザインタフェース部10501がユー
ザからのリクエストを受け付ける(ステップS1120
1)。ユーザインタフェース部10501は、受け付け
たリクエストを構造化文書要求受信部10503に渡す
(ステップS11202)。
【0480】構造化文書要求受信部10503は、ユー
ザ認証部10502を起動し、リクエストを出したユー
ザをユーザインタフェース部10501を起動して認証
する(ステップS11203)。構造化文書要求受信部
10503は、構造化文書送受信部10506に対し、
ユーザ情報とユーザのリクエストを伝える(ステップS
11204)。
【0481】構造化文書送受信部10506は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS11205)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部10506は、受信
した構造化文書とユーザ情報を重要項目抽出部1050
5に渡す(ステップS11206)。
【0482】重要項目抽出部10505は、受信した構
造化文書に重要項目が含まれているかどうかを検索する
(ステップS11207)。重要項目が含まれている場
合には、重要項目を抽出し(ステップS11209)、
重要項目格納部10507を起動し、そのユーザに対応
した場所に抽出した重要項目を格納する(ステップS1
1210)。重要項目が含まれていなかった場合には、
何もしない。重要項目抽出部10505は、構造化文書
送信部10504に、受信した構造化文書を渡す(ステ
ップS11211)。
【0483】構造化文書送信部は10504は、ユーザ
インタフェース部10501に受信した構造化文書を渡
し(ステップS11212)、ユーザインタフェース部
10501は、受信した構造化文書をユーザに渡す(ス
テップS11213)。
【0484】次に、ユーザが格納されている重要項目に
対してアクセス要求を出したときの文書内重要項目抽出
装置10500の動作について説明する。
【0485】図39に、ユーザが格納されている重要項
目に対してアクセス要求を出したときの文書内重要項目
抽出装置10500の動作アルゴリズムの一例を示す。
【0486】ユーザインタフェース部10501がユー
ザからのリクエストを受け付ける(ステップS1130
1)。ユーザインタフェース部10501は、受け付け
たリクエストを構造化文書要求受信部10503に渡す
(ステップS11302)。
【0487】構造化文書要求受信部10503は、ユー
ザ認証部10502を起動し、要求を出したユーザを認
証する(ステップS11303)。構造化文書要求受信
部10503は、重要項目抽出部10505に対し、ユ
ーザ情報と、アクセス要求を伝える(ステップS113
04)。
【0488】重要項目抽出部10505は、アクセス許
可判定部10508を起動し、ユーザが要求した重要項
目へのアクセスを許可する、許可しないを判定する(ス
テップS11305)。アクセスが許可された場合に
は、重要項目抽出部10505は、重要項目格納部10
507を起動し、該当する重要項目を取り出す(ステッ
プS11307)。重要項目抽出部10505は、取り
出した重要項目を構造化文書送信部10504に渡す
(ステップS11309)。なお、この取り出した重要
項目も構造化文書である。アクセスが許可されなかった
場合には、重要項目へのアクセスが不許可であることを
示す構造化文書を構造化文書送信部10504に渡す
(ステップS11308)。
【0489】構造化文書送信部10504は、渡されて
きた構造化文書(取り出された重要項目またはアクセス
が不許可であることを示すもの)をユーザインタフェー
ス部10501に渡す(ステップS11310)。ユー
ザインタフェース部10501は、渡されてきた構造化
文書をユーザに渡す(ステップS11311)。なお、
上記では、アクセスが不許可であることを示す情報を構
造化文書としてユーザに渡すようにしたが、アクセスが
不許可であることを示す情報を構造化文書でない情報、
例えば通常のメッセージ、としてユーザに渡すようにし
てもよい。
【0490】なお、重要項目に対するアクセス要求を、
閲覧のみか、編集も行うか、など細かく規定し、ある重
要項目に対して、そのアクセス許可リストの<所有者>
に登録されているユーザのみがこれを編集することを可
能とし、<許可ユーザ>に登録されているユーザは閲覧
のみ可能とするなどの、細かいアクセス制御を行うよう
にしてもよい。
【0491】また、図37の他にも、アクセス許可リス
トの形式には、種々のバリエーションが考えられる。
【0492】文書内重要項目抽出装置10500は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置10500
を構成する各部分10501〜10508の動作を記述
したプログラムをCPUで実行することにより、その機
能を得ることが出来る。
【0493】また、文書内重要項目抽出装置10500
を構成する各部分10501〜10508は、それぞ
れ、もしくはその一部を、文書内重要項目抽出装置10
500と同様に、CPUとメモリ装置と通信装置から構
成し、それぞれの動作を記述したプログラムをCPUで
実行することにより、それぞれの機能が得られ、その集
合体として構成することも可能である。
【0494】以上のように、本実施形態によれば、予
め、文書内重要項目抽出装置を利用するユーザ毎に、ユ
ーザが重要と考えるキーワードや構造化文書のタグを指
定しておくことにより、文書内重要項目抽出装置が、送
られてきた構造化文書から、ユーザ毎にユーザに代わっ
て重要項目を抽出することが可能となり、ユーザの手間
を大きく削減することが可能となる。また、抽出した重
要項目に対して、アクセス制御情報を付加することによ
り、必要にして十分な重要項目をユーザ間で共有するの
が容易になる。
【0495】(実施形態3−4)図40に、本実施形態
(3−4)に係る文書内重要項目抽出装置の構成例を示
す。
【0496】本実施形態の文書内重要項目抽出装置10
300は、ユーザ認証部10302、構造化文書要求受
信部10303、構造化文書送信部10304、重要項
目抽出部10305、構造化文書送受信部10306、
重要項目格納部10307、アクセス許可判定部103
08を備えている。
【0497】ユーザ認証部10302は、文書内重要項
目抽出装置10300に、ブラウザなどを用いてアクセ
スしてくるユーザ10301を認証する部分である。ユ
ーザを認証する手段としては、例えば、パスワードを用
いる認証方式などが利用できる。
【0498】構造化文書要求受信部10303は、ユー
ザ10301からの要求を、構造化文書送受信部103
06にユーザ情報とともに渡す部分である。
【0499】構造化文書送受信部10306は、構造化
文書要求受信部10303から渡されるユーザ1030
1の要求に従って、必要となる構造化文書を外部に対し
て要求し、該当する構造化文書を受信する部分である。
【0500】重要項目抽出部10305は、構造化文書
送受信部10306から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受けとり、構造化文書
内の重要項目を抽出し、重要項目格納部10307に格
納するとともに、構造化文書を構造化文書送信部103
04へ送る部分である。また、構造化文書要求受信部1
0303より、重要項目の要求があった場合には、重要
項目格納部10307より要求された該重要項目を構造
化文書送信部10304へ送る。
【0501】重要項目の抽出は、予めユーザ10301
が指定したキーワードや構造化文書に附属しているタグ
を基に行う方法が考えられる。例えば、構造化文書の中
に、ユーザ10301が指定したタグが含まれている部
分、およびキーワードが含まれている部分が存在した場
合には、その該当する部分を抽出する。あるいは、これ
らのタグ、キーワードが含まれている構造化文書全体を
対象としても良い。抽出した情報は、後に検索が可能な
ように、重要項目だけでなく、構造化文書の作成された
日時、構造化文書を受信した日時、どこから構造化文書
を受信したかを示す場所に関する情報なども合わせて記
憶しても良い。
【0502】重要項目格納部10307は、重要項目抽
出部10305の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部10307には、それを記録する
ための媒体が附属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0503】構造化文書送信部10304は、重要項目
抽出部10305より送られてきた構造化文書を、ユー
ザ10301へ送信する部分である。
【0504】アクセス許可判定部10308は、重要項
目抽出部10305より、重要項目を読み出す際のアク
セス許可を判断する部分である。アクセス許可判定部1
0308は、重要項目抽出部10305より、ある重要
項目の読み出し要求と、読み出し要求を出したユーザ情
報を与えられると、内部に持つアクセス許可リストに従
い、読み出しの可、不可を判断し、判断結果を重要項目
抽出部10305に返す。
【0505】なお、抽出された重要項目と、それに対応
するアクセス許可リストの格納例は、実施形態3−3
(図37)に示す例と同様であるので、ここでの説明は
省略する。
【0506】次に、ユーザが外部に対して構造化文書の
リクエストを出したときの文書内重要項目抽出装置10
300の動作について説明する。
【0507】図41に、ユーザが外部に対して構造化文
書のリクエストを出したときの文書内重要項目抽出装置
10300の動作アルゴリズムの一例を示す。
【0508】構造化文書要求受信部10303は、ユー
ザからのリクエストを受信する(ステップS1100
1)。リクエストを受信した構造化文書要求受信部10
303は、ユーザ認証部10302を起動し、リクエス
トを出したユーザを認証する(ステップS1100
2)。構造化文書要求受信部10303は、認証された
ユーザ情報とユーザのリクエストを構造化文書送受信部
10306に伝える(ステップS11003)。
【0509】構造化文書送受信部10306は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS11004)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部10306は、受信
した構造化文書とユーザ情報を重要項目抽出部1030
5に渡す(ステップS11005)。
【0510】重要項目抽出部10305は、受信した構
造化文書に重要項目が含まれているかどうかを検索する
(ステップS11006)。重要項目が含まれている場
合には、重要項目を抽出し(ステップS11008)、
重要項目格納部10307を起動し、そのユーザに対応
した場所に抽出した重要項目を格納する(ステップS1
1009)。重要項目が含まれていなかった場合には、
何もしない。重要項目抽出部10305は、構造化文書
送信部10304に、受信した構造化文書を渡す(ステ
ップS11010)。
【0511】構造化文書送信部10304は、重要項目
抽出部より渡された構造化文書をユーザに送信する(ス
テップS11011)。
【0512】次に、ユーザが格納されている重要項目に
対してアクセス要求を出したときの文書内重要項目抽出
装置10300の動作について説明する。
【0513】図42に、ユーザが格納されている重要項
目に対してアクセス要求を出したときの文書内重要項目
抽出装置10300の動作アルゴリズムの一例を示す。
【0514】構造化文書要求受信部10303が、ユー
ザからの重要項目に対するアクセス要求を受信する(ス
テップS11101)。構造化文書要求受信部1030
3は、ユーザ認証部10302を起動し、要求を出した
ユーザを認証する(ステップS11102)。構造化文
書要求受信部10303は、重要項目抽出部10305
に対し、ユーザ情報と、アクセス要求を伝える(ステッ
プS11103)。
【0515】重要項目抽出部10305は、アクセス許
可判定部10308を起動し、ユーザが要求した重要項
目へのアクセスを許可する、許可しないを判定する(ス
テップS11104)。アクセスが許可された場合に
は、重要項目抽出部10305は、重要項目格納部10
307を起動し、該当する重要項目を取り出す(ステッ
プS11106)。重要項目抽出部10305は、取り
出した重要項目を構造化文書送信部10304に渡す
(ステップS11108)。なお、この取り出した重要
項目も構造化文書である。アクセスが許可されなかった
場合には、重要項目へのアクセスが不許可であることを
示す構造化文書を構造化文書送信部10304に渡す
(ステップS11107)。
【0516】構造化文書送信部10304は、渡されて
きた構造化文書(取り出された重要項目またはアクセス
が不許可であることを示すもの)をユーザに送信する
(ステップS11109)。なお、上記では、アクセス
が不許可であることを示す情報を構造化文書としてユー
ザに渡すようにしたが、アクセスが不許可であることを
示す情報を構造化文書でない情報、例えば通常のメッセ
ージ、としてユーザに渡すようにしてもよい。
【0517】なお、実施形態3−3と同様に、重要項目
に対するアクセス要求を、閲覧のみか、編集も行うか、
など細かく規定し、ある重要項目に対して、そのアクセ
ス許可リストの<所有者>に登録されているユーザのみ
がこれを編集することを可能とし、<許可ユーザ>に登
録されているユーザは閲覧のみ可能とするなどの、細か
いアクセス制御を行うようにしてもよい。
【0518】また、図37の他にも、アクセス許可リス
トの形式には、種々のバリエーションが考えられる。
【0519】文書内重要項目抽出装置10300は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置10300
を構成する各部分10301〜10308の動作を記述
したプログラムをCPUで実行することにより、その機
能を得ることが出来る。
【0520】また、文書内重要項目抽出装置10300
を構成する各部分10301〜10308は、それぞ
れ、もしくはその一部を、文書内重要項目抽出装置10
300と同様に、CPUとメモリ装置と通信装置から構
成し、それぞれの動作を記述したプログラムをCPUで
実行することにより、それぞれの機能が得られ、その集
合体として構成することも可能である。
【0521】以上のように、本実施形態によれば、予
め、文書内重要項目抽出装置を利用するユーザ毎に、ユ
ーザが重要と考えるキーワードや構造化文書のタグを指
定しておくことにより、文書内重要項目抽出装置が、送
られてきた構造化文書から、ユーザ毎にユーザに代わっ
て重要項目を抽出することが可能となり、ユーザの手間
を大きく削減することが可能となる。また、抽出した重
要項目に対して、アクセス制御情報を付加することによ
り、必要にして十分な重要項目をユーザ間で共有するの
が容易になる。
【0522】(実施形態3−5)図43に、本実施形態
(3−5)に係る文書内重要項目抽出装置の構成例を示
す。
【0523】本実施形態の文書内重要項目抽出装置10
700は、ユーザインタフェース部10701、ユーザ
認証部10702、構造化文書要求受信部10703、
構造化文書送信部10704、重要項目抽出部1070
5、構造化文書送受信部10706、重要項目格納部1
0707、アクセス許可判定部10708を備えてい
る。
【0524】ユーザインタフェース部10701は、ユ
ーザとのインタフェースを司る部分であり、ユーザとの
情報の入出力を可能とするため、キーボード、マウスな
どの入力装置、ディスプレイ、スピーカーなどの出力装
置を備えている。
【0525】ユーザ認証部10702は、文書内重要項
目抽出装置10700にアクセスしてくるユーザを認証
する部分である。ユーザを認証する手段としては、例え
ば、パスワードを用いる認証方式などが利用できる。
【0526】構造化文書要求受信部10703は、ユー
ザからの要求を、構造化文書送受信部10706にユー
ザ情報とともに渡す部分である。また、ユーザが重要項
目のアクセス許可情報の追加、削除、変更を要求してき
た場合には、その要求をユーザ情報とともにアクセス許
可判定部10708に渡し、アクセス許可情報の更新を
行う。
【0527】構造化文書送受信部10706は、構造化
文書要求受信部10703から渡されるユーザの要求に
従って、必要となる構造化文書を外部に対して要求し、
該当する構造化文書を受信する部分である。
【0528】重要項目抽出部10705は、構造化文書
送受信部10706から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受けとり、構造化文書
内の重要項目を抽出し、重要項目格納部10707に格
納するとともに、構造化文書を構造化文書送信部107
04へ送る部分である。また、構造化文書要求受信部1
0703より、重要項目の要求があった場合には、重要
項目格納部10707より要求された該重要項目を構造
化文書送信部10704へ送る。
【0529】重要項目の抽出は、予めユーザが指定した
キーワードや構造化文書に附属しているタグを基に行う
方法が考えられる。例えば、構造化文書の中に、ユーザ
が指定したタグが含まれている部分、およびキーワード
が含まれている部分が存在した場合には、その該当する
部分を抽出する。あるいは、これらのタグ、キーワード
が含まれている構造化文書全体を対象としても良い。抽
出した情報は、後に検索が可能なように、重要項目だけ
でなく、構造化文書の作成された日時、構造化文書を受
信した日時、どこから構造化文書を受信したかを示す場
所に関する情報なども合わせて記憶しても良い。
【0530】重要項目格納部10707は、重要項目抽
出部10705の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部10707には、それを記録する
ための媒体が附属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0531】構造化文書送信部10704は、重要項目
抽出部10705より送られてきた構造化文書を、ユー
ザへ送信する部分である。
【0532】アクセス許可判定部10708は、重要項
目抽出部10705より、重要項目を読み出す際のアク
セス許可を判断する部分である。アクセス許可判定部1
0708は、重要項目抽出部10705より、ある重要
項目の読み出し要求と、読み出し要求を出したユーザ情
報を与えられると、内部に持つアクセス許可リストに従
い、読み出しの可、不可を判断し、判断結果を重要項目
抽出部10705に返す。
【0533】なお、抽出された重要項目と、それに対応
するアクセス許可リストの格納例は、実施形態3−3
(図37)に示す例と同様であるので、ここでの説明は
省略する。
【0534】次に、ユーザが外部に対して構造化文書の
リクエストを出したときの文書内重要項目抽出装置10
700の動作について説明する。
【0535】図44に、ユーザが外部に対して構造化文
書のリクエストを出したときの文書内重要項目抽出装置
10700の動作アルゴリズムの一例を示す。
【0536】ユーザインタフェース部10701がユー
ザからのリクエストを受け付ける(ステップS1170
1)。ユーザインタフェース部10701は、受け付け
たリクエストを構造化文書要求受信部10703に渡す
(ステップS11702)。
【0537】構造化文書要求受信部10703は、ユー
ザ認証部10702を起動し、リクエストを出したユー
ザをユーザインタフェース部10701を起動して認証
する(ステップS11703)。構造化文書要求受信部
10703は、構造化文書送受信部10706に対し、
ユーザ情報とユーザのリクエストを伝える(ステップS
11704)。
【0538】構造化文書送受信部10706は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS11705)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部10706は、受信
した構造化文書とユーザ情報を重要項目抽出部1070
5に渡す(ステップS11706)。
【0539】重要項目抽出部10705は、受信した構
造化文書に重要項目が含まれているかどうかを検索する
(ステップS11707)。重要項目が含まれている場
合には、重要項目を抽出し(ステップS11709)、
重要項目格納部10707を起動し、そのユーザに対応
した場所に抽出した重要項目を格納する(ステップS1
1710)。重要項目が含まれていなかった場合には、
何もしない。重要項目抽出部10705は、構造化文書
送信部10704に、受信した構造化文書を渡す(ステ
ップS11711)。
【0540】構造化文書送信部は10704は、ユーザ
インタフェース部10701に受信した構造化文書を渡
し(ステップS11712)、ユーザインタフェース部
10701は、受信した構造化文書をユーザに渡す(ス
テップS11713)。
【0541】次に、ユーザが格納されている重要項目に
対してアクセス要求を出したときの文書内重要項目抽出
装置10700の動作について説明する。
【0542】図45に、ユーザが格納されている重要項
目に対してアクセス要求を出したときの文書内重要項目
抽出装置10700の動作アルゴリズムの一例を示す。
【0543】ユーザインタフェース部10701がユー
ザからのリクエストを受け付ける(ステップS1180
1)。ユーザインタフェース部10701は、受け付け
たリクエストを構造化文書要求受信部10703に渡す
(ステップS11802)。
【0544】構造化文書要求受信部10703は、ユー
ザ認証部10702を起動し、要求を出したユーザを認
証する(ステップS11803)。構造化文書要求受信
部10703は、重要項目抽出部10705に対し、ユ
ーザ情報と、アクセス要求を伝える(ステップS118
04)。
【0545】重要項目抽出部10705は、アクセス許
可判定部10708を起動し、ユーザが要求した重要項
目へのアクセスを許可する、許可しないを判定する(ス
テップS11805)。アクセスが許可された場合に
は、重要項目抽出部10705は、重要項目格納部10
707を起動し、該当する重要項目を取り出す(ステッ
プS11807)。重要項目抽出部10705は、取り
出した重要項目を構造化文書送信部10704に渡す
(ステップS11809)。なお、この取り出した重要
項目も構造化文書である。アクセスが許可されなかった
場合には、重要項目へのアクセスが不許可であることを
示す構造化文書を構造化文書送信部10704に渡す
(ステップS11808)。
【0546】構造化文書送信部10704は、渡されて
きた構造化文書(取り出された重要項目またはアクセス
が不許可であることを示すもの)をユーザインタフェー
ス部10701に渡す(ステップS11810)。ユー
ザインタフェース部10701は、渡されてきた構造化
文書をユーザに渡す(ステップS11811)。なお、
上記では、アクセスが不許可であることを示す情報を構
造化文書としてユーザに渡すようにしたが、アクセスが
不許可であることを示す情報を構造化文書でない情報、
例えば通常のメッセージ、としてユーザに渡すようにし
てもよい。
【0547】なお、実施形態3−3、3−4と同様に、
重要項目に対するアクセス要求を、閲覧のみか、編集も
行うか、など細かく規定し、ある重要項目に対して、そ
のアクセス許可リストの<所有者>に登録されているユ
ーザのみがこれを編集することを可能とし、<許可ユー
ザ>に登録されているユーザは閲覧のみ可能とするなど
の、細かいアクセス制御を行うようにしてもよい。
【0548】次に、ユーザが重要項目に関するアクセス
許可情報の追加、削除、変更を要求してきたときの文書
内重要項目抽出装置10700の動作について説明す
る。
【0549】図46に、ユーザが重要項目に関するアク
セス許可情報の追加、削除、変更を要求してきたときの
文書内重要項目抽出装置10700の動作アルゴリズム
の一例を示す。
【0550】ユーザインタフェース部10701がユー
ザからの要求を受信する(ステップS11901)。ユ
ーザインタフェース部10701は、受け付けた要求を
構造化文書要求受信部10703に渡す(ステップS1
1902)。
【0551】構造化文書要求受信部10703は、ユー
ザ認証部10702を起動し、要求を出したユーザを認
証する(ステップS11903)。構造化文書受信部1
0703は、アクセス許可判定部10708に、ユーザ
情報とユーザからの要求である、対象となる重要項目と
それに対するアクセス許可情報の変更を伝える(ステッ
プS11904)。
【0552】アクセス許可判定部10708は、このユ
ーザにアクセス許可情報を変更する権限があるかどうか
を判断する(ステップS11905)。変更する権限が
ある場合には、アクセス許可情報を更新し(ステップS
11906)、アクセス許可情報の変更に成功したこと
を示す構造化文書を構造化文書要求受信部10703に
返す(ステップS11907)。変更する権限がない場
合には、アクセス許可情報を変更する権限がないことを
示す構造化文書を構造化文書要求受信部10703に返
す(ステップS11908)。
【0553】構造化文書要求受信部10703は、構造
化文書送信部10704に、受け取った構造化文書(ア
クセス許可情報の変更に成功したことを示すもの、また
はアクセス許可情報を変更する権限がないことを示すも
の)を渡す(ステップS11909)。構造化文書送信
部10704は、受け取った構造化文書をユーザインタ
フェース部10701に渡す(ステップS1191
0)。ユーザインタフェース部10701は、渡されて
きた構造化文書をユーザに渡す(ステップS1191
1)。なお、上記では、アクセス許可情報の変更に成功
したことを示す情報やアクセス許可情報を変更する権限
がないことを示す情報を構造化文書としてユーザに渡す
ようにしたが、それら情報を構造化文書でない情報、例
えば通常のメッセージ、としてユーザに渡すようにして
もよい。
【0554】なお、アクセス許可リストを変更する権限
は、そのアクセス許可リストの<所有者>に登録されて
いるユーザのみがこれを有するようにしてもよいし、そ
のアクセス許可リストの<所有者>と<許可ユーザ>に
登録されているユーザがこれを有するようにしてもよ
い。
【0555】また、アクセス許可リストの変更について
は、そのアクセス許可リストの<許可ユーザ>にのみ他
のユーザを追加できるようにしてもよいし、さらに<所
有者>にも他のユーザを追加できるようにしてもよい。
【0556】また、アクセス許可リストには、<所有者
>と<許可ユーザ>の区別を設けず、その重要項目を得
るもととなった構造化文書の要求を出したユーザと、そ
の後に許可されたユーザとをまとめて登録するようにし
てもよい。この場合には、アクセス許可リストに登録さ
れた全ユーザに変更権限を与えて構わない。
【0557】また、図37の他にも、アクセス許可リス
トの形式には、種々のバリエーションが考えられる。
【0558】文書内重要項目抽出装置10700は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置10700
を構成する各部分10701〜10708の動作を記述
したプログラムをCPUで実行することにより、その機
能を得ることが出来る。
【0559】また、文書内重要項目抽出装置10700
を構成する各部分10701〜10708は、それぞ
れ、もしくはその一部を文書内重要項目抽出装置107
00と同様に、CPUとメモリ装置と通信装置から構成
し、それぞれの動作を記述したプログラムをCPUで実
行することにより、それぞれの機能が得られ、その集合
体として構成することも可能である。
【0560】以上のように、本実施形態によれば、予
め、文書内重要項目抽出装置を利用するユーザ毎に、ユ
ーザが重要と考えるキーワードや構造化文書のタグを指
定しておくことにより、文書内重要項目抽出装置が、送
られてきた構造化文書から、ユーザ毎にユーザに代わっ
て重要項目を抽出することが可能となり、ユーザの手間
を大きく削減することが可能となる。また、抽出した重
要項目に対して、アクセス許可情報を付加することによ
り、必要にして十分な重要項目をユーザ間で共有するの
が容易になる。また、ユーザの要求に応じ、ユーザが保
存されている重要項目のアクセス許可情報を追加、削
除、変更する機能を持たせることで、異なる重要項目
を、ユーザ間で容易に適切に共有することが可能とな
り、重要項目の共有にかかるユーザの手間を大きく削減
することが可能となる。また、重要項目を共有すること
で、文書内重要項目抽出装置が具備する記憶装置の効率
的な利用が可能となる。
【0561】(実施形態3−6)図47に、本実施形態
(3−6)に係る文書内重要項目抽出装置の構成例を示
す。
【0562】本実施形態の文書内重要項目抽出装置10
600は、ユーザ認証部10602、構造化文書要求受
信部10603、構造化文書送信部10604、重要項
目抽出部10605、構造化文書送受信部10606、
重要項目格納部10607、アクセス許可判定部106
08を備えている。
【0563】ユーザ認証部10602は、文書内重要項
目抽出装置10600に、ブラウザなどを用いてアクセ
スしてくるユーザ10601を認証する部分である。ユ
ーザを認証する手段としては、例えば、パスワードを用
いる認証方式などが利用できる。
【0564】構造化文書要求受信部10603は、ユー
ザ10601からの要求を、構造化文書送受信部106
06にユーザ情報とともに渡す部分である。また、ユー
ザ10601が重要項目のアクセス許可情報の追加、削
除、変更を要求してきた場合には、その要求をユーザ情
報とともにアクセス許可判定部10608に渡し、アク
セス許可情報の変更を行う。
【0565】構造化文書送受信部10606は、構造化
文書要求受信部10603から渡されるユーザ1060
1の要求に従って、必要となる構造化文書を外部に対し
て要求し、該当する構造化文書を受信する部分である。
【0566】重要項目抽出部10605は、構造化文書
送受信部10606から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受けとり、構造化文書
内の重要項目を抽出し、重要項目格納部10607に格
納するとともに、構造化文書を構造化文書送信部106
04へ送る部分である。また、構造化文書要求受信部1
0603より、重要項目の要求があった場合には、重要
項目格納部10607より要求された該重要項目を構造
化文書送信部10604へ送る。
【0567】重要項目の抽出は、予めユーザ10601
が指定したキーワードや構造化文書に附属しているタグ
を基に行う方法が考えられる。例えば、構造化文書の中
に、ユーザ10601が指定したタグが含まれている部
分、およびキーワードが含まれている部分が存在した場
合には、その該当する部分を抽出する。あるいは、これ
らのタグ、キーワードが含まれている構造化文書全体を
対象としても良い。抽出した情報は、後に検索が可能な
ように、重要項目だけでなく、構造化文書の作成された
日時、構造化文書を受信した日時、どこから構造化文書
を受信したかを示す場所に関する情報なども合わせて記
憶する。
【0568】重要項目格納部10607は、重要項目抽
出部10605の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部10607には、それを記録する
ための媒体が附属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0569】構造化文書送信部10604は、重要項目
抽出部10605より送られてきた構造化文書を、ユー
ザ10601へ送信する部分である。
【0570】アクセス許可判定部10608は、重要項
目抽出部10605より、重要項目を読み出す際のアク
セス許可を判断する部分である。アクセス許可判定部1
0608は、重要項目抽出部10605より、ある重要
項目の読み出し要求と、読み出し要求を出したユーザ情
報を与えられると、内部に持つアクセス許可リストに従
い、読み出しの可、不可を判断し、判断結果を重要項目
抽出部10605に返す。
【0571】なお、抽出された重要項目と、それに対応
するアクセス許可リストの格納例は、実施形態3−3
(図37)に示す例と同様であるので、ここでの説明は
省略する。
【0572】次に、ユーザが外部に対して構造化文書の
リクエストを出したときの文書内重要項目抽出装置10
600の動作について説明する。
【0573】図48に、ユーザが外部に対して構造化文
書のリクエストを出したときの文書内重要項目抽出装置
10600の動作アルゴリズムの一例を示す。
【0574】構造化文書要求受信部10603は、ユー
ザからのリクエストを受信する(ステップS1140
1)。リクエストを受信した構造化文書要求受信部10
603は、ユーザ認証部10602を起動し、リクエス
トを出したユーザを認証する(ステップS1140
2)。構造化文書要求受信部10603は、認証された
ユーザ情報とユーザのリクエストを構造化文書送受信部
10606に伝える(ステップS11403)。
【0575】構造化文書送受信部10606は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS11404)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部10606は、受信
した構造化文書とユーザ情報を重要項目抽出部1060
5に渡す(ステップS11405)。
【0576】重要項目抽出部10605は、受信した構
造化文書に重要項目が含まれているかどうかを検索する
(ステップS11406)。重要項目が含まれている場
合には、重要項目を抽出し(ステップS11408)、
重要項目格納部10607を起動し、そのユーザに対応
した場所に抽出した重要項目を格納する(ステップS1
1409)。重要項目が含まれていなかった場合には、
何もしない。重要項目抽出部10605は、構造化文書
送信部10604に、受信した構造化文書を渡す(ステ
ップS11410)。
【0577】構造化文書送信部は10604は、重要項
目抽出部より渡された構造化文書をユーザに送信する
(ステップS11411)。
【0578】次に、ユーザが格納されている重要項目に
対してアクセス要求を出したときの文書内重要項目抽出
装置10600の動作について説明する。
【0579】図49に、ユーザが格納されている重要項
目に対してアクセス要求を出したときの文書内重要項目
抽出装置10600の動作アルゴリズムの一例を示す。
【0580】構造化文書要求受信部10603が、ユー
ザからの重要項目に対するアクセス要求を受信する(ス
テップS11501)。構造化文書要求受信部1060
3は、ユーザ認証部10602を起動し、要求を出した
ユーザを認証する(ステップS11502)。構造化文
書要求受信部10603は、重要項目抽出部10605
に対し、ユーザ情報と、アクセス要求を伝える(ステッ
プS11503)。
【0581】重要項目抽出部10605は、アクセス許
可判定部10608を起動し、ユーザが要求した重要項
目へのアクセスを許可する、許可しないを判定する(ス
テップS11504)。アクセスが許可された場合に
は、重要項目抽出部10605は、重要項目格納部10
607を起動し、該当する重要項目を取り出す(ステッ
プS11506)。重要項目抽出部10605は、取り
出した重要項目を構造化文書送信部10604に渡す
(ステップS11508)。なお、この取り出した重要
項目も構造化文書である。アクセスが許可されなかった
場合には、重要項目へのアクセスが不許可であることを
示す構造化文書を構造化文書送信部10604に渡す
(ステップS11507)。
【0582】構造化文書送信部10604は、渡されて
きた構造化文書(取り出された重要項目またはアクセス
が不許可であることを示すもの)をユーザに送信する
(ステップS11509)。なお、上記では、アクセス
が不許可であることを示す情報を構造化文書としてユー
ザに渡すようにしたが、アクセスが不許可であることを
示す情報を構造化文書でない情報、例えば通常のメッセ
ージ、としてユーザに渡すようにしてもよい。
【0583】なお、実施形態3−3〜3−5と同様に、
重要項目に対するアクセス要求を、閲覧のみか、編集も
行うか、など細かく規定し、ある重要項目に対して、そ
のアクセス許可リストの<所有者>に登録されているユ
ーザのみがこれを編集することを可能とし、<許可ユー
ザ>に登録されているユーザは閲覧のみ可能とするなど
の、細かいアクセス制御を行うようにしてもよい。
【0584】次に、ユーザが重要項目に関するアクセス
許可情報の追加、削除、変更を要求してきたときの文書
内重要項目抽出装置10600の動作について説明す
る。
【0585】図50に、ユーザが重要項目に関するアク
セス許可情報の追加、削除、変更を要求してきたときの
文書内重要項目抽出装置10600の動作アルゴリズム
の一例を示す。
【0586】構造化文書受信部10603がユーザから
の要求を受信する(ステップS11601)。構造化文
書受信部10603は、ユーザ認証部10602を起動
し、要求を出したユーザを認証する(ステップS116
02)。構造化文書受信部10603は、アクセス許可
判定部10608に、ユーザ情報とユーザからの要求で
ある、対象となる重要項目とそれに対するアクセス許可
情報の変更を伝える(ステップS11603)。
【0587】アクセス許可判定部10608は、このユ
ーザにアクセス許可情報を変更する権限があるかどうか
を判断する(ステップS11604)。変更する権限が
ある場合には、アクセス許可情報を更新し(ステップS
11605)、アクセス許可情報の変更に成功したこと
を示す構造化文書を構造化文書要求受信部10603に
返す(ステップS11606)。変更する権限がない場
合には、アクセス許可情報を変更する権限がないことを
示す構造化文書を構造化文書要求受信部10603に返
す(ステップS11607)。
【0588】構造化文書要求受信部10603は、構造
化文書送信部10604に、受け取った構造化文書(ア
クセス許可情報の変更に成功したことを示すもの、また
はアクセス許可情報を変更する権限がないことを示すも
の)を渡す(ステップS11608)。構造化文書送信
部10604は、受け取った構造化文書をユーザに送信
する(ステップS11609)。なお、上記では、アク
セス許可情報の変更に成功したことを示す情報やアクセ
ス許可情報を変更する権限がないことを示す情報を構造
化文書としてユーザに渡すようにしたが、それら情報を
構造化文書でない情報、例えば通常のメッセージ、とし
てユーザに渡すようにしてもよい。
【0589】なお、実施形態3−5と同様に、アクセス
許可リストを変更する権限は、そのアクセス許可リスト
の<所有者>に登録されているユーザのみがこれを有す
るようにしてもよいし、そのアクセス許可リストの<所
有者>と<許可ユーザ>に登録されているユーザがこれ
を有するようにしてもよい。
【0590】また、アクセス許可リストの変更について
は、そのアクセス許可リストの<許可ユーザ>にのみ他
のユーザを追加できるようにしてもよいし、さらに<所
有者>にも他のユーザをを追加できるようにしてもよ
い。
【0591】また、アクセス許可リストには、<所有者
>と<許可ユーザ>の区別を設けず、その重要項目を得
るもととなった構造化文書の要求を出したユーザと、そ
の後に許可されたユーザとをまとめて登録するようにし
てもよい。この場合には、アクセス許可リストに登録さ
れた全ユーザに変更権限を与えて構わない。
【0592】また、図37の他にも、アクセス許可リス
トの形式には、種々のバリエーションが考えられる。
【0593】文書内重要項目抽出装置10600は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置10600
を構成する各部分10601〜10608の動作を記述
したプログラムをCPUで実行することにより、その機
能を得ることが出来る。
【0594】また、文書内重要項目抽出装置10600
を構成する各部分10601〜10608は、それぞ
れ、もしくはその一部を文書内重要項目抽出装置106
00と同様に、CPUとメモリ装置と通信装置から構成
し、それぞれの動作を記述したプログラムをCPUで実
行することにより、それぞれの機能が得られ、その集合
体として構成することも可能である。
【0595】以上のように、本実施形態によれば、予
め、文書内重要項目抽出装置を利用するユーザ毎に、ユ
ーザが重要と考えるキーワードや構造化文書のタグを指
定しておくことにより、文書内重要項目抽出装置が、送
られてきた構造化文書から、ユーザ毎にユーザに代わっ
て重要項目を抽出することが可能となり、ユーザの手間
を大きく削減することが可能となる。また、抽出した重
要項目に対して、アクセス許可情報を付加することによ
り、必要にして十分な重要項目をユーザ間で共有するの
が容易になる。また、ユーザの要求に応じ、ユーザが保
存されている重要項目のアクセス許可情報を追加、削
除、変更する機能を持たせることで、異なる重要項目
を、ユーザ間で容易に適切に共有することが可能とな
り、重要項目の共有にかかるユーザの手間を大きく削減
することが可能となる。また、重要項目を共有すること
で、文書内重要項目抽出装置が具備する記憶装置の効率
的な利用が可能となる。
【0596】(実施形態3−7)図51に、本実施形態
(3−7)に係る文書内重要項目抽出装置の構成例を示
す。
【0597】本実施形態に係る文書内重要項目抽出装置
は、例えば実施形態3−5、3−6のような構成におい
て、複数のユーザが同一の重要項目抽出条件を設定して
おり(もしくは設定した重要項目抽出条件の少なくとも
一部に共通するものがあり)、かつ該複数のユーザが同
一の構造化文書を要求した場合に、ユーザ間で共通の重
要項目が抽出されることから、受信した構造化文書から
抽出された重要項目のうちユーザ間で共通の重要項目に
ついてはこれを共有できる形態で保存するようにしたも
のである。
【0598】なお、このような文書内重要項目抽出装置
として、実施形態3−5、3−6のように、データ送受
信装置に組み込む形態と、データ中継装置に組み込む形
態とが考えられるが、両者の違いは、ユーザインタフェ
ース部を持つか否かのみであり、本実施形態に係る抽出
した共通の重要項目をユーザ間で共有可能な形態で保存
する機能に関しては同様であるため、本実施形態では文
書内重要項目抽出装置をデータ中継装置に組み込む場合
について説明し、データ送受信装置に組み込む場合につ
いては詳細な説明は省略する。
【0599】さて、図51に示されるように、本実施形
態の文書内重要項目抽出装置13000は、ユーザ認証
部13002、構造化文書要求部13003、構造化文
書送信部13004、重要項目抽出部13005、構造
化文書送受信部13006、重要項目格納部1300
7、アクセス許可判定部13008を備えている。ま
た、重要項目抽出部13005は、実施形態3−6のよ
うに重要項目の抽出や(共通でない)重要項目の保存な
どに関する処理の機能を有するのに加えて、共通の重要
項目に関する処理を行うための共通重要項目処理部13
051を有する。
【0600】ユーザ認証部13002は、文書内重要項
目抽出装置13000に、ブラウザなどを用いてアクセ
スしてくるユーザ13001を認証する部分である。ユ
ーザを認証する手段としては、例えば、パスワードを用
いる認証方式などが利用できる。
【0601】構造化文書要求受信部13003は、ユー
ザ13001からの要求を、構造化文書送受信部130
06にユーザ情報とともに渡す部分である。また、ユー
ザ13001が重要項目のアクセス許可情報の追加、削
除、変更を要求してきた場合には、その要求をユーザ情
報とともにアクセス許可判定部13008に渡し、アク
セス許可情報の更新を行う。
【0602】構造化文書送受信部13006は、構造化
文書要求受信部13003から渡されるユーザ1300
1の要求に従って、必要となる構造化文書を外部に対し
て要求し、該当する構造化文書を受信する部分である。
【0603】重要項目抽出部13005は、構造化文書
送受信部13006から、受信した構造化文書と、該構
造化文書を要求したユーザ情報を受け取り、構造化文書
内の重要項目を抽出し、重要項目格納部13007に格
納するとともに、構造化文書を構造化文書送信部130
04へ送る部分である。また、構造化文書要求受信部1
3003より、重要項目の要求があった場合には、重要
項目格納部13007より要求された該重要項目を構造
化文書送信部13004へ送る。さらに、共通重要項目
処理を行うための部分である(共通重要項目処理部13
051)。
【0604】重要項目の抽出は、予めユーザ13001
が指定したキーワードや、構造化文書に付属しているタ
グを基に行う方法が考えられる。例えば、構造化文書の
中に、ユーザ13001が指定したタグが含まれている
部分、およびキーワードが含まれている部分が存在した
場合には、その該当する部分を抽出する。あるいは、こ
れらのタグ、キーワードが含まれている構造化文書全体
を対象としてもよい。抽出した情報は、後に検索が可能
なように、重要項目だけでなく、構造化文書の作成され
た日時、構造化文書を受信した日時、どこから構造化文
書を受信したかを示す場所に関する情報なども併せて記
憶する。
【0605】なお、本実施形態では、共通重要項目処理
によって、過去に同一構造文書から同一重要項目が抽出
されている場合には、今回の要求によって抽出された重
要項目を別途保存することはせずに、当該保存されてい
る該当重要項目に付随する情報(本実施形態例では、ア
クセス許可リストとする)に必要な修正をかけるように
している(修正が不要なこともある)。
【0606】重要項目格納部13007は、重要項目抽
出部13005の指示に従い、各ユーザ毎に抽出した重
要項目とそれに関連する情報を格納し、読み出す部分で
ある。重要項目格納部13007には、それを記録する
ための媒体が付属している。媒体としては、磁気ディス
ク、光ディスク、光磁気ディスク、相変化型光ディス
ク、CD−R、DVD−RAM、磁気テープなどが考え
られる。
【0607】構造化文書送信部13004は、重要項目
抽出部13005より送られてきた構造化文書を、ユー
ザ13001へ送信する部分である。
【0608】アクセス許可判定部13008は、重要項
目抽出部13005より、重要項目を読み出す際のアク
セス許可を判断する部分である。アクセス許可判定部1
3008は、重要項目抽出部13005より、ある重要
項目の読み出し要求と、読み出し要求を出したユーザ情
報を与えられると、内部に持つアクセス許可リストに従
い、読み出しの可、不可を判断し、判断結果を重要項目
抽出部13005に返す。
【0609】なお、抽出された重要項目と、それに対応
するアクセス許可リストの形式としては、実施形態3−
3(図37)に示す例を用いることができるが、その他
にも種々の形式のアクセス許可リストを用いることがで
き、本実施形態では、いくつかの形式のアクセス許可リ
ストについて説明する。
【0610】次に、ユーザが外部に対して構造化文書の
リクエストを出したときの文書内重要項目抽出装置13
000の動作について説明する。
【0611】図52に、ユーザが外部に対して構造化文
書のリクエストを出したときの文書内重要項目抽出装置
13000の動作アルゴリズムの一例を示す。
【0612】構造化文書要求受信部13003は、ユー
ザからのリクエストを受信する(ステップS1310
1)。リクエストを受信した構造化文書要求受信部13
003は、ユーザ認証部13002を起動し、リクエス
トを出したユーザを認証する(ステップS1310
2)。構造化文書要求受信部13003は、認証された
ユーザ情報とユーザのリクエストを構造化文書送受信部
13006に伝える(ステップS13103)。
【0613】構造化文書送受信部13006は、外部に
対し、ユーザが要求した構造化文書を要求する(ステッ
プS13104)。外部から要求した構造化文書が送信
されてきたら、構造化文書送受信部13006は、受信
した構造化文書とユーザ情報を重要項目抽出部1300
5に渡す(ステップS13105)。
【0614】重要項目抽出部13005は、受信した構
造化文書に重要項目が含まれているがどうかを検索する
(ステップS13106)。
【0615】重要項目が含まれている場合には、重要項
目を抽出する(ステップS13108)。ここで、本実
施形態では、すぐに抽出された重要項目を保存せずに、
共通重要項目処理部13051により、共通重要項目処
理を行う(ステップS13109)。ここでは、詳しく
は後述するが、当該重要項目が過去に同一構造化文書か
ら抽出され保存されているか否かを調べたり、保存され
ている場合のアクセス許可リストの更新の仕方またはそ
れを更新しないことの決定などを行う。次に、重要項目
格納部13007を起動し、そのユーザに対応した場所
に抽出した重要項目を格納(保存されていない場合)す
るか、または該当する重要項目について必要に応じてア
クセス許可リストを更新(保存されている場合)する
(ステップS13110)。
【0616】一方、受信した構造化文書に重要項目が含
まれていなかった場合には、何もしない。
【0617】重要項目抽出部13005は、構造化文書
送信部13004に、受信した構造化文書を渡す(ステ
ップS13111)。
【0618】構造化文書送信部13004は、重要項目
抽出部13005より渡された構造化文書をユーザに送
信する(ステップS13112)。
【0619】次に、重要項目を抽出するときの重要項目
抽出部13005の動作について説明する。
【0620】図53に、重要項目抽出部13005の重
要項目を抽出するときのアルゴリズムの一例を示す。な
お、本アルゴリズムでは、複数の要求とこれに対する応
答を同時に扱うことはせず、個々の要求とその応答がユ
ーザ毎に独立であるものとして動作することを仮定して
いる。また、抽出した重要項目は、図54のような形式
で格納されているものとする。
【0621】まず、構造化文書送受信部13006から
構造化文書を受け取る(ステップS13201)。
【0622】次に、ユーザ認証部13002より、この
構造化文書を要求したユーザ情報を得る(ステップS1
3202)。
【0623】次に、設定されているタグ、キーワードよ
り、構造化文書から、重要項目を抽出する(ステップS
13203)。
【0624】ここで、抽出した重要項目を、過去に同一
の構造化文書から抽出したことがあるかどうかを調べる
(ステップS13204)。
【0625】もし過去に同一の構造化文書から同一の重
要項目を抽出したことがある場合には、過去に抽出した
ときの該当重要項目のアクセス許可リストを調べる(ス
テップS13205)。すなわち、この構造化文書を要
求したユーザのユーザ名と、該当重要項目のアクセス許
可リストに含まれるユーザ名とを比較する。当該要求ユ
ーザのユーザ名が当該アクセス許可リストに含まれてい
ない場合には(ステップS13206)、当該アクセス
許可リストに当該要求ユーザのユーザ名を加えるなどの
必要な処理を行う(ステップS13207)。なお、こ
のアクセス許可リストの更新の形態にはアクセス許可リ
ストの形式などに応じて種々のバリエーションがある。
当該アクセス許可リストに当該要求ユーザのユーザ名が
含まれる場合には(ステップS13206)、既に該当
重要項目にアクセス可能であるため、処理を終える。
【0626】一方、テップS13204において、今回
抽出した重要項目を、過去に同一の構造化文書から抽出
したことがない場合には、基本的には実施形態3−6、
3−7と同様で、木構造を構成している格納済みの重要
項目に、新たに今回抽出した重要項目を付け加え(ステ
ップS13208)、そして、この重要項目に関するア
クセス許可リストに、このユーザ名を設定し(ステップ
S13209)、処理を終える。
【0627】なお、複数ユーザが同一の抽出条件を設定
しており、かつ該複数ユーザが同一の構造化文書を受信
したときの処理は、上記アルゴリズムを、ユーザ毎に、
抽出する重要項目の分だけ繰り返すことにより、実現す
ることができる。
【0628】ここで、アクセス許可リストのいくつかの
バリエーションについて説明する。
【0629】まず、図37にて例示した形式のアクセス
許可リストについて説明する。
【0630】この場合には、ステップS13205に
て、該当重要項目のアクセス許可リストの<所有者>お
よび<許可ユーザ>を調べ、当該要求ユーザのユーザ名
が<所有者>と<許可ユーザ>のいずれにも存在しない
場合に、ステップS13207にて、該当重要項目のア
クセス許可リストの<許可ユーザ>に当該要求ユーザの
ユーザ名を加える。
【0631】次に、図54にて例示する形式のアクセス
許可リストについて説明する。
【0632】図54では、アクセス許可リスト内に<所
有者>と<許可ユーザ>の構造を設けず、すべ所有者と
して<アクセス許可リスト>の直下に付加するようにし
たものである。
【0633】この場合には、ステップS13205に
て、該当重要項目のアクセス許可リストを調べ、当該要
求ユーザのユーザ名が存在しない場合に、ステップS1
3207にて、該当重要項目のアクセス許可リストに当
該要求ユーザのユーザ名を加える。
【0634】ところで、複数ユーザが同一の抽出した重
要項目を共有しており、該複数ユーザのうちの1ユー
ザ、またはそれ以上のユーザが、格納されている重要項
目を編集したい場合には、編集したいユーザの分の重要
項目をコピーし、それを編集するようにすると好まし
い。例えば、図54においては、項目2に関して、ユー
ザA,B,Cが共有していたが、ここで、ユーザBが重
要項目を編集したい場合、図55に示すように、ユーザ
Bを項目2のアクセス許可リストから取り除き、新たに
項目3を作成して項目2の重要項目をコピーし、項目3
のアクセス許可リストにユーザBを加えればよい。
【0635】次に、さらに他の形式のアクセス許可リス
トの例について説明する。
【0636】上記では、抽出した同一の重要項目を共有
するために、図37、図54に示すような、アクセス許
可の仕組みを取り入れたが、仕組みとしては、図56、
図57に示すような方法も考えられる。
【0637】図56では、抽出した同一の重要項目に対
して、図37に示す例と同様に、許可ユーザのリストを
追加するが、その際に所有者の部分を、最初に該重要項
目を抽出したユーザだけでなく、後に同一の重要項目を
抽出したユーザについても、該ユーザを所有者に付け加
える方法である。これにより、同一の重要項目を抽出し
たユーザは、全て該重要項目の所有者となり、該重要項
目に対するアクセス許可ユーザのリストを編集すること
ができる。
【0638】図56の例は、先にユーザAがある構造化
文書から重要項目を抽出した後に、ユーザBが同一の構
造化文書から同一の重要項目を抽出したときの格納状態
を示したものであり、変更された部分を、太線で示して
いる。
【0639】なお、該重要項目を編集する場合には、い
ずれのユーザであっても、図55に示すように、重要項
目のコピーを作成した上で、編集させるようにするのが
好ましい。
【0640】次に、図57は、抽出した同一の重要項目
に対して、所有者の部分にユーザを追加するのではな
く、所有者、および許可ユーザから構成される構造自体
を増やす方法である。図57の例は、図56の例と同
様、後からユーザBが同一の構造文書から同一の重要項
目を抽出したときの格納状態を示したものであり、変更
された部分を太線で示している。
【0641】なお、該重要項目を編集する場合には、図
55に示すように、重要項目のコピーを作成した上で、
編集させるようにするのが好ましい。
【0642】なお、ユーザが、格納されている重要項目
に対して、アクセス要求を出したときの、文書内重要項
目抽出装置13000の動作アルゴリズム、およびユー
ザが重要項目に関するアクセス許可情報の追加、削除、
変更を要求してきたときの文書内重要項目抽出装置13
000の動作アルゴリズムは、基本的に、実施形態3−
6に示す例と同様であるので、このでの詳細な説明は省
略する。
【0643】また、実施形態3−5、3−6と同様に、
図37、図56、図57の例の場合に、重要項目に対す
るアクセス要求を、閲覧のみか、編集も行うか、など細
かく規定し、ある重要項目に対して、そのアクセス許可
リストの<所有者>に登録されているユーザのみがこれ
を編集することを可能とし、<許可ユーザ>に登録され
ているユーザは閲覧のみ可能とするなどの、細かいアク
セス制御を行うようにしてもよい。
【0644】また、実施形態3−5、3−6と同様に、
図37、図56、図57の例の場合に、アクセス許可リ
ストを変更する権限は、そのアクセス許可リストの<所
有者>に登録されているユーザのみがこれを有するよう
にしてもよいし、そのアクセス許可リストの<所有者>
と<許可ユーザ>に登録されているユーザがこれを有す
るようにしてもよい。
【0645】また、アクセス許可リストの変更について
は、そのアクセス許可リストの<許可ユーザ>にのみ他
のユーザを追加できるようにしてもよいし、さらに<所
有者>にも他のユーザをを追加できるようにしてもよ
い。
【0646】また、アクセス許可リストには、<所有者
>と<許可ユーザ>の区別を設けず、その重要項目を得
るもととなった構造化文書の要求を出したユーザと、そ
の後に許可されたユーザとをまとめて登録するようにし
てもよい。この場合には、アクセス許可リストに登録さ
れた全ユーザに変更権限を与えて構わない。
【0647】また、図37、図54、図56、図57の
他にも、アクセス許可リストの形式には、種々のバリエ
ーションが考えられる。
【0648】文書内重要項目抽出装置13000は、例
えば電子計算機と同じように、CPUとメモリ装置と通
信装置から構成し、文書内重要項目抽出装置13000
を構成する各部分13001〜13008の動作を記述
させたプログラムをCPUで実行することにより、その
機能を得ることが出来る。
【0649】また、文書内重要項目抽出装置1300を
構成する各部分13001〜13008は、それぞれ、
もしくはその一部を文書内重要項目抽出装置13000
と同様に、CPUとメモリ装置と通信装置から構成し、
それぞれの動作を記述したプログラムをCPUで実行す
ることにより、それぞれの機能が得られ、その集合体と
して構成することも可能である。
【0650】以上のように、本実施形態によれば、予
め、文書内重要項目抽出装置を利用するユーザ毎に、ユ
ーザが重要と考えるキーワードや構造化文書のタグを指
定しておくことにより、文書内重要項目抽出装置が、送
られてきた構造化文書から、ユーザ毎にユーザに代わっ
て重要項目を抽出することが可能となり、ユーザの手間
を大きく削減することが可能となる。また、抽出した重
要項目に対して、アクセス許可情報を付加することによ
り、必要にして十分な重要項目をユーザ間で共有するの
が容易になる。また、ユーザの要求に応じ、ユーザが保
存されている重要項目のアクセス許可情報を追加、削
除、変更する機能を持たせることで、異なる重要項目
を、ユーザ間で容易に適切に共有することが可能とな
り、重要項目の共有にかかるユーザの手間を大きく削減
することが可能となる。また、重要項目を共有すること
で、文書内重要項目抽出装置が具備する記憶装置の効率
的な利用が可能となる。
【0651】以上、第3の実施形態によれば、本文書内
重要項目抽出装置は、ユーザが指定した抽出すべき重要
項目を自動的に構造化文書から抽出し、保存するが、抽
出した重要項目をユーザ毎に分離して保存することによ
り、特定のユーザが保存するよう指定した重要項目の読
み出し、検索が容易になる。また、保存した重要項目毎
に、アクセス許可リストを持つため、保存した重要項目
を複数のユーザ間で、容易に共有することが可能にな
り、記憶装置の効率的な利用が可能となる。
【0652】なお、第3の実施形態(実施形態3−1〜
3−7のそれぞれ)においても、第2の実施形態のよう
な付加項目に関する機能を追加してもよい。
【0653】なお、以上の各機能は、ソフトウェアとし
ても実現可能である。
【0654】また、本実施形態は、コンピュータに所定
の手順を実行させるための(あるいはコンピュータを所
定の手段として機能させるための、あるいはコンピュー
タに所定の機能を実現させるための)プログラムを記録
したコンピュータ読取り可能な記録媒体として実施する
こともできる。
【0655】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0656】
【発明の効果】本発明によれば、ユーザに負担をかけず
に構造化文書のうち重要な内容を含む部分を自動的に保
存することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る文書内重要項目
抽出装置について説明するための図
【図2】同実施形態に係る文書内重要項目抽出装置のW
WWシステムにおける重要項目抽出動作手順の一例を示
すフローチャート
【図3】同実施形態に係る文書内重要項目抽出装置の電
子メールシステムにおける重要項目抽出動作手順の一例
を示すフローチャート
【図4】同実施形態に係る文書内重要項目抽出装置の電
子ニュースシステムにおける重要項目抽出動作手順の一
例を示すフローチャート
【図5】同実施形態に係る文書内重要項目抽出装置にお
ける重要項目の抽出方法を設定するための構成について
説明するための図
【図6】同実施形態に係る文書内重要項目抽出装置にお
ける重要項目の抽出方法の設定手順の一例を示すフロー
チャート
【図7】同実施形態に係る文書内重要項目抽出装置にお
ける重要項目を抽出する手順の一例を示すフローチャー
【図8】構造化文書の例を示す図
【図9】重要項目の抽出処理途中の構造化文書の状態の
例を示す図
【図10】重要項目の抽出方法の設定例を示す図
【図11】重要項目の抽出時に用いる類語データベース
の一例を示す図
【図12】抽出された重要項目の例を示す図
【図13】重要項目を格納する重要項目データベースの
一例を示す図
【図14】重要項目を格納する重要項目データベースの
他の例を示す図
【図15】同実施形態に係る構造化文書表示クライアン
トにおいて重要項目が含まれていない構造化文書の表示
例を示す図
【図16】同実施形態に係る構造化文書表示クライアン
トにおいて表示された構造化文書内の重要項目に対する
指定、追加、変更、削除を行うための表示画面例を示す
【図17】同実施形態に係る構造化文書表示クライアン
トの重要項目指定画面の一例を示す図
【図18】同実施形態に係る構造化文書表示クライアン
トの重要項目追加画面の一例を示す図
【図19】同実施形態に係る構造化文書表示クライアン
トの重要項目変更画面の一例を示す図
【図20】同実施形態に係る構造化文書表示クライアン
トの重要項目削除画面の一例を示す図
【図21】本発明の第2の実施形態における重要項目お
よび付加項目を格納する重要項目・付加項目データベー
スの一例を示す図
【図22】同実施形態に係る文書内重要項目抽出装置の
一構成例を示す図
【図23】重要な項目が満たすべき条件を新たに構造化
文書内重要項目条件テーブルに追加したい場合の手続き
の一例を示すフローチャート
【図24】構造化文書から抽出した重要項目に関連する
付加項目が満たすべき条件を新たに構造化文書内重要項
目条件テーブルに追加したい場合の手続きの一例を示す
フローチャート
【図25】ユーザが構造化文書の閲覧要求を出してから
構造化文書内重要項目抽出装置に重要項目と付加項目が
保存されるまでに行われる手続きの一例を示すフローチ
ャート
【図26】文書内重要項目抽出装置内に格納されている
項目の検索を行う際の手続きの一例を示すフローチャー
【図27】同実施形態に係る文書内重要項目抽出装置の
他の構成例を示す図
【図28】重要な項目が満たすべき条件を新たに構造化
文書内重要項目条件テーブルに追加したい場合の手続き
の一例を示すフローチャート
【図29】構造化文書から抽出した重要項目に関連する
付加項目が満たすべき条件を新たに構造化文書内重要項
目条件テーブルに追加したい場合の手続きの一例を示す
フローチャート
【図30】構造化文書の閲覧要求を出してから構造化文
書内重要項目抽出装置に重要項目と付加項目が保存され
るまでに行われる手続きの一例を示すフローチャート
【図31】文書内重要項目抽出装置内に格納されている
項目の検索を行う際の手続きの一例を示すフローチャー
【図32】本発明の第3の実施形態に係る文書内重要項
目抽出装置の構成の一例を示す図
【図33】重要項目を抽出し格納する手続きの一例を示
すフローチャート
【図34】同実施形態に係る文書内重要項目抽出装置の
構成の他の例を示す図
【図35】重要項目を抽出し格納する手続きの他の例を
示すフローチャート
【図36】同実施形態に係る文書内重要項目抽出装置の
構成のさらに他の例を示す図
【図37】重要項目と該重要項目に対応するアクセス許
可リストの格納例を示す図
【図38】重要項目を抽出し格納する手続きのさらに他
の例を示すフローチャート
【図39】保存されている重要項目に対するアクセス要
求を処理する手続きの一例を示すフローチャート
【図40】同実施形態に係る文書内重要項目抽出装置の
構成のさらに他の例を示す図
【図41】重要項目を抽出し格納する手続きのさらに他
の例を示すフローチャート
【図42】保存されている重要項目に対するアクセス要
求を処理する手続きの他の例を示すフローチャート
【図43】同実施形態に係る文書内重要項目抽出装置の
構成のさらに他の例を示す図
【図44】重要項目を抽出し格納する手続きのさらに他
の例を示すフローチャート
【図45】保存されている重要項目に対するアクセス要
求を処理する手続きのさらに他の例を示すフローチャー
トを示す図
【図46】保存されている重要項目に対するアクセス要
求を変更する手続きの一例を示すフローチャート
【図47】同実施形態に係る文書内重要項目抽出装置の
構成のさらに他の例を示す図
【図48】重要項目を抽出し格納する手続きのさらに他
の例を示すフローチャート
【図49】保存されている重要項目に対するアクセス要
求を処理する手続きのさらに他の例を示すフローチャー
【図50】保存されている重要項目に対するアクセス要
求を変更する手続きの他の例を示すフローチャート
【図51】同実施形態に係る文書内重要項目抽出装置の
構成のさらに他の例を示す図
【図52】重要項目を抽出し格納する手続きのさらに他
の例を示すフローチャート
【図53】重要項目を抽出し格納するときの重要項目抽
出部の手続きの一例を示すフローチャート
【図54】重要項目と該重要項目に対応するアクセス許
可リストの他の格納例を示す図
【図55】重要項目と該重要項目に対応するアクセス許
可リストの他の格納例を示す図
【図56】重要項目と該重要項目に対応するアクセス許
可リストのさらに他の格納例を示す図
【図57】重要項目と該重要項目に対応するアクセス許
可リストのさらに他の格納例を示す図
【符号の説明】
101…WWWページ作成者 102…電子メール送信者 103…電子ニュース記事送信者 104…WWWサーバ 105…送信側電子メールサーバ 106…送信側電子ニュースサーバ 107…プロキシサーバ 108…受信側電子メールサーバ 109…受信側電子ニュースサーバ 110,220,10200〜10700,13000
…文書内重要項目抽出装置 111…記録装置 112…クライアント 113…WWWページブラウザ 114…電子メールブラウザ 115…電子ニュースブラウザ 120…構造化文書処理部 121,221…構造化文書要求解析部 122,222…構造化文書受信部 123,223…構造化文書内重要項目抽出部 124,224…構造化文書内重要項目関連付加項目生
成部 125,225…構造化文書内重要項目指示制御部 126,226…構造化文書内重要項目関連付加項目指
示制御部 127,227…検索指示制御部 128,228…記憶部制御部 129,229…記憶部 130,230…構造化文書閲覧部 131,231…構造化文書要求入力部 132,232…構造化文書表示部 140,240…重要項目指示部 141,241…重要項目指示入力部 142,242…重要項目指示実行結果表示部 150,250…付加項目指示部 151,251…付加項目指示入力部 152,252…付加項目指示実行結果表示部 160,260…検索指示部 161,261…検索指示入力部 162,262…検索結果表示部 170,270…通信路 210…構造化文書閲覧装置 280…構造化文書送受信装置 501…類語データベース 502…抽出方法データベース 503…重要項目データベース 506…重要項目抽出方法設定アプリケーション 10201,10301,10601,13001…ユ
ーザ(ブラウザなど) 10401,10501,10701…ユーザインタフ
ェース部 10202〜10702,13002…ユーザ認証部 10203〜10703,13003…構造化文書要求
受信部 10204〜10704,13004…構造化文書送信
部 10205〜10705,13005…重要項目抽出部 13051…共通重要項目処理部 10206〜10706,13006…構造化文書送受
信部 10207〜10707,13007…重要項目格納部 10308,10508〜10708,13008…ア
クセス許可判定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鳥井 修 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 金井 達徳 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 横川 健 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 矢尾 浩 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 田中 久子 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B009 QA03 5B075 KK34 KK39 ND03 ND34 NK02 PQ02 PQ32 UU06

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】要求された構造化文書を提供するサーバ装
    置から取得した構造化文書を処理するユーザシステムの
    ために該取得した構造化文書を部分的に自動保存するた
    めの構造化文書保存方法であって、 ユーザシステムの要求に応じてサーバ装置により提供さ
    れた構造化文書を取得し、 予め指定された所定の抽出基準に基づき前記取得した構
    造化文書の構造を利用して該構造化文書から重要部分を
    抽出して保存するとともに、該取得した構造化文書を前
    記ユーザシステムに渡すことを特徴とする構造化文書保
    存方法。
  2. 【請求項2】取得した前記構造化文書から重要部分を抽
    出する際、構造化されている単位での抽出を行い、 抽出された前記構造化文書の重要部分を保存する際、複
    数の構造化文書から別々に抽出された複数の重要部分を
    内部構造として持たせるようにした構造化されたデータ
    ベースに保存することを特徴とする請求項1に記載の構
    造化文書保存方法。
  3. 【請求項3】同一の文書から抽出された複数の重要部分
    を前記データベースに保存する際、該同一の文書から抽
    出された複数の重要部分の相互間の関連を示すリンク情
    報を作成して保存することを特徴とする請求項2に記載
    の構造化文書保存方法。
  4. 【請求項4】前記取得した構造化文書を前記ユーザシス
    テムに渡す際、該構造化文書における重要部分として抽
    出された部分に、その部分が重要部分として抽出された
    ことをユーザに提示するための所定の情報を付加した上
    で、該構造化文書を前記ユーザシステムに渡すことを特
    徴とする請求項1ないし3のいずれか1項に記載の構造
    化文書保存方法。
  5. 【請求項5】構造化文書から重要部分を抽出するための
    前記所定の抽出基準には、少なくとも重要部分として抽
    出する部分の持つべきタグおよび/または単語の指定を
    含み、 対象となる構造化文書について参照すべき文書型定義情
    報が指定されている場合には、該対象となる構造化文書
    からの重要部分の抽出に用いるタグおよび/または単語
    を、該指定された文書型定義情報に含まれるタグおよび
    /または単語とすることを特徴とする請求項1ないし4
    のいずれか1項に記載の構造化文書保存方法。
  6. 【請求項6】構造化文書から重要部分を抽出するための
    前記所定の抽出基準には、少なくとも重要部分として抽
    出する部分の持つべきタグおよび/または単語の指定を
    含み、 前記指定されたタグおよび/または単語に関して所定の
    類語データベースを検索して得たタグおよび/または単
    語に対する類語をも用いて、前記構造化文書から重要部
    分を抽出することを特徴とする請求項1ないし5のいず
    れか1項に記載の構造化文書保存方法。
  7. 【請求項7】前記ユーザシステムから、構造化文書から
    重要部分を抽出するための前記所定の抽出基準の内容に
    ついての指定、追加、変更または削除の要求を受け、該
    要求に従って前記所定の抽出基準の内容を新規登録、追
    加、変更または削除することを特徴とする請求項1ない
    し6のいずれか1項に記載の構造化文書保存方法。
  8. 【請求項8】前記所定の抽出基準に基づいて重要部分が
    抽出され前記構造化文書を受け取った前記ユーザシステ
    ムにおいて該構造化文書を表示した際にユーザから該所
    定の抽出基準の内容を変更するための指示が入力された
    場合に該指示に従って、前記抽出に用いた所定の抽出基
    準の内容を変更することを特徴とする請求項1ないし7
    のいずれか1項に記載の構造化文書保存方法。
  9. 【請求項9】前記取得した構造化文書から重要部分を抽
    出して保存する際、予め指定された所定の生成基準に基
    づいて、抽出された前記重要部分に関連のある付加情報
    を生成し、抽出された該重要部分と生成された該付加情
    報とを対応付けて保存することを特徴とする請求項1な
    いし8のいずれか1項に記載の構造化文書保存方法。
  10. 【請求項10】取得した前記構造化文書から重要部分を
    抽出する際に構造化されている単位での抽出を行うとと
    もに、前記重要部分に関連のある付加情報を構造化され
    たデータとして生成し、 抽出された前記重要部分と生成された前記付加情報とを
    保存する際、複数の構造化文書から別々に抽出された複
    数の重要部分および付加情報を内部構造として持たせる
    ようにした構造化されたデータベースに保存することを
    特徴とする請求項9に記載の構造化文書保存方法。
  11. 【請求項11】要求された構造化文書を提供するサーバ
    装置から取得した構造化文書を処理するユーザシステム
    のために該取得した構造化文書を部分的に自動保存する
    ための構造化文書保存方法であって、 ユーザシステムの要求に応じてサーバ装置により提供さ
    れた構造化文書を取得し、 予め指定された所定の抽出基準に基づき前記取得した構
    造化文書の構造を利用して該構造化文書から重要部分を
    抽出し、該重要部分に前記要求を出したユーザの識別情
    報を対応付けて保存するとともに、該取得した構造化文
    書を前記ユーザシステムに渡すことを特徴とする構造化
    文書保存方法。
  12. 【請求項12】保存されているある重要部分に対してあ
    るユーザからのアクセスが発生した場合に、該重要部分
    に対応して保存されているアクセス制御情報に基づいて
    該重要部分を該ユーザがアクセス可能か否かを判断し、
    アクセス可能であると判断された場合に、該重要部分を
    該ユーザに送信することを特徴とする請求項11に記載
    の構造化文書保存方法。
  13. 【請求項13】前記重要部分は、構造化された単位で抽
    出されて、複数の構造化文書から別々に抽出された複数
    の重要部分を内部構造として持たせるようにした構造化
    されたデータベースに保存されたものであり、 前記アクセス制御情報は、各重要部分ごとに作成された
    該重要部分の所有者となるユーザの識別情報および該重
    要部分に対するアクセスを許可されたユーザの識別情報
    のリストを記述した内容を持つ構造化されたデータであ
    って、各重要部分に対応付けて前記構造化されたデータ
    ベースに保存されたものであることを特徴とする請求項
    12に記載の構造化文書保存方法。
  14. 【請求項14】あるアクセス制御情報に対する内容変更
    の要求をあるユーザから受けた場合、そのアクセス制御
    情報に基づいて該ユーザに該アクセス制御情報の内容を
    変更する権限があるか否かを判断し、変更する権限があ
    ると判断された場合に、該アクセス制御情報を要求され
    た内容に従って変更することを特徴とする請求項12ま
    たは13に記載の構造化文書保存方法。
  15. 【請求項15】前記取得した構造化文書から重要部分が
    抽出された場合に、既に同一の構造化文書から同一の重
    要部分が抽出され保存されているならば、該取得した構
    造化文書から抽出された重要部分を新たに保存すること
    はせずに、該既に保存されている同一の重要部分に対応
    するアクセス制御情報に対して、前記要求を出したユー
    ザが少なくとも該同一の重要部分をアクセス可能となる
    ように、該ユーザの識別情報を付加することを特徴とす
    る請求項11ないし14のいずれか1項に記載の構造化
    文書保存方法。
  16. 【請求項16】前記取得した構造化文書から重要部分が
    抽出された場合に、既に同一の構造化文書から同一の重
    要部分が抽出され保存されており、かつ、該既に保存さ
    れている同一の重要部分に対応するアクセス制御情報に
    よって既に前記要求を出したユーザが少なくとも該同一
    の重要部分をアクセス可能となっているならば、該取得
    した構造化文書から抽出された重要部分の新たな保存も
    該アクセス制御情報に対する前記要求を出したユーザの
    識別情報の付加もせずに、該取得した構造化文書を前記
    ユーザシステムに渡すことを特徴とする請求項15に記
    載の構造化文書保存方法。
  17. 【請求項17】前記重要部分は、構造化された単位で抽
    出されて、複数の構造化文書から別々に抽出された複数
    の重要部分を内部構造として持たせるようにした構造化
    されたデータベースに保存されたものであり、 前記アクセス制御情報は、各重要部分ごとに作成された
    該重要部分の所有者となるユーザの識別情報および該重
    要部分に対するアクセスを許可されたユーザの識別情報
    のリストを記述した内容を持つ構造化されたデータであ
    って、各重要部分に対応付けて前記構造化されたデータ
    ベースに保存されたものであり、 前記既に保存されている同一の重要部分に対応するアク
    セス制御情報に対して前記要求を出したユーザの識別情
    報を付加する際、該既に保存されている同一の重要部分
    に対応するアクセス制御情報に該要求を出したユーザの
    識別情報を、少なくとも前記アクセスを許可されたユー
    ザの識別情報として付加することを特徴とする請求項1
    5または16に記載の構造化文書保存方法。
  18. 【請求項18】前記重要部分は、構造化された単位で抽
    出されて、複数の構造化文書から別々に抽出された複数
    の重要部分を内部構造として持たせるようにした構造化
    されたデータベースに保存されたものであり、 前記アクセス制御情報は、各重要部分ごとに作成され
    た、該重要部分の所有者となるユーザの識別情報および
    該重要部分に対するアクセスを許可されたユーザの識別
    情報のリストを記述した内容を持つ構造化されたデータ
    であって、各重要部分に対応付けて前記構造化されたデ
    ータベースに保存されたものであり、 前記既に保存されている同一の重要部分に対応するアク
    セス制御情報に対して前記要求を出したユーザの識別情
    報を付加する際、該既に保存されている同一の重要部分
    に対応するアクセス制御情報とは別に、該要求を出した
    ユーザの識別情報を少なくとも前記所有者となるユーザ
    の識別情報として記述した新たなアクセス制御情報を作
    成して、これを該既に保存されている同一の重要部分に
    対応付けて保存することを特徴とする請求項15または
    16に記載の構造化文書保存方法。
  19. 【請求項19】前記重要部分は、構造化された単位で抽
    出されて、複数の構造化文書から別々に抽出された複数
    の重要部分を内部構造として持たせるようにした構造化
    されたデータベースに保存されたものであり、 前記アクセス制御情報は、各重要部分ごとに作成された
    該重要部分にアクセス可能なユーザの識別情報のリスト
    を記述した内容を持つ構造化されたデータであって、各
    重要部分に対応付けて前記構造化されたデータベースに
    保存されたものであり、 前記既に保存されている同一の重要部分に対応するアク
    セス制御情報に対して前記要求を出したユーザの識別情
    報を付加する際、該既に保存されている同一の重要部分
    に対応するアクセス制御情報に該要求を出したユーザの
    識別情報を付加することを特徴とする請求項15または
    16に記載の構造化文書保存方法。
  20. 【請求項20】保存されているある重要部分に対する編
    集要求があった場合に、該重要部分に対応するアクセス
    制御情報の内容が複数のユーザの該重要部分に対するア
    クセスを可能とする状態になっているならば、該重要部
    分のデータを複写して別途同一の内容を持つ重要部分を
    生成するとともに、該編集要求を出したユーザが該生成
    された重要部分に対して編集可能となるような形で該ユ
    ーザの識別情報を含んだアクセス制御情報を作成して、
    これら生成された重要部分と作成されたアクセス制御情
    報とを対応付けて保存することを特徴とする請求項15
    ないし19のいずれか1項に記載の構造化文書保存方
    法。
  21. 【請求項21】データ送受信装置が要求した構造化文書
    を通信路を介して該当するサーバ装置から取得する手段
    と、 予め指定された所定の抽出基準に基づき前記取得した構
    造化文書の構造を利用して該構造化文書から重要部分を
    抽出して保存する手段と、 前記取得した構造化文書を前記データ送受信装置に転送
    する手段とを備えたことを特徴とするデータ中継装置。
  22. 【請求項22】要求された構造化文書を通信路を介して
    該当するサーバ装置から取得する手段と、 予め指定された所定の抽出基準に基づき前記取得した構
    造化文書の構造を利用して該構造化文書から重要部分を
    抽出して保存する手段と、 前記取得した構造化文書を表示する手段とを備えたこと
    を特徴とするデータ送受信装置。
  23. 【請求項23】データ送受信装置が要求した構造化文書
    を通信路を介して該当するサーバ装置から取得する手段
    と、 予め指定された所定の抽出基準に基づき前記取得した構
    造化文書の構造を利用して該構造化文書から重要部分を
    抽出し、該重要部分に前記要求を出したユーザの識別情
    報を対応付けて保存する手段と、 前記取得した構造化文書を前記データ送受信装置に転送
    する手段とを備えたことを特徴とするデータ中継装置。
  24. 【請求項24】要求された構造化文書を通信路を介して
    該当するサーバ装置から取得する手段と、 予め指定された所定の抽出基準に基づき前記取得した構
    造化文書の構造を利用して該構造化文書から重要部分を
    抽出し、該重要部分に前記要求を出したユーザの識別情
    報を対応付けて保存する手段と、 前記取得した構造化文書を表示する手段とを備えたこと
    を特徴とするデータ送受信装置。
JP25541198A 1998-06-30 1998-09-09 構造化文書保存方法及び構造化文書保存装置 Expired - Fee Related JP3715444B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP25541198A JP3715444B2 (ja) 1998-06-30 1998-09-09 構造化文書保存方法及び構造化文書保存装置
US09/342,268 US6973458B1 (en) 1998-06-30 1999-06-29 Scheme for constructing database for user system from structured documents using tags
US11/220,841 US7103604B2 (en) 1998-06-30 2005-09-08 Scheme for constructing database for user system from structured documents using tags

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP19958498 1998-06-30
JP10-199584 1998-06-30
JP25541198A JP3715444B2 (ja) 1998-06-30 1998-09-09 構造化文書保存方法及び構造化文書保存装置

Publications (2)

Publication Number Publication Date
JP2000155756A true JP2000155756A (ja) 2000-06-06
JP3715444B2 JP3715444B2 (ja) 2005-11-09

Family

ID=26511619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25541198A Expired - Fee Related JP3715444B2 (ja) 1998-06-30 1998-09-09 構造化文書保存方法及び構造化文書保存装置

Country Status (2)

Country Link
US (2) US6973458B1 (ja)
JP (1) JP3715444B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109742A (ja) * 1999-08-05 2001-04-20 Toshiba Corp ウェブページ部品統合処理方法及びクライアント装置
WO2002044908A1 (fr) * 2000-11-28 2002-06-06 Ntt Docomo, Inc. Dispositif recepteur et dispositif repetiteur
JP2003030179A (ja) * 2001-07-13 2003-01-31 Murata Mach Ltd 構造化文書管理装置とそのプログラム
WO2006098018A1 (ja) * 2005-03-16 2006-09-21 Visionarts, Inc. オブジェクトカッタープログラム
JP2009104613A (ja) * 2008-11-13 2009-05-14 Konica Minolta Holdings Inc データベースシステム、およびデータ生成方法
JP2009129202A (ja) * 2007-11-22 2009-06-11 Ntt Data Corp データ処理装置、データ処理方法、および、プログラム
JP2010286902A (ja) * 2009-06-09 2010-12-24 Canon Inc 印刷制御装置、印刷制御方法及びプログラム
KR102381539B1 (ko) * 2022-02-11 2022-04-01 (주) 바우디움 구조화 문서에 포함된 자원들에 관한 권한을 관리하는 방법 및 이를 이용한 장치
CN117951303A (zh) * 2024-03-25 2024-04-30 中国民用航空飞行学院 基于生成式大模型的文本信息关联性分析方法及设备

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001338062A (ja) * 2000-05-26 2001-12-07 Nec Corp 電子カルテ情報管理システムおよび電子カルテ情報管理方法
US8578266B2 (en) * 2000-06-26 2013-11-05 Vertical Computer Systems, Inc. Method and system for providing a framework for processing markup language documents
US7035910B1 (en) 2000-06-29 2006-04-25 Microsoft Corporation System and method for document isolation
JP2002132663A (ja) * 2000-10-20 2002-05-10 Nec Corp 情報通信システムとその通信方法、及び通信プログラムを記録した記録媒体
US8275716B2 (en) 2001-05-31 2012-09-25 Contentguard Holdings, Inc. Method and system for subscription digital rights management
US6876984B2 (en) 2001-05-31 2005-04-05 Contentguard Holdings, Inc. Method and apparatus for establishing usage rights for digital content to be created in the future
US7725401B2 (en) 2001-05-31 2010-05-25 Contentguard Holdings, Inc. Method and apparatus for establishing usage rights for digital content to be created in the future
CN1167027C (zh) * 2001-08-03 2004-09-15 富士通株式会社 格式文档中的信息的抽取装置及抽取方法
US20030154212A1 (en) * 2002-01-28 2003-08-14 International Business Machines Corporation Method and apparatus for determining attributes among objects
JP2004086845A (ja) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体
JP3832423B2 (ja) * 2002-11-19 2006-10-11 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像形成装置、およびプログラム
EP1501320A1 (fr) * 2003-07-24 2005-01-26 France Telecom Procédé et système de soumission d'un message déposé dans une boíte de réception d'un service de messagerie
JP4365162B2 (ja) * 2003-08-20 2009-11-18 富士通株式会社 構造化文書のデータを検索する装置および方法
JP4189369B2 (ja) * 2004-09-24 2008-12-03 株式会社東芝 構造化文書検索装置及び構造化文書検索方法
US8356053B2 (en) * 2005-10-20 2013-01-15 Oracle International Corporation Managing relationships between resources stored within a repository
US20070162459A1 (en) * 2006-01-11 2007-07-12 Nimesh Desai System and method for creating searchable user-created blog content
US9710615B1 (en) 2006-06-09 2017-07-18 United Services Automobile Association (Usaa) Systems and methods for secure online repositories
CN101094194B (zh) * 2006-06-19 2010-06-23 腾讯科技(深圳)有限公司 一种提取Web页面中用户所需Web信息的方法
US20080016168A1 (en) * 2006-07-13 2008-01-17 Siemens Medical Solutions Usa, Inc. Email Routing System
US9547648B2 (en) * 2006-08-03 2017-01-17 Excalibur Ip, Llc Electronic document information extraction
US9183321B2 (en) 2006-10-16 2015-11-10 Oracle International Corporation Managing compound XML documents in a repository
US8818958B2 (en) * 2009-03-20 2014-08-26 Microsoft Corporation Virtual safe deposit box for perpetual digital archival
JP5560723B2 (ja) * 2010-01-13 2014-07-30 ソニー株式会社 情報処理装置および方法、並びに、情報処理システムおよび方法
JP5698475B2 (ja) * 2010-07-29 2015-04-08 キヤノン株式会社 通信装置、中継装置、通信装置の制御方法、中継装置の制御方法およびプログラム
SG11201703830XA (en) 2014-11-14 2017-06-29 Fujitsu Ltd Recording medium, data acquisition method, and data acquisition apparatus.
US10891323B1 (en) * 2015-02-10 2021-01-12 West Corporation Processing and delivery of private electronic documents
EP3977024B1 (en) 2019-05-31 2023-06-28 3M Innovative Properties Company Composite cooling film and article including the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259421A (ja) * 1992-07-03 1994-09-16 Fuji Xerox Co Ltd 文書処理装置
JPH06309365A (ja) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd 文書処理装置
JPH07182373A (ja) * 1993-03-17 1995-07-21 Toshiba Corp 文書情報検索装置及び文書検索結果表示方法
JPH0887513A (ja) * 1994-09-16 1996-04-02 Alpha Corp ファイル管理装置及びファイル管理方法
JPH09245057A (ja) * 1996-03-08 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 構造化文書処理方法及び装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2028566A1 (en) * 1990-10-25 1992-04-26 John N. Bassili Method and apparatus for the measurement of response time in attitude survey research
JPH06169395A (ja) * 1992-11-27 1994-06-14 Sharp Corp 画像形成装置
US5963205A (en) * 1995-05-26 1999-10-05 Iconovex Corporation Automatic index creation for a word processor
US5787422A (en) * 1996-01-11 1998-07-28 Xerox Corporation Method and apparatus for information accesss employing overlapping clusters
US6003046A (en) * 1996-04-15 1999-12-14 Sun Microsystems, Inc. Automatic development and display of context information in structured documents on the world wide web
US6026397A (en) * 1996-05-22 2000-02-15 Electronic Data Systems Corporation Data analysis system and method
JP4025379B2 (ja) * 1996-09-17 2007-12-19 株式会社ニューズウオッチ 検索システム
US6078924A (en) * 1998-01-30 2000-06-20 Aeneid Corporation Method and apparatus for performing data collection, interpretation and analysis, in an information platform
US6314439B1 (en) * 1998-02-06 2001-11-06 International Business Machines Corporation Computer system, program product and method of creating aliases and accessing storage locations in a computer system with same
US6240407B1 (en) * 1998-04-29 2001-05-29 International Business Machines Corp. Method and apparatus for creating an index in a database system
US6044375A (en) * 1998-04-30 2000-03-28 Hewlett-Packard Company Automatic extraction of metadata using a neural network
US6076924A (en) * 1998-12-23 2000-06-20 Wysocki; John Optical device with rearview capabilities

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259421A (ja) * 1992-07-03 1994-09-16 Fuji Xerox Co Ltd 文書処理装置
JPH07182373A (ja) * 1993-03-17 1995-07-21 Toshiba Corp 文書情報検索装置及び文書検索結果表示方法
JPH06309365A (ja) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd 文書処理装置
JPH0887513A (ja) * 1994-09-16 1996-04-02 Alpha Corp ファイル管理装置及びファイル管理方法
JPH09245057A (ja) * 1996-03-08 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 構造化文書処理方法及び装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109742A (ja) * 1999-08-05 2001-04-20 Toshiba Corp ウェブページ部品統合処理方法及びクライアント装置
CN100456287C (zh) * 2000-11-28 2009-01-28 株式会社Ntt都科摩 接收装置和中继装置
WO2002044908A1 (fr) * 2000-11-28 2002-06-06 Ntt Docomo, Inc. Dispositif recepteur et dispositif repetiteur
US7072642B2 (en) 2000-11-28 2006-07-04 Ntt Docomo, Inc. Receiving device and repeating device
JP2003030179A (ja) * 2001-07-13 2003-01-31 Murata Mach Ltd 構造化文書管理装置とそのプログラム
US8082259B2 (en) 2005-03-16 2011-12-20 Sony Corporation Information processing apparatus for extracting objects
WO2006098018A1 (ja) * 2005-03-16 2006-09-21 Visionarts, Inc. オブジェクトカッタープログラム
JP2009129202A (ja) * 2007-11-22 2009-06-11 Ntt Data Corp データ処理装置、データ処理方法、および、プログラム
JP2009104613A (ja) * 2008-11-13 2009-05-14 Konica Minolta Holdings Inc データベースシステム、およびデータ生成方法
JP2010286902A (ja) * 2009-06-09 2010-12-24 Canon Inc 印刷制御装置、印刷制御方法及びプログラム
US9141324B2 (en) 2009-06-09 2015-09-22 Canon Kabushiki Kaisha Outputting selective elements of a structured document
KR102381539B1 (ko) * 2022-02-11 2022-04-01 (주) 바우디움 구조화 문서에 포함된 자원들에 관한 권한을 관리하는 방법 및 이를 이용한 장치
WO2023153558A1 (ko) * 2022-02-11 2023-08-17 (주) 바우디움 구조화 문서에 포함된 자원들에 관한 권한을 관리하는 방법 및 이를 이용한 장치
CN117951303A (zh) * 2024-03-25 2024-04-30 中国民用航空飞行学院 基于生成式大模型的文本信息关联性分析方法及设备
CN117951303B (zh) * 2024-03-25 2024-06-11 中国民用航空飞行学院 基于生成式大模型的文本信息关联性分析方法及设备

Also Published As

Publication number Publication date
US20060004780A1 (en) 2006-01-05
JP3715444B2 (ja) 2005-11-09
US6973458B1 (en) 2005-12-06
US7103604B2 (en) 2006-09-05

Similar Documents

Publication Publication Date Title
JP3715444B2 (ja) 構造化文書保存方法及び構造化文書保存装置
US7822735B2 (en) System and method for saving browsed data
US7209930B2 (en) Information providing system and a method for providing information
US7533083B2 (en) Device, system and computer program product for retrieving information
US9116927B2 (en) Methods and apparatuses for publication of unconsciously captured documents
US20020065846A1 (en) Spreadsheet Web server system and spreadsheet Web system
US20010042093A1 (en) Information processing system capable of file transmission and information processing apparatus in the system
EP1591911A1 (en) Synchronization program
US8667070B2 (en) Storage medium storing a mail management program, and mail management apparatus and method
US11599584B2 (en) Method and system for processing information in social network system
JP2003259293A (ja) カットリスト生成システム,センタサーバ,広告制作端末装置,コンピュータプログラム,記憶媒体,およびセンタサーバのカットリスト生成方法。
EP1861798B1 (en) Automatic intranet service publishing and service access
US20030135761A1 (en) Communication device, communication system and method therefor
JP2003256260A (ja) データ共有システム,共有センタサーバ,広告スタッフ端末装置,コンピュータプログラム,記憶媒体,および共有センタサーバのデータ共有方法
JP4062896B2 (ja) メール情報提供装置、メール情報提供方法、およびメール情報提供プログラム
US20020065796A1 (en) Web based automated office procedure system
US20220309111A1 (en) Information processing system, non-transitory computer readable medium storing program, and information processing method
JP4589592B2 (ja) 映像コンテンツ変換システム,変換センタサーバ,端末装置,コンピュータプログラム,記憶媒体,および変換センタサーバの映像コンテンツ変換方法
JP4000871B2 (ja) 広告承認回覧システム,承認回覧センタサーバ,広告スタッフ端末装置,コンピュータプログラム,記憶媒体,および承認回覧センタサーバの承認回覧方法
JP3533068B2 (ja) ファクシミリ情報ボックスアクセス処理方法およびプログラム記憶媒体
JP2005122606A (ja) 情報閲覧装置、情報閲覧システム、及び情報閲覧プログラム
JP4186452B2 (ja) 文書管理装置
JPH03103942A (ja) 分散データベース管理方式
JP2003242034A (ja) 通信装置,通信システム,および通信方法
JPH1139341A (ja) Wwwシステムにおけるページ表示装置及びプログラムを記録した機械読み取り可能な記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050825

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080902

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees