JP2004295836A - 文書管理方法 - Google Patents

文書管理方法 Download PDF

Info

Publication number
JP2004295836A
JP2004295836A JP2003090915A JP2003090915A JP2004295836A JP 2004295836 A JP2004295836 A JP 2004295836A JP 2003090915 A JP2003090915 A JP 2003090915A JP 2003090915 A JP2003090915 A JP 2003090915A JP 2004295836 A JP2004295836 A JP 2004295836A
Authority
JP
Japan
Prior art keywords
document
date
article
information
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003090915A
Other languages
English (en)
Inventor
Yuji Noro
勇二 野呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003090915A priority Critical patent/JP2004295836A/ja
Publication of JP2004295836A publication Critical patent/JP2004295836A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書情報の効率的な管理と再利用を行うことができる文書管理方法を提供する。
【解決手段】保存する文書情報を記事取り込み部311により取り込み、前記文書情報の分類を入力し、文書データ生成部314により前記文書情報を形態素分析し解析して、前記文書内に出現する事象の終了日付を抽出し、特定して、前記分類と前記終了日付とに基づいて、分類別に保存期間を設けた分類テーブル351にしたがった前記文書情報の保存最終日付を設定して、文書データDB342に記憶するので、文書ごとに最適な保存期間を容易に設定することができる。
【選択図】 図3

Description

【0001】
【発明の属する技術分野】
本発明は、文書情報の効率的な管理と再利用を行うことができる文書管理方法に関するものである。
【0002】
【従来の技術】
従来、新聞・雑誌・広告などの情報を収集や再利用するためには、該当の記事をスクラップとして切り抜き、保存していた。また、最近では、新聞記事を電子化またはインターネットを通じて配信される電子新聞が多くなりつつある。
【0003】
これらの情報の中から、自分が必要とする情報を選択、蓄積し、記事の有効活用が望まれる。これらを実現する技術として、紙上の文字列・図・写真を電子的に取り込み、取り込んだデータの一部または全てを記録し、編集と再利用する電子スクラップブック(例えば、特許文献1参照)、所望の電子記事を表示し、マークアップして保存する電子記事表示装置(例えば、特許文献2参照)が、開示されている。
【0004】
また、図34に示すような、保存する文書ファイルに文書管理情報を設定し、この文書の発効日情報をもとに、保存期限情報を設定するデータ分類管理システムも開示されている(例えば、特許文献3参照)。
【0005】
【特許文献1】
特開平5−303619号公報
【0006】
【特許文献2】
特開2001−282784号公報
【0007】
【特許文献3】
特開2001−92846号公報
【0008】
【発明が解決しようとする課題】
しかしながら、スクラップ保存されるデータが大量になっていく中で、スクラップされた記事が必ずしも有効に活用されていない。例えば、後で見直したい記事だと思ってスクラップしても、スクラップ量が増えるにつれて活用時期を逸してしまうことが少なくない。また、スクラップした情報の中には時間が過ぎると破棄してもよい情報が発生するが、大量のスクラップ情報の中からそれらを整理、破棄することは非常に面倒であるという問題があった。
【0009】
そこで、文書の保存期間を登録することが考えられるが、保存期間を登録するには、記事の内容を読み必要な保存期間を決定し、人手で保存期間を入力しなければならず、手間がかかって大変であるという問題があった。
【0010】
また、上記のような、発効日情報をもとに保存期限情報を設定する方法では、文書の内容に関わらず、「発効日」によって「保存期限」が決められてしまうという問題があった。
【0011】
そこで、本発明は、保存すべき文書とその分野をユーザが指定するだけで、システムがその文書を形態素分析してイベント等の終了日時を特定し、この日時を起算日として指定された分野に対応してあらかじめ登録された保存期間を加算して、保存期間の最終日を自動的に設定し、ユーザは、設定された最終日時を確認し、了承/修正することにより、文書の内容に応じた保存期間を容易に設定することができる文書管理方法を提供することを課題とする。
【0012】
【課題を解決するための手段】
本発明は、上記課題を解決するため、分類別に保存期間を設けた分類別保存期間情報を準備し、保存する文書情報を取り込み、前記文書情報の分類を入力し、前記文書情報を形態素分析して、文書の内容を解析し、前記解析された文書データに基づいて、前記文書内に出現する事象の終了日付を抽出し、特定し、前記分類と前記終了日付とに基づいて、前記分類別保存期間情報にしたがった前記文書情報の保存最終日付を設定し、前記文書情報とともに、前記保存最終日付を記憶することを特徴とするものである。
【0013】
これにより、文書内の日付から、この文書の分類に応じた保存最終日付が設定され、記憶されるので、文書ごとに最適な保存期間を設定することができ、実際に保存が必要な情報であるか否かを確実に把握することができることとなる。
【0014】
また、本発明は、前記文書情報から複数の終了日付候補を抽出したとき、最も遅い日付を前記終了日付として特定することを特徴とするものである。
【0015】
これにより、文書内から複数の日付を抽出した場合でも、最も遅い日付を終了日付として保存期間を設定するので、複数の日付があっても対応することができるとともに、文書保存が必要な期間を確実に保存期間とすることができることとなる。
【0016】
また、本発明は、前記文書の保存期限を過ぎたとき、ユーザに対して前記文書の削除確認の通知を行うか否かの区分を設定し、前記削除確認の通知が設定されている文書の保存最終日付が過ぎたとき、前記ユーザに対して前記文書の削除確認通知を送信し、前記削除確認の通知が設定されていない文書の保存最終日付が過ぎたとき、前記文書を削除することを特徴とするものである。
【0017】
したがって、文書の保存期限が過ぎたとき、確認が必要な文書では、ユーザに確認を行い、確認が必要でない文書では、自動的に文書の削除を行うので、文書に応じた削除方法を選択することができ、勝手に文書が削除されてしまうこともなく、確認の手間を減らして無駄に文書がたまることも防止することができることとなる。
【0018】
また、本発明は、前記文書削除確認の通知に対して、前記文書の保存期間延長指示を受信したとき、前記文書の保存最終日付を再設定することを特徴とするものである。
【0019】
したがって、保存期間延長指示により保存最終日付を変更することができるので、保存期限が来てしまっても、期間を延長することができ、必要な情報は削除されずに、そのまま保存しておくことができることとなる。
【0020】
さらに、本発明は、現在の日付を取得し、前記文書内の事象の日付と、前記現在日付と、にしたがって前記事象の発生を通知する情報通知日付を設定し、前記情報通知日付になったら、前記事象の発生通知を行うことを特徴とするものである。
【0021】
これにより、文書内の事象の日付と、文書保存時の日付と、にしたがって設定された情報通知日に、前記事象の発生通知が行われるので、文書の内容および保存した日付に適した日付で、前記事象の発生が通知され、知りたいときに知りたい情報を得ることができることとなる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態について添付図面を参照しつつ説明する。
【0023】
本発明に係る文書管理システムを実現するシステム構成図を、図1に示す。図1に示すように、文書管理システム200は、パソコン本体210、キーボード220、ディスプレイ240およびスキャナ250を備え、パソコン本体210は、公衆回線400を介して、新聞社等のサーバ500と接続される。
【0024】
図2に、パソコン本体210の構成のブロック図を示す。図2に示すように、パソコン本体210は、このパソコン全体を制御するCPU211、一時記憶領域であるRAM212、プログラム等を記憶するROM213、データ等の記録を行うHDD214、CD−ROMの読み書きを行うCD−ROMドライブ215、フロッピー(登録商標)ディスクの読み書きを行うFLDドライブ216、外部周辺機器との情報交換を行うI−Oインタフェース217、公衆回線400を通じてネットワークとの接続を行うモデム218を備え、各部は、バス219で接続されている。
【0025】
図3に、本文書管理システム200の原理構成図を示す。図3に示すように、文書管理システム200は、記事取り込み部311、記事切り抜き部312、記事データ生成部313、文書データ生成部314、記事表示部315、記事通知部316、記事削除部317、および、記事データDB341、文書データDB342、文字情報テーブル343、分類テーブル351、日付構文辞書352、開始\終了日付算出テーブル353、標準パターン文字辞書354、構文辞書355、単語辞書356を備えている。
【0026】
記事取り込み部311は、保存する記事の掲載されている新聞や広告等を取り込むものであり、記事切り抜き部312は、記事取り込み部311により取り込んだ記事から保存したい記事の部分を切り抜くものである。記事データ生成部313は、記事切り抜き部312で切り抜いた記事から記事全体を保存する記事データDB341を生成するものであり、文書データ生成部314は、記事データ生成部313に生成された記事データDB341から、この記事データの管理情報およびこの記事の文書データを保存する文書データDB342を生成するものである。
【0027】
記事表示部315は、保存した記事を文書データDB342、記事データDB341から抽出し、表示するものである。記事通知部316は、文書データDB342に設定した期日に基づいて、ユーザに対して記事の内容や期限を通知するものであり、記事削除部317は、文書データDB342に設定した区分に基づいて、ユーザに通知後または自動で保存した記事を、文書データDB342および記事データDB341から削除するものである。
【0028】
また、記事データDB341は、記事全体を保存するものであり、文書データDB342は、記事データの管理情報および記事の文書データを保存するものである。文字情報テーブル343は、記事データDB341のビットマップデータから検出した文字の情報(文字コード、文字サイズ、文字位置)を格納するものである。
【0029】
分類テーブル351は、保存する文書を種類ごとに区分けした分類のテーブルであり、分類ごとにその分類の保存期間を記憶している。日付構文辞書352は、文章中に表れる日付のパターンを格納したものである。開始\終了日付算出テーブル353は、日付要素により、開始日付および終了日付を格納したものである。
【0030】
標準パターン文字辞書354は、ビットマップデータから文字検出を行う文字のパターン辞書である。構文辞書355は、文字列から意味のある文章を抽出するための構文を格納したものである。単語辞書356は、文字列から意味のある単語を抽出するための単語を格納したものである。
【0031】
このような文書管理システム200において、文書情報の保存処理について、フローチャートを図4に示し、説明する。
【0032】
また、文書管理の事前準備として、分類別に保存期間を設定した分類テーブル351を作成しておく。図5に、分類テーブル351のデータ構造図を示す。同図に示すように、分類テーブル351は、文書の種類ごとに区分けする分類、分類ごとに各々設けられた文書を保存する保存期間、文書の保存切れ通知等を行うメール送信の電子メール宛先、およびメール送信の端末IDを有している。
【0033】
文書情報保存処理では、まず、保存する記事の掲載されている新聞や広告等を取り込み表示する(s101)。記事の取り込みは、モデム218を使用してネットワーク上から電子新聞を取り込んでも良いし、スキャナ250を使用して紙面の情報を取り込んでも良い。さらに、フロッピー(登録商標)ディスク610、CD−ROM620等に記録された情報を取り込んでも良い。また、このとき、現在の日付を処理日として取得する。
【0034】
次に、保存記事切り抜き処理を行う(s102)。保存記事切り抜き処理では、上記取り込み表示した記事から保存しておきたいスクラップ記事を切り抜く。
【0035】
次に、記事データDB生成処理を行う(s103)。記事データDB生成処理では、上記切り抜いたスクラップ記事から記事の現物イメージを保存するための記事データDB341を生成する。
【0036】
次に、文書データDB生成処理を行う(s104)。文書データDB生成処理では、上記記事データDB341から記事内容を管理する記事情報および記事の文書を保存するための文書データDB342を生成する。
【0037】
以下、上記文書情報保存処理の各処理の詳細を説明する。
【0038】
まず、保存記事切り抜き処理(s102)について、図6に、記事切り抜き指定画面例を示し、図7に、保存記事切り抜き処理のフローチャートを示し、説明する。
【0039】
記事切り抜き指定画面では、取り込んだ記事の全体と、この記事の分類を指定する分類一覧が表示される。分類については、分類テーブル351に登録されている分類が一覧表示され、選択して入力できるようになっている。
【0040】
保存記事切り抜き処理では、まず、分類を入力し、取り込みたい記事の分類を決定する(s201)。次に、表示されている記事から、切り取りたい領域の各角をマウスでクリックすることにより、取り込み領域を指定する(s202)。次に、上記指定された領域を判別し、記事データとして切り抜く(s203)。
【0041】
次に、記事データDB生成処理(s103)について、図8に、保存する記事領域を指定して切り抜いた切り抜き記事例を示し、図9に、記事データDB生成処理のフローチャートを示し、説明する。
【0042】
記事データDB生成処理では、まず、記事IDを生成する(s301)。記事IDとは、記事を管理するための識別符号であり、記事データDB341と文書データDB342とは、この識別IDによって、同一の記事情報であることを判断する。また、記事IDについては、自動採番する。次に、切り抜いた領域のビットマップデータを生成する(s302)。次に、上記記事IDとビットマップデータから記事データDB341を生成する(s303)。
【0043】
図10に、記事データDB341のデータ構造図を示す。
【0044】
次に、文書データDB生成処理(s104)について、図11にフローチャートを示し、説明する。
【0045】
文書データDB生成処理では、まず、記事データのビットマップデータから文字データを検出し、タイトル文生成処理を行う(s401)。次に、上記文字データから記事に記載された記事内容、例えば、イベントの期間を算出する(s402)。続いて、上記イベントの通知時期を算出し(s403)、この文書データの保存期間の算出を行う(s404)。
【0046】
次に、文書データ登録画面により、上記処理で求めたタイトル文、サブタイトル文、イベント通知時期、保存期間および保存期間満了後に文書データ削除の確認通知を行うか否かの区分を確認する(s405)。
【0047】
ここで、図12に、文書データ登録画面例を示す。
【0048】
登録情報の確認処理で修正項目の有無を確認し(s406)、修正項目があれば、項目の修正入力を行い(s407)、再度確認処理(s405)を行う。登録情報の確認処理で、修正項目がなければ(s406で判定)、上記登録情報で文書データDB342を生成する(s408)。
【0049】
次に、上記文書データDB生成処理の各処理について、説明する。
【0050】
まず、タイトル文の生成処理(s401)について、図13にフローチャートを示し、説明する。
【0051】
タイトル文の生成処理では、まず、記事データのビットマップデータから、標準パターン文字辞書354を用いて文字を検出する(s501)。ビットマップデータから文字を検出する方法は、既存の技術を用いて、例えば、特開2002−288166号公報に記載の文字検出方法により行う。
【0052】
図14に、このビットマップデータから文字を検出する文字検出方法のフローチャートを示し、簡単に説明する。この文字検出方法では、標準パターン文字辞書354に記述のパターンを順に照合する(s1)。文書中の未照合の位置から語を照合する(s2)。パターンと一致した語の並びがあれば(s3)、それらを抽出し、指定の順で格納する(s4)。さらに格納された情報に、文書の時間に関する情報(文書の作成日や発行日等の時間に関する情報)を共に格納する(s5)。文書中のすべての語について照合が終了すると(s6)、次のパターンについて同様に照合を行う(s1)。
【0053】
タイトル文の生成処理に戻り、ビットマップデータから文字を検出(s501)したら、検出した文字の文字サイズ/文字位置を算出し、文字コードとともに文字情報テーブル343に設定する(s502)。
【0054】
図15に、文字情報テーブル343のデータ構造図を示す。図15に示すように、文字情報テーブル343は、検出した文字の文字コード、その文字の文字サイズ、その文字のある文字位置(縦の位置と横の位置)を有している。
【0055】
文字情報テーブル343の設定(s502)ができたら、記事領域からタイトル文候補の生成を行い(s503)、次いで、記事領域以外からのタイトル文候補の生成を行う(s504)。
【0056】
図16に、記事領域からのタイトル文候補の生成処理(s503)のフローチャートを示し、説明する。
【0057】
記事領域からのタイトル文候補の生成処理では、まず、文字情報テーブル343から段組位置を判別し、記事文領域を求める(s601)。次に、上記記事文領域を構文解析し、縦書き/横書き文の判別を行う(s602)。次に、上記縦書き/横書きの判別結果と段組位置判別結果(記事文領域)から、記事の先頭20文字をタイトル文候補として抽出する(s603)。次に、求めたタイトル文候補と、記事文とを、記事IDとともに文書データDB342に出力する(s604)。
【0058】
図17に、文書データDB342のデータ構造図を示す。図17に示すように、文書データDB342は、記事ID、分類、処理日付、複数のタイトル文候補、サブタイトル文候補、イベント開始日付、イベント終了日付、イベント通知日付、イベント通知時間、保存期間の最終年月日、保存期間削除区分、記事文を有している。
【0059】
タイトル文候補1〜タイトル文候補nとサブタイトル文候補については、このタイトル文生成処理において抽出された全てのタイトル文候補を、タイトル文候補1〜タイトル文候補nに登録して、サブタイトル文候補は、初期値ブランクにしておき、文書データDB登録画面で選択されたものをそれぞれタイトル文、サブタイトル文としても良いし、タイトル文候補として抽出されたタイトル文の1つをサブタイトル文候補に格納しておき、文書データDB登録画面で確定するようにしても良い。
【0060】
イベント通知時間については、システムであらかじめ決めた時間とする。また、このイベント通知時間についても、文書内の内容によって求めるようにしても良いし、文書データDB登録画面で入力するようにしても良い。保存期間削除区分は、保存期間満了後、保存した記事および文書情報を自動的に削除するか、ユーザに確認通知を行うかどうかの区分である。
【0061】
次に、図18に、記事領域以外からのタイトル文候補の生成処理(s504)のフローチャートを示し、説明する。
【0062】
記事領域以外からのタイトル文候補の生成処理では、まず、文字情報テーブル343の文字サイズと文字位置情報から、縦書き方向の同一サイズ文字列を抽出する(s701)。次に、文字列を構文辞書355や単語辞書356を用いて構文解析し、意味のある単語が含まれている場合には、タイトル文候補として抽出する(s702)。続いて、求めたタイトル文候補を文書データDB342に出力する(s703)。
【0063】
次に、縦方向の文字列の抽出が終わりであるか否かを判定し(s704)、まだ縦方向の文字列があれば、縦書き方向の同一サイズ文字列の抽出処理(s701)に戻り、処理を繰り返し(s701〜s703)、縦方向の文字列抽出が終われば、縦方向と同様に、横方向のタイトル文候補を求め、文書データDBに出力する(s705)。
【0064】
以上の処理により、文書データDB生成処理(s104)のタイトル文生成処理(s401)が終了する。また、上記タイトル文候補の生成処理(s503、s504)では、記事領域、記事領域以外からそれぞれ求める方法以外に、全ての領域から文字サイズによってタイトル文候補を求める等の方法もある。
【0065】
次に、文書データDB生成処理(s104)のイベント期間の算出処理(s402)について、図19にフローチャートを示し、説明する。
【0066】
イベント期間の算出処理では、まず、記事文、タイトル文の文字列から日付要素の抽出を行う(s802)。次に、上記抽出により、日付要素が抽出されたか否かの判定を行う(s803)。
【0067】
日付要素があった場合には、イベント開始日付の算出処理を行い(s804)、続いて、イベント終了日付の算出処理を行う(s805)。
【0068】
日付要素がなかった場合には、イベント開始日付に処理日付を、イベント終了日付にも処理日付を設定する(s806)。続いて、上記設定した日付を、文書データDB342に登録する(s807)。
【0069】
次に、図20に、イベント開始日付算出処理(s804)のフローチャートを示し、説明する。
【0070】
イベント開始日付算出処理では、まず、記事文/タイトル文の文字列から開始日付要素を抽出する(s901)。開始日付要素の抽出には、日付構文辞書352を使用して、開始日付を検出し、求める。
【0071】
図21に、日付構文辞書352のデータ構造図を示す。図21に示すように、日付構文辞書352は、日付組み合わせパターン、日付表記パターン、日付修飾語を有し、文字列から辞書内の構文に当てはまるパターンを算出して、開始日付を抽出するものである。
【0072】
次に、開始日付要素の有無を判定する(s902)。開始日付要素がある場合には、開始/終了日付算出テーブル353からイベント開始日付を求める(s903)。
【0073】
図22、図23に、開始/終了日付算出テーブル353のデータ構造図を示す。図22、図23に示すように、開始/終了日付算出テーブル353は、日付要素、イベント開始日付(年月日)、イベント終了日付(年月日)を有し、日付要素として、特定日付要素1、特定日付要素2を有している。
【0074】
このような開始/終了日付算出テーブル353を使用して、抽出した開始日付要素から、テーブルの日付要素を検索し、その日付要素に対応したイベント開始日付を求める。開始日付要素が複数存在する場合には、最も小さい(早い)日付を開始日付要素とする。
【0075】
次に、イベント開始日付が求められたら(s903)、求めたイベント開始日付を文書データDB342に登録する(s904)。
【0076】
開始日付要素がない場合には、イベント開始日付に処理日付を設定して(s905)、文書データDB342に登録する(s906)。
【0077】
次に、図24に、イベント終了日付算出処理(s805)のフローチャートを示し、説明する。
【0078】
イベント終了日付算出処理では、まず、記事文/タイトル文の文字列から終了日付要素を抽出する(s1001)。終了日付要素の抽出には、開始日付要素の抽出処理と同様に、日付構文辞書352を使用して、終了日付を検出し、求める。
【0079】
次に、終了日付要素の有無を判定する(s1002)。終了日付要素がある場合には、開始/終了日付算出テーブル353からイベント終了日付を求める(s1003)。
【0080】
イベント終了日付の求め方は、上記イベント開始日付の求め方と同様に、抽出した終了日付要素から、開始/終了日付算出テーブル353の日付要素を検索し、その日付要素に対応したイベント終了日付を求める。終了日付要素が複数存在する場合には、最も大きい(遅い)日付を終了日付要素とする。
【0081】
次に、イベント終了日付が求められたら(s1003)、求めたイベント終了日付を文書データDB342に登録する(s1004)。
【0082】
終了日付要素がない場合には、イベント終了日付に先に求めたイベント開始日付を設定して(s1005)、文書データDB342に登録する(s1006)。
【0083】
次に、文書データDB生成処理(s104)のイベント通知時期の算出処理(s403)について、図25にフローチャートを示し、説明する。
【0084】
イベント通知時期の算出処理では、条件にしたがってそれぞれ通知日付を設定する。
【0085】
まず、終了日付までの日数が2日以内(条件a:終了日付−処理日付≦2)であるか否かを判定し(s1102)、2日以内であれば、文書データDB342の通知日付に0(通知しない)を設定する(s1103)。終了日付までの日数が2日以内でなければ、終了日付までの日数が3日から6日の間(条件b:3≦終了日付−処理日付≦6)であるか否かを判定し(s1104)、3日から6日の間であれば、文書データDB342の通知日付に終了日付の前日の日付(終了日付−1)を設定する(s1105)。
【0086】
終了日付までの日数が6日以内でなければ、終了日付までの日数が7日から30日の間(条件c:7≦終了日付−処理日付≦30)であるか否かを判定し(s1106)、7日から30日の間であれば、文書データDB342の通知日付に終了日付の3日前の日付(終了日付−3)を設定する(s1107)。終了日付までの日数が30日以内でなければ、文書データDB342の通知日付に終了日付の7日前の日付(終了日付−7)を設定する(s1109)。
【0087】
以上の処理により、イベント通知時期が算出される。
【0088】
次に、文書データDB生成処理(s104)の保存期間の算出処理(s404)について、図26にフローチャートを示し、説明する。
【0089】
保存期間の算出処理では、まず、分類の取得を行う(s1201)。次に、取得した分類で分類テーブル351を検索し、保存期間を抽出する(s1202)。次に、処理日付に上記で抽出した保存期間を加算して(処理日付+保存期間)、文書データDB342の保存期間に設定する。(s1203)。
【0090】
以上の処理により、分類に応じて所望の保存期間を設定することができる。
【0091】
以上、これまでの処理により、文書情報の保存処理が終了し、ユーザが保存したい情報を、情報の通知時期、保存期間およびタイトルを付与して、文書データDB342として記憶することできる。
【0092】
次に、上記で保存した情報の確認方法について、説明する。
【0093】
記事情報を保存して、文書データDB342作成後は、保存した記事の内容を確認することができる。ユーザは、記事を観たいと思ったら、分類を指定して記事一覧を表示させる。
【0094】
図27に、記事一覧の表示画面例を示す。図27に示すように、ここでは、処理日付順に、タイトル/サブタイトルが表示され、記事をユーザに通知する通知予定日付、記事を保存する保存期間の最終日付が表示される。ここで、ユーザがさらに詳しい内容が知りたい場合には、一覧表示された記事から詳細が知りたい記事を選択することにより、記事詳細画面が表示される。
【0095】
図28に、記事詳細の画面例を示す。図28に示すように、記事ごとに、詳細情報を観ることができる。さらに、ここで、「実イメージ」を選択することにより、記事データDB341から記事データのビットマップデータを表示して、記事を取り込んだときと同様の表示イメージを再現し、記事の現物と同じレイアウトで記事を確認することができる。
【0096】
次に、記事通知および記事削除確認通知処理のフローチャートを図29、図30に示し、説明する。
【0097】
図29、図30に示すように、記事通知および記事削除確認通知処理では、記事情報を保存した発信側のパソコン(以下、ホストとする)において、タイマー監視を行い、記事通知または記事削除確認通知が発生したときに、着信側のパソコンまたは携帯端末(以下、端末とする)に、所望の通知を行う。
【0098】
まず、ホストにおいて、タイマー監視を行い(s2101)、通知記事があったら(s2111で判断)、端末に対して通知記事のメール発信を行う(s2112)。このときの宛先は、該当の記事の分類から、分類テーブル351を検索し、メール宛先または端末IDを取得して、この宛先に送信する。また、この宛先は、文書データDB342の作成時に、分類テーブル351の宛先を文書データDB342に書き込むようにしたり、さらに、文書データ登録画面で修正および登録するようにしても良い。
【0099】
端末側では、この通知記事のメールを受信する(s2211)。図31に、記事通知メール例を示す。ここで、ユーザは、受信した通知記事を選択することにより、詳細情報を確認することができる。詳細確認を行う場合には(s2212で判断)、端末側から詳細通知依頼をホスト側に送信する(s2213)。
【0100】
ホスト側では、詳細通知依頼がある否かを判定し(s2113)、詳細通知依頼がある場合には、記事の詳細を端末側に送信する(s2114)。端末側では、記事の詳細を受信し、表示する(s2214)。図32に、記事通知詳細画面例を示す。
【0101】
次に、ホストにおいて、削除対象の記事があるか否かを判定し(s2121)、削除対象記事がある場合には、その記事が確認通知を行うか否かを判定する(s2122)。確認通知を行う記事であれば、端末に対して削除確認のメール発信を行う(s2123)。このときの宛先は、記事通知と同様に、該当の記事の分類から、分類テーブル351を検索し、メール宛先または端末IDを取得して、この宛先に送信する。この宛先指定についても、上記記事通知のときの宛先指定方法と同様である。
【0102】
端末側では、この削除確認のメールを受信する(s2221)。図33に、削除確認を行う期限超過記事表示例を示す。ここで、ユーザは、期限超過記事の詳細記事確認、保存期間延長、記事削除を行うことができる。
【0103】
まず、詳細記事の確認の場合には(s2222で判断)、端末側から詳細記事の通知依頼をホスト側に送信する(s2223)。ホスト側では、詳細記事通知依頼がある否かを判定し(s2124)、詳細記事通知依頼がある場合には、記事の詳細を端末側に送信する(s2125)。端末側では、記事の詳細を受信し、表示する(s2224)。
【0104】
次に、記事の保存期間の延長を行うか否かを判定し(s2225)、保存期間の延長を行う場合には、端末側から記事の保存期間延長依頼をホスト側に送信する(s2226)。
【0105】
ホスト側では、記事の保存期間の延長依頼がある否かを判定し(s2126)、保存期間延長依頼がある場合には、文書データDB342の保存期間(年月日)を書き換えて、保存期限を延長する(s2127)。
【0106】
次に、端末側において、記事の削除を行うか否かを判定し(s2227)、記事の削除を行う場合には、端末側から記事の削除指示をホスト側に送信する(s2228)。
【0107】
ホスト側では、記事の削除指示がある否かを判定し(s2128)、記事削除指示がある場合には、文書データDB342と記事データDB341の該当レコードを削除して、記事の削除を行う(s2129)。
【0108】
また、削除対象の記事があって(s2121で判定)、その記事が確認通知を必要としない場合(s2122で判定)には、期限が来たら自動的に、文書データDB342と記事データDB341の該当レコードが削除される(s2129)。
【0109】
以上の処理により、保存したい情報に、それぞれ情報の分類に適した保存期間を設けて保存でき、保存期間が経過した情報に対しては、確認後または自動で削除することができるので、情報が不要にたまらず、蓄積した情報を有効に活用することができる。
【0110】
さらに、本発明に関して以下を付記する。
【0111】
(付記1)
分類別に保存期間を設けた分類別保存期間情報を準備する準備ステップと、
ユーザが保存する文書情報を取り込む文書情報取り込みステップと、
前記文書情報の分類を入力する文書分類入力ステップと、
前記文書情報を形態素分析して、文書の内容を解析する文書解析ステップと、
前記解析された文書データに基づいて、前記文書内に出現する事象の終了日付を抽出し、特定する終了日付特定ステップと、
前記分類と前記終了日付とに基づいて、前記分類別保存期間情報にしたがった前記文書情報の保存最終日付を設定する保存期日設定ステップと、
前記文書情報とともに、前記保存最終日付を記憶する文書情報記憶ステップと、
を備えたことを特徴とする文書管理方法。
【0112】
(付記2)
付記1に記載の文書管理方法において、
前記終了日付特定ステップが、前記文書情報から複数の終了日付候補を抽出したとき、前記終了候補日付の中で最も遅い日付の終了候補日付を前記終了日付として特定することを特徴とする文書管理方法。
【0113】
(付記3)
付記1または付記2に記載の文書管理方法において、
前記文書の保存期限を過ぎたとき、ユーザに対して前記文書の削除確認の通知を行うか否かの区分を設定する削除通知区分設定ステップと、
前記削除確認の通知が設定されている文書の保存最終日付が過ぎたとき、前記ユーザに対して前記文書の削除確認通知を送信する削除確認通知送信ステップと、
前記削除確認の通知が設定されていない文書の保存最終日付が過ぎたとき、前記文書を削除する期限切れ文書削除ステップと、
を備えたことを特徴とする文書管理方法。
【0114】
(付記4)
付記3に記載の文書管理方法において、
前記削除確認通知送信ステップで送信した前記文書削除確認の通知に対して、前記文書の保存期間延長指示を受信する期限延長指示受信ステップと、
前記文書の保存期間延長指示を受信したとき、前記文書の保存最終日付を再設定する保存期日再設定ステップと、
を備えたことを特徴とする文書管理方法。
【0115】
(付記5)
付記1から付記4のいずれか1項に記載の文書管理方法において、
現在の日付を取得する現在日付取得ステップと、
前記文書内の事象の日付と、前記現在日付と、にしたがって前記事象の発生を通知する情報通知日付を設定する情報通知日付設定ステップと、
前記情報通知日付になったら、前記事象の発生通知を行う情報通知ステップと、
を備えたことを特徴とする文書管理方法。
【0116】
【発明の効果】
本発明によれば、保存する文書情報を取り込み、前記文書情報の分類を入力し、前記文書情報を形態素分析し解析した文書データに基づいて、前記文書内に出現する事象の終了日付を抽出し、特定して、前記分類と前記終了日付とに基づいて、分類別に保存期間を設けた分類別保存期間情報にしたがった前記文書情報の保存最終日付を設定して、記憶するので、文書ごとに最適な保存期間を設定することができ、実際に保存が必要な情報であるか否かを確実に把握することができる。
【0117】
また、本発明によれば、前記文書情報から複数の終了日付候補を抽出したとき、最も遅い日付を前記終了日付として特定することにより、文書内から複数の日付を抽出した場合でも、最も遅い日付を終了日付として保存期間を設定するので、複数の日付があっても対応することができるとともに、文書保存が必要な期間を確実に保存期間とすることができる。
【0118】
また、本発明によれば、前記文書の保存期限を過ぎたとき、ユーザに対して前記文書の削除確認の通知を行うか否かの区分を設定し、文書の保存最終日付が過ぎたとき、前記削除確認の通知が設定されていれば、前記ユーザに対して前記文書の削除確認通知を送信し、前記削除確認の通知が設定されていなければ、前記文書を自動的に削除するので、文書に応じた削除方法を選択することができ、勝手に文書が削除されてしまうこともなく、確認の手間を減らして無駄に文書がたまることも防止することができる。
【0119】
また、本発明によれば、前記文書削除確認の通知に対して、前記文書の保存期間延長指示を受信したとき、前記文書の保存最終日付を再設定するので、保存期限が来てしまっても、期間を延長することができ、必要な情報は削除されずに、そのまま保存しておくことができる。
【0120】
さらに、本発明によれば、前記文書内の事象の日付と、文書保存時の日付と、にしたがって前記事象の発生を通知する情報通知日付を設定し、情報通知日付になったら前記事象の発生通知を行うので、文書の内容および保存した日付に適した日付で、前記事象の発生が通知され、知りたいときに知りたい情報を得ることができる。
【図面の簡単な説明】
【図1】本発明に係る文書管理システムを実現するシステム構成図である。
【図2】パソコン本体の構成を示すブロック図である。
【図3】文書管理システムを示す原理構成図である。
【図4】文書情報の保存処理を示すフローチャートである。
【図5】分類テーブルのデータ構造図である。
【図6】記事切り抜き指定の画面例である。
【図7】保存記事切り抜き処理を示すフローチャートである。
【図8】記事領域を指定して切り抜いた切り抜き記事例を示す図である。
【図9】記事データDB生成処理を示すフローチャートである。
【図10】記事データDBのデータ構造図である。
【図11】文書データDB生成処理を示すフローチャートである。
【図12】文書データ登録画面例である。
【図13】タイトル文の生成処理を示すフローチャートである。
【図14】ビットマップデータから文字を検出する文字検出方法を示すフローチャートである。
【図15】文字情報テーブルのデータ構造図である。
【図16】記事領域からのタイトル文候補の生成処理を示すフローチャートである。
【図17】文書データDBのデータ構造図である。
【図18】記事領域以外からのタイトル文候補の生成処理を示すフローチャートである。
【図19】イベント期間の算出処理を示すフローチャートである。
【図20】イベント開始日付算出処理を示すフローチャートである。
【図21】日付構文辞書のデータ構造図である。
【図22】開始/終了日付算出テーブルのデータ構造図である。
【図23】開始/終了日付算出テーブルのデータ構造図である。
【図24】イベント終了日付算出処理を示すフローチャートである。
【図25】イベント通知時期の算出処理を示すフローチャートである。
【図26】保存期間の算出処理を示すフローチャートである。
【図27】記事一覧の表示画面例である。
【図28】記事詳細の画面例である。
【図29】記事通知および記事削除確認通知処理を示すフローチャートである。
【図30】記事通知および記事削除確認通知処理を示すフローチャートである。
【図31】記事通知メール例である。
【図32】記事通知の詳細画面例である。
【図33】削除確認を行う期限超過記事表示例である。
【図34】従来のデータ分類管理システムを示すブロック図である。
【符号の説明】
100 サーバマシン
101 クライアントマシン
102 文書登録画面
103 ログインユーザ情報
104 デフォルト分類表
105 デフォルト文書分類
106 文書分類基準表
107 文書分類基準情報
108 文書分類マトリックス出力部
109 文書分類マトリックス表示選択画面
110 文書分類設定部
111 文書属性情報
112 文書属性登録部
113 文書属性表
114 メール通知部
115 有効期限切れ文書情報
116 文書管理担当者表
200 文書管理システム
210 パソコン本体
211 CPU
212 RAM
213 ROM
214 HDD
215 CD−ROMドライブ
216 FLDドライブ
217 I−Oインタフェース
218 モデム
219 バス
220 キーボード
240 ディスプレイ
250 スキャナ
311 記事取り込み部
312 記事切り抜き部
313 記事データ生成部
314 文書データ生成部
315 記事表示部
316 記事通知部
317 記事削除部
341 記事データDB
342 文書データDB
343 文字情報テーブル
351 分類テーブル
352 日付構文辞書
353 開始\終了日付算出テーブル
354 標準パターン文字辞書
355 構文辞書
356 単語辞書
400 公衆回線
500 外部サーバ
610 フロッピー(登録商標)ディスク
620 CD−ROM
700 ユーザ端末

Claims (3)

  1. 分類別に保存期間を設けた分類別保存期間情報を準備する準備ステップと、
    ユーザが保存する文書情報を取り込む文書情報取り込みステップと、
    前記文書情報の分類を入力する文書分類入力ステップと、
    前記文書情報を形態素分析して、文書の内容を解析する文書解析ステップと、
    前記解析された文書データに基づいて、前記文書内に出現する事象の終了日付を抽出し、特定する終了日付特定ステップと、
    前記分類と前記終了日付とに基づいて、前記分類別保存期間情報にしたがった前記文書情報の保存最終日付を設定する保存期日設定ステップと、
    前記文書情報とともに、前記保存最終日付を記憶する文書情報記憶ステップと、
    を備えたことを特徴とする文書管理方法。
  2. 請求項1に記載の文書管理方法において、
    前記終了日付特定ステップが、前記文書情報から複数の終了日付候補を抽出したとき、前記終了候補日付の中で最も遅い日付の終了候補日付を前記終了日付として特定することを特徴とする文書管理方法。
  3. 請求項1または請求項2に記載の文書管理方法において、
    前記文書の保存期限を過ぎたとき、ユーザに対して前記文書の削除確認の通知を行うか否かの区分を設定する削除通知区分設定ステップと、
    前記削除確認の通知が設定されている文書の保存最終日付が過ぎたとき、前記ユーザに対して前記文書の削除確認通知を送信する削除確認通知送信ステップと、
    前記削除確認の通知が設定されていない文書の保存最終日付が過ぎたとき、前記文書を削除する期限切れ文書削除ステップと、
    を備えたことを特徴とする文書管理方法。
JP2003090915A 2003-03-28 2003-03-28 文書管理方法 Withdrawn JP2004295836A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003090915A JP2004295836A (ja) 2003-03-28 2003-03-28 文書管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003090915A JP2004295836A (ja) 2003-03-28 2003-03-28 文書管理方法

Publications (1)

Publication Number Publication Date
JP2004295836A true JP2004295836A (ja) 2004-10-21

Family

ID=33404415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003090915A Withdrawn JP2004295836A (ja) 2003-03-28 2003-03-28 文書管理方法

Country Status (1)

Country Link
JP (1) JP2004295836A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007140784A (ja) * 2005-11-16 2007-06-07 Nihon Daily Tsushinsha:Kk 広告データ収集システム、広告データ収集方法、及びプログラム
JP2010079842A (ja) * 2008-09-29 2010-04-08 Hitachi Software Eng Co Ltd 電子新聞保存管理システム及び新聞記事データ管理方法
KR101097815B1 (ko) 2007-02-21 2011-12-23 후지제롯쿠스 가부시끼가이샤 전자 문서의 보존의 제어를 위한 프로그램을 기억한 컴퓨터판독 가능한 매체, 문서 관리 시스템, 및 방법
JP2012098922A (ja) * 2010-11-02 2012-05-24 Hidehiko Kobayashi 電子記録管理システム
JP2012164284A (ja) * 2011-02-09 2012-08-30 Fuji Xerox Co Ltd 情報処理プログラム、及び情報処理装置
JP2019053632A (ja) * 2017-09-19 2019-04-04 シャープ株式会社 ファイル管理装置、複合機及び情報処理装置、ファイル管理方法並びにファイル管理用プログラム
JP2021103592A (ja) * 2016-10-26 2021-07-15 株式会社野村総合研究所 文書管理装置および文書管理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007140784A (ja) * 2005-11-16 2007-06-07 Nihon Daily Tsushinsha:Kk 広告データ収集システム、広告データ収集方法、及びプログラム
KR101097815B1 (ko) 2007-02-21 2011-12-23 후지제롯쿠스 가부시끼가이샤 전자 문서의 보존의 제어를 위한 프로그램을 기억한 컴퓨터판독 가능한 매체, 문서 관리 시스템, 및 방법
JP2010079842A (ja) * 2008-09-29 2010-04-08 Hitachi Software Eng Co Ltd 電子新聞保存管理システム及び新聞記事データ管理方法
JP2012098922A (ja) * 2010-11-02 2012-05-24 Hidehiko Kobayashi 電子記録管理システム
JP2012164284A (ja) * 2011-02-09 2012-08-30 Fuji Xerox Co Ltd 情報処理プログラム、及び情報処理装置
JP2021103592A (ja) * 2016-10-26 2021-07-15 株式会社野村総合研究所 文書管理装置および文書管理方法
JP2019053632A (ja) * 2017-09-19 2019-04-04 シャープ株式会社 ファイル管理装置、複合機及び情報処理装置、ファイル管理方法並びにファイル管理用プログラム

Similar Documents

Publication Publication Date Title
CN101178725B (zh) 用于信息检索的设备和方法
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
JP2007316965A (ja) 複合機、及び該複合機を複数備えた情報取得システム
JP2011022705A (ja) 証跡管理方法、システム、及びプログラム
JP2004086851A (ja) 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体
JP5294002B2 (ja) 文書管理システム、文書管理プログラム及び文書管理方法
CN111695014A (zh) 基于ai自动生成稿件的方法、系统、装置和存储介质
US20060167899A1 (en) Meta-data generating apparatus
JP2004295836A (ja) 文書管理方法
JP2012038207A (ja) データ検索装置及びその制御方法、コンピュータプログラム
CN101127068A (zh) 信息处理系统、信息处理器、信息处理方法和记录介质
JP2008158589A (ja) 更新情報通知装置及び更新情報通知プログラム
JP2008226110A (ja) 情報処理装置、情報処理方法および制御プログラム
JP7390071B2 (ja) 書類処理装置、書類処理方法、およびプログラム
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP2006155439A (ja) 文書管理装置及びその方法
JP5055202B2 (ja) キーワード比較システム、キーワード比較方法およびキーワード比較プログラム
JP2008234403A (ja) データ検索方法、プログラム及び装置
JP2006085234A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
KR20110024874A (ko) 웹 컨텐츠 스크랩 시스템 및 그 방법
JP2009026075A (ja) 画像処理装置
WO2003073360A1 (en) 2-dimensional bar code print method with summary information
JP2010273088A (ja) 紙文書来歴管理システム
JP2003316773A (ja) 文書管理システム、方法、プログラム及び記憶媒体
JP5963269B2 (ja) 情報処理装置、情報処理システム、ログ管理方法、及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060606