JPH11238072A - 文書保管装置 - Google Patents

文書保管装置

Info

Publication number
JPH11238072A
JPH11238072A JP10039974A JP3997498A JPH11238072A JP H11238072 A JPH11238072 A JP H11238072A JP 10039974 A JP10039974 A JP 10039974A JP 3997498 A JP3997498 A JP 3997498A JP H11238072 A JPH11238072 A JP H11238072A
Authority
JP
Japan
Prior art keywords
document
electronic document
storage
bibliographic
folder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10039974A
Other languages
English (en)
Inventor
Takashi Katooka
隆 加登岡
Tooru Mizuna
水納  亨
Tomoyuki Tanaka
智之 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10039974A priority Critical patent/JPH11238072A/ja
Publication of JPH11238072A publication Critical patent/JPH11238072A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 紙文書から電子文書を生成して保管する作業
の利便性の向上を図ること。 【解決手段】 紙文書を光学的に読み取ることによって
生成した文書画像を入力して文字認識処理を実行し、電
子文書を生成するOCR部203と、OCR部203で
生成した電子文書に基づいて、書誌事項を生成する書誌
事項抽出部204と、電子文書を分類して保管するため
の複数の分類条件および書誌事項抽出部204で生成し
た書誌事項に基づいて、複数の保管先候補の中から電子
文書の保管先を決定し、決定した保管先に電子文書を保
管する保管処理部205と、を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙文書を光学的に
読み取って生成した文書画像について文字認識処理を実
行することによって生成された電子文書を保管する文書
保管装置に関し、より詳細には、紙文書を光学的に読み
取ることによって得た文書画像から電子文書を生成する
際に、生成した電子文書の書誌事項を生成すると共に、
生成した書誌事項に基づいて電子文書の保管先を自動的
に決定することができるようにした文書保管装置に関す
る。
【0002】
【従来の技術】パーソナルコンピュータやネットワーク
の急速な普及は、オフィスにおける文書の電子化を促進
することとなった。ところが、紙は閲覧性が良い等の利
便性があるため、紙文書の生産は未だ止むことがなく、
紙の形で保存・流通されている文書は未だ多量に存在し
ていることが現状であり、このギャップがオフィスワー
クにおける生産効率の低下の一因となっている。
【0003】つまり、文書の作成,流通,閲覧,管理,
再利用といった一連の流れにおいて、文書は紙に記録さ
れた形とコンピュータ上のデータという形で存在してお
り、このように文書が紙に記録された形とコンピュータ
上のデータという形で存在しているのは、相互の変換コ
ストが高いということが原因となっている。
【0004】上記問題を解決する手段の一つとして、O
CR(Optical Character Read
er)を挙げることができる。このOCRを用いること
により、紙文書をスキャナ等で読み取って文書画像を生
成した後、文書画像中の文字列を文字コードに変換する
ことができる。すなわち、紙文書を光学的に読み取って
文書画像を生成し、生成した文書画像についてOCR処
理を行うことにより、一般的なワードプロセッサ等で編
集可能な電子文書を生成することができる。そして、O
CR処理を行うことによって生成された電子文書は、再
利用を図るため、ユーザによって指定された保管先に分
類されて保管されることになる。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の技術によれば、紙文書から電子文書を生成すること
ができるものの、生成した電子文書を分類して保管する
にはユーザ自身が保管先を指定しなければならないた
め、生成した電子文書を機械的に保管していくことがで
きず、利便性に欠けるという問題点があった。換言すれ
ば、上記従来の技術においては、電子文書の内容を把握
していなければ電子文書を後に利用し易いように分類し
て保管することができないため、大量に存在する紙文書
を電子化する際に不便であった。
【0006】また、上記従来の技術においては、保管し
た電子文書の検索処理の容易化を図るために書誌事項を
生成するような場合に、紙文書から電子文書を生成して
保管するという処理とは独立した別個の処理を行わなけ
ればならないため、手間がかかり不便であるという問題
点があった。
【0007】本発明は上記に鑑みてなされたものであっ
て、紙文書を光学的に読み取ることによって得た文書画
像から電子文書を生成する際に、生成した電子文書の書
誌事項を生成すると共に、生成した書誌事項に基づいて
電子文書の保管先を自動的に決定することができるよう
にすることにより、紙文書から電子文書を生成して保管
する作業の利便性の向上を図ることを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の文書保管装置は、紙文書を光学的に読み
取ることによって生成した文書画像を入力して文字認識
処理を実行し、電子文書を生成する文字認識手段と、前
記文字認識手段で生成した電子文書に基づいて、前記電
子文書の書誌事項を生成する書誌事項生成手段と、前記
電子文書を分類して保管するための分類条件を複数有
し、前記分類条件および前記書誌事項生成手段で生成し
た書誌事項に基づいて、複数の保管先候補の中から前記
電子文書の保管先を決定し、決定した保管先に前記電子
文書を保管する文書保管手段と、を備えたものである。
【0009】また、請求項2の文書保管装置は、請求項
1に記載の文書保管装置において、さらに、前記文書保
管手段で決定された保管先に前記電子文書が保管される
前に、前記保管先候補をフォルダとして画面表示すると
共に、前記文書保管手段で決定された保管先に該当する
フォルダを他のフォルダと識別できるようして画面表示
するフォルダ表示手段と、前記フォルダ表示手段で表示
されたフォルダの中から所望のフォルダを指定し、前記
電子文書の保管先を変更するための保管先変更手段と、
を備え、前記文書保管手段が、前記電子文書の保管が指
示されると、前記分類条件および書誌事項に基づいて決
定した保管先または前記保管先変更手段で変更された保
管先に前記電子文書を保管するものである。
【0010】また、請求項3の文書保管装置は、請求項
1または2に記載の文書保管装置において、さらに、前
記文書保管手段で決定された保管先に前記電子文書が保
管される前に、前記書誌事項生成手段で生成された書誌
事項を画面表示する書誌事項表示手段と、前記書誌事項
表示手段で画面表示された書誌事項を編集するための書
誌事項編集手段と、を備え、前記文書保管手段が、前記
書誌事項編集手段で書誌事項が編集された場合に、編集
された書誌事項に基づいて、前記電子文書の保管先を決
定するものである。
【0011】さらに、請求項4の文書保管装置は、請求
項1〜3のいずれか一つに記載の文書保管装置におい
て、前記書誌事項生成手段が、文書名,キーワード,お
よび前記紙文書中に絵・写真・グラフ等の画像が存在す
る場合には前記画像のキャプションまたは/および画像
に関連するテキストを含む画像関連テキストを前記書誌
事項として前記電子文書から抽出するものである。
【0012】
【発明の実施の形態】以下、本発明に係る文書保管装置
の実施の形態について、添付の図面を参照しつつ詳細に
説明する。
【0013】図1は、本実施の形態に係る文書保管装置
のハードウエア構成を示すブロック図である。本実施の
形態に係る文書保管装置はコンピュータによって実現さ
れ、図1に示すように、装置全体を制御するCPU10
1と、ブートプログラム等を記憶したROM102と、
CPU101のワークエリアとして使用されるRAM1
03と、文字,数値,各種命令等の入力を行うためのキ
ーボード104およびマウス105と、CPU101に
よる処理の結果を表示するためのCRTや液晶ディスプ
レイ等の表示装置106と、コンピュータを本実施の形
態に係る文書保管装置として機能させるアプリケーショ
ン・プログラムを記憶すると共に、後述するようにして
生成した電子文書を保管するハードディスク107(本
発明の文書保管手段に該当する)と、紙文書を光学的に
読み取って文書画像を生成するスキャナ108と、上記
各部を接続するバス109と、を備えている。
【0014】なお、図1に示した文書保管装置のハード
ウエア構成は、スタンドアローンのコンピュータで文書
保管装置を実現することを前提としたものであるが、図
1に示した構成に代えて、ネットワークに接続された複
数のコンピュータやスキャナ等からなるシステムで本実
施の形態に係る文書保管装置を構成することにしても良
い。また、図1には、紙文書を光学的に読み取る手段と
してスキャナ108が設けられているが、スキャナ10
8に代えまたは加えて、ファクシミリ装置(図示せず)
から送信された文書を受信するためのファックスモデム
を設けることにしても良い。さらに、図1においては、
後述するようにして生成した電子文書を保管するための
記憶媒体としてハードディスク107を用いることにし
ているが、ハードディスク107以外のフロッピーディ
スク,MO等,いかなる種類の記憶媒体を用いることに
しても良い。
【0015】図2は、図1に示したようなハードウエア
構成において、ハードディスク107に記憶されたアプ
リケーション・プログラムを実行することによって実現
される本実施の形態に係る文書保管装置の概念構成図で
ある。図2に示すように、本実施の形態に係る文書保管
装置は、スキャナ108で紙文書を光学的に読み取って
生成された文書画像を入力し、入力した文書画像から孤
立点ノイズを除去すると共に、文書画像の傾きを補正す
る前処理部201と、前処理部201から文書画像を入
力し、入力した文書画像から文字列を含む文字領域およ
び/または図,表,写真等の画像を含む画像領域を分割
する処理等を行う領域分割処理部202と、文書画像の
文字領域について文字認識処理を実行し、電子文書を生
成するOCR部203(本発明の文字認識手段に該当す
る)と、OCR部203で生成した電子文書に基づい
て、電子文書の書誌事項を生成する書誌事項抽出部20
4(本発明の書誌事項生成手段に該当する)と、電子文
書を分類するための分類条件(詳細は後述する)および
書誌事項抽出部204で生成した書誌事項に基づいて、
ハードディスク107中に用意された複数の保管先候補
の中から電子文書の保管先を決定し、決定した保管先に
電子文書を保管する処理を制御する保管処理部205
(本発明の文書保管手段に該当する)と、を有してい
る。
【0016】保管処理部205は、さらに、電子文書の
保管先候補をフォルダとして画面表示すると共に、決定
された保管先に該当するフォルダを他のフォルダと識別
できるようにして画面表示し、かつ、書誌事項抽出部2
04で生成された書誌事項を画面表示する表示処理部2
06(本発明のフォルダ表示手段および書誌事項表示手
段に該当する)と、表示処理部206で画面表示された
書誌事項を編集するための編集処理部207(本発明の
書誌事項編集手段に該当する)と、表示された保管先候
補であるフォルダの中から所望のフォルダを指定し、電
子文書の保管先を変更するための保管先指定部208
(本発明の保管先変更手段に該当する)と、を有してい
る。
【0017】つぎに、上述した構成の文書保管装置によ
る電子文書の保管処理について、 (1)処理の概要 (2)分類条件の設定 (3)文書保管装置による処理の具体例 の順で詳細に説明する。
【0018】(1)処理の概要 本実施の形態に係る文書保管装置は、電子文書を分類し
て保管するための分類条件を有した複数のフォルダをハ
ードディスク107(記憶媒体)に用意しておき、紙文
書を光学的に読み取ることによって生成した文書画像を
入力し、入力した文書画像について文字認識処理を実行
して電子文書を生成し、生成した電子文書に基づいて電
子文書の書誌事項を生成し、分類条件および書誌事項に
基づいて複数のフォルダの中から電子文書の保管先のフ
ォルダを決定し、決定した保管先のフォルダに電子文書
を保管するというものである。
【0019】(2)分類条件の設定 「(1)処理の概要」で説明したように、本実施の形態
に係る文書保管装置は、紙文書から生成した電子文書の
保管先となるハードディスク107のフォルダを自動的
に決定することができるようにするため、ハードディス
ク107に電子文書を分類して保管するための分類条件
を有した複数のフォルダを生成しておく必要がある。
【0020】図3は、ハードディスク107内に生成さ
れた分類条件を有するフォルダを説明するための説明図
である。図3に示すように、ハードディスク107は、
複数のフォルダで区分されていると共に、各フォルダに
は電子文書を分類して保管するための条件となる分類条
件が付加情報として付加されている。例えば、フォルダ
「コンピュータ」には、分類条件「コンピュータ,デス
クトップ,ノート,タワー」が付加されている。その結
果、文字認識処理によって生成された電子文書の書誌情
報を生成した後、生成した書誌情報がマッチする分類条
件を有するフォルダを特定することにより、電子文書を
保管すべきフォルダを決定することができる。この処理
の詳細については、「(3)文書保管装置による処理の
具体例」で説明することにする。
【0021】したがって、ユーザは、ハードディスク1
07内のフォルダに図3に示すような分類条件を設定す
る処理を予め行うことになる。また、ユーザは必要に応
じて分類条件を追加・削除・変更することができる。
【0022】なお、図3においては、分類条件をフォル
ダの付加情報であると説明したが、フォルダ名そのもの
を分類条件とすることにしても良い。
【0023】(3)文書保管装置による処理の具体例 図4は、紙文書の読み取りから電子文書の保管までの処
理を示すフローチャートである。以下では、図1,図2
および図4を参照しつつ、本実施の形態に係る文書保管
装置による紙文書の読み取りから電子文書の保管までの
処理について具体的に説明する。
【0024】スキャナ108は、ユーザの指示がある
と、読み取り対象である紙文書を読み取って文書画像を
生成し、次の前処理部201に文書画像を入力する処理
を行う(S401)。
【0025】続いて、前処理部201は、スキャナ10
8から文書画像を入力し、入力した文書画像から孤立点
ノイズを除去し(S402)、さらに、入力した文書画
像が傾いているような場合には文書画像の傾きを補正す
る処理を行う(S403)。なお、スキャナ108がカ
ラースキャナで、入力した文書画像がフルカラーである
場合、領域分割処理部202で行われる領域分割処理等
を容易に、かつ高速に行うことができるようにするた
め、フルカラーの文書画像を2値化する2値化処理が行
われる。
【0026】領域分割処理部202は、前処理部201
から文書画像を入力し、入力した文書画像から文字列を
含む文字領域および/または図,表,写真等の画像を含
む画像領域を分割する処理を行う(S404)。分割し
た各領域には、文字領域か、画像領域か、画像領域の場
合にはさらに図,表,写真か等の領域の種類および領域
の位置が属性情報として付与される。
【0027】ステップS404で領域分割処理を行った
後、領域分割処理部202は、さらに、文書画像がいか
なる段組種類、例えば、シングルコラム,マルチコラ
ム,フリーコラムのいずれで構成されているかを識別す
る処理およびセンタリング領域の検知処理等のレイアウ
ト情報を抽出する処理を行う(S405)。
【0028】具体的には、文字領域同士の間の距離(空
白部分)および罫線を検出し、検出した距離および罫線
の本数と共に、領域分割処理で分割した文字領域の位置
に関する属性情報に基づいて、段組種類の判定を行う。
【0029】そして、領域分割処理部202は、分割し
た各領域の属性情報に基づいて、表を含む領域が存在す
るか否かを判定する(S406)。表が含まれていない
場合には、ステップS408に進む。なお、表を含む領
域が存在するか否かを判定する処理については、特開平
2−252078号公報『文書の領域識別方法』に開示
されている方法を用いることができる。
【0030】一方、表が含まれている場合、領域分割処
理部202は、表の枠と罫線の構造を抽出すると共に、
枠内の文字領域を抽出する表処理を行う(S407)。
このように、表の中から文字領域を抽出することによ
り、次のOCR部203において、表中の文字認識処理
を行うことができる。
【0031】なお、領域分割処理部202は、ステップ
S404で分割した文字領域について、文字組方向を検
出する処理についても行うものとする。この文字組方向
を検出する処理としては、特開平4−309192号公
報『領域属性識別装置』等に開示されている処理を用い
ることができる。
【0032】そして、OCR部203は、領域分割処理
部205で分割した文字領域の文字列について文字認識
処理を行う(S408)。すなわち、OCR部203
は、文字領域について、行切り出しおよび文字切り出し
処理を行い、文字切り出した個々の文字パターンについ
て文字認識処理を行う。その結果、紙文書から電子文書
が生成される。加えて、OCR部203は、文字認識結
果に対して、言語処理による誤り補正を行う。
【0033】続いて、書誌事項抽出部204は、上記各
部による処理の結果に基づいて、文書画像のレイアウト
を解析する(S409)。ステップS409で行われる
レイアウトの解析処理には、例えば、フォント特徴の識
別処理,およびタイトル・キャプション等の検出処理が
含まれる。
【0034】フォント特徴の識別処理は、領域分割処理
部202で分割した文字領域の文字列について、行単位
でフォントが強調系(中ゴシック等)や非強調系(細明
朝等)のいずれであるかを識別する処理のことである。
具体的には、例えば、黒画素密度やランレングスの分布
等に基づいて、フォントの特徴を識別する。
【0035】タイトルは一般的に本文の文字とはサイズ
や行ピッチが異なり、また、存在する位置も本文とは若
干離れていることから、領域分割処理部202で付与し
た領域の位置に関する属性情報や上述したフォント特徴
の識別結果を用いてタイトルを検出することができる。
検出したタイトルは、後に書誌事項として使用される。
【0036】なお、タイトルとして採用可能な候補が複
数存在するような場合には、例えば、OCR部203の
文字認識結果を用いて電子文書中における各候補の出現
頻度等を求めることによって複数の候補に順位付けを行
い、最も順位の高い候補をタイトルとして採用すること
が可能である。
【0037】キャプションは、図,表,写真等の画像に
付与されたものであり、例えば、画像の近傍に存在する
「図8:コンピュータの構成を示すブロック図」のよう
な画像の内容を説明するものである。キャプションは、
画像領域の近傍に存在し、本文とは離れた位置に存在す
ること、加えて、「図8」等の図や表等を指し示す語が
含まれていることから、これらの条件を満たす行をキャ
プションと判定する。キャプションとして判定された行
は、後に書誌事項として用いられる。
【0038】また、書誌事項抽出部204は、文書の論
理的な構造を解析する(S410)。具体的には、図,
表,写真等の画像に付与されたキャプション中の「図
8」等の語と同一の語を本文中から見つけ出すことによ
り、画像に関連するテキストを特定する。このテキスト
は、後に書誌事項として用いられる。
【0039】なお、以下において、ステップS409の
キャプションおよびステップS410の画像に関連する
テキストのことを画像関連テキストと記述することにす
る。
【0040】続いて、書誌事項抽出部204は、OCR
部204による文字認識処理によって生成された電子文
書からキーワードを抽出する処理を行う(S411)。
ステップS411におけるキーワード抽出処理は、電子
文書から単語を抽出し、抽出した単語について電子文書
中の出現頻度等を求め、求めた出現頻度等を電子文書に
おけるその単語の重要度として用いることにより、抽出
した単語に順位付けを行う。そして、順位の高い順で予
め設定された数の単語をキーワードとして採用する。な
お、このキーワード抽出処理については、特開平8−9
5982号公報『キーワード抽出装置』等に開示されて
いる。
【0041】その後、書誌事項抽出部204は、ステッ
プS409,ステップS410およびステップS411
で得たタイトル・キーワード・画像関連テキストを電子
文書の書誌事項として生成する処理を行う(S41
2)。
【0042】なお、ステップS409においてタイトル
を紙文書のレイアウトに基づいて特定することにした
が、これに代え、電子文書中の最も重要度が高い単語を
タイトルとして採用することにしても良い。
【0043】ステップS412において書誌事項が設定
されると、保管処理部205は、書誌事項抽出部204
から電子文書および書誌事項を入力し、入力した書誌事
項に基づいて、電子文書を保管する保管先フォルダを決
定する処理を行う(S413)。
【0044】具体的に、保管処理部205は、図3を用
いて説明したような分類条件を含むハードディスク10
7中のフォルダ情報を入力しておき、ステップS412
で設定された書誌情報がいずれの分類条件にマッチする
かを判定することにより、電子文書の保管先となるフォ
ルダを決定する。書誌情報がいずれの分類条件にマッチ
するかを判定するには、一般的な検索処理で用いられて
いる方法を使用することができる。
【0045】なお、該当する分類条件が存在しない場合
には、予め設定しておいたフォルダを保管先にとして決
定することにしても良い。また、該当する分類条件が複
数存在する場合は、それらの分類条件に該当する複数の
フォルダを保管先として決定することにしても良い。さ
らに、分類条件とのマッチングを判定するために、タイ
トル・キーワード・画像関連テキストの全てを用いるの
ではなく、例えばキーワードのみを分類条件とのマッチ
ングを判定するために用いることにしても良い。
【0046】ステップS413で保管先のフォルダを決
定した後、保管処理部205の表示処理部206は、電
子文書の本文・書誌事項・フォルダを表示装置206に
画面表示する処理を行う(S414)。
【0047】図5は、電子文書の本文,生成した書誌事
項およびハードディスク107内のフォルダを画面表示
した様子の一例を示す説明図である。図5に示すよう
に、表示画面501は、電子文書の内容(OCR部20
3による文字認識結果)を表示する本文表示部502
と、書誌事項を表示する書誌事項表示部503と、ハー
ドディスク107内のフォルダを表示するフォルダ表示
部507とを有している。
【0048】書誌事項表示部503は、文書名を表示す
る文書名表示欄504を有し、文書名表示欄には文書名
としてステップS409で得たタイトルが表示される。
また、書誌事項表示部503は、ステップS411で得
たキーワードを表示するキーワード表示欄505および
ユーザが任意のコメントを入力するためのコメント欄5
06を有している。なお、図5においては、画像関連テ
キストを表示するための表示欄は省略されている。
【0049】また、フォルダ表示部507は、ハードデ
ィスク107内のフォルダ構造がわかるように複数のフ
ォルダをツリー構造で表示すると共に、ステップS41
3で決定された電子文書の保管先となるフォルダを例え
ばハイライト表示することにより他のフォルダと識別す
ることができるように表示する。
【0050】ユーザは、表示画面501の表示内容を参
照し、書誌事項を編集したり、電子文書の保管先を変更
する処理を行うことができる。書誌事項の編集処理は保
管処理部205の編集処理部207によって制御され、
電子文書の保管先の変更処理は保管先指定部208によ
って制御される。
【0051】書誌事項を変更する場合には、各欄に直接
文字列を入力することによって、現在の表示内容を変更
することができる。また、書誌事項を変更するための他
の方法として、表示画面501は、本文表示部502に
表示された本文の該当する文字列をマウス105で範囲
指定し、該当する欄のボタン508をクリックすること
により、現在の表示内容をマウス105で範囲指定した
文字列に入れ替えることができるように構成されてい
る。
【0052】なお、文書名表示欄504のように、ある
内容の書誌事項を表示する欄が一つしか存在しない場合
には、複数の候補の中から最も順位の高い候補が表示さ
れることになる。そのため、表示画面501は、該当す
る欄に用意されたボタン509をマウス105でクリッ
クすると他の候補がリスト表示されるように構成されて
いると共に、リスト表示された候補の中から文書名とし
てふさわしい候補を選択することにより、該当する欄に
新たな書誌事項が表示されるように構成されている。
【0053】このように本実施の形態に係る文書保管装
置は、生成した書誌事項を容易に容易に編集できるよう
に構成されている。また、書誌事項が変更された場合、
保管処理部205は、変更された書誌事項と分類条件と
のマッチングを判定し、必要に応じて保管先のフォルダ
を変更する処理を行う。保管先のフォルダが変更された
場合は、その結果がフォルダ表示部507に表示され
る。
【0054】さらに、電子文書の保管先をユーザ側で変
更するには、マウス105でフォルダ表示部507に表
示された任意のフォルダを指定する。ここで、保管先指
定部208は、ユーザによって保管先のフォルダが変更
された場合、該当する電子文書の書誌事項を変更後のフ
ォルダの分類情報に追加する処理を行うことにしても良
い。この処理を行うことによって、同様な内容の文書を
処理する場合に、変更後のフォルダが保管先として自動
的に決定されることになる。
【0055】再び図4の説明に戻る。保管処理部205
は、ユーザから電子文書の保管が指示されると、ステッ
プS413で決定したフォルダまたはユーザによって指
定されたフォルダに電子文書を保管する処理を行う(S
415)。この際、書誌事項は電子文書と共に保管さ
れ、電子文書を検索する際の検索対象として用いられ
る。
【0056】なお、図4に示したフローチャートにおい
ては、ステップS414でユーザがフォルダを変更する
ことを可能としているが、このステップS414の処理
を省略し、ステップS414で決定した保管先のフォル
ダにそのまま電子文書を保管することにしても良い。
【0057】また、スキャナ108で紙文書から生成し
た文書画像についても、例えばハードディスク107の
所定のフォルダに保管しておくことができる。この場
合、書誌事項として設定した画像関連テキストを文書画
像中の該当する画像に関連づけしておくことにより、書
誌事項中の画像関連テキストを検索することによって文
書画像中の該当する画像を検索することができるように
なる。
【0058】このように、実施の形態1の文書保管装置
によれば、紙文書を光学的に読み取ることによって得た
文書画像から電子文書を生成する際に、生成した電子文
書の書誌事項を生成すると共に、生成した書誌事項に基
づいて電子文書の保管先を自動的に決定することができ
るようにすることにより、紙文書から電子文書を生成し
て保管する作業の利便性の向上を図ることができる。
【0059】以上説明した本実施の形態に係る文書保管
装置は、図4に示したフローチャートの手順に従って、
予め用意されたプログラムを図1に示したコンピュータ
で実行することによって実現される。このプログラム
は、ハードディスク,フロッピーディスク,CD−RO
M,MO,DVD等のコンピュータで読み取り可能な記
録媒体に記録され、コンピュータによって記録媒体から
読み出されることによって実行される。また、このプロ
グラムは、上記記録媒体を介して、またはネットワーク
を介して配布することができる。
【0060】
【発明の効果】以上説明したように、本発明の文書保管
装置(請求項1)によれば、紙文書を光学的に読み取る
ことによって生成した文書画像を入力して文字認識処理
を実行し、電子文書を生成する文字認識手段と、文字認
識手段で生成した電子文書に基づいて、電子文書の書誌
事項を生成する書誌事項生成手段と、電子文書を分類し
て保管するための分類条件を複数有し、分類条件および
書誌事項生成手段で生成した書誌事項に基づいて、複数
の保管先候補の中から電子文書の保管先を決定し、決定
した保管先に電子文書を保管する文書保管手段と、を備
えたことにより、紙文書を光学的に読み取ることによっ
て得た文書画像から電子文書を生成する際に、生成した
電子文書の書誌事項を生成すると共に、生成した書誌事
項に基づいて電子文書の保管先を自動的に決定すること
ができるため、紙文書から電子文書を生成して保管する
作業の利便性の向上を図ることができる。
【0061】また、本発明の文書保管装置(請求項2)
によれば、請求項1に記載の文書保管装置において、さ
らに、文書保管手段で決定された保管先に電子文書が保
管される前に、保管先候補をフォルダとして画面表示す
ると共に、文書保管手段で決定された保管先に該当する
フォルダを他のフォルダと識別できるようして画面表示
するフォルダ表示手段と、フォルダ表示手段で表示され
たフォルダの中から所望のフォルダを指定し、電子文書
の保管先を変更するための保管先変更手段と、を備え、
文書保管手段が、電子文書の保管が指示されると、分類
条件および書誌事項に基づいて決定した保管先または保
管先変更手段で変更された保管先に電子文書を保管する
ことにより、ユーザが紙文書から生成された電子文書の
保管先を確認できると共に、必要に応じて保管先を変更
することができるため、正しい保管先に電子文書を保管
することができる。
【0062】また、本発明の文書保管装置(請求項3)
によれば、請求項1または2に記載の文書保管装置にお
いて、さらに、文書保管手段で決定された保管先に電子
文書が保管される前に、書誌事項生成手段で生成された
書誌事項を画面表示する書誌事項表示手段と、書誌事項
表示手段で画面表示された書誌事項を編集するための書
誌事項編集手段と、を備え、文書保管手段が、書誌事項
編集手段で書誌事項が編集された場合に、編集された書
誌事項に基づいて、電子文書の保管先を決定するため、
検索処理等に利用するための適切な書誌事項を生成して
おくことができると共に、適切な書誌事項に変更された
場合には、変更後の書誌事項に合致した適切な保管先に
電子文書を保管することができる。
【0063】さらに、本発明の文書保管装置(請求項
4)によれば、請求項1〜3のいずれか一つに記載の文
書保管装置において、書誌事項生成手段が、文書名,キ
ーワード,および紙文書中に絵・写真・グラフ等の画像
が存在する場合には画像のキャプションまたは/および
画像に関連するテキストを含む画像関連テキストを書誌
事項として電子文書から抽出することにより、電子文書
中の語を用いて書誌事項を生成することができるため、
適切な書誌事項を生成することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文書保管装置のハー
ドウエア構成を示すブロック図である。
【図2】本発明の実施の形態に係る文書保管装置の概念
構成図である。
【図3】本発明の実施の形態に係る文書保管装置におい
て、ハードディスク内に生成された分類条件を有するフ
ォルダを説明するための説明図である。
【図4】本発明の実施の形態に係る文書保管装置におい
て、紙文書の読み取りから電子文書の保管までの処理を
示すフローチャートである。
【図5】本発明の実施の形態に係る文書保管装置におい
て、電子文書の本文,生成した書誌事項およびハードデ
ィスク内のフォルダを画面表示した様子の一例を示す説
明図である。
【符号の説明】
101 CPU 102 ROM 103 RAM 104 キーボード 105 マウス 106 表示装置 107 ハードディスク 108 スキャナ 109 バス 201 前処理部 202 領域分割処理部 203 OCR部 204 書誌事項抽出部 205 保管処理部 206 表示処理部 207 編集処理部 208 保管先指定部 501 表示画面 502 本文表示部 503 書誌事項表示部 507 フォルダ表示部 504 文書名表示欄 505 キーワード表示欄 506 コメント欄 508,509 ボタン
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/401 310C 310D

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 紙文書を光学的に読み取ることによって
    生成した文書画像を入力して文字認識処理を実行し、電
    子文書を生成する文字認識手段と、 前記文字認識手段で生成した電子文書に基づいて、前記
    電子文書の書誌事項を生成する書誌事項生成手段と、 前記電子文書を分類して保管するための分類条件を複数
    有し、前記分類条件および前記書誌事項生成手段で生成
    した書誌事項に基づいて、複数の保管先候補の中から前
    記電子文書の保管先を決定し、決定した保管先に前記電
    子文書を保管する文書保管手段と、 を備えたことを特徴とする文書保管装置。
  2. 【請求項2】 さらに、前記文書保管手段で決定された
    保管先に前記電子文書が保管される前に、前記保管先候
    補をフォルダとして画面表示すると共に、前記文書保管
    手段で決定された保管先に該当するフォルダを他のフォ
    ルダと識別できるようして画面表示するフォルダ表示手
    段と、 前記フォルダ表示手段で表示されたフォルダの中から所
    望のフォルダを指定し、前記電子文書の保管先を変更す
    るための保管先変更手段と、を備え、 前記文書保管手段は、前記電子文書の保管が指示される
    と、前記分類条件および書誌事項に基づいて決定した保
    管先または前記保管先変更手段で変更された保管先に前
    記電子文書を保管することを特徴とする請求項1に記載
    の文書保管装置。
  3. 【請求項3】 さらに、前記文書保管手段で決定された
    保管先に前記電子文書が保管される前に、前記書誌事項
    生成手段で生成された書誌事項を画面表示する書誌事項
    表示手段と、 前記書誌事項表示手段で画面表示された書誌事項を編集
    するための書誌事項編集手段と、を備え、 前記文書保管手段は、前記書誌事項編集手段で書誌事項
    が編集された場合に、編集された書誌事項に基づいて、
    前記電子文書の保管先を決定することを特徴とする請求
    項1または2に記載の文書保管装置。
  4. 【請求項4】 前記書誌事項生成手段は、文書名,キー
    ワード,および前記紙文書中に絵・写真・グラフ等の画
    像が存在する場合には前記画像のキャプションまたは/
    および画像に関連するテキストを含む画像関連テキスト
    を前記書誌事項として前記電子文書から抽出することを
    特徴とする請求項1〜3のいずれか一つに記載の文書保
    管装置。
JP10039974A 1998-02-23 1998-02-23 文書保管装置 Pending JPH11238072A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10039974A JPH11238072A (ja) 1998-02-23 1998-02-23 文書保管装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10039974A JPH11238072A (ja) 1998-02-23 1998-02-23 文書保管装置

Publications (1)

Publication Number Publication Date
JPH11238072A true JPH11238072A (ja) 1999-08-31

Family

ID=12567936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10039974A Pending JPH11238072A (ja) 1998-02-23 1998-02-23 文書保管装置

Country Status (1)

Country Link
JP (1) JPH11238072A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229340A (ja) * 1999-12-16 2001-08-24 Xerox Corp 文書上の情報をスキャンしてフォーマット化するシステム
JP2006073012A (ja) * 2004-09-02 2006-03-16 Microsoft Corp 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法
JP2006172313A (ja) * 2004-12-17 2006-06-29 Fuji Electric Systems Co Ltd データチェック管理方法およびプログラム
DE102008049291A1 (de) 2008-02-27 2009-09-03 Pfu Ltd., Kahoku Sortierverfahren für eine Bilddatei, Sortiervorrichtung für eine Bilddatei und Computerprogrammprodukt
JP2010191611A (ja) * 2009-02-17 2010-09-02 Ricoh Co Ltd 画像処理装置、画像処理システム、画像処理方法、プログラム及び記憶媒体
JP2016146147A (ja) * 2015-02-09 2016-08-12 キヤノン株式会社 文書管理システム、文書登録装置、文書登録方法
JP2018173781A (ja) * 2017-03-31 2018-11-08 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2019095850A (ja) * 2017-11-17 2019-06-20 富士ゼロックス株式会社 文書処理装置およびプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229340A (ja) * 1999-12-16 2001-08-24 Xerox Corp 文書上の情報をスキャンしてフォーマット化するシステム
JP4509366B2 (ja) * 1999-12-16 2010-07-21 ゼロックス コーポレイション 文書上の情報をスキャンしてフォーマット化するシステム
JP2006073012A (ja) * 2004-09-02 2006-03-16 Microsoft Corp 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法
JP2006172313A (ja) * 2004-12-17 2006-06-29 Fuji Electric Systems Co Ltd データチェック管理方法およびプログラム
DE102008049291A1 (de) 2008-02-27 2009-09-03 Pfu Ltd., Kahoku Sortierverfahren für eine Bilddatei, Sortiervorrichtung für eine Bilddatei und Computerprogrammprodukt
JP2009205420A (ja) * 2008-02-27 2009-09-10 Pfu Ltd 画像ファイル振分方法、画像ファイル振分装置、および、プログラム
US8812521B2 (en) 2008-02-27 2014-08-19 Pfu Limited Image file sorting method, image file sorting device, and computer program product
JP2010191611A (ja) * 2009-02-17 2010-09-02 Ricoh Co Ltd 画像処理装置、画像処理システム、画像処理方法、プログラム及び記憶媒体
JP2016146147A (ja) * 2015-02-09 2016-08-12 キヤノン株式会社 文書管理システム、文書登録装置、文書登録方法
JP2018173781A (ja) * 2017-03-31 2018-11-08 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2019095850A (ja) * 2017-11-17 2019-06-20 富士ゼロックス株式会社 文書処理装置およびプログラム

Similar Documents

Publication Publication Date Title
JP4181892B2 (ja) 画像処理方法
US6768816B2 (en) Method and system for interactive ground-truthing of document images
US6353840B2 (en) User-defined search template for extracting information from documents
US7610274B2 (en) Method, apparatus, and program for retrieving data
US8532384B2 (en) Method of retrieving information from a digital image
US8482808B2 (en) Image processing apparatus and method for displaying a preview of scanned document data
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
JP4785655B2 (ja) 文書処理装置及び文書処理方法
US20060143154A1 (en) Document scanner
JP2001092852A (ja) 文書検索システム操作方法、検索キー生成方法、文書管理システム、文書照会システム、文書アーカイブ・システム操作方法、文書データベース閲覧方法及び記憶媒体
JP2011065621A (ja) 情報処理装置及び情報処理プログラム
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
US9049400B2 (en) Image processing apparatus, and image processing method and program
JPH11238072A (ja) 文書保管装置
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
JPH1166196A (ja) 文書画像認識装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4811133B2 (ja) 画像形成装置及び画像処理装置
JP2007310501A (ja) 情報処理装置、その制御方法、及びプログラム
CN112464907A (zh) 一种文档处理系统及方法
JP3537753B2 (ja) 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JPH0934903A (ja) ファイル検索装置
JP2005267057A (ja) テキストデータ抽出方法、検索用インデックス作成方法、電子ファイリングシステムおよびプログラム
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置