JP2005322080A - 文書管理装置および方法 - Google Patents

文書管理装置および方法 Download PDF

Info

Publication number
JP2005322080A
JP2005322080A JP2004140378A JP2004140378A JP2005322080A JP 2005322080 A JP2005322080 A JP 2005322080A JP 2004140378 A JP2004140378 A JP 2004140378A JP 2004140378 A JP2004140378 A JP 2004140378A JP 2005322080 A JP2005322080 A JP 2005322080A
Authority
JP
Japan
Prior art keywords
management
sheet
document
paper
sheets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004140378A
Other languages
English (en)
Inventor
Shoichi Tateno
昌一 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004140378A priority Critical patent/JP2005322080A/ja
Publication of JP2005322080A publication Critical patent/JP2005322080A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Or Security For Electrophotography (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】 複数の文書を一括して画像読取装置で読み取っても、事後的に文書単位での扱いを可能にする。
【解決手段】 文書D1、D2、D3がバラバラにされて用紙束d1、d2、d3とされ、それぞれの用紙束d1、d2、d3の上に管理用用紙c1、c2、c3が挿入される。これら一群の用紙はバッチ処理される対象として紙送り装置20に載置される。紙送り装置20はバッチ用紙束10の用紙を上から、または下から順次に送り出して画像読取装置30に供給する。用紙判別部40は、バッチ用紙束10から管理用用紙c1、c2、c3を検出する。文書管理部50は、管理用用紙からつぎの管理用用紙の間の用紙の画像等を1つの管理単位で管理する。利用者は、管理単位を指定して文書ごとに各ページの画像やテキストを閲覧等することができる。
【選択図】 図1

Description

この発明は、事務所等に保管されている紙文書を電子化して管理する文書管理技術に関し、とくに、光学的な画像読取のため1枚1枚にばらして膨大な枚数の紙文書を光学的に読み込んだ得た電子データを容易に文書単位にで扱えるようにする。
オフィス空間を有効に利用するために紙文書を遠隔地の比較的コストが低廉な倉庫に保管し、あるいは、破棄し、その内容を電子化して利用することが提案されている。紙文書の電子化は、オフィスコストを抑制するとともに情報の共有化の上でも好ましい。ところで、紙文書の電子化は、文書を各葉にばらばらにし、サイズの統一、両面ページの片面化等の前処理を行なった後、画像読取装置(スキャナ)で画像を読み取り、適宜、文字認識処理等の後処理を行い、文書単位で管理するようにしていた。文書は文書単位で扱えなければならないので、画像読み取りは文書単位で一まとまりで行なう必要があり、連続した作業が困難であった。典型的には文書ごとにその重要事項等を記入した用紙(例えばフェースシート)を準備してこれを文書の先頭に配置して、文書単位で画像の読み取りを行なっていた。しかしながら、文書ごとに読み取りを行なうのではあまり効率的でなく、複数の文書を一まとめにして一括して読み取りを行なえるようにすることが望まれる。
なお、この発明と関連するものとしては、紙文書をデジタル複写機で電子化して電子化データを外部委託先の文書データ保管部に保管するもの(特許文献1)があるが、複数の文書を一括して読み取ることについては何ら記載がない。
特開2001−357039公報
この発明は、以上の事情を考慮してなされたものであり、複数の文書を一まとめに読み込んでも電子化された後の読み取りデータを文書単位で扱うことができる文書管理技術を提供することを目的としている。
この発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。
すなわち、この発明の一側面によれば、上述の目的を達成するために、文書管理装置に:他の用紙と区別することができる管理用用紙を区切り位置に挿入した、複数枚の記録済み用紙を、紙送りしつつ読み取る画像読み取り手段と;上記複数枚の記録済み用紙に挿入されている管理用用紙を判別する用紙判別手段と;上記用紙判別手段による上記管理用用紙の判別に基づいて、上記管理用用紙により区切られる一連の記録済み用紙から上記画像読取装置により読み取った一連の画像を1文書をなす画像として管理する画像管理手段とを設けるようにしている。
この構成においては、複数の文書を一括して画像読取装置で読み取っても、管理文書の判別に基づいて、1文書を構成する画像を特定することができ、事後的に文書単位での扱いを可能にしている。
文書管理装置は、単一の筐体に収容されていても良いし、それぞれ個別の筐体に収容された複数の装置群から構成されても良い。
上記画像読取装置は、紙送り機構を含んでも良いし、紙送り装置を上記画像読取装置と別に設けても良い。記録済み用紙は、通常、文字や画像等が記録されて、読み取り対象になっている用紙をいう。読み取られる上記複数枚の記録済み用紙には、何らかの管理目的で、あるいは、何の目的もなく、白紙は混入することがあるが、この白紙を読み取る場合には白紙も「記録済み用紙」となる。白紙を無視する場合には「記録済み用紙」ではない。用紙は、シートともいい、紙に限定されず、樹脂その他のシート状に加工できるものであればよく、さらに、広く光学像を担持できる記録媒体であればよい。
1文書をなす画像は、例えば、同一のフォルダにまとめたり、リンクによりまとめたり、管理テーブルでまとめたり、種々の態様で1文書を構成するものとして管理される。
この構成において、文字認識装置により上記1文書をなす画像をコードデータに変換してもよい。コードデータも当該1文書をなすものとして管理される。画像と同様に、同一のフォルダにまとめたり、リンクによりまとめたり、管理テーブルでまとめたり、種々の態様で1文書を構成するものとして管理される。
また、上記1文書をなす画像を管理する管理単位(「1文書」と等価な電子データ管理単位)の属性の少なくとも一部を上記管理用用紙に担持された情報から付与するようにしてもよい。例えば、文書タイトル、管理者、保存年限等の重要な事項を管理用用紙に印刷しておき、これを文字認識装置により読み取って属性とすることができる。
また、上記1文書をなす画像を管理する管理単位の属性の少なくとも一部を、一連の記録済み用紙から上記画像読取装置により読み取った一連の画像の少なくとも一部から取得した情報から付与するようにしてもよい。例えば、文字認識した後に、1枚めのページの名称、日付等の固有表現を抽出してこれを属性とすることができる。1枚めの固有名は重要な情報であることが予想される。
また、上記管理用用紙に連続記号を担持させ、上記連続記号に関連付けられた属性が上記1文書をなす画像を管理する管理単位に付与されるようにしてもよい。例えば、管理用用紙の連続番号と当該管理用用紙に続く文書の属性とを関連付けて入力しておき、この関連づけを参照して自動的に属性を付与するようにしても良い。
また上記文字認識装置の認識結果に基づいて上記管理用用紙を他の用紙と区別してもよいし、上記管理用用紙を色付きの用紙として他の用紙と区別してもよいし、上記管理用用紙にバーコードが付され、当該バーコードにより他の用紙と区別するようにしてもよいし、上記管理用用紙にRFIDタグが付され、当該RFIDタグにより他の用紙と区別するようにしてもよい。
また、この発明の他の側面によれば、上述の目的を達成するために、文書管理方法において:画像読取装置の用紙判別部が他の用紙と区別することができる管理用用紙を区切り位置に挿入した、複数枚の記録済み用紙を、紙送りしつつ、当該画像読取装置により読み取るステップと;上記画像読取装置の用紙判別部が上記複数枚の記録済み用紙に挿入されている管理用用紙を判別するステップと;上記画像読取装置の用紙判別部による上記管理用用紙の判別に基づいて、上記管理用用紙により区切られる一連の記録済み用紙から上記画像読取装置により読み取った一連の画像を1文書をなす画像として管理するステップとを実行するようにしている。
この構成においても、複数の文書を一括して画像読取装置で読み取っても、管理文書の判別に基づいて、1文書を構成する画像を特定することができ、事後的に文書単位での扱いを可能にしている。
また、この発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
この発明によれば、複数の文書を一括して画像読取装置で読み取っても、管理文書の判別に基づいて、1文書を構成する画像を特定することができ、事後的に文書単位での扱いを可能にする。
以下、この発明の実施例について説明する。
図1は、この発明の原理的な構成を採用した実施例1を模式的に示している。この例では説明の便宜上、3つの文書の画像を読み取る場合を前提とするが、文書数等はこれに限らないことはもちろんである。図1において、文書D1、D2、D3がバラバラにされて用紙束d1、d2、d3とされ、それぞれの用紙束d1、d2、d3の上に管理用用紙(バナーシートともいう)c1、c2、c3が挿入される。これら一群の用紙はバッチ処理される対象として(以下ではバッチ用紙束ともいい、符号10で示す)紙送り装置20に載置される。紙送り装置20はバッチ用紙束10の用紙を上から、または下から順次に送り出して画像読取装置30に供給する。画像読取装置30は、典型的には、通常のスキャナであり、送られてくる用紙の印刷面を光学的に走査して印刷面の電子画像データを取得する。
用紙判別部40は、バッチ用紙束10から管理用用紙c1、c2、c3を検出する。管理用用紙c1、c2、c3は、他の用紙と区別するために、例えば、特別な色の用紙(一部の特定領域が特別の色でも良い)を用いる。あるいは、図2に示すように、区別用の文字列100、例えば「BANNER」とそれに続く連続数字(例えば「0001」から徐々に大きくなる数字)を印刷しても良いし、図3に示すように一次元または二次元バーコード101を設けても良いし、図4に示すようにRFIDタグを設けても良い。用紙の色は、画像読取装置30で読み取った電子画像データの属性から判別できる。紙送り装置20等に色判別機構(例えば、所定の色の光を検出する検出器。図示しない)を設けても良い。管理用用紙c1、c2、c3の記述内容を利用する場合には、その光学画像を文字認識装置により文字コードに変換して記述内容、例えば「BANNER」の文字や連続番号に連続性等に基づいて検出する。バーコードやRFIDタグを用いる場合には専用の読取機が必要である。RFIDタグの読取機は、用紙が重なって複数のRFIDタグが相互に近傍に配置されている状態では、誤動作を招来するので、紙送り装置20の搬送路等、用紙が重ならない状態が保証されている場所に設けることが好ましい。また、電磁遮蔽部を設けて外来ノイズへの耐性を強化することが好ましい。
文書管理部50は、図5に示すように、管理用用紙からつぎの管理用用紙の間の用紙の画像(一番下の用紙束の場合、管理用用紙の次の用紙の画像から最後の用紙の画像まで)を1つの管理単位で管理する。例えば、管理単位はフォルダである。図5の例では、文書を構成する各ページの画像データと、その画像データを文字認識して取得したテキストとを、1つの管理単位50aの下で管理している。これら画像やテキストは記憶装置60に記憶される。
利用者は、管理単位を指定して文書ごとに各ページの画像やテキストを閲覧等することができる。画像には例えば連続するファイル名等を付してページを指定できるようにする。画像やテキストの閲覧には専用のソフトウェアを用いても良いし、既存にHTMLファイルやXMLファイル等に画像やテキストをアンカータグにより埋め込んで、既存のウェブブラウザ等で閲覧するようにしても良い。
この実施例によれば、管理用用紙を各文書の用紙束の境に挿入しておくだけで一括して読み込みを行なっても、事後的に文書単位で管理することができる。
つぎに複写機を用いた実施例2について説明する。
図6は、実施例2の構成を全体として示しており、この図において、図1と対応する箇所には対応する符号を付した。
図6において、複写機200は、紙送り装置20、画像読取装置30、用紙判別部40、文書管理部50、記憶装置60、文字認識装置70、文書データ転送部80等を含んで構成されている。紙送り装置20は図1のバッチ用紙束10を一枚一枚画像読取装置30に送り出し、画像読取装置30は各用紙の光学画像を電子データに変換する。用紙判別部40は管理用用紙を判別し、この判別結果に基づいて文書管理部50が文書ごとに画像を管理単位の下管理する。文字認識装置70は、画像読取装置30が生成した電子画像から文字認識を行なう。この文字認識結果は例えばテキストファイルやHTMLファイル等とされ図5に示したように管理される。また、管理用用紙の記述内容に基づいて用紙の判別や種々の管理を行なう場合には文字認識装置70による認識結果を利用する。文書ごとの電子データは記憶装置60に管理される。
複写機200の操作部200aは、画像読取開始指示等、種々の操作を指示するものであり、さらに図7に示すように管理用用紙のバナー番号とこれに続く文書の属性とを入力できるようになっている。バナー番号は、1つの管理用用紙についての入力が終了するたびに自動的にインクリメントされてもよい。文書属性1、文書属性2等には、実際には具体的な属性名が表示される。属性は、例えば、文書のタイトル、管理責任者、オーナー、保管期限、電子化前の保管場所等である。電子化前の保管場所を属性として用いれば、電子化前の保管場所から電子化文書を検索できる。電子化前の保管場所(オフィスのレイアウト)をビジュアルに表示したり、階層化して表示して容易に検索できるようにしても良い。
文書の属性は管理単位ごとの属性として各管理単位に関連付けて記憶装置60に記憶される。
複写機200は、FTPプロトコル等により文書の電子データをサーバ装置300に転送する文書データ転送部80を有している。サーバ装置300はクライアント装置400に対して文書データの閲覧サービスを提供する。クライアント装置400は、電子化されたデータの検証、チェックに用いても良い。
この実施例においても、一括して文書の電子化が可能になる。
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、実施例2では、文字認識、用紙判別、文書管理を複写機200側で行なったが、読み取った画像データを文書データ転送部80でサーバ装置300に送り、サーバ装置300で文字認識、用紙判別、文書管理を行なうようにしても良い。
この発明の実施例1による文書管理を模式的に説明する図である。 実施例1の管理用用紙の一例を説明する図である。 実施例1の管理用用紙の他の例を説明する図である。 実施例1の管理用用紙のさらに他の例を説明する図である。 実施例1の文書ごとの管理単位を説明する図である。 この発明の実施例2の構成を説明する図である。 実施例2における文書属性の入力画面の例を説明する図である。
符号の説明
10 バッチ用紙束
20 機構
20 紙送り装置
30 画像読取装置
40 用紙判別部
50 文書管理部
50a 管理単位
60 記憶装置
70 文字認識装置
80 文書データ転送部
100 文字列
101 バーコード
102 RFIDタグ
200 複写機
200a 操作部
300 サーバ装置
400 クライアント
c1、c2、c3 管理用用紙
d1、d2、d3 用紙束
D1、D2、D3 文書

Claims (11)

  1. 他の用紙と区別することができる管理用用紙を区切り位置に挿入した、複数枚の記録済み用紙を、紙送りしつつ読み取る画像読み取り手段と、
    上記複数枚の記録済み用紙に挿入されている管理用用紙を判別する用紙判別手段と、
    上記用紙判別手段による上記管理用用紙の判別に基づいて、上記管理用用紙により区切られる一連の記録済み用紙から上記画像読取装置により読み取った一連の画像を1文書をなす画像として管理する画像管理手段とを有することを特徴とする文書管理装置。
  2. 文字認識装置により上記1文書をなす画像をコードデータに変換する請求項1記載の文書管理装置。
  3. 上記1文書をなす画像を管理する管理単位の属性の少なくとも一部を上記管理用用紙に担持された情報から付与する請求項1または2記載の文書管理装置。
  4. 上記1文書をなす画像を管理する管理単位の属性の少なくとも一部を、一連の記録済み用紙から上記画像読取装置により読み取った一連の画像の少なくとも一部から取得した情報から付与する請求項1、2または3記載の文書管理装置。
  5. 上記管理用用紙には連続記号が担持され、上記連続記号に関連付けられた属性が上記1文書をなす画像を管理する管理単位に付与される請求項1〜4のいずれかに記載の文書管理装置。
  6. 上記文字認識装置の認識結果に基づいて上記管理用用紙を他の用紙と区別する請求項2記載の文書管理装置。
  7. 上記管理用用紙を色付きの用紙として他の用紙と区別する請求項1〜5のいずれかに記載の文書管理装置。
  8. 上記管理用用紙にバーコードが付され、当該バーコードにより他の用紙と区別する請求項1〜5のいずれかに記載の文書管理装置。
  9. 上記管理用用紙にRFIDタグが付され、当該RFIDタグにより他の用紙と区別する請求項1〜5のいずれかに記載の文書管理装置。
  10. 画像読取装置の用紙判別部が他の用紙と区別することができる管理用用紙を区切り位置に挿入した、複数枚の記録済み用紙を、紙送りしつつ、当該画像読取装置により読み取るステップと、
    上記画像読取装置の用紙判別部が上記複数枚の記録済み用紙に挿入されている管理用用紙を判別するステップと、
    上記画像読取装置の用紙判別部による上記管理用用紙の判別に基づいて、上記管理用用紙により区切られる一連の記録済み用紙から上記画像読取装置により読み取った一連の画像を1文書をなす画像として管理するステップとを有することを特徴とする文書管理方法。
  11. 画像読取装置の用紙判別部が他の用紙と区別することができる管理用用紙を区切り位置に挿入した、複数枚の記録済み用紙を、紙送りしつつ、当該画像読取装置により読み取るステップと、
    上記画像読取装置の用紙判別部が上記複数枚の記録済み用紙に挿入されている管理用用紙を判別するステップと、
    上記画像読取装置の用紙判別部による上記管理用用紙の判別に基づいて、上記管理用用紙により区切られる一連の記録済み用紙から上記画像読取装置により読み取った一連の画像を1文書をなす画像として管理するステップとをコンピュータに実行させるために用いられることを特徴とする文書管理用コンピュータプログラム。
JP2004140378A 2004-05-10 2004-05-10 文書管理装置および方法 Pending JP2005322080A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004140378A JP2005322080A (ja) 2004-05-10 2004-05-10 文書管理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004140378A JP2005322080A (ja) 2004-05-10 2004-05-10 文書管理装置および方法

Publications (1)

Publication Number Publication Date
JP2005322080A true JP2005322080A (ja) 2005-11-17

Family

ID=35469313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004140378A Pending JP2005322080A (ja) 2004-05-10 2004-05-10 文書管理装置および方法

Country Status (1)

Country Link
JP (1) JP2005322080A (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03263182A (ja) * 1990-03-13 1991-11-22 Nec Corp 電子ファイリングシステム
JPH06251083A (ja) * 1993-02-25 1994-09-09 Hitachi Ltd 画像データの光ディスク登録方法およびシステム
JPH10171964A (ja) * 1996-12-09 1998-06-26 Canon Inc 電子ファイリング装置及び電子ファイリング方法
JP2000057315A (ja) * 1998-08-06 2000-02-25 Mitsubishi Electric Corp 文書ファイリング装置及び文書ファイリング方法
JP2002120475A (ja) * 2000-10-16 2002-04-23 Hitachi Ltd 紙製品、書類管理方法、書類管理システム、事務用品および事務機器
JP2002358506A (ja) * 2001-05-31 2002-12-13 Ricoh Co Ltd 文書ファイリング装置及び文書ファイリング方法並びに記録媒体
JP2003108496A (ja) * 2001-09-28 2003-04-11 Sharp Corp 画像送信装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03263182A (ja) * 1990-03-13 1991-11-22 Nec Corp 電子ファイリングシステム
JPH06251083A (ja) * 1993-02-25 1994-09-09 Hitachi Ltd 画像データの光ディスク登録方法およびシステム
JPH10171964A (ja) * 1996-12-09 1998-06-26 Canon Inc 電子ファイリング装置及び電子ファイリング方法
JP2000057315A (ja) * 1998-08-06 2000-02-25 Mitsubishi Electric Corp 文書ファイリング装置及び文書ファイリング方法
JP2002120475A (ja) * 2000-10-16 2002-04-23 Hitachi Ltd 紙製品、書類管理方法、書類管理システム、事務用品および事務機器
JP2002358506A (ja) * 2001-05-31 2002-12-13 Ricoh Co Ltd 文書ファイリング装置及び文書ファイリング方法並びに記録媒体
JP2003108496A (ja) * 2001-09-28 2003-04-11 Sharp Corp 画像送信装置

Similar Documents

Publication Publication Date Title
EP1583348B1 (en) Check boxes for identifying and processing stored documents
US7739583B2 (en) Multimedia document sharing method and apparatus
US7703002B2 (en) Method and apparatus for composing multimedia documents
US20150304521A1 (en) Dynamically generating table of contents for printable or scanned content
CN105635507A (zh) 图像扫描装置和用于控制其的方法
CN104346415B (zh) 图像文档命名的方法
JP5938393B2 (ja) 画像処理装置
TWI536798B (zh) 影像分檔方法
JP2008271534A (ja) 画像再生装置において実行されるコンテンツに基づくアカウンティング方法
US20090067717A1 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP4172478B2 (ja) 文書管理装置及び文書管理方法
JP5565130B2 (ja) 縮小画像生成装置及びプログラム
CN107534710B (zh) 电子设备以及标记处理方法
JP2007048053A (ja) 文書処理方法および文書処理装置、プログラム
JP2009032075A (ja) 文書電子化システム
JP2009137166A (ja) 可変情報印字物の管理方法、可変情報印字物の管理システム及び可変情報印字物群
JP2005322084A (ja) 文書管理装置および方法
JP2005322080A (ja) 文書管理装置および方法
JP2005322081A (ja) 文書管理装置および方法
JP5233350B2 (ja) 文書処理装置及び文書処理プログラム
JP2008278307A (ja) 画像読取システム及び原稿読取システムの制御方法
JP5373439B2 (ja) 著作物比較システム
JP2009223390A (ja) 画像処理監視システム及びプログラム
JP2004280514A (ja) Pdfファイル及びpdfファイル作成システム
JP5861351B2 (ja) バリアブル印刷ジョブ処理プログラムおよびバリアブル印刷ジョブ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091006