JP2004056468A - 文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体 - Google Patents

文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2004056468A
JP2004056468A JP2002211050A JP2002211050A JP2004056468A JP 2004056468 A JP2004056468 A JP 2004056468A JP 2002211050 A JP2002211050 A JP 2002211050A JP 2002211050 A JP2002211050 A JP 2002211050A JP 2004056468 A JP2004056468 A JP 2004056468A
Authority
JP
Japan
Prior art keywords
document
bibliographic information
image
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002211050A
Other languages
English (en)
Inventor
Atsushi Yamane
山根 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002211050A priority Critical patent/JP2004056468A/ja
Publication of JP2004056468A publication Critical patent/JP2004056468A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】文書データをその書誌情報とともにデータベース化し、原稿の文書画像から書誌情報を抽出し、データベース化された書誌情報と照合を行い、該当文書データを印刷することにより劣化のない印刷文書を得る。
【解決手段】文書画像の画像データを出力する画像スキャン手段1、前記画像データから文書画像認識技術を用いて書誌情報を抽出する書誌情報抽出手段2、通信回線9によって接続され複数の文書データ及び書誌情報を管理する文書データベース8、書誌情報抽出手段2により抽出された書誌情報と文書データベース8に管理された書誌情報とを照合する書誌情報照合手段3、照合された書誌情報に対応する文書データを印刷画像に変換する印刷データ生成手段4、画像処理手段5、文書印刷手段6を備え、文書画像を文書データベース8で管理されている文書データに基づき直接印刷する。
【選択図】    図1

Description

【0001】
【発明の属する技術分野】
本発明は、文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体に関し、さらに詳しくは、画像スキャンした画像データから抽出された書誌情報と通信回線によって接続された文書データベースに管理されている書誌情報を照合し、照合した書誌情報に対応する文書データを、直接印刷するようにした文献複写システムに関する。
【0002】
【従来の技術】
近年、コピー機の普及により、文書が手軽に複写できるようになってきた。しかし、コピー機を用いて文書を複写した文書画像は、当然、元の文書原稿と比較すると劣化してしまう。原稿台上において文書の置き方に注意を払わないと、意図しない角度で印刷されてしまう場合もある。また、書籍文書の印刷は、特に辞書のように開きづらいものの場合はページのつなぎの部分等で画像に歪みが生じる場合が多い。
【0003】
一方、近年は、文書情報のデータベース化が進んでおり、さらに文書レイアウトシステムの廉価化、パーソナル化等の要因により、書籍を含め多くの文書が電子文書として作成され、印刷され、出版されることが多くなってきた。学会における論文に関しては、紙に印刷したものではなく、電子文書として投稿することも可能になっている。
【0004】
【発明が解決しようとする課題】
文書が電子化されているのであれば、複写を行う際、文書を画像として読み取るのではなく、電子化されているデータを直接印刷することができれば、劣化のない印刷文書が得られる。
電子化された文書データベースへのアクセスは、データベース検索技術を用いて、パーソナルコンピュータ等の端末を用いて検索し、印刷を行うという手法が一般的であるが、数多くの文書から所望の文書を検索するためには、書誌情報を入力するという手間が必要になる。
そこで、文書画像の一部をスキャンし、その文書画像から書誌情報を抽出し、抽出された書誌情報を元に検索を行うことにより、容易に文書データにアクセスできるようになる。
【0005】
本発明は、もともと電子文書として作成された文書データをその書誌情報とともにデータベース化し、文書画像から文書画像認識技術を用いて書誌情報を抽出し、データベース化された書誌情報と照合を行い、該当文書データに基づいて印刷することにより、複写原稿と比較して劣化のない印刷文書を得ることを可能とするものである。
【0006】
【課題を解決するための手段】
本発明は、前記課題を解決するためになされたものであって、請求項1の発明は、文書画像をスキャニングして画像データを出力する画像スキャン手段、前記画像データから書誌情報を抽出する書誌情報抽出手段、前記書誌情報抽出手段により抽出された書誌情報と、通信回線によって接続され、かつ複数の文書データ及び該文書データのそれぞれに対応する書誌情報を管理する文書データベースに管理されている書誌情報とを照合する書誌情報照合手段、照合された書誌情報に対応する前記文書データを印刷画像に変換する印刷データ生成手段、前記印刷画像に対して画像処理を行う画像処理手段、画像処理された前記印刷画像を印刷する文書印刷手段を備えた文書印刷装置であることを特徴とする。
【0007】
請求項2の発明は、請求項1記載の文書印刷装置において、照合された書誌情報に対応する前記文書データが印刷可能かどうかを判定する印刷可能判定手段を備えたことを特徴とする。
【0008】
請求項3の発明は、請求項1または2記載の文書印刷装置において、前記画像スキャン手段が出力する画像データを、前記印刷データ生成手段に直接入力する選択手段を備えたことを特徴とする。
【0009】
請求項4の発明は、請求項1〜3記載の文書印刷装置において、前記画像スキャン手段のスキャン対象文書が書籍の場合、前記書誌情報抽出手段は書籍の表紙に含まれる文字情報を抽出することを特徴とする。
【0010】
請求項5の発明は、請求項1〜3記載の文書印刷装置において、前記画像スキャン手段のスキャン対象文書が学術論文の場合、前記書誌情報抽出手段はページの脚注に含まれる文字情報を抽出することを特徴とする。
【0011】
請求項6の発明は、請求項1〜3記載の文書印刷装置において、前記書誌情報抽出手段は前記画像データそのものを書誌情報として抽出し、前記書誌情報照合手段は画像の類似度に基づいて照合を行う画像類似度判定手段を有することを特徴とする。
【0012】
請求項7の発明は、請求項1〜3記載の文書印刷装置において、前記書誌情報抽出手段は、前記書籍の表紙に含まれる文字情報、前記学術論文のページの脚注に含まれる文字情報、前記画像データそのものをそれぞれ書誌情報として抽出し、前記書誌情報照合手段は画像の類似度に基づいて照合を行う画像類似度判定手段を有することを特徴とする。
【0013】
請求項8の発明は、文書画像をスキャニングして画像データを出力する画像スキャン工程、前記画像データから書誌情報を抽出する書誌情報抽出工程、前記抽出された書誌情報と、通信回線によって接続され、かつ複数の文書データ及び該文書データのそれぞれに対応する書誌情報とを管理する文書データベースに管理されている前記書誌情報とを照合する書誌情報照合工程、照合された書誌情報に対応する前記文書データを印刷画像に変換する印刷データ生成工程、前記印刷画像に対して画像処理を行う画像処理工程、画像処理された前記印刷画像を印刷する文書印刷工程を備えた文書印刷方法であることを特徴とする。
【0014】
請求項9の発明は、請求項8記載の文書印刷方法のアルゴリズムからなるプログラムを記載したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0015】
【発明の実施の形態】
以下、本発明の実施の形態を図1に示す実施例に基づいて説明する。
図1は、本発明の実施例による文書印刷装置の基本構成を示すブロック図である。
本発明の実施例の文書印刷装置は、画像スキャン手段1、書誌情報抽出手段2、書誌情報照合手段3、印刷データ生成手段4、画像処理手段5、文書印刷手段6、複写モード選択手段7等から構成される。文書印刷装置は、通信回線を介して文書データベース8に接続されており、文書データベース8は複数の文書データ及び該文書データのそれぞれに対応する書誌情報を管理する。
複写モード選択手段7は、文献を複写するにあたって、文書データベース8に問い合わせて複写するか、通常の複写機のように読み取った画像、あるいは読み取った画像に処理を加えてから印刷するかを利用者の入力に基づき選択する。
【0016】
まず、複写モード選択手段7において、文書データベース8に問い合わせて複写を行うモードを選択した場合の動作について説明する。
まず、複写原稿が画像スキャン手段1においてスキャンされる。画像スキャン手段1としては、複写機におけるスキャナ、あるいはスキャナ専用装置が挙げられる。画像スキャン手段1によってスキャンされた画像は、書誌情報抽出手段2に送られ、書誌情報が抽出される。書誌情報抽出手段2としては、OCR(Optical Character Reader)装置、あるいはOCR機能を有するLSI等の電子デバイス、あるいはOCRプログラムを搭載したパーソナルコンピュータ等が挙げられるが、文書印刷装置全体のサイズを考慮すると専用のLSIとして装置に内蔵するのが好ましい。
【0017】
書誌情報の抽出には、公知の文書画像認識技術を利用すればよい。書籍の表紙には、通常、書籍のタイトル・号数、著者、出版社等の情報が含まれるため、認識した文字列は書誌情報そのものとして用いることができる。また、学術論文の場合は、各ページの脚注に論文番号や学会名・文献タイトル等の書誌情報が含まれることが多いので、この情報を用いればよい。
文献の種類については、公知の文書画像処理技術を用いて自動認識してもよいが、利用者が予め文献の種類を入力する方がより的確な認識が可能になると考えられる。
【0018】
文書データベース8には、複数の文書データがその書誌情報と対応づけられて管理されている。文書データは、画像データフォーマットでもよいし、PDF、Postscript言語のような印刷用フォーマットでもよいし、さらにMS−Wordのような文書編集アプリケーション文書フォーマットでもよく、文書印刷手段6の仕様に基づいて印刷可能な形式になっていればよい。
書誌情報照合手段3は、書誌情報抽出手段2において抽出された書誌情報と、前記文書データベース8において管理されている書誌情報とを照合する。基本的には、文字列として抽出された書誌情報を文字列マッチングによって検索を行えばよいが、文字認識技術を用いて抽出された文字列にはノイズが含まれる場合もあるので、曖昧性を許した文字列マッチングが好ましい。また、書誌情報として、画像データそのものを用い、画像の類似度を用いたマッチングを行なったり、文字列マッチングと画像の類似度に基づくマッチングを併用して認識をより確実にするようにしてもよい。
【0019】
書誌情報照合手段3は、照合された書誌情報に対応する前記文書データが印刷可能かどうかを判定する印刷可能判定手段を備える構成とすることができる。この場合は、文書データベース8において管理されている書誌情報に印刷可能判定を行うための情報を付加するか、書誌情報照合手段3に書誌情報に基づいて印刷可能判定を行う機能を付加しておく必要がある。
書誌情報照合手段3が印刷可能判定手段を備えていることにより、印刷可能と設定されている文書あるいは印刷可能と判定された文書のみを印刷して、違法な劣化なしの複写が行われることを防止することができる。
なお、印刷可能判定手段は、必ずしも書誌情報照合手段3に備えなければならないものではなく、印刷データ生成手段4あるいは文書印刷手段6に備えるようにすることもできる。
【0020】
書誌情報照合手段3において照合が行われ、検索された文書の文書データは、印刷データ生成手段4に入力される。印刷データ生成手段4は、文書データを文書印刷手段6において印刷可能な形式のデータに変換し、出力するものである。例えば、文書印刷手段がプリンタの場合、文書データをプリンタ記述言語に変換する。文書データが既に文書印刷手段6において印刷可能なフォーマットの場合は、何も行われない。印刷手段としては、文書データを文書印刷手段6で印刷可能なデータに変換するためのプログラムを搭載したLSIやパーソナルコンピュータが挙げられる。
【0021】
印刷データ生成手段4から出力された、文書印刷手段6で印刷可能な形式の文書データは、画像処理手段5に入力される。画像処理手段5では、印刷文書画像に関して、拡大・縮小等の処理が行われる。利用者が特に処理を希望しない場合は、何も行われない。画像処理手段5としては、画像処理を行うためのプログラムを搭載したLSIやパーソナルコンピュータが挙げられる。
【0022】
画像処理手段5から出力された、文書印刷手段6で印刷可能な形式の文書データは、文書印刷手段6に入力され、印刷出力される。文書印刷手段6としては、プリンタ、複写機あるいはファクシミリ装置が備える印刷手段、あるいはそれらの印刷手段にパーソナルコンピュータ等を用いた印刷デバイス制御装置を含んだ構成が挙げられる。
以上により、本発明の文書印刷装置は、複写原稿をほとんど劣化なしに複写することが可能になる。
【0023】
次に、前記複写モード選択手段7において、通常の複写機のように読み取った画像あるいは読み取った画像に処理を加えてから印刷するモードを選択した場合の動作を説明する。
画像スキャン手段1においてスキャンされた文書画像は、直接印刷データ生成手段4に入力され、以降、文書データベース8に問い合わせを行う場合と同一の処理を行うことになる。この処理は、通常の複写機における複写印刷と同様の処理である。
以上により、本発明の文書印刷装置は、通常の複写機の機能も備えており、通常の複写機と同様に使用することもできる。
【0024】
【発明の効果】
請求項1記載の文書印刷装置は、書籍を含む文書画像をスキャニングして画像データを出力する画像スキャン手段、前記画像データから書誌情報を抽出する書誌情報抽出手段、前記抽出された書誌情報と、通信回線によって接続され、かつ複数の文書データ及び該文書データのそれぞれに対応する書誌情報とを管理する文書データベースに管理された書誌情報とを照合する書誌情報照合手段、照合された書誌情報に対応する前記文書データを印刷画像に変換する印刷データ生成手段、前記印刷画像に対して画像処理を行う画像処理手段、前記処理された印刷画像を印刷する文書印刷手段を備えているので、スキャン対象文書が文書データベースで管理された文書データとして存在する場合には、文書データベースで管理されている文書データを直接印刷することにより、複写文献を劣化なしに印刷することができる。
【0025】
請求項2記載の文書印刷装置は、請求項1記載の文書印刷装置において、照合された文書が印刷可能かどうかを判定する印刷可能判定手段を有するので、印刷可能と設定されている文書のみを印刷することにより、違法な劣化なしの複写を防止することができる。
【0026】
請求項3記載の文書印刷装置は、請求項1または2記載の文書印刷装置において、画像スキャン手段が出力する画像データを、直接印刷データ生成手段に入力することを可能にすることによって、通常の複写機の機能を有するので、文書データベースに問い合わせる形式の印刷と、通常の複写機の印刷との両方の機能を有する文書印刷装置を構成することができる。
【0027】
請求項4記載の文書印刷装置は、請求項1〜3記載の文書印刷装置において、書誌情報抽出手段において、対象文書が書籍の場合、書籍の表紙をスキャンし、表紙に含まれる情報を抽出するので、書籍文書を印刷する際に書誌情報の抽出がより確実になる。
【0028】
請求項5記載の文書印刷装置は、請求項1〜3記載の文書印刷装置において、前記書誌情報抽出手段において、対象文書が学術論文の場合、各ページの脚注に含まれる情報を抽出するので、学術論文を印刷する際に書誌情報の抽出がより確実になる。
【0029】
請求項6記載の文書印刷装置は、請求項1〜3記載の文書印刷装置において、画像データそのものを書誌情報として用い、前記書誌情報照合手段が画像の類似度に基づく照合を行う画像類似度判定手段を含むので、書誌情報の抽出と併用することにより、目的となる文書の検索がより確実になる。
【0030】
請求項7記載の文書印刷装置は、請求項4〜6記載の文書印刷装置の特徴を全て備えているので、請求項4〜6記載の文書印刷装置の効果を全て兼ね備えた文書印刷装置を構成することができる。
【0031】
請求項8記載の文書印刷方法は、書籍を含む文書画像をスキャニングして画像データを出力する画像スキャン工程、前記画像データから書誌情報を抽出する書誌情報抽出工程、前記抽出された書誌情報と、通信回線によって接続され、かつ複数の文書データ及び該文書データのそれぞれに対応する書誌情報とを管理する文書データベースに管理されている書誌情報とを照合する書誌情報照合工程、照合された書誌情報に対応する前記文書データを印刷画像に変換する印刷データ生成工程、前記印刷画像に対して画像処理を行う画像処理工程、前記処理された印刷画像を印刷する文書印刷工程を備えているので、文書データベースで管理されている文書データを直接印刷することにより、複写文献を劣化なしに印刷することができる。
【0032】
請求項9記載のコンピュータ読み取り可能な記録媒体は、請求項8記載の文書印刷方法のアルゴリズムを持ったプログラムを記録しているので、コンピュータにおいて請求項9記載の文書印刷方法を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施例による文書印刷装置の基本構成を示すブロック図である。
【符号の説明】
1…画像スキャン手段、2…書誌情報抽出手段、3…書誌情報照合手段、4…印刷データ生成手段、5…画像処理手段、6…文書印刷手段、7…複写モード選択手段、8…文書データベース、9…通信回線。

Claims (9)

  1. 文書画像をスキャニングして画像データを出力する画像スキャン手段、前記画像データから書誌情報を抽出する書誌情報抽出手段、前記書誌情報抽出手段により抽出された書誌情報と、通信回線によって接続され、かつ複数の文書データ及び該文書データのそれぞれに対応する書誌情報を管理する文書データベースに管理されている書誌情報とを照合する書誌情報照合手段、照合された書誌情報に対応する前記文書データを印刷画像に変換する印刷データ生成手段、前記印刷画像に対して画像処理を行う画像処理手段、画像処理された前記印刷画像を印刷する文書印刷手段を備えたことを特徴とする文書印刷装置。
  2. 照合された書誌情報に対応する前記文書データが印刷可能かどうかを判定する印刷可能判定手段を備えたことを特徴とする請求項1記載の文書印刷装置。
  3. 前記画像スキャン手段が出力する画像データを、前記印刷データ生成手段に直接入力する選択手段を備えたことを特徴とする請求項1または2記載の文書印刷装置。
  4. 前記画像スキャン手段のスキャン対象文書が書籍の場合、前記書誌情報抽出手段は書籍の表紙に含まれる文字情報を抽出することを特徴とする請求項1乃至3いずれかに記載の文書印刷装置。
  5. 前記画像スキャン手段のスキャン対象文書が学術論文の場合、前記書誌情報抽出手段はページの脚注に含まれる文字情報を抽出することを特徴とする請求項1乃至3いずれかに記載の文書印刷装置。
  6. 前記書誌情報抽出手段は前記画像データそのものを書誌情報として抽出し、前記書誌情報照合手段は画像の類似度に基づいて照合を行う画像類似度判定手段を有することを特徴とする請求項1乃至3いずれかに記載の文書印刷装置。
  7. 前記書誌情報抽出手段は、前記書籍の表紙に含まれる文字情報、前記学術論文のページの脚注に含まれる文字情報、前記画像データそのものをそれぞれ書誌情報として抽出し、前記書誌情報照合手段は画像の類似度に基づいて照合を行う画像類似度判定手段を有することを特徴とする請求項1乃至3いずれかに記載の文書印刷装置。
  8. 文書画像をスキャニングして画像データを出力する画像スキャン工程、前記画像データから書誌情報を抽出する書誌情報抽出工程、前記抽出された書誌情報と、通信回線によって接続され、かつ複数の文書データ及び該文書データのそれぞれに対応する書誌情報とを管理する文書データベースに管理されている前記書誌情報とを照合する書誌情報照合工程、照合された書誌情報に対応する前記文書データを印刷画像に変換する印刷データ生成工程、前記印刷画像に対して画像処理を行う画像処理工程、画像処理された前記印刷画像を印刷する文書印刷工程を備えたことを特徴とする文書印刷方法。
  9. 請求項8記載の文書印刷方法のアルゴリズムからなるプログラムを記載したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2002211050A 2002-07-19 2002-07-19 文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体 Pending JP2004056468A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002211050A JP2004056468A (ja) 2002-07-19 2002-07-19 文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002211050A JP2004056468A (ja) 2002-07-19 2002-07-19 文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2004056468A true JP2004056468A (ja) 2004-02-19

Family

ID=31934386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002211050A Pending JP2004056468A (ja) 2002-07-19 2002-07-19 文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2004056468A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10032232B2 (en) 2013-12-27 2018-07-24 Ricoh Company, Ltd. Information processing system, information processing method, and computer program product
US10104252B2 (en) 2015-11-25 2018-10-16 Ricoh Company, Ltd. Image reading device, image forming apparatus and method using the image reading device employing movable guide plate holding the medium and shading correction plate

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10032232B2 (en) 2013-12-27 2018-07-24 Ricoh Company, Ltd. Information processing system, information processing method, and computer program product
US10104252B2 (en) 2015-11-25 2018-10-16 Ricoh Company, Ltd. Image reading device, image forming apparatus and method using the image reading device employing movable guide plate holding the medium and shading correction plate

Similar Documents

Publication Publication Date Title
US8073255B2 (en) Keyword generation process
US7506250B2 (en) Techniques for determining electronic document information for paper documents
US6880124B1 (en) Methods of storing and retrieving information, and methods of document retrieval
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US20060062453A1 (en) Color highlighting document image processing
US20050105116A1 (en) Document processing apparatus and document processing method
US20040234169A1 (en) Image processing apparatus, control method therefor, and program
CN100581214C (zh) 图像处理装置和图像处理方法
JP2007034847A (ja) 検索装置及び検索方法
JP4673200B2 (ja) 印刷処理システムおよび印刷処理方法
JP2005309829A (ja) 文書管理装置および文書管理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体および文書管理プログラム
JP4254775B2 (ja) 書込画像取得装置、書込情報抽出方法、およびコンピュータプログラム
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
US8712155B2 (en) Device for identifying types of document files
JP4725483B2 (ja) 電子文書と印鑑データとを管理する方法および文書処理装置
JP2004056468A (ja) 文書印刷装置、文書印刷方法及び該方法を実施するプログラムを記録した記録媒体
US20050225792A1 (en) Apparatus and method for secondarily outputting original data
JP4765593B2 (ja) 画像形成装置及び画像形成処理プログラム並びに画像形成処理方法
US8004712B2 (en) Image processing apparatus and method
JP4827519B2 (ja) 画像処理装置、画像処理方法、およびプログラム
AU2008259730B2 (en) Method of producing probabilities of being a template shape
JP2004112524A (ja) 画像情報蓄積装置、文書出力装置、および画像情報蓄積方法
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2004280514A (ja) Pdfファイル及びpdfファイル作成システム
JP2007048236A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び記憶媒体