JP2005208934A - 文書配信処理装置及び文書配信処理プログラム - Google Patents

文書配信処理装置及び文書配信処理プログラム Download PDF

Info

Publication number
JP2005208934A
JP2005208934A JP2004014774A JP2004014774A JP2005208934A JP 2005208934 A JP2005208934 A JP 2005208934A JP 2004014774 A JP2004014774 A JP 2004014774A JP 2004014774 A JP2004014774 A JP 2004014774A JP 2005208934 A JP2005208934 A JP 2005208934A
Authority
JP
Japan
Prior art keywords
image processing
document
data
code data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004014774A
Other languages
English (en)
Inventor
Yasuyuki Ikeda
靖之 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004014774A priority Critical patent/JP2005208934A/ja
Publication of JP2005208934A publication Critical patent/JP2005208934A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】本発明は、文書を読み取って配信する際に自動的に必要な画像処理を容易に行うことが可能な文書配信処理装置及び文書配信処理プログラムを提供することを目的とする。
【解決手段】入力文書の先頭ページにOCRフォームシートを配置し、文書をスキャナで読み取った文書データからOCRフォームシートに記入された画像処理メニューに対応する符号データ及び画像処理範囲を指定する画像処理位置データを認識して抽出し、抽出した符号データに対応する画像処理を画像処理位置データで決められた範囲に行い、指定された画像処理が行われた後決められた配信先に配信するようにする。
【選択図】図2

Description

本発明は、文書データを配信処理する装置に関し、例えば、ネットワークシステム上に構築された文書データをルーティングする文書配信システムにおいて、特に文書データに画像処理を付加する文書配信処理装置及び文書配信処理プログラムに関する。
従来より、帳票等の文書を画像認識処理して自動的に帳票を分類し、帳票画像や文書画像として登録する方法が提案されている。例えば、特許文献1では、入力された定型帳票画像と、既に登録されている定型帳票画像との対応点の相違度計算により得られた相違度に基づいて定型帳票画像を分類し、入力定型帳票画像を登録することが記載されている。また、特許文献2では、帳票を含む複数の文書の入力において、入力された画像が、予め登録された帳票画像を含む画像であるか否かを識別して、帳票画像を文書の区切りとして認識して、各文書画像をそれぞれ1つの文書データとして登録することが記載されている。
特開2000−57266号公報 特開2002−358506号公報
上述した先行文献に記載されたような装置においては、入力された画像はそのまま保管するようにしているので、入力された画像毎に異なった画像処理を行うことが想定されていない。先行文献に記載の装置のように帳票のみを取り扱う場合にはそうした要請はないが、様々な文書を取り扱う場合には文書に応じて画像処理(例えば、全文OCR処理、天地識別)を行うことが必要となってくる。
そこで、本発明は、文書を読み取って配信する際に自動的に必要な画像処理を容易に行うことが可能な文書配信処理装置及び文書配信処理プログラムを提供することを目的とする。
本発明に係る文書配信処理装置は、文書を読み取って文書データを出力する読取手段と、符号データと対応付けた画像処理メニューデータ及び配信先情報を記憶する記憶手段と、文書中のOCRフォームシートに関するイメージデータより文字情報を認識して前記符号データを抽出する抽出手段と、抽出された前記符号データに対応する画像処理メニューを読み出して文書データに当該画像処理を行う画像処理手段と、画像処理された文書データを前記記憶手段に記憶された配信先情報に基づいて配信する配信制御手段とを備えていることを特徴とする。さらに、前記抽出手段は、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の前記符号データを抽出するとともに、前記画像処理手段は、前記認識位置情報に関連付けられた順序で前記符号データに対応する画像処理メニューを順次行うことを特徴とする。さらに、前記抽出手段は、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の画像処理位置データを抽出するとともに、前記画像処理手段は、前記認識位置情報に関連付けられた順序で前記画像処理位置データにより設定される範囲の文書データのみ画像処理を行うことを特徴とする。
本発明に係る文書配信処理プログラムは、コンピュータを、符号データと対応付けた画像処理メニューデータ及び配信先情報を記憶する記憶手段、読取手段により読み取られた文書データ中のOCRフォームシートに関するイメージデータより文字情報を認識して前記符号データを抽出する抽出手段、抽出された前記符号データに対応する画像処理メニューを読み出して文書データに当該画像処理を行う画像処理手段、及び画像処理された文書データを前記記憶手段に記憶された配信先情報に基づいて配信する配信制御手段、として機能させる。さらに、前記抽出手段を、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の前記符号データを抽出するように機能させるとともに、前記画像処理手段を、前記認識位置情報に関連付けられた順序で前記符号データに対応する画像処理メニューを順次行うように機能させる。さらに、前記抽出手段を、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の画像処理位置データを抽出するように機能させるとともに、前記画像処理手段を、前記認識位置情報に関連付けられた順序で前記画像処理位置データにより設定される範囲の文書データのみ画像処理を行うように機能させる。
上記のような構成を有することで、文書中のOCRフォームシートに記載された符号データを認識し、認識されて抽出された符号データに対応する画像処理を行うようにしているので、容易に文書データに応じた画像処理が選択できると共に文書配信時に画像処理を行うことができる。そして、OCRフォームシートに複数の符号データを記載してその認識位置に関連付けた順序により自動的に画像処理を順次行うようにすれば、複数の画像処理を簡単に設定して行うことができる。また、OCRフォームシートに画像処理位置データを記載することで画像処理位置を読み取り画像処理位置により設定される範囲の文書データのみ画像処理を行うようにすることもでき、文書中の範囲指定も簡単に設定することができるようになる。
ここで、画像処理には、全文OCR処理や天地識別処理、画像フォーマット変換処理(JPGやPDFに変換する処理)等の、公知の画像処理が含まれる。
以下、本発明に係る部分画像検索方法に関する実施形態について詳しく説明する。なお、以下に説明する実施形態は、本発明を実施するにあたって好ましい具体例であるから、技術的に種々の限定がなされているが、本発明は、以下の説明において特に発明を限定する旨明記されていない限り、これらの形態に限定されるものではない。
図1は、本発明に係る実施形態を備えたネットワークシステムに関するブロック構成図である。文書配信処理装置である配信サーバー1には、スキャナ2及び大容量記憶装置である文書保存DB3が接続されており、ネットワーク6を介して複数のクライアントPC4及びプリンタ5が接続されている。
配信サーバー1は、制御部10及び記憶部11を備えており、記憶部11には文書配信処理プログラム12及び画像処理テーブル13が記憶されている。制御部10は、スキャナ2を制御して文書を読み取り、読み取られた文書データを文書配信処理プログラム12により画像処理して、文書データを文書保存DB3、クライアントPC4又はプリンタ5に必要に応じて配信処理する。
図2は、配信サーバー1を機能ブロックで示した図である。文書データ入力部20は、スキャナ2において読み取られた文書データを取り込み、文書データ一時記憶部22に記憶すると共に、記憶された文書データをOCRフォーム認識部21に送る。
入力される文書は、例えば図3に示すように構成されている。先頭ページは、画像処理を指定する為のOCRフォームシート30となっており、2ページ以降には配信処理する文書31となっている。したがって、先頭ページのOCRフォームシート30から情報を読み取ってそれに従い2ページ以降の文書を画像処理して配信される。OCRフォームシート30には、文書に施される画像処理メニューに関する認識領域32が設けられており、認識領域32には指定した画像処理メニューを記入する記入欄32a〜32eが印刷されている。画像処理メニューは、単純な文字(英数字のようなOCRで正確に認識できる単純な文字で、本実施形態では数字とする)で表される符号データに対応付けられている。そして、記入欄32a〜32eに記載された符号データは上から下に向かって順番に必要な画像処理メニューを記入するようになっている。記入の際の参考にするため、OCRフォームシート30の下部には、画像処理メニュー説明欄33が記載されている。また、OCRフォームシート30には画像処理を行う範囲に関する認識領域34が設けられており、認識領域34には画像処理範囲として文書のページ記入欄34a及び34bが印刷されている。そして、画像処理を行う範囲の最初のページ及び最後のページを画像処理位置データとして数字で記入するようになっている。
なお、画像処理メニュー及び画像処理範囲に関する記入欄は、処理に応じて適宜その数を増減させてもかまわない。例えば、図4に示すように、画像処理メニューの記入欄を1つだけにし、1つのメニューのみ選択できるようにしてもよく、また図5に示すように、画像処理メニューの記入欄を複数設けるようにしてもよい。
認識位置情報記憶部23には、認識領域32の記入欄32a〜32e及び認識領域34の記入欄34a及び34bに関する認識位置情報が記憶されており、OCRフォーム認識部21では、これらの認識位置情報に基づいて記入欄に記載された符号データ及び画像処理位置データを認識する。そして、これらのデータをデータ抽出部24で抽出し、抽出されたデータに基づいて画像処理部25において文書データの画像処理が行われる。認識位置情報としては、例えば、記入欄の左上角部の座標データを記憶するようにすればよい。また、同じような記入欄が複数ある場合には、一番上の記入欄の座標データ、記入欄の幅及び高さ、記入欄の間隔を記憶しておけば、認識位置情報を少なくすることができる。
画像処理部25では、抽出された符号データに対応する画像処理メニューを画像処理テーブル13から読み出す。画像処理テーブル13には、画像メニュー説明欄33に記載されているように、符号データとして1〜6の数字がそれぞれ異なる画像処理に対応付けられて記憶されている。この例では、記入欄32aに2、記入欄32bに3、記入欄32cに1が記入されており、これらの符号データが抽出されて画像処理2(天地識別)、画像処理3(ノイズ除去)及び画像処理1(全文OCR)が順次文書データに処理されるようになる。一方、画像処理位置データとして、記入欄34aには2、記入欄34bには5が記入されているので、2及び5が画像処理位置データとして抽出されて2ページから5ページの範囲について画像処理が行われる。
画像処理部25において、文書データは、2〜5ページの範囲を天地の識別及び補正処理をされて、データ中のノイズを除去処理され、OCR処理をされて文字コードデータとなり、文書データ一時記憶部22に保存される。
そして、文書データ配信部26は、配信先情報記憶部27より配信先情報を読み出して、画像処理された文書データを配信処理する。配信先としては、例えば、ネットワーク6を介してクライアントPC4やプリンタ5に配信したり、保存のため文書保存DB3に配信されたりする。また、保存フォルダ28に配信するようにしてもよい。
本発明の実施形態を備えたネットワークに関するブロック構成図である。 本発明の実施形態に関する機能ブロック図である。 入力する文書に関する説明図である。 OCRフォームシートの別の例を示す図である。 OCRフォームシートの別の例を示す図である。
符号の説明
1・・・配信サーバ、2・・・スキャナ、3・・・文書保存DB、4・・・クライアントPC、5・・・プリンタ、6・・・ネットワーク、10・・・制御部、11・・・記憶部、12・・・文書配信処理プログラム、13・・・画像処理テーブル、20・・・文書データ入力部、21・・・OCRフォーム認識部、22・・・文書データ一時記憶部、23・・・認識位置情報記憶部、24・・・データ抽出部、25・・・画像処理部、26・・・文書データ配信部、27・・・配信先情報記憶部、28・・・保存フォルダ、30・・・OCRフォームシート、31・・・文書、32・・・認識領域、33・・・画像処理メニュー説明欄、34・・・認識領域

Claims (6)

  1. 文書を読み取って文書データを出力する読取手段と、符号データと対応付けた画像処理メニューデータ及び配信先情報を記憶する記憶手段と、文書中のOCRフォームシートに関するイメージデータより文字情報を認識して前記符号データを抽出する抽出手段と、抽出された前記符号データに対応する画像処理メニューを読み出して文書データに当該画像処理を行う画像処理手段と、画像処理された文書データを前記記憶手段に記憶された配信先情報に基づいて配信する配信制御手段とを備えていることを特徴とする文書配信処理装置。
  2. 前記抽出手段は、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の前記符号データを抽出するとともに、前記画像処理手段は、前記認識位置情報に関連付けられた順序で前記符号データに対応する画像処理メニューを順次行うことを特徴とする請求項1に記載の文書配信処理装置。
  3. 前記抽出手段は、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の画像処理位置データを抽出するとともに、前記画像処理手段は、前記認識位置情報に関連付けられた順序で前記画像処理位置データにより設定される範囲の文書データのみ画像処理を行うことを特徴とする請求項1又は2に記載の文書配信処理装置。
  4. コンピュータを、
    符号データと対応付けた画像処理メニューデータ及び配信先情報を記憶する記憶手段、
    読取手段により読み取られた文書データ中のOCRフォームシートに関するイメージデータより文字情報を認識して前記符号データを抽出する抽出手段、
    抽出された前記符号データに対応する画像処理メニューを読み出して文書データに当該画像処理を行う画像処理手段、及び
    画像処理された文書データを前記記憶手段に記憶された配信先情報に基づいて配信する配信制御手段、
    として機能させる文書配信処理プログラム。
  5. 前記抽出手段を、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の前記符号データを抽出するように機能させるとともに、
    前記画像処理手段を、前記認識位置情報に関連付けられた順序で前記符号データに対応する画像処理メニューを順次行うように機能させる請求項4に記載の文書配信処理プログラム。
  6. 前記抽出手段を、OCRフォームシートの複数の領域に対応して予め設定された認識位置情報に基づいて複数の画像処理位置データを抽出するように機能させるとともに、
    前記画像処理手段を、前記認識位置情報に関連付けられた順序で前記画像処理位置データにより設定される範囲の文書データのみ画像処理を行うように機能させる請求項4又は5に記載の文書配信処理プログラム。
JP2004014774A 2004-01-22 2004-01-22 文書配信処理装置及び文書配信処理プログラム Pending JP2005208934A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004014774A JP2005208934A (ja) 2004-01-22 2004-01-22 文書配信処理装置及び文書配信処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004014774A JP2005208934A (ja) 2004-01-22 2004-01-22 文書配信処理装置及び文書配信処理プログラム

Publications (1)

Publication Number Publication Date
JP2005208934A true JP2005208934A (ja) 2005-08-04

Family

ID=34900462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004014774A Pending JP2005208934A (ja) 2004-01-22 2004-01-22 文書配信処理装置及び文書配信処理プログラム

Country Status (1)

Country Link
JP (1) JP2005208934A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2015554A1 (en) 2007-07-13 2009-01-14 Ricoh Company, Ltd. User interface generating method, image forming apparatus, and computer program product
US8179542B2 (en) 2006-09-15 2012-05-15 Ricoh Company, Ltd. Information processing device, image forming apparatus, and process control system
US8203740B2 (en) 2008-01-21 2012-06-19 Ricoh Company, Limited Image processing apparatus, distribution management method, and recording medium
US8213036B2 (en) 2007-03-07 2012-07-03 Ricoh Company, Ltd. Distribution system for scan image data and validating the scan image data
US8351059B2 (en) 2009-03-13 2013-01-08 Ricoh Company, Limited Apparatus, system, and method of image processing, and recording medium storing image processing program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8179542B2 (en) 2006-09-15 2012-05-15 Ricoh Company, Ltd. Information processing device, image forming apparatus, and process control system
US8213036B2 (en) 2007-03-07 2012-07-03 Ricoh Company, Ltd. Distribution system for scan image data and validating the scan image data
EP2015554A1 (en) 2007-07-13 2009-01-14 Ricoh Company, Ltd. User interface generating method, image forming apparatus, and computer program product
US8468213B2 (en) 2007-07-13 2013-06-18 Ricoh Company, Limited Screen generating method, image forming apparatus, and computer program product
US9489348B2 (en) 2007-07-13 2016-11-08 Ricoh Company, Limited Screen generating method, image forming apparatus, and computer program product
US8203740B2 (en) 2008-01-21 2012-06-19 Ricoh Company, Limited Image processing apparatus, distribution management method, and recording medium
US8351059B2 (en) 2009-03-13 2013-01-08 Ricoh Company, Limited Apparatus, system, and method of image processing, and recording medium storing image processing program
US8804159B2 (en) 2009-03-13 2014-08-12 Ricoh Company, Limited Apparatus, system, and method of image processing, and recording medium storing image processing program

Similar Documents

Publication Publication Date Title
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP2008192032A (ja) 文書処理装置、文書処理方法、プログラム
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
US20120250107A1 (en) Image processing apparatus, image processing method, and computer readable medium storing program
CN102883085B (zh) 图像处理装置和图像处理方法
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2005210563A (ja) 文書処理装置
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2005208934A (ja) 文書配信処理装置及び文書配信処理プログラム
JP2008282094A (ja) 文字認識処理装置
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP2017021654A (ja) 文書管理サーバ及びシステム
US20110157658A1 (en) Imaging processing apparatus, method for controlling the same, and program
JP2004164376A (ja) 識別コード添付帳票、帳票読取プログラム、及び帳票作成プログラム
WO2023021636A1 (ja) データ処理装置、データ処理方法及びプログラム
JP5343584B2 (ja) 情報処理装置及びプログラム
JP4651407B2 (ja) 画像処理装置およびコンピュータプログラムおよび記憶媒体
US8634094B2 (en) Image processing apparatus, image processing method and non-transitory computer readable medium storing program
JP2005242786A (ja) 帳票識別装置および帳票識別方法
JP2008123446A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法及びログ情報管理プログラム
JP6852359B2 (ja) 画像処理装置及びプログラム
JP2000339407A (ja) 画像処理装置及び画像処理方法及びコンピュータ読み取り可能な記憶媒体
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP3006294B2 (ja) 光学的文字読取装置
JP6435636B2 (ja) 情報処理装置及び情報処理プログラム