JP5754147B2 - Image reading apparatus and image forming apparatus - Google Patents

Image reading apparatus and image forming apparatus Download PDF

Info

Publication number
JP5754147B2
JP5754147B2 JP2011018789A JP2011018789A JP5754147B2 JP 5754147 B2 JP5754147 B2 JP 5754147B2 JP 2011018789 A JP2011018789 A JP 2011018789A JP 2011018789 A JP2011018789 A JP 2011018789A JP 5754147 B2 JP5754147 B2 JP 5754147B2
Authority
JP
Japan
Prior art keywords
character string
document
common
blank
string table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011018789A
Other languages
Japanese (ja)
Other versions
JP2012160885A (en
Inventor
慎也 佐原
慎也 佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2011018789A priority Critical patent/JP5754147B2/en
Publication of JP2012160885A publication Critical patent/JP2012160885A/en
Application granted granted Critical
Publication of JP5754147B2 publication Critical patent/JP5754147B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像読取装置及び画像形成装置に関する。   The present invention relates to an image reading apparatus and an image forming apparatus.

原稿の画像を読み取る画像読取装置の機能の一つに白紙判断機能がある。下記特許文献1には、原稿の縁部やパンチ穴の形成箇所を除外領域として指定し、除外領域を除いた領域で白紙判断を行う技術が開示されている。除外領域を設定することで、原稿の影やパンチ穴の影を画像と誤認することがなくなることから、白紙判断の精度が高くなる。尚、特許文献1では、白紙判定対象の領域について、画素濃度の出現数をカウントし、それを閾値と比較することで、原稿が白紙かどうか判断している。   One of the functions of an image reading apparatus that reads an image of a document is a blank page determination function. Japanese Patent Application Laid-Open No. 2004-151561 discloses a technique in which an edge portion of a document or a place where a punch hole is formed is designated as an excluded area, and blank page determination is performed in an area excluding the excluded area. By setting the exclusion area, the shadow of the original or the shadow of the punch hole is not mistaken for the image, and the accuracy of blank page determination is increased. In Patent Document 1, it is determined whether the document is blank by counting the number of occurrences of pixel density in the blank determination target area and comparing it with a threshold value.

特開2003−198777号公報JP 2003-198777 A

ところで、全面白紙原稿(定型画像、本文画像とも印刷されていない原稿)だけでなく、ファイル名、ページなどいわゆる定型画像のみ印刷され本文画像の印刷がない準白紙原稿も、白紙と判定したい場合がある。しかし、上述した従来の画像読取装置では、定型画像の形成箇所が除外領域に設定されなければ、準白紙原稿が白紙でないと誤判定される恐れがある。また、除外領域をユーザ設定にすると、ユーザの手間になる。 By the way, there are cases where it is desired to determine not only a blank white document (a document in which neither a standard image nor a text image is printed) but also a quasi-white paper document in which only a so-called standard image such as a file name and a page is printed but no text image is printed. is there. However, in the above-described conventional image reading apparatus, there is a possibility that it is erroneously determined that the quasi-blank document is not blank unless the formation position of the standard image is set in the exclusion area . Also, if the exclusion area is set as a user setting, it will be time-consuming for the user.

本発明は上記のような事情に基づいて完成されたものであって、ユーザの手間を減らしつつ、準白紙原稿を白紙と判断することを目的とする。 The present invention has been completed based on the above-described circumstances, and an object thereof is to determine a semi-blank document as a blank sheet while reducing the user's trouble.

本明細書によって開示される画像読取装置は、原稿の画像を読み取る読取部と、前記読取部が読み取った複数ページの原稿画像を比較することにより、複数ページの同じ座標に形成された共通パターンを検出する検出部と、前記共通パターンを除外して、原稿が白紙か非白紙かを判断する判断部とを備える。この構成では、共通パターンを除外して白紙判断を行うので、例えば、共通パターンのみ印字されていた原稿は白紙と判断される。そして、従来技術のように除外範囲を設けないので、原稿全面を対象に白紙判断を行うことが可能であり、白紙判断の判定精度を高めること可能となる。また、除外範囲を設けないので、ユーザの手間を減らすことが出来る。   An image reading apparatus disclosed in this specification compares a reading unit that reads an image of a document with a plurality of pages of document images that are read by the reading unit, thereby generating a common pattern formed at the same coordinates on a plurality of pages. A detection unit for detecting, and a determination unit for determining whether the document is white or non-blank by excluding the common pattern. In this configuration, since the blank page is determined by excluding the common pattern, for example, a document on which only the common pattern is printed is determined to be blank. Since no exclusion range is provided as in the prior art, blank page determination can be performed on the entire original surface, and the determination accuracy of blank page determination can be increased. Moreover, since no exclusion range is provided, the user's trouble can be reduced.

また、上記画像読取装置において、前記読取部が読み取った各ページの画像から文字を判読して座標と関連付けて出力する判読部と、前記判読された文字と文字の座標から各ページに印字された文字列を認識する文字列認識部と、画像が読み取られた各原稿について、前記文字列と座標を関連付けた文字列テーブルを生成する文字列テーブル生成部を備え、前記検出部は各原稿の文字列テーブルを比較することにより、前記共通パターンとして、座標と文字が一致する共通文字列を検出するようにしてもよい。   Further, in the image reading device, a reading unit that reads characters from each page image read by the reading unit and outputs the characters in association with the coordinates, and printed on each page from the read characters and the character coordinates. A character string recognizing unit for recognizing a character string; and a character string table generating unit for generating a character string table in which the character string is associated with coordinates for each document from which an image has been read. By comparing column tables, a common character string whose coordinates and characters match may be detected as the common pattern.

また、上記画像読取装置において、前記文字には数字が含まれ、前記共通文字列には、座標が一致し連続する数字が含まれるようにしてもよい。   In the image reading apparatus, the character may include a number, and the common character string may include a continuous number of coordinates that coincide with each other.

また、上記画像読取装置において、前記検出部は、原稿のうち中央を含む一部の領域を除外して、前記共通文字列を検出するようにしてもよい。   In the image reading apparatus, the detection unit may detect the common character string by excluding a part of the original including a center.

また、上記画像読取装置において、前記検出部は、前記文字列テーブル生成部にて生成された全文字列テーブルのうち一部の文字列テーブルだけを使用して、前記共通文字列を検出するようにしてもよい。   In the image reading apparatus, the detection unit detects the common character string by using only a part of the character string tables among all the character string tables generated by the character string table generation unit. It may be.

また、上記画像読取装置において、前検出部は、前記文字列テーブル生成部にて生成された全文字列テーブルを対象にして、前記共通文字列を検出するようにしてもよい。   In the image reading apparatus, the pre-detection unit may detect the common character string with respect to all the character string tables generated by the character string table generation unit.

また、上記画像読取装置において、前記検出部は、前記文字列テーブル生成部にて前記文字列テーブルが生成される度に、新しく生成された文字列テーブルに含まれない共通文字列を削除することにより、前記共通文字列を更新するようにしてもよい。   In the image reading apparatus, the detection unit deletes a common character string that is not included in the newly generated character string table every time the character string table is generated by the character string table generation unit. Thus, the common character string may be updated.

また、上記画像読取装置において、前記判断部は、前記文字列テーブルに、前記共通文字以外の文字列が含まれている場合、原稿を非白紙と判断するようにしてもよい。   In the image reading apparatus, the determination unit may determine that the document is non-blank when the character string table includes a character string other than the common character.

また、上記画像読取装置において、前記判断部は、前記文字列テーブルに、前記共通文字列と座標が重なり、文字が異なる文字列が含まれている場合には、非白紙と判断するようにしてもよい。   In the image reading apparatus, the determination unit may determine that the character string table is non-blank when the character string table includes a character string that overlaps the common character string and has different characters. Also good.

本発明によれば、ユーザの手間を減らしつつ原稿の白紙判断をより正確に行うことが可能となる。   According to the present invention, it is possible to more accurately perform blank page determination of a document while reducing user effort.

実施形態1において複合機の斜視図1 is a perspective view of a multifunction machine according to a first embodiment. 画像読取ユニットの断面図Cross section of image reading unit 複合機の電気的構成を示すブロック図Block diagram showing the electrical configuration of the MFP 画像読取ユニットの電気的構成を示すブロック図Block diagram showing the electrical configuration of the image reading unit 白紙除去シーケンスのフローチャート図Flow chart of blank paper removal sequence 原稿を示す図Illustration showing the manuscript サブルーチン1のフローチャート図Flow chart of subroutine 1 文字の座標を説明する図Illustration explaining the coordinates of characters 文字列の座標を説明する図Illustration explaining the coordinates of the string 文字テーブル1を示す図The figure which shows the character table 1 文字テーブル2を示す図The figure which shows the character table 2 文字列テーブル1を示す図The figure which shows the character string table 1 文字列テーブル2を示す図The figure which shows the character string table 2 文字列テーブル3を示す図The figure which shows the character string table 3 文字列テーブル4を示す図The figure which shows the character string table 4 文字列テーブル5を示す図The figure which shows the character string table 5 サブルーチン2のフローチャート図Flow chart of subroutine 2 共通文字列テーブルを示す図Diagram showing common character string table サブルーチン3のフローチャート図Flow chart of subroutine 3 サブルーチン4のフローチャート図Flowchart diagram of subroutine 4 実施形態2において、白紙除去シーケンスのフローチャート図In the second embodiment, a flowchart of the blank paper removal sequence サブルーチン5のフローチャート図Flowchart of subroutine 5 共通文字列テーブルの更新を示す図The figure which shows the update of the common character string table

<実施形態1>
実施形態1を、図1ないし図14を用いて説明する。
<Embodiment 1>
The first embodiment will be described with reference to FIGS.

1.複合機の外観構成
図1は本発明の画像形成装置、画像読取装置の一例である複合機1の外観を示す斜視図であり、図2は画像読取ユニット5の断面図である。尚、本明細書を通じて原稿の読み取り方向である主走査方向をX方向とし、原稿の送り方向である副走査方向をY方向とする。
1. FIG. 1 is a perspective view showing an appearance of a multifunction machine 1 as an example of an image forming apparatus and an image reading apparatus according to the present invention. FIG. 2 is a cross-sectional view of an image reading unit 5. Throughout this specification, the main scanning direction, which is the document reading direction, is the X direction, and the sub-scanning direction, which is the document feeding direction, is the Y direction.

図1に示すように、複合機1はボックス型の本体部2と、本体部2の上方に配置された画像読取ユニット5を備えている。本体部2には印刷ユニット(本発明の「印刷部」の一例)3が収容されている。印刷ユニット3は、例えば、画像読取ユニット5にて読み取った画像データに基づいて紙などの被記録媒体に対してトナー、インクなどを用いて電子写真方式により画像を形成(印刷)する装置である。   As shown in FIG. 1, the multifunction machine 1 includes a box-type main body 2 and an image reading unit 5 disposed above the main body 2. The main body 2 accommodates a printing unit 3 (an example of the “printing unit” in the present invention) 3. The printing unit 3 is an apparatus that forms (prints) an image on a recording medium such as paper based on the image data read by the image reading unit 5 by using an electrophotographic method using toner, ink, or the like. .

画像読取ユニット5は原稿を読み取るものであり、CIS30、ADF40、原稿載置部50を含む。原稿載置部50は、台枠51、透明なガラス板からなる第1プラテンガラス52、第2プラテンガラス53、及びこれらのガラス52、53の中間に配置された中間枠54を含む。原稿カバー48は、原稿載置部50を覆う閉姿勢と原稿載置部50を開放する開姿勢とに回動可能であり、複合機1の本体部2の後側(操作部11、表示部12等が設けられる側を前側とする)に連結されている。原稿カバー48上に、ADF40が設けられている。   The image reading unit 5 reads a document and includes a CIS 30, an ADF 40, and a document placement unit 50. The document placing unit 50 includes a frame 51, a first platen glass 52 made of a transparent glass plate, a second platen glass 53, and an intermediate frame 54 disposed between these glasses 52 and 53. The document cover 48 can be rotated between a closed posture that covers the document placement portion 50 and an open posture that opens the document placement portion 50, and the rear side of the main body 2 of the multifunction machine 1 (the operation portion 11, the display portion). The side on which 12 etc. are provided is connected to the front side). An ADF 40 is provided on the document cover 48.

図2に示すように、ADF40はADFカバー41、原稿トレイ42、搬送路43、給紙ローラ44A、一対の搬送ローラ44B、一対の排紙ローラ44C等の各種ローラ、これら各種ローラを駆動するADFモータ86、排紙トレイ46、および押圧部材47を含む。ADF40は、原稿トレイ42に載置されている原稿を給紙ローラ44Aにより、一枚ずつ搬送して、第2プラテンガラス53上を通過させ、排紙トレイ46に排出する。押圧部材47は、第2プラテンガラス53上を通過する原稿が第2プラテンガラス53から浮かないように、原稿を第2プラテンガラス53に押圧する。さらに、ADF40には、原稿トレイ42にセットされた原稿を検出するための、フォトセンサ等の原稿センサ49が設けられている。   As shown in FIG. 2, the ADF 40 includes an ADF cover 41, a document tray 42, a conveyance path 43, various rollers such as a paper feed roller 44A, a pair of conveyance rollers 44B, a pair of paper discharge rollers 44C, and an ADF that drives these various rollers. A motor 86, a paper discharge tray 46, and a pressing member 47 are included. The ADF 40 conveys the originals placed on the original tray 42 one by one by the paper feed roller 44 </ b> A, passes the second platen glass 53, and discharges the originals to the paper output tray 46. The pressing member 47 presses the document against the second platen glass 53 so that the document passing over the second platen glass 53 does not float from the second platen glass 53. Further, the ADF 40 is provided with a document sensor 49 such as a photo sensor for detecting a document set on the document tray 42.

CIS30は、原稿載置部50の下方に設けられている。CIS30は、複数の受光素子が図2の紙面垂直方向に直線状に配列されているリニアイメージセンサ33、RGB3色の発光ダイオードなどで構成される光源31、原稿で反射された光源31からの反射光をリニアイメージセンサ33の各受光素子に結像させるロッドレンズアレイ32、これらが搭載されるキャリッジ34、およびキャリッジ34を搬送する図示しない搬送機構を含む。リニアイメージセンサ33は、受光素子に結像した反射光の輝度や色度を検出し、原稿の画像に基づくデータを生成する。   The CIS 30 is provided below the document placement unit 50. The CIS 30 includes a linear image sensor 33 in which a plurality of light receiving elements are linearly arranged in a direction perpendicular to the paper surface of FIG. 2, a light source 31 composed of RGB three-color light emitting diodes, etc., and a reflection from the light source 31 reflected from the document. It includes a rod lens array 32 that focuses light on each light receiving element of the linear image sensor 33, a carriage 34 on which these are mounted, and a transport mechanism (not shown) that transports the carriage 34. The linear image sensor 33 detects the brightness and chromaticity of the reflected light imaged on the light receiving element, and generates data based on the image of the document.

画像読取ユニット5は、第1プラテンガラス52にセットされた原稿を読み取るときはFBモータ84によってCIS30を第1プラテンガラス52に平行な副走査方向(図2中のA方向)に搬送しながら原稿を1ラインずつ読み取る。一方、ADF40によって搬送される原稿を読み取るときは、画像読取ユニット5は、FBモータ84によってCIS30を第2プラテンガラス53の直下に移動させ、第2プラテンガラス上の読取位置Pを通過する原稿を、イメージセンサ33によって1ラインずつ読み取る。   When reading the original set on the first platen glass 52, the image reading unit 5 conveys the CIS 30 by the FB motor 84 in the sub-scanning direction (A direction in FIG. 2) parallel to the first platen glass 52. Is read line by line. On the other hand, when reading a document conveyed by the ADF 40, the image reading unit 5 moves the CIS 30 directly below the second platen glass 53 by the FB motor 84, and reads the document that passes the reading position P on the second platen glass. The image sensor 33 reads each line.

さらに、複合機1の前側には、各種のボタンからなり、ユーザからの操作指令を受け付ける操作部11、複合機1の状態を表示する液晶ディスプレイからなる表示部12が設けられている。   Further, on the front side of the multifunction device 1, an operation unit 11 that includes various buttons and receives an operation command from a user, and a display unit 12 that includes a liquid crystal display that displays the state of the multifunction device 1 are provided.

2.電気的構成
図3は複合機1の電気的構成を示すブロック図、図4は画像読取ユニットの電気的構成を示すブロック図である。複合機1は、制御部70、印刷ユニット3、画像読取ユニット5及び通信部7を備えて構成されている。制御部70はCPU71a、ROM71b、及びRAM71cを備えている。CPU71aはROM71bに記憶されている各種のプログラムを実行することによって複合機1の各部を制御する。ROM71bはCPU71aが実行する各種のプログラム(例えば、後述する白紙除去シーケンスを実行するためのプログラム)やプログラムの実行に用いるデータ(例えば、後述するOCR辞書)などを記憶している。RAM71cはCPU71aが各種の処理を実行するための主記憶装置として用いられる。また、RAM71cには、画像読取ユニット5にて読み取った原稿の画像データが記憶される。
2. Electrical Configuration FIG. 3 is a block diagram showing the electrical configuration of the multifunction machine 1, and FIG. 4 is a block diagram showing the electrical configuration of the image reading unit. The multifunction machine 1 includes a control unit 70, a printing unit 3, an image reading unit 5, and a communication unit 7. The control unit 70 includes a CPU 71a, a ROM 71b, and a RAM 71c. The CPU 71a controls each part of the multifunction device 1 by executing various programs stored in the ROM 71b. The ROM 71b stores various programs executed by the CPU 71a (for example, a program for executing a blank sheet removal sequence described later), data used for execution of the program (for example, an OCR dictionary described later), and the like. The RAM 71c is used as a main storage device for the CPU 71a to execute various processes. The RAM 71c stores image data of a document read by the image reading unit 5.

図4は、画像読取ユニット5の電気的構成を示すブロック図である。画像読取ユニット5は、ASIC80、FBモータ84、FBモータ駆動回路85、ADFモータ86、ADFモータ駆動回路87、CIS30、光源制御回路88、AFE89、原稿センサ49、操作部11、表示部12などを備えて構成されている。   FIG. 4 is a block diagram showing an electrical configuration of the image reading unit 5. The image reading unit 5 includes an ASIC 80, an FB motor 84, an FB motor drive circuit 85, an ADF motor 86, an ADF motor drive circuit 87, a CIS 30, a light source control circuit 88, an AFE 89, an original sensor 49, an operation unit 11, a display unit 12, and the like. It is prepared for.

ASIC80には、FBモータ駆動回路85、ADFモータ駆動回路87、光源制御回路88、AFE89、操作部11、表示部12が接続されている。ASIC80はCPU71aの制御下でこれらを制御するとともに、AFE89から出力された出力値(画素値)にガンマ補正やシェーディング補正、その他各種の画像処理を施して画素毎にRGB3つの画素値を持つ画像データを生成する。そして、生成された画像データは、RAM71cに記憶される。   Connected to the ASIC 80 are an FB motor drive circuit 85, an ADF motor drive circuit 87, a light source control circuit 88, an AFE 89, an operation unit 11, and a display unit 12. The ASIC 80 controls these under the control of the CPU 71a, and applies gamma correction, shading correction, and other various image processing to the output value (pixel value) output from the AFE 89, and image data having three RGB pixel values for each pixel. Is generated. The generated image data is stored in the RAM 71c.

AFE89(Analog Front End)は、イメージセンサ33から出力されるアナログの出力値(電圧)をデジタルの出力値(画素値)に変換する回路である。   The AFE 89 (Analog Front End) is a circuit that converts an analog output value (voltage) output from the image sensor 33 into a digital output value (pixel value).

3.白紙除去シーケンス
本実施形態の複合機1は、画像読取ユニット5で読み取った原稿のうち「白紙」の原稿を除去する機能を備えている。尚、ここで言う白紙にはファイル名、ページなどいわゆる定型画像のみ印刷され本文画像の印刷がない準白紙原稿と、全面白紙原稿(定型画像、本文画像とも印刷されていない原稿)の双方を含むものとする。
3. Blank Paper Removal Sequence The multifunction machine 1 of the present embodiment has a function of removing “blank paper” originals from the originals read by the image reading unit 5. Note that the white paper referred to here includes both semi-blank originals that are printed only with so-called standard images, such as file names and pages, and that are not printed with full-text images, and full-scale blank originals (originals with neither fixed-form images nor text images printed). Shall be.

以下、図5を参照して、上記白紙除去を行う白紙除去シーケンスについて詳細を説明する。白紙除去シーケンスは複合機1の起動に伴って実行され、スタート直後、オペレータの入力操作を待つ待機状態となる(S1)。そして、原稿トレイ42に原稿がセットされ操作部11のスタートキーが押されると、S2に移行する。尚、ここでは、原稿トレイ42に対して図6に示す全5枚の原稿がセットされたものとして、以下説明を行う。   Hereinafter, the blank sheet removal sequence for performing the blank sheet removal will be described in detail with reference to FIG. The blank sheet removal sequence is executed as the multifunction device 1 is started, and immediately after the start, the standby state is waited for an input operation by the operator (S1). When a document is set on the document tray 42 and the start key of the operation unit 11 is pressed, the process proceeds to S2. Here, the following description will be made assuming that all the five originals shown in FIG. 6 are set on the original tray 42.

S2では、制御部70のCPU71aによりADF40を駆動させる処理が開始される。これにより原稿トレイ42上にセットされた一枚目の原稿が、表面を上に向けた状態で搬送路43に送りだされる。そして、S3では、S2で送り出された原稿(ここでは、1枚目の原稿)の先端が読取位置Pに達したかどうか判定する処理が行われる。原稿の先端が読取位置Pに達するまでの間は、S3でNO判定され、S3の処理を繰り返す状態となる。   In S2, the CPU 71a of the control unit 70 starts processing for driving the ADF 40. As a result, the first document set on the document tray 42 is sent to the transport path 43 with the front side facing up. In S3, a process for determining whether or not the leading edge of the document sent out in S2 (here, the first document) has reached the reading position P is performed. Until the leading edge of the document reaches the reading position P, NO is determined in S3, and the process in S3 is repeated.

そして、送りだされた原稿の先端が読取位置Pに達するとS3でYES判定され、処理はS4に移る。S4では、CIS30による原稿の読み取りが行われる。具体的には、第2プラテンガラス53上の読取位置Pを通過する原稿を、イメージセンサ33が1ラインずつ読み取ってゆく。そして、全ラインについて読み取りが完了すると、その原稿は排紙トレイ46上に排紙される。   When the leading edge of the fed document reaches the reading position P, a YES determination is made in S3, and the process proceeds to S4. In S4, the document is read by the CIS 30. Specifically, the image sensor 33 reads the original passing through the reading position P on the second platen glass 53 line by line. When all the lines have been read, the document is discharged onto the discharge tray 46.

S4に続くS5では、CPU71aにより、S4にて読み取った原稿が1枚目の原稿か判定される。S4で読み取った原稿は1枚目であるため、S5ではYES判定される。S5でYES判定されると、次にS6に移行する。S6では、S4にて読み取った原稿の画像データをRAM71cに対して保存する処理がCPU71aにより実行される。これにて、1枚目の原稿の画像データがRAM71cに対して保存(記憶)される。   In S5 following S4, the CPU 71a determines whether the document read in S4 is the first document. Since the document read in S4 is the first document, YES is determined in S5. If YES is determined in S5, the process proceeds to S6. In S6, the CPU 71a executes processing for saving the image data of the original read in S4 in the RAM 71c. Thus, the image data of the first original is saved (stored) in the RAM 71c.

S7では、保存した画像データから文字テーブルと文字列テーブルを作成する処理が、CPU71aにより実行される。尚、文字テーブルとは、原稿に印刷された文字(数字を含む)や図柄を、座標(原稿上の座標)と関連付けて記憶させたものであり、また文字列テーブルとは、文字がX方向(原稿の主走査方向)に連なった文字列を座標(原稿上の座標)と関連付けて記憶させたものである。尚、これら文字テーブル、文字列テーブル及び後述する共通文字列テーブルはいずれもRAM71cのワーキングエリアに作成される。そして、この文字テーブルと文字列テーブルを作成する処理はサブルーチン化されており、S7では、図7に示すサブルーチン1が読み出される。   In S7, processing for creating a character table and a character string table from the stored image data is executed by the CPU 71a. The character table stores characters (including numbers) and designs printed on a document in association with coordinates (coordinates on the document), and the character table is a character string in the X direction. A character string continuous in the (original scanning direction of the document) is stored in association with coordinates (coordinates on the document). These character table, character string table, and common character string table described later are all created in the working area of the RAM 71c. The process for creating the character table and the character string table is made into a subroutine, and in S7, the subroutine 1 shown in FIG. 7 is read.

サブルーチン1は、図7に示すように、S41〜S49の9つのステップから構成されている。そして、S41では、読み取った原稿について黒画素が探索される。この例では、図8aに示すように、原稿の座標基準を原稿の上縁部左端とし、主走査方向(図8a中の左右方向)をX方向、副走査方向(図8a中の上下方向)をY方向としている。黒画素は、座標基準である原稿上縁部左端を始端として、X方向に探査される。   Subroutine 1 is composed of nine steps S41 to S49 as shown in FIG. In step S41, a black pixel is searched for the read original. In this example, as shown in FIG. 8a, the document coordinate reference is the left edge of the upper edge of the document, the main scanning direction (left-right direction in FIG. 8a) is the X direction, and the sub-scanning direction (up-down direction in FIG. 8a). Is the Y direction. The black pixel is searched in the X direction starting from the left edge of the upper edge of the document, which is the coordinate reference.

黒画素が検出されると、S42でYES判定されS43に移る。S43では、黒画素が連続する連続領域が探索され、画像データが切りだされる。具体例を挙げると、図6に示す1枚目の原稿では、原稿左端の上部に「title」なる文字が印刷されている。そのため、初回に行われるS43の処理では「title」のうち、最初の文字「t」を囲む連続領域Uが検出され、連続領域Uの画像データが切り出される。   If a black pixel is detected, YES is determined in S42, and the process proceeds to S43. In S43, a continuous region in which black pixels are continuous is searched, and image data is cut out. As a specific example, in the first document shown in FIG. 6, the characters “title” are printed on the upper left side of the document. Therefore, in the process of S43 performed for the first time, the continuous area U surrounding the first character “t” in “title” is detected, and the image data of the continuous area U is cut out.

S44では、S43にて切り出した画像データについて、文字判読する処理がCPU71aにより行われる。具体的には、切り出した画像データから形状を解析し、それをOCR辞書に登録された文字(キャラクタ)の形状を照合して、OCR辞書から形状が最も近い文字を検出することにより、文字判読する。ここでは、S43にて切り出した画像データは文字「t」であると、CPU71aにて判読される。尚、S44の文字判定処理はいわゆる光学文字認識(OCR:Optical Character Recognition)として知られた技術である。また、ここでいう「文字」には、ひらがな、かたかな、ローマ字の他、数字が含まれる。また、CPU71aが実行するS44の処理により、本発明の「判読部」の処理機能が実現されている。   In S44, the CPU 71a performs a character reading process on the image data cut out in S43. Specifically, character interpretation is performed by analyzing the shape from the extracted image data, comparing the shape of the character (character) registered in the OCR dictionary, and detecting the closest character from the OCR dictionary. To do. Here, the CPU 71a interprets that the image data cut out in S43 is the character “t”. The character determination processing in S44 is a technique known as so-called optical character recognition (OCR). In addition, the “letter” here includes numbers in addition to hiragana, katakana, and romaji. Further, the processing function of the “reading unit” of the present invention is realized by the processing of S44 executed by the CPU 71a.

続く、S45では、S43にて切り出した画像データがS44にて文字として判読できたか、判定する処理がCPU71aにて実行される。ここでは、S43にて切り出した画像データは文字として判読できていることから、S45ではYES判定され、処理はS46に移る。   In S45, the CPU 71a determines whether the image data cut out in S43 has been read as characters in S44. Here, since the image data cut out in S43 can be read as characters, YES is determined in S45, and the process proceeds to S46.

そして、S46では、S44にて判読した文字に関する情報を、文字テーブルに書き込む処理(保存する処理)が行われる。文字テーブルは、図9a、図9bに示すように、文字と、その文字の座標を表としてまとめたものである。そして、この実施形態では、文字の座標を、画像データの切り出しに使用した連続領域(すなわち、文字を囲む矩形領域)Uの座標(X1、X2、Y1、Y2)を使って表すことにしている(図8a参照)。   In S46, a process of writing (storing) information related to the character read in S44 to the character table is performed. As shown in FIGS. 9a and 9b, the character table is a table in which characters and their coordinates are collected. In this embodiment, the coordinates of the characters are expressed using the coordinates (X1, X2, Y1, Y2) of the continuous area U (that is, the rectangular area surrounding the characters) U used to cut out the image data. (See FIG. 8a).

従って、ここでは、図9aに示す文字テーブルの文字の欄に「t」が書き込まれ、また、文字の座標の欄にX1=10、X2=14、Y1=10、Y2=20がそれぞれ書き込まれる(図8aも参照)。   Therefore, “t” is written in the character column of the character table shown in FIG. 9a, and X1 = 10, X2 = 14, Y1 = 10, and Y2 = 20 are written in the character coordinate column. (See also FIG. 8a).

尚、S44で切り出した画像データについて、文字が判読できなかった場合には、S45の判定処理でNO判定される。そして、S45でNO判定された場合には、S47に移行する。S47では、判読できなかった画像データは図柄であると認識し、その図柄は座標とともに文字テーブルに書き込まれる。尚、図柄の座標としては、文字と同様に図柄を囲む連続領域Uの座標が書き込まれる。   Note that if the image data cut out in S44 cannot be read, NO is determined in the determination process in S45. If NO is determined in S45, the process proceeds to S47. In S47, the image data that could not be read is recognized as a symbol, and the symbol is written in the character table together with the coordinates. As the symbol coordinates, the coordinates of the continuous area U surrounding the symbols are written as in the case of characters.

S46、S47の処理が完了すると、次にS48の処理が行われる。S48では、原稿の全画素について黒画素の探索を行ったか判定する処理がCPU71aにより実行される。この段階では、原稿左端の上部しか行っていないことから、S48ではNO判定される。そして、S48でNO判定されると、処理はS41に戻り、CPU71aにより、既に探索済みの領域を除外して、黒画素を探索する処理が再開される。   When the processes of S46 and S47 are completed, the process of S48 is performed next. In S48, the CPU 71a executes processing for determining whether or not black pixels have been searched for all the pixels of the document. At this stage, since only the upper part of the left end of the document has been performed, NO is determined in S48. If NO is determined in S48, the process returns to S41, and the CPU 71a resumes the process of searching for black pixels by excluding the already searched area.

そして、新たな黒画素が検出されると、S43にて連続領域Uが検出され、更に連続領域Uの画像データが切り出される。そして、S44では切り出した画像データを文字判読する処理が行われる。その後、S45にて、切り出した画像データを文字判読できたか判定する処理が行われ、文字判読できていれば、S46にて、文字テーブルに、文字とその文字の座標が書き込まれる。この例では、2回目に行うS46の処理にて、原稿左端の上部に印刷された「title」なる文字列のうち、2番目の文字である「i」と、「i」を囲む連続領域Uの座標が図9aに示す文字テーブルに書き込まれる。   When a new black pixel is detected, a continuous area U is detected in S43, and image data of the continuous area U is further cut out. In S44, a process of reading the extracted image data is performed. Thereafter, in S45, a process is performed to determine whether or not the extracted image data has been read. If the character has been read, the character and the coordinates of the character are written in the character table in S46. In this example, the second character “i” and the continuous region U surrounding “i” in the character string “title” printed in the upper part of the left end of the document in the process of S46 performed for the second time. Are written in the character table shown in FIG. 9a.

このような処理が繰り返し行われることで、画像データの切り出しと、切り出した画像データの文字判読が行われ、その結果が文字テーブルに順に書き込まれてゆく。そして、1枚目の原稿には「t」、「i」、「t」、「l」、「e」、「a」、「b」、「c」、「い」、「い」、「え」、「1」、「A」、「.」、「d」、「o」、「c」の合計17の文字が印字されていることから、サブルーチン1の実行により、文字テーブルには、上記した17個の文字と、その文字の座標が書き込まれることとなる。   By repeatedly performing such processing, the image data is cut out and the extracted image data is interpreted, and the result is sequentially written in the character table. The first document includes “t”, “i”, “t”, “l”, “e”, “a”, “b”, “c”, “i”, “i”, “ E ”,“ 1 ”,“ A ”,“. ”,“ D ”,“ o ”,“ c ”, a total of 17 characters are printed. The 17 characters described above and the coordinates of the characters are written.

そして、原稿の全画素について黒画素の探索が終了すると、S48の判定でYES判定され、処理はS49に移行する。S49では、連なっている文字を文字列としてテーブルを再構成することにより、文字列テーブルが作成される(CPU71aにより作成される)。   When the search for the black pixel is completed for all the pixels of the document, the determination in S48 is YES, and the process proceeds to S49. In S49, a character string table is created by reconfiguring the table using the consecutive characters as a character string (created by the CPU 71a).

具体的に説明すると、文字が文字列を構成しているかどうかは、2つの条件を満たしているかどうかにより判断される。
(1)Y座標が概ね一致している。
(2)X座標が連続している。
More specifically, whether or not a character constitutes a character string is determined based on whether or not two conditions are satisfied.
(1) The Y coordinates are almost the same.
(2) The X coordinate is continuous.

例えば、1枚目原稿の文字テーブルを構成する17個の文字のうち「t」、「i」、「t」、「l」、「e」の5文字はいずれもY1の座標が「10」、Y2の座標が「20」であり、Y座標が一致している。よって、(1)の条件をクリアしている。   For example, among the 17 characters that make up the character table of the first original, 5 characters “t”, “i”, “t”, “l”, and “e” all have a Y1 coordinate of “10”. , Y2 is “20”, and the Y coordinates are the same. Therefore, the condition (1) is cleared.

また「t」、「i」、「t」、「l」、「e」の5文字は、X座標が連続している。具体的には、1番目の文字「t」はX2の座標が「14」であるのに対して、2番目の文字「i」はX1の座標が「15」であり、1番目の文字「t」と2番目の「i」のX座標は連続している。また、2番目の文字「i」はX2の座標「19」であるのに対して、3番目の文字「t」のX1の座標「20」であり、2番目の文字「i」と3番目の文字「t」のX座標は連続している。また、3番目の文字「t」と4番目の文字「i」と、4番目の文字「i」と5番目の文字「e」はX座標が連続している。   In addition, the X coordinates of five characters “t”, “i”, “t”, “l”, and “e” are continuous. Specifically, the first character “t” has the X2 coordinate “14”, whereas the second character “i” has the X1 coordinate “15” and the first character “t”. The X coordinates of “t” and the second “i” are continuous. Also, the second character “i” is the X2 coordinate “19”, whereas the third character “t” is the X1 coordinate “20”, and the second character “i” is the third character “t”. The X coordinate of the character “t” is continuous. The third character “t”, the fourth character “i”, the fourth character “i”, and the fifth character “e” have consecutive X coordinates.

このように「t」、「i」、「t」、「l」、「e」の5文字は、(1)の条件と(2)の条件の双方を満たしているので、文字列と認識される。   As described above, the five characters “t”, “i”, “t”, “l”, and “e” satisfy both the conditions (1) and (2), and thus are recognized as character strings. Is done.

そして、1枚目の原稿のうち、番号1〜番号5の5文字(「t」、「i」、「t」、「l」、「e」)と、番号6〜番号8の3文字(「a」、「b」、「c」)と、番号9〜番号11の3文字(「い」、「い」、「え」)と、番号13〜番号17の5文字(「A」、「.」、「d」、「o」、「c」)は、いずれも(1)の条件と(2)の条件を満たしており、文字列と認識される。   Of the first document, five characters (“t”, “i”, “t”, “l”, “e”) of number 1 to number 5 and three characters of number 6 to number 8 ( “A”, “b”, “c”), three characters from number 9 to number 11 (“i”, “i”, “e”), and five characters from number 13 to number 17 (“A”, ".", "D", "o", "c") all satisfy the conditions (1) and (2) and are recognized as character strings.

文字列テーブルは、図10a〜図10eに示すように、文字列と、その文字列の座標を表としてまとめたものである。そして、この実施形態では、文字列の座標を、文字列を囲む矩形領域Vの座標(X3、X4、Y3、Y4)を使って表すことにしている(図8b参照)。   As shown in FIGS. 10a to 10e, the character string table is a table in which character strings and the coordinates of the character strings are collected. In this embodiment, the coordinates of the character string are expressed using the coordinates (X3, X4, Y3, Y4) of the rectangular area V surrounding the character string (see FIG. 8b).

以上のことから、図10aに示す文字列テーブル1には「title」、「abc」、「いいえ」、「1」、「A.doc」の5つの文字列と、各文字列の座標がそれぞれ書き込まれることになる。尚、本実施形態では、単独文字を文字列に含めており、文字「1」についても、文字列として文字列テーブルに書き込むようにしている。また、文字テーブル1や文字列テーブル1など、テーブルの末尾に付した添え字は、原稿の枚数を示す。すなわち、文字テーブル1は1枚目原稿の文字テーブルを意味、文字列テーブル1は、1枚目原稿の文字列テーブルを意味する。また、CPU71aが実行するS49の処理により、本発明の「文字列認識部」と「文字列テーブル生成部」の果たす処理機能が実現されている。   From the above, the character string table 1 shown in FIG. 10a includes five character strings “title”, “abc”, “No”, “1”, “A.doc”, and coordinates of each character string. Will be written. In this embodiment, a single character is included in the character string, and the character “1” is also written in the character string table as a character string. A subscript attached to the end of the table such as the character table 1 or the character string table 1 indicates the number of documents. That is, the character table 1 means the character table of the first original, and the character string table 1 means the character string table of the first original. Further, the processing function performed by the “character string recognition unit” and the “character string table generation unit” of the present invention is realized by the processing of S49 executed by the CPU 71a.

そして、S49にて、文字列テーブルが作成されるとサブルーチン1は終了し、処理は図5のメインフローに戻り、S23の処理が行われる。S23では、原稿センサ49の出力に基づいて、原稿トレイ42上に次の原稿があるか判定される。この段階では、1枚目の原稿しか原稿の読み取りを終了しておらず、原稿トレイ42上には、残りの原稿が残されているため、S23ではYES判定される。   When the character string table is created in S49, the subroutine 1 ends, the process returns to the main flow of FIG. 5, and the process of S23 is performed. In S 23, it is determined whether there is a next document on the document tray 42 based on the output of the document sensor 49. At this stage, only the first document has been read, and the remaining document remains on the document tray 42, so a YES determination is made in S23.

そのため、白紙除去シーケンスはS2に戻り、ADF40により、原稿トレイ42上にセットされた二枚目の原稿が、表面を上に向けた状態で搬送路43に送りだされる(S3)。そして、原稿の先端が読取位置Pに達すると、CIS30による原稿の読み取りが行われる(S4)。   For this reason, the blank paper removal sequence returns to S2, and the second document set on the document tray 42 is sent to the transport path 43 by the ADF 40 with the front side facing up (S3). When the leading edge of the document reaches the reading position P, the document is read by the CIS 30 (S4).

S4に続くS5では、CPU71aにより、S4にて読み取った原稿が1枚目の原稿か判定される。S4で読み取った原稿は2枚目であるため、S5ではNO判定される。S5でNO判定されると、次にS8に移行する。S8では、S4にて読み取った原稿が2枚目の原稿か判定される。   In S5 following S4, the CPU 71a determines whether the document read in S4 is the first document. Since the document read in S4 is the second document, NO is determined in S5. If NO is determined in S5, the process proceeds to S8. In S8, it is determined whether the document read in S4 is the second document.

ここでは、S4で2枚目の原稿を読み取っているので、S8ではYES判定される。その後、処理はS9に移行して、S4にて読み取った原稿の画像データをRAM71cに対して保存する処理がCPU71aにより実行される。これにて、2枚目の原稿の画像データがRAM71cに対して保存(記憶)される。   Here, since the second original is read in S4, YES is determined in S8. Thereafter, the process proceeds to S9, and the CPU 71a executes a process for storing the image data of the document read in S4 in the RAM 71c. Thus, the image data of the second document is saved (stored) in the RAM 71c.

S9にて、読み取った画像データをRAM71cに対して記憶すると、次にS10の処理が実行される。S10の処理は、S7と同じ処理であり、図7に示すサブルーチン1が読み出され、2枚目の原稿について、読み取った画像データから文字テーブルと文字列テーブルを作成する処理が行われる。これにより、図9bに示す文字テーブル2と、図10bに示す文字列テーブル2が作成されることとなる。   When the read image data is stored in the RAM 71c in S9, the process of S10 is executed next. The process of S10 is the same process as S7. Subroutine 1 shown in FIG. 7 is read, and a process of creating a character table and a character string table from the read image data is performed for the second original. As a result, the character table 2 shown in FIG. 9b and the character string table 2 shown in FIG. 10b are created.

そして、サブルーチン1の終了後、図5のメインフローに戻り、S10の処理が行われる。S10の処理は、1枚目原稿の文字列テーブル1と2枚目原稿の文字列テーブルから、共通文字列テーブルを作成する処理がCPU71aにより実行される。この共通文字列テーブルを作成する処理はサブルーチン化されており、S11では図11に示すサブルーチン2が読み出される。   Then, after the subroutine 1 is completed, the process returns to the main flow of FIG. 5 and the process of S10 is performed. In S10, the CPU 71a executes a process of creating a common character string table from the character string table 1 of the first original and the character string table of the second original. The process of creating the common character string table is made into a subroutine, and subroutine S2 shown in FIG. 11 is read in S11.

サブルーチン2は、図11に示すようにS61〜S74の14ステップから構成されている。このサブルーチン2は、1枚目原稿の文字列テーブル1の「行番号iの文字列」に対し、それに一致する文字列が2枚目原稿の文字列テーブル2に含まれているか検索する処理(S61〜S69)を、文字列テーブル1の「行番号iを更新」しながら繰り返し行うことで、1枚目原稿の文字列テーブル1と2枚目原稿の文字列テーブル2に共通する共通文字列を検出し、共通文字列テーブルを作成するものである。   Subroutine 2 includes 14 steps S61 to S74 as shown in FIG. This subroutine 2 searches for whether or not a character string matching the “character string of line number i” in the character string table 1 of the first original is included in the character string table 2 of the second original ( S61 to S69) are repeated while updating the line number i in the character string table 1, so that the common character string common to the character string table 1 of the first original and the character string table 2 of the second original is common. And a common character string table is created.

尚、この実施形態では、下記(3A)の条件と(4)の条件を満たすか、(3B)の条件と(4)の条件を満たした場合に、文字列は共通であると判断する。   In this embodiment, the character strings are determined to be common when the following conditions (3A) and (4) are satisfied or when the conditions (3B) and (4) are satisfied.

(3A)文字列を構成する文字が一致している(S62)。
(3B)文字列が数字で、かつ文字列テーブル1の「i」行の数字+1の値が文字列テーブル2の行にある(S63)。
(4)文字列の座標がほぼ一致している(S64)。
(3A) The characters constituting the character string match (S62).
(3B) The character string is a number, and the value of the number +1 in the “i” row of the character string table 1 is in the row of the character string table 2 (S63).
(4) The coordinates of the character strings are almost the same (S64).

さて、S61では、1枚目原稿の文字列テーブル1について行番号「i」が「1」に設定され、2枚目の文字列テーブルについて行番号「j」が「1」に設定される。   In S61, the line number “i” is set to “1” for the character string table 1 of the first original, and the line number “j” is set to “1” for the second character string table.

次にS62では、文字列テーブル1の「i」行目の文字列と、文字列テーブル2の「j」行目の文字列について、文字が一致しているかどうか判定される。ここでは、「i」と「j」はいずれも1であるため、文字列テーブル1と文字テーブル2の1行目の文字列について、文字の一致が判定される。   Next, in S62, it is determined whether or not the characters in the character string in the “i” line of the character string table 1 match the character string in the “j” line in the character string table 2. Here, since both “i” and “j” are 1, character matching is determined for the first character strings in the character string table 1 and the character table 2.

文字列テーブル1と文字列テーブル2の1行目の文字列は、いずれも「title」であることから、S62ではYES判定される。その後、処理はS64に移行する。尚、S62でNO判定された場合には、S63に移行する。S63では、文字列が数字で、かつ文字列テーブル1の「i」行の数字+1の値が文字列テーブル2の行にあるか判定(CPU71aにより判定される)される。   Since the character strings in the first row of the character string table 1 and the character string table 2 are both “title”, YES is determined in S62. Thereafter, the process proceeds to S64. If NO is determined in S62, the process proceeds to S63. In S63, it is determined whether the character string is a numeral and the value of the number “i” in the character string table 1 plus the value +1 is in the line of the character string table 2 (determined by the CPU 71a).

S64では、2つの文字列が同じような座標にあるか判定される(CPU71aにより判定される)。従って、ここでは、文字列テーブル1の1行目に書き込まれた文字列「title」と、文字列テーブル2の1行目に書き込まれた文字列「title」がほぼ同じような座標か判定される。   In S64, it is determined whether the two character strings have the same coordinates (determined by the CPU 71a). Therefore, here, it is determined whether the character string “title” written in the first line of the character string table 1 and the character string “title” written in the first line of the character string table 2 have substantially the same coordinates. The

文字列テーブル1の1行目に書き込まれた文字列「title」と、文字列テーブル2の1行目に書き込まれた文字列「title」の座標は、X1=10、X=14、Y1=10、Y2=20であり、4つの座標は全て一致している(図10a、図10b参照)。そのため、S64ではYES判定され、次にS65に移行(ただし、NO判定された場合には、S68に移行する)する。   The coordinates of the character string “title” written in the first line of the character string table 1 and the character string “title” written in the first line of the character string table 2 are X1 = 10, X = 14, Y1 = 10, Y2 = 20, and all four coordinates coincide (see FIGS. 10a and 10b). Therefore, YES is determined in S64, and then the process proceeds to S65 (however, if NO is determined, the process proceeds to S68).

尚、S64では、2つの文字列が同じような座標にある場合であれば、YES判定するようになっており、2つの文字列の座標が完全に一致している場合に加えて、同じような座標にある場合(具体的には、2つの文字列の座標に数mm程度の相違がある場合)もYES判定される。このように座標の一致判断に余裕を持たせることで、印刷ズレにより、文字列の座標に数mm程度のズレが発生したとしても、S64でNO判断されない。   In S64, if the two character strings are at the same coordinates, the determination is YES, and in addition to the case where the coordinates of the two character strings are completely the same, YES (specifically, when there is a difference of about several millimeters between the coordinates of two character strings), YES is also determined. By providing a margin for the coordinate determination in this way, even if a shift of about several millimeters occurs in the coordinates of the character string due to the printing shift, NO is not determined in S64.

さて、S65では、文字列は「数字」か、判定される。文字列「title」は「数字」でないため、S65ではNO判定され、次にS66に移行する。そして、S66では、共通文字列テーブルに、共通文字列と座標を保存する処理が行われる(CPU71aにより行われる)。   In S65, it is determined whether the character string is “numeric”. Since the character string “title” is not “number”, a NO determination is made in S65, and then the process proceeds to S66. In S66, a process of saving the common character string and coordinates in the common character string table is performed (performed by the CPU 71a).

共通文字列テーブルとは、共通文字列と、その共通文字列の座標を表としてまとめたもの(別の言い方をすると、共通文字列と、その座標を関連付けて記憶させたもの)である(図12参照)。従って、ここでは、共通文字列テーブルの1行目に、文字列「title」と、その座標が保存される(書き込まれる)。また、S65でYES判定された場合には、S67に移行して共通文字列テーブルに、共通文字列として「数字」と座標が保存される(書き込まれる)。   The common character string table is a table in which the common character strings and the coordinates of the common character strings are summarized as a table (in other words, the common character strings and the coordinates are stored in association with each other) (see FIG. 12). Therefore, the character string “title” and its coordinates are stored (written) in the first line of the common character string table. If YES is determined in S65, the process proceeds to S67, and “numerals” and coordinates are stored (written) as a common character string in the common character string table.

S66又はS67の処理が終了すると、次にS68の処理が行われる。S68では、文字列テーブル2の行番号である「j」をインクリメント(+1加算)する処理が行われる。従って、ここでは、文字列テーブル2の行番号が「1」から「2」にインクリメントされる。   When the process of S66 or S67 is completed, the process of S68 is performed next. In S68, a process of incrementing (adding +1) “j” which is the line number of the character string table 2 is performed. Therefore, here, the line number of the character string table 2 is incremented from “1” to “2”.

次に、S69では、文字列テーブル2の最大行数まで検索したか、CPU71aにより判定される。この段階では、文字列テーブル2の1行目までしか検索されていないので、NO判定される。S69でNO判定されると、処理はS62に戻る。   Next, in S69, the CPU 71a determines whether the maximum number of lines in the character string table 2 has been searched. At this stage, since only the first line of the character string table 2 has been searched, NO is determined. If a NO determination is made in S69, the process returns to S62.

その後、文字列テーブル1の「1」行目の文字列と、文字列テーブル2の「2」行目の文字列を対象にS62〜S67の処理が行われる。文字列テーブル1の「1」行目の文字列と、文字列テーブル2の「2」行目の文字列は、文字が不一致であり、また、数字でもないので、S62、S63でいずれもNO判定され、処理はS68に移行する。   Thereafter, the processes of S62 to S67 are performed on the character string on the “1” line in the character string table 1 and the character string on the “2” line in the character string table 2. Since the character string in the “1” line of the character string table 1 and the character string in the “2” line of the character string table 2 do not match and are not numbers, both NO in S62 and S63. As a result, the process proceeds to S68.

そして、S68では文字列テーブル2の行番号が「2」から「3」にインクリメントされ、続く、S69で文字列テーブル2の最大行数まで検索したかどうかが判定される。この段階では、文字列テーブル2の2行目までしか検索されていないので、NO判定される。S69でNO判定されると、処理はS62に戻る。   In S68, the line number of the character string table 2 is incremented from “2” to “3”, and it is determined in S69 whether or not the maximum number of lines in the character string table 2 has been searched. At this stage, since only the second line of the character string table 2 has been searched, NO is determined. If a NO determination is made in S69, the process returns to S62.

その後、文字列テーブル1の「1」行目の文字列と、文字列テーブル2の「3」行目の文字列を対象にS62〜S67の処理が行われる。このような処理が繰り返し行われ、文字テーブル2の最大行数(ここでは、3行目)まで検索が完了すると、S69でYES判定される。   Thereafter, the processes of S62 to S67 are performed on the character string on the “1” line in the character string table 1 and the character string on the “3” line in the character string table 2. When such processing is repeated and the search is completed up to the maximum number of lines in the character table 2 (here, the third line), YES is determined in S69.

そして、S69でYES判定された場合には、S70にて、文字列テーブル2の行番号である「j」を1に設定する処理が行われる。また、S71で、文字列テーブル1の行番号である「i」をインクリメント(+1加算)する処理が行われる。従って、ここでは、文字列テーブル1の行番号が「1」から「2」にインクリメントされる。   If YES is determined in S <b> 69, a process of setting “j” that is the line number of the character string table 2 to 1 is performed in S <b> 70. Also, in S71, a process of incrementing (i.e. adding +1) "i" that is the line number of the character string table 1 is performed. Therefore, here, the line number of the character string table 1 is incremented from “1” to “2”.

その後、S72では、文字列テーブル1の「i」行の文字列が、原稿の中央領域CTに含まれているか判定する処理が行われる(CPU71aにより行われる)。この実施形態では、原稿の中央領域CTを図6に示す一点鎖線で示す範囲(具体的には、定型画像が印字される原稿の上端から所定範囲(ヘッダ)と、定型画像が印字される原稿の下端から所定範囲(フッタ)を除外した範囲)に設定してあり、「i」行の文字列が中央領域CTに含まれていれば、YES判定される。一方、中央領域に含まれていなければ、NO判定される。尚、原稿の中央領域CTが、本発明の「原稿のうち中央を含む一部の領域」に対応している。また、中央領域CTは座標で設定するとよい。そのようにすれば、文字列テーブル1の「i」行のY座標(文字列のY座標)と、中央領域CTのY座標を比較することにより、文字列テーブル1の「i」行の文字列が、原稿の中央領域CTに含まれているか、簡単に判定できる。   Thereafter, in S72, a process is performed to determine whether the character string in the “i” line of the character string table 1 is included in the central area CT of the document (performed by the CPU 71a). In this embodiment, the central area CT of the document is indicated by a dashed line shown in FIG. 6 (specifically, a predetermined range (header) from the upper end of the document on which the standard image is printed, and the document on which the standard image is printed. If the character string of the “i” line is included in the central region CT, a YES determination is made. On the other hand, if it is not included in the central region, NO is determined. Note that the center area CT of the document corresponds to “a part of the document including the center” of the present invention. The central region CT may be set by coordinates. By doing so, by comparing the Y coordinate of the “i” line in the character string table 1 (the Y coordinate of the character string) with the Y coordinate of the central area CT, the character in the “i” line of the character string table 1 It can be easily determined whether the column is included in the central area CT of the document.

文字列テーブル1の2行目の文字列「abc」は、図6に示すように中央領域CKから外れている。そのため、S72ではNO判定される。S72でNO判定されると、S74に移行する。   The character string “abc” in the second line of the character string table 1 is out of the central area CK as shown in FIG. Therefore, NO determination is made in S72. If NO is determined in S72, the process proceeds to S74.

そして、S74では、文字列テーブル1の最大行数まで検索したか判定する処理が行われる。この段階では、文字列テーブル1の1行目までしか検索されていないので、NO判定される。S74でNO判定されると、処理はS62に戻る。   Then, in S74, a process for determining whether or not the maximum number of lines in the character string table 1 has been searched is performed. At this stage, since only the first line of the character string table 1 has been searched, NO is determined. If a NO determination is made in S74, the process returns to S62.

その後、文字列テーブル1の「2」行目の文字列と、文字列テーブル2の「1」行目〜「3」行目の各文字列を対象にS62〜S69の処理が行われる。これにて、文字列テーブル1の「2」行目の文字列に対して、それに共通する文字列(すなわち、(3A)と(4)の条件か、(3B)と(4)の条件を満たす文字列)が、文字列テーブル2の「1」行目〜「3」行目に含まれているか、検索される。ただし、文字列テーブル1の「i」行の文字列が、原稿の中央領域に含まれている場合は除く。   Thereafter, the processes of S62 to S69 are performed on the character string on the “2” line of the character string table 1 and the character strings on the “1” line to the “3” line of the character string table 2. As a result, the character string common to the character string on the “2” line of the character string table 1 (that is, the conditions of (3A) and (4) or the conditions of (3B) and (4) are set. It is searched whether the character string to be satisfied is included in the “1” line to the “3” line of the character string table 2. However, the case where the character string of the “i” line of the character string table 1 is included in the central area of the document is excluded.

そして、(3A)の条件と(4)の条件を満たす場合には、その文字列は座標と共に、共通文字列テーブルに保存される(S66)。また、(3B)の条件と(4)の条件を満たす場合には、共通文字列として「数字」と座標が、共通文字テーブルに保存される(S66、S67)。   If the conditions (3A) and (4) are satisfied, the character string is stored in the common character string table together with the coordinates (S66). When the conditions (3B) and (4) are satisfied, “number” and coordinates are stored as a common character string in the common character table (S66, S67).

このような処理が、文字列テーブル1の「行番号iを更新」しながら繰り返し行なわれる。そして、文字列テーブル1の5行目について、それに共通する文字列が、文字列テーブル2の「1」行目〜「3」行目に含まれているか検索し終わると、S74にてYES判定され、サブルーチン2は終了する。   Such processing is repeatedly performed while “updating line number i” in the character string table 1. Then, when the fifth row of the character string table 1 is searched for whether the common character string is included in the “1” to “3” rows of the character string table 2, a YES determination is made in S74. Then, subroutine 2 ends.

この実施形態では、1枚目の原稿と2枚目の原稿には「title」、「数字(1、2、3、・・)」、「A.doc」の3つの共通する文字列が含まれているので、共通文字列テーブルに対して、これら3つ文字列とその座標が保存されることになる(図12参照)。   In this embodiment, the first document and the second document include three common character strings “title”, “number (1, 2, 3,...)”, And “A.doc”. Therefore, these three character strings and their coordinates are stored in the common character string table (see FIG. 12).

尚、上記した3つの共通文字列のうち、「数字(1、2、3・・)」は、文字列テーブル1の4行目の数字「1」と、文字列テーブル2の2行目の数字「2」を共通した文字列と判断したものである。すなわち、これら両文字列テーブルの2つの数字は座標が一致し、数が連続している。そのため、文字列テーブル1の4行目の数字「1」についてサブルーチン2にかけると、S62でNO判定された後、S63でYES判定される。これら数が連続していることから、文字列テーブル1の「i」行の数字+1の値が文字列テーブル2の行にあるかの条件を満たすからである。   Of the above three common character strings, “number (1, 2, 3,...)” Is the number “1” in the fourth line of the character string table 1 and the second line in the character string table 2. The number “2” is determined as a common character string. That is, the two numbers in both the character string tables have the same coordinates and the numbers are continuous. Therefore, when the number “1” on the fourth line of the character string table 1 is applied to the subroutine 2, a NO determination is made in S62, and a YES determination is made in S63. This is because these numbers are continuous, so that the condition that the value of the number +1 in the “i” row of the character string table 1 is in the row of the character string table 2 is satisfied.

その後、S64、S65でそれぞれYES判定されることから、S67にて、共通文字列テーブルに共通文字列として保存されることになる。このように、共通文字列に、座標が一致し連続する数字を含めるようにしているようにすれば、原稿にふられたページ数を共通文字列に含めることが可能となる。   After that, since YES is determined in S64 and S65, respectively, it is stored as a common character string in the common character string table in S67. As described above, if the common character string includes consecutive numbers with the same coordinates, the number of pages touched on the document can be included in the common character string.

また、このサブルーチン2では、文字列テーブル1の「i」行の文字列が、原稿の中央領域CKに含まれている場合には、「i」行を中央領域外の値に設定する(S72、S73)。そのため、たとえば、原稿の中央領域CKに含まれる3行目の文字列「いいえ」は検索対象から除外され、2行目の文字列「abc」について、それに共通する文字列が文字列テーブル2側に含まれているか検索すると、次は3行目の文字列「いいえ」を飛ばして、4行目の文字列「1」について、それに共通する文字列が文字列テーブル2側に含まれているか検索する。   Further, in this subroutine 2, when the character string of the “i” line in the character string table 1 is included in the central area CK of the document, the “i” line is set to a value outside the central area (S72). , S73). Therefore, for example, the character string “No” on the third line included in the central area CK of the document is excluded from the search target, and the character string common to the character string “abc” on the second line is the character string table 2 side. Next, if the character string “No” on the third line is skipped and a character string common to the character string “1” on the fourth line is included in the character string table 2 side Search for.

このように原稿の中央領域CKを除外して共通文字列を検出すれば、原稿の全領域を対象に共通文字列を検出する場合に比べて共通文字列を検出する処理を短縮できる。また、共通文字列は例えばページ番号、日付、ファイル名等であり、これらは通常、原稿端に印字されることが多い。そのため、原稿の中央領域CKを予め除外しておけば、共通文字列を誤検出することがなくなる。従って、白紙判断を正確に行うことが可能となる。   If the common character string is detected by excluding the central area CK of the document in this way, the process for detecting the common character string can be shortened compared to the case where the common character string is detected for the entire area of the document. The common character string is, for example, a page number, a date, a file name, etc., and these are usually printed at the end of the document. Therefore, if the central area CK of the document is excluded in advance, the common character string is not erroneously detected. Accordingly, it is possible to accurately determine the blank page.

尚、CPU71aにより実行されるS11の処理(サブルーチン2)により本発明の検出部の果たす機能が実現されている。また、サブルーチン2の実行により、1枚目の原稿の文字列テーブルと2枚目の原稿の文字列テーブルから共通文字列テーブルを作成することにより、本発明の「前記検出部は、前記文字列テーブル生成部にて生成された全文字列テーブルのうち一部の文字列テーブルだけを使用して、前記共通文字列を検出する」を実現させている。   The function performed by the detection unit of the present invention is realized by the process of S11 (subroutine 2) executed by the CPU 71a. Further, by executing the subroutine 2, a common character string table is created from the character string table of the first original and the character string table of the second original, whereby the “detection unit detects the character string” according to the present invention. The common character string is detected using only a part of the character string tables among all the character string tables generated by the table generation unit ”.

そして、サブルーチン2の終了後、図5のメインフローに戻り、S12にて1枚目の原稿が、白紙か判断する処理がCPU71aにより実行される。この白紙判断処理はサブルーチン化されており、S12では図13に示すサブルーチン3が読み出される。   Then, after the subroutine 2 is completed, the process returns to the main flow of FIG. 5, and the CPU 71a executes a process of determining whether or not the first original is blank in S12. This blank page determination process is a subroutine, and subroutine S3 shown in FIG. 13 is read out in S12.

サブルーチン3は、S11で作成した「共通文字列テーブル」と白紙判断対象となる原稿の「文字列テーブル」を比較することにより白紙判断を行うものであり、図13に示すS81〜S89の9ステップから構成されている。尚、以下の説明において「共通範囲」とは原稿のうち共通文字列が印刷された範囲(4つの座標X1、X2、Y1、Y2で表される範囲)のことである。また、非共通範囲とは原稿のうち共通範囲を除くそれ以外の全範囲を意味する。   Subroutine 3 performs blank page determination by comparing the “common character string table” created in S11 with the “character string table” of the original to be blanked, and includes nine steps S81 to S89 shown in FIG. It is composed of In the following description, the “common range” is a range (a range represented by four coordinates X1, X2, Y1, and Y2) in which a common character string is printed in the document. Further, the non-common range means the entire range other than the common range in the original.

S81では、白紙判断対象の原稿について、共通範囲が白紙かどうか判定される。共通範囲が白紙かどうかを判断するには、判断対象となる原稿の文字列テーブルに、共通範囲に対して座標が重なる文字列があるか検索すればよく、重なる文字列がなければ、共通範囲は白紙と判断される(YES)。   In S <b> 81, it is determined whether or not the common range is a blank page for the blank page determination target document. To determine whether the common range is blank, it is only necessary to search the character string table of the document to be determined for a character string whose coordinates overlap with the common range. If there is no overlapping character string, the common range is determined. Is determined to be blank (YES).

S81でYES判定されると、処理はS82に移行する。そして、S82では、白紙判断対象の原稿について、非共通範囲が白紙かどうか判定される。非共通範囲が白紙か判断するには、判断対象となる原稿の文字列テーブルに、非共通範囲に含まれる文字列があるか検索すればよく、非共通範囲に含まれる文字列がなければ、非共通範囲は白紙と判断される(YES)。   If YES is determined in S81, the process proceeds to S82. In S82, it is determined whether or not the non-common range is blank for the blank page determination target document. To determine whether the non-common range is blank, it is only necessary to search the character string table of the document to be determined for a character string included in the non-common range. If there is no character string included in the non-common range, The non-common range is determined to be blank (YES).

そして、S82でYES判定された場合には、S83に移行して、白紙フラグが立てられる(RAM71cに白紙フラグが記憶される)。一方、S82でNO判定された場合には、S84に移行して、非白紙フラグが立てられる(RAM71cに白紙フラグが記憶される)。   If YES is determined in S82, the process proceeds to S83 and a blank sheet flag is set (the blank sheet flag is stored in the RAM 71c). On the other hand, if NO is determined in S82, the process proceeds to S84, and a non-blank sheet flag is set (the blank sheet flag is stored in the RAM 71c).

また、S81でNO判定された場合には、S85に移行する。S85では、白紙判断の対象となる原稿について、共通範囲に印刷された文字列が、共通文字列テーブル側の共通文字列に対して文字が一致しているか判断される。これは、原稿側の文字列テーブルの文字列と、共通文字列テーブル側の共通文字列を比較することにより判断される。   If NO is determined in S81, the process proceeds to S85. In S85, it is determined whether or not the character string printed in the common range for the document that is the target of blank page determination matches the character string in the common character string table side. This is determined by comparing the character string in the character string table on the document side with the common character string on the common character string table side.

そして、S85にてYES判定された場合(一致する場合)には、次にS86に移行する。そして、S86では、非共通範囲が白紙かどうか、判定される。非共通範囲が白紙か判断するには、判断対象の原稿の文字列テーブルに、非共通範囲に含まれる文字列があるか、検索すればよい。そして、S86でYES判定された場合には、S87に移行して、白紙フラグが立てられる。一方、S86でNO判定された場合には、S88に移行して、非白紙フラグが立てられる。また、S85でNO判定された場合(不一致と判断された場合)も、S89に移行して、非白紙フラグが立てられる。尚、サブルーチン3のうちS81、S85、S89の処理により、本発明の「前記判断部は、前記文字列テーブルに、前記共通文字列と座標が重なり、文字が異なる文字列が含まれている場合には、非白紙と判断する」が実現されている。   If YES is determined in S85 (if they match), the process proceeds to S86. In S86, it is determined whether the non-common range is blank. In order to determine whether the non-common range is blank, it is only necessary to search the character string table of the document to be determined for a character string included in the non-common range. If YES is determined in S86, the process proceeds to S87 and a blank flag is set. On the other hand, if NO is determined in S86, the process proceeds to S88, and a non-blank flag is set. Also, if NO is determined in S85 (when it is determined that there is a mismatch), the process proceeds to S89 and the non-blank flag is set. It should be noted that, according to the processing of S81, S85, and S89 in the subroutine 3, “the determination unit includes a character string in which the character string table includes a character string that is different in character from the common character string. Is determined to be non-blank ”.

次に、上記のサブルーチン3により、1枚目の原稿の白紙判断が如何様になされるか説明する。1枚目の原稿の文字列テーブル1には、共通範囲に座標が重なる文字列(例えば、「title」など)がある。従って、S81ではNO判定される。また、その文字列(例えば、「title」)は、共通文字列に保存された共通文字列と一致している。そのため、S85では、YES判定される。そして、1枚目の原稿の文字列テーブルには、「abc」や「いいえ」の文字列(座標が共通範囲外の文字列)が含まれていて、非共通範囲は白紙ではない。そのため、S86ではNO判定される。   Next, how the blank sheet of the first document is determined by the subroutine 3 will be described. The character string table 1 of the first document has a character string (for example, “title”) whose coordinates overlap the common range. Therefore, NO determination is made in S81. Further, the character string (for example, “title”) matches the common character string stored in the common character string. Therefore, YES determination is made in S85. The character string table of the first document includes character strings “abc” and “No” (character strings whose coordinates are outside the common range), and the non-common range is not blank. Therefore, NO determination is made in S86.

このように、一枚目の原稿の白紙判断では、S81にてNO判定、S85にてYES判定、S86にてNO判定される。そして、S88にて非白紙フラグが立てられる。S88の処理が終わると、サブルーチン3は終了する。尚、CPU71aに実行されるS12(サブルーチン3)、S21(サブルーチン3)の処理により、本発明の判断部の果たす機能が実現されている。   Thus, in the blank page determination of the first document, a NO determination is made in S81, a YES determination is made in S85, and a NO determination is made in S86. In step S88, a non-blank sheet flag is set. When the process of S88 ends, the subroutine 3 ends. The function performed by the determination unit of the present invention is realized by the processing of S12 (subroutine 3) and S21 (subroutine 3) executed by the CPU 71a.

サブルーチン3の終了後、図5のメインフローに戻り、S13の処理が行われる。S13では、S12の判断結果に応じて、1枚目の原稿を白紙除去する処理がCPU71aにより実行される。この白紙除去処理はサブルーチン化されており、S13では、図14に示すサブルーチン4が読み出される。   After the subroutine 3 is completed, the process returns to the main flow of FIG. 5 and the process of S13 is performed. In S13, the CPU 71a executes a process of removing a blank sheet from the first document according to the determination result in S12. This blank sheet removal processing is made into a subroutine, and subroutine S4 shown in FIG. 14 is read in S13.

サブルーチン4は、S91とS92の2つのステップから構成されていて、S91では、白紙フラグが立っているかどうか判定する処理が行われる。そして、白紙フラグが立っている場合には、その原稿を白紙除去(具体的には、RAM71cに保存したその原稿の画像データを削除する)。一方、白紙フラグが立っていない場合には、S91ではNO判定され、白紙除去する処理をしないまま処理は終了する。そして、1枚目の原稿は、非白紙フラグが立っており、白紙フラグは立っていない。そのため、白紙除去されることなく、サブルーチン4は終了することになる。   Subroutine 4 is composed of two steps S91 and S92. In S91, a process for determining whether or not a blank page flag is set is performed. If the blank sheet flag is set, the original is removed (specifically, the image data of the original stored in the RAM 71c is deleted). On the other hand, if the blank page flag is not set, NO is determined in S91, and the process ends without performing the blank page removal process. The first original has a non-blank flag and no blank flag. Therefore, the subroutine 4 ends without removing the blank paper.

サブルーチン4の終了後、図5のメインフローに戻り、S21の処理にて、原稿(ここでは、2枚目の原稿)が白紙か判断する処理がCPU71aにより実行される。S21の処理はS12と同じ処理であり、S21ではS12の場合と同様に図13に示すサブルーチン3が読み出される。   After the subroutine 4 is completed, the process returns to the main flow of FIG. The process in S21 is the same as that in S12. In S21, the subroutine 3 shown in FIG. 13 is read in the same manner as in S12.

サブルーチン3の説明は既に行ったので、ここでは、2枚目の原稿の白紙判断が如何様に行われるかを簡単に説明する。2枚目の原稿の文字列テーブル2には、共通範囲に座標が重なる文字列(例えば、「title」など)がある。従って、S81ではNO判定される。また、その文字列(例えば、「title」)は、共通文字列に保存された共通文字列と一致している。そのため、S85では、YES判定される。そして、2枚目の原稿の文字列テーブル2には、共通文字テーブルの共通文字列と同じ文字列しか含まれておらず、非共通範囲に含まれる文字列は存在しない。そのため、S86ではYES判定される。   Since the subroutine 3 has already been described, how to determine the blank page of the second document will be briefly described here. The character string table 2 of the second document has a character string (for example, “title”) whose coordinates overlap in the common range. Therefore, NO determination is made in S81. Further, the character string (for example, “title”) matches the common character string stored in the common character string. Therefore, YES determination is made in S85. The character string table 2 of the second document includes only the same character string as the common character string in the common character table, and there is no character string included in the non-common range. Therefore, YES determination is made in S86.

このように、2枚目の原稿の白紙判断では、S81にてNO判定、S85にてYES判定、S86にてYES判定される。そして、S88にて、白紙フラグが立てられる。そして、S88にて白紙フラグを立てる処理が終わると、サブルーチン3は終了する。 Thus, in the blank page determination of the second document, a NO determination is made in S81, a YES determination is made in S85, and a YES determination is made in S86. In S88, a blank paper flag is set. Then, when the process of setting the blank paper flag is finished in S88, the subroutine 3 is finished.

サブルーチン3の終了後、図5のメインフローに戻り、S22の処理が行われる。S22では、S21の判断結果に応じて、原稿(ここでは、2枚目の原稿)を白紙除去する処理がCPU71aにより実行される。このS22の白紙除去処理(S13と同じ処理)はサブルーチン化されており、図14に示すサブルーチン4が読み出される。そして、サブルーチン4の実行により、2枚目の原稿は白紙除去される。すなわち、RAM71cに保存した画像データは削除される。   After the subroutine 3 is completed, the process returns to the main flow of FIG. 5 and the process of S22 is performed. In S22, according to the determination result in S21, the CPU 71a executes processing for removing a blank sheet of the original (here, the second original). This blank paper removal process of S22 (the same process as S13) is made into a subroutine, and subroutine 4 shown in FIG. 14 is read out. Then, by executing subroutine 4, the second original is removed. That is, the image data stored in the RAM 71c is deleted.

その後、処理はS23に移行する。S23では、原稿センサ49の出力に基づいて、原稿トレイ42上に次の原稿があるか判定される。この段階では、2枚目までしか原稿の読み取りを終了しておらず、原稿トレイ42上には、原稿が残されているため、S23ではYES判定される。   Thereafter, the process proceeds to S23. In S 23, it is determined whether there is a next document on the document tray 42 based on the output of the document sensor 49. At this stage, only the second page has been read, and the document remains on the document tray 42, so a YES determination is made in S23.

そのため、白紙除去シーケンスはS2に戻り、ADF40により、原稿トレイ42上にセットされた三枚目の原稿が、表面を上に向けた状態で搬送路43に送りだされる。そして、原稿の先端が読取位置Pに達すると、CIS30による原稿の読み取りが行われる。   Therefore, the blank paper removal sequence returns to S2, and the third document set on the document tray 42 is sent to the transport path 43 by the ADF 40 with the front side facing up. When the leading edge of the document reaches the reading position P, the document is read by the CIS 30.

S4に続くS5では、S4にて読み取った原稿が1枚目の原稿か判定される。S4で読み取った原稿は3枚目であるため、S5ではNO判定される。S5でNO判定されると、次にS8に移行する。S8では、S4にて読み取った原稿が2枚目の原稿か判定される。S4で読み取った原稿は3枚目であるため、S8ではNO判定される。その後、処理はS14に移行して、S4にて読み取った原稿の画像データをRAM71cに対して保存する処理がCPU71aにより実行される。これにて、3枚目の原稿の画像データがRAM71cに対して保存(記憶)される。   In S5 following S4, it is determined whether the document read in S4 is the first document. Since the document read in S4 is the third, NO is determined in S5. If NO is determined in S5, the process proceeds to S8. In S8, it is determined whether the document read in S4 is the second document. Since the document read in S4 is the third, NO is determined in S8. Thereafter, the process proceeds to S14, and the CPU 71a executes a process for storing the image data of the original read in S4 in the RAM 71c. Thus, the image data of the third original is saved (stored) in the RAM 71c.

S14にて、読み取った画像データをRAM71cに対して記憶すると、次にS15の処理が実行される。S15の処理は、S7、S9と同じ処理であり、図7に示すサブルーチン1が読み出され、3枚目の原稿について、読み取った画像データから文字テーブルと文字列テーブルを作成する処理が行われる。これにより、文字テーブル3と、図10cに示す文字列テーブル3が作成されることとなる。尚、文字テーブル3は図を省略している。   When the read image data is stored in the RAM 71c in S14, the process of S15 is executed next. The process of S15 is the same process as S7 and S9. Subroutine 1 shown in FIG. 7 is read, and a process of creating a character table and a character string table from the read image data is performed for the third original. . As a result, the character table 3 and the character string table 3 shown in FIG. 10c are created. Note that the character table 3 is not shown.

そして、S15の処理が完了すると、次にS21にて3枚目原稿について白紙判断する処理が実行される。そして、S21にて白紙判断が行われると、次にS22に移行して、S21の判断結果に応じてその原稿を白紙除去する処理が行われる。そして、S22の処理が終了すると、再びS23に戻る。   When the process of S15 is completed, a process of determining a blank page for the third original is executed in S21. When the blank page is determined in S21, the process proceeds to S22, and a process for removing the blank sheet according to the determination result in S21 is performed. Then, when the process of S22 ends, the process returns to S23 again.

このような処理が繰り返し行われ、原稿トレイ42上にセットされた全原稿(この例では、5枚)について、白紙除去する処理が完了すると、S23にてYES判定されることとなり、白紙除去シーケンスは終了することになる。   When such processing is repeatedly performed and the blank sheet removal processing is completed for all the originals (in this example, five sheets) set on the document tray 42, a YES determination is made in S23, and a blank sheet removal sequence is performed. Will end.

以下、3枚目〜5枚目の各原稿について、原稿の白紙判断が如何様に行われるかを簡単に説明する。
図6に示す3枚目原稿の文字列テーブル3には、図10cに示すように、共通範囲に座標が重なる文字列(例えば、「title」など)がある。従って、S81ではNO判定される。また、その文字列(例えば、「title」)は、共通文字列に保存された共通文字列と一致している。そのため、S85では、YES判定される。そして、3枚目の原稿の文字列テーブル3には「あいうえお」なる文字列(座標が共通範囲外の文字列)が含まれており、非共通範囲は白紙ではない。S86ではNO判定される。以上のことから、S88にて非白紙フラグが立てられるので、3枚目の原稿は白紙除去されない。
In the following, a brief description will be given of how the blank page of the original is determined for each of the third to fifth originals.
The character string table 3 of the third original shown in FIG. 6 includes a character string (for example, “title”) whose coordinates overlap in the common range, as shown in FIG. 10c. Therefore, NO determination is made in S81. Further, the character string (for example, “title”) matches the common character string stored in the common character string. Therefore, YES determination is made in S85. The character string table 3 of the third document includes the character string “Aiueo” (character string whose coordinates are outside the common range), and the non-common range is not blank. In S86, a NO determination is made. From the above, since the non-blank flag is set in S88, the third original is not removed.

次に、図6に示す4枚目の原稿、すなわち原稿の左端に「japan」の文字だけが印刷された原稿の場合を説明する。4枚目原稿の文字列テーブル4には、図10dに示すように、文字列「japan」が保存されている。この文字列「Japan」は共通範囲に座標が重っていることから、S81ではNO判定される。一方、この文字列「japan」は、共通範囲に記された共通文字列「title」とは文字列が一致していない。そのため、S85ではNO判定され、S89にて非白紙フラグが立てられる。よって、4枚目の原稿は白紙除去されない。   Next, the case of the fourth original shown in FIG. 6, that is, an original in which only the characters “japan” are printed on the left end of the original will be described. In the character string table 4 of the fourth original, a character string “Japan” is stored as shown in FIG. Since the character string “Japan” has coordinates in the common range, NO is determined in S81. On the other hand, the character string “japan” does not match the character string “title” described in the common range. Therefore, a NO determination is made in S85, and a non-blank flag is set in S89. Therefore, the fourth original is not removed.

次に、図6に示す5枚目の原稿、すなわち全面白紙の場合を説明する。5枚目原稿の文字列テーブル5には、図10eに示すように、文字列が一切保存されていない。そのため、S81、S82ではいずれもNO判定される。そのため、S84にて非白紙フラグが立てられ、5枚目の原稿は白紙除去される。   Next, the case of the fifth original shown in FIG. 6, that is, the entire blank sheet will be described. As shown in FIG. 10E, no character string is stored in the character string table 5 of the fifth original. Therefore, NO determination is made in both S81 and S82. Therefore, a non-blank flag is set in S84 and the fifth original is removed.

以上説明したように、実施形態1では、全面白紙原稿(図6の5枚目の原稿)を除去できる。また、実施形態1では、共通文字列を除外して白紙判断を行うことから、準白紙原稿(図6の2枚目の原稿であって、共通文字列のみ印字され本文画像の印刷がない原稿)を白紙除去できる。   As described above, according to the first embodiment, the entire blank original (the fifth original in FIG. 6) can be removed. In the first embodiment, since the blank page is determined by excluding the common character string, a quasi-blank document (the second document in FIG. 6, only the common character string is printed and the body image is not printed). ) Can be removed.

また、実施形態1では、共通範囲に重なる文字列があったとしても、それが共通文字列と一致しなければ、非白紙フラグを立てるようにしてある(S81、S85、S89)。そのため、図6の4枚目の原稿のように、共通文字列の座標に異なる文字列が印刷されている場合には、白紙除去されない。仮に、従来のように除外範囲を設定すると、図6の4枚目の原稿のように除外範囲である共通文字列の座標に異なる文字列が印刷されていても、それは白紙除去される。本実施形態1では、そのような原稿であっても白紙除去されないため、従来の白紙判断方法に比べて白紙判断精度が高い。また、除外範囲を設けないようにすることで、ユーザの手間を減らすことが出来るというメリットも得られる。   In the first embodiment, even if there is a character string that overlaps the common range, if it does not match the common character string, a non-blank flag is set (S81, S85, S89). Therefore, blank pages are not removed when different character strings are printed at the coordinates of the common character string as in the fourth document in FIG. If the exclusion range is set as in the prior art, even if a different character string is printed at the coordinates of the common character string that is the exclusion range as in the fourth document in FIG. 6, it is removed as a blank sheet. In the first exemplary embodiment, blank pages are not removed even in such an original, and therefore, blank page determination accuracy is higher than that of the conventional blank page determination method. Moreover, the merit that a user's effort can be reduced by not providing an exclusion range is also acquired.

また、実施形態1では、判読した文字に基づいて共通文字列を検出しており、濃度に基づいて検出する場合に比べて、共通文字列を正確に検出できる。従って、白紙判断を正確に行うことが可能となる。   In the first embodiment, the common character string is detected based on the read character, and the common character string can be detected more accurately than in the case where the common character string is detected based on the density. Accordingly, it is possible to accurately determine the blank page.

また、実施形態1では、共通文字列に、座標が一致し連続する数字を含めるようにしている。このようにすれば、原稿にふられたページ数を共通文字列に含めることが可能となる。そのため、ページ数を除外して、白紙判定を行うことが可能となり、白紙判断の精度が高まる。   In the first embodiment, the common character string includes consecutive numbers having the same coordinates. In this way, the number of pages touched on the document can be included in the common character string. For this reason, it is possible to perform blank page determination by excluding the number of pages, and the accuracy of blank page determination is increased.

また、実施形態1では、原稿の中央領域CKを除外して共通文字列を検出する。そのため、原稿の全領域を対象に共通文字列を検出する場合に比べて共通文字列を検出する処理を短縮できる。また、共通文字列は例えばページ番号、日付、ファイル名等であり、これらは通常、原稿端に印字されることが多い。そのため、原稿の中央領域CKを予め除外しておけば、共通文字列を誤検出することがなくなる。従って、白紙判断を正確に行うことが可能となる。   In the first embodiment, the common character string is detected by excluding the central area CK of the document. Therefore, the process for detecting the common character string can be shortened compared to the case where the common character string is detected for the entire area of the document. The common character string is, for example, a page number, a date, a file name, etc., and these are usually printed at the end of the document. Therefore, if the central area CK of the document is excluded in advance, the common character string is not erroneously detected. Accordingly, it is possible to accurately determine the blank page.

また、実施形態1では、1枚目の原稿と2枚目の原稿の文字列テーブルだけを使用して、共通文字列を検出している。そのため、共通文字列を検出した以降は、原稿の読み取りと白紙判断を並行して行うことが可能である。   In the first embodiment, the common character string is detected using only the character string tables of the first document and the second document. Therefore, after the common character string is detected, it is possible to perform reading of the original and blank page determination in parallel.

<実施形態2>
実施形態2を図15ないし図17を用いて説明する。実施形態1では、1枚目の原稿と2枚目原稿の文字列テーブルを比較して、共通文字列テーブルを作成した。そして、1枚目の原稿と2枚目原稿の文字列テーブルを比較して作成した共通文字列テーブルに基づいて、3枚目以降の原稿について白紙判断を行うようにした。
<Embodiment 2>
A second embodiment will be described with reference to FIGS. 15 to 17. In the first embodiment, the common character string table is created by comparing the character string tables of the first document and the second document. Then, based on the common character string table created by comparing the character string tables of the first document and the second document, blank page determination is performed for the third and subsequent documents.

実施形態2は、1枚目の原稿と2枚目原稿の文字列テーブルを比較して共通文字列テーブルを作成する点は、実施形態1と共通している。しかし、実施形態2では、作成した共通文字列テーブルを、3枚目以降の原稿の文字列テーブルと比較して更新する構成となっており、その点が実施形態1と異なっている。そして、この変更に伴って、実施形態2の白紙除去シーケンスでは、実施形態1の白紙除去シーケンスに対してS16の処理(共通文字列テーブル更新処理)を追加している。   The second embodiment is common to the first embodiment in that the common character string table is created by comparing the character string tables of the first document and the second document. However, the second embodiment differs from the first embodiment in that the created common character string table is updated by comparing with the character string tables of the third and subsequent originals. Along with this change, in the blank page removal sequence of the second embodiment, the processing of S16 (common character string table update processing) is added to the blank page removal sequence of the first embodiment.

また、実施形態1では、原稿の画像を読み取ると、その都度白紙判断を行うようにしていたが、実施形態2では、画像の読み取りをまず全原稿分行い、その後、白紙判断をまとめて行うようにした。そして、この変更に伴って、実施形態2の白紙除去シーケンスでは、実施形態1の白紙除去シーケンスに対してS24〜S28を追加し、S12、S13、S21、S22を削除した内容となっている。   Further, in the first embodiment, blank images are determined each time an image of a document is read. However, in the second embodiment, images are first read for all original documents, and then blank images are determined collectively. I made it. Along with this change, the blank paper removal sequence of the second embodiment has contents obtained by adding S24 to S28 to the blank paper removal sequence of the first embodiment and deleting S12, S13, S21, and S22.

以下、実施形態1との相違点を説明する。
<1点目の相違点>
S16の処理を、3枚目の原稿の読み取りに伴って共通文字列テーブルを更新する場合を例にとって説明する。S16の処理はサブルーチン化されており、S16では、図16に示すサブルーチン5が読み出される。サブルーチン5は、S100〜S107の8つのステップから構成されていてCPU71aにより実行される。尚、以下の説明において「m」とは共通文字列テーブルの行番号を示すものとする。
Hereinafter, differences from the first embodiment will be described.
<First difference>
The process of S16 will be described by taking as an example a case where the common character string table is updated as the third original is read. The process of S16 is made into a subroutine. In S16, the subroutine 5 shown in FIG. 16 is read. Subroutine 5 comprises eight steps S100 to S107 and is executed by CPU 71a. In the following description, “m” represents the line number of the common character string table.

まず、S100では共通文字列テーブルの行番号「m」が「1」に設定される。続くS101では共通文字列テーブルの「m」行と同じ座標を、3枚目原稿の文字列テーブルから検索する処理が行われる。そして、同じ座標がない場合にはS102でNO判定され、S105にて共通文字列テーブルから「m」行は削除される。   First, in S100, the line number “m” of the common character string table is set to “1”. In the subsequent S101, a process for retrieving the same coordinates as the “m” line of the common character string table from the character string table of the third original is performed. If there is no same coordinate, NO is determined in S102, and the "m" line is deleted from the common character string table in S105.

一方、同じ座標が、3枚目原稿の文字列テーブルに含まれていれば、S102でYES判定され、処理はS103に移行する。S103では、3枚目原稿の文字列テーブルから検索された同じ座標の文字列は、共通文字列と同じか判定される。   On the other hand, if the same coordinates are included in the character string table of the third original, YES is determined in S102, and the process proceeds to S103. In S103, it is determined whether the character string having the same coordinates retrieved from the character string table of the third original is the same as the common character string.

同じ文字列であれば、S103でYES判定される。一方、同じ文字列でない場合には、S104に移行する。S104では、共通文字列テーブル側の「m」行の文字列は数字で、文字列テーブル側の文字列も数字か、判定される。双方が数字であれば、S104ではYES判定される。   If they are the same character string, YES is determined in S103. On the other hand, if they are not the same character string, the process proceeds to S104. In S104, it is determined whether the character string in the “m” line on the common character string table side is a numeral and the character string on the character string table side is also a numeral. If both are numbers, YES is determined in S104.

S103、S104でYES判定された場合は、いずれもS106に移行する。S106では、共通文字列テーブルの行番号である「m」をインクリメント(+1加算)する処理が行われる。従って、ここでは、共通文字列テーブルの行番号が「1」から「2」にインクリメントされる。   If YES is determined in S103 and S104, the process proceeds to S106. In S106, a process of incrementing (+1 addition) “m” that is the line number of the common character string table is performed. Therefore, here, the line number of the common character string table is incremented from “1” to “2”.

一方、S104でNO判定された場合には、S102でNO判定された場合と同様に、S105にて共通文字列テーブルから「m」行は削除される。そして、S105の処理に続いてS106に移行し、上記したように共通文字列テーブルの行番号が「1」から「2」にインクリメントされる。   On the other hand, if NO is determined in S104, the “m” line is deleted from the common character string table in S105, similarly to the case where NO is determined in S102. Then, the process proceeds to S106 following the process of S105, and the line number of the common character string table is incremented from “1” to “2” as described above.

その後、S107では、共通文字列テーブルの全行番について検索を行ったか判定される。ここでは、1行目しか検索されていないので、S107ではNO判定される。そのため、処理はS101に戻り、上記したS101〜S106の処理が、上記した手順に従って実行される。そして、共通文字列テーブルの全行番について検索を行うと、S107でYES判定され、サブルーチン5は終了する。   Thereafter, in S107, it is determined whether a search has been performed for all line numbers in the common character string table. Here, since only the first line has been searched, NO is determined in S107. Therefore, the process returns to S101, and the above-described processes of S101 to S106 are executed according to the above-described procedure. If all line numbers in the common character string table are searched, YES is determined in S107, and the subroutine 5 ends.

このサブルーチン5は、共通文字列テーブルに保存された共通文字列のうち、新しく読み込んだ3枚目以降の原稿の文字列テーブル3に含まれていない共通文字列を削除する(S105)。   This subroutine 5 deletes the common character string that is not included in the character string table 3 of the third and subsequent originals newly read out of the common character strings stored in the common character string table (S105).

そのため、共通文字列テーブルは例えば、図17に示すように上段→中段→下段の順に、更新されてゆき、最終的には全原稿に共通する共通文字列とその座標だけが保存された状態となる。尚、共通文字列を作成する際、図10eのような、文字列を有しない文字列テーブルを使用しない。CPU71aにて実行されるS16の処理により、本発明の「前記検出部は、前記文字列テーブル生成部にて前記文字列テーブルが生成される度に、新しく生成された文字列テーブルに含まれない共通文字列を削除することにより、前記共通文字列を更新する」が実現されている。
Therefore, the common character string table is updated, for example, in the order of upper → middle → lower as shown in FIG. 17, and finally the common character string common to all originals and its coordinates are stored. Become. When creating a common character string, a character string table having no character string as shown in FIG. 10E is not used. According to the processing of S16 executed by the CPU 71a, “the detection unit is not included in the newly generated character string table every time the character string table is generated by the character string table generation unit. “The common character string is updated by deleting the common character string” is realized.

<2点目の相違点>
次に、図15を参照して、2点目の相違点であるS24〜S28の処理を説明する。尚、以下の説明において、「n」とは読み取った原稿のページ数を示すものとする。
<Second difference>
Next, with reference to FIG. 15, the process of S24-S28 which is the 2nd difference is demonstrated. In the following description, “n” represents the number of pages of the read document.

S24からS28の処理は、S16にて更新済みの共通文字列テーブルを利用して、画像読取ユニット5で読み取った全n枚の原稿の白紙判断と、白紙除去処理をまとめて行うものである。具体的には、S24〜S28の5つのステップから構成されていて、S24では、原稿のページ数「n」が「0」に設定される。続く、S25では、原稿のページ数である「m」をインクリメント(+1加算)する処理が行われる。従って、ここでは、原稿のページ数が「0」から「1」にインクリメントされる。   The processing from S24 to S28 is performed by collectively performing blank page determination and blank page removal processing of all n documents read by the image reading unit 5, using the common character string table updated in S16. Specifically, the process consists of five steps S24 to S28. In S24, the page number “n” of the document is set to “0”. In S25, a process of incrementing (+1 addition) “m” which is the number of pages of the document is performed. Accordingly, here, the number of pages of the document is incremented from “0” to “1”.

S26は、n枚目の原稿を白紙判断する処理が行われる。このS26の処理は、実施形態1のS12やS21と同じ処理であり、S26では、サブルーチン3が読み出される。そして、S16にて更新済みの共通文字列テーブルを利用して、n枚目(ここでは、1枚目)の原稿が白紙か判断される。   In S26, a process of determining a blank sheet for the nth document is performed. The process of S26 is the same as S12 and S21 of the first embodiment, and the subroutine 3 is read in S26. In step S16, the updated common character string table is used to determine whether the nth (here, the first) document is blank.

S26にて1枚目の原稿について、白紙判断が行われると、次に、S27に移行する。S27では、n枚目の原稿について、白紙除去する処理が行われる。このS27の処理は、実施形態1のS13やS22と同じ処理であり、S27では、サブルーチン4が読み出される。そして、S27では、S26の判断結果に応じて、原稿(ここでは、1枚目の原稿)を白紙除去する処理が実行される。   If a blank page is determined for the first document in S26, the process proceeds to S27. In S27, a blank sheet removal process is performed on the nth document. The process of S27 is the same as S13 and S22 of the first embodiment, and the subroutine 4 is read in S27. In S27, a process of removing a blank sheet from the original (here, the first original) is executed according to the determination result in S26.

そして、S28では、白紙判断済みの原稿ページ数nが、画像読取ユニット5で読み取ったページ数に達したか判断される。そして、白紙判断済みの原稿ページ数nが、読み取ったページ数に達していなければ、S28でNO判定され、S25に戻る。   In S28, it is determined whether or not the number of original pages n for which blank pages have been determined has reached the number of pages read by the image reading unit 5. If the number n of blank original pages has not reached the number of read pages, a NO determination is made in S28, and the process returns to S25.

以上のことから、画像読取ユニット5で読み取った各原稿について白紙判断と白紙除去処理が行われる。そして、全原稿について、それらの処理が終了すると、S28でYES判定され、一連の白紙除去シーケンスは終了する。   From the above, blank sheet determination and blank sheet removal processing are performed for each document read by the image reading unit 5. When these processes are completed for all the originals, a YES determination is made in S28, and the series of blank paper removal sequences is completed.

実施形態2では、画像読取ユニット5で読み取った全原稿の文字列テーブルを対象にして、共通文字列を検出するから、全原稿に共通する文字列を共通文字列として検出することが可能である。従って、全原稿に共通する共通文字列だけを除外して白紙判断を行うことが出来るので、原稿の白紙判断を正確に行うことが可能である。   In the second embodiment, since a common character string is detected for the character string table of all originals read by the image reading unit 5, it is possible to detect a character string common to all originals as a common character string. . Accordingly, since it is possible to perform blank page determination by excluding only the common character string common to all the originals, it is possible to accurately determine the blank page of the original.

また、実施形態2では、新たな原稿の読み取りに伴って文字列テーブルが生成される度に、共通文字列テーブルを更新するようにしている。このように共通文字列テーブルを更新するようにしておけば、全原稿を読み取った後に、全原稿の文字列テーブルから共通文字列を作成する場合に比べて、共通文字列の検索に要する手間が少なくて済む。そのため、共通文字列テーブルの作成、及び原稿の白紙判断、除去を効率よく行うことが可能である。   In the second embodiment, the common character string table is updated each time a character string table is generated as a new document is read. If the common character string table is updated in this way, it takes more time to search for the common character string than when the common character string is created from the character string table of all originals after all the originals are read. Less is enough. For this reason, it is possible to efficiently create a common character string table, and determine and remove blank pages from a document.

<実施形態3>
実施形態3を説明する。実施形態1では原稿の白紙判断に、サブルーチン3を用いた。実施形態3は、原稿の白紙判断を、実施形態1とは異なる方法で行うようにしたものである。具体的には、実施形態3では、判断対象の原稿の文字列テーブルに対して、共通文字列テーブルに保存された共通文字列以外の文字列が含まれている場合には、非白紙と判断する。
<Embodiment 3>
A third embodiment will be described. In the first embodiment, the subroutine 3 is used for blank page determination. In the third embodiment, the blank page of the document is determined by a method different from that in the first embodiment. Specifically, in the third embodiment, when a character string other than the common character string stored in the common character string table is included in the character string table of the document to be determined, the document is determined to be non-blank. To do.

実施形態1と同様に、図6に示す5枚の原稿を白紙判断する場合を例にとって具体的な白紙判断例を説明する。尚、各原稿の文字列テーブルは実施形態1と同様にサブルーチン1を用いて、図10a〜図10eに示す文字列テーブルが生成させたものとし、共通文字列テーブルはサブルーチン2を用いて、図12に示す共通文字列テーブルが作成されているものとする。   As in the first embodiment, a specific example of blank page determination will be described by taking as an example the case of blank page determination for five documents shown in FIG. Note that the character string table of each document is generated by using the subroutine 1 as in the first embodiment, and the character string table shown in FIGS. 10a to 10e is generated, and the common character string table is generated by using the subroutine 2. Assume that the common character string table shown in FIG.

さて、図12に示す共通文字列テーブルには「title」、「数字」、「A.doc」の3つの共通文字列が保存されている。一方、図10aに示す文字列テーブル1には、共通文字列に含まれていない文字列「abc」や「いいえ」が含まれている。また、図10cに示す文字テーブル3には、共通文字列に含まれていない文字列「あいうえお」が含まれている。また、図10dに示す文字テーブル4には、共通文字列に含まれていない文字列「japan」が含まれている。   In the common character string table shown in FIG. 12, three common character strings “title”, “number”, and “A.doc” are stored. On the other hand, the character string table 1 shown in FIG. 10A includes character strings “abc” and “No” that are not included in the common character string. In addition, the character table 3 illustrated in FIG. 10C includes a character string “Aiueo” that is not included in the common character string. In addition, the character table 4 illustrated in FIG. 10D includes a character string “japan” that is not included in the common character string.

従って、これら文字列テーブル1に対応する1枚目の原稿、文字列テーブル3に対応する3枚目の原稿、文字列テーブル4に対応する4枚目原稿は非白紙と判断できる。   Accordingly, it can be determined that the first original corresponding to the character string table 1, the third original corresponding to the character string table 3, and the fourth original corresponding to the character string table 4 are non-blank.

一方、それ以外の文字列テーブル2、4は、共通文字列しか含まれていないか、文字列そのものが含まれていないパターンになるので、文字列テーブル2に対応する2枚目の原稿、文字列テーブル4に対応する4枚目の原稿はいずれも白紙と判断できる。このように実施形態3では、文字列と共通文字列を比較するだけの簡単な処理で原稿が白紙か非白紙か判断できるというメリットがある。   On the other hand, since the other character string tables 2 and 4 have a pattern that includes only the common character string or does not include the character string itself, the second manuscript and character corresponding to the character string table 2 are used. It can be determined that the fourth original corresponding to the row table 4 is all blank. As described above, the third embodiment has an advantage that it is possible to determine whether a document is blank or non-blank by a simple process of simply comparing a character string with a common character string.

<他の実施形態>
本発明は上記記述及び図面によって説明した実施形態に限定されるものではなく、例えば次のような実施形態も本発明の技術的範囲に含まれる。
<Other embodiments>
The present invention is not limited to the embodiments described with reference to the above description and drawings. For example, the following embodiments are also included in the technical scope of the present invention.

(1)実施形態1〜2では、画像読取装置の一例に複合機を例示したが、印刷ユニットが必ずしも必要でなく、少なくとも制御部70と画像読取ユニット5を備えた構成であればよい。   (1) In the first and second embodiments, a multifunction peripheral is illustrated as an example of an image reading apparatus. However, a printing unit is not necessarily required, and any configuration that includes at least the control unit 70 and the image reading unit 5 may be used.

(2)実施形態1〜2では、原稿の白紙判断を文字列テーブルを用いて行った例を示したが、具体的には、文字列テーブルに共通文字列以外の文字列が含まれている場合、原稿を非白紙と判断するようにした。白紙判断は、共通文字列を除外して行うものであればよく、例えば、原稿画像から共通文字列を除外する処理を行い、その後、共通文字列を除外した原稿画像について、画素濃度の出現数を閾値と比較することで、原稿が白紙することも可能である。   (2) In the first and second embodiments, an example in which blank page determination of a document is performed using a character string table has been described. Specifically, a character string other than a common character string is included in the character string table. In this case, the manuscript is judged to be non-blank. The blank page determination may be performed by excluding the common character string. For example, the process of excluding the common character string from the document image is performed, and then the number of appearances of the pixel density for the document image from which the common character string is excluded. It is also possible to make the original blank by comparing the above with the threshold.

(3)実施形態2では、共通文字列テーブルを新しく読み取った原稿の文字列テーブルと比較して更新することにより、全原稿に共通する共通文字列テーブルを作成するようにした。全原稿に共通する共通文字列テーブルの作成方法(CPU71aにて作成される全原稿の全文字列テーブルを対象に共通文字列を検出する方法)は、実施形態2の方法以外に限定されるものではなく、例えば、全原稿を読み取った後に、全原稿の文字列テーブルから共通文字列を作成するようにしてもよい。   (3) In the second embodiment, the common character string table is updated by comparing with the character string table of the newly read original, thereby creating the common character string table common to all originals. A method of creating a common character string table common to all originals (a method of detecting a common character string for all character string tables of all originals created by the CPU 71a) is limited to a method other than the method of the second embodiment. Instead, for example, a common character string may be created from a character string table of all originals after all originals have been read.

(4)実施形態1〜2では、原稿の白紙判断を文字列テーブルを用いて行った例を示したが、具体的には、文字列テーブルに共通文字列以外の文字列が含まれている場合、原稿を非白紙と判断するようにした。白紙判断は、共通文字列を除外して行うものであればよく、例えば、原稿画像から共通文字列を除外する処理を行い、その後、共通文字列を除外した原稿画像について、画素濃度の出現数を閾値と比較することで、原稿が白紙することも可能である。   (4) In the first and second embodiments, an example in which blank page determination of a document is performed using a character string table has been described. Specifically, a character string other than a common character string is included in the character string table. In this case, the manuscript is judged to be non-blank. The blank page determination may be performed by excluding the common character string. For example, the process of excluding the common character string from the document image is performed, and then the number of appearances of the pixel density for the document image from which the common character string is excluded. It is also possible to make the original blank by comparing the above with the threshold.

(5)実施形態1では、文字列テーブルの文字列に数字を含めたが、更に図柄を含めるようにしてもよい。   (5) In the first embodiment, numbers are included in the character strings of the character string table, but symbols may be further included.

1…複合機(本発明の「画像読取装置」、「画像形成装置」の一例)
3…印刷ユニット(本発明の「印刷部」の一例)
5…画像読取ユニット
30…CIS(本発明の「読取部」の一例)
40…ADF
43…搬送路
70…制御部
71a…CPU(本発明の「検出部」、「判断部」、「判読部」、「文字列認識部」、「文字列テーブル生成部」の一例)
71b…ROM
71c…RAM
1. Multifunction machine (an example of “image reading apparatus” and “image forming apparatus” of the present invention)
3. Printing unit (an example of the “printing unit” of the present invention)
5... Image reading unit 30... CIS (an example of the “reading unit” of the present invention)
40 ... ADF
43 ... conveying path 70 ... control unit 71a ... CPU (an example of "detection unit", "determination unit", "reading unit", "character string recognition unit", "character string table generation unit" of the present invention)
71b ... ROM
71c ... RAM

Claims (8)

原稿の画像を読み取る読取部と、
前記読取部が読み取った各ページの画像から文字を判読して座標と関連付けて出力する判読部と、
前記判読された文字と文字の座標から各ページに印字された文字列を認識する文字列認識部と、
画像が読み取られた各原稿について、前記文字列と座標を関連付けて記憶した文字列テーブルを生成する文字列テーブル生成部と、
各原稿の前記文字列テーブルを比較することにより、複数ページの同じ座標に形成され座標と文字が一致する共通文字列を検出する検出部と、
前記検出部が検出した共通文字列を除外して、原稿が白紙か非白紙かを判断する判断部とを備える画像読取装置。
A reading unit for reading an image of a document;
A reading unit that reads the characters from the image of each page read by the reading unit and outputs the characters in association with the coordinates;
A character string recognition unit for recognizing a character string printed on each page from the read character and the character coordinates;
A character string table generating unit that generates a character string table in which the character string and the coordinates are stored in association with each other for each document from which an image has been read;
By detecting the character string table of each document, a detection unit that detects a common character string that is formed at the same coordinates on a plurality of pages and that has the same characters as the coordinates;
An image reading apparatus comprising: a determination unit that determines whether a document is blank or non-blank by excluding the common character string detected by the detection unit.
前記文字には数字が含まれ、
前記共通文字列には、座標が一致し前記複数ページの原稿のそれぞれにふられた連続する数字が含まれる請求項1に記載の画像読取装置。
The letters include numbers,
2. The image reading apparatus according to claim 1 , wherein the common character string includes consecutive numbers that coincide with each other on the plurality of pages of the document .
前記検出部は、原稿のうち中央を含む一部の領域を除外して、前記共通文字列を検出する請求項1又は請求項2に記載の画像読取装置。 The detector is operable to exclude some areas including the central of the original, the common character string image reading apparatus according to claim 1 or claim 2 for detecting a. 前記検出部は、前記文字列テーブル生成部にて生成された全文字列テーブルを対象にして、前記共通文字列を検出する請求項1ないし請求項3のいずれか一項に記載の画像読取装置。 Wherein the detection unit, the by all string table generated by the string table generating unit in the target, the common character claims 1 to detect the sequence of any one of claims 3 image reading apparatus . 前記検出部は、前記文字列テーブル生成部にて前記文字列テーブルが生成される度に、新しく生成された文字列テーブルに含まれない共通文字列を削除することにより、前記共通文字列を更新する請求項4に記載の画像読取装置。 The detection unit updates the common character string by deleting a common character string that is not included in the newly generated character string table each time the character string table is generated by the character string table generation unit. The image reading apparatus according to claim 4 . 前記判断部は、前記文字列テーブルに、前記共通文字列以外の文字列が含まれている場合、原稿を非白紙と判断することを特徴とする請求項1ないし請求項5のいずれか一項に記載の画像読取装置。 The determination unit, the string table, the common case where a character string other than a column is contained, claims 1, characterized in that determining the original and non-blank any one of claims 5 The image reading apparatus described in 1. 前記判断部は、前記文字列テーブルに、前記共通文字列と座標が重なり、文字が異なる文字列が含まれている場合には、非白紙と判断することを特徴とする請求項1ないし請求項3のいずれか一項に記載の画像読取装置。 The determination unit, the string table, the common character string and the coordinates overlap, when the character is contain different strings claims 1, characterized in that it is determined that the non-blank claim The image reading apparatus according to any one of claims 3 to 4 . 請求項1ないし請求項7のいずれか一項に記載の画像読取装置と、
前記画像読取装置の読み取った画像を被記録媒体に印刷する印刷部とを備えた画像形成装置。
An image reading apparatus according to any one of claims 1 to 7 ,
An image forming apparatus comprising: a printing unit that prints an image read by the image reading apparatus on a recording medium.
JP2011018789A 2011-01-31 2011-01-31 Image reading apparatus and image forming apparatus Active JP5754147B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011018789A JP5754147B2 (en) 2011-01-31 2011-01-31 Image reading apparatus and image forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011018789A JP5754147B2 (en) 2011-01-31 2011-01-31 Image reading apparatus and image forming apparatus

Publications (2)

Publication Number Publication Date
JP2012160885A JP2012160885A (en) 2012-08-23
JP5754147B2 true JP5754147B2 (en) 2015-07-29

Family

ID=46841075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011018789A Active JP5754147B2 (en) 2011-01-31 2011-01-31 Image reading apparatus and image forming apparatus

Country Status (1)

Country Link
JP (1) JP5754147B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6203143B2 (en) * 2014-07-22 2017-09-27 住友化学株式会社 Manufacturing method of polarizing plate

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7362455B2 (en) * 2002-12-19 2008-04-22 Hewlett-Packard Development Company, L.P. Processing scanned pages
JP2008252383A (en) * 2007-03-29 2008-10-16 Canon Electronics Inc Image reader, image processing method and image processing program

Also Published As

Publication number Publication date
JP2012160885A (en) 2012-08-23

Similar Documents

Publication Publication Date Title
US8849033B2 (en) Image-reading device
JP2012104028A (en) Image processor, image reading device, image forming device, image processing method, and program and recording medium therefor
US8593679B2 (en) Position-based image scanning, processing and storage
JP2009094934A (en) Image processing apparatus and control program of image processing apparatus
US8606049B2 (en) Image management apparatus, image management method, and storage medium
JP2013074609A (en) File name creation apparatus and file name creation program
JP2009206678A (en) Image processor
JP2012118863A (en) Image reading device, image formation device, image reading method, program and recording medium therefor
JP5754147B2 (en) Image reading apparatus and image forming apparatus
JP6332477B2 (en) Image forming apparatus and method of controlling image forming apparatus
JP6583164B2 (en) Image forming apparatus
JP7180408B2 (en) Image processing device and image processing program
JP5857427B2 (en) Image reading device
JP2004235680A (en) Manuscript reader
JP2009010690A (en) Image reader and image forming apparatus
US9323477B2 (en) Operating device and image formation device
JP2009171165A (en) Original reader
JP6187366B2 (en) Image processing apparatus, image processing method, and program
US20210227081A1 (en) Information processing apparatus that creates processed text data from text data, by changing order of sentences in text data, and image forming apparatus
JP2009049788A (en) Image information processing program, computer readable recording medium recording same, and document reader
JP6399000B2 (en) Image processing apparatus and image creation program
JP5822865B2 (en) Image processing apparatus, ruled line determination method, and ruled line determination program
JP2008077197A (en) Image processing apparatus, image processing method, image processing program and recording medium
JP6274121B2 (en) Image forming apparatus
JP2024060455A (en) Image reading device and image forming device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140106

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20140407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150128

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150324

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150511

R150 Certificate of patent or registration of utility model

Ref document number: 5754147

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150