JP2021081853A - Document reader - Google Patents

Document reader Download PDF

Info

Publication number
JP2021081853A
JP2021081853A JP2019207108A JP2019207108A JP2021081853A JP 2021081853 A JP2021081853 A JP 2021081853A JP 2019207108 A JP2019207108 A JP 2019207108A JP 2019207108 A JP2019207108 A JP 2019207108A JP 2021081853 A JP2021081853 A JP 2021081853A
Authority
JP
Japan
Prior art keywords
page
image
document
document reading
page data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019207108A
Other languages
Japanese (ja)
Inventor
知明 山田
Tomoaki Yamada
知明 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019207108A priority Critical patent/JP2021081853A/en
Publication of JP2021081853A publication Critical patent/JP2021081853A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Input (AREA)
  • Facsimiles In General (AREA)

Abstract

To provide a document reader which allows for easily finding out transfer of an image for certification such as an impression of a seal due to ink transfer.SOLUTION: In the document reader, a page inside specification unit 102 detects an image group of an impression of a seal where vermilion has a high frequency and characters used in the seal are included, from each of pieces of page data. An inter-page consistency determination unit 105 evaluates whether the image group of the impression of the seal is included in each of a pair of pieces of page data corresponding to two document surfaces adjacent to each other in a bundle of documents, whether the image group of the impression of the seal included in one of the pair and that included in the other have a mirror image relation, and which of them is degraded. If it is evaluated as a result of evaluation that the image group of the impression of the seal in either of the pair of pieces of page data is degraded, a user is notified of the result of evaluation.SELECTED DRAWING: Figure 2

Description

本発明は、複数の原稿からなる原稿束を読み取って、複数のページデータからなるスキャンデータを得る原稿読取装置に関し、特に、ページデータを対象とした画像処理の改良に関する。 The present invention relates to a document scanning apparatus that reads a bundle of documents composed of a plurality of documents and obtains scan data composed of a plurality of page data, and more particularly to an improvement in image processing for the page data.

紙面と、電子データとによる重要書類の二元管理を行うため、近年、原稿読取装置が多くの職場に導入されている。原稿読取装置は、ADF(Automatic Document Feeder)によりトレイに積載された原稿束を一枚ずつ繰り出し、かかる原稿を読み取って文書データを作成する。また、両面モード/片面モードの設定や原稿サイズの混在設定が可能であり、両面モードに設定されると、原稿の表面、裏面がそれぞれ連続したページに対応した文書データを得る。上記の原稿読取装置による読み取りで得られる文書データは、原稿に対する押印で形成された印影を含むことがある。ここで、印刷データから印鑑の画像部分を抽出して、何等かの処理を実行する先行技術としては、特許文献1に記載された画像形成システムが知られている。かかる画像形成システムは、電子印鑑画像を予め記憶していて、それと共に、印刷データの中から印鑑画像を抽出する。そして、抽出された印鑑画像が、記憶されている電子印鑑画像のいずれかと一致するか否かの判定を行い、抽出された印鑑画像が1又は複数の電子印鑑画像のいずれかと一致する場合、印刷を実行する。 In recent years, document readers have been introduced in many workplaces in order to perform dual management of important documents using paper and electronic data. The document reading device feeds out a bundle of documents loaded on a tray one by one by an ADF (Automatic Document Feeder), reads the documents, and creates document data. Further, it is possible to set the double-sided mode / single-sided mode and the mixed setting of the document size. When the double-sided mode is set, the document data corresponding to the pages in which the front and back sides of the document are continuous can be obtained. The document data obtained by scanning with the document reading device may include an imprint formed by imprinting the document. Here, as a prior art that extracts an image portion of a seal stamp from print data and executes some processing, the image forming system described in Patent Document 1 is known. Such an image forming system stores an electronic seal stamp image in advance, and extracts the seal stamp image from the print data together with the electronic seal stamp image. Then, it is determined whether or not the extracted seal stamp image matches any of the stored electronic seal stamp images, and if the extracted seal stamp image matches any one or a plurality of electronic seal stamp images, printing is performed. To execute.

特開2010-44563号公報Japanese Unexamined Patent Publication No. 2010-44563

原稿をADFのトレイに積載して自動読み取りに供する場合、原稿間にインク写りが発生している可能性がある。インク写りとは、印肉であるインクが乾燥しないまま、他の原稿に重ね合わせられたために、押印による印影が他の原稿の紙面に転写されることをいう。原稿読取装置のトレイに載置された原稿束において、実印の押印がなされた用紙が、社外に発送される書類の下敷きになっていたとする。これにより、用紙から書類へのインク写りが生じて、実印の印影が用紙から書類に転写されると、大事な実印の印影が社外に流出してしまう。そして社外流出した転写物が印章の偽造に利用された場合、重大な法律上のトラブルを招いてしまう可能性がある。 When the originals are loaded on the ADF tray and used for automatic scanning, there is a possibility that ink transfer may occur between the originals. Ink transfer means that the imprint of the imprint is transferred to the paper surface of another original because the ink, which is the stamp, is superimposed on another original without being dried. It is assumed that in a bundle of documents placed on a tray of a document reading device, a paper stamped with a real seal is used as an underlay for documents to be shipped outside the company. As a result, ink is transferred from the paper to the document, and when the imprint of the actual seal is transferred from the paper to the document, the important imprint of the actual seal is leaked to the outside. And if the transcript leaked outside the company is used for forgery of the seal, it may lead to serious legal troubles.

内蔵メモリの大容量化に伴い、一度に100枚以上の原稿を読み取ることができる原稿読取装置が現在、多くの事業所に導入されている。一度に読み取られる100枚以上の原稿の中から、各原稿の転写の有無を目視で確認するというのは、事務員にとって大きな負担になる。また、かかる目視確認を徹底するとなると、事務作業の効率が一挙に低下するという問題がある。 With the increase in the capacity of the built-in memory, a document reading device capable of reading 100 or more documents at a time is currently introduced in many business establishments. It is a heavy burden for the clerk to visually check the presence or absence of transfer of each manuscript from among 100 or more manuscripts that can be read at one time. Further, if such visual confirmation is thoroughly performed, there is a problem that the efficiency of office work is reduced at once.

尚、特許文献1の画像形成システムは、印刷データからの印鑑画像の抽出を行えるものの、抽出された印鑑画像が、インク写りによるものかどうかは判定し得ないので、上述したような、インク写りによる印影の転写を発見しえないという問題がある。 Although the image forming system of Patent Document 1 can extract the stamp image from the print data, it cannot determine whether the extracted stamp image is due to the ink image, so that the ink image is as described above. There is a problem that the transfer of the imprint cannot be found.

押印による印影の転写を一例として説明したが、上記課題は印影の転写に限ったことではない。原稿読取装置のトレイの載置時に転写が生じて、原稿の記載に責を負うことの証明となる証明用画像が、1の原稿から他の原稿に転写された際、発生し得る普遍的な技術的課題である。 Although the transfer of the imprint by imprint has been described as an example, the above-mentioned problem is not limited to the transfer of the imprint. A universal proof image that can occur when a proof image is transferred from one document to another, which is a proof that the transfer occurs when the tray of the document reader is placed and is responsible for the description of the document. It is a technical issue.

本開示の目的は、インク写りによる証明用画像の転写を容易に発見することができる原稿読取装置を提供することである。 An object of the present disclosure is to provide a document reader capable of easily finding a transfer of a proof image due to ink transfer.

上記課題は、積載された両面原稿を複数読み取り、各原稿の両面のそれぞれに対応するページデータを得る原稿読取装置であって、前記原稿束の状態で対面する2つの原稿面に相当する2つのページデータのうち一方に、前記原稿の記載に責を負うことの証明となる証明用画像が含まれ、他方に、前記証明用画像に対し鏡像関係をなす画像が含まれているかどうかを評価する評価手段と、評価結果に基づき、原稿間で証明用画像が転写された旨を報知する報知手段とを備えることを特徴とする原稿読取装置により解決される。 The above-mentioned problem is a document reading device that reads a plurality of loaded double-sided originals and obtains page data corresponding to each of both sides of each original, and has two original surfaces corresponding to two facing original surfaces in the state of the document bundle. It is evaluated whether or not one of the page data contains a proof image that proves that the manuscript is responsible for the description, and the other contains an image that has a mirror image relationship with the proof image. The problem is solved by a document reading device including an evaluation means and a notification means for notifying that a certification image has been transferred between documents based on the evaluation result.

ここで、前記評価手段は、各ページデータのカラーヒストグラムを算出する処理、原稿本体の主要な色成分がなす分布域よりも低い度数をなす色成分の分布域を前記カラーヒストグラムから抽出する抽出処理を行い、前記抽出処理により抽出された分布域の色成分からなる画素群を証明用画像としてもよい。 Here, the evaluation means is a process of calculating a color histogram of each page data, and an extraction process of extracting a distribution area of color components having a frequency lower than the distribution area of the main color components of the manuscript body from the color histogram. , And the pixel group consisting of the color components of the distribution area extracted by the extraction process may be used as the proof image.

前記証明用画像は、原稿に押印がなされたことで形成された印影の画像であり、前記評価手段は、前記押印に使用される顔料の色成分、及び/又は、その近傍色の色成分からなる画素群を抽出することで証明用画像を得てもよい、前記証明用画像は、原稿に押印がなされたことで形成された印影の画像であり、前記評価手段は、印影の枠形状を抽出する処理を行ってもよい。 The proof image is an image of an imprint formed by imprinting a manuscript, and the evaluation means is based on the color component of the pigment used for the imprint and / or the color component of a color in the vicinity thereof. An image for proof may be obtained by extracting a group of pixels. The proof image is an image of an imprint formed by imprinting a stamp on a manuscript, and the evaluation means obtains a frame shape of the imprint. The process of extracting may be performed.

前記画素群の周縁をなすエッジに途切れがあったとしても、エッジ全長に対する途切れの比率が所定の値を下回る場合、前記評価手段は、当該画素群の周縁をなすエッジが印影の枠形状をなすとしてもよい。 Even if there is a break in the edge forming the peripheral edge of the pixel group, if the ratio of the break to the total edge length is less than a predetermined value, the evaluation means means that the edge forming the peripheral edge of the pixel group forms the frame shape of the imprint. May be.

前記証明用画像は、印章文字を含む印章であり、前記評価手段は、前記抽出処理により抽出された色成分からなる画素群から線図を抽出する処理、抽出された線図と、印章文字の活字パターンとをマッチングする処理を行い、前記マッチング処理の結果に従い、前記画素群が印章を構成するかどうかの判定結果を下してもよい。 The proof image is a seal including a seal character, and the evaluation means is a process of extracting a line diagram from a pixel group consisting of color components extracted by the extraction process, an extracted line diagram, and a seal character. A process of matching with a print pattern may be performed, and a determination result of whether or not the pixel group constitutes a stamp may be made according to the result of the matching process.

前記評価手段は、積載された複数の両面原稿が、サイズの異なる原稿を含むがどうか、前記複数の両面原稿のそれぞれが前後の原稿と比較して大きいかどうかに基づき、証明用画像を含むとされる、2つのページデータの対を特定してもよい。 The evaluation means includes a proof image based on whether the loaded double-sided originals include originals of different sizes and whether each of the plurality of double-sided originals is larger than the previous and next originals. The pair of two page data to be created may be specified.

前記複数原稿のサイズ設定が混在サイズであり、読み取るべき複数の両面原稿において、第1のサイズの2枚の原稿の間に、第1のサイズよりも小さい第2のサイズの原稿が挿入されている場合、前記評価手段は、前記第1のサイズの1の原稿に対応するページデータと、前記第1のサイズの他の原稿に対応するページデータとを、証明用画像を含む2つのページデータの対としてもよい。 The size setting of the plurality of originals is a mixed size, and in a plurality of double-sided originals to be read, a second size original smaller than the first size is inserted between two first size originals. If so, the evaluation means obtains page data corresponding to the first size 1 manuscript and page data corresponding to the first size other manuscript into two page data including a proof image. It may be a pair of.

前記評価手段による鏡像関係が成立しているかどうかの評価は、
(1)前記2つのページデータの一方に含まれる証明用画像に鏡像変換を施す処理、
(2)鏡像変換後の証明用画がなす角度が、前記2つのページデータの他方に含まれる証明用画像と一致しない場合、証明用画像に回転変換を施す処理を含んでもよい。
The evaluation of whether or not the mirror image relationship is established by the evaluation means is
(1) A process of performing a mirror image conversion on a proof image included in one of the two page data.
(2) If the angle formed by the proof image after the mirror image conversion does not match the proof image contained in the other of the two page data, a process of performing rotation conversion on the proof image may be included.

前記評価手段は更に、前記2つのページデータにおいて、前記証明用画像がなす線図が、どれだけ劣化しているかの度合いをそれぞれのページデータについて算出し、前記劣化の度合いが大きい方のページデータが、証明用画像を含むとの評価結果を下してもよい。 The evaluation means further calculates the degree of deterioration of the diagram formed by the proof image in the two page data for each page data, and the page data having the larger degree of deterioration. However, the evaluation result that the proof image is included may be given.

前記評価手段は、前記証明用画像を構成する線図の線種、濃度、途切れから劣化度を算出してもよい。 The evaluation means may calculate the degree of deterioration from the line type, density, and interruption of the diagram constituting the proof image.

証明用画像の画像を、各ページデータから検出して、証明用画像の画像が、原稿束で重なり合う2つの原稿面に相当する一対のページデータのそれぞれに含まれていて、それらが鏡像関係をなすかどうかを評価し、評価結果に基づき、原稿間で証明用画像が転写された旨を表示パネルに表示させるので、かかる表示に従い、ユーザーが転写された原稿を廃棄すれば、証明用画像の外部流出を回避することができる。これにより、証明用画像の外部流出のリスクを最小限にすることができる。 The image of the proof image is detected from each page data, and the image of the proof image is included in each of the pair of page data corresponding to the two document surfaces overlapping in the document bundle, and they have a mirror image relationship. It evaluates whether or not it is done, and based on the evaluation result, the display panel displays that the proof image has been transferred between the manuscripts. Therefore, if the user discards the transferred manuscript according to such display, the proof image will be displayed. It is possible to avoid external outflow. As a result, the risk of leakage of the proof image to the outside can be minimized.

原稿読取装置1000の外観を示す図である。It is a figure which shows the appearance of the document reading apparatus 1000. 原稿読取装置1000の内部構成を示す図である。It is a figure which shows the internal structure of the document reading apparatus 1000. 電子データ化される書類Aと、電子データ化で得られたスキャンデータとを示す。Document A to be converted into electronic data and scan data obtained by conversion to electronic data are shown. 複数のフローチャートのメインルーチンを示す。Shows the main routines of multiple flowcharts. ページ内領域特定の処理手順の詳細を示すフローチャートである。It is a flowchart which shows the detail of the processing procedure of a specific area in a page. 図6(a)は、RGB色空間の黒色近傍領域、朱色近傍領域を示す。図6(b)は、黒色近傍領域、朱色近傍領域のカラーヒストグラムを示す。FIG. 6A shows a region near black and a region near vermilion in the RGB color space. FIG. 6B shows a color histogram of a black neighborhood region and a vermilion neighborhood region. 印章文字を構成する4つのエッジ群201、202、203、204と、OCRデータベースの一例とを示す。The four edge groups 201, 202, 203, and 204 constituting the seal character and an example of the OCR database are shown. 特定領域の有用性判定手順の詳細を示すフローチャートである。It is a flowchart which shows the detail of the usefulness determination procedure of a specific area. 第1動作例におけるページ内情報テーブル102Tの一例を示す。An example of the in-page information table 102T in the first operation example is shown. 比較すべきページ対の決定手順の詳細を示すフローチャートである。It is a flowchart which shows the detail of the determination procedure of the page pair to be compared. 図11(a)は、第1動作例における原稿読取装置1000の機器設定、読取設定の一例を示す。図11(b)は、第1動作例におけるページ間情報テーブル104Tの一例を示す。FIG. 11A shows an example of the device setting and the scanning setting of the document reading device 1000 in the first operation example. FIG. 11B shows an example of the page-to-page information table 104T in the first operation example. ページ対に含まれる比較対象の原本性判定の詳細を示すフローチャートである。It is a flowchart which shows the detail of the originality determination of the comparison target included in a page pair. 図13(a)は、鏡像関係の判定のためのX−Y座標系を示す。図13(b)は、回転変換の過程を示す。FIG. 13A shows an XY coordinate system for determining the mirror image relationship. FIG. 13B shows the process of rotational transformation. 図14(a)は、第1動作例で原本性判定の対象となるエッジを拡大して示す。図14(b)は、第1動作例において線太、濃度、途切れ数が記載されたページ内情報テーブル102Tを示す。FIG. 14A shows an enlarged edge that is the target of the originality determination in the first operation example. FIG. 14B shows an in-page information table 102T in which the line thickness, density, and number of breaks are described in the first operation example. ステップS507でタッチパネルディスプレイ1001に表示される報知画面を示す。The notification screen displayed on the touch panel display 1001 in step S507 is shown. 混載サイズの原稿からなる原稿束を示す。Indicates a bundle of originals consisting of mixed-size originals. 混載サイズの原稿からなる原稿束について作成されたページ内情報テーブル102Tを示す。The in-page information table 102T created for a bundle of manuscripts composed of mixed-size manuscripts is shown. 図18(a)は、第2動作例における原稿読取装置1000の機器設定、読取設定の一例を示す。図18(b)は、第2動作例におけるページ間情報テーブル104Tの一例を示す。FIG. 18A shows an example of the device setting and the scanning setting of the document reading device 1000 in the second operation example. FIG. 18B shows an example of the page-to-page information table 104T in the second operation example. 図19(a)は、第2動作例で原本性判定の対象となるエッジを拡大して示す。図19(b)は、第2動作例において線太、濃度、途切れ数が記載されたページ内情報テーブル102Tを示す。FIG. 19A shows an enlarged edge that is the target of the originality determination in the second operation example. FIG. 19B shows an in-page information table 102T in which the line thickness, density, and number of breaks are described in the second operation example.

以下、本開示にかかる原稿読取装置の実施形態について説明する。 Hereinafter, embodiments of the document reader according to the present disclosure will be described.

[1] 原稿読取装置1000の外観
図1は、原稿読取装置1000の外観を示す図である。原稿読取装置1000は、MFP(Multi function Printer)であり、タッチパネルディスプレイ1001に対してなされたユーザーによる操作に従い、ADF1004のトレイ1004Tに載置された原稿束を読み込み電子データ化する。原稿束において、インク写りにより原稿D2の表面の印影M1が、原稿D1の裏面に転写され、原稿D1の裏面には、印影の転写物M2が形成されたとする。本実施形態に係る原稿読取装置1000は、原稿D1、D2、D3、D4、D5の読み込みで得られたスキャンデータから、こうしたインク写りによる転写物を検出して、タッチパネルディスプレイ100の表示を通じてユーザーに報知する。
[1] Appearance of Document Reading Device 1000 FIG. 1 is a diagram showing an appearance of the document reading device 1000. The document reading device 1000 is an MFP (Multi function Printer), and reads a bundle of documents placed on the tray 1004T of the ADF 1004 and converts it into electronic data according to a user operation performed on the touch panel display 1001. It is assumed that the imprint M1 on the front surface of the document D2 is transferred to the back surface of the document D1 and the transfer product M2 of the imprint is formed on the back surface of the document D1 due to the ink transfer in the document bundle. The document reading device 1000 according to the present embodiment detects a transferred material due to such ink reflection from the scan data obtained by reading the documents D1, D2, D3, D4, and D5, and displays the printed matter on the touch panel display 100 to the user. Notify.

[2]原稿読取装置1000の内部構成
図2は、原稿読取装置1000の内部構成を示す図である。本図に示すように、原稿読取装置1000は、原稿読取部101、ページ内特定部102、比較対象有効性判定部103、ページ間比較対象検出部104、装置設定部104S、ページ間一致判定部105、対話制御部106により構成される。
[2] Internal Configuration of Document Reading Device 1000 FIG. 2 is a diagram showing an internal configuration of the document reading device 1000. As shown in this figure, the document reading device 1000 includes a document reading unit 101, an in-page identification unit 102, a comparison target effectiveness determination unit 103, an inter-page comparison target detection unit 104, a device setting unit 104S, and a page-to-page match determination unit. It is composed of 105 and a dialogue control unit 106.

(2−1)原稿読取部101
原稿読取部101は、ADF1004のトレイに読み取りを行うべき原稿束が載置され、タッチパネルディスプレイ1001に対し原稿読み込みを開始する旨の操作がなされると、図1に示すトレイ1004Tに載置された両面原稿を順次繰り出すのと共に、各原稿の表面、裏面を光学的に読み取る。これにより、例えば、原稿の表面・裏面が、奇数ページ、偶数ページに対応するスキャンデータを得る。
(2-1) Document reading unit 101
When the document bundle to be read is placed on the tray of the ADF 1004 and the touch panel display 1001 is operated to start reading the document, the document reading unit 101 is placed on the tray 1004T shown in FIG. The double-sided documents are sequentially fed, and the front and back surfaces of each document are optically read. As a result, for example, scan data corresponding to odd-numbered pages and even-numbered pages on the front and back surfaces of the document can be obtained.

(2−2)ページ内特定部102
ページ内特定部102は、個々のページデータのページ内領域に対し、カラーヒストグラムの算出を行い、カラーヒストグラムにおいて、下地がなす画素の色成分の分布域、又は、文書本体がなす画素の色成分の分布域の度数よりも、低い度数をなす色を印肉の色として検出して、かかる印肉の色をなす画素群の座標を、ページ内領域から特定する。また、印肉の色をなす画素群内のエッジを抽出して文字認識を試み、印肉の色をなす画素群における印章文字の有無を確認する。こうして、印肉の色をなし、かつ、印章文字を含む画素群が検出されれば、当該画素群は証明用画像を構成するとして扱い、その画素群の座標、印章文字を含む旨を示すレコードをページ内情報テーブル102Tに追加する。ここで証明用画像とは、正像又は鏡像が原稿の記載に責を負うことの証明となる画像のことであり、本実施形態では、実印の印影の正像のみならず、当該印影の鏡像をも証明用画像として扱う。
(2-2) Specific part 102 in the page
The in-page identification unit 102 calculates a color histogram for the in-page area of each page data, and in the color histogram, the distribution area of the color component of the pixel formed by the background or the color component of the pixel formed by the document body. A color having a frequency lower than the frequency of the distribution area of is detected as the color of the stamp, and the coordinates of the pixel group forming the color of the stamp are specified from the in-page area. In addition, the edge in the pixel group that forms the color of the stamp is extracted to try character recognition, and the presence or absence of the seal character in the pixel group that forms the color of the stamp is confirmed. In this way, if a pixel group that has the color of the seal and contains the seal character is detected, the pixel group is treated as forming a proof image, and a record indicating that the coordinates of the pixel group and the seal character are included. Is added to the in-page information table 102T. Here, the proof image is an image that proves that the normal image or the mirror image is responsible for the description of the manuscript, and in the present embodiment, not only the normal image of the imprint of the actual seal but also the mirror image of the imprint. Is also treated as a proof image.

(2−3)比較対象有効性判定部103
比較対象有効性判定部103は、ページ内特定部102により特定された印章文字を含む領域の周縁からエッジを抽出する。連続性があるエッジが抽出された場合、そのエッジは、図形として成立するかを評価する。図形としての成立性を有する場合、かかる図形形状の区別(矩形形状、円形状の区別を含む)をページ内情報テーブル102Tに登録する。また、印章文字を構成する画素の明度(L)、彩度(S)、色相(H)を算出して、ページ内情報テーブル102Tに登録する。
(2-3) Comparison target effectiveness determination unit 103
The comparison target validity determination unit 103 extracts an edge from the peripheral edge of the area including the seal character specified by the in-page identification unit 102. When an edge with continuity is extracted, it is evaluated whether the edge is established as a figure. When it has the feasibility as a figure, the distinction between the figure shapes (including the distinction between the rectangular shape and the circular shape) is registered in the in-page information table 102T. Further, the brightness (L), saturation (S), and hue (H) of the pixels constituting the seal character are calculated and registered in the in-page information table 102T.

(2−4)ページ間比較対象検出部104
ページ間比較対象検出部104は、画像形成装置におけるADF1004の装着の有無、原稿の読込設定が両面設定かどうか(両面/片面設定)、読み込むべき原稿のサイズが混載しているかどうかの設定(混載/同一設定)に基づき、比較対象となるべきページ対をページ間情報テーブル104Tに設定する。同一サイズの原稿を両面で読み込む場合、画像データにおける連続するページの組みを比較すべきページ対とする。画像データにおける連続するページであり、2・i(偶数)ページと、2・i+1(奇数)ページとの組みは、1の原稿の裏面と、次の原稿の表面とに対応していて、これらは積載時に対面するからである。
(2-4) Page-to-page comparison target detection unit 104
The page-to-page comparison target detection unit 104 sets whether or not the ADF1004 is attached in the image forming apparatus, whether or not the document reading setting is double-sided setting (double-sided / single-sided setting), and whether or not the size of the document to be read is mixed (mixed loading). / Same setting), the page pair to be compared is set in the page-to-page information table 104T. When reading originals of the same size on both sides, the set of consecutive pages in the image data is the page pair to be compared. It is a continuous page in the image data, and the combination of the 2.i (even) page and the 2.i + 1 (odd) page corresponds to the back surface of one manuscript and the front surface of the next manuscript. This is because they face each other when loaded.

同じ用紙サイズの連続する2枚の原稿の間に、これらよりも小さいサイズの原稿が挿入されているような、混載サイズの両面原稿を読み取る場合、その2枚の原稿の対面する2つのページを比較すべきページ対として、ページ間情報テーブル104Tに設定する。大きな用紙サイズの原稿と、小さな用紙サイズの原稿とが重なり合っていて、当該原稿の下側に印章文字を含む印影が存在する場合、その印影は、対面する大きなサイズの原稿に転写されうるからである。 When scanning a mixed-size double-sided document in which a smaller size document is inserted between two consecutive sheets of the same paper size, the two facing pages of the two sheets are displayed. The page pair to be compared is set in the page-to-page information table 104T. This is because if a large paper size document and a small paper size document overlap each other and there is an imprint containing stamp characters on the lower side of the document, the imprint can be transferred to the facing large size document. is there.

(2−5)ページ間一致判定部105
ページ間一致判定部105は、ページ内情報テーブル102Tに登録され、取得したページ対の一方のページデータに含まれる印影を、当該ページ対の他方のページデータに含まれる印影と比較して、何れが原本であるか、何れが転写物であるかの見極めを行う。この比較にあたって、比較対象ページ対の一方側、多方側に含まれる印影の線幅、濃度、途切れ数から、比較すべきページ対における印影がどの程度劣化しているかという劣化度を算出する。そうした劣化度が高い印影を転写物であるとし、劣化度が低い印影を原本とする。
(2-5) Page-to-page match determination unit 105
The page-to-page match determination unit 105 compares the imprint contained in one page data of the acquired page pair with the imprint contained in the other page data of the page pair registered in the in-page information table 102T, and eventually Determine whether is the original or which is the transcript. In this comparison, the degree of deterioration of the degree of deterioration of the imprint on the page pair to be compared is calculated from the line width, density, and the number of breaks of the imprint contained on one side and many sides of the page pair to be compared. The imprint with a high degree of deterioration is regarded as a transcript, and the imprint with a low degree of deterioration is used as the original.

[3]第1動作例
(3−1)原稿束の読み取りで得られたページデータ
図4、図5、図8、図10、図12のフローチャートを参照して、以上のように構成された原稿読取装置1000の動作を説明する。第1動作例では、図3に示す書類Aを読み取り、電子データ化するケースを想定する。書類Aは3枚の両面原稿からなる文書であり、2枚目原稿の表面に印影が存在する。
[3] First Operation Example (3-1) Page Data Obtained by Reading a Bundle of Documents With reference to the flowcharts of FIGS. 4, 5, 8, 10, and 12, the configuration is as described above. The operation of the document reading device 1000 will be described. In the first operation example, it is assumed that the document A shown in FIG. 3 is read and converted into electronic data. Document A is a document composed of three double-sided originals, and has an imprint on the surface of the second original.

ADF1004の積載時において、印肉が乾燥しないまま用紙が積み重ねられたため、2枚目原稿の表面の印影が1枚目原稿の裏面に転写されている。 When the ADF1004 was loaded, the papers were stacked without the stamps being dried, so that the imprint on the front surface of the second original was transferred to the back surface of the first original.

図4は、図5、図8、図10、図12のフローチャートのメインルーチンのフローチャートである。図4のステップS101では、原稿束をADF1004で読み取り、スキャンデータを得る。図3におけるスキャンデータAは、書類Aの原稿束を光学的に読み取ることで得られたデータであり、書類Aを構成する各原稿の表面を奇数ページ、裏面を偶数ページとしたページ構成をなす。そのため、スキャンデータの2ページ目には、未乾燥のインクが転写されたことによる印影画像が存在する。 FIG. 4 is a flowchart of the main routine of the flowcharts of FIGS. 5, 8, 10, and 12. In step S101 of FIG. 4, the document bundle is read by the ADF1004 to obtain scan data. The scan data A in FIG. 3 is data obtained by optically reading a bundle of documents of the document A, and has a page structure in which the front surface of each document constituting the document A is an odd number of pages and the back surface is an even number of pages. .. Therefore, on the second page of the scan data, there is an imprint image due to the transfer of the undried ink.

(3−2)カラーヒストグラム分析
スキャンデータが得られると、ページ内特定部102が処理を開始する。ページ内特定部102は、スキャンデータの各ページに存在する領域を特定して、ページ内情報テーブル102Tを得る(ステップS102)。ステップS102の手順は、図5のサブルーチンに展開することができる。図5は、ページ内領域特定の処理手順の詳細を示すフローチャートである。
(3-2) Color Histogram Analysis When the scan data is obtained, the in-page identification unit 102 starts processing. The in-page identification unit 102 identifies an area existing on each page of the scan data and obtains the in-page information table 102T (step S102). The procedure of step S102 can be expanded to the subroutine of FIG. FIG. 5 is a flowchart showing the details of the processing procedure for specifying the in-page area.

本フローチャートにおける変数iは、スキャンデータのそれぞれのページを指示する変数であり、本フローチャートでは、ステップS201〜S212のループによる繰り返しを制御する制御変数としての役目を担う。まず変数iを初期化し(ステップS201)、ページiのカラーヒストグラムを算出する(ステップS202)。こうして生成されたカラーヒストグラムは、原稿の主要な色成分で最も高い度数を示していて、原稿の下地及び本文の主要な色成分とは異なる色成分で次順位以下の度数を示しているかを判定する(ステップS203)。 The variable i in this flowchart is a variable that indicates each page of scan data, and in this flowchart, serves as a control variable that controls the repetition by the loop of steps S201 to S212. First, the variable i is initialized (step S201), and the color histogram of page i is calculated (step S202). The color histogram generated in this way shows the highest frequency among the main color components of the document, and determines whether the frequency is lower than the next rank with a color component different from the main color components of the base of the document and the text. (Step S203).

伝票等の原稿は主として文字、罫線等で構成されており、この文字、罫線にあたる画素は、図6(a)のRGB色空間において、黒色・灰色を中心とした領域(黒色近傍領域200B)を占める。印影にあたる画素は、図6(a)のRGB色空間において、異なる領域(特定色領域200S)を占める。 Manuscripts such as slips are mainly composed of characters, ruled lines, etc., and the pixels corresponding to these characters and ruled lines form an area centered on black and gray (black neighborhood area 200B) in the RGB color space of FIG. 6 (a). Occupy. The pixels corresponding to the imprint occupy different regions (specific color region 200S) in the RGB color space of FIG. 6A.

黒色近傍領域200Bは、図6(b)のカラーヒストグラムにおいて、最も高い度数を示す。特定色領域200Sは、図6(b)のカラーヒストグラムにおいて、黒色近傍領域200Bの次に高い度数を示す。 The black vicinity region 200B shows the highest frequency in the color histogram of FIG. 6 (b). The specific color region 200S shows the next highest frequency after the black neighborhood region 200B in the color histogram of FIG. 6 (b).

ページデータの一部の画素群が、原稿の主要な色成分とは異なる色成分の画素からなり、当該画素が次順位以下の度数を示す場合、この次順位以下の度数を示す画素群のレコードを、ページ内情報テーブル102Tに追加する(ステップS204)。以下、レコードとして追加された画素群を単に画素群という。また、ページ内特定部102は、ページ内情報テーブル102Tのレコードに、用紙2ページ目、用紙3ページ目の印影の座標(X1、Y1)、(X4、Y4)、縦幅H1、H2、横幅W1、W2を登録する。 When a part of the pixel group of the page data is composed of pixels having a color component different from the main color component of the document and the pixel shows a frequency of the next rank or lower, a record of the pixel group showing the power of the next rank or lower. Is added to the in-page information table 102T (step S204). Hereinafter, the pixel group added as a record is simply referred to as a pixel group. Further, the in-page identification unit 102 has the coordinates (X1, Y1), (X4, Y4), vertical widths H1, H2, and horizontal widths of the imprints (X1, Y1), (X4, Y4), the second page of the paper, and the third page of the paper in the record of the in-page information table 102T. Register W1 and W2.

(3−3)エッジ抽出・文字認識
ページ内特定処理を終えたので、エッジ処理を開始する。はじめに、ページiの画素群の内部を下地の空白で分割してエッジ群を検出し(ステップS205)、エッジに一定以上の連続性が存在するかどうかを判定する(ステップS206)。連続性を有するエッジがページiに存在する場合(ステップS206でYes)、上記画素群のエッジを線画として抽出する(ステップS207)。
(3-3) Edge extraction / character recognition Since the page identification processing has been completed, the edge processing is started. First, the inside of the pixel group on page i is divided by a blank background to detect the edge group (step S205), and it is determined whether or not the edge has continuity of a certain level or more (step S206). When an edge having continuity exists on page i (Yes in step S206), the edge of the pixel group is extracted as a line drawing (step S207).

続いて、印章文字としての成立性を判定する。ページiのエッジと、活字パターンとのマッチング率は閾値を下回るかどうかを判定する(ステップS208)。閾値を下回る場合(ステップS208でYes)、連続性を有するエッジを印章文字として認識し(ステップS209)、画素群内のエッジが印章文字を構成する旨を、ページ内情報テーブル102Tの該当するレコードの画像・特徴の欄に登録する(ステップS210)。 Subsequently, the feasibility of the seal character is determined. It is determined whether the matching rate between the edge of page i and the type pattern is below the threshold value (step S208). When the value is below the threshold value (Yes in step S208), the edge having continuity is recognized as the seal character (step S209), and the corresponding record of the in-page information table 102T indicating that the edge in the pixel group constitutes the seal character. Register in the image / feature column of (step S210).

図3の一例の印影は、図7に示すように、水平、垂直方向の下地領域102B,102Cを境界として、4つのエッジ群201、202、203、204が存在するので、かかるエッジ群を抽出し、OCRの活字パターンとのマッチング率を算出して、個々のエッジ群の文字認識を試みる。 As shown in FIG. 7, the imprint of an example of FIG. 3 has four edge groups 201, 202, 203, and 204 with the horizontal and vertical base areas 102B and 102C as boundaries, and thus such edge groups are extracted. Then, the matching rate with the OCR type pattern is calculated, and character recognition of each edge group is attempted.

認識対象となる文字と、マッチング率との大まかな関係を以下に説明する。図7の対応表102Lは、1から5までのマッチング率と、各マッチング率に該当するとされるエッジ群とを示す。この対応表102Lにおけるエッジ群は、「験」、「字」、「ま」といった活字を構成するものである。 The rough relationship between the characters to be recognized and the matching rate will be described below. Correspondence table 102L of FIG. 7 shows the matching rate from 1 to 5 and the edge group corresponding to each matching rate. The edge group in the correspondence table 102L constitutes a type such as "experiment", "character", and "ma".

本図に示すように、活字に近いエッジは、マッチング率が高いと認識される。 As shown in this figure, edges that are close to print are recognized as having a high matching rate.

そこで、マッチング率から印章文字の重要度レベルを定めて、図9に示すようにページ内情報テーブル102Tの、2ページ、3ページに対応するレコードのうち、画像・特徴欄に、当該重要度レベルを登録する。本実施形態では、画素群のエッジがなす文字のマッチング率が、2以下であれば、重要度レベルを「高」とし、画素群のエッジがなす文字のマッチング率が、3であれば、重要度レベルを「中」とする。4以上であれば、重要度レベルを「低」とする。 Therefore, the importance level of the seal character is determined from the matching rate, and as shown in FIG. 9, the importance level is set in the image / feature column of the records corresponding to the second page and the third page of the in-page information table 102T. To register. In the present embodiment, if the matching rate of characters formed by the edges of the pixel group is 2 or less, the importance level is set to "high", and if the matching rate of characters formed by the edges of the pixel group is 3, it is important. Set the degree level to "medium". If it is 4 or more, the importance level is set to "low".

図7において、スキャンデータの2ページ目、3ページ目の印影文字は篆書体であり、OCRの活字パターンとのマッチング率が1、2等低く算出される。そのため、ページ内特定部102は、図9において原稿2ページ目、原稿3ページ目のレコードの画像特徴欄C42、C43に、これらの2ページ目、3ページ目の画素群が、印章文字を形成していて、重要度レベルが高い旨を登録する(ステップS210)。ステップS211は、ステップS202〜S212のループの継続要件が成立するかどうかの判定ステップであり、変数iが最大ページ数を下回る場合(ステップS211でYes)、変数iをインクリメントして(ステップS212)、ステップS202に戻る。 In FIG. 7, the imprint characters on the second and third pages of the scan data are in a seal script, and the matching rate with the OCR type pattern is calculated to be 1 or 2 mag lower. Therefore, in the in-page identification unit 102, the pixel groups of the second and third pages form the seal characters in the image feature columns C42 and C43 of the records of the second page and the third page of the manuscript in FIG. It is registered that the importance level is high (step S210). Step S211 is a step for determining whether or not the loop continuation requirement of steps S202 to S212 is satisfied. If the variable i is less than the maximum number of pages (Yes in step S211), the variable i is incremented (step S212). , Return to step S202.

以下、変数iがページ最大値を下回る限り、ステップS202〜S212の繰り返しは継続する。変数iが最大ページ数に達し、全ページの処理が完了すると、継続要件を規定するステップS211がNoになる。ステップS211がNoになることで、本フローチャートの処理を終了し、図4のメインルーチンにリターンする。 Hereinafter, as long as the variable i falls below the page maximum value, the repetition of steps S202 to S212 continues. When the variable i reaches the maximum number of pages and the processing of all pages is completed, step S211 defining the continuation requirement becomes No. When step S211 becomes No, the process of this flowchart is terminated, and the process returns to the main routine of FIG.

(3−4)図形枠の抽出
ページ内特定部102が処理を終えたので、ステップS103において比較対象有効性判定部103が処理を開始し、ページ内特定部102により特定された画素群が、印章として有用かどうかを判定する。具体的にいうと、連続するエッジが、図形としての成立性を有しているかどうかを判定する。上述したステップS103の手順は、図8のサブルーチンに展開することができる。
(3-4) Extraction of Graphic Frame Since the in-page identification unit 102 has finished processing, the comparison target validity determination unit 103 starts processing in step S103, and the pixel group specified by the in-page identification unit 102 Determine if it is useful as a seal. Specifically, it is determined whether or not the continuous edges have the feasibility as a figure. The procedure of step S103 described above can be expanded to the subroutine of FIG.

図8は、特定領域の有用性判定手順の詳細を示すフローチャートである。図8のフローチャートも、図5と同様、個々のページを特定する変数iを制御変数として用いる。図8のフローチャートでは、変数iに1を設定して(ステップS301)、ページ間で比較すべき印影(比較対象という)がページiに存在するかどうかを判定する(ステップS302)。比較対象が存在する場合(ステップS302でYes)、ページiで特定された画素群の周縁部におけるエッジを抽出する(ステップS303)。こうしてエッジを抽出すると、検出したエッジに一定以上の連続性があるかどうか(ステップS304)、検出したエッジが図形として成立するかどうか(ステップS305)の判定を行う。印章の枠形状には、円形状のもの、矩形形状のものがある。ページ内特定部102は、これらの円形状、矩形形状をなすエッジを画素群の周縁から抽出する。画素群の周縁から抽出されたエッジに途切れがあったとしても、エッジ全長に対する途切れの比率が所定の値(例えば、全長に対する10%)以下であればエッジは連続性を有していて、印章の枠形状をなすものとする。ステップS304、S305が何れもYesであるなら、ページiにおいて特定された領域を、印章の領域として抽出して、図9に示すようにページ内情報テーブル102Tにおけるレコードの形状・左上座標欄C22、C23に登録する(ステップS306)。ステップS304がYes、S305がNoであるなら、ページiにおいて特定された領域から抽出を行わず、ステップS311に進んで、変数iをインクリメントする。このように、印章を抽出した後、抽出した領域のHCL色空間における座標を抽出する。 FIG. 8 is a flowchart showing the details of the procedure for determining the usefulness of the specific area. Similar to FIG. 5, the flowchart of FIG. 8 also uses the variable i that identifies each page as a control variable. In the flowchart of FIG. 8, the variable i is set to 1 (step S301), and it is determined whether or not an imprint (referred to as a comparison target) to be compared between pages exists on the page i (step S302). When the comparison target exists (Yes in step S302), the edge at the peripheral edge of the pixel group specified on page i is extracted (step S303). When the edges are extracted in this way, it is determined whether or not the detected edges have a certain degree of continuity or more (step S304), and whether or not the detected edges are established as a figure (step S305). The frame shape of the seal includes a circular shape and a rectangular shape. The in-page identification unit 102 extracts these circular and rectangular edges from the periphery of the pixel group. Even if there is a break in the edge extracted from the peripheral edge of the pixel group, if the ratio of the break to the total edge length is less than or equal to a predetermined value (for example, 10% of the total length), the edge has continuity and is a seal. It shall form the frame shape of. If both steps S304 and S305 are Yes, the area specified on page i is extracted as the area of the seal, and as shown in FIG. 9, the shape of the record in the in-page information table 102T / upper left coordinate column C22, Register in C23 (step S306). If step S304 is Yes and S305 is No, extraction is not performed from the area specified on page i, and the process proceeds to step S311 to increment the variable i. In this way, after extracting the seal, the coordinates of the extracted region in the HCl color space are extracted.

2ページ目、3ページ目の印影の周縁のエッジに連続性があるので、印章の枠は、図形として成立する。そのため、比較対象有効性判定部103は、ページ内情報テーブル102Tのうち、2ページ目、3ページ目の印影のレコードに、形状が矩形形状である旨、及び、矩形形状の幅、高さを登録する。 Since there is continuity at the edge of the periphery of the imprint on the second and third pages, the frame of the seal is established as a figure. Therefore, the comparison target validity determination unit 103 tells the record of the imprint on the second and third pages of the in-page information table 102T that the shape is rectangular, and that the width and height of the rectangular shape are rectangular. sign up.

尚、ステップS304がNoであれば、ステップS305〜S308をスキップする。ステップS309はループの継続要件が成立するかどうかの判定であり、変数iが最大ページ数を下回る場合(ステップ309でYes)、変数iをインクリメントして(ステップS310)、ステップS302に戻る。変数iがページ最大値を下回る限り、ステップの繰り返しは継続する。これにより、個々のページは処理に供される。変数iが最大ページ数に達し、全ページの処理が完了すると、終了要件を規定するステップS309がNoになって、本フローチャートの処理を終了し、メインルーチンにリターンする。サブルーチンからのリターンにより、ステップS103の直後のステップS104から処理を再開する。 If step S304 is No, steps S305 to S308 are skipped. Step S309 is a determination as to whether or not the loop continuation requirement is satisfied. If the variable i is less than the maximum number of pages (Yes in step 309), the variable i is incremented (step S310), and the process returns to step S302. As long as the variable i falls below the page maximum, the step repeats. As a result, the individual pages are subjected to processing. When the variable i reaches the maximum number of pages and the processing of all pages is completed, step S309 for defining the end requirement becomes No, the processing of this flowchart is terminated, and the process returns to the main routine. Due to the return from the subroutine, the process is restarted from step S104 immediately after step S103.

(3−5)比較を行うべきページデータ対の特定
ステップS104は、ADF装着の有無や原稿サイズに従い、比較をおこなうべきページ対を決定して、ページ間情報テーブル104Tを作成する。ステップS104の手順は、図10のサブルーチンに展開することができる。図10は、比較すべきページ対の決定手順の詳細を示すフローチャートである。
(3-5) Identification of Page Data Pairs to be Compared In step S104, the page pair to be compared is determined according to the presence / absence of ADF attachment and the original size, and the page-to-page information table 104T is created. The procedure of step S104 can be expanded to the subroutine of FIG. FIG. 10 is a flowchart showing the details of the procedure for determining the page pairs to be compared.

本フローチャートのステップS401はADF1004の装着の有無の判定であり、ステップS402は両面読み取りが設定されたかどうかの判定である。これらのステップS401、S402の何れかがNoであれば、なんの処理も行わず、本フローチャートの処理を終了する。 Step S401 of this flowchart is for determining whether or not the ADF1004 is attached, and step S402 is for determining whether or not double-sided reading is set. If any of these steps S401 and S402 is No, no processing is performed and the processing of this flowchart ends.

ステップS401、S402が何れもYesであれば、原稿読取装置1000の読取設定がサイズ混在であるかどうかを判定する。読み取るべき原稿が同一サイズであれば(ステップS403でNo)、ステップ404〜S408からなるループに移行する。ステップS404〜ステップS408のループは、変数iに1を設定して(ステップS404)、ページ2・iが比較対象を含むかどうかを判定し(ステップS405)、含む場合、2・i番目のページ、2・i+1番目のページを比較すべきページ対u,vとする(ステップS406)。 If both steps S401 and S402 are Yes, it is determined whether or not the reading settings of the document reading device 1000 are mixed sizes. If the documents to be read have the same size (No in step S403), the process proceeds to the loop consisting of steps 404 to S408. In the loop of steps S404 to S408, the variable i is set to 1 (step S404), it is determined whether or not pages 2 and i include the comparison target (step S405), and if so, the 2nd and i-th pages are included. 2, i + 1 The first page is the page to be compared vs. u, v (step S406).

原稿読取装置1000の機器設定、読取設定は、図11(a)に示すような設定、つまりADF1004が装着されていて、片面/両面設定が両面設定、原稿サイズがページ同一に設定されているものとする。装置設定は、両面読取、原稿サイズ同一なので、比較すべきページ対は、2・iページ、2・i+1ページとなる(ステップS406)。 The device settings and scanning settings of the document scanning device 1000 are the settings shown in FIG. 11A, that is, the ADF1004 is mounted, the single-sided / double-sided setting is set to double-sided, and the document size is set to the same page. And. Since the device settings are double-sided scanning and the document size is the same, the page pairs to be compared are 2 · i pages and 2 · i + 1 pages (step S406).

これにより、図11(b)のページ間情報テーブル104Tの一例に示すように、スキャンデータの2ページにおいては、相手側ページを「3」と定める。また、スキャンデータの3ページ目においても相手側ページを「2」と定める。スキャンデータの2ページ目、3ページ目には印影が存在するので、図11(b)に示すように、ページ内情報テーブル102Tの2ページ目、3ページ目のレコードは、比較対象を「あり」と定め、また判定要否を「実施要」に定める。 As a result, as shown in an example of the inter-page information table 104T in FIG. 11B, the other page is defined as "3" in the two pages of the scan data. Also, on the third page of the scan data, the other page is defined as "2". Since imprints are present on the second and third pages of the scan data, as shown in FIG. 11B, the records on the second and third pages of the in-page information table 102T have a comparison target of "Yes". , And the necessity of judgment is specified in "Implementation required".

ステップS407は、ループの継続要件であり、2・i+2番目のページのページ番号が最終ページを下回る場合(ステップS407でYes)、変数iをインクリメントして(ステップS408)、ステップS405に戻る。ステップS407の継続要件を充足する限り、次順位の情報要素を対象として、上記一連の処理が実行される。2・i+2番目のページのページ番号が最終ページになると、本サブルーチンを終了して、メインルーチンにリターンする。サブルーチンからのリターンにより、直後のステップS105から処理を再開する。 Step S407 is a loop continuation requirement, and if the page number of the second i + second page is lower than the last page (Yes in step S407), the variable i is incremented (step S408), and the process returns to step S405. As long as the continuation requirement of step S407 is satisfied, the above series of processes are executed for the information elements of the next rank. 2. When the page number of the i + 2nd page reaches the last page, this subroutine is terminated and the process returns to the main routine. By the return from the subroutine, the process is restarted from the step S105 immediately after.

ステップS105では、比較すべきページ対に含まれる個々の比較対象の原本性を判定する。ステップS105の手順は、図12のサブルーチンに展開することができる。図12は、ページデータ対に含まれる比較対象の原本性判定の詳細を示すフローチャートである。 In step S105, the originality of each comparison target included in the page pair to be compared is determined. The procedure of step S105 can be expanded to the subroutine of FIG. FIG. 12 is a flowchart showing details of the originality determination of the comparison target included in the page data pair.

本フローチャートの変数u,vは、一致判定の対象になるべきページの組を指示する変数である。まず、ページ間情報テーブル104Tにおいて比較対象を有する最初のページをページuとする(ステップS501)。また、ページ間情報テーブル104Tにおいて、ページuの相手側のページをページvとする(ステップS502)。 The variables u and v in this flowchart are variables that indicate the set of pages that should be the target of the match determination. First, page u is the first page having a comparison target in the page-to-page information table 104T (step S501). Further, in the page-to-page information table 104T, the page on the other side of the page u is set as the page v (step S502).

(3−6)鏡像関係の判定
次に、ページuの比較対象と、ページvの比較対象とは、鏡像関係にあるかどうかの評価を行う(ステップS503)。
(3-6) Determination of Mirror Image Relationship Next, it is evaluated whether or not the comparison target of page u and the comparison target of page v have a mirror image relationship (step S503).

鏡像関係が成立するかどうかの判定は、以下の過程を経ることでなされる。2ページ目のページデータの比較対象、3ページ目のページデータの比較対象を、図13(a)に示すようなX−Y座標系の第1象限(X座標が正、Y座標が正の象限)、第2象限(X座標が負、Y座標が正の象限)に配置する。 Judgment as to whether or not the mirror image relationship is established is made by going through the following process. The comparison target of the page data on the second page is the comparison target of the page data on the third page in the first quadrant of the XY coordinate system as shown in FIG. 13 (a) (the X coordinate is positive and the Y coordinate is positive). Arrange in the second quadrant (quadrant where the X coordinate is negative and the Y coordinate is positive).

比較対象である印影である画素群を配置する際、ページ2の印影の右上座標(X1´、Y1´)と、ページ3の印影の左上座標(X4、Y4)とが、Y軸において線対称になるように、ページ2の印影の左上座標のオフセット(ofset1、ofset3)、ページ3の印影の左上座標のオフセット(ofset2、ofset4)を定める。一対のページデータにおける画素群の位置が、上下左右にずれている可能性があるからである。このように、2ページ目の比較対象、3ページ目の比較対象を第2象限、第1象限に配置すると、2ページ目の比較対象、3ページ目の比較対象は、Y軸で折り返す関係になるから、Y軸で折り返す一次変換行列Aで、第2象限の印影を構成する個々の画素の変換を試みる。 When arranging the pixel group that is the imprint to be compared, the upper right coordinates (X 1 ', Y 1 ') of the imprint on page 2 and the upper left coordinates (X 4 , Y 4 ) of the imprint on page 3 are Y. The offset of the upper left coordinate of the imprint of page 2 (ofset1, ofset3) and the offset of the upper left coordinate of the imprint of page 3 (ofset2, ofset4) are determined so as to be line-symmetrical on the axis. This is because the positions of the pixel groups in the pair of page data may be shifted vertically and horizontally. In this way, when the comparison target on the second page and the comparison target on the third page are arranged in the second quadrant and the first quadrant, the comparison target on the second page and the comparison target on the third page are in a relationship of folding back on the Y axis. Therefore, the first-order transformation matrix A that wraps around the Y-axis attempts to transform the individual pixels that make up the imprint of the second quadrant.

Y軸で折り返す一次変換行列Aを以下の数1に示す。 The first-order transformation matrix A that wraps around the Y-axis is shown in Equation 1 below.

Figure 2021081853
Figure 2021081853

2ページ目の印影を一次変換行列Aにより変換したものが、3ページ目の印影と一致した場合、2ページ目の印影と、3ページ目の印影とは鏡像関係にあるものとの判断結果を下す。 When the imprint of the second page is converted by the linear transformation matrix A and matches the imprint of the third page, the judgment result that the imprint of the second page and the imprint of the third page are in a mirror image relationship is determined. Give it down.

一次変換行列Aによる変換では、双方の印影が一致しない場合、図13(b)に示すように、印影に回転行列による変換を施し、微小角Δθだけ、2ページ目の印影を回転する。かかるΔθの回転がなされ、一次変換行列Aによる変換がなされた変換後の印影が、3ページ目の印影と一致するかどうかの判定を行い、一致すれば双方は鏡像関係にあるとの判断結果を下す。微小角Δθの回転変換後の印影が、3ページ目の印影と一致しない場合、微小角Δθの回転変換と、3ページ目の印影と一致するかどうかの判定とを繰り返す。 In the transformation by the linear transformation matrix A, when both imprints do not match, the imprints are transformed by the rotation matrix as shown in FIG. 13B, and the imprints on the second page are rotated by the minute angle Δθ. The rotation of Δθ is performed, and it is determined whether or not the imprint after conversion, which is converted by the linear transformation matrix A, matches the imprint on the third page. If they match, it is determined that both are in a mirror image relationship. To give. When the imprint after the rotation conversion of the minute angle Δθ does not match the imprint of the third page, the rotation conversion of the minute angle Δθ and the determination of whether or not it matches the imprint of the third page are repeated.

(3−7)劣化度の判定
比較対象の回転を繰り返したとしてもページデータ対における比較対象が一致しない場合(ステップS503でNo)、ページuの比較対象と、ページvの比較対象とは、鏡像関係にないものとして、本サブルーチンの処理を終了し、メインルーチンにリターンする。
(3-7) Judgment of Deterioration Degree When the comparison target in the page data pair does not match even if the rotation of the comparison target is repeated (No in step S503), the comparison target of page u and the comparison target of page v are Assuming that it is not related to the mirror image, the processing of this subroutine is terminated and the process returns to the main routine.

以上の過程を経て、ページデータ対における比較対象の角度が一致した場合(ステップS503でYes)、ページuの比較対象と、ページvの比較対象とは、鏡像関係にあるものとする。続いて、ページu,v内の画素群のエッジにおける線幅、濃度、途切れを取得し(ステップS504)、取得した線幅、濃度、途切れから、ページu,vの劣化度を算出する(ステップS505)。続いて、ページuの劣化度と、ページvの劣化度vとの大小比較を行う。 Through the above process, when the angles of the comparison targets in the page data pair match (Yes in step S503), it is assumed that the comparison target of the page u and the comparison target of the page v are in a mirror image relationship. Subsequently, the line width, density, and break at the edge of the pixel group in pages u and v are acquired (step S504), and the degree of deterioration of pages u and v is calculated from the acquired line width, density, and break (step). S505). Subsequently, the magnitude of the deterioration degree v of the page u and the deterioration degree v of the page v are compared.

ここで、図14(a)の拡大図に示すように、2ージ目の印影のエッジは、線幅が細く(2ページ目の線幅は2であるのに対し、3ページ目の線幅は5)、また、2ページ目のエッジは濃度が薄い(2ページ目のエッジE1は濃度が50、3ページ目のエッジE2は濃度が75)。更に2ページ目は、3ページ目よりも多くの途切れ(5個の途切れ)を有しているものとする。ページ間一致判定部105は、これらの線幅、濃度、途切れ数を取得し、ページ内情報テーブル102Tの2ページ目、3ページ目のレコードに登録する(ステップS504)。そして、これらの線幅、濃度、途切れから、ページu、vにおける比較対象の劣化度を算出して(ステップS505)、ページuの劣化度と、ページvの劣化度とが一致するかどうかを判断し(ステップS506)、ページuの劣化度と、ページvの劣化度とが一致しない場合(ステップS506でNo)、ページu,vのうち、劣化度が大きい側のページに転写物が存在する旨をユーザーに通知する(ステップS507)。 Here, as shown in the enlarged view of FIG. 14A, the edge of the imprint of the second page has a narrow line width (the line width of the second page is 2, while the line of the third page). The width is 5), and the edge of the second page has a low density (the edge E1 of the second page has a density of 50, and the edge E2 of the third page has a density of 75). Further, it is assumed that the second page has more breaks (five breaks) than the third page. The page-to-page match determination unit 105 acquires these line widths, densities, and the number of breaks, and registers them in the records on the second and third pages of the in-page information table 102T (step S504). Then, from these line widths, densities, and breaks, the degree of deterioration of the comparison target on pages u and v is calculated (step S505), and whether or not the degree of deterioration of page u and the degree of deterioration of page v match. If it is determined (step S506) and the degree of deterioration of page u and the degree of deterioration of page v do not match (No in step S506), the transcript exists on the page u and v on the side with the larger degree of deterioration. Notify the user to do so (step S507).

ページ3の印影は、濃度が濃く、線幅が太く、途切れが少ないことから劣化度は低く算出される。逆にページ2の印影は、劣化度が高く算出される。このため、2ページ目の劣化度と、3ページ目の劣化度が一致しないと判断され、劣化度が大きい2ページ目に転写物が存在する旨をユーザーに通知する(ステップS507)。 The imprint on page 3 is calculated to have a low degree of deterioration because it has a high density, a thick line width, and few breaks. On the contrary, the imprint of page 2 is calculated with a high degree of deterioration. Therefore, it is determined that the degree of deterioration of the second page and the degree of deterioration of the third page do not match, and the user is notified that the transcript exists on the second page having a large degree of deterioration (step S507).

図15は、ステップS507でタッチパネルディスプレイ1001に表示される報知画面を示す。図15の報知画面1001Dは、読み取った原稿の1枚目の裏面に、2枚目の表面の印影が転写された旨を提示し、1ページの原稿を再作成して、再スキャンを行う必要がある旨をユーザーに提示する。 FIG. 15 shows a notification screen displayed on the touch panel display 1001 in step S507. The notification screen 1001D of FIG. 15 indicates that the imprint of the second front surface has been transferred to the back surface of the first sheet of the scanned document, and it is necessary to recreate the one-page document and perform rescanning. Show the user that there is.

図12のステップS510はループの継続要件が成立するかどうかの判定であり、ページv以降に、比較対象を含むページが存在するかどうかを判定する。存在する場合(ステップS510でYes)、ページ間情報テーブル104Tにおいて、比較対象を有するページであって、ページvの次となるものをページuに設定し(ステップS511)、ステップS502に戻る。 Step S510 of FIG. 12 is a determination of whether or not the loop continuation requirement is satisfied, and determines whether or not a page including a comparison target exists after the page v. If it exists (Yes in step S510), in the page-to-page information table 104T, the page having the comparison target, which is next to the page v, is set to the page u (step S511), and the process returns to step S502.

変数v以降に、比較対象を含むページが存在する限り、ステップS502〜S507、S510〜S511の繰り返しは継続する。これにより、個々のページは処理に供される。変数v以降に、比較対象を含むページが存在しない場合、全ページの処理が完了して、終了要件を規定するステップS510がNoになり、本フローチャートの処理を終了して、メインルーチンにリターンする。サブルーチンからのリターンにより、メインルーチンの処理も終了する。 As long as there is a page containing the comparison target after the variable v, the repetition of steps S502 to S507 and S510 to S511 continues. As a result, the individual pages are subjected to processing. If there is no page including the comparison target after the variable v, the processing of all pages is completed, step S510 for defining the end requirement becomes No, the processing of this flowchart is ended, and the process returns to the main routine. .. The return from the subroutine also ends the processing of the main routine.

[4]第2動作例
(4−1)混在モードで読み取られた原稿束
第2動作例では、図16のような混載サイズの原稿束を読み取る。この原稿束は、通常サイズの原稿A,Cの間に、サイズが小さい原稿Bが挿入されている。1枚目原稿の表面に印影が存在し、3枚目原稿の表面に、印影が存在する。ADF1004を用いて、両面モードでかかる混載原稿束を読み取ることで、図16の下段に示すようなスキャンデータが得られる。
[4] Second Operation Example (4-1) Document Bundles Read in Mixed Mode In the second operation example, a document bundle of mixed loading size as shown in FIG. 16 is read. In this document bundle, a small-sized document B is inserted between the normal-sized documents A and C. An imprint is present on the surface of the first original, and an imprint is present on the surface of the third original. By reading the mixed document bundle in the double-sided mode using the ADF1004, scan data as shown in the lower part of FIG. 16 can be obtained.

このスキャンデータは、6つのページデータからなり、各ページデータは、混載原稿束の各原稿の表面、裏面に対応している。スキャンデータのうち、1ページ目、2ページ目、5ページ目のページデータには、1枚目原稿の印影、3枚目原稿の印影の読み取りで得られた印影画像が存在する。このスキャンデータの1、2、5ページにおける印影は朱色、赤色をなし、RGB色空間において、原稿本体の色分布とはかけ離れた部位に出現する。よってページ内特定部102は、1、2、5ページから、特異な色分布をなす印影部の左上座標を検出し、検出された左上座標を含むレコードを図17に示すように、ページ内情報テーブル102Tに追加する。 This scan data consists of six page data, and each page data corresponds to the front surface and the back surface of each document in the mixed document bundle. Among the scan data, the page data of the first page, the second page, and the fifth page contains an imprint image obtained by reading the imprint of the first original and the imprint of the third original. The imprints on pages 1, 2 and 5 of this scan data are vermilion and red, and appear in a portion of the RGB color space that is far from the color distribution of the original body. Therefore, the in-page identification unit 102 detects the upper left coordinates of the imprint portion having a peculiar color distribution from pages 1, 2 and 5, and records the records including the detected upper left coordinates as shown in FIG. Add to table 102T.

1ページ表面における印影は矩形形状、2ページ、5ページにおける印影は円形状なので、図17に示すように、1ページ目の矩形形状の横幅・縦幅(W1×H1)、左上座標を示すレコード、2ページ目の円形状の径(φ1)、中心座標(X3、Y3)を示すレコード、5ページ目の円形状のの径(φ1)、中心座標(X4、Y4)を、ページ内情報テーブル102Tのレコードに登録する。 Since the imprint on the surface of page 1 has a rectangular shape and the imprint on pages 2 and 5 has a circular shape, as shown in FIG. 17, a record showing the width / height (W1 × H1) and the upper left coordinate of the rectangular shape on the first page. , A record showing the diameter (φ1) and center coordinates (X3, Y3) of the circular shape on the second page, and the diameter (φ1) and center coordinates (X4, Y4) of the circular shape on the fifth page in the in-page information table. Register in the 102T record.

機器設定、読込設定は、図18(a)に示す通りであり、ADF1004は装着済み、片面/両面設定は両面、サイズ同一/混載は、混載に設定されている。また、ADF読込時の用紙サイズ検出により、1枚目、3枚目の原稿が通常サイズ、2枚目の原稿が小サイズであると検出されている。混載モードに設定されているので、ADF1004のトレイ1004Tに載置された原稿束から原稿が繰り出される度に、用紙のサイズをページ間情報テーブル104Tの対応するレコードに登録する。こうした装置設定、読込設定、用紙サイズ検出に従い、図10のフローチャートの処理を実行する。 The device settings and read settings are as shown in FIG. 18A. The ADF1004 is already mounted, the single-sided / double-sided setting is set to double-sided, and the same size / mixed loading is set to mixed loading. Further, by detecting the paper size at the time of reading the ADF, it is detected that the first and third sheets of the original are the normal size and the second sheet is the small size. Since the mixed loading mode is set, the size of the paper is registered in the corresponding record of the interpage information table 104T each time the originals are fed out from the document bundle placed on the tray 1004T of the ADF1004. The processing of the flowchart of FIG. 10 is executed according to the device setting, the reading setting, and the paper size detection.

(4−2)比較すべきページデータ対の決定
第2動作例では、ADF1004を装着していて、読取モードは、両面読取に設定され、原稿サイズは混在であるから、ステップS401がYes、ステップS402がYes、ステップS403がYesになり、ステップS411に移行する。ステップS411〜S418は、変数iを制御変数としたループを規定する。ステップS411は、変数iの初期化であり、変数iに1を代入する。ステップS412はページ2・iが比較対象を含むかどうかの判定であり、ステップS413は、ページ2・iのサイズが、ページ2・i+1のサイズを上回るかどうかの判定である。ページ2・iのサイズが、ページ2・i+1のサイズを上回る場合(ステップS413でYes)、原稿束が混在サイズであることを考慮して、比較すべきページデータの対を決定する。
(4-2) Determining the page data pair to be compared In the second operation example, since the ADF1004 is mounted, the scanning mode is set to double-sided scanning, and the document sizes are mixed, step S401 is Yes, and step S401 is a step. S402 becomes Yes, step S403 becomes Yes, and the process proceeds to step S411. Steps S411 to S418 define a loop with the variable i as a control variable. Step S411 is the initialization of the variable i, and 1 is assigned to the variable i. Step S412 is a determination as to whether or not page 2 and i include a comparison target, and step S413 is a determination as to whether or not the size of page 2 and i exceeds the size of page 2 and i + 1. When the size of page 2 · i exceeds the size of page 2 · i + 1 (Yes in step S413), the pair of page data to be compared is determined in consideration of the mixed size of the document bundles.

原稿束が混在サイズであり、大きいサイズの原稿と、小さいサイズの原稿とが重なり合って対面している場合、印影が大きいサイズの原稿のどこに存在するかで、転写の相手側となるページが変わる。 When a bundle of documents is a mixed size and a large size document and a small size document overlap and face each other, the page to be transferred changes depending on where the imprint is located on the large size document. ..

大きいサイズの原稿のうち、小さいサイズの原稿と重なり合う領域に印影が存在する場合、第1動作例と同様、ページ2i、ページ2i+1がページ対となる。 When the imprint exists in the area of the large-sized document that overlaps with the small-sized document, page 2i and page 2i + 1 are page pairs as in the first operation example.

大きいサイズの原稿のうち、小さいサイズの原稿と重なり合っていない領域に印影が存在する場合、ページ2i、ページ2i+2m+1がページ対となる。第2動作例では、これらのケースを考慮して、比較すべきページ対を定める。つまり図10のステッS416では、ページ2i、ページ2i+1との組み及びページ2i、ページ2i+2m+1との組みを比較すべきページ対とする。 If an imprint exists in an area of a large-sized document that does not overlap with the small-sized document, page 2i and page 2i + 2m + 1 form a page pair. In the second operation example, the page pairs to be compared are determined in consideration of these cases. That is, in step S416 of FIG. 10, the combination with page 2i and page 2i + 1 and the combination with page 2i and page 2i + 2m + 1 are set as page pairs to be compared.

続くステップS417は、ステップはループの継続要件が成立するかどうかの判定であり、ページ2・i+2・m+2が最終ページ数を下回る場合(ステップS417でYes)、変数iをインクリメントして(ステップS418)、ステップS412に戻る。 In the following step S417, the step is a determination as to whether or not the loop continuation requirement is satisfied, and when pages 2, i + 2, m + 2 are less than the number of final pages (Yes in step S417), the variable i is incremented (step S418). ), Return to step S412.

ページ2・iのサイズが、ページ2・i+1のサイズと等しいか下回る場合(ステップS413でNo)、ページ2・iと、ページ2・i+1とを、比較すべきページ対u、vとする(ステップS414)。ステップS417は、ループの継続要件が成立するかどうかの判定であり、2・i+2が最終ページ数を下回る場合(ステップS415でYes)、変数iをインクリメントして(ステップS418)、ステップS412に戻る。変数iがページ最大値を下回る限り、ステップS412〜S418の繰り返しは継続する。これにより、個々のページは処理に供される。ステップS415、S417の何れかがNoになると、全ページの処理が完了したとして、本サブルーチンの処理を終了し、メインルーチンにリターンする。 When the size of page 2 · i is equal to or smaller than the size of page 2 · i + 1 (No in step S413), page 2 · i and page 2 · i + 1 are set as page vs. u, v to be compared (No). Step S414). Step S417 is a determination as to whether or not the loop continuation requirement is satisfied. If 2.i + 2 is less than the number of final pages (Yes in step S415), the variable i is incremented (step S418), and the process returns to step S412. .. As long as the variable i falls below the page maximum value, the repetition of steps S421 to S418 continues. As a result, the individual pages are subjected to processing. When any of steps S415 and S417 becomes No, it is assumed that the processing of all pages is completed, the processing of this subroutine is terminated, and the process returns to the main routine.

第2動作例で読み取られる原稿束は、1枚目、3枚目が通常サイズの原稿、2枚目が小サイズの原稿であり、スキャンデータのうち、1、2ページ目が通常サイズのページデータ、3、4ページ目が小サイズのページデータ、5、6ページ目が通常サイズのページデータとなる。小サイズの原稿は、1枚なのでm=1となる。 The bundle of documents read in the second operation example is a normal size document on the first and third sheets, a small size document on the second sheet, and the first and second pages of the scan data are normal size pages. The data, the 3rd and 4th pages are the small size page data, and the 5th and 6th pages are the normal size page data. Since there is only one small-sized document, m = 1.

従って、i=1の場合、2ページ(=2・i)がページuとして設定され、5ページ(=2・i+2・m+1)がページvとして設定される(ステップS416)。これにより、図18(b)の141、142に示すように、2ページと、5ページとが比較すべきページ対として設定され、ページ間情報テーブル104Tに記述される。 Therefore, when i = 1, page 2 (= 2 · i) is set as page u, and page 5 (= 2 · i + 2 · m + 1) is set as page v (step S416). As a result, as shown in 141 and 142 of FIG. 18B, pages 2 and 5 are set as page pairs to be compared and are described in the page-to-page information table 104T.

スキャンデータの2ページ目、5ページ目には、印影が存在するので、ページ内情報テーブル102Tの2ページ目、5ページ目のレコードは、比較対象を「あり」と定め、また判定要否を「実施要」に定める。比較対象、判定要否が設定されると、ページ間一致判定部105が処理を開始する。 Since imprints exist on the 2nd and 5th pages of the scan data, the records on the 2nd and 5th pages of the in-page information table 102T are set as "Yes" for comparison, and the necessity of judgment is determined. It is stipulated in "Implementation requirements". When the comparison target and the necessity of determination are set, the page-to-page match determination unit 105 starts processing.

図19(a)の拡大図に示すように、ページ2の印影のエッジE11は、線幅が細く(2ページ目の線幅は2であるのに対し、5ページ目の線幅は5)、また、2ページ目の印影のエッジE12は濃度が薄い(2ページ目のエッジは濃度が50、5ページ目のエッジは濃度が80)。また、2ページ目は、5ページ目よりも多くの途切れを有するので、ページ間一致判定部105は、図19(b)に示すように、これらの線幅、濃度、途切れ数をページ内情報テーブル102Tに登録する。 As shown in the enlarged view of FIG. 19A, the edge E11 of the imprint of page 2 has a narrow line width (the line width of the second page is 2, while the line width of the fifth page is 5). Also, the edge E12 of the imprint on the second page has a low density (the edge on the second page has a density of 50, and the edge on the fifth page has a density of 80). Further, since the second page has more breaks than the fifth page, the page-to-page match determination unit 105 provides information on the line width, density, and number of breaks in the page as shown in FIG. 19B. Register in table 102T.

ページ5の印影は、濃度が濃く、線幅が太く、途切れが少ないことから、原本性の判断にあたって、ページ5の印影が原本、ページ2の印影が転写物であるの判断結果を下す。そして、その旨をページ内情報テーブル102Tの対応するレコードに登録する。 Since the imprint of page 5 has a high density, a thick line width, and few breaks, the imprint of page 5 is the original and the imprint of page 2 is the transcript in determining the originality. Then, that fact is registered in the corresponding record of the in-page information table 102T.

[5]まとめ
以上のように本実施形態によれば、ページの内部領域に対し、カラーヒストグラム解析、文字認識を行うことで押印、署名がなされた箇所をスキャンデータのページ領域内から特定する。そして、これらの箇所が、比較すべきページ対に含まれているか、また、またこれらの箇所の印影が鏡像関係をなしていて何れが劣化しているかを判断するので、ADF1004において、複数の原稿が揃って載置されておらず、原本となる押印と、転写物となる押印とがずれているような場合でも、インク写りの有無を相応の判定精度をもって判定することができる。
[5] Summary As described above, according to the present embodiment, the portion where the seal and the signature are made is specified from the page area of the scan data by performing color histogram analysis and character recognition on the internal area of the page. Then, since it is determined whether these parts are included in the page pair to be compared and which of the imprints of these parts has a mirror image relationship and which is deteriorated, a plurality of manuscripts are used in the ADF1004. Even when the stamps that are the original and the stamps that are the transferred products are misaligned, the presence or absence of ink transfer can be determined with appropriate determination accuracy.

[6]変形例
本開示に係る原稿読取装置の実施の形態に基づき説明してきたが、本開示は上述の実施の形態に限定されないのは勿論であり以下の変形例が考えられる。
[6] Modifications Although the description has been made based on the embodiment of the document reading device according to the present disclosure, it goes without saying that the present disclosure is not limited to the above-described embodiment, and the following modifications can be considered.

(1)原稿紙面の記載の責を負うことの証明となる証明用画像として、印影の画像を一例として説明した。しかしこれに限らない。原稿の記載に責を負うことの証明となる画像であれば、他のものを証明用画像としてもよい。例えば、ユーザーの手書きによる署名の画像を証明用画像としてもよい。また、指紋の捺印による画像を証明用画像としてもよい。これらの署名、捺印には、インクが使用されるので、インク写りによる転写が発生する可能性があるとの理由による。 (1) The image of the imprint has been described as an example as a proof image that proves that the person is responsible for the description on the manuscript paper. However, it is not limited to this. Any other image may be used as the proof image as long as it is an image that proves that the person is responsible for the description of the manuscript. For example, an image of a user's handwritten signature may be used as a proof image. Further, the image obtained by imprinting the fingerprint may be used as the proof image. Since ink is used for these signatures and seals, there is a possibility that transfer due to ink transfer may occur.

(2)ページ内特定部102が文字認識を行うにあたって、認識できない文字の補足的な処理を実行してもよい。具体的にいうと、スキャンデータのページ内に認識できないエッジが存在する場合、ページ内特定部102は、スキャンデータのページ内のエッジに鏡像変換を施して、鏡像変換後の文字が文字認識されるかどうかで再認識を試みてもよい。鏡像変換を施すことで、文字認識が可能になる場合、その文字は転写物である旨をページ内情報テーブル102Tに登録する。こうした鏡像変換を伴った判定を行えば、線幅、濃度、途切れ等を参照することによる転写物かどうかの判定が不要になり、処理の簡略化を期することができる。 (2) When the specific unit 102 in the page recognizes characters, supplementary processing of unrecognized characters may be executed. Specifically, when there is an unrecognizable edge in the scan data page, the page identification unit 102 performs mirror image conversion on the edge in the scan data page, and the character after the mirror image conversion is recognized as a character. You may try to re-recognize whether or not. When character recognition becomes possible by performing mirror image conversion, the fact that the character is a transcript is registered in the in-page information table 102T. If the determination accompanied by such mirror image conversion is performed, it becomes unnecessary to determine whether or not the transcript is a transcript by referring to the line width, density, breakage, etc., and the processing can be simplified.

(3)鏡像関係が成立するかどうかの判定にあたり、微小角の回転を繰り返したがこれに限らない。一対のページデータに含まれる印影が矩形枠を有している場合、また印章文字間に、下地の境界が存在する場合、これら矩形枠の辺や下地の境界がなす角度から、転写像の回転角を算出して、この回転角だけ、転写像を回転させてもよい。 (3) In determining whether or not the mirror image relationship is established, the rotation of a minute angle is repeated, but the present invention is not limited to this. If the imprint contained in the pair of page data has a rectangular frame, or if there is a background boundary between the stamp characters, the rotation of the transferred image is performed from the angle formed by the sides of these rectangular frames and the background boundary. The angle may be calculated and the transferred image may be rotated by this rotation angle.

(4)エッジ抽出にあたり、一対のページデータのそれぞれの画素群から特徴点を抽出して、その特徴点の比較により、鏡像変換後の転写像の同否を判定してもよい。 (4) In edge extraction, feature points may be extracted from each pixel group of a pair of page data, and the same or not of the transferred image after mirror image conversion may be determined by comparing the feature points.

(5)偽造が難しく、印章に利用されることが多い特殊な字体(篆書体、印相体等)のそれぞれについて、字形パターンのOCRデータベースを設け、何れの字形パターンのOCRデータベースで、マッチング率が高くなるかの判定を行ってもよい。 (5) An OCR database of character shape patterns is set up for each of the special fonts (seal script, seal script, etc.) that are difficult to forge and are often used for stamps, and the matching rate is used in the OCR database of any character shape pattern. May be determined whether or not becomes higher.

(6)上記実施形態では、カラーヒストグラムにおいて、ページ内特定部102は下地がなす画素の色成分の分布域、文書本体がなす画素の色成分の分布域の何れかよりも、低い度数をなす色成分の画素を印肉の色としたがこれに限らない。朱肉の色等、代表的な印肉を構成する顔料の色成分を予め登録しておき、かかる色成分及びその近傍色の画素群がページデータの内部に存在すれば、ページ内特定部102が、かかる画素群を印影の領域として特定してもよい。ここでの近傍色とは、RGB色空間における朱肉色との空間距離が、所定の距離に満たない色をいう。 (6) In the above embodiment, in the color histogram, the specific portion 102 in the page has a frequency lower than either the distribution area of the color component of the pixel formed by the background or the distribution area of the color component of the pixel formed by the document body. The pixel of the color component is the color of the stamp, but it is not limited to this. If the color components of the pigments that make up a typical stamp, such as the color of red meat, are registered in advance, and if such a color component and a pixel group of a color in the vicinity thereof exist inside the page data, the specific portion 102 in the page will be displayed. , Such a pixel group may be specified as an imprint area. The neighboring color here means a color in which the spatial distance from the vermilion color in the RGB color space is less than a predetermined distance.

(7)上記実施形態では、印影の転写を発見した際、タッチパネルディスプレイ1001に報知画面を表示することとしたが、これに限らない。転写像が存在する原稿を読み上げる内容の音声ナレーションの発話により、インク写りによる転写の発生をユーザーに報知してもよい。その他、LEDインディケーターの明滅でインク写りによる転写の発生をユーザーに報知してもよい。構内に存在する機器に、メッセージデータを送信することで、インク写りによる転写の発生をユーザーに報知してもよい。 (7) In the above embodiment, when the transfer of the imprint is found, the notification screen is displayed on the touch panel display 1001, but the present invention is not limited to this. The user may be notified of the occurrence of transfer due to ink transfer by speaking a voice narration that reads out the document in which the transferred image exists. In addition, the blinking of the LED indicator may notify the user of the occurrence of transfer due to ink transfer. By transmitting message data to a device existing on the premises, the user may be notified of the occurrence of transfer due to ink transfer.

(8)大きいサイズの原稿のうち、小さいサイズの原稿と重なり合う領域に印影が存在するどうかで、比較を行うべきページ対を決定してもよい。大きいサイズの原稿のうち、小さいサイズの原稿と重なり合う領域に印影が存在する場合、ページ2i、ページ2i+1がページ対とする。また、大きいサイズの原稿のうち、小さいサイズの原稿と重なり合っていない領域に印影が存在する場合、ページ2i、ページ2i+2m+1がページ対とする。 (8) Among the large-sized documents, the page pair to be compared may be determined depending on whether or not the imprint exists in the area overlapping the small-sized document. If the imprint exists in the area of the large-sized document that overlaps with the small-sized document, page 2i and page 2i + 1 are paired with each other. Further, when an imprint exists in an area of a large-sized document that does not overlap with the small-sized document, page 2i and page 2i + 2m + 1 are page pairs.

(9)上記実施形態の原稿読取装置1000は、MFPであるとしたがこれに限らない。原稿読取装置1000はパーソナルコンピュータの単機能の周辺機器(スキャナー)であってもよい。 (9) The document reading device 1000 of the above embodiment is assumed to be an MFP, but the present invention is not limited to this. The document reading device 1000 may be a single-function peripheral device (scanner) of a personal computer.

本発明は、積載された両面原稿を読み取って得られた各ページデータから証明用画像が、対面する2枚の両面原稿の一方から他方に載置されたことを容易に検出でき、OA機器、情報機器の産業分野を始め、小売業、賃貸業、不動産業、広告業、運輸業、出版業等、様々な業種の産業分野で利用される可能性がある。 INDUSTRIAL APPLICABILITY According to the present invention, it can be easily detected from one of two facing double-sided originals that a proof image is placed on the other from each page data obtained by reading the loaded double-sided originals. It may be used in various industrial fields such as the information equipment industry, retail, leasing, real estate, advertising, transportation, and publishing.

101 原稿読取部
102 ページ内特定部
102T ページ内情報テーブル
103 比較対象有効性判定部
104 ページ間比較対象検出部
104S 装置設定部
104T ページ間情報テーブル
105 ページ間一致判定部
106 対話制御部
1000 原稿読取装置
1001 タッチパネルディスプレイ
1004 ADF
1004T トレイ
101 Manuscript reading unit 102 Page-specific information table 102T Page-to-page information table 103 Comparison target effectiveness judgment unit 104 Page-to-page comparison target detection unit 104S Device setting unit 104T Page-to-page information table 105 Page-to-page match judgment unit 106 Dialogue control unit 1000 Device 1001 Touch panel display 1004 ADF
1004T tray

Claims (11)

積載された両面原稿を複数読み取り、各原稿の両面のそれぞれに対応するページデータを得る原稿読取装置であって、
前記原稿束の状態で対面する2つの原稿面に相当する2つのページデータのうち一方に、前記原稿の記載に責を負うことの証明となる証明用画像が含まれ、他方に、前記証明用画像に対し鏡像関係をなす画像が含まれているかどうかを評価する評価手段と、
評価結果に基づき、原稿間で証明用画像が転写された旨を報知する報知手段と
を備えることを特徴とする原稿読取装置。
It is a document reading device that reads a plurality of loaded double-sided documents and obtains page data corresponding to each of the double-sided sides of each document.
One of the two page data corresponding to the two manuscript surfaces facing each other in the state of the manuscript bundle contains a proof image that proves that the person is responsible for the description of the manuscript, and the other is the proof image. An evaluation means for evaluating whether or not an image having a mirror image relationship is included in the image,
A document reading device including a notification means for notifying that a proof image has been transferred between documents based on an evaluation result.
前記評価手段は、
各ページデータのカラーヒストグラムを算出する処理、
原稿本体の主要な色成分がなす分布域よりも低い度数をなす色成分の分布域を前記カラーヒストグラムから抽出する抽出処理を行い、
前記抽出処理により抽出された分布域の色成分からなる画素群を証明用画像とする
ことを特徴とする請求項1に記載の原稿読取装置。
The evaluation means
Processing to calculate the color histogram of each page data,
An extraction process is performed to extract the distribution area of the color components having a frequency lower than the distribution area of the main color components of the manuscript body from the color histogram.
The document reading apparatus according to claim 1, wherein a pixel group composed of color components in a distribution area extracted by the extraction process is used as a proof image.
前記証明用画像は、原稿に押印がなされたことで形成された印影の画像であり、
前記評価手段は、
前記押印に使用される顔料の色成分、及び/又は、その近傍色の色成分からなる画素群を抽出することで証明用画像を得る
ことを特徴とする請求項1に記載の原稿読取装置。
The proof image is an image of an imprint formed by imprinting a manuscript.
The evaluation means
The document reading apparatus according to claim 1, wherein a proof image is obtained by extracting a pixel group consisting of a color component of a pigment used for imprinting and / or a color component of a color in the vicinity thereof.
前記証明用画像は、原稿に押印がなされたことで形成された印影の画像であり、
前記評価手段は、印影の枠形状を抽出する処理を行う
ことを特徴とする請求項2記載の原稿読取装置。
The proof image is an image of an imprint formed by imprinting a manuscript.
The document reading device according to claim 2, wherein the evaluation means performs a process of extracting the frame shape of the imprint.
前記画素群の周縁をなすエッジに途切れがあったとしても、エッジ全長に対する途切れの比率が所定の値を下回る場合、前記評価手段は、当該画素群の周縁をなすエッジが印影の枠形状をなすとする
ことを特徴とする請求項4に記載の原稿読取装置。
Even if there is a break in the edge forming the peripheral edge of the pixel group, if the ratio of the break to the total edge length is less than a predetermined value, the evaluation means means that the edge forming the peripheral edge of the pixel group forms the frame shape of the imprint. The document reading device according to claim 4, wherein the document reading device is characterized by the above.
前記証明用画像は、印章文字を含む印章であり、
前記評価手段は、
前記抽出処理により抽出された色成分からなる画素群から線図を抽出する処理、
抽出された線図と、印章文字の活字パターンとをマッチングする処理を行い、
前記マッチング処理の結果に従い、前記画素群が印章を構成するかどうかの判定結果を下す
ことを特徴とする請求項2、4、5の何れかに記載の原稿読取装置。
The proof image is a seal containing the seal characters, and is
The evaluation means
A process of extracting a diagram from a pixel group consisting of color components extracted by the extraction process,
Performs processing to match the extracted diagram with the type pattern of the seal character,
The document reading apparatus according to any one of claims 2, 4, and 5, wherein a determination result of whether or not the pixel group constitutes a seal is made according to the result of the matching process.
前記評価手段は、積載された複数の両面原稿が、サイズの異なる原稿を含むがどうか、前記複数の両面原稿のそれぞれが前後の原稿と比較して大きいかどうかに基づき、証明用画像を含むとされる、2つのページデータの対を特定する
ことを特徴とする請求項1〜6の何れかに記載の原稿読取装置。
The evaluation means includes a proof image based on whether the loaded double-sided originals include originals of different sizes and whether each of the plurality of double-sided originals is larger than the previous and next originals. The document reading apparatus according to any one of claims 1 to 6, wherein the pair of two page data is specified.
前記複数原稿のサイズ設定が混在サイズであり、読み取るべき複数の両面原稿において、第1のサイズの2枚の原稿の間に、第1のサイズよりも小さい第2のサイズの原稿が挿入されている場合、前記評価手段は、前記第1のサイズの1の原稿に対応するページデータと、前記第1のサイズの他の原稿に対応するページデータとを、証明用画像を含む2つのページデータの対とする
ことを特徴とする請求項7に記載の原稿読取装置。
The size setting of the plurality of originals is a mixed size, and in a plurality of double-sided originals to be read, a second size original smaller than the first size is inserted between two first size originals. If so, the evaluation means obtains page data corresponding to the first size 1 manuscript and page data corresponding to the first size other manuscript into two page data including a proof image. The document reading device according to claim 7, wherein the document reading device is paired with the above.
前記評価手段による鏡像関係が成立しているかどうかの評価は、
(1)前記2つのページデータの一方に含まれる証明用画像に鏡像変換を施す処理、
(2)鏡像変換後の証明用画がなす角度が、前記2つのページデータの他方に含まれる証明用画像と一致しない場合、証明用画像に回転変換を施す処理を含む、
ことを特徴とする請求項1〜8の何れかに記載の原稿読取装置。
The evaluation of whether or not the mirror image relationship is established by the evaluation means is
(1) A process of performing a mirror image conversion on a proof image included in one of the two page data.
(2) When the angle formed by the proof image after the mirror image conversion does not match the proof image contained in the other of the two page data, the process of performing rotation conversion on the proof image is included.
The document reading device according to any one of claims 1 to 8.
前記評価手段は更に、前記2つのページデータにおいて、前記証明用画像がなす線図が、どれだけ劣化しているかの度合いをそれぞれのページデータについて算出し、
前記劣化の度合いが大きい方のページデータが、証明用画像を含むとの評価結果を下す
ことを特徴とする請求項1〜9の何れかに記載の原稿読取装置。
The evaluation means further calculates the degree of deterioration of the diagram formed by the proof image in the two page data for each page data.
The document reading apparatus according to any one of claims 1 to 9, wherein the page data having a larger degree of deterioration gives an evaluation result that the image for proof is included.
前記評価手段は、前記証明用画像を構成する線図の線種、濃度、途切れから劣化度を算出する
ことを特徴とする請求項10に記載の原稿読取装置。
The document reading device according to claim 10, wherein the evaluation means calculates the degree of deterioration from the line type, density, and interruption of the diagram constituting the proof image.
JP2019207108A 2019-11-15 2019-11-15 Document reader Pending JP2021081853A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019207108A JP2021081853A (en) 2019-11-15 2019-11-15 Document reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019207108A JP2021081853A (en) 2019-11-15 2019-11-15 Document reader

Publications (1)

Publication Number Publication Date
JP2021081853A true JP2021081853A (en) 2021-05-27

Family

ID=75966343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019207108A Pending JP2021081853A (en) 2019-11-15 2019-11-15 Document reader

Country Status (1)

Country Link
JP (1) JP2021081853A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6277686A (en) * 1985-09-30 1987-04-09 Usac Electronics Ind Co Ltd Seal impression reader
JP2001180066A (en) * 1999-12-22 2001-07-03 Oki Electric Ind Co Ltd Continuous form-printing apparatus and method for designating printing position
JP2006140762A (en) * 2004-11-12 2006-06-01 Sharp Corp Image processor, image processing method, image processing program and computer readable recording medium with the program recorded

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6277686A (en) * 1985-09-30 1987-04-09 Usac Electronics Ind Co Ltd Seal impression reader
JP2001180066A (en) * 1999-12-22 2001-07-03 Oki Electric Ind Co Ltd Continuous form-printing apparatus and method for designating printing position
JP2006140762A (en) * 2004-11-12 2006-06-01 Sharp Corp Image processor, image processing method, image processing program and computer readable recording medium with the program recorded

Similar Documents

Publication Publication Date Title
CN1208743C (en) Digital imaging method and apparatus for detecting documents safety mark
JP6015189B2 (en) Image inspection apparatus, image forming apparatus, image inspection method, and image forming system
CN101958989B (en) Image processing device, image processing system, image processing method
US10527991B2 (en) Printing apparatus, printing system, and non-transitory computer readable medium for printing
US8452044B2 (en) Printed matter, image processing apparatus, printed matter authenticity determination apparatus, image processing method, printed matter authenticity determination method, and program
JP4419269B2 (en) Two-dimensional code extraction method
US8477988B2 (en) Image processing apparatus, image forming apparatus and computer readable medium
US9858513B2 (en) Document file output apparatus, document file output method, and computer readable medium
US8238599B2 (en) Image processing device and image processing method for identifying a selected one or more embedding methods used for embedding target information
WO2020255971A1 (en) Determining device, method for controlling determining device, determining system, method for controlling determining system, and program
JP2021081853A (en) Document reader
JP4296314B2 (en) Printed material production method, printed material production device, authenticity determination method, authenticity determination device, and printed material
CN101344748A (en) Copy apparatus having a copy prevention function and a copy prevention method thereof
CN112616311B (en) Anti-counterfeit printed matter and method for manufacturing same
US8320027B2 (en) Image processing apparatus, data processing method executed by image processing apparatus, and computer-readable storage medium storing program for causing computer to execute data processing method
JP3144231U (en) Anti-counterfeiting form
JP4973484B2 (en) Image input system and image input method
JP2010030056A (en) Authenticity determination printed matter
JPH11316839A (en) Method and device for picture rough recognition, medium with picture rough recognition program recorded, picture recognition device, and color copying device
JP4309881B2 (en) ID card recognition apparatus and ID card recognition method
JP5418057B2 (en) Image processing apparatus and computer program
JP6645143B2 (en) Image analysis device
JP2021153276A (en) Image processing apparatus
JP2019175361A (en) Image reading device, image reading method, image reading system, and program
JP2023128683A (en) Information processing device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231219