JP2008293353A - Image input device - Google Patents

Image input device Download PDF

Info

Publication number
JP2008293353A
JP2008293353A JP2007139361A JP2007139361A JP2008293353A JP 2008293353 A JP2008293353 A JP 2008293353A JP 2007139361 A JP2007139361 A JP 2007139361A JP 2007139361 A JP2007139361 A JP 2007139361A JP 2008293353 A JP2008293353 A JP 2008293353A
Authority
JP
Japan
Prior art keywords
image
condition
input
management system
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007139361A
Other languages
Japanese (ja)
Inventor
Tomoshi Yoshida
知史 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007139361A priority Critical patent/JP2008293353A/en
Publication of JP2008293353A publication Critical patent/JP2008293353A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that, with respect to electronic storage of a form or the like by an image, it is necessary to judge whether an original to be stored satisfies a condition to be formed as a form or not at first and whether the original is legal or not, and operation for scanning the original, providing a time stamp and electronic signature to the original and then storing the original is non-efficient in a working cost and a system maintenance cost. <P>SOLUTION: The image input device for scan-inputting an image document and storing an image and an index in a document management system is composed of a form recognition means, an OCR or the like and a user interface or the like, and after evaluating the validity of an original, inputs the image document and the index in the document management system. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、スキャナ機器およびスキャナ装置を有するMFP(デジタル複合機)から画像を入力し、画像とそのインデックスデータを文書管理システムに保存する画像入力装置に関する。   The present invention relates to an image input device that inputs an image from an MFP (digital multifunction peripheral) having a scanner device and a scanner device, and stores the image and its index data in a document management system.

従来、画像入力装置では、スキャナから読み取った画像は、そのまま文書管理システムへ保存していた。また、画像をOCRする場合も、その用途の主目的は検索用のインデックスデータ(画像の属性)を作成するための処理であった。   Conventionally, in an image input apparatus, an image read from a scanner is stored in a document management system as it is. In addition, when an image is OCRed, the main purpose of its use is processing for creating index data (image attributes) for search.

一方、電子フォームといった、帳票フォーマットとデータが個別に管理される電子ファイルにおいては、必要なデータ欠損等を発見する処理が可能であるが、画像の場合、そいうった判断をする技術は提案されていない。   On the other hand, an electronic file such as an electronic form, in which the form format and data are individually managed, can be processed to detect necessary data loss, etc., but in the case of an image, a technique for making such a determination has been proposed. Not.

従来例としては、例えば、文書データに高精度な時刻情報が利用された電子署名とIDを添付し、原本保管部に保存するものがある(特許文献1参照)。
特開2003−298575号公報
As a conventional example, for example, an electronic signature and ID using highly accurate time information are attached to document data and stored in an original storage unit (see Patent Document 1).
JP 2003-298575 A

帳票類の画像による電子保存に関して、まず、保存する原稿が、そもそも帳票として成り立つ条件を満たし、正当なものかどうか判断する必要がある。例えば、必須の記入事項が記載されていない帳票は、帳票として成立していため、保存する意味がない。また、必須記入事項に記入があった場合でも、その記入内容が誤っていたりした場合も、帳票として意味をなさなくなる。例えば、領収書の例で言えば、発行元や日付、金額等の記入がない領収書は、領収書として成り立たないため、スキャンして保存するような処理は無駄となる。また、企業内の文書でも、提出者の名前欄が未記入の場合や、見積り書の総額欄が未記入の場合など、多くの例が考え得る。   Regarding electronic storage using images of forms, first, it is necessary to determine whether the original to be stored satisfies the conditions that hold in the first place and is legitimate. For example, a form that does not contain essential items is formed as a form, so there is no point in saving it. In addition, even if the required entry items are filled in, even if the entry details are incorrect, it does not make sense as a form. For example, in the case of a receipt, a receipt that is not filled in with an issuer, date, amount, etc., does not hold as a receipt, and therefore processing such as scanning and saving is useless. In addition, even in company documents, many cases can be considered, such as when the name column of the submitter is not filled in or when the total amount column of the estimate is not filled in.

こうした原稿に対して、原稿をスキャンし、タイムスタンプや電子署名を付与して保存することは作業コスト、システムの維持コストの面で非効率である。   It is inefficient in terms of work cost and system maintenance cost to scan such a document and give it a time stamp or digital signature.

上記従来例による課題を解決するために本発明は下記の手段を備える。   In order to solve the problems caused by the above conventional example, the present invention comprises the following means.

スキャナ機器から画像を入力する画像入力手段、文書管理システムへ画像を保存する保存手段。   An image input unit for inputting an image from a scanner device, and a storage unit for storing the image in a document management system.

画像を帳票認識するためのフォーム登録手段。   Form registration means for recognizing images in forms.

フォーム登録した帳票の条件エリアを設定する条件エリア設定手段。   Condition area setting means for setting the condition area of a form registered form.

各条件エリアごとの条件をする条件設定手段。   Condition setting means for setting conditions for each condition area.

入力した画像を帳票認識しフォームを特定する帳票認識手段。   Form recognition means for recognizing forms and identifying forms.

帳票認識手段で特定されたフォームの条件エリアを読み出し、そのエリア画像を切り出し、切り出した部分画像のみをOCRするゾーンOCR手段。   Zone OCR means for reading out the condition area of the form specified by the form recognition means, cutting out the area image, and OCRing only the cut out partial image.

ゾーンOCR手段の結果を条件と照合する照合手段。   Collating means for collating the result of the zone OCR means with the condition.

ゾーンOCR手段の結果を一時記憶するインデックス保存手段。   Index storage means for temporarily storing the results of the zone OCR means.

照合結果によって原稿の正当性を判定した結果を一時記憶する照合結果記憶手段。   Collation result storage means for temporarily storing the result of determining the validity of the document based on the collation result.

照合結果によって保存処理の方法を決める保存処理判定手段。   Storage processing determination means for determining a storage processing method according to the collation result.

インデックス保存手段で記憶されているインデックスを文書管理システムに画像と関連付けて保存するインデックス保存手段。   Index storage means for storing an index stored in the index storage means in association with an image in the document management system.

本発明は、以上の構成および各手段を備えるものであれば、単体のPC等のコンピュータ内に構成要素を備える形態でもよく、またネットワークを介した複数のPC上にそれぞれの構成要素がありシステムの形態で提供されても良いことは言うまでもない。   As long as the present invention has the above-described configuration and each means, the present invention may have a configuration in which components are provided in a computer such as a single PC. Needless to say, it may be provided in the form.

本発明の特徴的な手段を有する入力ソフト部や文書管理システムはコンピュータソフトウェアとしてコンピュータシステム上に構築されるものである。   The input software section and document management system having the characteristic means of the present invention are constructed on a computer system as computer software.

以上説明したように本発明によれば、
(1)帳票として成立する原稿のみにタイムススタンプ、電子署名を付与することで、タイムスタンプ付与に要するコストを圧縮(経費削減)することができるという効果がある。
As described above, according to the present invention,
(1) By giving a time stamp and an electronic signature only to a document formed as a form, there is an effect that the cost required for the time stamp can be reduced (cost reduction).

(2)帳票として成立する原稿のみを分類し、文書管理システムで管理できるため、ユーザの所望の用途で検索閲覧する際の操作性向上という効果がある。   (2) Since only originals formed as forms can be classified and managed by the document management system, there is an effect of improving operability when searching and browsing for a user's desired use.

(3)帳票として成立する原稿のみを分類し、文書管理システムで管理することで、文書保存に対する企業のコンプライアンスが向上する効果がある。   (3) By classifying only manuscripts formed as a form and managing them with a document management system, there is an effect of improving corporate compliance with respect to document storage.

以下、本発明の各実施の形態を図面を参照し、説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は本発明のシステムの基本構成を示した図である。   FIG. 1 is a diagram showing the basic configuration of the system of the present invention.

1.スキャナ機器部は、実際の紙原稿を入力し画像データを入力する機器を示す。   1. The scanner device unit is a device that inputs an actual paper document and inputs image data.

2.入力ソフト部は、スキャナ機器から画像を入力し、本発明の特徴的な処理を行う。   2. The input software unit inputs an image from the scanner device and performs the characteristic processing of the present invention.

3.の文書管理システムは、スキャナ機器から入力した原本画像とインデックスデータを保存するデータ保存部である。   3. The document management system is a data storage unit that stores an original image and index data input from a scanner device.

実施の形態としては、図1に示すようにネットワーク上で入力ソフト部や文書管理システムが接続され、相互にデータ交換ができるシステム形態でもよく、また、各構成要素が1つのPC内に存在する場合でも、機能的要素や手段が満たされていれば本発明は実現可能である。   As an embodiment, as shown in FIG. 1, an input software unit and a document management system may be connected on a network so that data can be exchanged with each other, and each component is present in one PC. Even in this case, the present invention can be realized if functional elements and means are satisfied.

図2は、本発明の実施の形態に係る全体的な処理のフローチャート図である。   FIG. 2 is a flowchart of overall processing according to the embodiment of the present invention.

図3は、本発明の実施の形態に係る、スキャン・保存フェーズ処理を示す概念図である。これは、本発明の特徴である入力ソフト部の原稿の正当性判定処理について概念的に説明するためのものである。   FIG. 3 is a conceptual diagram showing scan / save phase processing according to the embodiment of the present invention. This is for conceptually explaining the document validity determination process of the input software unit, which is a feature of the present invention.

概念的に示した理由は、OCR処理、ユーザインタフェースによる最終判定の入力処理は、これまでアルゴリズムとしては多くの技術提案がなされているため、本発明における処理は、そういった従来技術の新しい組み合わせによる応用技術であることを示し、その目的とする処理を説明するため、便宜上図3に処理の概念を示すものである。   The reason for conceptually indicating that the OCR process and the input process of final determination by the user interface have so far been made with many technical proposals as algorithms, and therefore the process in the present invention is applied by such a new combination of conventional techniques. For the sake of convenience, FIG. 3 shows the concept of the process in order to show the technology and to explain the target process.

図4は、条件エリアごとの条件設定の内容をテーブルの概念で示した図である。   FIG. 4 is a diagram showing the contents of condition setting for each condition area in the concept of a table.

図5は、原稿に対する条件エリア設定の例を示す。画像上の原稿としての必須記入部分を矩形でエリア選択する。   FIG. 5 shows an example of condition area setting for a document. A rectangular area is selected for a required entry portion as a manuscript on the image.

次に、図2のフローチャートに従い、本発明の実施例の処理について詳細に説明する。   Next, the processing of the embodiment of the present invention will be described in detail according to the flowchart of FIG.

まず、ステップS101で本画像入力装置にかかる各機能の初期設定を行う。このS101では、本発明の入力ソフト部や文書管理システムはコンピュータソフトウェアで提供されるため、コンピュータプログラム一般の初期化処理を行い、スキャナ機器から画像のスキャンを開始できる状態にすることを示す。   First, in step S101, initial setting of each function relating to the image input apparatus is performed. In S101, since the input software unit and the document management system of the present invention are provided by computer software, the computer program general initialization processing is performed, and the scanner device is ready to start scanning an image.

次に、ステップS102では、スキャナ機器で画像のスキャンを実行し、画像を入力ソフト部へ取り込む。このステップS102では、ユーザインタフェーズを介したスキャン実行命令があるまで、スキャン処理を待つ状態も含み、実際にスキャン実行命令があった場合にスキャナ機器からの画像読み取りを開始する。そして、スキャンした画像画像は、入力ソフト部に取り込まれる。   In step S102, the scanner device scans the image and captures the image into the input software unit. This step S102 includes a state of waiting for the scanning process until there is a scan execution command through the user interphase. When there is an actual scan execution command, reading of an image from the scanner device is started. Then, the scanned image is taken into the input software unit.

次に、ステップS103では、入力ソフト部での処理が「登録フェーズ」なのか、「スキャン・保存フェーズ」なのかを判断する。この判断のもととなる指示は入力ソフト部のユーザインタフェーズを介して入力する。「登録フェーズ」の場合、本発明で帳票の正当性を証明するための処理の事前設定を行うため、ステップS104へ処理が進む。「スキャン・保存フェーズ」の場合、処理はステップS108へ進む。   In step S103, it is determined whether the process in the input software unit is the “registration phase” or the “scan / save phase”. The instruction that is the basis of this determination is input via the user interface phase of the input software unit. In the “registration phase”, the process proceeds to step S104 in order to perform advance setting of the process for proving the validity of the form in the present invention. In the “scan / save phase”, the process proceeds to step S108.

次に、ステップS104では、ステップS102で入力した画像をフォーム登録する。登録されるフォームは帳票DBといったフォームを複数登録するデータベースに登録される。帳票DBに登録されたフォームは、「スキャン・保存フェーズ」での帳票認識の際の帳票認識で使用される。フォームがフォームDBに登録される際、フォームをブロック解析した正規化データ形式で登録され、登録フォーム毎にフォーム名が割り振られる。   In step S104, the image input in step S102 is registered as a form. Forms to be registered are registered in a database for registering a plurality of forms such as a form DB. The form registered in the form DB is used for form recognition at the time of form recognition in the “scan / save phase”. When a form is registered in the form DB, the form is registered in a normalized data format obtained by block analysis, and a form name is assigned to each registered form.

次にステップS105では、条件エリアを設定する。条件エリアとは、画像上の矩形エリアであり、帳票の正当性を判断するために必要な情報がある場所である。図5の例では、A1からA5の位置に記載内容が帳票として意味を持ち、かつ、この位置に情報がなければその原稿が帳票として成り立たなくなる場所を、のユーザインタフェーズを介した画面上の矩形位置指定によって設定する。   In step S105, a condition area is set. The condition area is a rectangular area on the image, and is a place where there is information necessary to determine the validity of the form. In the example of FIG. 5, the contents described in the positions A1 to A5 have a meaning as a form, and if there is no information at this position, the place where the manuscript cannot be formed as a form is displayed on the screen through the user interface phase. Set by specifying the rectangle position.

次にステップS106では、S107で設定した条件エリアの条件を設定する。図5の例で示すと、画像上のA1からA5に情報があればいいのか、どういう方法でそれを判断すればいいのかを入力ソフト部のユーザインタフェーズを介して設定し、設定内容は図4の例で示す条件テーブルに記録される。   Next, in step S106, the condition of the condition area set in S107 is set. In the example of FIG. 5, it is set via the user interface phase of the input software section whether the information from A1 to A5 on the image should be determined and how to determine the information. It is recorded in the condition table shown in the example of 4.

次にステップS107で、条件エリア設定とその条件設定を終了するかどうかの判断をこない、設定を継続する場合には、処理はステップS105に戻り、フォーム上の別の条件エリアとその条件を設定する。このようにステップS105からS107の繰り返し処理によって、1フォーム上に複数の条件エリアとその条件を設定することができる。   Next, in step S107, if the condition area setting and whether or not to end the condition setting are not determined and the setting is continued, the process returns to step S105 to set another condition area on the form and its condition. To do. As described above, a plurality of condition areas and their conditions can be set on one form by repeating the processes in steps S105 to S107.

図5のA1の例では、条件の照合方法は「データ有無」である、これは、その条件エリアに何らかの情報が記入されていればよいという判定を行うためである。   In the example of A1 in FIG. 5, the condition collation method is “data presence / absence”, which is to determine that some information should be entered in the condition area.

また、図5のA2の条件設定の例では、照合方法として日付範囲が指定され、その条件値として最小値設定と最大値設定が条件テーブルに記録される。これは、条件設定値内の最小値と最大値の間かどうかの判定を行うためである。   In the example of the condition setting of A2 in FIG. 5, a date range is designated as the collation method, and the minimum value setting and the maximum value setting are recorded in the condition table as the condition values. This is for determining whether or not the value is between the minimum value and the maximum value in the condition set value.

また、図5のA3の「 40000」の条件設定の例では、照合方法として数値範囲が指定される。その条件値として最小値設定と最大値設定が条件テーブルに記録される。これは、条件設定値内の最小値と最大値の間かどうかの判定を行うためである。   Further, in the example of the condition setting “40000” in A3 of FIG. 5, a numerical value range is designated as the collation method. As the condition value, the minimum value setting and the maximum value setting are recorded in the condition table. This is for determining whether or not the value is between the minimum value and the maximum value in the condition set value.

つまり、図5および図4の例では、領収書1というフォーム名のフォームが帳票DBにフォームDBに条件エリアとしてA1からA5までの5つの条件エリアが設定され、それぞれの条件エリアごとに正当性照合時の条件設定がなされていることになる。   In other words, in the example of FIGS. 5 and 4, the form with the form name “Receipt 1” has five condition areas A1 to A5 as the condition areas in the form DB in the form DB, and each condition area is valid. The condition setting at the time of collation is made.

次に、ステップS107でフォーム登録と条件エリア設定、条件設定が終了した場合、処理は「登録フェーズ」の処理は終了となり、ステップS102へ戻り、次のスキャン実行を待つ状態となる。   Next, when the form registration, condition area setting, and condition setting are completed in step S107, the process ends in the “registration phase”, returns to step S102, and waits for the next scan execution.

ステップS103の判断で、処理が「スキャン・保存フェーズ」の場合、処理はステップS108へ進む。   If it is determined in step S103 that the process is the “scan / save phase”, the process proceeds to step S108.

ステップS108では、S102でスキャンした画像に対し、帳票認識処理を行う。帳票認識処理は、S102で入力した画像を正規化し、帳票DBに登録されたフォームの正規化データを参照し、フォームを特定する処理である。   In step S108, a form recognition process is performed on the image scanned in S102. The form recognition process is a process for specifying the form by normalizing the image input in S102 and referring to the normalized data of the form registered in the form DB.

次に、ステップS109では、S108の帳票認識の結果、フォームが帳票DBに登録されているかどうかの判断を行う。画像はフォーム登録されていた場合、処理はステップS110へ進む。画像がフォーム登録されていなかった場合、本発明の特徴である画像の正当性の判断処理ができないため、処理はステップS122へ進む。   Next, in step S109, it is determined whether the form is registered in the form DB as a result of the form recognition in S108. If the image has been registered in the form, the process proceeds to step S110. If the image is not registered in the form, the image legitimacy determination process, which is a feature of the present invention, cannot be performed, and the process advances to step S122.

ステップS110では、帳票DBに登録されたフォームと関連付けして保存されている図4にその例を示す条件テーブルから条件エリア設定の情報をひとつずつ読み出す。図4における、条件エリア欄の設定が条件エリアである。図4の例では、まず(sx1,sy1)(ex1,ey1)が読み出される。(sx1,sy1)(ex1,ey1)は画像上の原点からの座標位置示す。条件エリアは画像上の矩形エリア指定なので、(sx1,sy1)は矩形左上の座標を示す。(ex1,ey1)は矩形右下の座標を示す。Sx1とex1はx座標の位置を示す。Sy1,ey1はy座標の位置を示す。   In step S110, the condition area setting information is read one by one from the condition table shown in FIG. 4 which is stored in association with the form registered in the form DB. The setting in the condition area column in FIG. 4 is the condition area. In the example of FIG. 4, (sx1, sy1) (ex1, ey1) is first read. (Sx1, sy1) (ex1, ey1) indicates the coordinate position from the origin on the image. Since the condition area is a rectangular area on the image, (sx1, sy1) indicates the coordinates of the upper left corner of the rectangle. (ex1, ey1) indicates the coordinates of the lower right corner of the rectangle. Sx1 and ex1 indicate the position of the x coordinate. Sy1, ey1 indicates the position of the y coordinate.

次にステップS111では、条件テーブルから条件設定を読み出す。   In step S111, the condition setting is read from the condition table.

図4の例では、IDがF1−1で示される条件で、照合方法は「データ有無」となる。この場合、データがあればよいので条件設定値はない。   In the example of FIG. 4, the collation method is “data presence / absence” under the condition that the ID is indicated by F1-1. In this case, there is no condition setting value as long as there is data.

次に、ステップS112では、S110で読み出した条件エリア設定の内容にしたがって、S102で入力した画像から部分画像を切り出す。   Next, in step S112, a partial image is cut out from the image input in S102 according to the contents of the condition area setting read in S110.

次にステップS113では、S112で切り出した部分画像にOCR処理をする。   In step S113, OCR processing is performed on the partial image cut out in step S112.

次にステップS114では、S113のOCR結果をインデックスデータとして一時保存する。   In step S114, the OCR result in S113 is temporarily stored as index data.

次にステップS115では、S112・S113のOCR結果とS111で読み出した条件の照合を行う。図4のID「F1−1」の条件例と図5で説明すると、まず、ステップ112では、図5のA1の矩形が切り出される。そして切り出された画像をOCR処理する。矩形内には文字情報等がないためOCR結果は空となる。次にS115で条件との照合をする.その際照合方法は「データ有無」のため、空のOCR結果だと、ID「F1−1」の照合結果は「否」となる。   In step S115, the OCR result in S112 / S113 is compared with the condition read in S111. The condition example of ID “F1-1” in FIG. 4 and FIG. 5 will be described. First, in step 112, a rectangle A1 in FIG. 5 is cut out. The cut image is subjected to OCR processing. Since there is no character information in the rectangle, the OCR result is empty. Next, in step S115, a check is performed against the condition. At this time, since the check method is “data presence / absence”, if the result is an empty OCR result, the check result of the ID “F1-1” is “no”.

次に、S116ではフォームに対する全ての条件を照合したかどうかの判断を行う。全ての照合を終了した場合、ステップS117へ進む。全ての照合を終了した場合、ステップS110へ戻り、次の条件の照合までの処理を行う。図5に示すエリア設定例では、A1からA5に対し、図4の条件テーブルを参照し、S110からS115の処理が繰り返される。   Next, in S116, it is determined whether or not all conditions for the form have been collated. When all the collations are completed, the process proceeds to step S117. When all the collations have been completed, the process returns to step S110 to perform processing up to the collation of the next condition. In the area setting example shown in FIG. 5, the processing from S110 to S115 is repeated for A1 to A5 with reference to the condition table of FIG.

ステップS117では、画像と全ての条件の照合結果を画面表示する。例として図3の全面画面表示のような状態、つまり画像と画像上の条件エリア矩形が表示され、さらに条件矩形はS115の照合結果にしたがって「合」のものと「否」のもので異なる矩形の線色で表示される。表示は入力ソフト部のあるコンピュータのディスプレイに表示される。   In step S117, the collation result of the image and all the conditions is displayed on the screen. As an example, the state shown in FIG. 3 is a full screen display, that is, an image and a condition area rectangle on the image are displayed. The line color is displayed. The display is displayed on the display of a computer having an input software section.

次にステップS118で、最終判定画面表示を行う。図3の「条件確認」画面にその例を示す。S117の画像全面表示は、OCR結果に基づく条件の照合結果であり、厳密には正確とはいえない。そのため、S118で最終判定のための「条件確認」画面を表示する。この条件確認画面でユーザの入力による合否の結果を受付つける。図3の条件確認画面例は、「OK」にチェックがあれば「合」、「NG」にチェックがあれば「否」という最終判定結果となる。   In step S118, a final determination screen is displayed. An example is shown in the “Condition Confirmation” screen of FIG. The entire image display in S117 is a result of matching conditions based on the OCR result, and is not exactly accurate. Therefore, a “Condition Confirmation” screen for final determination is displayed in S118. On this condition confirmation screen, the result of acceptance or rejection by the user input is accepted. In the example of the condition confirmation screen in FIG. 3, the final determination result is “OK” if “OK” is checked, and “No” if “NG” is checked.

次にステップS119で、条件確認画面でユーザの入力による合否の結果を一時保存する。   In step S119, the pass / fail result by the user input on the condition confirmation screen is temporarily stored.

次にステップS120では、最終判定画面表示と最終判定結果の保存が全ての条件に対しておこなわれたかどうかの判断を行う。全ての条件に対して行われた場合は、処理はS121へ進む。まだ、全ての条件に対して行われていない場合は、処理はS118へ戻り、次の条件に対する最終判定画面表示とユーザからの最終判定入力、および条件ごとの最終判定結果の保存を繰り返し行う。   Next, in step S120, it is determined whether or not the final determination screen display and the final determination result are stored for all conditions. If it has been performed for all conditions, the process proceeds to S121. If not yet performed for all conditions, the process returns to S118, and the final determination screen display for the next condition, the final determination input from the user, and the final determination result for each condition are repeatedly stored.

次に、ステップS121では、S118からS120の繰り返し処理で保存された、全条件の最終判定結果を評価する。全部の条件の最終判定結果が「合」の場合、処理はS123へ進む。全部の条件の最終判定結果に一つでも「否」があれば、それは帳票として成り立たないものとして、S122へ処理が進む。   Next, in step S121, the final determination result of all conditions stored in the repetition process of S118 to S120 is evaluated. If the final determination result of all the conditions is “go”, the process proceeds to S123. If there is at least one “No” in the final determination result of all the conditions, it is assumed that it does not hold as a form, and the process proceeds to S122.

ステップS122では、入力した画像を文書管理システムの他の保存場所へ保存する。   In step S122, the input image is stored in another storage location of the document management system.

ステップS123では、S102でスキャンした画像にタイムスタンプを付与する。   In step S123, a time stamp is given to the image scanned in S102.

次にステップS124では、S102でスキャンした画像に電子署名を付与する。   In step S124, an electronic signature is added to the image scanned in S102.

本発明では、S121で全ての条件が「合」である場合に、S123,S124を処理することを特徴としている。しかしながら画像へのタイムスタンプの付与や電子署名の付与の処理については、一般的な技術であり、特に本発明の特徴ではないため、詳細な説明は省略する。   The present invention is characterized in that S123 and S124 are processed when all the conditions are “go” in S121. However, the process of adding a time stamp to an image and applying an electronic signature is a general technique and is not a feature of the present invention, and thus detailed description thereof is omitted.

次にステップS125では、S102で入力した画像にタイムスタンプと電子署名が付与されたものと、更にS114で保存していたOCR結果をインデックスデータを文書管理システムに保存する。   In step S125, the index data is stored in the document management system in which the image input in step S102 is given a time stamp and an electronic signature and the OCR result stored in step S114.

最後にS126では、本画像入力装置全体の処理を終了するかどうかの判断を行う。終了しない場合は、処理はS102へ戻り、また画像のスキャン実行待ち状態となる。終了する場合は、異パン的なソフトウェアの終了処理を行った上で、全ての処理を終了する。   Finally, in S126, it is determined whether or not the processing of the entire image input apparatus is to be ended. If not completed, the process returns to S102 and waits for image scanning. When the process is to be ended, all processes are ended after performing a different software end process.

本発明の第1実施の形態に係るシステム構成ブロック図である。It is a system configuration block diagram concerning a 1st embodiment of the present invention. 本発明の実施の形態に係る全体的な処理のフローチャート図である。It is a flowchart figure of the whole process which concerns on embodiment of this invention. 本発明の実施の形態に係る、スキャン・保存フェーズ処理の概念図である。It is a conceptual diagram of the scan / save phase process according to the embodiment of the present invention. 本発明の実施の形態に係る、条件テーブルの概念図である。It is a key map of a condition table concerning an embodiment of the invention. 本発明の実施の形態に係る、登録フェーズの条件エリア設定を示す図である。It is a figure which shows the condition area setting of the registration phase based on embodiment of this invention.

Claims (4)

本発明における画像入力装置は、画像入力を行うスキャナ機器、画像をスキャナ機器から取り込む入力ソフト部と、スキャナが読み込んだ画像をインデックスと共に保存しさらに保存文書の検索閲覧をする文書管理システムによる画像入力装置において、
入力ソフト部の処理として、入力する原稿の正当性を評価する方法があり、画像情報から帳票の必須記入項目に対する画像上の条件エリアを読み出し、OCR(光学式文字認識)によって画像情報を文字情報変換して、予め帳票ごとに登録された条件DBに文字情報を参照し、1帳票内の全ての条件が合致する場合のみ、その入力画像は正当であると判断し文書管理システムに登録する入力画像の正当性判断手段を備え、
その入力画像の正当性判断手段のために、まず、原稿種を自動で判断する帳票認識のためのフォーム登録手段と、フォーム毎に条件エリア設定、各条件エリアごとの条件を関連付けして設定するといった一連の登録フェーズ手段を備え、
また、入力ソフト部では、画像を入力し、正当性を判断した上で文書管理システムに画像を保存する一連の処理をスキャン・保存フェーズ手段を備え、
そのスキャン・保存フェーズにおいて、まず、入力ソフト部でスキャナから画像を入力し、自動帳票認識しフォーム登録されている帳票から合致したフォームの「条件エリア」設定と条件エリアごとの「条件」設定を読み出す条件読み出し手段を備え、
次に、合致したフォームの「条件エリア」画像を切り出し、その部分画像をOCR処理して、OCR結果の文字列を「条件」と照合する自動条件照合手段を備え、
さらに、自動前期照合手段による照合結果は、入力した画像を画面表示する際に条件エリアとして画像上に矩形表示し、その矩形の色を「合致した場合」と「合致しない場合」と異なる色で表示する照合結果表示手段を備え、
さらに、自動照合手段による照合結果をオペレータが最終判断するためのユーザインタフェースによる最終判断結果入力手段を備え、
最終判断結果入力手段で入力された内容をもとに、最終判定結果がすべて「合致する」の場合は、文書管理システム内の所定の保存場所へ画像を保存し、「合致しない」が含まれていた場合は、文書管理システム内の他の保存場所への保存を行う画像保存手段を備えることを特徴とする画像入力装置。
An image input apparatus according to the present invention includes a scanner device that performs image input, an input software unit that captures an image from the scanner device, and an image input by a document management system that stores an image read by the scanner together with an index and further searches and browses stored documents. In the device
As a process of the input software section, there is a method for evaluating the validity of the input document. The condition area on the image for the required entry items of the form is read from the image information, and the image information is converted into character information by OCR (optical character recognition). Convert and refer to the character information in the condition DB registered for each form in advance. Only when all the conditions in one form are met, the input image is judged to be valid and registered in the document management system. It has a means of judging the validity of the image,
In order to determine the validity of the input image, first, form registration means for automatically recognizing the document type, condition area setting for each form, and conditions for each condition area are set in association with each other. A series of registration phase means,
In addition, the input software unit includes a scan / save phase means for inputting a picture, judging the validity, and saving a series of processes in the document management system.
In the scan / save phase, first, an image is input from the scanner using the input software section, and the "condition area" setting for the form that matches the form registered in the form registered automatically and the "condition" setting for each condition area are set. A condition reading means for reading,
Next, automatic condition matching means for cutting out the “condition area” image of the matched form, subjecting the partial image to OCR processing, and matching the character string of the OCR result with “condition”,
Furthermore, the result of the verification by the automatic previous verification means is displayed in a rectangle on the image as a condition area when the input image is displayed on the screen. It has a matching result display means for displaying,
Furthermore, a final judgment result input means by a user interface for the operator to finally judge the collation result by the automatic collation means,
Based on the contents entered by the final judgment result input means, if the final judgment results are all “match”, the image is saved in a predetermined storage location in the document management system, and “does not match” is included. If so, an image input device comprising image storage means for storing in another storage location in the document management system.
請求項1に関するもので、登録フェーズ処理で「条件」設定する際に、スキャン・保存フェーズでの照合処理で、どういった照合を行うのか条件照合方式の設定を行う。条件照合方式として、データ一致、データの有無、設定された条件の範囲内といった条件を設定し、
スキャン・保存フェーズで、スキャナから入力した画像の正当性を判断する際、入力ソフト部でスキャナから画像を入力し、自動帳票認識しフォーム登録されている帳票から合致したフォームの「条件エリア」設定と条件エリアごとの「条件」設定を読み出し、次に、合致したフォームの「条件エリア」画像を切り出し、その部分画像をOCR処理して、OCR結果の文字列を「条件」と照合し、照合する際には「条件」設定に設定された、条件エリアごとの条件による照合がなされることを特徴とする画像入力装置。
The present invention relates to claim 1, and when the “condition” is set in the registration phase process, the condition verification method is set for the verification process in the verification process in the scan / save phase. Set the conditions such as data match, presence / absence of data, within the set condition range as the condition matching method,
When judging the validity of the image input from the scanner in the scan / save phase, the image is input from the scanner in the input software section, and the "Condition area" of the form that matches the form registered in the form registered automatically is recognized. “Condition” setting for each condition area is read out, then the “condition area” image of the matched form is cut out, the partial image is subjected to OCR processing, the character string of the OCR result is collated with “condition”, and collation In this case, the image input apparatus is characterized in that collation is performed according to the condition for each condition area set in the “condition” setting.
請求項1のスキャン・保存フェーズでの文書保存において、正当性判断の最終結果によって、全ての条件が「合致する」場合、画像にタイムスタンプおよび電子署名を付与して文書管理システムへ保存することを特徴とする画像入力装置。   In the document storage in the scan / save phase of claim 1, if all conditions are “matched” by the final result of the validity judgment, the image is given a time stamp and an electronic signature and stored in the document management system. An image input device. 請求項1のスキャン・保存フェーズでの文書保存において、正当性判断時に各条件エリアごとのOCR結果を入力ソフト部に一時保存しておき、文書管理システムへの保存時に、そのOCR結果を画像のインデックスデータ(画像と関連付けされた属性データ)として文書管理システムに保存することを特徴とする画像入力装置。   In the document storage in the scan / save phase according to claim 1, the OCR result for each condition area is temporarily stored in the input software unit at the time of validity judgment, and the OCR result is stored in the document management system when the image is stored. An image input apparatus that stores data as index data (attribute data associated with an image) in a document management system.
JP2007139361A 2007-05-25 2007-05-25 Image input device Pending JP2008293353A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007139361A JP2008293353A (en) 2007-05-25 2007-05-25 Image input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007139361A JP2008293353A (en) 2007-05-25 2007-05-25 Image input device

Publications (1)

Publication Number Publication Date
JP2008293353A true JP2008293353A (en) 2008-12-04

Family

ID=40167999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007139361A Pending JP2008293353A (en) 2007-05-25 2007-05-25 Image input device

Country Status (1)

Country Link
JP (1) JP2008293353A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015087830A (en) * 2013-10-28 2015-05-07 富士ゼロックス株式会社 Document processing apparatus and program
JP2015194861A (en) * 2014-03-31 2015-11-05 株式会社日本総合研究所 Collation system, program, and collation method
JP2017097515A (en) * 2015-11-20 2017-06-01 富士ゼロックス株式会社 Application processing apparatus, application processing system, and program
JP2017134502A (en) * 2016-01-26 2017-08-03 株式会社東芝 Document management device, document management method, and program
JP2018124705A (en) * 2017-01-31 2018-08-09 日本Ics株式会社 Voucher management program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015087830A (en) * 2013-10-28 2015-05-07 富士ゼロックス株式会社 Document processing apparatus and program
JP2015194861A (en) * 2014-03-31 2015-11-05 株式会社日本総合研究所 Collation system, program, and collation method
JP2017097515A (en) * 2015-11-20 2017-06-01 富士ゼロックス株式会社 Application processing apparatus, application processing system, and program
JP2017134502A (en) * 2016-01-26 2017-08-03 株式会社東芝 Document management device, document management method, and program
JP2018124705A (en) * 2017-01-31 2018-08-09 日本Ics株式会社 Voucher management program

Similar Documents

Publication Publication Date Title
US8014039B2 (en) Document management system, a document management method, and a document management program
EP1995686B1 (en) Document processing device and document processing method
US7778953B2 (en) Document management apparatus and document management method
JP4405831B2 (en) Image processing apparatus, control method therefor, and program
JP5223284B2 (en) Information retrieval apparatus, method and program
US20090219567A1 (en) Image processing apparatus and image processing method
US7853039B2 (en) Workflow management system and workflow management method
US8099384B2 (en) Operation procedure extrapolating system, operation procedure extrapolating method, computer-readable medium and computer data signal
JP2010510563A (en) Automatic generation of form definitions from hardcopy forms
US20180061263A1 (en) Image forming apparatus and grading assistance method
JP2005025736A (en) Document management method, document management program and document management system
US20070188810A1 (en) Image processing apparatus
US8228522B2 (en) Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data
US20090027718A1 (en) Workflow management system
JP2008293353A (en) Image input device
US8266146B2 (en) Information processing apparatus, information processing method and medium storing program thereof
JP4752758B2 (en) Image processing apparatus, image processing system, image processing program, and image processing method
JP5844564B2 (en) Form recognition system
JP6127597B2 (en) Information processing apparatus, control method thereof, and program
JP2006209261A (en) Method, apparatus, and program for displaying job of received business form
JP4811133B2 (en) Image forming apparatus and image processing apparatus
JP2007041709A (en) Document processing system, control method of document processing system, document processing device, computer program and computer readable storage medium
US8194982B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP2008092451A (en) Scanner system
JP2009026075A (en) Image processing device

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201