JP2008250817A - Business form automatically discriminating device - Google Patents

Business form automatically discriminating device Download PDF

Info

Publication number
JP2008250817A
JP2008250817A JP2007093339A JP2007093339A JP2008250817A JP 2008250817 A JP2008250817 A JP 2008250817A JP 2007093339 A JP2007093339 A JP 2007093339A JP 2007093339 A JP2007093339 A JP 2007093339A JP 2008250817 A JP2008250817 A JP 2008250817A
Authority
JP
Japan
Prior art keywords
feature
image data
data
image
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007093339A
Other languages
Japanese (ja)
Inventor
Yoshiaki Ota
圭亮 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2007093339A priority Critical patent/JP2008250817A/en
Publication of JP2008250817A publication Critical patent/JP2008250817A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To prevent a collation error of business forms by checking and collating features between a previously registered business form image and an actual business form to be sorted. <P>SOLUTION: A business form discrimination processing part 15 generates feature data indicating a feature of image data from the image data input by an image input processing part 14. Then, the business form discrimination processing part 15 extracts feature image data similar to the input image data based on the generated feature data and the feature data stored in a business form discrimination data storage memory 12. The business form discrimination processing part 15 specifies a feature quantity difference indicating quantity of a feature difference from each other in regions divided into a predetermined number based on the generated feature data and the feature data described in the extracted feature image data. A similarity degree display part 16 displays the feature quantity difference on each specified region. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、画像ベースで多種多様な帳票画像を入力し、その帳票画像から帳票のフォーマットを識別する帳票自動識別装置に関する。   The present invention relates to an automatic form identification apparatus for inputting a wide variety of form images on an image basis and identifying the form format from the form images.

多種多様な帳票画像を入力し、文字認識対象領域の文字を認識したり、画像をファイリングしたりする、いわゆる基幹業務系の帳票画像処理システムにおいて、まず、入力された帳票画像を業務に合わせて帳票の種類を識別する必要がある。識別する方法として幾通りかの方法があるが、そのうちの1には、罫線特徴識別方法がある。この罫線特徴識別方法は、識別対象となる帳票画像の罫線の特徴を抽出し、その特徴をその画像のフォーマットとしてあらかじめ分類・登録しておき、帳票画像が入力されたときにその帳票画像の罫線の特徴と、登録されている複数のフォーマットの罫線特徴を照合し、帳票の種類を識別するという方法である(例えば、特許文献1参照)。   In a so-called core business form image processing system that inputs a wide variety of form images, recognizes characters in the character recognition target area, and filing the images, the input form image is first adapted to the business. It is necessary to identify the type of form. There are several methods for identifying, but one of them is a ruled line feature identifying method. In this ruled line feature identification method, the ruled line feature of the form image to be identified is extracted, the feature is classified and registered in advance as the format of the image, and the ruled line of the form image is input when the form image is input. And the ruled line features of a plurality of registered formats are identified, and the form type is identified (see, for example, Patent Document 1).

ところで、帳票は、必要に応じて欄の追加を行ったり、表の配置や大きさを変更したりするような、帳票改訂が頻繁に生じる。また、既にある帳票は、別の新しい帳票を作成するときに流用される。
特開平11−282956号公報
By the way, the form is frequently revised so that a column is added or the layout and size of the table are changed as necessary. An existing form is also used when another new form is created.
JP-A-11-282956

上述した罫線特徴識別方法を用いた従来の帳票画像処理システムでは、予め登録しておいた帳票画像と、実際に分類したい帳票画像とを予め決められた基準に従って照合して帳票を識別しているが、罫線の特徴だけでは同一の帳票であるにも関わらず違うと照合されてしまうケースや、その逆のケースなどの照合ミスが発生するという問題点があった。   In the conventional form image processing system using the ruled line feature identification method described above, a form image is identified by comparing a pre-registered form image with a form image to be actually classified according to a predetermined criterion. However, there is a problem that collation mistakes such as a case where the same form is collated with the ruled line feature alone, but the case where the forms are different, and the opposite case occur.

そこで、本発明は上述した問題点に鑑み、予め登録しておいた帳票画像と、実際に分類したい帳票画像との照合ミスを防止することが可能な帳票自動識別装置を提供することを目的とする。   Accordingly, in view of the above-described problems, the present invention has an object to provide a form automatic identification device capable of preventing a matching error between a form image registered in advance and a form image to be actually classified. To do.

上記課題を解決するため、請求項1記載の発明は、帳票の画像データの特徴を示す特徴データと該画像データを対応させた特徴画像データを記憶する特徴画像データ記憶部と、帳票の画像データを入力する画像データ入力部と、前記画像データ入力部により入力された画像データから該画像データの特徴を示す特徴データを生成する特徴データ生成部と、前記特徴データ生成部により生成された特徴データと、前記特徴データ記憶部に記憶されている特徴データとに基づき、前記画像データ入力部から入力された画像データと類似している前記特徴画像データを抽出する抽出部と、前記特徴データ生成部により生成された前記特徴データと、前記抽出部により抽出された特徴画像データに記述されている特徴データとに基づき、所定の数に分割した領域における、互いの特徴の差の量を示す特徴量差を特定する特徴量差特定部と、前記特徴量差特定部に特定された領域ごとの特徴量差を表示する表示部とを備える。   In order to solve the above-mentioned problem, the invention described in claim 1 is characterized in that the feature data indicating the feature of the image data of the form, the feature image data storing the feature image data corresponding to the image data, and the image data of the form An image data input unit that inputs the feature data, a feature data generation unit that generates feature data indicating features of the image data from the image data input by the image data input unit, and feature data generated by the feature data generation unit And an extraction unit that extracts the feature image data similar to the image data input from the image data input unit based on the feature data stored in the feature data storage unit, and the feature data generation unit Is divided into a predetermined number based on the feature data generated by the feature data and the feature data described in the feature image data extracted by the extraction unit. A feature amount difference specifying unit that specifies a feature amount difference indicating an amount of difference between the features in the region, and a display unit that displays the feature amount difference for each region specified by the feature amount difference specifying unit. .

この構成によれば、特徴量差特定部により、特徴データ生成部により生成された特徴データと、抽出部により抽出された特徴画像データに記述されている特徴データとに基づき、所定の数に分割した領域における、互いの特徴の差の量を示す特徴量差が特定され、表示部が特徴量差特定部に特定された領域ごとの特徴量差を表示するので、予め登録しておいた帳票画像と、実際に分類したい帳票画像との間の特徴を確認して照合することができるので、帳票の照合ミスを防止することができる。   According to this configuration, the feature amount difference specifying unit divides the data into a predetermined number based on the feature data generated by the feature data generation unit and the feature data described in the feature image data extracted by the extraction unit. Since the feature amount difference indicating the amount of the difference between the features in the selected area is specified, and the display unit displays the feature amount difference for each region specified in the feature amount difference specifying unit, the registered form Since the feature between the image and the form image to be actually classified can be confirmed and collated, a form collation error can be prevented.

請求項2記載の発明は、請求項1記載の発明において、表示部が、領域ごとの特徴量差を表示する以外に、表示されている特徴量差における領域が選択されると、該選択された領域における前記画像データ入力部から入力された画像データと、前記抽出部により抽出された前記特徴画像データの有する画像データを拡大して表示する。   In the invention described in claim 2, in the invention described in claim 1, the display unit displays the feature amount difference for each region. The image data input from the image data input unit in the selected area and the image data included in the feature image data extracted by the extraction unit are enlarged and displayed.

この構成によれば、表示部が、領域ごとの特徴量差を表示する以外に、表示されている特徴量差における領域が押下されると、該押下された領域における前記画像データ入力部から入力された画像データの画像と、前記抽出部により抽出された前記特徴画像データの有する画像データの画像を拡大して表示するので、予め登録しておいた帳票画像と、実際に分類したい帳票画像との間の特徴を詳細に確認して照合することができるので、帳票の照合ミスを一層防止することができる。   According to this configuration, in addition to displaying the feature amount difference for each region, when the region in the displayed feature amount difference is pressed, the display unit inputs from the image data input unit in the pressed region. Since the image of the image data and the image of the image data of the feature image data extracted by the extraction unit are enlarged and displayed, the form image registered in advance and the form image to be actually classified Since it is possible to check the characteristics between the two in detail and collate them, it is possible to further prevent the form from being collated.

以上、本発明によれば、予め登録しておいた帳票画像と、実際に分類したい帳票画像との間の特徴を確認して照合することができるので、帳票の照合ミスを防止することができる。   As described above, according to the present invention, since it is possible to check and collate the characteristics between a pre-registered form image and a form image to be actually classified, it is possible to prevent a form collation error. .

次に、本発明を実施するための最良の形態を説明する。   Next, the best mode for carrying out the present invention will be described.

図1は、本発明に係る帳票自動識別装置の構成を示すブロック図である。図1に示すように、この帳票自動識別装置は、入力画像メモリ11と、帳票識別データ格納メモリ12と、帳票識別結果格納メモリ13と、画像入力処理部14と、帳票識別処理部15と、類似度表示部16とを備えて構成されている。ここで、帳票識別処理部15は、図示しないCPUが図示しないROMに記憶されている制御プログラムを実行することにより、下記に示す機能を有する。   FIG. 1 is a block diagram showing the configuration of a form automatic identification apparatus according to the present invention. As shown in FIG. 1, the form automatic identification device includes an input image memory 11, a form identification data storage memory 12, a form identification result storage memory 13, an image input processing unit 14, a form identification processing unit 15, The similarity display unit 16 is provided. Here, the form identification processing unit 15 has the following functions when a CPU (not shown) executes a control program stored in a ROM (not shown).

入力画像メモリ11は、ビデオRAMにより形成され、画像入力処理部14から入力された帳票の画像データを記憶する。   The input image memory 11 is formed of a video RAM, and stores form image data input from the image input processing unit 14.

帳票識別データ格納メモリ12は、ハードディスク装置により形成され、識別対象としている帳票の特徴を示すデータ(以下、帳票識別データという)を格納する。     The form identification data storage memory 12 is formed by a hard disk device, and stores data (hereinafter referred to as form identification data) indicating the characteristics of the form to be identified.

帳票識別データは、各罫線の開始位置及び罫線の終了位置と画像データを対にしてなるデータである。例えば、図2に示すように、ある帳票の画像データ中に、符号Cに示されているように、縦横に囲まれた罫線があるとすると、この帳票データにおける帳票識別データは、位置aの座標Pa(Xa、Ya)、位置bの座標Pb(Xb、Yb)、位置cの座標Pc(Xc、Yc)、位置dの座標Pd(Xd、Yd)の組からなる(Pa、Pb、Pc、Pd)と画像データとが対になっている。   The form identification data is data obtained by pairing the start position of each ruled line and the end position of the ruled line with image data. For example, as shown in FIG. 2, if there is a ruled line surrounded by vertical and horizontal lines as shown by reference C in the image data of a certain form, the form identification data in this form data is It consists of a set of coordinates Pa (Xa, Ya), coordinates Pb (Xb, Yb) at position b, coordinates Pc (Xc, Yc) at position c, and coordinates Pd (Xd, Yd) at position d (Pa, Pb, Pc) , Pd) and image data are paired.

帳票識別結果格納メモリ13は、RAMにより形成され、帳票識別データ格納メモリ12に格納されているすべての帳票識別データの中から後述するようにして、帳票識別処理部15により抽出された帳票識別データを格納する。   The form identification result storage memory 13 is formed of RAM, and the form identification data extracted by the form identification processing unit 15 from all the form identification data stored in the form identification data storage memory 12 as will be described later. Is stored.

画像入力処理部14は、デジタルカメラ等のイメージスキャナにより形成され、入力帳票の画像を画像データ(以下、入力画像データという)として入力し、この入力画像データを入力画像メモリ11に書き込む。   The image input processing unit 14 is formed by an image scanner such as a digital camera, inputs an input form image as image data (hereinafter referred to as input image data), and writes the input image data into the input image memory 11.

帳票識別処理部15は、入力画像メモリ11に格納されている帳票の入力画像データから帳票中のすべての罫線についての開始位置と終了位置とを算出し、算出したすべての罫線の開始位置と終了位置とからなる罫線特徴データを生成する。   The form identification processing unit 15 calculates the start position and end position for all ruled lines in the form from the input image data of the form stored in the input image memory 11, and starts and ends the calculated ruled lines. Ruled line feature data including positions is generated.

また、帳票識別処理部15は、帳票識別データ格納メモリ12に記憶されている帳票識別データについて、図3に示すように、均等に9等分された領域ごとに、先に生成した罫線特徴データに基づき、領域別の特徴量の差(以下、領域別特徴量差という)を、大、中、小、無と決定し、この決定した領域別特徴量差をRAM(図示せず)に格納する。ここで、領域別特徴量差が大とは、該当する領域における罫線の数が1本でも異なる場合であり、領域別特徴量差が中とは、罫線の数が同じでかつ罫線の長さの差が互いに50%以上である場合であり、領域別特徴量差が小とは、罫線の数が同じで、罫線の長さの差が互いに50%未満でかつ10%以上である場合であり、領域別特徴量差が無とは、罫線の数が同じで、罫線の長さの差が互いに10%未満である場合である。罫線の長さは、罫線の開始位置と罫線の終了位置との距離で算出され、罫線の本数は、罫線の長さが算出された数をもって本数とされる。   Further, the form identification processing unit 15 generates the ruled line feature data previously generated for each area equally divided into nine parts as shown in FIG. 3 with respect to the form identification data stored in the form identification data storage memory 12. Based on the above, the difference between the feature amounts for each region (hereinafter referred to as the feature amount difference for each region) is determined as large, medium, small, and none, and the determined region-specific feature amount difference is stored in a RAM (not shown). To do. Here, a large feature amount difference for each region means that the number of ruled lines in the corresponding region is different even by one, and a medium feature amount difference means that the number of ruled lines is the same and the length of the ruled line. The difference between the regions is 50% or more, and the characteristic difference by region is small when the number of ruled lines is the same and the length difference between the ruled lines is less than 50% and 10% or more. “No difference in feature amount by region” means that the number of ruled lines is the same and the difference in the lengths of the ruled lines is less than 10% of each other. The length of the ruled line is calculated by the distance between the start position of the ruled line and the end position of the ruled line, and the number of ruled lines is the number of the calculated ruled line length.

また、帳票識別処理部15は、上述したようにして、帳票識別データ格納メモリ12に記憶されている帳票識別データについて、均等に9等分された領域ごとに、先に生成した罫線特徴データに基づき、領域別特徴量差を大、中、小、無と決定すると、帳票識別データについての上記罫線特徴データに対する類似度を算出する。例えば、類似度を算出する基準値として領域別特徴量差が大の領域を「0」とし、領域別特徴量差が中の領域を「4」とし、領域別特徴量差が小の領域を「7」とし、領域別特徴量差が無の領域を「10」とした場合には、帳票識別処理部15は、すべての9つの領域における値の合計結果に従い、帳票識別データについての上記罫線特徴データに対する類似度を算出する。   Further, as described above, the form identification processing unit 15 converts the form identification data stored in the form identification data storage memory 12 into the ruled line feature data generated previously for each equally divided area. Based on the area-specific feature quantity difference determined as large, medium, small, or none, the similarity of the form identification data to the ruled line feature data is calculated. For example, as a reference value for calculating similarity, an area having a large area-specific feature amount difference is set to “0”, an area-by-area feature quantity difference is set to “4”, and an area having a small area-specific feature amount difference is set to “4”. When “7” is set and an area having no area-specific feature difference difference is “10”, the form identification processing unit 15 determines the ruled line for the form identification data according to the total result of the values in all nine areas. The similarity to the feature data is calculated.

また、帳票識別処理部15は、上述したような処理を行い、帳票識別データ格納メモリ12に記憶されている帳票識別データから、画像入力処理部14から入力された入力画像データの罫線の特徴を最も有するものから5つの帳票識別データを抽出し、この抽出した帳票識別データを帳票識別結果格納メモリ13に格納する。   In addition, the form identification processing unit 15 performs the above-described process, and the feature of the ruled line of the input image data input from the image input processing unit 14 is determined from the form identification data stored in the form identification data storage memory 12. Five form identification data are extracted from the most possessed form, and the extracted form identification data is stored in the form identification result storage memory 13.

類似度表示部16は、液晶表示装置により形成され、図4に示す画像特徴表示画面を表示する。この画像特徴表示画面は、図4に示すように、入力された画像を表示する入力画像表示欄161と、抽出された帳票識別データの画像を表示する抽出画像表示欄162と、上述した9つの領域におけるそれぞれの領域別特徴量差を表示する領域別特徴量差表示入力欄163と、領域別特徴量差表示入力欄163に表示されている9つの領域のうち1つが押下されたときに、この領域の入力画像データを拡大して表示する入力領域画像表示欄164と、上記領域の帳票識別データを拡大して表示する抽出領域画像表示欄165とを有している。   The similarity display unit 16 is formed of a liquid crystal display device and displays an image feature display screen shown in FIG. As shown in FIG. 4, the image feature display screen includes an input image display field 161 for displaying an input image, an extracted image display field 162 for displaying an image of the extracted form identification data, and the above-described nine items. When one of the nine areas displayed in the area-specific feature quantity difference display input field 163 for displaying the area-specific feature quantity difference display area 163 and the area-specific feature quantity difference display input field 163 is pressed, An input area image display field 164 for enlarging and displaying the input image data of this area and an extraction area image display field 165 for enlarging and displaying the form identification data of the area are provided.

次に、本発明に係る実施例の帳票自動識別装置の動作を説明する。   Next, the operation of the form automatic identification apparatus according to the embodiment of the present invention will be described.

図5は、本発明に係る実施例の帳票自動識別装置の動作を示すフローチャートである。まず、画像入力処理部14は、入力帳票の画像を入力画像データとして入力し、この入力画面データを入力画像メモリ11に書き込むとともに、帳票識別処理部15に対して、入力画像データが入力された旨の通知を入力する(ステップS1)。   FIG. 5 is a flowchart showing the operation of the automatic form identification device according to the embodiment of the present invention. First, the image input processing unit 14 inputs an input form image as input image data, writes the input screen data in the input image memory 11, and the input image data is input to the form identification processing unit 15. A notification to that effect is input (step S1).

帳票識別処理部15は、画像入力処理部14から上記通知が入力されると、入力画像メモリ11に格納されている入力画像データを読み出し、この画像データのすべての罫線についての開始位置と終了位置とを算出し、算出したすべての罫線の開始位置と終了位置とからなる罫線特徴データを生成する(ステップS2)。   When the notification is input from the image input processing unit 14, the form identification processing unit 15 reads the input image data stored in the input image memory 11, and the start position and end position for all ruled lines of this image data And ruled line feature data including the start positions and end positions of all the calculated ruled lines is generated (step S2).

次に、帳票識別処理部15は、罫線特徴データに記述されている罫線の開始位置及び罫線の終了位置から罫線の長さ及び罫線の本数を縦方向と横方向について、図3に示すように、均等に9等分された領域ごとに特定する。その後、帳票識別処理部15は、帳票識別データ格納メモリ12に記憶されている帳票識別データを読み出し、帳票識別データに記述されている罫線の開始位置及び罫線の終了位置から罫線の長さ及び罫線の本数を縦方向と横方向について、均等に9等分された領域ごとに特定する。   Next, the form identification processing unit 15 determines the length of the ruled line and the number of ruled lines in the vertical direction and the horizontal direction from the ruled line start position and the ruled line end position described in the ruled line feature data as shown in FIG. Identifies each area equally divided into nine equal parts. Thereafter, the form identification processing unit 15 reads out the form identification data stored in the form identification data storage memory 12, and determines the length of the ruled line and the ruled line from the ruled line start position and ruled line end position described in the form identification data. Is specified for each of the equally divided areas in the vertical and horizontal directions.

その後、帳票識別処理部15は、読み出した帳票識別データについて、均等に9等分された領域ごとに、先に生成した罫線特徴データと比較し、領域別特徴量差を、大、中、小、無と決定したのち、類似度を算出する基準値を用いて、すべての9つの領域における値の合計結果に従い、帳票識別データについての上記罫線特徴データに対する類似度を算出する(ステップS3)。   Thereafter, the form identification processing unit 15 compares the read form identification data with the ruled line feature data generated previously for each of the equally divided nine areas, and determines the feature value difference for each area as large, medium, or small. Then, using the reference value for calculating the degree of similarity, the degree of similarity of the form identification data with respect to the ruled line feature data is calculated using the reference value for calculating the degree of similarity (step S3).

帳票識別処理部15は、上述したようにして、帳票識別データ格納メモリ12に記憶されているすべての帳票識別データについの罫線特徴データに対する類似度を算出したのち、帳票識別データ格納メモリ12に記憶されている帳票識別データから、画像入力処理部14から入力された入力画像データの罫線の特徴を最も有するものから5つ(合計値が最も高いものから5つ)の帳票識別データを抽出し、この抽出した帳票識別データを最も高い特徴を有するものから帳票識別結果格納メモリ13に格納する(ステップS4)。   The form identification processing unit 15 calculates the similarity to the ruled line feature data for all the form identification data stored in the form identification data storage memory 12 as described above, and then stores it in the form identification data storage memory 12. From the form identification data that has been entered, five pieces of form identification data having the features of the ruled lines of the input image data input from the image input processing unit 14 (from the highest total value to five) are extracted, The extracted form identification data is stored in the form identification result storage memory 13 from the one having the highest characteristic (step S4).

次に、帳票識別処理部15は、その後、画像入力処理部から入力された画像の入力画像データを入力画像メモリ11から読み出すとともに、帳票識別結果格納メモリ13から最も高い特徴量を有する帳票識別データを読み出す。また、帳票識別処理部15は、先に算出した9つの領域における領域別特徴量差をRAMから読み出す。   Next, the form identification processing unit 15 reads out the input image data of the image input from the image input processing unit from the input image memory 11 and the form identification data having the highest feature amount from the form identification result storage memory 13. Is read. In addition, the form identification processing unit 15 reads the area-specific feature amount differences in the nine areas calculated previously from the RAM.

その後、帳票識別処理部15は、読み出した入力画像データ、帳票識別データ、及び、9つの領域における領域別特徴量差値に基づき、類似度表示部16に表示させる図4に示す画像特徴表示画面の表示データを生成し、この表示データを類似度表示部16に出力する。   After that, the form identification processing unit 15 displays the image feature display screen shown in FIG. 4 to be displayed on the similarity display unit 16 based on the read input image data, form identification data, and area-specific feature value difference values in the nine areas. Display data is generated, and this display data is output to the similarity display unit 16.

類似度表示部16は、帳票識別処理部15から上記表示データが入力されると、図4に示す画像特徴表示画面を表示する。なお、このとき、入力領域画像表示欄164及び抽出領域画像表示欄165のそれぞれには、領域別特徴量差表示入力欄163において押下された領域に該当する入力画像データの画像、及び、帳票識別データの画像は表示されていない。   When the display data is input from the form identification processing unit 15, the similarity display unit 16 displays an image feature display screen shown in FIG. At this time, each of the input area image display field 164 and the extraction area image display field 165 includes an image of input image data corresponding to the area pressed in the area-specific feature amount difference display input field 163, and a form identification. Data image is not displayed.

帳票識別処理部15は、その後、ユーザにより、画像特徴表示画面に表示されている領域別特徴量差表示入力欄163のうち、例えば、符号Aに示された箇所が押下されると、入力領域画像表示欄164に該当する領域の入力画像データの画像を表示させるとともに、抽出領域画像表示欄165に該当する領域の帳票識別データの画像を表示させる表示データを生成し、この生成した表示データを類似度表示部16に出力する(ステップS5)。   The form identification processing unit 15 then selects the input region when the user presses, for example, a location indicated by the symbol A in the region-specific feature amount difference display input field 163 displayed on the image feature display screen. In addition to displaying the image of the input image data in the area corresponding to the image display field 164 and generating the display data for displaying the image of the form identification data of the area corresponding to the extraction area image display field 165, the generated display data is displayed. It outputs to the similarity display part 16 (step S5).

類似度表示部16は、帳票識別処理部15から上記表示データが入力されると、図4に示すように、入力領域画像表示欄164に該当する領域の入力画像データの画像を表示させるとともに、抽出領域画像表示欄165に該当する領域の帳票識別データの画像を表示させる画像特徴表示画面を表示する(ステップS6)。   When the display data is input from the form identification processing unit 15, the similarity display unit 16 displays the image of the input image data in the area corresponding to the input area image display field 164 as shown in FIG. An image feature display screen for displaying an image of the form identification data in the area corresponding to the extracted area image display field 165 is displayed (step S6).

図4に示す画像特徴表示画面の入力領域画像表示欄164に表示された画像は、符号Aに示された領域における入力画像データの画像で、また、抽出領域画像表示欄165に表示された画像は、符号Aに示された領域における帳票識別データの画像であって、図4に示すように、横方向の罫線の本数が同じで、かつ、縦方向の罫線の長さの差が50%未満で、かつ、10%以上である場合の領域別特徴量差が小のものである。   The image displayed in the input area image display field 164 of the image feature display screen shown in FIG. 4 is the image of the input image data in the area indicated by the symbol A, and the image displayed in the extraction area image display field 165. Is an image of the form identification data in the area indicated by the symbol A, and as shown in FIG. 4, the number of horizontal ruled lines is the same and the length difference between the vertical ruled lines is 50%. If the difference is less than 10% or more, the region-specific feature amount difference is small.

因みに、図6に示す画像特徴表示画面の入力領域画像表示欄164に表示された画像は、符号Bに示された領域における入力画像データの画像で、また、抽出領域画像表示欄165に表示された画像は、符号Bに示された領域における帳票識別データの画像であって、図6に示すように、横方向の罫線の本数が異なる場合の領域別特徴量差が大のものである。   Incidentally, the image displayed in the input area image display field 164 of the image feature display screen shown in FIG. 6 is an image of the input image data in the area indicated by reference numeral B, and is also displayed in the extraction area image display field 165. The image is an image of the form identification data in the area indicated by the symbol B, and has a large difference in area-specific feature amount when the number of horizontal ruled lines is different as shown in FIG.

その後、ユーザにより、入力画像データと、帳票識別結果格納メモリ13に記憶されている他の帳票識別データとについての帳票の特徴を確認する処理が続行された場合には、帳票識別処理部15及び類似度表示部16は、上述したと同様な処理を続行し、一方、帳票の特徴を確認する処理が終了された場合には、処理を終了する。   Thereafter, when the process of confirming the characteristics of the form for the input image data and other form identification data stored in the form identification result storage memory 13 is continued by the user, the form identification processing unit 15 and The similarity display unit 16 continues the same process as described above. On the other hand, when the process for confirming the feature of the form is finished, the process is finished.

実施例によれば、帳票識別処理部15により、生成された特徴データと、抽出された特徴画像データに記述されている特徴データとに基づき、9つ分割した領域における、互いの特徴の差の量を示す領域別特徴量差が特定され、類似度表示部16が9つ分割した領域における、互いの特徴の差の量を示す領域別特徴量差を表示するので、予め登録しておいた帳票画像と、実際に分類したい帳票画像との間の特徴を確認して照合することができるので、帳票の照合ミスを防止することができる。   According to the embodiment, based on the feature data generated by the form identification processing unit 15 and the feature data described in the extracted feature image data, the difference between the features in each of the nine divided regions is shown. Since the region-specific feature amount difference indicating the amount is specified and the similarity display unit 16 displays the region-specific feature amount difference indicating the amount of difference between the features in the nine divided regions, it is registered in advance. Since the features between the form image and the form image to be actually classified can be confirmed and collated, it is possible to prevent a form collation error.

また、実施例によれば、類似度表示部16が、9つ分割した領域ごとの特徴量差を表示する以外に、表示されている領域別特徴量差における領域が押下されると、この押下された領域における画像入力処理部から入力された画像データの画像と、帳票識別処理部15により抽出された帳票識別データに有する画像データの画像を拡大して表示するので、予め登録しておいた帳票画像と、実際に分類したい帳票画像との間の特徴を詳細に確認して照合することができるので、帳票の照合ミスを一層防止することができる。   In addition, according to the embodiment, when the similarity display unit 16 displays the feature amount difference for each of the nine divided regions, when the region in the displayed region-specific feature amount difference is pressed, this pressing is performed. Since the image of the image data input from the image input processing unit in the area and the image of the image data included in the form identification data extracted by the form identification processing unit 15 are enlarged and displayed, it has been registered in advance. Since the features between the form image and the form image to be actually classified can be confirmed and collated in detail, it is possible to further prevent the form from being collated.

上述した実施例の帳票自動識別装置は、類似度表示部16が領域別特徴量差を表示箇所がモノクロでもって表示されているが、これ以外として、特徴量差の違いにより領域に異なる色を表示するようにしてもよい。   In the form automatic identification device according to the above-described embodiment, the similarity display unit 16 displays the feature amount difference for each region with the display portion being displayed in monochrome. You may make it display.

本発明に係る実施例の帳票自動識別装置の構成を示すブロック図である。It is a block diagram which shows the structure of the form automatic identification device of the Example which concerns on this invention. 帳票識別データを説明するための図である。It is a figure for demonstrating form identification data. 領域別特徴量差を示す9つの領域を説明するための図である。It is a figure for demonstrating nine area | regions which show the feature-value difference according to area | region. 図1中の類似度表示部が表示する表示画面を示す図である。It is a figure which shows the display screen which the similarity display part in FIG. 1 displays. 本発明に係る実施例の帳票自動識別装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the form automatic identification device of the Example which concerns on this invention. 図1中の類似度表示部が表示する表示画面を示す図である。It is a figure which shows the display screen which the similarity display part in FIG. 1 displays.

符号の説明Explanation of symbols

11 入力画像メモリ
12 帳票識別データ格納メモリ
13 帳票識別結果格納メモリ
14 画像入力処理部
15 帳票識別処理部
16 類似度表示部
DESCRIPTION OF SYMBOLS 11 Input image memory 12 Form identification data storage memory 13 Form identification result storage memory 14 Image input process part 15 Form identification process part 16 Similarity display part

Claims (4)

帳票の画像データの特徴を示す特徴データと該画像データを対応させた特徴画像データを記憶する特徴画像データ記憶部と、
帳票の画像データを入力する画像データ入力部と、
前記画像データ入力部により入力された画像データから該画像データの特徴を示す特徴データを生成する特徴データ生成部と、
前記特徴データ生成部により生成された特徴データと、前記特徴データ記憶部に記憶されている特徴データとに基づき、前記画像データ入力部から入力された画像データと類似している前記特徴画像データを抽出する抽出部と、
前記特徴データ生成部により生成された前記特徴データと、前記抽出部により抽出された特徴画像データに記述されている特徴データとに基づき、所定の数に分割した領域における、互いの特徴の差の量を示す特徴量差を特定する特徴量差特定部と、
前記特徴量差特定部に特定された領域ごとの特徴量差を表示する表示部と、
を備えることを特徴とする帳票自動識別装置。
A feature image data storage unit for storing feature data indicating features of image data of a form and feature image data corresponding to the image data;
An image data input unit for inputting the image data of the form;
A feature data generating unit that generates feature data indicating the characteristics of the image data from the image data input by the image data input unit;
Based on the feature data generated by the feature data generation unit and the feature data stored in the feature data storage unit, the feature image data similar to the image data input from the image data input unit is obtained. An extractor for extracting;
Based on the feature data generated by the feature data generation unit and the feature data described in the feature image data extracted by the extraction unit, the difference between the features of each other in an area divided into a predetermined number A feature quantity difference identifying unit that identifies a feature quantity difference indicating a quantity;
A display unit for displaying a feature amount difference for each region specified by the feature amount difference specifying unit;
A form automatic identification device comprising:
表示部は、領域ごとの特徴量差を表示する以外に、表示されている特徴量差における領域が選択されると、該選択された領域における前記画像データ入力部から入力された画像データと、前記抽出部により抽出された前記特徴画像データの有する画像データを拡大して表示することを特徴とする請求項1記載の帳票自動識別装置。   In addition to displaying the feature amount difference for each region, the display unit, when a region in the displayed feature amount difference is selected, the image data input from the image data input unit in the selected region, The form automatic identification device according to claim 1, wherein the image data included in the feature image data extracted by the extraction unit is enlarged and displayed. 前記表示部は、特徴量差の違いにより前記領域に異なる色を表示することを特徴とする請求項1又は2記載の帳票自動識別装置。   The form automatic identification device according to claim 1, wherein the display unit displays different colors in the area depending on a difference in feature amount. 前記特徴は帳票の罫線に基づく罫線特徴であり、特徴の差を罫線の数および長さにより特定することを特徴とする請求項1〜3のいずれかに記載の帳票自動識別装置。
The form automatic identification device according to claim 1, wherein the feature is a ruled line feature based on a ruled line of the form, and a difference between the features is specified by a number and a length of the ruled line.
JP2007093339A 2007-03-30 2007-03-30 Business form automatically discriminating device Pending JP2008250817A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007093339A JP2008250817A (en) 2007-03-30 2007-03-30 Business form automatically discriminating device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007093339A JP2008250817A (en) 2007-03-30 2007-03-30 Business form automatically discriminating device

Publications (1)

Publication Number Publication Date
JP2008250817A true JP2008250817A (en) 2008-10-16

Family

ID=39975655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007093339A Pending JP2008250817A (en) 2007-03-30 2007-03-30 Business form automatically discriminating device

Country Status (1)

Country Link
JP (1) JP2008250817A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149684A (en) * 2020-03-19 2021-09-27 株式会社リコー Slip classification device, slip classification system, slip classification method, and program
US11354496B2 (en) 2020-02-28 2022-06-07 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11354496B2 (en) 2020-02-28 2022-06-07 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program
JP2021149684A (en) * 2020-03-19 2021-09-27 株式会社リコー Slip classification device, slip classification system, slip classification method, and program

Similar Documents

Publication Publication Date Title
US10545656B2 (en) Information processing apparatus and display controlling method for displaying an item in a display area in response to movement
JP6826293B2 (en) Information information system and its processing method and program
US20180115681A1 (en) Display system
US8522138B2 (en) Content analysis apparatus and method
CN107085699B (en) Information processing apparatus, control method of information processing apparatus, and storage medium
US10706581B2 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
JP6000992B2 (en) Document file generation apparatus and document file generation method
US20170099403A1 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
US9600916B2 (en) Image processing apparatus for creating composite images, image processing method, and non-transitory computer readable recording medium
US10679091B2 (en) Image box filtering for optical character recognition
JP4983464B2 (en) Form image processing apparatus and form image processing program
US10192524B2 (en) Image display apparatus, image display method, and storage medium
JP2008250817A (en) Business form automatically discriminating device
JP2018055256A (en) Information processing apparatus, information processing method, and program
US8165404B2 (en) Method and apparatus for creating document data, and computer program product
JP2021140831A (en) Document image processing system, document image processing method, and document image processing program
JP7383882B2 (en) Information processing device and information processing program
JP2018005801A (en) Image processing system
US20110157658A1 (en) Imaging processing apparatus, method for controlling the same, and program
JP2010102734A (en) Image processor and program
JP5169648B2 (en) Original image search device and original image search program
EP3113031B1 (en) Image processing device, image processing method, and program
JP6682827B2 (en) Information processing apparatus and information processing program
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
US20210157969A1 (en) Information processing system, information processing apparatus, and non-transitory computer readable medium storing program