JP7445364B2 - Image processing program, image processing method, and image processing device - Google Patents
Image processing program, image processing method, and image processing device Download PDFInfo
- Publication number
- JP7445364B2 JP7445364B2 JP2019125556A JP2019125556A JP7445364B2 JP 7445364 B2 JP7445364 B2 JP 7445364B2 JP 2019125556 A JP2019125556 A JP 2019125556A JP 2019125556 A JP2019125556 A JP 2019125556A JP 7445364 B2 JP7445364 B2 JP 7445364B2
- Authority
- JP
- Japan
- Prior art keywords
- seal
- area
- notification
- detection process
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 79
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims description 136
- 238000001514 detection method Methods 0.000 claims description 98
- 238000010586 diagram Methods 0.000 description 16
- 238000000605 extraction Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Collating Specific Patterns (AREA)
Description
本発明は、画像処理プログラム、画像処理方法、及び画像処理装置に関する。 The present invention relates to an image processing program, an image processing method, and an image processing apparatus.
銀行等で使用される帳票処理システムの1つとして、届出印が押印された帳票を扱うシステムが知られている。この種の帳票処理システムは、画像処理装置を備える。画像処理装置は、光学的に読み取られた帳票の画像を取得し、取得した帳票の画像から届出印の印影を抽出し、抽出した届出印の印影と予め登録された届出印の印影とを電子的に照合する(所謂印鑑照合)等の処理を行う。 2. Description of the Related Art As one of the form processing systems used in banks and the like, a system that handles forms with a notification seal affixed thereto is known. This type of form processing system includes an image processing device. The image processing device obtains an optically read image of the form, extracts the impression of the notification seal from the obtained image of the form, and electronically converts the extracted impression of the notification seal and the impression of the notification seal registered in advance. Processes such as verification (so-called seal verification) are performed.
帳票の画像から届出印の印影を抽出する方法として、次のような方法が知られている。例えば、予め定義された届出印欄の位置に基づいて届出印の印影を抽出する方法(方法1)が知られている(例えば特許文献1参照)。また、例えば、届出印の項目名を示す文字列(例えば「お届け印」)を利用して帳票の画像における届出印欄の位置を検出し、検出した届出印欄の位置に基づいて届出印の印影を抽出する方法(方法2)も知られている。また、例えば、帳票の画像から印影を検出し、検出した印影の中から、予め登録されている除外印影(例えば検印の印影)を除外することによって、顧客印影を抽出する方法も知られている(例えば特許文献2参照)。 The following methods are known as methods for extracting the impression of a notification seal from an image of a form. For example, a method (method 1) of extracting the impression of a notification seal based on the position of a predefined notification seal field is known (for example, see Patent Document 1). In addition, for example, the position of the notification seal column in the image of the form is detected using a character string indicating the item name of the notification seal (for example, "notice seal"), and the notification seal is determined based on the detected position of the notification seal column. A method (Method 2) of extracting a seal impression is also known. Furthermore, for example, a method is known in which customer seal impressions are extracted by detecting seal impressions from an image of a form and excluding previously registered excluded seal impressions (for example, an inspection seal impression) from among the detected seal impressions. (For example, see Patent Document 2).
また、方法2のような届出印の項目名を示す文字列を利用することなく帳票の画像から届出印の印影を抽出する方法として、例えば、ディープラーニング(深層学習)等の物体検出AI(artificial intelligence)技術や本願の出願人による特願2018‐091876号の特許出願に記載の日付印領域特定技術を利用して、届出印の印影を抽出する方法(方法3)も考えられる。
In addition, as a method for extracting the seal imprint of a notification seal from an image of a form without using a character string indicating the item name of the notification seal as in
しかしながら、方法1では、予め届出印欄の位置を定義しておく必要があることから、届出印欄の位置が異なる多種の帳票を扱う場合は、その定義に非常に多くの労力を要することになる。例えば、帳票の1つである口座振替依頼書は、収納機関(支払先)により作成されるものであるから、レイアウトが異なる口座振替依頼書(即ち届出印欄の位置が異なる口座振替依頼書)が多種存在し、届出印欄の位置を個別に定義しておくことは容易ではない。
However, in
方法2では、届出印欄のデザイン性が高い場合に、届出印の項目名を示す文字列を利用して届出印欄の位置を検出することができない場合がある。一般に、届出印欄は、口座番号欄や金額欄等とは異なり、デザイン性が高い傾向にある。図13は、デザイン性が高い届出印欄を例示する図である。図13に例示する届出印欄は、届出印の項目名を示す文字列が白抜きで表された届出印欄である。このような届出印欄の場合は、届出印の項目名を示す文字列を利用して届出印欄の位置を検出することができない場合がある。
In
方法3では、届出印の印影の他に訂正印や検印や見本印等の印影が存在する場合に、一意に届出印の印影を特定することができない。図14は、届出印以外の印影を例示する図である。図14の(a)に例示する印影は検印の印影であり、図14の(b)に例示する印影は見本印の印影である。このように届出印以外の印影も存在する場合は、届出印の印影を一意に特定することができない。
In
本発明は、上記実状に鑑み、届出印欄の位置の事前定義を不要にし、帳票の画像から届出印の印影を抽出することが可能な技術を提供することを目的とする。 In view of the above-mentioned circumstances, it is an object of the present invention to provide a technology that makes it unnecessary to predefine the position of the notification seal column and allows extraction of the impression of the notification seal from the image of the form.
プログラムの一観点は、画像処理プログラムであって、帳票によるサービスを利用する収納機関によって作成された帳票をスキャンすることで生じた画像における届出印の項目名を示すキーワードの領域を検出する第1の検出処理と、前記帳票の画像における印影の領域を検出する第2の検出処理とを実行し、前記第1の検出処理及び前記第2の検出処理の実行結果に基づいて、前記帳票の画像における届出印の印影の領域を特定する処理をコンピュータに実行させることを特徴とし、前記特定する処理は、前記第1の検出処理及び前記第2の検出処理の実行により前記届出印を意味する項目名を示すキーワードの領域が複数検出され且つ前記印影の領域が複数検出された場合に、前記複数のキーワードの領域と前記複数の印影の領域との位置関係に基づいて、前記届出印の、照合される印影の領域を特定することを特徴とする。 One aspect of the program is an image processing program that detects a keyword area indicating the item name of a notification seal in an image generated by scanning a form created by a receiving institution that uses a form-based service. and a second detection process for detecting a seal imprint area in the image of the form, and based on the execution results of the first detection process and the second detection process, the image of the form is The method is characterized by causing a computer to execute a process of specifying the area of the seal impression of the notification seal, and the specifying process means the notification seal by executing the first detection process and the second detection process. When a plurality of keyword areas indicating item names are detected and a plurality of seal imprint areas are detected, based on the positional relationship between the plurality of keyword areas and the plurality of seal imprint areas, the notification seal is It is characterized by specifying the region of the seal impression to be verified .
方法の一観点は、画像処理方法であって、帳票によるサービスを利用する収納機関によって作成された帳票をスキャンすることで生じた画像における届出印の項目名を示すキーワードの領域を検出する第1の検出処理と、前記帳票の画像における印影の領域を検出する第2の検出処理とを実行し、前記第1の検出処理及び前記第2の検出処理の実行結果に基づいて、前記帳票の画像における届出印の印影の領域を特定することを特徴とし、前記特定は、前記第1の検出処理及び前記第2の検出処理の実行により前記届出印を意味する項目名を示すキーワードの領域が複数検出され且つ前記印影の領域が複数検出された場合に、前記複数のキーワードの領域と前記複数の印影の領域との位置関係に基づいて、前記届出印の、照合される印影の領域を特定することを特徴とする。 One aspect of the method is an image processing method in which a first method detects a keyword area indicating the item name of a notification seal in an image generated by scanning a form created by a receiving institution that uses a form-based service. and a second detection process for detecting a seal imprint area in the image of the form, and based on the execution results of the first detection process and the second detection process, the image of the form is The area of the seal imprint of the notification seal is specified , and the identification includes a plurality of areas of keywords indicating item names meaning the notification seal by executing the first detection process and the second detection process . and when a plurality of areas of the seal impression are detected, specifying an area of the seal impression of the notification seal to be verified based on the positional relationship between the area of the plurality of keywords and the area of the plurality of seal impressions. It is characterized by
装置の一観点は、画像処理装置であって、帳票によるサービスを利用する収納機関によって作成された帳票をスキャンすることで生じた画像における届出印の項目名を示すキーワードの領域を検出する第1の検出処理を実行する届出印項目名検出部と、前記帳票の画像における印影の領域を検出する第2の検出処理を実行する印影検出部と、前記第1の検出処理及び前記第2の検出処理の実行結果に基づいて、前記帳票の画像における届出印の印影の領域を特定する届出印印影特定部とを備えることを特徴とし、前記特定は、前記第1の検出処理及び前記第2の検出処理の実行により前記届出印を意味する項目名を示すキーワードの領域が複数検出され且つ前記印影の領域が複数検出された場合に、前記複数のキーワードの領域と前記複数の印影の領域との位置関係に基づいて、前記届出印の、照合される印影の領域を特定することを特徴とする。 One aspect of the device is that it is an image processing device that detects a keyword area indicating the item name of a notification seal in an image generated by scanning a form created by a receiving institution that uses a form-based service. a notification seal item name detection unit that executes a detection process, a seal imprint detection unit that executes a second detection process that detects a seal imprint area in the image of the form, and the first detection process and the second detection process. and a notification seal imprint identification unit that specifies a seal imprint area of a notification seal in the image of the form based on the execution result of the process, and the identification is performed by the first detection process and the second detection process. When a plurality of keyword areas indicating the item name meaning the notification seal are detected by executing the detection process, and a plurality of areas of the seal impression are detected, the area of the plurality of keywords and the area of the plurality of seal impressions are detected. The method is characterized in that an area of the seal imprint of the notification seal to be verified is specified based on the positional relationship of the notification seal.
本発明によれば、届出印欄の位置の事前定義を不要にし、帳票の画像から届出印の印影を抽出することが可能となる。 According to the present invention, there is no need to predefine the position of the notification seal column, and it is possible to extract the impression of the notification seal from the image of the form.
以下、図面を参照しながら本発明の実施の形態について説明する。
図1は、帳票処理システムの構成を例示する図である。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is a diagram illustrating the configuration of a form processing system.
図1に例示する帳票処理システム1は、届出印が押印された帳票を扱うシステムである。帳票処理システム1は、画像処理装置2と、スキャナ装置3と、入力装置4と、表示装置5と、サーバ装置6とを含む。
A
画像処理装置2は、帳票の画像から届出印の印影やその他必要な情報を抽出し、例えば、抽出した届出印の印影と予め登録された届出印の印影との電子的照合を行う。画像処理装置2は、例えば、スキャナ装置3から帳票の画像を取得する。スキャナ装置3は、帳票等の紙媒体をデジタルデータ(画像)に変換する装置である。
The
入力装置4は、画像処理装置2に各種情報を入力する装置である。入力装置4は、例えば、キーボード装置である。表示装置5は、画像処理装置2が行う処理の内容や処理の結果、入力装置4により入力された情報、帳票の画像等の、各種情報を表示する装置である。表示装置5は、例えば、液晶ディスプレイである。
The
サーバ装置6は、画像処理装置2が画像内の文字を認識する際に参照する文字認識辞書と、画像処理装置2が文字の認識結果からキーワードを抽出する際に参照するキーワードテーブルとを保持する装置である。サーバ装置6は、ネットワーク7を介して画像処理装置2と通信可能に接続される。
The
図2は、一実施の形態に係る画像処理装置の機能的構成を例示する図である。
図2に例示するように、画像処理装置2は、スキャナ制御部210と、文字認識処理部220と、文字列抽出部230と、印影検出部240と、届出印印影特定部250と、表示制御部260と、主制御部270とを含む。また、画像処理装置2は、図示していない記憶部を含む。
FIG. 2 is a diagram illustrating a functional configuration of an image processing apparatus according to an embodiment.
As illustrated in FIG. 2, the
スキャナ制御部210は、スキャナ装置3から帳票の画像を取得する処理を制御する。
文字認識処理部220は、サーバ装置6が保持する文字認識辞書610を参照して、帳票の画像に含まれる文字を認識する。
The
The character
文字列抽出部230は、サーバ装置6が保持するキーワードテーブル620を参照して、文字認識処理部220による文字の認識結果から、項目名を示すキーワード(文字列)を抽出する。キーワードテーブル620には、予め、項目名を示すキーワードとなり得る文字列が登録されている。例えば、口座番号の項目名を示すキーワードとなり得る文字列として「口座番号」、「口座」、「口座振込番号」等が登録され、届出印の項目名を示すキーワードとなり得る文字列として「届出印」、「お届け印」、「登録印」等が登録されている。
The character
また、文字列抽出部230は、文字認識処理部220による文字の認識結果から、項目名を示すキーワード(例えば「口座番号」)に対する内容の文字列(例えば「1234567」)を抽出する。
Further, the character
また、文字列抽出部230は、届出印項目名検出部231を含む。
届出印項目名検出部231は、帳票の画像における届出印の項目名を示すキーワードの領域(例えばキーワードを含む矩形領域)を検出する第1の検出処理を実行する。第1の検出処理は、例えば、既存の技術を利用して行われる。
Further, the character
The notification seal item
印影検出部240は、帳票の画像における印影の領域(例えば印影を含む矩形領域)を検出する第2の検出処理を実行する。第2の検出処理は、例えば、ディープラーニング等の物体検出AI技術や本願の出願人による特願2018‐091876号の特許出願に記載の日付印領域特定技術を利用して行われる。
The seal
届出印印影特定部250は、届出印項目名検出部231による第1の検出処理及び印影検出部240による第2の検出処理の実行結果に基づいて、帳票の画像における届出印の印影の領域を特定する。例えば、届出印項目名検出部231による第1の検出処理及び印影検出部240による第2の検出処理の実行により、届出印の項目名を示すキーワードの領域が1つ以上検出され且つ印影の領域が1つ以上検出された場合は、届出印の項目名を示すキーワードの領域と印影の領域との位置関係に基づいて、届出印の印影の領域を特定する。この場合の特定では、例えば、所定条件を満たす印影の領域を、届出印の印影の領域として特定する。所定条件は、例えば、届出印の項目名を示すキーワードの領域の右側又は下側に存在し且つキーワードの領域との距離が所定値以下であるという条件や、届出印の項目名を示すキーワードの領域の右側又は下側に存在し且つキーワードの領域との距離が所定値以下であり且つ領域サイズが所定サイズより大きいという条件である。また、例えば、届出印項目名検出部231による第1の検出処理及び印影検出部240による第2の検出処理の実行により、印影の領域が1つだけ検出された場合は、その印影の領域を、届出印の印影の領域として特定する。
The notification seal
表示制御部260は、表示装置5の表示を制御する。例えば、表示制御部260は、帳票の画像に対する処理の結果を含む画面データを生成し、該画面データを表示装置5に表示(出力)させる。
The
主制御部270は、スキャナ制御部210、文字認識処理部220、文字列抽出部230、印影検出部240、届出印印影特定部250、及び表示制御部260が行う一連の処理を制御する。
The
図3は、一実施の形態に係る画像処理を例示するフローチャートである。図4は、一実施の形態に係る画像処理の具体例を模式的に示す図である。 FIG. 3 is a flowchart illustrating image processing according to one embodiment. FIG. 4 is a diagram schematically showing a specific example of image processing according to an embodiment.
画像処理装置2は、帳票から必要な情報を抽出するための画像処理を開始すると、図3に例示するように、まず、帳票の画像を取得する(S1)。S1の処理は、スキャナ制御部210が行う。
When the
次に、画像処理装置2は、サーバ装置6が保持する文字認識辞書610を参照して、帳票の画像に含まれる文字を認識する(S2)。S2の処理は、文字認識処理部220が行う。
Next, the
次に、画像処理装置2は、サーバ装置6が保持するキーワードテーブル620を参照して、文字の認識結果から、項目名を示すキーワードを抽出すると共に、帳票の画像における届出印の項目名を示すキーワードの領域を検出する第1の検出処理を実行する(S3)。S3の処理は、文字列抽出部230が行い、特に、S3の処理のうち第1の検出処理は文字列抽出部230に含まれる届出印項目名検出部231が行う。
Next, the
次に、画像処理装置2は、文字の認識結果から、項目名を示すキーワードに対する内容の文字列を抽出する(S4)。S4の処理は、文字列抽出部230が行う。
Next, the
次に、画像処理装置2は、帳票の画像における印影の領域を検出する第2の検出処理を実行すると共に、第1の検出処理及び第2の検出処理の実行結果に基づいて、帳票の画像における届出印の印影の領域を特定する(S5)。S5の処理は、印影検出部240と届出印印影特定部250が行う。
Next, the
次に、画像処理装置2は、項目名毎の処理結果を表示装置5に表示させる(S6)。例えば、届出印の項目名の処理結果として、特定した届出印の印影の領域を示す座標(例えば、その印影を含む矩形領域の対角の2点の座標)を表示させ、届出印以外の項目名の処理結果として、項目名を示すキーワードに対する内容の文字列と、その文字列の領域を示す座標(例えば、その文字列を含む矩形領域の対角の2点の座標)とを表示させる。S6の処理は、表示制御部260が行う。
Next, the
このような画像処理に従えば、例えば、S1の処理では、図4の(a)に模式的に示すような帳票の画像8が取得される。帳票の画像8は、口座番号の項目名を示すキーワード(「口座番号」)の領域801と、口座番号の項目名を示すキーワードに対する内容の文字列(「1234567」)の領域802と、届出印の項目名を示すキーワード(「届出印」)の領域803、804、805と、届出印が押印された印影の領域806と、届出印以外の印(例えば訂正印)が押印された印影の領域807とを含む。届出印の項目名を示すキーワードの領域803、804、805において、領域803は、本来の届出印の項目名を示すキーワードの領域を示し、領域804、805は、説明文等に含まれる届出印の項目名を示すキーワードの領域を示す。
According to such image processing, for example, in the process of S1, an
その後、S3の処理では、図4の(b)に模式的に示すように、帳票の画像8において、領域801に含まれる文字列(「口座番号」)が、口座番号の項目名を示すキーワードとして抽出され、領域803、804、805に含まれる文字列(「届出印」)が、届出印の項目名を示すキーワードとして抽出され、領域803、804、805が、届出印の項目名を示すキーワードの領域として検出される。
Thereafter, in the process of S3, as schematically shown in FIG. The character string (``notification seal'') contained in
その後、S4及びS5の処理では、図4の(c)に模式的に示すように、帳票の画像8において、領域802に含まれる文字列(「1234567」)が、口座番号の項目名を示すキーワードに対する内容の文字列として抽出され、領域806が、届出印の印影の領域として特定される。
Thereafter, in the processes of S4 and S5, as schematically shown in FIG. The character string corresponding to the keyword is extracted, and the
その後、S6の処理では、図4の(d)に示すように、項目名毎の処理結果(内容、座標)が表示装置5に表示される。例えば、口座番号の項目名の処理結果として、口座番号の項目名を示すキーワードに対する内容の文字列(「1234567」)と、その文字列の領域の座標(「(x1,y1,x2,y2)」)が表示され、届出印の項目名の処理結果として、届出印の印影の領域の座標(「(x3,y3,x4,y4)」)が表示される。なお、届出印の項目名を示すキーワードに対する内容の文字列は、元々存在しないため、届出印の項目名の処理結果には含まれない。
Thereafter, in the process of S6, the processing results (contents, coordinates) for each item name are displayed on the
図5は、S5の処理の詳細を例示するフローチャートである。図6は、S5の処理の具体例を模式的に示す図である。 FIG. 5 is a flowchart illustrating details of the process in S5. FIG. 6 is a diagram schematically showing a specific example of the process of S5.
図5に例示するように、S5の処理が開始されると、まず、印影検出部240は、帳票の画像における印影の領域を検出する第2の検出処理を実行する(S51)。なお、S51の処理で検出する印影の領域は、帳票の画像における届出印の印影の領域の候補でもある。
As illustrated in FIG. 5, when the process of S5 is started, first, the seal
次に、届出印印影特定部250は、印影検出部240による第2の検出処理の実行により印影の領域が複数検出されたか否かを判定する(S52)。
Next, the notification seal
S52の判定結果がYESの場合、届出印印影特定部250は、届出印項目名検出部231による第1の検出処理及び印影検出部240による第2の検出処理の実行結果に基づいて、帳票の画像における届出印の印影の領域を特定し(S53)、特定した届出印の印影の領域を示す座標を主制御部270に出力する(S54)。但し、S53の処理で届出印の印影の領域を特定できなかった場合は座標の出力を行わない。
If the determination result in S52 is YES, the notification seal
一方、S52の判定結果がNOの場合、届出印印影特定部250は、印影検出部240による第2の検出処理の実行により検出された印影の領域の数が1個であるか0個であるかに応じて次の処理を行う(S54)。検出された印影の領域の数が1個である場合は、その印影の領域を、帳票の画像における届出印の印影の領域として特定し、特定した届出印の印影の領域を示す座標を主制御部270に出力する。一方、検出された印影の領域の数が0個である場合は、帳票の画像に届出印の印影の領域が無いとして、座標の出力を行わない。
On the other hand, if the determination result in S52 is NO, the notification seal
このような図5に例示する処理に従えば、例えば、S51の処理では、図6の(a)に模式的に示すように、帳票の画像8における領域806、807が、印影の領域として検出される。
According to the process illustrated in FIG. 5, for example, in the process of S51,
その後、S53の処理では、図6の(b)に模式的に示すように、帳票の画像8における領域806が、届出印の印影の領域として特定される。
Thereafter, in the process of S53, as schematically shown in FIG. 6(b), an
その後、S54の処理では、図6の(c)に示すように、特定された届出印の印影の領域を示す座標(「(x3,y3,x4,y4)」)が主制御部270に出力される。 Thereafter, in the process of S54, as shown in FIG. be done.
図7は、S51の処理の詳細を例示するフローチャートである。図8及び図9は、S51の処理の具体例を模式的に示す図である。 FIG. 7 is a flowchart illustrating details of the process in S51. FIGS. 8 and 9 are diagrams schematically showing a specific example of the process of S51.
S51の処理を行う印影検出部240は、上述のとおり、第2の検出処理を、例えば、ディープラーニング等の物体検出AI技術や、本願の出願人による特願2018‐091876号の特許出願に記載の日付印領域特定技術を利用して行う。ここでは、ディープラーニング等の物体検出AI技術を利用して行う場合を例に説明する。
As described above, the seal
図7に例示するように、S51の処理が開始されると、印影検出部240は、まず、学習済みのニューラルネットワークモデルに適合するように、帳票の画像をサイズ変換する(S511)。学習済みのニューラルネットワークモデルは、所定サイズの画像の入力に対して、その画像におけるオブジェクトの領域を示す座標と、そのオブジェクトの印影らしさを表す特徴量とを出力する。オブジェクトの領域は、ひとまとまりの物体として判定された領域である。
As illustrated in FIG. 7, when the process of S51 is started, the seal
次に、印影検出部240は、学習済みニューラルネットワークモデルを読み込む(S512)。学習済みニューラルネットワークモデルは、画像処理装置2が備える記憶部(図示せず)か、サーバ装置6で管理することができる。
Next, the seal
次に、印影検出部240は、サイズ変換した帳票の画像を、読み込んだニューラルネットワークモデルに入力して、その出力であるオブジェクトの領域を示す座標と印影らしさを表す特徴量とを取得する(S513)。
Next, the seal
次に、印影検出部240は、取得したオブジェクトの領域を示す座標と印影らしさを表す特徴量とから、印影らしさを表す特徴量が所定値を超えるオブジェクトの領域を示す座標を、印影の領域を示す座標として判定する(S514)。
Next, the seal
次に、印影検出部240は、サイズ変換した帳票の画像を元のサイズにサイズ変換して、印影の領域を示す座標として判定したオブジェクトの領域を示す座標を、元のサイズにサイズ変換した帳票の画像における座標に変換する(S515)。
Next, the seal
次に、印影検出部240は、変換した座標を、帳票の画像における印影の領域(届出印の印影の領域候補)を示す座標として主制御部270に出力する(S516)。
Next, the seal
印影検出部240は、このようにして帳票の画像における印影の領域を検出し、その領域を示す座標を出力する。
In this way, the seal
このような図7に例示する処理に従えば、例えば、S511の処理では、図8の(a)に模式的に示すように、帳票の画像8が、学習済みニューラルネットワークモデルに適合したサイズ(ここでは512ピクセル×512ピクセルのサイズ)にサイズ変換される。 According to the process illustrated in FIG. 7, for example, in the process of S511, as schematically shown in FIG. Here, the size is converted to a size of 512 pixels x 512 pixels).
その後、S513の処理では、図8の(b)に模式的に示すように、サイズ変換後の帳票の画像8aが、学習済みニューラルネットワークモデル9に入力されて、その出力であるオブジェクトの領域を示す座標と印影らしさを表す特徴量とが取得される。図8の(b)では、オブジェクトの領域の座標として、領域808、809、810、811、812、813、814の各領域の座標が取得される。また、図8の(b)では省略しているが、S513の処理を行うことにより、領域808、809、810、811、812、813、814の各領域のオブジェクトに対する、印影らしさを表す特徴量が取得される。
Thereafter, in the process of S513, as schematically shown in FIG. The indicated coordinates and the feature amount representing the seal imprint-likeness are acquired. In FIG. 8B, the coordinates of
その後、S514の処理では、図9の(a)に模式的に示すように、印影らしさを表す特徴量が所定値(ここでは0.9)を超えるオブジェクトの領域811、812を示す座標が、印影の領域を示す座標として判定される。なお、特徴量の値は、オブジェクトが印影に類似するほど1に近づく値である。 Thereafter, in the process of S514, as schematically shown in FIG. It is determined as the coordinates indicating the area of the seal impression. Note that the value of the feature amount approaches 1 as the object becomes more similar to the seal impression.
その後、S515の処理では、図9の(b)に模式的に示すように、サイズ変換された帳票の画像8aが元のサイズにサイズ変換され、印影の領域を示す座標として判定されたオブジェクトの領域811、812を示す座標が、元のサイズにサイズ変換された帳票の画像8における座標に変換される。これにより、変換後の座標として、帳票の画像8における領域806、807を示す座標が取得される。
Thereafter, in the process of S515, as schematically shown in FIG. 9(b), the size-converted
その後、S516の処理では、図9の(c)に示すように、変換後の座標である、領域806を示す座標(「(x3,y3,x4,y4)」)と領域807を示す座標(「(x5,y5,x6,y6)」)が、帳票の画像8における印影の領域(届出印の印影の領域候補)を示す座標として主制御部270に出力される。
Thereafter, in the process of S516, as shown in FIG. "(x5, y5, x6, y6)") is output to the
図10は、S53の処理の詳細を例示するフローチャートである。図11は、S53の処理の具体例を模式的に示す図である。 FIG. 10 is a flowchart illustrating details of the process of S53. FIG. 11 is a diagram schematically showing a specific example of the process of S53.
図10に例示するように、S53の処理が開始されると、届出印印影特定部250は、まず、届出印項目名検出部231により検出された届出印の項目名を示すキーワードの領域を示す座標と、印影検出部240により検出された印影の領域を示す座標を、帳票の画像に対応する座標系にマッピングする(S531)。すなわち、届出印の項目名を示すキーワードの領域と印影の領域とをマッピングする。
As illustrated in FIG. 10, when the process of S53 is started, the notification seal
次に、届出印印影特定部250は、マッピングした届出印の項目名を示すキーワードの領域と印影の領域との位置関係に基づいて、届出印の印影の領域を特定する(S532)。この特定では、例えば、所定条件を満たす印影の領域を、届出印の印影の領域として特定する。所定条件は、例えば、届出印の項目名を示すキーワードの領域の右側又は下側に存在し且つキーワードの領域との距離が所定値以下であるという条件や、届出印の項目名を示すキーワードの領域の右側又は下側に存在し且つキーワードの領域との距離が所定値以下であり且つ領域サイズが所定サイズより大きいという条件である。
Next, the notification seal
次に、届出印印影特定部250は、帳票の画像における、特定した届出印の印影の領域を示す座標を主制御部270に出力する(S533)。
Next, the notification seal
このような図10に例示する処理に従えば、例えば、S531の処理では、図11の(a)に模式的に示すように、帳票の画像8に対応する座標系10に、届出印の項目名を示すキーワードの領域101、102、103と、印影の領域104、105とがマッピングされる。
According to the process illustrated in FIG. 10, for example, in the process of S531, as schematically shown in FIG.
その後、S532の処理では、印影の領域104,105のうち、図11の(b)に示すような所定条件を満たす印影の領域104が、届出印の印影の領域として特定される。図11の(b)に示す所定条件は、届出印の項目名を示すキーワードの領域の右側又は下側に存在し、且つ、届出印の項目名を示すキーワードの領域との距離が所定値以下(ここでは1cm以下)であり、且つ、領域サイズが所定サイズ(ここでは2.4cm×2.4cmのサイズ)より大きいという条件である。なお、届出印の項目名を示すキーワードの領域との距離が所定値以下とは、例えば、届出印の項目名を示すキーワードの領域の基準点と印影の領域の基準点との距離が所定値以下ということである。基準点は、例えば、領域の中心点である。
Thereafter, in the process of S532, among the
その後、S533の処理では、図11の(c)に示すように、特定された届出印の印影の領域(ここでは領域104(領域806に対応))を示す座標(「(x3,y3,x4,y4)」)が主制御部270に出力される。
Thereafter, in the process of S533, as shown in FIG. 11(c), the coordinates ("(x3, y3, x4 , y4)'') are output to the
以上のように、画像処理装置2が行う画像処理によれば、帳票の画像における届出印の項目名を示すキーワードの領域と印影の領域とを検出する処理を実行し、その処理結果に基づいて、帳票の画像における届出印の印影の領域を特定するようにしたので、届出印欄の位置の事前定義を不要にし、届出印の印影の抽出が可能になる。また、届出印の印影の他に訂正印や検印や見本印等の印影を含む帳票の画像に対しても、届出印の印影の領域を特定することができ、届出印の印影の抽出が可能になる。さらに、デザイン性が高い届出印欄を含む帳票の画像に対しては、届出印の項目名を示すキーワードの領域が検出されなかったとしても印影の領域が1つだけ検出されれば、その印影の領域を届出印の印影の領域として特定するようにしたので、届出印の印影の抽出が可能になる。
As described above, according to the image processing performed by the
なお、画像処理装置2の機能的構成は、図2に例示した構成に限らず、適宜変更可能である。例えば、文字認識処理部220が参照する文字認識辞書610と文字列抽出部230が参照するキーワードテーブル620の一方又は両方を、画像処理装置2が備える記憶部(図示しない)で管理することも可能である。また、画像処理装置2は、例えば、メモリカードや光ディスク等の可搬型記録媒体、或いはネットワークを介して提供される帳票の画像を取得して上記の画像処理を行えるようにしてもよい。
Note that the functional configuration of the
加えて、画像処理装置2は、コンピュータと、該コンピュータに実行させるプログラムとにより実現可能である。以下、コンピュータとプログラムとにより実現される画像処理装置2について、図12を参照して説明する。
In addition, the
図12は、コンピュータのハードウェア構成を例示する図である。
図12に例示するように、コンピュータ11は、CPU(Central Processing Unit)1101と、メモリ1102と、補助記憶装置1103と、入力装置1104と、表示装置1105とを備える。また、コンピュータ11は、入出力インタフェース1106と、通信制御装置1107と、媒体駆動装置1108とを備える。コンピュータ11におけるこれらの要素1101~1108は、バス1109により相互に接続されており、要素間でのデータの受け渡しが可能になっている。
FIG. 12 is a diagram illustrating the hardware configuration of a computer.
As illustrated in FIG. 12, the
CPU1101は、オペレーティングシステムを含む各種のプログラムを実行することによりコンピュータ11の全体の動作を制御する。例えば、CPU1101は、図3~図11を用いて説明した各処理を含む画像処理プログラムを実行する。
The
メモリ1102は、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を含む。メモリ1102のROMには、例えば、コンピュータ11の起動時にCPU1101が読み出す所定の基本制御プログラム等が予め記録されている。また、メモリ1102のRAMは、CPU1101が、各種のプログラムを実行する際に必要に応じて作業用記憶領域として使用する。メモリ1102のRAMは、例えば、帳票の画像、届出印の項目名を示すキーワードの領域を示す座標、印影の領域を示す座標等の一時的な記憶に利用可能である。
The
補助記憶装置1103は、例えば、HDD(Hard Disk Drive)等の磁気ディスク、及びフラッシュメモリ等の不揮発性メモリである。補助記憶装置1103には、CPU1101によって実行される各種のプログラムや各種のデータ等を記憶させることができる。補助記憶装置1103は、例えば、上述の画像処理プログラム等の記憶に利用可能である。また、補助記憶装置1103は、例えば、帳票の画像、項目名毎の処理結果等の記憶に利用可能である。
The
入力装置1104は、例えば、キーボード装置、マウス装置、及びタッチパネル装置等である。コンピュータ11のオペレータが入力装置1104に対し所定の操作を行うと、入力装置1104は、その操作内容に対応付けられている入力情報をCPU1101に送信する。入力装置1104は、図1の帳票処理システム1における入力装置4に相当する。
The
表示装置1105は、例えば、液晶表示装置である。表示装置1105は、例えば、コンピュータ11の動作状態や、帳票の画像、項目名毎の処理結果等の表示に利用可能である。表示装置1105は、図1の帳票処理システム1における表示装置5に相当する。
The
入出力インタフェース1106は、コンピュータ11と、電子部品や他の電子装置(例えばスキャナ装置3)等とを接続する。入出力インタフェース1106は、例えば、USB(Universal Serial Bus)規格のコネクタを備えたフラッシュメモリの接続にも利用可能である。
The input/
通信制御装置1107は、コンピュータ11をネットワークに接続し、ネットワークを介したコンピュータ11と他の電子機器との各種通信を制御する装置である。通信制御装置1107は、例えば、図1の帳票処理システム1におけるサーバ装置6が保持している文字認識辞書やキーワードテーブルを参照することに利用可能である。
The
媒体駆動装置1108は、可搬型記録媒体12に記録されているプログラムやデータの読み出し、補助記憶装置1103に記憶されたデータ等の可搬型記録媒体12への書き込みを行う。可搬型記録媒体12としては、例えば、Secure Digital(SD)規格のメモリカード(フラッシュメモリ)がある。可搬型記録媒体12は、上記の画像処理プログラム、帳票の画像、項目名毎の処理結果等の記憶に利用可能である。また、コンピュータ11が媒体駆動装置1108として利用可能な光ディスクドライブを搭載している場合、当該光ディスクドライブで認識可能な各種の光ディスクを可搬型記録媒体12として利用可能である。可搬型記録媒体12として利用可能な光ディスクには、例えば、Compact Disc(CD)、Digital Versatile Disc(DVD)、Blu-ray Disc(Blu-rayは登録商標)等がある。
The
コンピュータ11は、オペレータが入力装置1104を操作して画像処理プログラムの開始命令を入力すると、CPU1101が補助記憶装置1103等から上述の画像処理プログラムを読み出して実行する。画像処理プログラムを実行している間、CPU1101は、図2に例示した画像処理装置2における文字認識処理部220、届出印項目名検出部231を含む文字列抽出部230、印影検出部240、届出印印影特定部250、及び表示制御部260として機能(動作)する。また、帳票の画像をスキャナ装置3から取得する場合、CPU1101及び入出力インタフェース1106は、図2に例示した画像処理装置2におけるスキャナ制御部210として機能する。また、コンピュータ11とは別のサーバ装置6等が保持している文字認識辞書610を参照して文字を認識する場合、通信制御装置1107が文字認識処理部220の持つ機能の一部を担う。更に、コンピュータ11とは別のサーバ装置6等が保持しているキーワードテーブル620を参照してキーワードの抽出を行う場合、通信制御装置1107が文字列抽出部230の持つ機能の一部を担う。
In the
なお、画像処理装置2として動作させるコンピュータ11は、図12に例示した要素1101~1108の全てを含む必要はなく、用途や条件に応じて一部の要素を省略することも可能である。例えば、コンピュータ11は、媒体駆動装置1108や通信制御装置1107が省略されたものであってもよい。
Note that the
以上、本発明の実施の形態を説明したが、本発明は、上述した実施の形態に限定されることなく、本発明の要旨を逸脱しない範囲内で種々の改良・変更が可能である。 Although the embodiments of the present invention have been described above, the present invention is not limited to the embodiments described above, and various improvements and changes can be made without departing from the gist of the present invention.
1 帳票処理システム
2 画像処理装置
3 スキャナ装置
4 入力装置
5 表示装置
6 サーバ装置
7 ネットワーク
8、8a 画像
9 ニューラルネットワークモデル
10 座標系
11 コンピュータ
12 可搬型記録媒体
101、102、103、104、105 領域
210 スキャナ制御部
220 文字認識処理部
230 文字列抽出部
231 届出印項目名検出部
240 印影検出部
250 届出印印影特定部
260 表示制御部
270 主制御部
610 文字認識辞書
620 キーワードテーブル
801、802、803、804、805 領域
806、807、808、809、810 領域
811、812、813、814 領域
1101 CPU
1102 メモリ
1103 補助記憶装置
1104 入力装置
1105 表示装置
1106 入出力インタフェース
1107 通信制御装置
1108 媒体駆動装置
1109 バス
1
1102
Claims (7)
前記第1の検出処理及び前記第2の検出処理の実行結果に基づいて、前記帳票の画像における届出印の印影の領域を特定する
処理をコンピュータに実行させる画像処理プログラムであって
前記特定する処理は、前記第1の検出処理及び前記第2の検出処理の実行により前記届出印を意味する項目名を示すキーワードの領域が複数検出され且つ前記印影の領域が複数検出された場合に、前記複数のキーワードの領域と前記複数の印影の領域との位置関係に基づいて、前記届出印の、照合される印影の領域を特定することを特徴とする画像処理プログラム。 A first detection process for detecting a keyword area indicating an item name of a notification seal in an image generated by scanning a form created by a receiving institution that uses a form-based service ; and a seal imprint area in the image of the form. a second detection process for detecting the
An image processing program that causes a computer to execute a process of specifying an area of a seal imprint of a notification seal in an image of the form based on the execution results of the first detection process and the second detection process, the process of specifying. is, when a plurality of keyword areas indicating the item name meaning the notification seal are detected by executing the first detection process and the second detection process, and a plurality of areas of the seal imprint are detected, the plurality of areas of the seal impression are detected . An image processing program that specifies a region of a seal impression of the notification seal to be verified based on a positional relationship between a keyword region and the plurality of seal impression regions.
ことを特徴とする請求項1記載の画像処理プログラム。 The image processing program according to claim 1, wherein the identifying process identifies an area of the seal impression that satisfies a predetermined condition as an area of the seal impression of the notification seal.
ことを特徴とする請求項2記載の画像処理プログラム。 3. The image processing program according to claim 2, wherein the predetermined condition is a condition that the keyword exists on the right side or below the keyword area and that a distance from the keyword area is equal to or less than a predetermined value.
ことを特徴とする請求項2記載の画像処理プログラム。 The predetermined condition is that the seal imprint exists on the right side or below the keyword area, the distance from the keyword area is less than or equal to a predetermined value, and the area size of the seal imprint is larger than the predetermined size. The image processing program according to claim 2.
ことを特徴とする請求項1記載の画像処理プログラム。 The identifying process includes, when only one seal imprint area is detected by executing the first detection process and the second detection process, determining the seal imprint area as the seal imprint area of the notification seal. The image processing program according to claim 1, characterized in that:
前記第1の検出処理及び前記第2の検出処理の実行結果に基づいて、前記帳票の画像における届出印の印影の領域を特定する
画像処理方法であって
前記特定は、前記第1の検出処理及び前記第2の検出処理の実行により前記届出印を意味する項目名を示すキーワードの領域が複数検出され且つ前記印影の領域が複数検出された場合に、前記複数のキーワードの領域と前記複数の印影の領域との位置関係に基づいて、前記届出印の、照合される印影の領域を特定することを特徴とする画像処理方法。 A first detection process for detecting a keyword area indicating an item name of a notification seal in an image generated by scanning a form created by a receiving institution that uses a form-based service ; and a seal imprint area in the image of the form. a second detection process for detecting the
An image processing method that specifies an area of a seal imprint of a notification seal in an image of the form based on the execution results of the first detection process and the second detection process, wherein the identification is performed in the first detection process. and when a plurality of keyword areas indicating the item name meaning the notification seal are detected by executing the second detection process, and a plurality of areas of the seal imprint are detected, the plurality of keyword areas and the plurality of keyword areas are detected. An image processing method characterized by specifying an area of a seal imprint of the notification seal to be verified based on a positional relationship with an area of the seal imprint .
前記帳票の画像における印影の領域を検出する第2の検出処理を実行する印影検出部と、
前記第1の検出処理及び前記第2の検出処理の実行結果に基づいて、前記帳票の画像における届出印の印影の領域を特定する届出印印影特定部と
を備える画像処理装置であって
前記特定は、前記第1の検出処理及び前記第2の検出処理の実行により前記届出印を意味する項目名を示すキーワードの領域が複数検出され且つ前記印影の領域が複数検出された場合に、前記複数のキーワードの領域と前記複数の印影の領域との位置関係に基づいて、前記届出印の、照合される印影の領域を特定することを特徴とする画像処理装置。 a notification seal item name detection unit that executes a first detection process of detecting a keyword area indicating the item name of the notification seal in an image generated by scanning a form created by a receiving institution that uses the form-based service; ,
a seal imprint detection unit that performs a second detection process for detecting a seal imprint area in the image of the form;
an image processing apparatus, comprising: a notification seal imprint identifying section that specifies a seal imprint area of a notification seal in the image of the form based on the execution results of the first detection process and the second detection process; is, when a plurality of keyword areas indicating the item name meaning the notification seal are detected by executing the first detection process and the second detection process, and a plurality of areas of the seal imprint are detected, the plurality of areas of the seal impression are detected . An image processing apparatus characterized in that a region of a seal impression of the notification seal to be verified is specified based on a positional relationship between a keyword region and the plurality of seal impression regions.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019125556A JP7445364B2 (en) | 2019-07-04 | 2019-07-04 | Image processing program, image processing method, and image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019125556A JP7445364B2 (en) | 2019-07-04 | 2019-07-04 | Image processing program, image processing method, and image processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021012487A JP2021012487A (en) | 2021-02-04 |
JP7445364B2 true JP7445364B2 (en) | 2024-03-07 |
Family
ID=74227379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019125556A Active JP7445364B2 (en) | 2019-07-04 | 2019-07-04 | Image processing program, image processing method, and image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7445364B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4163211B2 (en) * | 2005-12-28 | 2008-10-08 | 富士通株式会社 | Image processing method and image processing apparatus |
JP5500480B2 (en) * | 2010-06-24 | 2014-05-21 | 株式会社日立情報通信エンジニアリング | Form recognition device and form recognition method |
JP5593966B2 (en) * | 2010-08-27 | 2014-09-24 | 沖電気工業株式会社 | Seal verification device |
-
2019
- 2019-07-04 JP JP2019125556A patent/JP7445364B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2021012487A (en) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016048444A (en) | Document identification program, document identification device, document identification system, and document identification method | |
JP2008204226A (en) | Form recognition device and its program | |
JP2008145611A (en) | Information processor and program | |
JP2010157107A (en) | Business document processor | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP5566971B2 (en) | Information processing program, information processing apparatus, and character recognition method | |
JP7445364B2 (en) | Image processing program, image processing method, and image processing device | |
WO2004068407A1 (en) | Method for supporting data linkage between applications | |
JP2018045359A (en) | Image processing device and image processing program | |
JP5483467B2 (en) | Form reader, square mark detection method, and square mark detection program | |
JP5481965B2 (en) | Information processing apparatus and information processing program | |
JP4935459B2 (en) | Character recognition method, character recognition program, and character recognition device | |
TWM626292U (en) | Business-oriented key item key-value identification system | |
JP7328797B2 (en) | Terminal device, character recognition system and character recognition method | |
JP6682827B2 (en) | Information processing apparatus and information processing program | |
JP2009182530A (en) | Business processing execution support device | |
JP4535176B2 (en) | Work control program and work control system | |
JP2017021654A (en) | Document management server and system | |
US9661179B2 (en) | Image processing device, information processing method, and non-transitory computer-readable medium | |
JP6241311B2 (en) | Image processing apparatus and image processing program | |
JP5924035B2 (en) | Information processing apparatus and information processing program | |
JP7329331B2 (en) | Apparatus, method, and program for recognizing character strings contained in forms | |
JP5521530B2 (en) | Information processing apparatus, information processing system, information processing method, program, and storage medium | |
JP3006294B2 (en) | Optical character reader | |
JP2012248948A (en) | Device and method for supporting slip check and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210909 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230622 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230630 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20230810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231220 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20231220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7445364 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |