JP2012234344A - Character recognition device for recognizing character on business form, mask processing method, and mask processing program - Google Patents

Character recognition device for recognizing character on business form, mask processing method, and mask processing program Download PDF

Info

Publication number
JP2012234344A
JP2012234344A JP2011102221A JP2011102221A JP2012234344A JP 2012234344 A JP2012234344 A JP 2012234344A JP 2011102221 A JP2011102221 A JP 2011102221A JP 2011102221 A JP2011102221 A JP 2011102221A JP 2012234344 A JP2012234344 A JP 2012234344A
Authority
JP
Japan
Prior art keywords
mask
character string
character
headline
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011102221A
Other languages
Japanese (ja)
Other versions
JP5661549B2 (en
Inventor
Masaaki Ozawa
昌昭 小澤
Hirotaka Inoue
博貴 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2011102221A priority Critical patent/JP5661549B2/en
Publication of JP2012234344A publication Critical patent/JP2012234344A/en
Application granted granted Critical
Publication of JP5661549B2 publication Critical patent/JP5661549B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Facsimile Transmission Control (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a character recognition device capable of specifying a region from a data section to perform masking in the character recognition device for recognizing characters on a business form and mapping a headline included in the business form with the data section corresponding to characters (character string) written or printed on the business form.SOLUTION: The recommended character recognition device includes: a character string recognition part for recognizing a character string from a business form image obtained by reading a business form; a headline specification part for specifying a character string corresponding to a headline from the recognized character string, on the basis of headline definition information having a character string corresponding to a headline and a data property of a character string that should be printed or written on a data section that is a corresponding frame; a data section specification part for specifying the data section as a frame in which a character string that should be mapped with the specified headline exists; and a mask region calculation part for calculating a region that should be masked, on the basis of mask definition information having a headline that should be masked and a mask method and recognition result information corresponding to a character string of the specified data section.

Description

本発明は、任意フォーマットの帳票を読み込んで帳票画像として電子化し、その帳票画像上の文字を認識し、その帳票画像に含まれる見出しと、帳票上に記入または印字された文字(文字列、データ)に対応する枠としてのデータ部との対応付けを行う文字認識装置における、データの一部または全部をマスクするマスク処理技術に関する。   The present invention reads a form in an arbitrary format, digitizes it as a form image, recognizes characters on the form image, and includes a headline included in the form image and characters entered or printed on the form (character string, data) The present invention relates to a mask processing technique for masking part or all of data in a character recognition apparatus that associates with a data portion as a frame corresponding to ().

金融機関等で使用する帳票に印字または記入された文字(文字列)を認識する文字認識装置がある。
帳票として、図23に示す振込依頼書を例にとる。この振込依頼書は、見出し部分の文字列と、データ部分の文字列とを有する単票形式の帳票で、見出し部分の文字列として、銀行名、支店名、種目、口座番号、受取人名、振込金額、等があり、これらの見出し部分に対応するデータ部分は、各見出し部分の隣接する枠にある。図23の振込依頼書では、見出し部分“金額”に対し、データ部“1335776”が記入されており、見出し部分“整理番号”に対し、データ部“012345678”が印字されている。
2. Description of the Related Art There is a character recognition device that recognizes characters (character strings) printed or entered on a form used in a financial institution or the like.
As a form, the transfer request form shown in FIG. 23 is taken as an example. This transfer request form is a single-form form that has a character string of the heading part and a character string of the data part. As the character string of the heading part, the bank name, branch name, item, account number, recipient name, transfer There are amounts of money, etc., and the data portions corresponding to these heading portions are in a frame adjacent to each heading portion. In the transfer request form of FIG. 23, the data part “1357777” is entered for the heading part “amount”, and the data part “012345678” is printed for the heading part “reference number”.

混同しないために、用語の使用法を統一しておく。罫線で囲まれた枠を「セル」と呼ぶ。「見出し」とは帳票上のプレプリント文字の文字列であり、その見出しに対応する印字または記入欄があるもののことをいう。「見出し部」とは見出しが含まれるセル(文字枠)のことである。「データ部」とは、見出しに対応する印字または記入欄に相当するセル(文字枠)である。「データ」と単にいうとき、この「データ部」内に印字または記入された文字列を指すことがある。   Keep terminology consistent so that it is not confused. A frame surrounded by ruled lines is called a “cell”. “Heading” is a character string of pre-printed characters on a form, which means that there is a print or entry field corresponding to the heading. “Heading part” is a cell (character frame) including a heading. The “data portion” is a cell (character frame) corresponding to a print or entry column corresponding to the heading. When simply referred to as “data”, it may indicate a character string printed or entered in the “data portion”.

図23の振込依頼書をスキャナ等の入力装置から読み込むことで、帳票を画像化し、図24に示すように、その画像を用い、あらかじめ定義した定義領域(文字枠(帳票上で文字が印字または記入される枠))に対し文字認識処理(OCR処理)をかけ、文字認識結果を出力する。これが、帳票に対する文字認識の一般的な処理方法である。   By reading the transfer request form of FIG. 23 from an input device such as a scanner, the form is imaged, and as shown in FIG. 24, the image is used to define a predefined definition area (character frame (characters are printed or printed on the form). Character recognition processing (OCR processing) is applied to the frame to be filled)), and a character recognition result is output. This is a general processing method of character recognition for a form.

この結果、帳票をそのまま画像化することになり、帳票画像上の個人情報や機密情報が印字または記入されたままの形でオペレータ等に見えてしまい、個人情報の漏洩等のセキュリティ上の観点から好ましくない、という問題がある。   As a result, the form will be imaged as it is, and the personal information and confidential information on the form image will appear to the operator etc. in the form of being printed or filled in, from the viewpoint of security such as leakage of personal information There is a problem that it is not preferable.

帳票画像上の個人情報や機密情報をオペレータの権限では、見せたくない(役席以上の権限で閲覧可能としたい)という要望がある。そのため、図25に示すように、あらかじめ定義した定義領域(文字枠)のうちで、マスクを必要とする項目(定義領域)を設定し、図26に示すように、その設定したマスクする項目の定義領域全体に対し、それぞれマスク処理を行なっている   There is a demand that the operator's authority does not want to show personal information or confidential information on the form image (it is desired to be able to view with authority higher than the office). Therefore, as shown in FIG. 25, an item (definition region) that requires a mask is set in a predefined definition region (character frame), and as shown in FIG. Each entire definition area is masked

このように、従来技術では、あらかじめ定義した領域の文字認識、及びあらかじめ定義した領域でのマスクしか対応できないため、以下のような不都合(問題点)が生じる。
(1)対応できる帳票が限定される。
銀行が作成するような制定帳票では、帳票の数が限られているが、私製帳票のような、エンドユーザが自由な構想で作成した帳票では、帳票レイアウトがまちまちであり、数限りないパターンがある。そのため、帳票レイアウトのパターン毎に認識する領域を定義しなければならなくなり、すべての帳票をサポートするのは困難である。
As described above, the conventional technique can deal only with the character recognition of the predefined area and the mask with the predefined area, and the following inconvenience (problem) occurs.
(1) Available forms are limited.
In enacted forms created by banks, the number of forms is limited, but in forms created by end users, such as private forms, the form layout varies and there are numerous patterns. is there. Therefore, it is necessary to define an area to be recognized for each form layout pattern, and it is difficult to support all forms.

(2)定義領域内からはみ出した文字(文字列)に対し、マスクできない
定義した領域全面に固定的にマスクをするため、領域からはみ出した文字に対しては完全にマスクができない。そのため、マスクからはみ出した文字の一部分から、文字が推測できる場合がある。
(2) Characters (character strings) that protrude from the definition area cannot be masked Since the entire defined area is masked permanently, characters that protrude from the area cannot be completely masked. Therefore, there are cases where a character can be estimated from a part of the character that protrudes from the mask.

(3)領域内(文字枠)にあるプレプリント文字がマスクされる
項目名が文字枠の中にあるレイアウトの場合、プレプリント文字がマスクされてしまうため、項目名が判断できない場合がある。
(3) The preprint character in the area (character frame) is masked In the case of the layout in which the item name is in the character frame, the preprint character is masked, so the item name may not be determined.

(4)文字の位置や文字の記入の有無がわからない
文字の位置や記入有無を考慮せず、定義した領域全面にマスクをするため、領域内(文字枠)に、文字・文字列の記述があるのか無いのか、あるとしたらどの位置に何文字分の文字・文字列があるのか、が判断できない。
(4) I do not know the position of characters and whether or not characters are entered. Because the entire defined area is masked without considering the position of characters or whether or not characters are entered, characters and character strings are described in the area (character frame). It is impossible to determine whether there are any characters or character strings at which positions.

(5)類似帳票の区別がつかなくなる
定義した領域がマスク領域となるため、定義した領域が広い場合、全体がマスクされ、似たような帳票と見た目の区別がつかなくなる場合がある。
(5) A similar form cannot be distinguished. Since the defined area becomes a mask area, if the defined area is wide, the entire form is masked, and a similar form may not be distinguished from the appearance.

(6)部分的なマスクの対応ができない
領域内(文字枠)の文字・文字列内の、何文字目をマスクしたい、また特定のキーワード(例えば、県、市 等)をマスクせず他の文字列をマスクしたい、などの細かいマスクのニーズに対応ができない。
(6) Partial masking is not supported. What character you want to mask in the character / character string in the area (character frame), and other keywords without masking specific keywords (eg prefecture, city, etc.) Cannot respond to the needs of detailed masks such as wanting to mask character strings.

このうち、上記問題点(1)については、特許文献1に示される帳票認識装置の技術を適用することで、任意のフォーマットの帳票を読み込んで帳票画像として電子化し、その帳票画像に含まれる見出しと、帳票上に記入または印字などされた文字(文字列)に対応するデータ部とを対応付けて、帳票画像を認識することが可能となる。この結果、殆どすべての帳票レイアウトを扱うことが可能となる。   Among these, for the above problem (1), by applying the technology of the form recognition device disclosed in Patent Document 1, a form in an arbitrary format is read and digitized as a form image, and the headline included in the form image is displayed. It is possible to recognize a form image by associating with a data portion corresponding to a character (character string) entered or printed on the form. As a result, almost all form layouts can be handled.

本願は、特許文献1の帳票認識技術を利用し、そのような帳票認識装置において、データ部から範囲を指定してマスクを行うマスク処理技術に関するものである。このようにすることで、後述するように、上記問題点(2)〜(6)についても解決する。   The present application relates to a mask processing technique that uses the form recognition technique of Patent Document 1 and performs masking by designating a range from a data portion in such a form recognition apparatus. By doing so, the problems (2) to (6) are solved as will be described later.

なお、関連技術として、特許文献2には、フォーマット画像において、見出し語を認識して特定領域を認識する画像処理システムが示されている。このシステムでは、特定領域を単一色で塗りつぶすことを行っている。   As a related technique, Patent Document 2 discloses an image processing system that recognizes a specific area by recognizing a headword in a format image. In this system, a specific area is filled with a single color.

また、特許文献3には、文字領域を認識し、特定領域の座標を得て、特定領域をマスクする画像処理装置が示されている。
また、特許文献4には、守秘項目の座標値を取得し、守秘項目をマスクする電子ファイル装置が示されている。
Patent Document 3 discloses an image processing apparatus that recognizes a character area, obtains coordinates of a specific area, and masks the specific area.
Patent Document 4 discloses an electronic file device that acquires the coordinate value of a confidential item and masks the confidential item.

しかし、特許文献2〜4のいずれも、上記問題点(2)〜(6)を解決するものではない。   However, none of Patent Documents 2 to 4 solves the problems (2) to (6).

特開2010−003155号公報JP 2010-003155 A 特開2006−319668号公報JP 2006-319668 A 特開2007−158413号公報JP 2007-158413 A 特開平06−290251号公報Japanese Patent Laid-Open No. 06-290251

本発明は、上記問題を解決するためになされたものであり、帳票上の文字を認識し、その帳票に含まれる見出しと、帳票上に記入または印字された文字(文字列)に対応するデータ部とを対応付けする文字認識装置において、データ部から範囲を指定してマスクを行うことを可能とした文字認識装置、マスク処理方法、および、マスク処理プログラムを提供することを目的とする。   The present invention has been made to solve the above problems, recognizes characters on a form, and includes data corresponding to a headline included in the form and characters (character strings) entered or printed on the form. An object of the present invention is to provide a character recognition device, a mask processing method, and a mask processing program capable of performing masking by designating a range from a data portion in a character recognition device that associates a portion with a portion.

提案する帳票上の文字を認識する文字認識装置は、帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部と、見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記文字列認識部により認識された文字列のうちから見出しに相当する文字列を特定する見出し特定部と、特定された見出しに対応付けられるべき、印字または記入された文字列がある枠としてのデータ部を特定するデータ部特定部と、マスクすべきデータに対応する見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記帳票画像上のマスクすべき領域を算出するマスク領域算出部と、算出されたマスク領域にマスク処理を施して前記帳票画像を出力する出力部と、を有する。   The proposed character recognition device for recognizing characters on a form includes a character string recognition unit for recognizing a character string from a form image obtained by reading a form, a character string corresponding to a heading, and a data part as a corresponding frame. A headline specifying unit for specifying a character string corresponding to a headline from among the character strings recognized by the character string recognition unit, based on headline definition information having data characteristics of the character string to be printed or entered; Mask definition information having a data part specifying part for specifying a data part as a frame with a printed or written character string to be associated with a written heading, a heading corresponding to the data to be masked, and a masking method And a mask area calculation unit for calculating an area to be masked on the form image based on recognition result information for the character string of the specified data part, and a calculated mass And an output unit for outputting the document image by performing a mask process in the region.

提案する帳票上の文字を認識する文字認識装置では、マスクすべきデータに対応する見出しと、マスク方法とをマスク定義情報に指定することで、その見出しと対応付けられた枠としてのデータ部内に印字または記入された文字列からマスク方法の内容に応じてマスクする範囲を指定してマスク処理を行うことができる。   In the proposed character recognition device for recognizing characters on a form, by specifying the heading corresponding to the data to be masked and the masking method in the mask definition information, the data portion as a frame associated with the heading is included. Masking processing can be performed by designating a masking range in accordance with the contents of the masking method from the printed or entered character string.

本発明の一実施形態に係る帳票の文字を認識する文字認識装置の機能ブロック図である。It is a functional block diagram of the character recognition apparatus which recognizes the character of the form which concerns on one Embodiment of this invention. 帳票イメージをマスク定義テーブルとともに示した図である。It is the figure which showed the form image with the mask definition table. 見出しに対するデータ部の位置の探索方法を示す図である。It is a figure which shows the search method of the position of the data part with respect to a heading. 見出し定義テーブルのデータ構造を示す図である。It is a figure which shows the data structure of a heading definition table. マスク定義テーブル、文字認識結果テーブル、及び、マスク座標テーブルのデータ構造を示す図である。It is a figure which shows the data structure of a mask definition table, a character recognition result table, and a mask coordinate table. マスク方法の原理を示す図である。It is a figure which shows the principle of a mask method. 帳票上の文字を認識する文字認識装置の全体フローチャートである。It is a whole flowchart of the character recognition apparatus which recognizes the character on a form. マスクする文字を特定する処理のフローチャートである。It is a flowchart of the process which specifies the character to mask. 文字認識結果テーブルの状態を示す図(その1)である。It is FIG. (1) which shows the state of a character recognition result table. 文字認識結果テーブルの状態を示す図(その2)である。It is FIG. (2) which shows the state of a character recognition result table. 文字認識結果テーブルの状態を示す図(その3)である。It is FIG. (3) which shows the state of a character recognition result table. マスク座標を算出する処理のフローチャートである。It is a flowchart of the process which calculates a mask coordinate. マスク領域の座標を算出する処理のフローチャートである。It is a flowchart of the process which calculates the coordinate of a mask area | region. マスク座標テーブルの生成方法を示す図である。It is a figure which shows the production | generation method of a mask coordinate table. 画像表示処理のフローチャートである。It is a flowchart of an image display process. マスク処理を施さなかった場合の帳票イメージと、その帳票イメージに対する文字認識結果を示す図である。It is a figure which shows the character recognition result with respect to the form image at the time of not performing a mask process, and the form image. マスク処理を施した場合の帳票イメージと、その帳票イメージに対する文字認識結果を示す図である。It is a figure which shows the form recognition image at the time of performing a mask process, and the character recognition result with respect to the form image. 本実施形態のマスク処理方法の効果を示す図(その1)である。It is FIG. (1) which shows the effect of the mask processing method of this embodiment. 本実施形態のマスク処理方法の効果を示す図(その2)である。It is FIG. (2) which shows the effect of the mask processing method of this embodiment. 本実施形態のマスク処理方法の効果を示す図(その3)である。It is FIG. (3) which shows the effect of the mask processing method of this embodiment. 本実施形態のマスク処理方法の効果を示す図(その4)である。It is FIG. (4) which shows the effect of the mask processing method of this embodiment. 本実施形態のマスク処理方法の効果を示す図(その5)である。It is FIG. (5) which shows the effect of the mask processing method of this embodiment. 本実施形態の帳票上の文字を認識する文字認識装置を実現可能なコンピュータの構成図である。It is a block diagram of the computer which can implement | achieve the character recognition apparatus which recognizes the character on the form of this embodiment. 帳票イメージの一例(振込依頼書)を示す図である。It is a figure which shows an example (transfer request book) of a form image. 帳票イメージをその帳票上の文字認識結果とともに示した図である。It is the figure which showed the form image with the character recognition result on the form. 従来の帳票に対するマスク方法を示した図である。It is the figure which showed the masking method with respect to the conventional form. 従来の帳票に対するマスク処理結果を示した図である。It is the figure which showed the mask processing result with respect to the conventional form.

以下、本発明に係る実施の形態について図面を参照して詳細に説明する。
図1は、本発明の一実施形態に係る帳票の文字を認識する文字認識装置の機能ブロック図である。
Hereinafter, embodiments according to the present invention will be described in detail with reference to the drawings.
FIG. 1 is a functional block diagram of a character recognition device that recognizes characters in a form according to an embodiment of the present invention.

この文字認識装置は、帳票を読み取って得られる電子化された帳票画像を入力し、その帳票画像上に存在する文字列(1つ以上の文字から構成されるもの)を認識するものである。   This character recognition device inputs an electronic form image obtained by reading a form, and recognizes a character string (consisting of one or more characters) existing on the form image.

この文字認識装置は、図1に示すように、入力部11、罫線/セル抽出部12、見出し部特定部13、データ部特定部14、データ部特徴解析部15、データ部文字認識部16、マスク対象特定部17、マスク座標算出部18、出力部19、画面表示部20、見出し定義DB21、マスク定義DB22、文字認識結果DB23、マスク座標DB24、文字認識エンジン25、を有する。   As shown in FIG. 1, the character recognition device includes an input unit 11, ruled line / cell extraction unit 12, heading unit specifying unit 13, data unit specifying unit 14, data unit feature analyzing unit 15, data unit character recognizing unit 16, A mask target specifying unit 17, a mask coordinate calculating unit 18, an output unit 19, a screen display unit 20, a heading definition DB 21, a mask definition DB 22, a character recognition result DB 23, a mask coordinate DB 24, and a character recognition engine 25.

図1において、入力部11は、スキャナ等により読み取られて電子化された帳票画像を入力する。
罫線/セル抽出部12は、入力部11が入力した帳票画像上に存在する記載をその種類別、例えば図、表、及び文字(文字列)に分けて分離して、分離された表から罫線を抽出し、表を罫線で囲まれたセルで分割し解析する。
In FIG. 1, an input unit 11 inputs a form image read and digitized by a scanner or the like.
The ruled line / cell extracting unit 12 separates the description existing on the form image input by the input unit 11 into its type, for example, a figure, a table, and a character (character string) and separates the ruled line from the separated table. Are extracted, and the table is divided into cells surrounded by ruled lines and analyzed.

見出し部特定部13は、文字認識エンジンに文字認識を依頼して、文字認識結果、及び、文字認識座標を受け取り、この初回の文字認識の結果をふまえ、セル内の文字列と、見出し定義DB21とマッチングを行い、見出し部分のセル(見出しに相当する文字列を含むセル、以下、このようなセルのことを「見出し部」という)を抽出する。   The headline specifying unit 13 requests the character recognition engine to perform character recognition, receives the character recognition result and the character recognition coordinates, and based on the result of the first character recognition, the character string in the cell, the headline definition DB 21 And a headline part cell (a cell including a character string corresponding to the headline, hereinafter referred to as a “header part”) is extracted.

データ部特定部14は、見出し部のセルに隣接するセルを探索し、見出しに対応して印字または記入される文字列があるセル(以下、このようなセルのことを「データ部」という)として最適な(尤もらしい)セルを特定する。   The data part specifying part 14 searches for a cell adjacent to the heading part cell, and has a character string to be printed or entered corresponding to the heading (hereinafter, such a cell is referred to as a “data part”). To identify the optimal (likely) cell.

データ部特徴解析部15は、データ部の特徴を解析し、文字枠、ノイズ等を除去した文字認識に最適なイメージに加工する。
データ部文字認識部16は、文字認識エンジン25に文字認識を依頼して、文字認識結果及び、文字認識座標を受け取る。すなわち、データ部として特定されたセル内に含まれるデータに相当する文字列に対し、見出し定義テーブル31の対応する代表見出しに対するデータの属性等が考慮されてより精度が高い2回目の文字認識が行われ、見出し部特定部13が文字認識エンジンを呼び出したことによる初回の文字認識結果のうちの、データ部分に対する文字認識結果に対する調整(部分的な修正等)が行われる。
The data part feature analysis unit 15 analyzes the feature of the data part and processes it into an image optimal for character recognition from which character frames, noise, and the like are removed.
The data part character recognition unit 16 requests the character recognition engine 25 to perform character recognition, and receives a character recognition result and character recognition coordinates. That is, the character recognition corresponding to the data included in the cell specified as the data portion is subjected to the second character recognition with higher accuracy in consideration of the attribute of the data for the corresponding representative heading in the heading definition table 31. The adjustment (partial correction, etc.) is performed on the character recognition result for the data portion of the initial character recognition result obtained by the headline specifying unit 13 calling the character recognition engine.

マスク対象特定部17は、マスク定義DB22の、マスク条件に合う文字(文字列)を特定する。
マスク座標算出部18は、マスクする文字(文字列)の外郭を覆うマスク座標を算出する。
The mask target specifying unit 17 specifies characters (character strings) that match the mask conditions in the mask definition DB 22.
The mask coordinate calculation unit 18 calculates mask coordinates covering the outline of the character (character string) to be masked.

出力部19は、文字認識の結果(文字認識結果DB23)、およびマスク座標の結果(マスク座標DB24)を画面表示部20に通知(送信)する。
画面表示部20は、マスク処理結果の帳票イメージを表示する。
The output unit 19 notifies (transmits) the character recognition result (character recognition result DB 23) and the mask coordinate result (mask coordinate DB 24) to the screen display unit 20.
The screen display unit 20 displays a form image of the mask processing result.

図2は、帳票イメージをマスク定義テーブルとともに示した図である。
図2において、帳票イメージ上には、見出し部に含まれる見出しに相当するプレプリント文字の文字列(以下、この“見出し部に含まれる見出しに相当するプレプリント文字の文字列”のことを単に“見出し”ということがある)として、銀行名101、金額104、預金種目106、口座番号108、口座名110、整理番号112、集団(団体)名114、集団(団体)ご住所116、がある。
FIG. 2 is a diagram showing a form image together with a mask definition table.
In FIG. 2, on the form image, a character string of a preprint character corresponding to a headline included in the heading portion (hereinafter, “character string of a preprint character corresponding to a headline included in the heading portion” is simply referred to as “character string”. The bank name 101, the amount 104, the deposit type 106, the account number 108, the account name 110, the reference number 112, the group (group) name 114, and the group (group) address 116 are included as “headings”. .

見出しに対して印字、記入される文字列がある枠(セル)としてのデータ部の位置を探索する方法としては、図3に示すように、見出しがあるセルとは別のセルがデータ部である場合に対しては、見出しの右、下、右下のセルから加点方式で探索する方法(最も得点が高いセルをデータ部として見出しに対応付ける)がある。   As a method of searching for the position of the data part as a frame (cell) with a character string to be printed and entered with respect to the heading, as shown in FIG. 3, a cell different from the cell with the heading is used in the data part. In some cases, there is a method of searching by a point addition method from the right, lower, and lower right cells of the heading (corresponding to the heading as a data part the cell having the highest score).

見出し部とデータ部が一致する場合もある(例えば、図2の振込依頼書における集団(団体)ご住所116と、文字列117はセル118に共に含まれている)。このように、同じセル内に見出しとデータがあり、かつ、複数行ある条件の場合に対しては、そのセル(すなわち、見出し部兼用データ部)内においてデータを探索する方法(見出し以外の文字列をデータの候補とする方法)がある。   In some cases, the heading part and the data part match (for example, the group (group) address 116 and the character string 117 in the transfer request form of FIG. 2 are included in the cell 118). Thus, in the case where there are a heading and data in the same cell and there are a plurality of rows, a method for searching for data in the cell (that is, the heading and data portion) (characters other than the heading) Column as a data candidate).

図2では、帳票イメージの見出しとしての銀行名101に対しては、右隣りのセル102、103がデータ部として特定され、金額104に対しては、右隣りのセル105がデータ部として特定され、預金種目106に対しては、右隣りのセル107がデータ部として特定され、口座番号108に対しては、右隣りのセル109がデータ部として特定され、口座名110に対しては、右隣りのセル111がデータ部として特定され、整理番号112に対しては、下側に接するセル113がデータ部として特定され、集団(団体)名114に対しては、下側に接するセル115がデータ部として特定される。これに対し、見出しとしての集団(団体)ご住所116については、データ117もともにセル118に含まれていて、上述の見出し部とデータ部が共にセル118で一致するケースに該当する。   In FIG. 2, for the bank name 101 as the headline of the form image, the cells 102 and 103 on the right are specified as the data portion, and for the amount 104, the cell 105 on the right is specified as the data portion. For the deposit item 106, the right adjacent cell 107 is specified as the data part, for the account number 108, the right adjacent cell 109 is specified as the data part, and for the account name 110, the right The adjacent cell 111 is specified as the data part, the cell 113 in contact with the lower side is specified as the data part for the reference number 112, and the cell 115 in contact with the lower side is specified for the group (organization) name 114. Identified as a data part. On the other hand, for the group (organization) address 116 as a headline, the data 117 is also included in the cell 118, and this corresponds to the case where the above-mentioned headline part and data part match in the cell 118.

図4は、見出し定義テーブルのデータ構造を示す図である。
図4に示すように、見出し定義テーブル31は、代表見出し、見出し位置、データ、文言バリエーションの各項目を有する。データは、属性、フォーマット(桁数等)、付帯記号の各項目を備えている。このデータは、代表見出しの項目に設定された各項目(銀行名、支店名、種目、口座番号、口座名、金額、整理番号、依頼人名、住所、等)がデータ部にどのような形式(桁数等)のデータ(このように、データ部に印字または記入される文字列を単に“データ”ということがある)を持つかを規定するものである。文言バリエーションは、代表見出しに示される語の、バリエーションを示すものである。見出し定義テーブル31は、見出し定義DB21に記憶される。
FIG. 4 is a diagram illustrating a data structure of the heading definition table.
As shown in FIG. 4, the headline definition table 31 has items of representative headline, headline position, data, and word variation. The data includes items of attribute, format (number of digits, etc.), and accompanying symbols. In this data, each item (bank name, branch name, item, account number, account name, amount, reference number, client name, address, etc.) set in the representative heading item is displayed in any format ( Data (number of digits, etc.) (in this way, a character string printed or written in the data part is sometimes simply referred to as “data”). The wording variation indicates a variation of the word shown in the representative headline. The headline definition table 31 is stored in the headline definition DB 21.

帳票イメージ(帳票画像)から抽出した見出し文言に対し、見出し定義テーブル31の文言バリエーションの項目の文言と突合して、どの代表見出しに属するかを探索する。
例えば、帳票イメージ上の「預金種目」ならば、見出し定義テーブル31の文言バリエーションの項目に「預金種目」があるため、そのまま、代表見出しは「種目」となる。
The headline wording extracted from the form image (form image) is collated with the wording of the word variation item in the headline definition table 31, and the representative headline is searched for.
For example, in the case of “deposit line item” on the form image, since there is “deposit line item” in the word variation item of the headline definition table 31, the representative headline is “item” as it is.

また、帳票イメージ上の「集団(団体)名」ならば、見出しの一部分の「団体」が、見出し定義テーブルの文言バリエーションの項目にあるため、代表見出しは「依頼人」にとなる。
このようにして、帳票画像上にある見出しが見出し定義テーブル31と対応付けられる。
In the case of “group (organization) name” on the form image, “group” as a part of the heading is in the wording variation item of the heading definition table, so the representative heading is “client”.
In this way, the headline on the form image is associated with the headline definition table 31.

図5は、マスク定義テーブル、文字認識結果テーブル、及び、マスク座標テーブルのデータ構造を示す図である。マスク定義テーブル、文字認識結果テーブル、マスク座標テーブルはマスク定義DB22、文字認識結果DB23、マスク座標DB24にそれぞれ記憶される。   FIG. 5 is a diagram illustrating data structures of the mask definition table, the character recognition result table, and the mask coordinate table. The mask definition table, the character recognition result table, and the mask coordinate table are stored in the mask definition DB 22, the character recognition result DB 23, and the mask coordinate DB 24, respectively.

図5に示すように、マスク定義テーブル32は、認識項目、マスク要否、マスク方法の各項目を有する。
ここで、認識項目は、見出し定義テーブルの代表見出しに一致するものである。マスク要否は、その認識項目(代表見出し)がマスクを必要とするものであるかどうかを示すフラグ情報である。フラグがオンであれば(図中、“○”印があれば)、その項目はマスク対象であり、フラグがオフであれば(図中、“×”印あるいは無印)であれば、その項目はマスクする対象ではない。
As shown in FIG. 5, the mask definition table 32 has items of recognition items, necessity of mask, and mask method.
Here, the recognition item matches the representative heading in the heading definition table. The necessity of mask is flag information indicating whether or not the recognition item (representative headline) requires a mask. If the flag is on (if there is a “○” mark in the figure), the item is a mask target, and if the flag is off (“x” or no mark in the figure), that item. Are not masked.

また、図5において、文字認識結果テーブル33は、認識項目、文字認識桁、文字認識結果、開始X座標、開始Y座標、終了X座標、終了Y座標、マスク対象フラグ、マスク後文字認識結果、の各項目を有する。   In FIG. 5, the character recognition result table 33 includes a recognition item, a character recognition digit, a character recognition result, a start X coordinate, a start Y coordinate, an end X coordinate, an end Y coordinate, a mask target flag, a character recognition result after masking, Each item.

文字認識桁は、1かたまりとして認識した文字列のいくつ目の文字かを示している。認識項目が口座番号である場合(口座番号に対するデータ部の場合)、何桁目かを示している。文字認識結果は、その桁(位置)での認識結果の文字(1文字)を示している。開始X座標、開始Y座標は、文字に外接する矩形の左上の点の座標、終了X座標、終了Y座標は文字に外接する矩形の右下の点の座標をそれぞれ示している。左上に原点を持つ座標系が採用されているため、終了座標の方が開始座標より大きい値を持つ。   The character recognition digit indicates the number of characters in the character string recognized as one block. When the recognition item is an account number (in the case of the data part for the account number), it indicates the number of digits. The character recognition result indicates the character (one character) of the recognition result at that digit (position). The start X coordinate and start Y coordinate indicate the coordinates of the upper left point of the rectangle circumscribing the character, and the end X coordinate and end Y coordinate indicate the coordinates of the lower right point of the rectangle circumscribing the character, respectively. Since the coordinate system having the origin at the upper left is adopted, the end coordinate has a larger value than the start coordinate.

マスク対象フラグは、その文字がマスク対象になっているかどうかを示すフラグ情報である。このように、ある項目に対応するデータ部に含まれる文字列において、その文字列内の文字毎にマスク対象フラグを持たせることで、認識項目に対応するデータ部の文字列のうちからマスクする範囲を指定することが可能となる。   The mask target flag is flag information indicating whether or not the character is a mask target. As described above, in a character string included in a data portion corresponding to a certain item, a mask target flag is provided for each character in the character string, thereby masking the character string in the data portion corresponding to the recognized item. A range can be specified.

マスク後文字認識結果は、マスクした文字をどのように画面表示するかを指定するものである。ここでは、マスクした文字はすべて“*(アスタリスク)”に置き換えることにしている。他の文字で置き換えてもよい。   The post-mask character recognition result specifies how to display the masked character on the screen. Here, all the masked characters are replaced with “* (asterisk)”. It may be replaced with other characters.

また、図5において、マスク座標テーブル34は、認識項目、マスク番号、マスク開始X座標、マスク開始Y座標、マスク終了X座標、マスク終了Y座標、の各項目を有する。
マスク番号は、帳票イメージ上に形成されるマスク領域(本実施形態では単一色(例えば黒)による塗りつぶし)を識別するための領域番号である。
In FIG. 5, the mask coordinate table 34 includes items of a recognition item, a mask number, a mask start X coordinate, a mask start Y coordinate, a mask end X coordinate, and a mask end Y coordinate.
The mask number is an area number for identifying a mask area (filling with a single color (for example, black) in the present embodiment) formed on the form image.

マスク開始X座標、マスク開始Y座標、マスク終了X座標、マスク終了Y座標については、文字列の外接矩形(文字列を囲む四角形)の左上と右下の点である。これは、図6に示すように、文字座標から文字列を囲む、(最左端、最上端)、(最右端、最上端)、(最右端、最下端)、(最左端、最下端)の各座標を求めて、文字列を囲む四角形を求める。すなわち、視認性を考慮し、連続する文字は同じ高さでマスクする。なお、文字毎にマスクしてもよい。   The mask start X coordinate, mask start Y coordinate, mask end X coordinate, and mask end Y coordinate are the upper left and lower right points of the circumscribed rectangle (rectangle surrounding the character string) of the character string. As shown in FIG. 6, (leftmost, uppermost), (rightmost, uppermost), (rightmost, lowermost), (leftmost, lowermost) Each coordinate is obtained, and a rectangle surrounding the character string is obtained. That is, in consideration of visibility, consecutive characters are masked at the same height. Note that each character may be masked.

図7は、帳票上の文字を認識する文字認識装置の全体フローチャートである。
図7のステップS1で、入力部11は、文字認識対象の帳票をスキャナで読込み、帳票をイメージ化する。
FIG. 7 is an overall flowchart of a character recognition apparatus that recognizes characters on a form.
In step S1 of FIG. 7, the input unit 11 reads a form for character recognition with a scanner, and forms an image of the form.

ステップS2では、罫線/セル抽出部12は、帳票画像をレイアウト解析し、罫線、及び、セルを抽出する。なお、セルとは、罫線で囲まれた枠(文字枠)のことである。
ステップS3で、見出し特定部13は、文字認識エンジン25に文字認識を依頼して、文字認識結果、及び、文字認識座標を受け取る。これにより、帳票画像上の文字全般に対しての初回の認識処理が行われる。また、見出し特定部13は、文字認識の結果をふまえ、セル内の文字列と、見出し定義テーブル31とマッチングを行い、見出しに相当する文字列を含むセル(すなわち、見出し部)を抽出する。
In step S2, the ruled line / cell extracting unit 12 performs layout analysis on the form image and extracts ruled lines and cells. A cell is a frame (character frame) surrounded by ruled lines.
In step S3, the headline specifying unit 13 requests the character recognition engine 25 to perform character recognition, and receives a character recognition result and character recognition coordinates. As a result, the initial recognition process is performed for all characters on the form image. Further, the headline specifying unit 13 performs matching with the character string in the cell and the headline definition table 31 based on the result of character recognition, and extracts a cell including the character string corresponding to the headline (that is, the headline unit).

ステップS4では、データ部特定部14は、見出し部分のセル(見出し部)に隣接するセルを探索し、データ部分として最適な(尤もらしい)セル(データ部)を特定する。
ステップS5では、データ部特徴解析部15は、データ部の特徴を解析し、文字枠、ノイズ等を除去した文字認識に最適なイメージに加工する。
In step S4, the data part specifying unit 14 searches for a cell adjacent to the heading part cell (heading part), and specifies an optimal (likely) cell (data part) as the data part.
In step S5, the data part feature analysis unit 15 analyzes the feature of the data part and processes it into an image optimal for character recognition from which character frames, noise, and the like are removed.

ステップS6では、データ部文字認識部16は、文字認識エンジンに文字認識を依頼して、文字認識結果、及び、文字認識座標を受け取る。ここでは、データ部として特定されたセル内に含まれるデータに相当する文字列に対し、見出し定義テーブル31の対応する代表見出しに対するデータの属性等が考慮されてより精度が高い2回目の文字認識が行われ、ステップS3での初回の文字認識結果のうちの、データ部分に対する文字認識結果に対する調整(部分的な修正等)が行われる。   In step S6, the data part character recognition unit 16 requests the character recognition engine to perform character recognition, and receives a character recognition result and character recognition coordinates. Here, the character recognition corresponding to the data included in the cell specified as the data portion is considered for the second character recognition with higher accuracy in consideration of the attribute of the data for the corresponding representative heading in the heading definition table 31. And the adjustment (partial correction, etc.) to the character recognition result for the data portion of the initial character recognition result in step S3 is performed.

ステップS7では、マスク対象特定部17は、マスク定義テーブル32の、マスク条件(マスク方法)に合う文字(文字列)を特定する。
ステップS8では、マスク座標算出部18は、マスクする文字(文字列)の外郭を覆うマスク座標を算出する。
In step S <b> 7, the mask target specifying unit 17 specifies a character (character string) that meets the mask condition (mask method) in the mask definition table 32.
In step S8, the mask coordinate calculation unit 18 calculates mask coordinates covering the outline of the character (character string) to be masked.

ステップS9では、出力部19は、文字認識の結果(文字認識結果テーブル33)、およびマスク座標の結果(マスク座標テーブル34)を画面表示部20に通知する。そして、一連の処理を終了する。   In step S9, the output unit 19 notifies the screen display unit 20 of the character recognition result (character recognition result table 33) and the mask coordinate result (mask coordinate table 34). Then, a series of processing ends.

図8は、マスクする文字を特定する処理のフローチャートである。このフローチャートの処理は、マスク対象特定部17によって実行される。
図8のステップS11で、マスク対象特定部17は、文字認識結果テーブル33に文字認識結果、文字認識座標を格納する。すなわち、図9に示すように、文字認識結果テーブル33において、認識項目、文字認識桁、文字認識結果、開始X座標、開始Y座標、終了X座標、終了Y座標、マスク後文字認識結果、の各項目に認識処理の結果として値がそれぞれ設定される。なお、マスク後文字認識結果には、この時点では、文字認識結果と同一の文字が全桁で設定される。
FIG. 8 is a flowchart of processing for specifying a character to be masked. The process of this flowchart is executed by the mask target specifying unit 17.
In step S <b> 11 of FIG. 8, the mask target specifying unit 17 stores the character recognition result and the character recognition coordinates in the character recognition result table 33. That is, as shown in FIG. 9, in the character recognition result table 33, the recognition item, character recognition digit, character recognition result, start X coordinate, start Y coordinate, end X coordinate, end Y coordinate, post-mask character recognition result, A value is set for each item as a result of the recognition process. It should be noted that at this time, the same character as the character recognition result is set to the post-mask character recognition result in all digits.

続く、ステップS12で、マスク対象特定部17は、文字認識結果テーブル33の全データ行を処理済みであるかどうかを判定する。
ステップS12で文字認識結果テーブル33の全データ行を処理済みであると判定された場合(ステップS12の判定結果がYesの場合)、一連の処理を終了する。
In step S12, the mask target specifying unit 17 determines whether all data rows in the character recognition result table 33 have been processed.
If it is determined in step S12 that all data rows in the character recognition result table 33 have been processed (if the determination result in step S12 is Yes), the series of processing ends.

ステップS12で文字認識結果テーブル33の全データ行を処理済みではないと判定された場合(ステップS12の判定結果がNoの場合)、ステップS13で、文字認識結果テーブル33から次の認識結果のデータ行を取得する。なお、このステップS13が初回に実行される場合は、先頭行を取得する。   If it is determined in step S12 that all the data rows in the character recognition result table 33 have not been processed (if the determination result in step S12 is No), in step S13, the next recognition result data is read from the character recognition result table 33. Get a row. If this step S13 is executed for the first time, the first line is acquired.

続く、ステップS14では、図5のマスク定義テーブル32から認識項目のマスク条件を取得する。すなわち、ステップS13で取得した行の認識項目の位置に設定された見出し名(銀行名、支店名、種目、口座番号、口座名、金額、整理番号、依頼人名、住所、振込手数料、等)と同一の見出し名を、マスク定義テーブル32の認識項目から見つけ、マスク定義テーブル32のその行のマスク要否、及び、マスク方法の項目に設定されたデータを取得する。   In subsequent step S14, the mask condition of the recognition item is acquired from the mask definition table 32 of FIG. That is, the heading name (bank name, branch name, item, account number, account name, amount, reference number, client name, address, transfer fee, etc.) set at the position of the recognition item in the line acquired in step S13 The same heading name is found from the recognition item in the mask definition table 32, and the data set in the mask necessity item and the mask method item in the mask definition table 32 are acquired.

続く、ステップS15では、取得されたマスク方法に応じて処理を分岐している。まず、マスク要否の項目がマスク定義テーブル32上で空欄になっている場合は、マスク要否のフラグがオフになっていてマスクなし、とみなし、ステップS15から先の処理がスキップされ、ステップS12に戻る。   In subsequent step S15, the process branches according to the acquired mask method. First, when the mask necessity item is blank in the mask definition table 32, it is assumed that the mask necessity flag is off and there is no mask, and the processing from step S15 onward is skipped. Return to S12.

また、マスク要否の項目に、テーブル上で“○”印がついていて、マスク要否のフラグがオンになっている場合は、マスク方法に応じて処理を分岐する。
例えば、何桁目をマスクする、というように複数桁のうちのマスクする桁を指定するような条件の場合(ここでは、7桁の口座番号のうちの3桁、6桁、7桁目をマスクする場合を考える)、ステップS16で、マスク条件を満たす行かどうかが判定される。
If the item “necessity of masking” is marked with “◯” on the table and the flag of necessity of masking is turned on, the process branches depending on the masking method.
For example, in the condition of specifying a digit to be masked among a plurality of digits such as masking what digit (in this case, the third digit, the sixth digit, and the seventh digit of the seven-digit account number) Consider the case of masking). In step S16, it is determined whether or not the row satisfies the mask condition.

このステップS16の判定結果は、マスクする桁(3桁、6桁、7桁)に相当する文字認識結果テーブル33の行を現在処理していない限りYesとなることはない。マスクする桁以外に相当する行を処理している場合(例えば図10の1レコード目の処理のような場合)、ステップS16の判定結果はNoとなり、現在行が1行分進み、ステップS16が再度実行される。   The determination result in step S16 is not Yes unless the row of the character recognition result table 33 corresponding to the digits to be masked (3 digits, 6 digits, 7 digits) is currently processed. When a line other than the digit to be masked is processed (for example, in the case of the process of the first record in FIG. 10), the determination result in step S16 is No, the current line advances by one line, and step S16 Will be executed again.

マスクする桁(3桁、6桁、7桁)に相当する文字認識結果テーブル33の行を現在処理している場合(例えば図10の7レコード目の処理のような場合)、ステップS16の判定結果がYesとなり、続く、ステップS17で、処理対象行のマスク対象フラグがONに設定され(図中、“○”で表記)、ステップS18で、処理対象行のマスク後文字認識結果の文字が“*”で置換される。置換は“*”以外の文字で行ってもかまわない。   When the row of the character recognition result table 33 corresponding to the digits to be masked (3 digits, 6 digits, 7 digits) is currently being processed (for example, in the case of the seventh record in FIG. 10), the determination in step S16 The result is Yes. Subsequently, in step S17, the mask target flag of the processing target line is set to ON (indicated by “◯” in the figure), and in step S18, the character of the post-masking character recognition result of the processing target line is displayed. Replaced with “*”. Replacement may be performed with a character other than “*”.

他のマスク方法(マスク条件)として、例えば、住所において、都道府県名は表示させ、市町村の“市”、“町”、“村”も表示させるが、それ以外はマスクする、という条件の場合、“都”、“道”、“府”、“県”という文字と、“市”、“町”、“村”という文字で挟まれた1つ以上の文字と、“市”、“町”、“村”以降の文字列とがマスク対象となるので、ステップS19において、マスク対象に処理対象行が該当するかどうかを判定する。   As another masking method (masking condition), for example, in the address, the name of the prefecture is displayed, and the “city”, “town”, and “village” of the municipality are displayed, but other conditions are masked. , “City”, “road”, “fu”, “prefecture” and one or more characters between “city”, “town”, “village”, “city”, “town” Since the character string after “,” “village” is a mask target, it is determined in step S19 whether or not the processing target line corresponds to the mask target.

ステップS19の判定結果がNoの場合、処理対象行を1行進めて再度ステップS19が実行される。
ステップS19の判定結果がYesの場合、ステップS20で、処理対象行のマスク対象フラグがONに設定され(図中、“○”で表記)、ステップS21で、処理対象行のマスク後文字認識結果の文字が“*”で置換される。
If the determination result of step S19 is No, the process target line is advanced by one line and step S19 is executed again.
If the determination result in step S19 is Yes, the mask target flag of the processing target line is set to ON in step S20 (indicated by “◯” in the figure), and the post-mask character recognition result of the processing target line is determined in step S21. Is replaced with “*”.

なお、例えば、認識項目“口座番号”に対するマスク要否がオフで、“口座番号”がマスク対象になっていない場合、図11に示すように、文字認識結果テーブル33に対しては、ステップS11の格納処理のみが行われる(他のステップの処理はスキップする)。   For example, when the necessity of masking for the recognition item “account number” is off and “account number” is not a mask target, as shown in FIG. Only the storage process is performed (the process of other steps is skipped).

図12は、マスク座標を算出する処理のフローチャートである。このフローチャートの処理は、マスク座標算出部18によって実行される。
図12のステップ31で、マスク座標算出部18は、文字認識結果テーブル33の全データ行を処理済みであるかどうかを判定する。
FIG. 12 is a flowchart of processing for calculating mask coordinates. The process of this flowchart is executed by the mask coordinate calculation unit 18.
In step 31 in FIG. 12, the mask coordinate calculation unit 18 determines whether all data rows in the character recognition result table 33 have been processed.

ステップ31で文字認識結果テーブル33の全データ行を処理済みであると判定された場合(ステップS31の判定結果がYesの場合)、一連の処理を終了する。
ステップ31で文字認識結果テーブル33の全データ行を処理済みでないと判定された場合(ステップS31の判定結果がNoの場合)、ステップS32で、マスク座標算出部18は、文字認識結果テーブル33から現在の認識結果のデータ行を取得する。
If it is determined in step 31 that all data rows in the character recognition result table 33 have been processed (if the determination result in step S31 is Yes), the series of processing ends.
If it is determined in step 31 that all the data rows in the character recognition result table 33 have not been processed (if the determination result in step S31 is No), the mask coordinate calculation unit 18 reads from the character recognition result table 33 in step S32. Get the data line of the current recognition result.

そして、ステップS33で、その現在行で、マスク対象フラグがONかどうかを判定する。
ステップS33で現在行でマスク対象フラグがONでないと判定された場合(ステップS33の判定結果がNoの場合)、ステップS31に戻る。
In step S33, it is determined whether or not the mask target flag is ON in the current line.
If it is determined in step S33 that the mask target flag is not ON in the current line (if the determination result in step S33 is No), the process returns to step S31.

ステップS33で現在行でマスク対象フラグがONであると判定された場合(ステップS33の判定結果がYesの場合)、ステップS34で、マスク座標算出部18は、文字認識結果テーブル33から次の認識結果のデータ行を取得する。   If it is determined in step S33 that the mask target flag is ON in the current line (if the determination result in step S33 is Yes), the mask coordinate calculation unit 18 performs the next recognition from the character recognition result table 33 in step S34. Get the resulting data row.

続く、ステップS35では、マスク座標算出部18は、ステップS32で取得した次行のマスク対象フラグがONであるかどうかを判定する。
ステップS35で次行のマスク対象フラグがONではないと判定された場合(ステップS35の判定結果がNoの場合)、ステップS37でマスク領域(四角形)の座標算出を行い、ステップS31に戻る。
In step S35, the mask coordinate calculation unit 18 determines whether or not the mask target flag on the next line acquired in step S32 is ON.
If it is determined in step S35 that the mask target flag in the next row is not ON (if the determination result in step S35 is No), the coordinates of the mask area (rectangle) are calculated in step S37, and the process returns to step S31.

ステップS35で次行のマスク対象フラグがONであると判定された場合(ステップS35の判定結果がYesの場合)、ステップS36で、マスク領域座標の算出依頼用に、
マスク対象文字分の座標をワークにまとめる。そして、ステップS34に戻り、さらに次の認識結果のデータ行を取得する。
If it is determined in step S35 that the mask target flag in the next row is ON (if the determination result in step S35 is Yes), in step S36, for a mask area coordinate calculation request,
Collect the coordinates for the mask target character in the work. Then, the process returns to step S34, and a data row of the next recognition result is acquired.

このステップS34〜S36の処理は、連続するマスク対象文字を検索している。途切れたところで、1かたまりとしてとらえ、ステップS37において、1文字あるいは複数文字にまたがるマスク領域を算出する。   In the processes in steps S34 to S36, a search is performed for consecutive mask target characters. When the interruption occurs, it is regarded as one lump, and in step S37, a mask area extending over one character or a plurality of characters is calculated.

図13は、マスク領域の座標を算出する処理のフローチャートである。この処理は、図12のステップS37の詳細フローチャートである。このフローチャートの処理は、マスク座標算出部18によって実行される。   FIG. 13 is a flowchart of a process for calculating the coordinates of the mask area. This process is a detailed flowchart of step S37 of FIG. The process of this flowchart is executed by the mask coordinate calculation unit 18.

図13のステップS41で、マスク座標算出部18は、マスク領域の座標(左上X座標、左上Y座標、右下X座標、右下Y座標)に、1文字目の座標(左上X座標、左上Y座標、右下X座標、右下Y座標)を代入する。   In step S41 of FIG. 13, the mask coordinate calculation unit 18 sets the coordinates of the first character (upper left X coordinate, upper left X coordinate) to the coordinates of the mask area (upper left X coordinate, upper left Y coordinate, lower right X coordinate, lower right Y coordinate). Y coordinate, lower right X coordinate, lower right Y coordinate).

続く、ステップS42で、マスク座標算出部18は、全文字の座標計算が処理済みであるかどうかを判定する。
ステップS42で全文字の座標計算が処理済みであると判定された場合(ステップS42の判定結果がYesの場合)、ステップS43で、マスク領域の座標を、マスク座標テーブルに格納し、一連の処理を終了する。
In step S42, the mask coordinate calculation unit 18 determines whether the coordinate calculation of all characters has been processed.
If it is determined in step S42 that all the character coordinates have been processed (if the determination result in step S42 is Yes), in step S43, the coordinates of the mask area are stored in the mask coordinate table, and a series of processes is performed. Exit.

ステップS42で全文字の座標計算が処理済みではないと判定された場合(ステップS42の判定結果がNoの場合)、ステップS44で、次の文字の座標(左上X座標、左上Y座標、右下X座標、右下Y座標)を取得し、ステップS45で、左上X座標が、マスク領域の左上X座標より小さいかどうかを判定する。   If it is determined in step S42 that the coordinate calculation of all characters has not been processed (if the determination result in step S42 is No), in step S44, the coordinates of the next character (upper left X coordinate, upper left Y coordinate, lower right) X coordinate, lower right Y coordinate) is acquired, and it is determined in step S45 whether the upper left X coordinate is smaller than the upper left X coordinate of the mask area.

ステップS45で左上X座標が、マスク領域の左上X座標より小さくないと判定された場合(ステップS45の判定結果がNoの場合)、ステップS47に進む。
ステップS45で左上X座標が、マスク領域の左上X座標より小さいと判定された場合(ステップS45の判定結果がYesの場合)、ステップS46で、左上X座標を、マスク領域の左上X座標に代入し、ステップS47に進む。
If it is determined in step S45 that the upper left X coordinate is not smaller than the upper left X coordinate of the mask area (if the determination result in step S45 is No), the process proceeds to step S47.
If it is determined in step S45 that the upper left X coordinate is smaller than the upper left X coordinate of the mask area (if the determination result in step S45 is Yes), the upper left X coordinate is substituted for the upper left X coordinate of the mask area in step S46. Then, the process proceeds to step S47.

ステップS47では、左上Y座標が、マスク領域の左上Y座標より小さいかどうかを判定する。
ステップS47で左上Y座標が、マスク領域の左上Y座標より小さくないと判定された場合(ステップS47の判定結果がNoの場合)、ステップS49に進む。
In step S47, it is determined whether the upper left Y coordinate is smaller than the upper left Y coordinate of the mask area.
If it is determined in step S47 that the upper left Y coordinate is not smaller than the upper left Y coordinate of the mask area (if the determination result in step S47 is No), the process proceeds to step S49.

ステップS47で左上Y座標が、マスク領域の左上Y座標より小さいと判定された場合(ステップS47の判定結果がYesの場合)、ステップS48で、左上Y座標を、マスク領域の左上Y座標に代入し、ステップS49に進む。   If it is determined in step S47 that the upper left Y coordinate is smaller than the upper left Y coordinate of the mask area (if the determination result in step S47 is Yes), the upper left Y coordinate is substituted for the upper left Y coordinate of the mask area in step S48. Then, the process proceeds to step S49.

ステップS49では、右下X座標が、マスク領域の右下X座標より大きいかどうかを判定する。
ステップS49で、右下X座標が、マスク領域の右下X座標より大きくないと判定された場合(ステップS49の判定結果がNoの場合)、ステップS51に進む。
In step S49, it is determined whether the lower right X coordinate is larger than the lower right X coordinate of the mask area.
When it is determined in step S49 that the lower right X coordinate is not larger than the lower right X coordinate of the mask area (when the determination result in step S49 is No), the process proceeds to step S51.

ステップS49で、右下X座標が、マスク領域の右下X座標より大きいと判定された場合(ステップS49の判定結果がYesの場合)、ステップS50で、右下X座標を、マスク領域の右下X座標に代入し、ステップS51に進む。   If it is determined in step S49 that the lower right X coordinate is greater than the lower right X coordinate of the mask area (if the determination result in step S49 is Yes), the lower right X coordinate is set to the right of the mask area in step S50. Substitute for the lower X coordinate and proceed to step S51.

ステップS51では、右下Y座標が、マスク領域の右下Y座標より大きいかどうかを判定する。
ステップS51で、右下Y座標が、マスク領域の右下Y座標より大きくないと判定された場合(ステップS51の判定結果がNoの場合)、ステップS42に戻る。
In step S51, it is determined whether the lower right Y coordinate is larger than the lower right Y coordinate of the mask area.
If it is determined in step S51 that the lower right Y coordinate is not larger than the lower right Y coordinate of the mask area (if the determination result in step S51 is No), the process returns to step S42.

ステップS51で、右下Y座標が、マスク領域の右下Y座標より大きいと判定された場合(ステップS51の判定結果がYesの場合)、ステップS52で、右下Y座標を、マスク領域の右下Y座標に代入し、ステップS42に戻る。   If it is determined in step S51 that the lower right Y coordinate is greater than the lower right Y coordinate of the mask area (if the determination result in step S51 is Yes), the lower right Y coordinate is set to the right of the mask area in step S52. Substitute for the lower Y coordinate and return to step S42.

図14は、マスク座標テーブルの生成方法を示す図である。
図13のフローチャートの処理の結果として、例えば、7桁の口座番号の3桁、6桁、7桁目をマスクする場合を考えると、3桁目の場合は、1つ前や1つ後の桁がマスク対象になっていないので、3桁目の文字の開始X座標、開始Y座標、終了X座標、終了Y座標をマスク開始X座標、マスク開始Y座標、マスク終了X座標、マスク終了Y座標、として、マスク座標テーブル34のマスク番号“1”のレコードに格納する。
FIG. 14 is a diagram illustrating a method for generating a mask coordinate table.
As a result of the processing of the flowchart of FIG. 13, for example, when the third digit, the sixth digit, and the seventh digit of the 7-digit account number are masked, in the case of the third digit, the previous or next Since the digit is not masked, the start X coordinate, start Y coordinate, end X coordinate, and end Y coordinate of the third digit character are set as the mask start X coordinate, mask start Y coordinate, mask end X coordinate, and mask end Y. The coordinates are stored in the record of the mask number “1” in the mask coordinate table 34.

これに対し、6桁目と7桁目は2文字連続でマスク対象フラグがONになっていることから、2文字の領域に対する最左端、最上端、最右端、最下端の座標を算出し、それらをマスク開始X座標、マスク開始Y座標、マスク終了X座標、マスク終了Y座標、として、マスク座標テーブル34のマスク番号“2”のレコードに格納する。   On the other hand, since the mask target flag is ON for the 6th and 7th digits and the mask target flag is ON, the coordinates of the leftmost, topmost, rightmost, and bottommost positions for the 2-character area are calculated, These are stored in the record of the mask number “2” in the mask coordinate table 34 as the mask start X coordinate, mask start Y coordinate, mask end X coordinate, and mask end Y coordinate.

図15は、画像表示処理のフローチャートである。このフローチャートの処理は、画面表示部20によって実行される。
図15のステップS61で、出力部19から通知された文字認識の結果(文字認識結果テーブル33)、およびマスク座標の結果(マスク座標テーブル34)を取得する。そして、ステップS62で、マスク座標テーブル34に指定されたマスク領域に対し、帳票イメージ上でマスク処理を行い、ステップS63で、図16Bに示すように、マスク処理を施した帳票イメージを画面表示する。なお、この際、図16Bに示すように、文字認識結果テーブル33から帳票イメージに対する文字認識結果もともに画面表示する。
FIG. 15 is a flowchart of the image display process. The process of this flowchart is executed by the screen display unit 20.
In step S61 in FIG. 15, the character recognition result (character recognition result table 33) and the mask coordinate result (mask coordinate table 34) notified from the output unit 19 are acquired. In step S62, the mask area designated in the mask coordinate table 34 is masked on the form image, and in step S63, the form image subjected to the mask process is displayed on the screen as shown in FIG. 16B. . At this time, as shown in FIG. 16B, the character recognition result for the form image is also displayed on the screen from the character recognition result table 33.

なお、図16Aは、マスク処理を施さなかった場合の帳票イメージと、その帳票イメージに対する文字認識結果を示す図である。
これに対し、図16Bは、マスク処理を施した場合の帳票イメージと、その帳票イメージに対する文字認識結果を示す図である。
FIG. 16A is a diagram illustrating a form image when the mask process is not performed, and a character recognition result for the form image.
On the other hand, FIG. 16B is a diagram showing a form image when the mask process is performed and a character recognition result for the form image.

図16Bに示すように、本実施形態のマスク処理方法では、データ部の範囲を指定したマスクが可能となる。
以上説明したように、本実施形態の帳票上の文字を認識する文字認識装置による印字または記入された文字列であるデータ部のマスク処理方法では、マスクすべき(プレプリントの)見出しと、マスク方法とをマスク定義情報に指定することで、その見出しと対応付けられたデータ部(印字または記入された文字列)からマスク方法の内容に応じてマスクする範囲を指定してマスク処理を行うことができる。
As shown in FIG. 16B, the mask processing method of the present embodiment enables masking that specifies the range of the data portion.
As described above, in the mask processing method of the data portion that is a character string printed or entered by the character recognition device for recognizing characters on the form according to the present embodiment, the (preprint) heading to be masked and the mask By specifying the method in the mask definition information, the masking process is performed by specifying the masking range according to the contents of the masking method from the data part (printed or filled-in character string) associated with the heading. Can do.

続いて、本実施形態の帳票上の文字を認識する文字認識装置によるマスク処理を行うことで、背景技術にて示した問題点(2)〜(6)が解決されることを、図17〜図21を参照して説明する。   Subsequently, the problems (2) to (6) shown in the background art are solved by performing mask processing by the character recognition device that recognizes the characters on the form according to the present embodiment. This will be described with reference to FIG.

まず、問題点(2)の定義領域内からはみ出した文字(文字列)に対し、マスクできない点については、図17に示すように、従来は、定義した領域全面に固定的にマスクをするため、文字枠からはみ出した文字に対しては完全にマスクができない。そのため、マスクからはみ出した文字の一部分から、文字が推測できる場合がある。   First, as shown in FIG. 17, conventionally, the character (character string) that protrudes from the definition area of the problem (2) cannot be masked, as shown in FIG. It is impossible to completely mask characters that are out of the character frame. Therefore, there are cases where a character can be estimated from a part of the character that protrudes from the mask.

これに対し、本実施形態のマスク処理方法では、文字(文字列)毎にマスク処理をしているので、文字枠からはみだした文字に対してもマスク処理を行うことができ、文字枠からはみだした文字の一部が露出するという不都合を回避することができる。   On the other hand, in the mask processing method of the present embodiment, since mask processing is performed for each character (character string), it is possible to perform mask processing even for characters that protrude from the character frame, and to protrude from the character frame. It is possible to avoid the inconvenience that some characters are exposed.

問題点(3)の領域内(文字枠)にあるプレプリント文字がマスクされる点については、図18に示すように、文字枠(セル)121内に見出し120とマスクすべきデータ122とがあった場合は、データ122の一部あるいは全部を(ここでは全部を)マスクしているので、見出し(プレプリント文字の文字列)120がマスクされることはなく、マスク処理された帳票イメージに対する視認性を向上させることができる。この結果、項目名が文字枠(セル)の中にあるレイアウトの場合に、プレプリント文字がマスクされてしまうために項目名が判断できないことを回避することができる。   As shown in FIG. 18, the headline 120 and the data 122 to be masked in the character frame (cell) 121 are masked for the preprint character in the problem (3) area (character frame). In such a case, since part or all of the data 122 is masked (in this case, all of the data 122), the heading (character string of preprint characters) 120 is not masked, and the masked form image is not masked. Visibility can be improved. As a result, in the case of a layout in which the item name is in the character frame (cell), it is possible to avoid that the item name cannot be determined because the preprint character is masked.

問題点(4)の文字の位置や文字の記入の有無がわからない点については、図19に示すように、従来では、文字の位置や記入有無を考慮せず、定義した領域全面にマスクをするため、領域内(文字枠)に、文字・文字列の記述があるのか無いのか、あるとしたらどの位置に何文字分の文字・文字列があるのか、が判断できなかった。しかし、本実施形態のマスク処理方法の場合、文字枠(セル)内から文字を探し出しマスクしているため、文字の位置や記入の有無が分かる(記入がない場合は、マスクすべき対象の項目であってもマスク処理は施されない)。   As for the point (4) where the character position and the presence / absence of character entry are not known, as shown in FIG. 19, conventionally, the entire area of the defined area is masked without considering the character position or the presence / absence of character entry. For this reason, it is impossible to determine whether or not there is a description of a character / character string in the area (character frame), and if so, how many characters / character strings are present. However, in the case of the mask processing method of this embodiment, since the character is searched for and masked from within the character frame (cell), the position of the character and the presence / absence of the entry are known (if there is no entry, the item to be masked) However, no masking is applied.)

問題点(5)の類似帳票の区別がつかなくなる点については、図20に示すように、従来は、定義した領域がマスク領域となるため、定義した領域が広い場合、全体がマスクされ、似たような帳票と見た目の区別がつかなくなる場合がある。また、定義した領域全面に対しマスク処理を行うため、帳票画像全体の視認性が悪くなる。これに対し、本実施形態のマスク処理方法では、文字列に外接する矩形(四角形)をマスク領域とするため、帳票レイアウトの大部分がオペレータに露出されることになり、類似している帳票の間でも、区別がつきやすくなる。また、マスク範囲がスマートになり、帳票画像全体が見やすくなる。   As shown in FIG. 20, since the defined area becomes a mask area in the past, the similar area of the problem (5) cannot be distinguished. Therefore, when the defined area is wide, the entire area is masked and similar. In some cases, it may not be possible to distinguish the form from the appearance. In addition, since the mask process is performed on the entire defined area, the visibility of the entire form image is deteriorated. In contrast, in the mask processing method of the present embodiment, a rectangle (quadrangle) circumscribing a character string is used as a mask area, so that most of the form layout is exposed to the operator, and similar forms are displayed. Even between, it becomes easy to distinguish. In addition, the mask range becomes smart and the entire form image is easy to see.

問題点(6)の部分的なマスクの対応ができない点については、従来は、定義した領域(文字枠、セル)全体をマスクしているので、領域内(文字枠)の文字・文字列内の、何文字目をマスクしたい、また特定のキーワード(例えば、県、市 等)をマスクせず他の文字列をマスクしたい、などの細かいマスクのニーズに対応ができなかった。しかし、本実施形態のマスク処理方法では、文字毎にマスクするかどうかを決めることができるので、変化に富んだ部分的なマスクができる(文字列から範囲を指定してマスクすることができる)。   Regarding the problem that the partial mask of problem (6) cannot be handled, conventionally, the entire defined area (character frame, cell) is masked, so within the character / character string in the area (character frame) However, it was not possible to meet the needs of detailed masks, such as what number of characters you want to mask, and masking other character strings without masking specific keywords (for example, prefecture, city, etc.). However, in the mask processing method according to the present embodiment, it is possible to determine whether or not to mask for each character, so that partial masks rich in change can be made (masking can be performed by specifying a range from a character string). .

図22は、図1に示す本実施形態の帳票上の文字を認識する文字認識装置を実現可能なコンピュータの構成図である。
図22に示すコンピュータは、CPU61、メモリ62、入力装置63、出力装置64、外部記憶装置65、媒体駆動装置66、及びネットワーク接続装置67を有し、 これらがバス68によって互いに接続された構成となっている。同図に示す構成は一例であり、これに限定されるものではない。
FIG. 22 is a configuration diagram of a computer capable of realizing a character recognition apparatus that recognizes characters on the form of the present embodiment shown in FIG.
The computer shown in FIG. 22 has a CPU 61, a memory 62, an input device 63, an output device 64, an external storage device 65, a medium drive device 66, and a network connection device 67, which are connected to each other by a bus 68. It has become. The configuration shown in the figure is an example, and the present invention is not limited to this.

CPU61は、当該コンピュータ全体の制御を行う。
メモリ62は、プログラム実行、データ更新等の際に、外部記憶装置65(あるいは可搬型の記録媒体69)に記憶されているプログラムあるいはデータを一時的に格納する例えばRAMである。CPU61は、プログラムをメモリ62に読み出して実行することにより、全体の制御を行う。
The CPU 61 controls the entire computer.
The memory 62 is, for example, a RAM that temporarily stores a program or data stored in the external storage device 65 (or the portable recording medium 69) during program execution, data update, or the like. The CPU 61 performs overall control by reading the program into the memory 62 and executing it.

入力装置63は、例えば、キーボード、マウス等の入力装置、或いはスキャナ等の画像読取装置と接続されたインターフェースである。入力装置に対するユーザの操作を検出し、その検出結果をCPU61に通知する。   The input device 63 is an interface connected to an input device such as a keyboard and a mouse or an image reading device such as a scanner. A user operation on the input device is detected, and the detection result is notified to the CPU 61.

出力装置64は、例えば表示装置と接続された表示制御装置である。CPU61の制御によって送られてくるデータを表示装置上に出力させる。
ネットワーク接続装置67は、例えばイントラネットやインターネット等のネットワークを介して、外部装置と通信を行うためのものである。外部装置は、画像読取装置であってもよく、その画像読取装置と接続されたものであってもよい。外部記憶装置65は、例えばハードディスク装置である。主に各種データや プログラムの保存に用いられる。
The output device 64 is a display control device connected to, for example, a display device. The data sent under the control of the CPU 61 is output on the display device.
The network connection device 67 is for communicating with an external device via a network such as an intranet or the Internet. The external device may be an image reading device or may be connected to the image reading device. The external storage device 65 is, for example, a hard disk device. Mainly used for storing various data and programs.

記憶媒体駆動装置66は、光ディスクや光磁気ディスク等の可搬型の記録媒体69にアクセスするものである。
本実施形態による帳票上の文字を認識する文字認識装置は、それに必要な機能を搭載したプログラム(以降「文字認識ソフト」と呼ぶ)をCPU61が実行することで実現される。文字認識ソフトは、記録媒体69に記録して配布してもよく、或いはネットワーク接続装置67により取得できるようにしてもよい。ここでは、外部記憶装置65に文字認識ソフト、及び、図1に示したDB21〜DB24が格納されていると想定する。
The storage medium driving device 66 accesses a portable recording medium 69 such as an optical disk or a magneto-optical disk.
The character recognition apparatus for recognizing characters on a form according to the present embodiment is realized by the CPU 61 executing a program (hereinafter referred to as “character recognition software”) equipped with necessary functions. The character recognition software may be recorded on the recording medium 69 and distributed, or may be acquired by the network connection device 67. Here, it is assumed that character recognition software and DB 21 to DB 24 shown in FIG. 1 are stored in the external storage device 65.

上述した想定では、入力部11は例えばCPU61、メモリ62、入力装置63、外部記憶装置65、ネットワーク接続装置67、及びバス68によって実現される。出力部19は、例えばCPU61、メモリ62、出力装置64、外部記憶装置65、ネットワーク接続装置67、及びバス68によって実現される。DB21〜DB24は外部記憶装置65に相当する。他は、例えばCPU61、メモリ62、外部記憶装置65、及びバス68によって実現される。   In the above-described assumption, the input unit 11 is realized by, for example, the CPU 61, the memory 62, the input device 63, the external storage device 65, the network connection device 67, and the bus 68. The output unit 19 is realized by, for example, the CPU 61, the memory 62, the output device 64, the external storage device 65, the network connection device 67, and the bus 68. DB 21 to DB 24 correspond to the external storage device 65. Others are realized by, for example, the CPU 61, the memory 62, the external storage device 65, and the bus 68.

11 入力部
12 罫線/セル抽出部
13 見出し特定部
14 データ部特定部
15 データ部特徴解析部
16 データ部文字認識部
17 マスク対象特定部
18 マスク座標算出部
19 出力部
20 画面表示部
21 見出し定義DB
22 マスク定義DB
23 文字認識結果DB
24 マスク座標DB
25 文字認識エンジン
31 見出し定義テーブル
32 マスク定義テーブル
33 文字認識結果テーブル
34 マスク座標テーブル
61 CPU
62 メモリ
63 入力装置
64 出力装置
65 外部記憶装置
66 媒体駆動装置
67 ネットワーク接続装置
68 バス
69 可搬記録媒体
101、104、106、108、110、112、114、116、120 見出し
102、103、105、107、109、111、113、115 データ部
117、122 データ部内の文字列
118、121 見出し部兼用データ部
DESCRIPTION OF SYMBOLS 11 Input part 12 Ruled line / cell extraction part 13 Heading specific part 14 Data part specific part 15 Data part characteristic analysis part 16 Data part Character recognition part 17 Mask object specific part 18 Mask coordinate calculation part 19 Output part 20 Screen display part 21 Headline definition DB
22 Mask definition DB
23 Character recognition result DB
24 Mask coordinate DB
25 Character recognition engine 31 Headline definition table 32 Mask definition table 33 Character recognition result table 34 Mask coordinate table 61 CPU
62 Memory 63 Input device 64 Output device 65 External storage device 66 Medium drive device 67 Network connection device 68 Bus 69 Portable recording medium 101, 104, 106, 108, 110, 112, 114, 116, 120 Headings 102, 103, 105 , 107, 109, 111, 113, 115 Data portion 117, 122 Character string in the data portion 118, 121 Heading portion combined data portion

Claims (4)

帳票上の文字の認識を行う文字認識装置において、
帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部と、
見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記文字列認識部により認識された文字列のうちから見出しに相当する文字列を特定する見出し特定部と、
特定された見出しに対応付けられるべき、印字または記入された文字列がある枠としてのデータ部を特定するデータ部特定部と、
マスクすべきデータに対応する見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記帳票画像上のマスクすべき領域を算出するマスク領域算出部と、
算出されたマスク領域にマスク処理を施して前記帳票画像を出力する出力部と、を有することを特徴とする文字認識装置。
In a character recognition device that recognizes characters on a form,
A character string recognition unit for recognizing a character string from a form image obtained by reading a form;
Of the character strings recognized by the character string recognition unit, based on the headline definition information having the character string corresponding to the headline and the data characteristics of the character string to be printed or entered in the data part which is the corresponding frame A headline specifying part for specifying a character string corresponding to the headline from
A data part specifying part for specifying a data part as a frame with a printed or filled character string to be associated with the specified heading;
An area to be masked on the form image is calculated based on mask definition information having a heading corresponding to data to be masked and a masking method, and recognition result information on the character string of the specified data portion. A mask area calculation unit;
An output unit that performs mask processing on the calculated mask area and outputs the form image.
前記マスク方法は、文字列のうちでマスクする文字位置を指定すること、あるいは、文字列に含まれるキーとなる文字を指定し、その文字の前後の所定範囲をマスクすること、であることを特徴とする請求項1記載の文字認識装置。   The masking method is to specify a character position to be masked in a character string, or to specify a key character included in the character string and mask a predetermined range before and after the character. The character recognition device according to claim 1, wherein: 帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部、を使用して帳票上の文字の認識を行う文字認識装置、が行うマスク処理方法において、
見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記文字列認識部により認識された文字列のうちから見出しに相当する文字列を特定する見出し特定ステップと、
特定された見出しに対応付けられるべき、印字または記入された文字列がある枠としてのデータ部を特定するデータ部特定ステップと、
マスクすべきデータに対応する見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記帳票画像上のマスクすべき領域を算出するマスク領域算出ステップと、
算出されたマスク領域にマスク処理を施して前記帳票画像を出力する出力ステップと、を有することを特徴とするマスク処理方法。
In a mask processing method performed by a character recognition device that recognizes characters on a form using a character string recognition unit that recognizes a character string from a form image obtained by reading the form,
Of the character strings recognized by the character string recognition unit, based on the headline definition information having the character string corresponding to the headline and the data characteristics of the character string to be printed or entered in the data part which is the corresponding frame A headline identifying step for identifying a character string corresponding to the headline from
A data part specifying step for specifying a data part as a frame having a printed or filled character string to be associated with the specified heading;
An area to be masked on the form image is calculated based on mask definition information having a heading corresponding to data to be masked and a masking method, and recognition result information on the character string of the specified data portion. A mask area calculating step;
An output step of performing mask processing on the calculated mask area and outputting the form image.
帳票を読み取って得られる帳票画像から文字列を認識する文字列認識部、を呼び出して帳票上の文字の認識を行わせるようにコンピュータを機能させるプログラムであり、
該プログラムは、コンピュータを、
見出しに相当する文字列と、対応する枠であるデータ部に印字または記入されるべき文字列のデータ特性とを有する見出し定義情報を基に、前記文字列認識部により認識された文字列のうちから見出しに相当する文字列を特定する見出し特定部、
特定された見出しに対応付けられるべき、印字または記入された文字列がある枠としてのデータ部を特定するデータ部特定部、
マスクすべきデータに対応する見出しと、マスク方法とを有するマスク定義情報、及び、前記特定されたデータ部の文字列に対する認識結果情報を基に、前記帳票画像上のマスクすべき領域を算出するマスク領域算出部、
算出されたマスク領域にマスク処理を施して前記帳票画像を出力する出力部、として機能させるマスク処理プログラム。
A program that causes a computer to function to call a character string recognition unit that recognizes a character string from a form image obtained by reading a form, and to recognize characters on the form,
The program
Of the character strings recognized by the character string recognition unit, based on the headline definition information having the character string corresponding to the headline and the data characteristics of the character string to be printed or entered in the data part which is the corresponding frame A headline specifying part for specifying a character string corresponding to the headline from
A data part specifying part for specifying a data part as a frame with a printed or filled character string to be associated with the specified heading;
An area to be masked on the form image is calculated based on mask definition information having a heading corresponding to data to be masked and a masking method, and recognition result information on the character string of the specified data portion. Mask area calculator,
A mask processing program that functions as an output unit that performs mask processing on a calculated mask area and outputs the form image.
JP2011102221A 2011-04-28 2011-04-28 Character recognition device for recognizing characters on a form, mask processing method, and mask processing program Active JP5661549B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011102221A JP5661549B2 (en) 2011-04-28 2011-04-28 Character recognition device for recognizing characters on a form, mask processing method, and mask processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011102221A JP5661549B2 (en) 2011-04-28 2011-04-28 Character recognition device for recognizing characters on a form, mask processing method, and mask processing program

Publications (2)

Publication Number Publication Date
JP2012234344A true JP2012234344A (en) 2012-11-29
JP5661549B2 JP5661549B2 (en) 2015-01-28

Family

ID=47434613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011102221A Active JP5661549B2 (en) 2011-04-28 2011-04-28 Character recognition device for recognizing characters on a form, mask processing method, and mask processing program

Country Status (1)

Country Link
JP (1) JP5661549B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015143899A (en) * 2014-01-31 2015-08-06 日本電気株式会社 Information processing apparatus, information hiding method, and information hiding program
JP2015176282A (en) * 2014-03-14 2015-10-05 オムロン株式会社 Image processing method, image processor, program for executing the same method, and recording medium for recording the same program
JP2017151639A (en) * 2016-02-23 2017-08-31 大日本印刷株式会社 Document imaging apparatus, document imaging method and program for document imaging apparatus
JP2017182276A (en) * 2016-03-29 2017-10-05 株式会社東芝 Image processing system, image processing device, and image processing program
JP2019153357A (en) * 2019-06-25 2019-09-12 大日本印刷株式会社 Document imaging device, document imaging method, and program for document imaging device
JP2019175334A (en) * 2018-03-29 2019-10-10 日本電気株式会社 Information processing device, control method, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3798906A1 (en) 2019-09-30 2021-03-31 Tata Consultancy Services Limited System and method for masking text within images

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290251A (en) * 1993-03-31 1994-10-18 Hitachi Ltd Document image processing method of electronic file device
JP2000181988A (en) * 1998-12-16 2000-06-30 Hitachi Ltd Optical character reader
JP2007241442A (en) * 2006-03-06 2007-09-20 Oki Electric Ind Co Ltd Personal information reading storage device and personal information reading storage system
US20080239365A1 (en) * 2007-03-26 2008-10-02 Xerox Corporation Masking of text in document reproduction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290251A (en) * 1993-03-31 1994-10-18 Hitachi Ltd Document image processing method of electronic file device
JP2000181988A (en) * 1998-12-16 2000-06-30 Hitachi Ltd Optical character reader
JP2007241442A (en) * 2006-03-06 2007-09-20 Oki Electric Ind Co Ltd Personal information reading storage device and personal information reading storage system
US20080239365A1 (en) * 2007-03-26 2008-10-02 Xerox Corporation Masking of text in document reproduction

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015143899A (en) * 2014-01-31 2015-08-06 日本電気株式会社 Information processing apparatus, information hiding method, and information hiding program
JP2015176282A (en) * 2014-03-14 2015-10-05 オムロン株式会社 Image processing method, image processor, program for executing the same method, and recording medium for recording the same program
JP2017151639A (en) * 2016-02-23 2017-08-31 大日本印刷株式会社 Document imaging apparatus, document imaging method and program for document imaging apparatus
JP2017182276A (en) * 2016-03-29 2017-10-05 株式会社東芝 Image processing system, image processing device, and image processing program
JP2019175334A (en) * 2018-03-29 2019-10-10 日本電気株式会社 Information processing device, control method, and program
JP7031438B2 (en) 2018-03-29 2022-03-08 日本電気株式会社 Information processing equipment, control methods, and programs
JP2019153357A (en) * 2019-06-25 2019-09-12 大日本印刷株式会社 Document imaging device, document imaging method, and program for document imaging device

Also Published As

Publication number Publication date
JP5661549B2 (en) 2015-01-28

Similar Documents

Publication Publication Date Title
JP5661549B2 (en) Character recognition device for recognizing characters on a form, mask processing method, and mask processing program
JP4461769B2 (en) Document retrieval / browsing technique and document retrieval / browsing device
CN100454293C (en) Document editing method, document editing device
US20090123071A1 (en) Document processing apparatus, document processing method, and computer program product
CN106164932B (en) The method and apparatus of music symbol for identification
JP4780169B2 (en) Data generation device, scanner, and computer program
TW200416583A (en) Definition data generation method of account book voucher and processing device of account book voucher
JP2021043478A (en) Information processing device, control method thereof and program
JP2006065477A (en) Character recognition device
JP2008108114A (en) Document processor and document processing method
JP4935459B2 (en) Character recognition method, character recognition program, and character recognition device
JP4807618B2 (en) Image processing apparatus and image processing program
JP4518212B2 (en) Image processing apparatus and program
JP2013030040A (en) Information processing program, information processor, and character recognition method
JP3898645B2 (en) Form format editing device and form format editing program
JP4474231B2 (en) Document link information acquisition system
JP7351159B2 (en) Information processing device and program
JP4517822B2 (en) Image processing apparatus and program
JP7430219B2 (en) Document information structuring device, document information structuring method and program
JP2014078168A (en) Character recognition apparatus and program
JP2013182459A (en) Information processing apparatus, information processing method, and program
JP2018063597A (en) Character recognition device, character recognition method, character recognition program, and form
JP6489041B2 (en) Information processing apparatus and program
JP2022148922A (en) Information processing device and program
JP2024003769A (en) Character recognition system, method of recognizing character by computer, and character search system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141203

R150 Certificate of patent or registration of utility model

Ref document number: 5661549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150