JP4435141B2 - Character recognition device, character recognition method, and character recognition program - Google Patents

Character recognition device, character recognition method, and character recognition program Download PDF

Info

Publication number
JP4435141B2
JP4435141B2 JP2006322316A JP2006322316A JP4435141B2 JP 4435141 B2 JP4435141 B2 JP 4435141B2 JP 2006322316 A JP2006322316 A JP 2006322316A JP 2006322316 A JP2006322316 A JP 2006322316A JP 4435141 B2 JP4435141 B2 JP 4435141B2
Authority
JP
Japan
Prior art keywords
pixel
image
character recognition
halftone dot
connected components
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006322316A
Other languages
Japanese (ja)
Other versions
JP2008134970A (en
Inventor
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006322316A priority Critical patent/JP4435141B2/en
Publication of JP2008134970A publication Critical patent/JP2008134970A/en
Application granted granted Critical
Publication of JP4435141B2 publication Critical patent/JP4435141B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、例えば網掛け領域に文字が記入された帳票がスキャナなどで読み取られたときの画像データから文字を認識する文字認識装置、文字認識方法および文字認識プログラムに関する。   The present invention relates to a character recognition device, a character recognition method, and a character recognition program for recognizing characters from image data when, for example, a form in which characters are entered in a shaded area is read by a scanner or the like.

帳票をスキャナなどで帳票の画像を読み取って、その画像から帳票に記入された文字を認識する文字認識装置が既にある。   There is already a character recognition device that reads an image of a form with a scanner or the like and recognizes characters entered on the form from the image.

近年、演算速度の向上や文字解析プログラムの高精度化により、文字認識装置の文字認識精度は向上してきたものの、帳票に記載されている文字の字体や書体によっては、文字認識精度が落ちるものも多い。以下、網掛けされた画像(以下「網掛け画像」と称す。)に対して文字認識装置が文字を認識する場合について説明する。   In recent years, the character recognition accuracy of character recognition devices has improved due to improvements in computation speed and higher accuracy of character analysis programs. However, depending on the typefaces and typefaces of characters on the form, the character recognition accuracy may drop. Many. Hereinafter, a case where a character recognition device recognizes a character with respect to a shaded image (hereinafter referred to as “shaded image”) will be described.

通常、網掛けのある帳票から文字を文字認識装置で読み取る場合、通常、大きさが小さな連結成分、つまり文字以外の部分に点在する網点を除去した後の画像を用いて文字認識処理を行う。   Normally, when characters are read from a shaded form with a character recognition device, character recognition processing is usually performed using an image after removing small connected components, that is, halftone dots scattered in portions other than characters. Do.

このような画像に対して網点を除去する従来の技術としては、例えば網掛けのある帳票の画像を、高速フーリエ変換することで、特定の空間周波数成分を除去する技術がある(例えば特許文献1参照)。   As a conventional technique for removing halftone dots from such an image, for example, there is a technique for removing a specific spatial frequency component by performing a fast Fourier transform on a shaded form image (for example, Patent Documents). 1).

また、他の先行技術として、例えば文字の輪郭を追跡することで突起状のものを取り除く技術がある(例えば特許文献2参照)。
特開2000−293630公報 特開2003−67738公報
Further, as another prior art, for example, there is a technique for removing protrusions by tracking the outline of a character (see, for example, Patent Document 2).
JP 2000-293630 A JP 2003-67738 A

上記特許文献1の技術の場合、高速フーリエ変換とは言っても計算量が甚大であるため、帳票を連続して読み取るような業務処理には向かない。また、この技術の場合、特定の空間周波数成分を除去するため、元の文字の画像も除去されてしまうなどの欠点がある。   In the case of the technique of the above-mentioned Patent Document 1, the amount of calculation is enormous even if it is fast Fourier transform, so that it is not suitable for business processing such as reading a form continuously. In addition, this technique has a drawback that an original character image is also removed because a specific spatial frequency component is removed.

また上記特許文献2の技術の場合、濁点やピリオドなどのように、文字から離れている微小な文字の特徴部分も同時に失われてしまうという問題がある。   In the case of the technique disclosed in Patent Document 2, there is a problem that feature portions of minute characters that are separated from characters, such as muddy dots and periods, are also lost at the same time.

本発明はこのような課題を解決するためになされたもので、網掛けされた画像に含まれる文字の画像に重なる網点を文字にできるだけ忠実に除去して文字認識精度を向上することのできる文字認識装置、文字認識方法および文字認識プログラムを提供することを目的とする。   The present invention has been made to solve such a problem, and can improve character recognition accuracy by removing halftone dots overlapping a character image included in a shaded image as faithfully as possible. An object is to provide a character recognition device, a character recognition method, and a character recognition program.

上記の課題を解決するために本発明の文字認識装置は、規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置において、記憶装置と、前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、前記第2処理画像に対して文字認識を行う文字認識手段とを具備することを特徴とする。 In order to solve the above problems, a character recognition device according to the present invention is a character recognition device for recognizing characters from a shaded image shaded by regularly dotted halftone dots, a storage device, and the shaded image. from detects the center position of the pixel connected components under size or less of the preset the dot, the positional information of the center position of the detected pixel connected components, the pre-Symbol pixel connected components were removed from the shaded image a first halftone dot elimination means for storing the first processed image in the storage device, the positional information of the any two adjacent pixel connected component of the position information read from the storage device, preset and other point position calculating means for calculating the position of the other pixel connected components adjacent to the two pixel connected components in accordance with the arrangement pattern or calculation rule of the halftone dot, the positions of the other pixel connected components the calculated, the First process A halftone dot determining unit for determining whether a pixel of an image is a white pixel or a black pixel, and a position within a predetermined diameter range that can be taken by the halftone dot, with the position determined as a black pixel by the halftone dot determining unit as a center Circumference calculation means for calculating coordinates, and whether or not the pixels of the first processed image on the circumference coordinates calculated by the circumference calculation means are divided into continuous white pixels and continuous black pixels Dividing the first processed image by connecting the dividing points of the pixels of the two colors determined to be divided by the dividing point determining means and the dividing point determining means for determining A second halftone dot removing unit that removes black pixels on the white pixel side to generate a second processed image; and a character recognition unit that performs character recognition on the second processed image. To do.

本発明の文字認識方法は、規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置における文字認識方法において、前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、前記画素連結成分を前記網掛け画像から除去した第1処理画像とを記憶装置に記憶するステップと、前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出するステップと、前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定するステップと、前記黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算するステップと、前記計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定するステップと、前記2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成するステップと、前記第2処理画像に対して文字認識を行うステップとを有することを特徴とする。 The character recognition method of the present invention is a character recognition method in a character recognition apparatus for recognizing a character from a halftone image that is regularly shaded by halftone dots. detecting the center position of the pixel connected components under size or less of the points, it stores the positional information of the center position of the detected pixel connected components, and the pre-Symbol pixel connected component first processed image is removed from the hatching image device and storing in an arbitrary position information of the two adjacent pixels connected component is read out from said storage device, said two pixels in accordance with the arrangement pattern or calculation rule preset dot of the position information Calculating a position of another pixel connected component close to the connected component, and determining whether the pixel of the first processed image at the calculated position of the other pixel connected component is a white pixel or a black pixel And a step of calculating a circumferential coordinate in a range of a predetermined diameter that can be taken by the halftone dot with the position determined as the black pixel as a center, and the first processing on the calculated circumferential coordinate A step of determining whether or not an image pixel has been divided into a continuous white pixel and a continuous black pixel, and connecting between the division points of the two color pixels determined to be divided into two. Dividing the first processed image, removing black pixels on the white pixel side of the circumference and generating a second processed image; and performing character recognition on the second processed image; It is characterized by having.

本発明のプログラムは、規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置を動作させるプログラムにおいて、前記文字認識装置を、記憶装置と、前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、前記第2処理画像に対して文字認識を行う文字認識手段として機能させることを特徴とする。 The program of the present invention is a program for operating a character recognition device that recognizes a character from a halftone image shaded by regularly dotted dots, the character recognition device comprising: a storage device; and the halftone image. from detects the center position of the pixel connected components under size or less of the preset the dot, the positional information of the center position of the detected pixel connected components, the pre-Symbol pixel connected components were removed from the shaded image a first halftone dot elimination means for storing the first processed image in the storage device, the positional information of the any two adjacent pixel connected component of the position information read from the storage device, preset and other point position calculating means for calculating the position of the other pixel connected components adjacent to the two pixel connected components in accordance with the arrangement pattern or calculation rule of the halftone dot, the positions of the other pixel connected components the calculated A halftone dot determination unit that determines whether a pixel of the first processed image is a white pixel or a black pixel, and a position that is determined as a black pixel by the halftone dot determination unit with a predetermined diameter that the halftone dot can take Circumference calculation means for calculating the circumference coordinates in a range, and pixels of the first processed image on the circumference coordinates calculated by the circumference calculation means are divided into two continuous white pixels and continuous black pixels. Dividing the first processed image by connecting between the dividing points of the pixels of the two colors determined to be divided by the dividing point determining unit; A second halftone dot removing unit that removes black pixels on the white pixel side of the circumference to generate a second processed image; and a character recognition unit that performs character recognition on the second processed image. It is characterized by.

本発明によれば、網掛けされた画像に含まれる文字の画像に重なる網点を、文字にできるだけ忠実に除去して文字認識精度を向上することができる。   According to the present invention, it is possible to improve the character recognition accuracy by removing the halftone dot overlapping the character image included in the shaded image as faithfully as possible to the character.

以下、本発明の実施の形態について図面を参照しながら説明する。図1は本発明の実施形態に係る文字認識装置の構成を示すブロック図である。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a character recognition apparatus according to an embodiment of the present invention.

図1に示すように、この文字認識装置は、帳票21を読み取るスキャナ22などの入力ユニット20と、入力ユニット20から入力される画像データを受け付けて文字認識処理を実行するコンピュータ1(以下「PC1」と称す。)とを備える。   As shown in FIG. 1, the character recognition apparatus includes an input unit 20 such as a scanner 22 that reads a form 21, and a computer 1 (hereinafter referred to as "PC1") that receives image data input from the input unit 20 and executes character recognition processing. ").).

PC1は、入力インターフェース部11(以下「入力I/F11」と称す。)、第1網点除去手段としての第1画像処理部12、記憶装置3、網点判定部13、円周計算部14、区分点判定部15、第2網点除去手段としての第2画像処理部16、文字認識部17、出力インターフェース部18(以下「出力I/F18」と称す。)とを備える。   The PC 1 includes an input interface unit 11 (hereinafter referred to as “input I / F 11”), a first image processing unit 12 as a first halftone dot removing unit, a storage device 3, a halftone dot determination unit 13, and a circumference calculation unit 14. A segment point determination unit 15, a second image processing unit 16 as a second halftone dot removing unit, a character recognition unit 17, and an output interface unit 18 (hereinafter referred to as “output I / F 18”).

記憶装置3は、例えばRAM、ROMおよびハードディスクドライブ装置等により実現される。入力I/F11および出力I/F18は、PC1の外部インターフェース装置の一つであり、例えばUSBインターフェース、LANインターフェース、D−sub端子などである。   The storage device 3 is realized by, for example, a RAM, a ROM, a hard disk drive device, and the like. The input I / F 11 and the output I / F 18 are one of the external interface devices of the PC 1, such as a USB interface, a LAN interface, and a D-sub terminal.

第1画像処理部12、網点判定部13、円周計算部14、区分点判定部15、第2画像処理部16、文字認識部17などは、ソフトウェア(プログラム)の機能をブロック化したものであり、PC1のセントラルプロセッシングユニット(以下「CPU」と称す。)の一つの機能として実現される。CPUは、記憶装置3に記憶されたプログラムのコードを読み込んで上記各部の機能を実現する。また各部は、ソフトウェア(プログラム)に限定されることなく、独立したハードウェア(機能部品)で構成しても良い。   The first image processing unit 12, the halftone dot determination unit 13, the circumference calculation unit 14, the segment point determination unit 15, the second image processing unit 16, the character recognition unit 17, and the like are blocks of software (program) functions. It is realized as one function of the central processing unit (hereinafter referred to as “CPU”) of the PC 1. The CPU reads the program code stored in the storage device 3 and realizes the functions of the above-described units. Each unit is not limited to software (program), and may be configured by independent hardware (functional components).

スキャナ22は、読み取り対象の文字が記載された帳票21から文字、図形、写真等を読み取って、画像データとしてPC1に転送(入力)する画像入力装置である。スキャナ22は、帳票21の表面に光を当てて、その反射光をCCDなどの光電変換素子で読み取ってデジタルデータに変換する。   The scanner 22 is an image input device that reads characters, figures, photographs, and the like from a form 21 on which characters to be read are written, and transfers (inputs) them as image data to the PC 1. The scanner 22 illuminates the surface of the form 21, reads the reflected light with a photoelectric conversion element such as a CCD, and converts it into digital data.

記憶装置3には、処理対象画像記憶部31、網点位置情報記憶部32、第1網点除去画像記憶部33、第2網点除去画像記憶部34、帳票定義記憶部35、辞書データ記憶部36、認識結果記憶部37等を有している。   The storage device 3 includes a processing target image storage unit 31, a halftone dot position information storage unit 32, a first halftone dot removal image storage unit 33, a second halftone dot removal image storage unit 34, a form definition storage unit 35, and dictionary data storage. Unit 36, recognition result storage unit 37, and the like.

処理対象画像記憶部31には、処理対象の画像として入力ユニット20から入力された帳票21の画像データ(以下「網掛け画像と称す。」が記憶される。   The processing target image storage unit 31 stores image data of the form 21 (hereinafter referred to as “shaded image”) input from the input unit 20 as a processing target image.

網点位置情報記憶部32には、網掛け画像から検出された網点の位置情報が記憶される。   The halftone dot position information storage unit 32 stores halftone dot position information detected from the halftone image.

第1網点除去画像記憶部33には、網掛け画像から、所定の直径(径)以下の網点を除去した第1処理画像としての第1網点除去画像が記憶される。網点とは、スキャナ22の解像度を例えば400dpi程度に設定し帳票21をスキャニングして得られた画像の場合、10ピクセル(0.6mm)程度の黒画素の集合体(画素の連結成分)である。なお、これは一例であり、解像度の設定によってはピクセル数が変化する場合がある。   The first halftone dot removal image storage unit 33 stores a first halftone dot removal image as a first processed image obtained by removing halftone dots having a predetermined diameter (diameter) or less from a halftone image. A halftone dot is a set of black pixels (connected components of pixels) of about 10 pixels (0.6 mm) in the case of an image obtained by scanning the form 21 with the resolution of the scanner 22 set to about 400 dpi, for example. is there. This is an example, and the number of pixels may change depending on the resolution setting.

第2網点除去画像記憶部34には、第1網点除去画像から文字に重なった網点を除去して生成された第2処理画像としての第2網点除去画像が記憶される。   The second halftone dot removal image storage unit 34 stores a second halftone dot removal image as a second processed image generated by removing halftone dots overlapping characters from the first halftone dot removal image.

帳票定義記憶部35には、帳票定義情報としての帳票21のフォーマットコントロールデータが記憶されている。フォーマットコントロールデータは、タイミングマークの位置、帳票21の大きさ(mm単位)、読み取り対象の文字が記入された枠の種類及び大きさ、文字数、文字ピッチ、文字の属性(住所、氏名等)、出力形式(テキスト、CSV、XML等)、加工情報(全角・半角変換、順序変更等)、画像出力形式(JPEG/TIFF)、画像の解像度、画像の切り出し位置が定義されている。   The form definition storage unit 35 stores format control data of the form 21 as form definition information. The format control data includes the timing mark position, the size of the form 21 (in mm), the type and size of the frame in which the character to be read is written, the number of characters, the character pitch, the character attributes (address, name, etc.), The output format (text, CSV, XML, etc.), processing information (full-width / half-width conversion, order change, etc.), image output format (JPEG / TIFF), image resolution, and image clipping position are defined.

タイミングマークは、帳票21の読み取り開始位置を示すものである。また、タイミングマークは、帳票21から読み取った網掛け画像の基点(座標)にされる。タイミングマーク以外では、例えば帳票21の四角のいずれか一点を基点にしても良い。   The timing mark indicates the reading start position of the form 21. The timing mark is set as a base point (coordinates) of the shaded image read from the form 21. Other than the timing marks, for example, any one of the squares of the form 21 may be used as a base point.

辞書データ記憶部36には、文字認識処理を行う際に参照される辞書データが記憶されている。辞書データは、文字イメージ(文字パターン)に文字コードを対応させたデータである。   The dictionary data storage unit 36 stores dictionary data that is referred to when performing character recognition processing. The dictionary data is data in which character codes are associated with character images (character patterns).

認識結果記憶部37には、第2網点除去画像から切り出された文字イメージとそれを文字認識した文字コードとが対応して記憶される。   In the recognition result storage unit 37, a character image cut out from the second halftone dot removal image and a character code obtained by character recognition of the character image are stored in association with each other.

第1画像処理部12は、規則的に点在する網点によって網掛け領域が形成された文字を含む帳票21の画像データ、つまり網掛け画像から、標準的な網点とほぼ同じ径を持つ黒画素の連結成分の中心位置を検出し、その連結成分を網掛け画像から除去して第1処理画像としての第1網点除去画像を生成し、検出した黒画素の連結成分の中心位置の位置情報と第1網点除去画像を記憶装置3に記憶する。網掛け画像に形成される網掛け領域は一部分でもよく全部でも良い。   The first image processing unit 12 has almost the same diameter as a standard halftone dot from the image data of a form 21 including a character in which a halftone area is formed by regularly dotted halftone dots, that is, a halftone image. The center position of the connected component of the black pixel is detected, the connected component is removed from the shaded image to generate a first halftone dot removed image as the first processed image, and the detected center position of the connected component of the black pixel is detected. The position information and the first halftone dot removal image are stored in the storage device 3. The shaded area formed in the shaded image may be part or all.

規則的に点在する網点とは、例えば格子状に線分を引き、多数の正方形またはひし形を形成したときの交点(頂点)の位置に点在させた網点を言う。   The regularly scattered halftone dots are, for example, halftone dots that are dotted at the intersections (vertices) when a large number of squares or rhombuses are formed by drawing line segments in a grid pattern.

網点判定部13は、記憶装置3に記憶された第1網点除去画像と、除去された黒画素の連結成分の位置情報のうちの任意の隣接する2つ黒画素の連結成分の位置情報を読み出して、予め設定された計算ルールから、2つ黒画素の連結成分に近接する他の黒画素の連結成分の位置を算出し、その位置の第1網点除去画像の画素が白画素か黒画素かを判定する。 Halftone determining section 13, the position of any connected components of two adjacent black pixels of the first halftone removed image stored in the storage device 3, position information of the connected component of black pixels that have been removed reads information, from a preset calculation rule, to calculate the position of the connected components other black pixels adjacent to the connected components of the two black pixels, the pixel is white first halftone removed image in that position Determine whether the pixel is a black pixel.

計算ルールとは、例えば直角二等三角形の1辺からその頂点を求める計算式等である。この他、予め記憶装置3に網点の配置パターン等を記憶しておき、その配置パターンから他の網点の位置を求めても良い。   The calculation rule is, for example, a calculation formula for obtaining a vertex from one side of a right-angled isosceles triangle. In addition, a halftone dot arrangement pattern or the like may be stored in the storage device 3 in advance, and the position of another halftone dot may be obtained from the arrangement pattern.

円周計算部14は、網点判定部13により黒画素と判定された位置を中心とし、網点(黒画素の連結成分)がとり得る所定の径の範囲で円周座標を計算する。   The circumference calculation unit 14 calculates the circumference coordinates in a range of a predetermined diameter that a halftone dot (a connected component of black pixels) can take, with the position determined as a black pixel by the halftone determination unit 13 as the center.

網点(黒画素の連結成分)がとり得る所定の径の範囲とは、網点の径の平均値Wを例えば10ピクセル程度とすると、初期値を下限値minの5ピクセル程度として、その値から増分Δ(例えば1ピクセル)ずつプラスして円周を計算し、最大値maxの例えば15ピクセル程度まで行う(min<W<max)。   The range of the predetermined diameter that can be taken by the halftone dots (connected components of black pixels) is the value when the average value W of the halftone dots is about 10 pixels, for example, and the initial value is about 5 pixels of the lower limit value min. The circumference is calculated by incrementing increment Δ (for example, 1 pixel) from the maximum value, for example, up to about 15 pixels of the maximum value max (min <W <max).

つまり、網点(黒画素の連結成分)がとり得る所定の径の範囲とは、網点の径の下限値から上限値までの範囲を言う。網点の径の下限値や上限値は、実際の帳票21から計測して統計をとってもよく、帳票21の規格書などに設定されている値を用いても良い。また、下限値、上限値にマージンをとっても良い。   That is, the range of the predetermined diameter that can be taken by the halftone dots (connected components of black pixels) refers to a range from the lower limit value to the upper limit value of the halftone dot diameter. As the lower limit value and upper limit value of the diameter of the halftone dots, statistics may be obtained by measuring from the actual form 21, or values set in the standard form of the form 21 may be used. Further, a margin may be taken for the lower limit value and the upper limit value.

区分点判定部15は、円周計算部14により計算された円周座標上にある第1網点除去画像の全ての画素の色を検出し、検出した円周座標上の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する。   The dividing point determination unit 15 detects the colors of all the pixels of the first halftone dot removal image on the circumferential coordinate calculated by the circumferential calculation unit 14, and the detected pixels on the circumferential coordinate are continuous. It is determined whether or not the white pixel and the continuous black pixel are divided into two.

第2画像処理部16は、区分点判定部15により円周が2分されたものと判定された画素の区分点間を結んで第1網点除去画像を2つの領域に区分し、円周の白画素の側にある黒画素の領域を除去して第2網点除去画像を生成し、第2網点除去画像記憶部34に記憶する。   The second image processing unit 16 divides the first halftone dot-removed image into two regions by connecting the pixel division points determined to have been divided into two by the division point determination unit 15, and A black pixel region on the white pixel side of the white dot is removed to generate a second halftone dot removal image, which is stored in the second halftone dot removal image storage unit 34.

文字認識部17は、文字の画像に重なった網点(黒画素の連結成分)が除去された第2網点除去画像を第2網点除去画像記憶部34から読み出し、読み出した第2網点除去画像に対して記憶装置3の辞書データを用いて文字認識処理を行う。   The character recognizing unit 17 reads the second halftone dot removed image from which the halftone dot (black pixel connected component) overlapping the character image is removed from the second halftone dot removed image storage unit 34, and reads the read second halftone dot. Character recognition processing is performed on the removed image using dictionary data in the storage device 3.

以下、図2乃至図9を参照してこの文字認識装置の第1の動作例を説明する。なおこの例は、帳票21から読み取った画像がモノクロ画像の場合の例で説明するが、カラー画像でも良い。   Hereinafter, a first operation example of the character recognition apparatus will be described with reference to FIGS. In this example, an example in which an image read from the form 21 is a monochrome image will be described, but a color image may be used.

この文字認識装置の場合、帳票21がスキャナ22に設置されて、読み取り開始のボタン操作が行われると、帳票21の表面がスキャナ22により読み取られてその画像データがPC1の入力I/F11を通じて処理対象画像記憶部31に記憶される。   In the case of this character recognition apparatus, when the form 21 is installed in the scanner 22 and a reading start button operation is performed, the surface of the form 21 is read by the scanner 22 and the image data is processed through the input I / F 11 of the PC 1. It is stored in the target image storage unit 31.

すると、第1画像処理部12は、処理対象画像記憶部31に記憶された帳票21の画像データである網掛け画像(図3参照)を読み出して、網点とほぼ同じ径を持つ黒画素の連結成分の中心位置を検出し、その位置にある黒画素の連結成分を網掛け画像から除去して第1網点除去画像(図4参照)を生成し、検出した黒画素の連結成分の中心位置の位置情報(以下「中心座標」と称す。)を網点位置情報記憶部32に記憶すると共に、第1網点除去画像を第1網点除去画像記憶部33に記憶する。   Then, the first image processing unit 12 reads out the shaded image (see FIG. 3) that is the image data of the form 21 stored in the processing target image storage unit 31, and detects the black pixel having almost the same diameter as the halftone dot. The center position of the connected component is detected, and the connected component of the black pixel at that position is removed from the shaded image to generate a first halftone-removed image (see FIG. 4). The position information of the position (hereinafter referred to as “center coordinates”) is stored in the halftone dot position information storage unit 32, and the first halftone dot removal image is stored in the first halftone dot removal image storage unit 33.

すなわち、第1画像処理部12は、文字周辺部の網点を除去し、文字周辺部の網点を除去した第1網点除去画像と、除去した網点の中心座標とを記憶装置3に記憶する(図2のステップ:S101)。   That is, the first image processing unit 12 removes the halftone dots in the character peripheral portion, and stores the first halftone dot removed image from which the halftone dots in the character peripheral portion and the center coordinates of the removed halftone dots are stored in the storage device 3. Store (step S101 in FIG. 2).

図4に示すように、第1網点除去画像では、文字に重なった(接触した)網点は、文字の連結成分と判断されるため、除去されない。   As shown in FIG. 4, in the first halftone dot removal image, halftone dots that overlap (contact with) the character are determined to be connected components of the character and are not removed.

次に、網点判定部13は、除去した網点(黒画素の連結成分)の中心座標のうちの任意の上下に隣接する2つ網点(黒画素の連結成分)の中心座標(x座標,y座標)を網点位置情報記憶部32から読み出して、その2つの網点の組について処理済みを示すフラグを付し、図5に示すように、2つ網点Pのy座標間を一辺とし、その辺の両端の2角が45°となる直角二等辺三角形の頂点(網点)A,Bの座標を算出する(S102)。なお、2つ網点(黒画素の連結成分)が左右に隣接する場合はx座標間を一辺とする。 Next, the halftone dot determination unit 13 selects the center coordinates (x of two halftone dots (black pixel connected components) adjacent to each other above and below the central coordinates of the removed halftone dots (black pixel connected components). (Coordinate, y coordinate) is read from the halftone dot position information storage unit 32, a flag indicating that the two halftone dots are processed is attached, and the y coordinate between the two halftone dots P as shown in FIG. And the coordinates of vertices (halftone dots) A and B of a right-angled isosceles triangle where the two corners of the side are 45 ° are calculated (S102). When two halftone dots (connected components of black pixels) are adjacent to the left and right, the side between the x coordinates is defined as one side.

そして、網点判定部13は、処理対象画像記憶部31から第1網点除去画像を読み出して、それぞれの頂点(網点)A,Bに位置する、第1網点除去画像上の画素が白画素か黒画素かを判定する(S103)。   Then, the halftone dot determination unit 13 reads out the first halftone dot removal image from the processing target image storage unit 31, and the pixels on the first halftone dot removal image located at the respective vertices (halftone dots) A and B are detected. It is determined whether the pixel is white or black (S103).

この例では、頂点(網点)Aの位置は、第1網点除去画像において既に消去された網点の位置であるため白画素であり、頂点(網点)Bの位置は、第1網点除去画像上では文字にかかっているため黒画素となっている。   In this example, the position of the vertex (halftone dot) A is a white pixel since it is the position of the halftone dot already deleted in the first halftone dot removal image, and the position of the vertex (halftone dot) B is the position of the first halftone dot. On the point-removed image, it is a black pixel because it covers the character.

円周計算部14は、図6に示すように、網点判定部13により黒画素と判定された頂点(網点)Bの位置を中心として、円周を求める計算式の径の値の初期値として、予め設定されている下限値minの5ピクセルを代入して(S104)、円周座標を計算する(S105)。初期値は、この例では下限値minとしたが、他の値でも良く変更可能である。   As shown in FIG. 6, the circumference calculation unit 14 sets an initial value of the diameter of a calculation formula for obtaining a circle around the position of the vertex (halftone dot) B determined as a black pixel by the halftone dot determination unit 13. As a value, 5 pixels of a preset lower limit value min are substituted (S104), and circumferential coordinates are calculated (S105). The initial value is the lower limit value min in this example, but other values may be changed.

円周計算部14により円周座標が計算されると、区分点判定部15は、その円周座標上にある第1網点除去画像の全ての画素の色を検出し、検出した円周座標上の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する(S106)。   When the circumference calculation unit 14 calculates the circumference coordinates, the segment point determination unit 15 detects the colors of all the pixels of the first halftone dot removal image on the circumference coordinates, and detects the detected circumference coordinates. It is determined whether or not the upper pixel has been divided into two: a continuous white pixel and a continuous black pixel (S106).

図6に示すように、この例では、初期値では円周61が第1網点除去画像の網点領域よりも十分小さいため、円周座標上の画素は全て黒画素である。   As shown in FIG. 6, in this example, since the circumference 61 is sufficiently smaller than the halftone dot region of the first halftone dot removal image in the initial value, all the pixels on the circumferential coordinate are black pixels.

このように円周座標上の画素が白画素と黒画素に2分されない場合(S106のNo)、区分点判定部15は、円周計算部14に対して円周を再計算するよう指示する。   As described above, when the pixel on the circumferential coordinate is not divided into the white pixel and the black pixel (No in S106), the division point determination unit 15 instructs the circumference calculation unit 14 to recalculate the circumference. .

円周の再計算にあたり、円周計算部14は、直前の直径Sの値から増分Δ(例えば1ピクセル)をプラスして(S107)、直径Sが網点の最大値maxを超えたか否かを判定する(S108)。最大値maxおよび増分Δの値は予め設定されている値であり、修正可能である。   In the recalculation of the circumference, the circumference calculation unit 14 adds an increment Δ (for example, 1 pixel) from the value of the diameter S immediately before (S107), and whether or not the diameter S exceeds the maximum value max of the halftone dot. Is determined (S108). The maximum value max and the value of the increment Δ are preset values and can be corrected.

この判定の結果、最大値maxを超えていない場合(S108のNo)、円周計算部14は、S105の処理に戻り、再度円周を計算する。この計算は、2分されない間、網点の最大値maxの、例えば15ピクセル程度まで繰り返される。つまり、除去した網点の径よりも円周が十分大きくなるまで繰り返される。   As a result of this determination, when the maximum value max is not exceeded (No in S108), the circumference calculation unit 14 returns to the process in S105 and calculates the circumference again. This calculation is repeated until the halftone dot maximum value max, for example, about 15 pixels, is not divided into two. That is, the process is repeated until the circumference becomes sufficiently larger than the diameter of the removed halftone dot.

円周計算を繰り返している間に、円の直径Sが網点の最大値maxを超えた場合(S108のYes)、円周計算部14は、S102の処理に戻り、除去した中で、フラグが付されていない任意の2つの網点(黒画素の連結成分)の中心座標を読み出して今までの処理を繰り返す。   If the circle diameter S exceeds the halftone maximum value max while repeating the circle calculation (Yes in S108), the circle calculation unit 14 returns to the process in S102 and removes the flag The center coordinates of any two halftone dots (connected components of black pixels) not marked with are read and the processing so far is repeated.

そして、除去した全ての隣接する網点の組合せについて処理を行った場合(S110のYes)、処理を終了する。   Then, when processing is performed for all the combinations of adjacent halftone dots that have been removed (Yes in S110), the processing ends.

上記円周座標計算を繰り返した結果、図7に示すように、円周61が連続する白画素61aと連続する黒画素61bとに2分された場合、区分点判定部15により、連続する白画素と連続する黒画素とに2分されたものと判定される(S106のYes)。なお図面上、点線で示す円の色が白画素と黒画素とが逆になっている。   As a result of repeating the circumferential coordinate calculation, when the circumference 61 is divided into two continuous white pixels 61a and continuous black pixels 61b as shown in FIG. It is determined that the pixel is divided into two continuous black pixels (Yes in S106). In the drawing, the color of the circle indicated by the dotted line is reversed between the white pixel and the black pixel.

この場合、第2画像処理部16は、図8に示すように、白画素と黒画素との区分点62間を直線63で結んで第1網点除去画像60を2つの領域に区分し、円周の白画素の側にある黒画素の領域64を除去して第2網点除去画像を生成し、生成した第2網点除去画像を第2網点除去画像記憶部34に記憶する。
換言すると、第2画像処理部16は、直線63と円周の白画素61aで囲まれた領域を白画素に置換する(塗りつぶす)。つまり、第2画像処理部16は、区分点62間を結ぶ直線63で2分された文字の外側の黒画素の領域を消去する(S109)。
In this case, as shown in FIG. 8, the second image processing unit 16 divides the first halftone dot removed image 60 into two regions by connecting the dividing points 62 of the white pixels and the black pixels with a straight line 63, The black pixel region 64 on the white pixel side of the circumference is removed to generate a second halftone dot removal image, and the generated second halftone dot removal image is stored in the second halftone dot removal image storage unit 34.
In other words, the second image processing unit 16 replaces (fills) the area surrounded by the straight line 63 and the circumferential white pixel 61a with the white pixel. That is, the second image processing unit 16 erases the black pixel region outside the character divided by the straight line 63 connecting the segment points 62 (S109).

この結果、図9に示すように、第1網点除去画像で文字画像65から突出していた網点66が消去されて、文字のラインに忠実な、なめらかな文字画像67が得られる。   As a result, as shown in FIG. 9, the halftone dots 66 protruding from the character image 65 in the first halftone dot removal image are erased, and a smooth character image 67 faithful to the character line is obtained.

その後、文字認識部17は、文字の外縁から突出していた網点が除去された第2網点除去画像を第2網点除去画像記憶部34から読み出し、その第2網点除去画像に対して辞書データ記憶部36の辞書データを用いて文字認識処理を行い、文字認識処理の結果を記憶装置3に記憶する。   Thereafter, the character recognizing unit 17 reads out the second halftone dot removed image from which the halftone dots protruding from the outer edge of the character are removed from the second halftone dot removed image storage unit 34, and applies the second halftone dot removed image to the second halftone dot removed image. Character recognition processing is performed using the dictionary data in the dictionary data storage unit 36, and the result of the character recognition processing is stored in the storage device 3.

文字認識処理は、帳票定義に従って第2処理画像から文字画像を切り出す処理や、切り出した文字画像と辞書データ記憶部36の辞書データとをマッチングし、合致度の高い文字コードを選出し、その文字コードと文字画像とを認識結果記憶部37に記憶する処理などが含まれる。   Character recognition processing includes processing for cutting out a character image from the second processed image according to the form definition, matching the cut out character image with dictionary data in the dictionary data storage unit 36, selecting a character code having a high degree of matching, and selecting the character A process of storing the code and the character image in the recognition result storage unit 37 is included.

続いて、図10乃至図13を参照してこの文字認識装置の他の動作例について説明する。まず、図10を参照して第2動作例について説明する。上記動作例では、網点が斜めに並んでいる網掛けを除去したが、この第2動作例では、図2に示したS101の処理において、第1画像処理部12は、所定の径以下の網点を除去したときの網点の中心座標の分布(配置または並び)から、網掛けのパターンが正方形パターンかひし形パターンかを識別する。   Subsequently, another operation example of the character recognition apparatus will be described with reference to FIGS. 10 to 13. First, a second operation example will be described with reference to FIG. In the above operation example, shading in which halftone dots are diagonally arranged is removed. However, in the second operation example, in the processing of S101 shown in FIG. 2, the first image processing unit 12 has a predetermined diameter or less. Whether the halftone pattern is a square pattern or a rhombus pattern is identified from the distribution (arrangement or arrangement) of the center coordinates of the halftone dots when the halftone dots are removed.

正方形パターンの場合、次のS102の処理において、網点判定部13は、除去した網点(黒画素の連結成分)の中心座標のうちの任意の上下に隣接する2つ網点(黒画素の連結成分)の中心座標(x座標,y座標)を網点位置情報記憶部32から読み出して、その2つの網点(黒画素の連結成分)の組について処理済みを示すフラグを付し、図10に示すように、上下に隣接する2つの網点Pのy座標間を一辺とする正方形を、辺の左右に2つ作成し、それぞれの頂点(網点)A,B,C,Dの座標を算出する。 A square pattern, the processing of the next S102, the halftone determining section 13, any two halftone (black pixels vertically adjacent to one of the center coordinates of the removed dot (connected component of black pixels) Read out the center coordinates (x coordinate, y coordinate) of the halftone dots) from the halftone dot position information storage unit 32, and attach a flag indicating that the two halftone dots (black pixel connected components) have been processed, As shown in FIG. 10, two squares having one side between the y-coordinates of two halftone dots P that are adjacent vertically are created on the left and right sides of the sides, and the respective vertices (halftone dots) A, B, C, D The coordinates of are calculated.

以降の処理は、図2のフローチャートの処理と同様である。この第2動作例によれば、網点が縦横に並んでいる網掛け(正方形パターン)の場合にも対応でき、文字に接触した網点を除去できる。   The subsequent processing is the same as the processing in the flowchart of FIG. According to this second operation example, it is possible to deal with the case of halftone dots (square pattern) in which halftone dots are arranged vertically and horizontally, and halftone dots in contact with characters can be removed.

図11を参照して第3動作例について説明する。この例では、図2のS101の処理において、第1画像処理部12は、除去した網点(黒画素の連結成分)の中の任意の2つの隣接する網点Pの中心座標から、互いの間の距離と方向を算出する。   A third operation example will be described with reference to FIG. In this example, in the processing of S101 in FIG. 2, the first image processing unit 12 determines the mutual coordinates from the center coordinates of any two adjacent halftone dots P in the removed halftone dots (black pixel connected components). Calculate the distance and direction between them.

続いて、第1画像処理部12は、図11に示すように、算出した網点P間の距離と方向に従って網点P間を結ぶ辺を延長して画像全面の網点の位置(中心座標)を算出する。   Subsequently, as shown in FIG. 11, the first image processing unit 12 extends the side connecting the halftone dots P according to the calculated distance and direction between the halftone dots P, and the positions of the halftone dots (center coordinates) on the entire surface of the image. ) Is calculated.

以降の処理は、図2のフローチャートの処理と同様であり、算出された網点の位置(中心座標)が黒画素であった場合に、その位置を中心に円周を計算し、文字に重なった網点を消去する。この第3動作例によれば、消去した網点から離れて文字画像の反対側の縁で文字と繋がった網点も消去することができる。   The subsequent processing is the same as the processing in the flowchart of FIG. 2, and when the calculated halftone dot position (center coordinate) is a black pixel, the circumference is calculated around that position and overlapped with the character. Erase halftone dots. According to the third operation example, halftone dots that are apart from the erased halftone dots and are connected to the characters at the opposite edge of the character image can be erased.

図12,図13を参照して第4動作例について説明する。スキャナ22の解像度が低い場合等、図12に示すように、網点よりも大きく網点とほぼ変わらない大きさの微小な連結成分、例えばピリオドや濁点等の画像が網点と重なったことで乱れる場合がある。   A fourth operation example will be described with reference to FIGS. When the resolution of the scanner 22 is low or the like, as shown in FIG. 12, an image of a minute connected component that is larger than the halftone dot and almost the same as the halftone dot, such as a period or a cloud point, is overlapped with the halftone dot. May be disturbed.

このような場合、上記実施形態では、ピリオドが線分Xの位置で削られることになるため、図13に示すように、元の文字画像(ピリオド)よりも文字の形状が悪化してしまう。   In such a case, in the above-described embodiment, the period is cut at the position of the line segment X, so that the character shape is worse than the original character image (period) as shown in FIG.

そこで、この第4動作例では、除去しようとする連結成分と網点の大きさとを比較して互いの差(面積の差等)を調べ、互いの差が所定の値に満たない場合、つまりあまり差がない場合、S109の消去処理をスキップする。   Therefore, in this fourth operation example, the connected component to be removed and the size of the halftone dot are compared to check each other's difference (area difference, etc.). If there is not much difference, the erasure process in S109 is skipped.

これにより、微小な連結成分については、重なっている網点の削除を行わない方が画像の乱れが小さい場合が多いため、「連結成分と網点の大きさの差が所定の値に満たない場合に消去処理を行わない」という条件を入れることで文字認識精度を高めることができる。   As a result, for small connected components, it is often the case that image disturbance is less when the overlapping halftone dots are not deleted. Therefore, the difference between the size of the connected components and the halftone dots is less than a predetermined value. The character recognition accuracy can be improved by including a condition that “the deletion process is not performed in some cases”.

このようにこの実施形態の文字認識装置によれば、始めに、画像から、文字自体に関連しない部分の網点を除去して第1網点除去画像を生成し、次に、除去した網点の位置から、文字と接触または文字の中に含まれる網点の中心位置を特定し、その中心位置から計算した円周上の黒画素と白画素の分布を調べる。そして、円周が、連続する黒画素と連続する白画素とに2分された時点で、その2分された区分点を結んで第1網点除去画像を区分し、円周の白画素の側に位置する黒画素を除去して第2網点除去画像を生成し、この第2網点除去画像を用いて文字認識を行う。これにより、帳票21の網掛け画像から網掛け部分を高速かつ高精度に除去し文字認識精度を向上できる。   Thus, according to the character recognition device of this embodiment, first, a halftone dot that is not related to the character itself is removed from the image to generate a first halftone dot removal image, and then the removed halftone dot is created. From this position, the center position of the halftone dot included in the character or contact with the character is specified, and the distribution of black pixels and white pixels on the circumference calculated from the center position is examined. Then, when the circumference is divided into two continuous black pixels and continuous white pixels, the first halftone dot removal image is divided by connecting the divided division points, and the white pixels of the circumference are divided. A black pixel located on the side is removed to generate a second halftone dot removed image, and character recognition is performed using the second halftone dot removed image. As a result, it is possible to remove the shaded portion from the shaded image of the form 21 at high speed and with high accuracy to improve the character recognition accuracy.

すなわち、この実施形態の文字認識装置によれば、網掛け画像に含まれる文字の画像に重なる網点を、文字の形状をできるだけ損なうことなく除去できる。つまり文字の画像に重なる網点を、文字にできるだけ忠実に除去して文字認識精度を向上することができる。   That is, according to the character recognition device of this embodiment, it is possible to remove halftone dots that overlap the character image included in the shaded image without damaging the character shape as much as possible. That is, the halftone dots that overlap the character image can be removed as faithfully as possible to improve the character recognition accuracy.

なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。また、上記実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の発明を構成できる。   In addition, this invention is not limited only to the said embodiment, You may deform | transform a component in the range which does not deviate from the summary in an implementation stage. Moreover, various inventions can be configured by appropriately combining a plurality of components disclosed in the embodiment.

例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

本発明の一実施形態の文字認識装置の構成を示す図である。It is a figure which shows the structure of the character recognition apparatus of one Embodiment of this invention. 文字認識装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a character recognition apparatus. 網点がひし形の頂点にある網掛け画像の一例を示す図である。It is a figure which shows an example of the shaded image in which a halftone dot is at the apex of a rhombus. 網掛け画像から網点を除去して生成した第1網点除去画像を示す図である。It is a figure which shows the 1st halftone dot removal image produced | generated by removing a halftone dot from a halftone image. 除去した任意の隣接する2つの網点の位置から、第1網点除去画像の文字にかかる網点の位置を特定する動作を説明するための図である。It is a figure for demonstrating the operation | movement which pinpoints the position of the halftone dot concerning the character of a 1st halftone dot removal image from the position of the arbitrary adjacent halftone dots removed. 文字にかかった除去対象の網点の中心から円周座標を計算する動作を説明するための図である。It is a figure for demonstrating the operation | movement which calculates a circumferential coordinate from the center of the halftone dot of the removal target concerning a character. 円の径を増分ずつ徐々に大きくしていったときに円周が白画素と黒画素に2分された状態を示す図である。It is a figure which shows the state by which the circumference was divided into 2 by the white pixel and the black pixel, when the diameter of a circle was gradually enlarged every increment. 2分された位置で区分点間を結んで、円周の白画素の側にある第1網点除去画像の黒画素の領域を削除した様子を示す図である。It is a figure which shows a mode that the area | region of the black pixel of the 1st halftone dot removal image in the side of the white pixel of the circumference was connected by connecting the division points in the position divided into two. 第1網点除去画像の文字画像と第2網点除去画像の文字画像とを比較して示す図である。It is a figure which compares and shows the character image of a 1st halftone dot removal image, and the character image of a 2nd halftone dot removal image. 文字認識装置において、網点が正方形の頂点にある場合に、除去した網点の中心座標を求める動作を説明するための図である。FIG. 10 is a diagram for explaining an operation for obtaining the center coordinates of a removed halftone dot when the halftone dot is at a square vertex in the character recognition device. 網点がひし形の頂点にある場合に、離れた文字画像の縁の位置に網点の中心位置を求める動作を説明するための図である。It is a figure for demonstrating the operation | movement which calculates | requires the center position of a halftone dot in the position of the edge of the separated character image when a halftone dot exists in the vertex of a rhombus. 網点とほぼ同じ大きさの連結成分(文字の一部)が存在する例を示す図である。It is a figure which shows the example in which the connection component (a part of character) of the magnitude | size substantially the same as a halftone dot exists. 図12の連結成分を除去した場合の様子を示す図である。It is a figure which shows a mode when the connection component of FIG. 12 is removed.

符号の説明Explanation of symbols

1…コンピュータ(PC)、3…記憶装置、11…入力インターフェース部(入力I/F)、12…第1画像処理部、13…網点判定部、14…円周計算部、15…区分点判定部、16…第2画像処理部、17…文字認識部、18…出力インターフェース部(出力I/F)、20…入力ユニット、21…帳票、22…スキャナ、31…処理対象画像記憶部、32…網点位置情報記憶部、33…第1網点除去画像記憶部、34…第2網点除去画像記憶部、35…帳票定義記憶部、36…辞書データ記憶部、37…認識結果記憶部。   DESCRIPTION OF SYMBOLS 1 ... Computer (PC), 3 ... Memory | storage device, 11 ... Input interface part (input I / F), 12 ... 1st image processing part, 13 ... Halftone dot determination part, 14 ... Circumference calculation part, 15 ... Division point Determining unit, 16 ... second image processing unit, 17 ... character recognition unit, 18 ... output interface unit (output I / F), 20 ... input unit, 21 ... form, 22 ... scanner, 31 ... processing target image storage unit, 32 ... halftone dot position information storage unit, 33 ... first halftone dot removal image storage unit, 34 ... second halftone dot removal image storage unit, 35 ... form definition storage unit, 36 ... dictionary data storage unit, 37 ... recognition result storage Department.

Claims (7)

規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置において、
記憶装置と、
前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、
前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、
前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、
前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、
前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、
前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、
前記第2処理画像に対して文字認識を行う文字認識手段と
を具備することを特徴とする文字認識装置。
In a character recognition device for recognizing characters from a shaded image shaded by regularly dotted dots,
A storage device;
From the shaded image, and detects the center position of the pixel connected components under size or less of the preset said dot, said hatching and positional information of the center position of the detected pixel connected components, the pre-Symbol pixel connected components First halftone dot removing means for storing the first processed image removed from the image in the storage device;
Other adjacent to any of the position information of the two adjacent pixels connected component is read out from the storage device, the two pixel connected components in accordance with the arrangement pattern or calculation rule preset dot of the position information Other point position calculating means for calculating the position of the pixel connected component of
Halftone dot determining means for determining whether the pixel of the first processed image at the position of the calculated other pixel connected component is a white pixel or a black pixel;
Centering on a position determined as a black pixel by the halftone dot judging means, a circumference calculating means for calculating a circumferential coordinate in a range of a predetermined diameter that the halftone dot can take,
Demarcation point determination means for determining whether or not the pixels of the first processed image on the circumferential coordinates calculated by the circumference calculation means are divided into a continuous white pixel and a continuous black pixel;
The first processed image is segmented by connecting segment points of pixels of two colors determined to be divided by the segment point determination means, and black pixels on the white pixel side of the circumference are removed. A second halftone dot removing unit for generating a second processed image;
A character recognition device comprising character recognition means for performing character recognition on the second processed image.
前記他点位置算出手段は、
消去された中の隣接する2つの画素連結成分のx座標間またはy座標間を一辺とし両端の角度が45°の直角二等辺三角形を作成し、その頂点の座標を算出することを特徴とする請求項1記載の文字認識装置。
The other point position calculating means includes:
Creating a right-angled isosceles triangle with one side between the x-coordinates or y-coordinates of two adjacent pixel connected components that have been deleted and an angle at both ends of 45 °, and calculating the vertex coordinates The character recognition device according to claim 1.
前記他点位置算出手段は、
消去された中の隣接する2つの画素連結成分のx座標間またはy座標間を一辺とする正方形を作成し、その頂点の座標を算出することを特徴とする請求項1記載の文字認識装置。
The other point position calculating means includes:
2. The character recognition apparatus according to claim 1, wherein a square having one side between the x coordinates or the y coordinates of two adjacent pixel connected components in the erased area is created, and the coordinates of the vertex are calculated.
前記他点位置算出手段は、
除去された中の任意の2つの隣接する画素連結成分の中心座標から、互いの間の距離と方向を算出し、算出した画素連結成分間の距離と方向に従って互いの間を結ぶ線分を延長して画像全面の画素連結成分の中心座標を算出することを特徴とする請求項1記載の文字認識装置。
The other point position calculating means includes:
Calculate the distance and direction between each other from the center coordinates of any two adjacent pixel connected components that have been removed, and extend the line segment connecting each other according to the calculated distance and direction between the pixel connected components The character recognition apparatus according to claim 1, wherein center coordinates of pixel connected components of the entire image are calculated.
前記第2網点除去手段は、
除去対象の画素連結成分と網点の大きさとを比較して互いの差が所定の値に満たない画素連結成分については消去しないことを特徴とする請求項1記載の文字認識装置。
The second halftone dot removing means includes
2. The character recognition apparatus according to claim 1, wherein the pixel connection component to be removed is compared with the size of the halftone dot, and the pixel connection component whose difference is less than a predetermined value is not deleted.
規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置における文字認識方法において、
前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、前記画素連結成分を前記網掛け画像から除去した第1処理画像とを記憶装置に記憶するステップと、
前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出するステップと、
前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定するステップと、
前記黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算するステップと、
前記計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定するステップと、
前記2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成するステップと、
前記第2処理画像に対して文字認識を行うステップと
を有することを特徴とする文字認識方法。
In a character recognition method in a character recognition device for recognizing characters from a shaded image shaded by regularly dotted halftone dots,
From the shaded image, and detects the center position of the pixel connected components under size or less of the preset said dot, said hatching and positional information of the center position of the detected pixel connected components, the pre-Symbol pixel connected components Storing the first processed image removed from the image in a storage device;
Other adjacent to any of the position information of the two adjacent pixels connected component is read out from the storage device, the two pixel connected components in accordance with the arrangement pattern or calculation rule preset dot of the position information Calculating the position of the pixel connected component of
Determining whether the pixel of the first processed image at the position of the calculated other pixel connected component is a white pixel or a black pixel;
Centering on the position determined to be the black pixel, calculating a circumferential coordinate in a range of a predetermined diameter that the halftone dot can take;
Determining whether the pixels of the first processed image on the calculated circumferential coordinate are bisected into a continuous white pixel and a continuous black pixel;
The first processing image is divided by connecting the dividing points of the two color pixels determined to be divided into two, and the black pixel on the white pixel side of the circumference is removed to perform the second processing. Generating an image; and
And a step of performing character recognition on the second processed image.
規則的に点在する網点によって網掛けされた網掛け画像から文字を認識する文字認識装置を動作させるプログラムにおいて、
前記文字認識装置を、
記憶装置と、
前記網掛け画像から、予め設定された前記網点の径以下の画素連結成分の中心位置を検出し、検出された画素連結成分の中心位置の位置情報と、前記画素連結成分を前記網掛け画像から除去した第1処理画像とを前記記憶装置に記憶する第1網点除去手段と、
前記位置情報のうち任意の隣接する2つ画素連結成分の位置情報を前記記憶装置から読み出して、予め設定された網点の配置パターンまたは計算ルールに従って前記2つ画素連結成分に近接する他の画素連結成分の位置を算出する他点位置算出手段と、
前記算出された他の画素連結成分の位置の、前記第1処理画像の画素が白画素か黒画素かを判定する網点判定手段と、
前記網点判定手段により黒画素と判定された位置を中心とし、前記網点がとり得る所定の径の範囲で円周座標を計算する円周計算手段と、
前記円周計算手段により計算された円周座標上にある前記第1処理画像の画素が、連続する白画素と連続する黒画素とに2分されたか否かを判定する区分点判定手段と、
前記区分点判定手段により2分されたものと判定された2つの色の画素の区分点間を結んで前記第1処理画像を区分し、前記円周の白画素の側にある黒画素を除去して第2処理画像を生成する第2網点除去手段と、
前記第2処理画像に対して文字認識を行う文字認識手段
として機能させることを特徴とする文字認識プログラム。
In a program for operating a character recognition device for recognizing characters from a shaded image shaded by regularly dotted halftone dots,
The character recognition device;
A storage device;
From the shaded image, and detects the center position of the pixel connected components under size or less of the preset said dot, said hatching and positional information of the center position of the detected pixel connected components, the pre-Symbol pixel connected components First halftone dot removing means for storing the first processed image removed from the image in the storage device;
Other adjacent to any of the position information of the two adjacent pixels connected component is read out from the storage device, the two pixel connected components in accordance with the arrangement pattern or calculation rule preset dot of the position information Other point position calculating means for calculating the position of the pixel connected component of
Halftone dot determining means for determining whether the pixel of the first processed image at the position of the calculated other pixel connected component is a white pixel or a black pixel;
Centering on a position determined as a black pixel by the halftone dot judging means, a circumference calculating means for calculating a circumferential coordinate in a range of a predetermined diameter that the halftone dot can take,
Demarcation point determination means for determining whether or not the pixels of the first processed image on the circumferential coordinates calculated by the circumference calculation means are divided into a continuous white pixel and a continuous black pixel;
The first processed image is segmented by connecting segment points of pixels of two colors determined to be divided by the segment point determination means, and black pixels on the white pixel side of the circumference are removed. A second halftone dot removing unit for generating a second processed image;
A character recognition program that functions as character recognition means for performing character recognition on the second processed image.
JP2006322316A 2006-11-29 2006-11-29 Character recognition device, character recognition method, and character recognition program Expired - Fee Related JP4435141B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006322316A JP4435141B2 (en) 2006-11-29 2006-11-29 Character recognition device, character recognition method, and character recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006322316A JP4435141B2 (en) 2006-11-29 2006-11-29 Character recognition device, character recognition method, and character recognition program

Publications (2)

Publication Number Publication Date
JP2008134970A JP2008134970A (en) 2008-06-12
JP4435141B2 true JP4435141B2 (en) 2010-03-17

Family

ID=39559773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006322316A Expired - Fee Related JP4435141B2 (en) 2006-11-29 2006-11-29 Character recognition device, character recognition method, and character recognition program

Country Status (1)

Country Link
JP (1) JP4435141B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020089984A1 (en) * 2018-10-29 2020-05-07 株式会社Pfu Image processing device, control method, and control program

Also Published As

Publication number Publication date
JP2008134970A (en) 2008-06-12

Similar Documents

Publication Publication Date Title
US7269298B2 (en) Image processing device, image processing method, and record medium on which the same is recorded
KR101447932B1 (en) Image processing device and image processing method
JP5017031B2 (en) Image processing apparatus, image processing method, image processing program, and storage medium
US8300946B2 (en) Image processing apparatus, image processing method, and computer program
US20080018951A1 (en) Image processing apparatus and control method thereof
JP2009003936A (en) Text direction-determining method in digital image, system, control program, and recording medium
EP2782065B1 (en) Image-processing device removing encircling lines for identifying sub-regions of image
JP5049922B2 (en) Image processing apparatus and image processing method
JP5067882B2 (en) Image processing apparatus, image processing method, and program
JP2010074342A (en) Image processing apparatus, image forming apparatus, and program
JP5335581B2 (en) Image processing apparatus, image processing method, and program
JP4435141B2 (en) Character recognition device, character recognition method, and character recognition program
US20110187721A1 (en) Line drawing processing apparatus, storage medium storing a computer-readable program, and line drawing processing method
JP2010011450A (en) Image-forming device and image processing method
JP2007109177A (en) Image processing apparatus, its control method, and program
JP4873554B2 (en) Image distribution apparatus and image distribution method
JP4208520B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP4825888B2 (en) Document image processing apparatus and document image processing method
JP3698867B2 (en) Circular pattern determination method, apparatus and recording medium
US6661535B1 (en) Moire fringe eliminating apparatus and a method for eliminating moire fringes
JP4070486B2 (en) Image processing apparatus, image processing method, and program used to execute the method
JP2008269131A (en) Image processor and image processing program
JP6613625B2 (en) Image processing program, image processing apparatus, and image processing method
JP2008206037A (en) Image processing apparatus and image processing program
JP3566738B2 (en) Shaded area processing method and shaded area processing apparatus

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091222

R150 Certificate of patent or registration of utility model

Ref document number: 4435141

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140108

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees