JP5054472B2 - Character recognition device and character recognition method in character recognition device - Google Patents

Character recognition device and character recognition method in character recognition device Download PDF

Info

Publication number
JP5054472B2
JP5054472B2 JP2007235246A JP2007235246A JP5054472B2 JP 5054472 B2 JP5054472 B2 JP 5054472B2 JP 2007235246 A JP2007235246 A JP 2007235246A JP 2007235246 A JP2007235246 A JP 2007235246A JP 5054472 B2 JP5054472 B2 JP 5054472B2
Authority
JP
Japan
Prior art keywords
character
image
dropout
character recognition
cutout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007235246A
Other languages
Japanese (ja)
Other versions
JP2009069951A (en
Inventor
博文 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP2007235246A priority Critical patent/JP5054472B2/en
Publication of JP2009069951A publication Critical patent/JP2009069951A/en
Application granted granted Critical
Publication of JP5054472B2 publication Critical patent/JP5054472B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、帳票表面の画像を読み込むことにより文字の認識をする文字認識装置に関し、特に、帳票上におけるドロップアウトカラーの画像も、非ドロップアウトカラーの画像も、どちらも読み込める文字認識装置に関するものである。   The present invention relates to a character recognition apparatus that recognizes characters by reading an image on the surface of a form, and more particularly to a character recognition apparatus that can read both a dropout color image and a non-dropout color image on a form. It is.

従来から、はがき、伝票、アンケート、テストの解答用紙等の様々な帳票に記載された文字、記号等を認識する装置として文字認識装置が使用されている。一般に文字認識装置に読み込まれる帳票は、人の目には見えるが文字認識装置では読み込めない色であるドロップアウトカラーで印刷された部分と、文字認識装置で読み込むことが可能な色である非ドロップアウトカラーで印刷された部分とを含んでいる。   Conventionally, a character recognition device has been used as a device for recognizing characters, symbols, and the like described in various forms such as postcards, slips, questionnaires, and test answer sheets. In general, a form that is read by a character recognition device is a portion that is printed in a dropout color that is visible to the human eye but cannot be read by the character recognition device, and a non-drop that is a color that can be read by the character recognition device. Parts printed in out color.

従来の文字認識装置は、帳票を1枚ずつ次々と搬送し、搬送しながら帳票表面の画像を1枚ずつ読み込み、読み込んだ画像中の文字、記号等のうち帳票端から決められた位置にある文字、記号等の画像を切り取って、切り取った画像を認識対象として認識していた。   The conventional character recognition apparatus conveys the form one by one, reads the image on the surface of the form one by one while conveying it, and is in a position determined from the edge of the form among characters, symbols, etc. in the read image. Images such as characters and symbols are cut out, and the cut out images are recognized as recognition targets.

しかしながら、帳票を搬送しながら画像の読み込みをしている最中に搬送の遅れ等の搬送誤差が発生した場合、読み込んだ画像が伸長することによって帳票端から決められた位置に本来有るはずの認識対象文字等がずれて別の場所に存在することになる。このため、帳票端から決められた位置の画像を切り取っても、認識対象の文字画像を正しく切り取ることができないため、認識対象の文字がうまく認識ができないという問題があった。   However, if a transport error such as a transport delay occurs during the reading of an image while transporting a form, it recognizes that it should be at the position determined from the end of the form by expanding the read image. The target character or the like is shifted and exists in another place. For this reason, there is a problem that even if the image at the position determined from the edge of the form is cut out, the character image to be recognized cannot be cut out correctly, so that the character to be recognized cannot be recognized well.

画像の読み込み中に搬送誤差が発生しても搬送誤差を補正し、文字画像を正しく切り取ることができる文字認識装置として、「文字認識装置及び文字認識方法」(特許文献1)が提案されている。   “Character recognition device and character recognition method” (Patent Document 1) has been proposed as a character recognition device that corrects a conveyance error even if a conveyance error occurs during image reading and can correctly cut out a character image. .

特許文献1に記載された文字認識装置は、複数の文字記入枠と、これらの文字枠それぞれに対応し、かつ、隣接して設けられたプレプリント情報とを持つ帳票のイメージに基づいて文字の切り取り、文字の認識を行うことを特徴としている。具体的には、前記文字認識装置は、プレプリント情報を利用して文字枠位置を補正し、位置の補正をした文字枠を基にして文字画像の切り出しを行い、切り出した文字画像から文字の認識を行う。   The character recognition device described in Patent Literature 1 is based on a form image having a plurality of character entry frames and preprint information corresponding to each of these character frames and provided adjacent to each other. It is characterized by cutting out and recognizing characters. Specifically, the character recognition device corrects a character frame position using preprint information, cuts out a character image based on the character frame whose position has been corrected, and extracts a character image from the cut out character image. Recognize.

これにより、画像の読み込み中に搬送誤差が発生しても、文字画像を正しく切り出すとともに、文字認識を正しく行うことができるとしている。
特開2002−109469号公報
As a result, even if a transport error occurs during image reading, the character image can be cut out correctly and the character can be recognized correctly.
JP 2002-109469 A

従来の文字認識装置は、画像の読み込み中に搬送誤差が発生した場合、読み込んだ画像が伸長することにより、認識対象文字の位置がずれるので、正しく文字画像を切り出すことができず、そのため、切り出した文字画像の認識を行っても文字が正確に認識できなかった。   In the conventional character recognition device, when a conveyance error occurs during reading of an image, the read image is expanded and the position of the character to be recognized is shifted. Therefore, the character image cannot be correctly cut out. Even if the character image was recognized, the characters could not be recognized correctly.

また、帳票のカットずれ、印刷ずれがあった場合も帳票表面上での文字位置がずれるので正しく文字画像を切り出すことができず、そのため、切り出した文字画像の認識を行っても文字が正確に認識できなかった。   In addition, even if there is a slippage deviation or printing slippage on the form, the character position on the form surface is misaligned, so the character image cannot be cut out correctly. Therefore, even if the cutout character image is recognized, the character is accurately I couldn't recognize it.

更に、特許文献1に記載された文字認識装置は、搬送誤差を補正するためのプレプリント情報を予め帳票に印刷しておく必要があり、従来の帳票を使用することができなかった。そのため、新たな帳票が必要となり、コスト高にもなっていた。   Furthermore, the character recognition apparatus described in Patent Document 1 needs to print preprint information for correcting a conveyance error on a form in advance, and cannot use a conventional form. For this reason, a new form is required and the cost is high.

更にまた、特許文献1に記載された文字認識装置は、搬送誤差が発生していなくてもプレプリント情報に基づいて位置の補正処理を実施するので、処理速度が遅くなるという問題があった。   Furthermore, the character recognition device described in Patent Document 1 has a problem that the processing speed becomes slow because the position correction processing is performed based on the preprint information even if no transport error occurs.

本発明は、このような実情に鑑みてなされたものであり、文字の位置ずれが発生しても正しく文字認識が可能で、処理速度も遅くならない文字認識装置及び文字認識装置における文字認識方法を提供しようとするものである。   The present invention has been made in view of such circumstances, and provides a character recognition device capable of correctly recognizing a character even when a character misalignment occurs and does not slow down the processing speed, and a character recognition method in the character recognition device. It is something to be offered.

本発明の課題は、下記の各発明によって解決することができる。
すなわち、本発明の文字認識装置及び文字認識方法は、ドロップアウトカラーで印刷された文字枠を有する帳票の前記文字枠内に記載された文字の認識をする文字認識装置であって、
前記帳票上におけるドロップアウトカラーの画像も、非ドロップアウトカラーの画像も、どちらの画像も読み込むことができる全画像読み込み手段と、前記帳票上における非ドロップアウトカラーの画像のみ読み込むことができる文字画像読み込み手段と、前記帳票の端の位置を検出し、帳票端位置に関する情報を取得する帳票端検出手段と、前記帳票の端の位置を基準とした、帳票上における前記文字枠位置又は前記文字位置に関するフォーマットパラメータ指定位置が記憶されたフォーマットパラメータ記憶手段と、前記文字画像読み込み手段によって読み込んだドロップアウト画像から文字画像を切り出す文字切り出し手段と、前記文字切り出し手段によって切り出された文字画像から文字を認識する文字認識手段と、を備え、
前記文字切り出し手段が、
前記帳票端検出手段によって検出された帳票端に関する情報とフォーマットパラメータ記憶手段に記憶されているフォーマットパラメータ指定位置とを用いてドロップアウト画像上における文字配置位置と文字切り出し基準位置を算出する第1工程と、
前記第1工程によって算出した文字切り出し基準位置と配置位置とを比較し、前記基準位置と配列位置との位置ずれの有無を判定する第2工程と、
前記第2工程によって位置ずれがないと判定したとき、前記文字切り出し基準位置を基にして文字の切り出しを行う第3工程と、
前記第2工程によって位置ずれがあると判定したとき、全画像読み込み手段によって読み込んだ非ドロップアウト画像から前記第1工程によって算出した文字配置位置を基準とした読み取り領域内の文字枠位置を検出する第4工程と、
前記第4工程によって検出した文字枠位置に基づいて前記ドロップアウト画像から文字の切り出しを行う第5工程とを実行し、
前記文字認識手段が、前記第3工程又は第5工程によって切り出した文字の認識行う第6工程とを実行することを主な特徴としている。
The problems of the present invention can be solved by the following inventions.
That is, the character recognition device and the character recognition method of the present invention are character recognition devices for recognizing characters written in the character frame of a form having a character frame printed in dropout color,
All image reading means capable of reading both images of a dropout color and a non-dropout color on the form, and a character image capable of reading only a non-dropout color image on the form A reading means; a form edge detecting means for detecting the position of the edge of the form; and acquiring information relating to the edge position of the form; and the character frame position or the character position on the form based on the position of the edge of the form Format parameter storage means for storing format parameter designation positions, character cutout means for cutting out a character image from the dropout image read by the character image reading means, and recognition of characters from the character image cut out by the character cutout means Character recognition means for
The character cutout means is
A first step of calculating a character arrangement position and a character cutout reference position on the dropout image using information on the form edge detected by the form edge detection means and the format parameter designation position stored in the format parameter storage means. When,
A second step of comparing the character cutout reference position calculated in the first step with the arrangement position and determining whether or not there is a positional deviation between the reference position and the arrangement position;
A third step of cutting out characters based on the character cutout reference position when it is determined in the second step that there is no misalignment;
When it is determined that there is a displacement in the second step, the character frame position in the reading area is detected based on the character arrangement position calculated in the first step from the non-dropout image read by the whole image reading means. A fourth step;
Run a fifth step for cutting out a character from the dropout image based on the character frame position detected by said fourth step,
A main feature is that the character recognition means executes a sixth step of recognizing the character cut out in the third step or the fifth step.

これにより、帳票に記載された文字に位置ずれが発生していない場合は、文字切り出し基準位置の補正を行わないので、高速な文字認識処理が可能となり、位置ずれが発生している場合は、非ドロップアウト画像から認識した文字枠文字枠を基にして文字画像を切り出すことによって、文字の位置ずれが発生しても正しく文字認識を行うことができる。
Thus, if the positional deviation in the character described in the document does not occur, since not corrected character extraction reference position, speed character recognition processing is possible, if the positional displacement has occurred By cutting out the character image based on the character frame recognized from the non-dropout image, the character can be correctly recognized even if the character is misaligned.

更に、本発明は、前記文字切り出し手段が、前記ドロップアウト画像上における文字画像を最も小さい長方形で囲った場合の、前記長方形の画面上における縦方向の中心線と、前記文字切り出し基準位置を通って前記中心線に平行な直線との位置ずれ量を算出することによって前記位置ずれ量算出を行う。  Further, according to the present invention, the character cutout unit passes a vertical center line on the rectangular screen and the character cutout reference position when the character image on the dropout image is surrounded by the smallest rectangle. The positional deviation amount is calculated by calculating the positional deviation amount with respect to a straight line parallel to the center line.

更にまた、本発明は、前記文字切り出し手段が、前記ドロップアウト画像上における文字画像の重心を求め、前記重心と、前記文字切り出し基準位置とのずれ量を算出することによって前記位置ずれ量算出を行う。  Still further, in the present invention, the character cutout unit calculates the positional deviation amount by calculating a center of gravity of the character image on the dropout image and calculating a deviation amount between the center of gravity and the character cutout reference position. Do.

以上、説明したように、本発明の文字認識装置によれば、搬送誤差、帳票のカットずれ、帳票の印刷ずれ等により帳票上の文字位置がずれて認識された場合においても、文字を切り出すときは、ドロップアウト画像から切り出すので、ドロップアウトカラーで印刷された文字枠が切り出されることがなく、文字認識の障害となる文字以外の画像の切り出しを防ぎ、高精度な文字認識を可能とすることができる。 As described above, according to the character recognition device of the present invention, when a character is cut out even when the character position on the form is recognized to be misaligned due to conveyance error, form cut deviation, form print deviation, etc. Cuts out from the dropout image, so that the character frame printed in the dropout color is not cut out, and it is possible to prevent high-precision character recognition by preventing the cutting out of images other than the characters that hinder character recognition. Can do.

更に、帳票に記載された文字に位置ずれが発生していない場合は、文字切り出し基準位置の補正を行わないので、高速な文字認識処理を可能とすることができる。   Furthermore, when there is no positional deviation in the characters described in the form, the character extraction reference position is not corrected, so that high-speed character recognition processing can be performed.

以下、添付図面を参照しながら、本発明の文字認識装置を実施するための最良の形態を詳細に説明する。
<構成>
本発明の一実施形態に係る文字認識装置の構成について図を用いて説明する。図1は、本発明の一実施形態に係る文字認識装置の構成図である。
図1に示すように、本発明の文字認識装置は、画像読み込み手段1と、帳票端検出手段2と、文字切り出し手段3と、フォーマットパラメータ記憶手段4と、文字認識手段5とから構成されている。
The best mode for carrying out the character recognition device of the present invention will be described below in detail with reference to the accompanying drawings.
<Configuration>
A configuration of a character recognition device according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram of a character recognition apparatus according to an embodiment of the present invention.
As shown in FIG. 1, the character recognition apparatus of the present invention comprises an image reading means 1, a form edge detection means 2, a character cutout means 3, a format parameter storage means 4, and a character recognition means 5. Yes.

画像読み込み手段1は、全画像読み込み手段6と、文字画像読み込み手段7とから構成されている。
全画像読み込み手段6は、帳票表面に記載されているドロップアウトカラーで印刷された文字枠と、非ドロップアウトカラーで印刷された文字とをイメージセンサにより読み込む。イメージセンサには、CCDイメージセンサやCMOSイメージセンサなどを使用することができる。
The image reading means 1 comprises an all image reading means 6 and a character image reading means 7.
The all image reading means 6 reads the character frame printed in the dropout color described on the form surface and the character printed in the non-dropout color by the image sensor. As the image sensor, a CCD image sensor, a CMOS image sensor, or the like can be used.

ドロップアウトカラーとは、モノクロの画像読み込み手段でカラー原稿を読み込んだとき読み込むことのできない色のことを言い、通常は画像読み込み手段に使用されている光源の色がドロップアウトカラーに該当する。画像読み込み手段がカラー画像を読み込むことができる場合には、RGBのうちどれかの色をドロップアウトカラーに設定することができる。   The dropout color refers to a color that cannot be read when a color original is read by a monochrome image reading means, and usually the color of the light source used in the image reading means corresponds to the dropout color. If the image reading means can read a color image, any color of RGB can be set as a dropout color.

例えば、赤色をドロップアウトカラーに設定した場合は、RGBのうちR、即ち赤色(Red)と、読み込んだ部分とのコントラストの差をイメージとして読み込む。これにより、ドロップアウトカラーである赤色で印刷された部分は、赤色とコントラストの差がないので、イメージとして読み込むことができず、その部分だけ何も印刷されていないように読み込まれる。   For example, when red is set as the dropout color, the contrast difference between R of RGB, that is, red (Red), and the read portion is read as an image. As a result, the portion printed in red, which is the dropout color, has no difference in contrast with the red color, so that it cannot be read as an image, and the portion is read so that nothing is printed.

即ち、全画像読み込み手段6は、RGBのうちドロップアウトカラーに設定された色以外の色も読み込むことにより、ドロップアウトカラーで印刷された文字枠も読み込むことができる。以下、全画像読み込み手段6によって読み込まれた画像を非ドロップアウト画像と称する。   That is, the all-image reading means 6 can also read a character frame printed in the dropout color by reading colors other than those set as the dropout color among RGB. Hereinafter, the image read by the whole image reading means 6 is referred to as a non-dropout image.

文字画像読み込み手段7は、帳票表面に記載されている、非ドロップアウトカラーで記載された文字等をイメージセンサにより読み込むが、ドロップアウトカラーで印刷された文字枠等は読み込むことができない。以下、文字画像読み込み手段7によって読み込まれた画像をドロップアウト画像と称する。   The character image reading means 7 reads characters and the like written in the non-dropout color described on the surface of the form by the image sensor, but cannot read the character frame and the like printed in the dropout color. Hereinafter, the image read by the character image reading means 7 is referred to as a dropout image.

帳票端検出手段2は、画像読み込み手段1によって読み込まれた画像を基にして帳票端を検出する。また、帳票端検出手段は、画像認識ではなく光学センサや機械的センサによっても帳票端を認識することができる。   The form edge detection means 2 detects the form edge based on the image read by the image reading means 1. Further, the form edge detecting means can recognize the form edge not by image recognition but also by an optical sensor or a mechanical sensor.

文字切り出し手段3は、帳票端検出手段2によって検出された帳票端の位置情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置情報とから、帳票表面上において文字の記載されている位置を計算し、その位置にある文字画像を切り出す処理を行う。   The character cutout means 3 is based on the position information of the form edge detected by the form edge detection means 2 and the character position information with reference to the form edge stored in the format parameter storage means 4. The position described is calculated, and the character image at that position is cut out.

また、文字切り出し手段3は、帳票端検出手段2によって検出された帳票端の位置情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置情報のみならず、全画像読み込み手段6によって読み込まれた文字枠の画像を基にして、文字の記載されている位置を計算し、その位置にある文字画像を切り出す処理を行うこともできる。   The character cutout means 3 reads not only the position information of the form edge detected by the form edge detection means 2 and the character position information based on the form edge stored in the format parameter storage means 4, but also reads all images. Based on the image of the character frame read by the means 6, the position where the character is described can be calculated, and the character image at that position can be cut out.

これにより、帳票のイメージを読み込む際の帳票の搬送誤差などにより、帳票イメージが伸長して読み込まれても、文字枠の画像情報を使用することにより、文字の記載位置の位置ずれを補正して文字画像を切り出すことが可能となる。   As a result, even if the form image is expanded and read due to an error in carrying the form when reading the form image, the character frame image information is used to correct the misalignment of the character description position. A character image can be cut out.

フォーマットパラメータ記憶手段4には、前述の通り、帳票の端の辺を基準とした文字位置情報や、文字枠の位置情報などが記憶されている。文字認識手段5は、文字切り出し手段3によって切り出された文字画像を基にして、文字の認識を行う。   As described above, the format parameter storage unit 4 stores character position information with reference to the edge of the form, character frame position information, and the like. The character recognition unit 5 recognizes characters based on the character image cut out by the character cutout unit 3.

<全文字補正時の動作>
次に、本発明の一実施形態に係る文字認識装置の全文字補正時の動作について図を用いて説明する。図2(A)は、帳票を全画像読み込み手段6で読み込んだ例を示す図である。図2(B)は、帳票を文字画像読み込み手段7で読み込んだ例を示す図である。
<Operation when correcting all characters>
Next, the operation at the time of all character correction of the character recognition device according to the embodiment of the present invention will be described with reference to the drawings. FIG. 2A is a diagram showing an example in which a form is read by all image reading means 6. FIG. 2B is a diagram showing an example in which a form is read by the character image reading means 7.

まず、図2(A)を参照して説明する。全画像読み込み手段6は、帳票表面の画像の読み込みを行う。図2(A)に示すように、文字枠22と、文字23とが読み込まれている。ここで帳票上においては、文字枠22は、ドロップアウトカラーで印刷されており、文字23は、非ドロップアウトカラーで記載されている。   First, a description will be given with reference to FIG. The all image reading means 6 reads the image on the form surface. As shown in FIG. 2A, a character frame 22 and a character 23 are read. Here, on the form, the character frame 22 is printed in a dropout color, and the character 23 is described in a non-dropout color.

帳票端検出手段2は、読み込まれた帳票表面の画像から帳票の端の辺を認識することにより、帳票端を検出する。また、帳票端検出手段は、画像認識ではなく光学センサや機械的センサによっても帳票端を認識することができる。   The form edge detecting means 2 detects the edge of the form by recognizing the edge of the form from the read image on the surface of the form. Further, the form edge detecting means can recognize the form edge not by image recognition but also by an optical sensor or a mechanical sensor.

文字切り出し手段3は、帳票端検出手段2によって検出された帳票端位置に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置に関する情報とを用いて、非ドロップアウト画像上における文字が配置されている位置を計算する。次に、文字切り出し手段3は、計算された文字配置位置を基準とした予め定められた範囲の領域である、読み取り領域21内で文字枠22の認識を行い、認識した文字枠22を基に文字切り出し基準位置24を決定する。予め定められた範囲の領域である、前記読み取り領域21内で文字枠22の認識を行うことにより、帳票上に複数の文字枠があっても、誤認識することなく必要な文字枠を選択して認識することが可能となる。   The character cutout means 3 uses the information related to the form edge detected by the form edge detection means 2 and the information related to the character position stored with reference to the form edge stored in the format parameter storage means 4 to perform non-dropout. The position where the character is arranged on the image is calculated. Next, the character cutout unit 3 recognizes the character frame 22 in the reading area 21 which is an area in a predetermined range based on the calculated character arrangement position, and based on the recognized character frame 22. The character cutout reference position 24 is determined. By recognizing the character frame 22 in the reading area 21, which is an area of a predetermined range, even if there are a plurality of character frames on the form, a necessary character frame can be selected without being erroneously recognized. Can be recognized.

また、文字切り出し手段3は、帳票端検出手段2によって検出された帳票端位置に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字枠位置に関する情報を基にして、前記文字枠位置を基準として予め定められた範囲の領域である、読み取り領域内で文字枠22の認識を行い、認識した文字枠22を基に文字切り出し基準位置24を決定することもできる。予め定められた範囲の領域である、前記読み取り領域内で文字枠22の認識を行うことにより、帳票上に複数の文字枠があっても、誤認識することなく必要な文字枠を選択して認識することが可能となる。
更に、文字切り出し手段3は、非ドロップアウト画像全体から文字枠22の認識を行い、認識した文字枠を基にして文字切り出し基準位置24を決定することもできる。
Further, the character cutout means 3 is based on the information on the form edge position detected by the form edge detection means 2 and the information on the character frame position on the basis of the form edge stored in the format parameter storage means 4. It is also possible to recognize the character frame 22 within the reading area, which is an area within a predetermined range based on the character frame position, and to determine the character cutout reference position 24 based on the recognized character frame 22. By recognizing the character frame 22 in the reading area, which is an area of a predetermined range, even if there are a plurality of character frames on the form, a necessary character frame can be selected without erroneous recognition. It becomes possible to recognize.
Further, the character cutout unit 3 can also recognize the character frame 22 from the entire non-dropout image and determine the character cutout reference position 24 based on the recognized character frame.

次に、図2(B)を参照して説明する。文字切り出し手段3は、決定した文字切り出し基準位置24を基にして、文字の切り出しを行い、文字認識手段5が、切り出された画像から文字の認識を行う。この際、文字の切り出しは、ドロップアウト画像にて行う。これにより、ドロップアウト画像には、文字枠が写ってないので、切り出した領域内に文字枠が写っていることはなく、文字の認識において文字枠が認識の障害となることがないため、高精度な文字認識が可能となる。   Next, description will be made with reference to FIG. The character cutout unit 3 cuts out characters based on the determined character cutout reference position 24, and the character recognition unit 5 recognizes characters from the cut out image. At this time, the character is cut out by the dropout image. As a result, since the character frame is not shown in the dropout image, the character frame is not shown in the clipped area, and the character frame does not become an obstacle to recognition in character recognition. Accurate character recognition is possible.

<リトライ処理でずれ補正をする場合の動作>
次に、本発明の一実施形態に係る文字認識装置のリトライ処理でずれ補正をする場合の動作について図を用いて説明する。図3(A)は、帳票を文字画像読み込み手段7で読み込んだ例を示す図である。図3(B)は、計算上の文字切り出し基準位置と実際の文字位置とのずれを示す図である。図3(C)は、帳票を全画像読み込み手段6で読み込んだ画像に計算上の文字枠位置を示した図である。図3(D)は、帳票を文字画像読み込み手段7で読み込んだ画像から文字を切り出した図である。
<Operation when correcting deviation by retry processing>
Next, the operation in the case of correcting the deviation in the retry process of the character recognition device according to the embodiment of the present invention will be described with reference to the drawings. FIG. 3A shows an example in which a form is read by the character image reading means 7. FIG. 3B is a diagram showing a deviation between the calculated character cutout reference position and the actual character position. FIG. 3C is a diagram showing the calculation character frame positions in the image read by the all-image reading means 6. FIG. 3D is a diagram in which characters are cut out from the image read by the character image reading means 7.

まず、図3(A)を参照して説明する。全画像読み込み手段6と文字画像読み込み手段7とは、帳票表面の画像の読み込みを行う。全画像読み込み手段6で読み込まれた画像は、非ドロップアウト画像であり、文字枠も文字も読み込まれている。文字画像読み込み手段7で読み込まれた画像は、この図に示すように、ドロップアウトカラーで記載された文字枠は読み込まれず、文字のみが読み込まれている。   First, a description will be given with reference to FIG. The all image reading means 6 and the character image reading means 7 read the image on the form surface. The image read by the all-image reading means 6 is a non-dropout image, and both character frames and characters are read. In the image read by the character image reading means 7, as shown in this figure, the character frame described in the dropout color is not read, but only the characters are read.

帳票端検出手段2は、読み込まれた帳票表面の画像から帳票の端の辺を認識することにより、帳票端を検出する。また、帳票端検出手段は、画像認識ではなく光学センサや機械的センサによっても帳票端を認識することができる。   The form edge detecting means 2 detects the edge of the form by recognizing the edge of the form from the read image on the surface of the form. Further, the form edge detecting means can recognize the form edge not by image recognition but also by an optical sensor or a mechanical sensor.

文字切り出し手段3は、帳票端検出手段2によって検出された帳票端に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字枠位置33または文字位置に関する情報とを用いて、ドロップアウト画像上における文字配置位置、及び、文字切り出し基準位置31を計算する。   The character cutout means 3 uses information on the form edge detected by the form edge detection means 2 and information on the character frame position 33 or the character position based on the form edge stored in the format parameter storage means 4. The character arrangement position on the dropout image and the character cutout reference position 31 are calculated.

次に、図3(B)を参照して説明する。文字切り出し手段3は、計算された文字切り出し基準位置31とドロップアウト画面の文字23とのドロップアウト画面上における位置ずれを調べる。位置ずれは、文字切り出し基準位置31と文字23との位置ずれ量を求めることによって、位置ずれの有無を判断できる。   Next, a description will be given with reference to FIG. The character cutout means 3 checks the positional deviation on the dropout screen between the calculated character cutout reference position 31 and the character 23 on the dropout screen. The positional deviation can be determined by determining the amount of positional deviation between the character cutout reference position 31 and the character 23.

例えば、次のようにして求めることができる。即ち、文字23を最も小さい長方形で囲った場合の、その長方形の平面上における縦方向と横方向の中心線を求める。前記長方形の縦方向の中心線と、文字切り出し基準位置31を通って前記縦方向の中心線に平行な直線との位置ずれ量を求める。同様に、前記長方形の横方向の中心線と文字切り出し基準位置31を通って前記横方向の中心線に平行な直線との位置ずれ量を求める。このようにして、位置ずれ量を求めることができる。   For example, it can be obtained as follows. That is, when the character 23 is surrounded by the smallest rectangle, the vertical and horizontal center lines on the plane of the rectangle are obtained. A positional deviation amount between the vertical center line of the rectangle and a straight line passing through the character cutout reference position 31 and parallel to the vertical center line is obtained. Similarly, an amount of positional deviation between the horizontal center line of the rectangle and a straight line passing through the character cutting reference position 31 and parallel to the horizontal center line is obtained. In this way, the positional deviation amount can be obtained.

また、位置ずれ量は、文字23の重心の位置を算出し、前記重心の位置を使用することによって求めることができる。具体的には、文字23の重心を求め、画像平面上における前記重心を通る水平線と、前記重心を通り、かつ、前記水平線と垂直な直線(以下、垂直線と称する。)を求める。文字切り出し基準位置31を通って前記水平線に平行な直線と、前記水平線との位置ずれ量を求める。同様に、文字切り出し基準位置31を通って前記垂直線に平行な直線と、前記垂直線との位置ずれ量を求める。このようにして、位置ずれ量を求めることができる。   Further, the amount of displacement can be obtained by calculating the position of the center of gravity of the character 23 and using the position of the center of gravity. Specifically, the center of gravity of the character 23 is obtained, and a horizontal line passing through the center of gravity on the image plane and a straight line passing through the center of gravity and perpendicular to the horizontal line (hereinafter referred to as a vertical line) are obtained. A positional deviation amount between the horizontal line and the straight line parallel to the horizontal line through the character cutout reference position 31 is obtained. Similarly, the amount of positional deviation between the straight line passing through the character cutout reference position 31 and parallel to the vertical line and the vertical line is obtained. In this way, the positional deviation amount can be obtained.

更に、前記重心の位置と、前記文字切り出し基準位置31とのずれ量を求め、これを位置ずれ量とすることもできる。   Furthermore, a deviation amount between the position of the center of gravity and the character cutout reference position 31 can be obtained and used as a positional deviation amount.

求めた位置ずれ量が予め決められた範囲の場合は、文字切り出し手段3は、文字の位置ずれはないと判断して、文字切り出し基準位置31を基にして前記ドロップアウト画像から文字23の画像を切り出す。また、前記文字23の画像切り出しは、フォーマットパラメータ記憶手段4に記憶された文字位置に関する情報を基にして切り出すこともできる。切り出された文字23は、文字認識手段5によって、文字が認識される。   When the obtained positional deviation amount is within a predetermined range, the character cutout unit 3 determines that there is no character positional deviation, and based on the character cutout reference position 31, an image of the character 23 from the dropout image. Cut out. Further, the image cut-out of the character 23 can be cut out based on the information on the character position stored in the format parameter storage means 4. The character 23 is recognized by the character recognition means 5.

これにより、文字の位置ずれがない場合は、ずれ補正を行わないので文字認識の処理スピードを速めることができる。また、ドロップアウト画像から文字を切り出すので、文字枠が切り出されることがなく、切り出した画像には認識の障害となる文字枠が入っていないので、高精度な認識が可能となる。求めた2個の位置ずれ量のうち、何れか一つでも予め決められた範囲を超えている場合は、文字切り出し手段3は、文字の位置ずれがあると判断する。   As a result, when there is no character misalignment, the character recognition processing speed can be increased because the misalignment correction is not performed. Further, since characters are cut out from the dropout image, the character frame is not cut out, and the cut image does not include a character frame that becomes an obstacle to recognition, so that highly accurate recognition is possible. If any one of the two obtained misregistration amounts exceeds the predetermined range, the character cutout unit 3 determines that there is a misalignment of the characters.

次に、図3(C)を参照して説明する。文字切り出し手段3は、文字の位置ずれがあると判断した場合においては、以下のようにずれ補正を行う。文字切り出し手段3は、全画像読み込み手段6によって読み込まれた非ドロップアウト画像において、先に計算された前記文字配置位置に関する情報を適用し、前記文字配置位置を基準とした予め定められた領域である、読み取り領域21内で文字枠22の認識を行う。予め定められた範囲の領域である、前記読み取り領域21内で文字枠22の認識を行うことにより、帳票上に複数の文字枠があっても、誤認識することなく必要な文字枠を選択して認識することが可能となる。
文字切り出し手段3は、認識した文字枠22を基にして文字切り出し基準位置32を決定する。
Next, description will be made with reference to FIG. When it is determined that there is a character misalignment, the character cutout unit 3 performs misalignment correction as follows. In the non-dropout image read by the whole image reading means 6, the character cutout means 3 applies the information related to the character arrangement position calculated previously, and is a predetermined area based on the character arrangement position. A character frame 22 is recognized in a certain reading area 21. By recognizing the character frame 22 in the reading area 21, which is an area of a predetermined range, even if there are a plurality of character frames on the form, a necessary character frame can be selected without being erroneously recognized. Can be recognized.
The character cutout unit 3 determines the character cutout reference position 32 based on the recognized character frame 22.

また、文字切り出し手段3は、帳票端検出手段2によって検出された帳票端位置に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字枠位置33に関する情報を基にして、前記文字枠位置を基準として予め定められた範囲の領域である、読み取り領域21内で文字枠22の認識を行い、認識した文字枠22を基に文字切り出し基準位置32を決定することもできる。
更に、文字切り出し手段3は、非ドロップアウト画像全体から文字枠22の認識を行い、認識した文字枠を基にして文字切り出し基準位置32を決定することもできる。
Further, the character cutout means 3 is based on the information on the form edge position detected by the form edge detection means 2 and the information on the character frame position 33 on the basis of the form edge stored in the format parameter storage means 4. The character frame 22 can be recognized in the reading area 21, which is an area in a predetermined range based on the character frame position, and the character cutout reference position 32 can be determined based on the recognized character frame 22. .
Further, the character cutout unit 3 can also recognize the character frame 22 from the entire non-dropout image and determine the character cutout reference position 32 based on the recognized character frame.

次に、図3(D)を参照して説明する。文字切り出し手段3は、決定した文字切り出し基準位置32を基にして、文字の切り出しを行い、文字認識手段5が切り出された画像から文字の認識を行う。この際、文字の切り出しは、ドロップアウト画像にて行う。   Next, description will be made with reference to FIG. The character cutout unit 3 cuts out the character based on the determined character cutout reference position 32, and the character recognition unit 5 recognizes the character from the cut out image. At this time, the character is cut out by the dropout image.

これにより、ドロップアウト画像には、文字枠が写ってないので、切り出した領域内に文字枠が写っていることはなく、文字の認識において文字枠が認識の障害となることがないので、高精度の文字認識が可能となる。   As a result, since the character frame is not shown in the dropout image, the character frame is not shown in the clipped area, and the character frame does not become an obstacle to recognition in character recognition. Accurate character recognition is possible.

<全文字補正時の文字切り出しフロー>
次に、図4を参照して全文字補正時の文字切り出しフローについて更に説明する。図4は、全文字補正時の文字切り出しフローを示す図である。
文字切り出し手段3は、帳票端検出手段2によって検出された帳票端に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置または文字枠位置に関する情報(フォーマットパラメータ指定位置)とを用いて、非ドロップアウト画像上において文字枠の検出を行う(S41)。
<Character extraction flow when correcting all characters>
Next, with reference to FIG. 4, the character cutout flow when all characters are corrected will be further described. FIG. 4 is a diagram showing a character cutout flow when all characters are corrected.
The character cutout means 3 includes information on the form edge detected by the form edge detection means 2 and information on the character position or character frame position based on the form edge stored in the format parameter storage means 4 (format parameter designation position). ) Is used to detect a character frame on the non-dropout image (S41).

次に、文字切り出し手段3は、検出した文字枠22の画像から画面上での文字枠22の位置を計算し、文字枠22の位置情報を取得する(S42)。
文字切り出し手段3は、取得した文字枠22の位置情報を基にして、文字切り出し基準位置32を決定し、ドロップアウト画像から文字を切り出す(S43)。
文字認識手段5は、切り出された画像から読み取るべき文字成分を選択して、文字の認識を行う(S44)。
Next, the character cutout unit 3 calculates the position of the character frame 22 on the screen from the detected image of the character frame 22, and acquires the position information of the character frame 22 (S42).
The character cutout unit 3 determines the character cutout reference position 32 based on the acquired position information of the character frame 22, and cuts out the character from the dropout image (S43).
The character recognition means 5 selects a character component to be read from the cut image and recognizes the character (S44).

<リトライ処理でずれ補正する場合の文字切り出しフロー>
次に、図5を参照してリトライ処理でずれ補正する場合の文字切り出しフローについて更に説明する。図5は、リトライ処理でずれ補正する場合の文字切り出しフローを示す図である。
<Character cutout flow for correcting misalignment in retry processing>
Next, with reference to FIG. 5, the character cutout flow in the case of correcting the deviation by the retry process will be further described. FIG. 5 is a diagram showing a character cutout flow in the case where deviation correction is performed by retry processing.

文字切り出し手段3は、帳票端検出手段2によって検出された帳票端に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置に関する情報(フォーマットパラメータ指定位置)とを用いて、ドロップアウト画像上における文字配置位置、及び、文字切り出し基準位置31を計算する(S51)。
切り出し手段3は、計算された文字切り出し基準位置31と文字23との位置ずれを調べて、位置ずれの有無を判定する(S52)。
The character cutout means 3 uses information related to the form edge detected by the form edge detection means 2 and information related to the character position (format parameter designation position) stored in the format parameter storage means 4 as a reference. Then, the character arrangement position on the dropout image and the character cutout reference position 31 are calculated (S51).
The cutout unit 3 checks the positional deviation between the calculated character cutout reference position 31 and the character 23 and determines the presence or absence of the positional deviation (S52).

次に、文字切り出し手段3は、位置ずれがない場合は、文字切り出し基準位置を基にして、文字の切り出しを行い(S58)、位置ずれがある場合は、S54を実行する(S53)。   Next, when there is no position shift, the character cutout means 3 cuts out a character based on the character cutout reference position (S58), and when there is a position shift, executes S54 (S53).

文字切り出し手段3は、全画像読み込み手段6で読み込まれた非ドロップアウト画像において、先に計算された前記文字配置位置に関する情報を適用し、前記文字配置位置を基準とした予め定められた領域である、読み取り領域21内で文字枠22の検出及び認識を行い(S54)、その情報を基にして文字枠22の位置に関する情報を取得する(S55)。
文字切り出し手段3は、取得した文字枠22の位置に関する情報を基にして、ドロップアウト画像から文字の切り出しを行う(S56)。
文字認識手段5は、切り出された画像から読み取るべき文字成分を選択して、文字の認識を行う(S57)。
In the non-dropout image read by the whole image reading means 6, the character cutout means 3 applies the information relating to the character arrangement position calculated previously, and is a predetermined area based on the character arrangement position. The character frame 22 is detected and recognized in a certain reading area 21 (S54), and information on the position of the character frame 22 is acquired based on the information (S55).
The character cutout unit 3 cuts out characters from the dropout image based on the acquired information on the position of the character frame 22 (S56).
The character recognizing means 5 selects a character component to be read from the clipped image and recognizes the character (S57).

以上、本発明の文字認識装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態における文字認識装置の構成及び機能に様々な変更・改良を加えることが可能である。   As mentioned above, although the specific embodiment was shown and demonstrated about the character recognition apparatus of this invention, this invention is not limited to these. Those skilled in the art can make various changes and improvements to the configuration and functions of the character recognition device in each of the above embodiments without departing from the scope of the present invention.

例えば、本発明の帳票端検出手段2、文字切り出し手段3、文字認識手段5が行う処理は、コンピュータの記憶装置に記憶されたプログラムによって、実施することができ、本発明の課題を解決して、同様の作用効果を奏することができる。   For example, the processing performed by the form edge detection means 2, the character cutout means 3, and the character recognition means 5 of the present invention can be executed by a program stored in a storage device of a computer. Similar effects can be obtained.

本発明の文字認識装置は、コンピュータのCPU、メモリ、補助記憶装置、ディスプレイ等を含むハードウェア資源上に構築されたOS、アプリケーション、光学センサ、等によって実現されるものであり、帳票上に記載された文字の認識という処理が上記のハードウェア資源を用いて具体的に実現されるものであるから、自然法則を利用した技術的思想に該当するものであり、帳票上に記載された文字を認識することを必要とする分野である、例えば、郵便の仕分け、宅配便の仕分け、アンケートの集計、テストの集計等の様々な分野において利用することができるものである。   The character recognition apparatus according to the present invention is realized by an OS, an application, an optical sensor, and the like built on hardware resources including a computer CPU, memory, auxiliary storage device, display, and the like, and is described on a form. Since the process of recognizing the written characters is specifically realized by using the above hardware resources, it corresponds to the technical idea using the laws of nature, and the characters described on the form are It can be used in various fields that need to be recognized, such as mail sorting, courier sorting, questionnaire counting, test counting, and the like.

本発明の一実施形態に係る文字認識装置の構成図である。It is a block diagram of the character recognition apparatus which concerns on one Embodiment of this invention. (A)帳票を全画像読み込み手段6で読み込んだ例を示す図である。(B)帳票を文字画像読み込み手段7で読み込んだ例を示す図である。(A) It is a figure which shows the example which read the form with all the image reading means 6. FIG. (B) It is a figure which shows the example which read the form with the character image reading means 7. FIG. (A)帳票を文字画像読み込み手段7で読み込んだ例を示す図である。(B)計算上の文字位置と実際の文字位置とのずれを示す図である。(C)帳票を全画像読み込み手段6で読み込んだ画像に計算上の文字枠位置を示した図である。(D)帳票を文字画像読み込み手段7で読み込んだ画像から文字を切り出した図である。(A) It is a figure which shows the example which read the form with the character image reading means 7. FIG. (B) It is a figure which shows the shift | offset | difference of the calculated character position and an actual character position. (C) is a diagram showing a calculation character frame position in the image read by the all image reading means 6 of the form. (D) It is the figure which extracted the character from the image which the form read with the character image reading means 7. FIG. 全文字補正時の文字切り出しフローを示す図である。It is a figure which shows the character extraction flow at the time of all the character corrections. リトライ処理でずれ補正する場合の文字切り出しフローを示す図である。It is a figure which shows the character cutout flow in the case of carrying out deviation correction by retry processing.

1 画像読み込み手段
2 帳票端検出手段
3 文字切り出し手段
4 フォーマットパラメータ記憶手段
5 文字認識手段
6 全画像読み込み手段
7 文字画像読み込み手段
21 読み取り領域
22 文字枠
23 文字
24 文字切り出し基準位置
31 文字切り出し基準位置
32 文字切り出し基準位置
33 フォーマットパラメータ記憶手段に記憶されている帳票端を基準とした文字枠位置
DESCRIPTION OF SYMBOLS 1 Image reading means 2 Form edge detection means 3 Character extraction means 4 Format parameter storage means 5 Character recognition means 6 All image reading means 7 Character image reading means 21 Reading area 22 Character frame 23 Character 24 Character extraction reference position 31 Character extraction reference position 32 Character cutout reference position 33 Character frame position based on the form edge stored in the format parameter storage means

Claims (6)

ドロップアウトカラーで印刷された文字枠を有する帳票の前記文字枠内に記載された文字の認識をする文字認識装置であって、前記帳票上におけるドロップアウトカラーの画像も、非ドロップアウトカラーの画像も、どちらの画像も読み込むことができる全画像読み込み手段と、前記帳票上における非ドロップアウトカラーの画像のみ読み込むことができる文字画像読み込み手段と、前記帳票の端の位置を検出し、帳票端位置に関する情報を取得する帳票端検出手段と、前記帳票の端の位置を基準とした、帳票上における前記文字枠位置又は前記文字位置に関するフォーマットパラメータ指定位置が記憶されたフォーマットパラメータ記憶手段と、前記文字画像読み込み手段によって読み込んだドロップアウト画像から文字画像を切り出す文字切り出し手段と、前記文字切り出し手段によって切り出された文字画像から文字を認識する文字認識手段と、を備え、前記文字切り出し手段が、前記帳票端検出手段によって検出された帳票端に関する情報とフォーマットパラメータ記憶手段に記憶されているフォーマットパラメータ指定位置とを用いてドロップアウト画像上における文字配置位置と文字切り出し基準位置を算出する第1工程と、前記第1工程によって算出した文字切り出し基準位置と配置位置とを比較し、前記基準位置と配列位置との位置ずれの有無を判定する第2工程と、前記第2工程によって位置ずれがないと判定したとき、前記文字切り出し基準位置を基にして文字の切り出しを行う第3工程と、前記第2工程によって位置ずれがあると判定したとき、全画像読み込み手段によって読み込んだ非ドロップアウト画像から前記第1工程によって算出した文字配置位置を基準とした読み取り領域内の文字枠位置を検出する第4工程と、前記第4工程によって検出した文字枠位置に基づいて前記ドロップアウト画像から文字の切り出しを行う第5工程とを実行し、前記文字認識手段が、前記第3工程又は第5工程によって切り出した文字の認識行う第6工程とを実行することを特徴とする文字認識装置。 A character recognition device for recognizing characters written in a character frame of a form having a character frame printed in dropout color, wherein the dropout color image on the form is also a non-dropout color image In addition, all image reading means capable of reading both images, character image reading means capable of reading only non-dropout color images on the form, and the edge position of the form are detected, and the edge position of the form is detected. A form edge detecting means for acquiring information on the form, a format parameter storage means for storing a format parameter designation position relating to the character frame position or the character position on the form with reference to the position of the edge of the form, and the character Text that cuts out a character image from a dropout image read by the image reading means A character recognition means for recognizing a character from the character image cut out by the character cut-out means, and the character cut-out means stores information about the form edge detected by the form edge detection means and a format parameter storage a first step of calculating a character position and the character extraction reference positions on dropout image using the format parameters specified position stored in the unit, and position the character extraction reference position calculated by said first step comparing a second step of determining whether the positional deviation between the arrangement position and the reference position, when it is determined that there is no positional deviation by said second step, cutting out characters based on the character extracting reference position When it is determined that there is a displacement in the third step and the second step, all image reading is performed. A fourth step of detecting the character frame position of the reading region from the non-dropout image read by viewing means relative to the character position calculated by said first step, the character frame position detected by the fourth step And a fifth step of cutting out characters from the dropout image, and the character recognition means executes a sixth step of recognizing the characters cut out in the third step or the fifth step. Character recognition device. 前記文字切り出し手段は、前記ドロップアウト画像上における文字画像を最も小さい長方形で囲った場合の、前記長方形の画面上における縦方向の中心線と、前記文字切り出し基準位置を通って前記中心線に平行な直線との位置ずれ量を算出することによって、前記位置ずれ量算出を行うことを特徴とする請求項1に記載の文字認識装置。   The character cut-out means is parallel to the center line through the character cut-out reference position and the vertical center line on the rectangular screen when the character image on the drop-out image is surrounded by the smallest rectangle. The character recognition device according to claim 1, wherein the positional deviation amount is calculated by calculating a positional deviation amount from a straight line. 前記文字切り出し手段は、前記ドロップアウト画像上における文字画像の重心を求め、前記重心と、前記文字切り出し基準位置とのずれ量を算出することによって、前記位置ずれ量算出を行うことを特徴とする請求項1に記載の文字認識装置。   The character cutout means calculates the positional deviation amount by obtaining a center of gravity of the character image on the dropout image and calculating a deviation amount between the center of gravity and the character cutout reference position. The character recognition device according to claim 1. ドロップアウトカラーで印刷された文字枠を有する帳票の前記文字枠内に記載された文字の認識をする文字認識装置であって、前記帳票上におけるドロップアウトカラーの画像も、非ドロップアウトカラーの画像も、どちらの画像も読み込むことができる全画像読み込み手段と、前記帳票上における非ドロップアウトカラーの画像のみ読み込むことができる文字画像読み込み手段と、前記帳票の端の位置を検出し、帳票端位置に関する情報を取得する帳票端検出手段と、前記帳票の端の位置を基準とした、帳票上における前記文字枠位置及び前記文字位置に関する情報が記憶されたフォーマットパラメータ記憶手段と、前記文字画像読み込み手段によって読み込んだドロップアウト画像から文字画像を切り出す文字切り出し手段と、前記文字切り出し手段によって切り出された文字画像から文字を認識する文字認識手段と、を備えた文字認識装置における文字認識方法であって、前記文字切り出し手段に、前記帳票端検出手段によって検出された帳票端に関する情報とフォーマットパラメータ記憶手段に記憶されているフォーマットパラメータ指定位置とを用いてドロップアウト画像上における文字配置位置と文字切り出し基準位置を算出する第1工程と、前記第1工程によって算出した文字切り出し基準位置と配置位置とを比較し、前記基準位置と配列位置との位置ずれの有無を判定する第2工程と、前記第2工程によって位置ずれがないと判定したとき、前記文字切り出し基準位置を基にして文字の切り出しを行う第3工程と、前記第2工程によって位置ずれがあると判定したとき、全画像読み込み手段によって読み込んだ非ドロップアウト画像から前記第1工程によって算出した文字配置位置を基準とした読み取り領域内の文字枠位置を検出する第4工程と、前記第4工程によって検出した文字枠位置に基づいて前記ドロップアウト画像から文字の切り出しを行う第5工程とを実行させ、前記文字認識手段に、前記第3工程又は第5工程によって切り出した文字の認識行う第6工程とを実行させることを特徴とする文字認識装置における文字認識方法。 A character recognition device for recognizing characters written in a character frame of a form having a character frame printed in dropout color, wherein the dropout color image on the form is also a non-dropout color image In addition, all image reading means capable of reading both images, character image reading means capable of reading only non-dropout color images on the form, and the edge position of the form are detected, and the edge position of the form is detected. Form edge detection means for acquiring information on the form, format parameter storage means for storing information on the character frame position and the character position on the form with reference to the position of the edge of the form, and the character image reading means Character cutout means for cutting out a character image from the dropout image read by A character recognizing section for recognizing characters from the character image extracted by means Eject and, a character recognition method in the character recognition apparatus having a, in the character segmentation means, the detected form end by the form edge detecting means The first step of calculating the character placement position and the character cutout reference position on the dropout image using the information on the position and the format parameter designation position stored in the format parameter storage means, and the character cutout calculated by the first step A second step of comparing the reference position and the arrangement position, and determining whether or not there is a positional deviation between the reference position and the arrangement position; and when determining that there is no positional deviation in the second step, Based on the third step of cutting out characters based on the second step and the second step, it was determined that there was a misalignment The fourth step of detecting the character frame position in the reading area based on the character arrangement position calculated by the first step from the non-dropout image read by the whole image reading means, and the detection by the fourth step Performing a fifth step of cutting out characters from the dropout image based on a character frame position, and causing the character recognition means to recognize a character cut out in the third step or the fifth step. The character recognition method in the character recognition apparatus characterized by making it perform . 前記文字切り出し手段に、前記ドロップアウト画像上における文字画像を最も小さい長方形で囲った場合の、前記長方形の画面上における縦方向の中心線と、前記文字切り出し基準位置を通って前記中心線に平行な直線との位置ずれ量を算出することによって、前記位置ずれ量算出を行う第7工程を実行させることを特徴とする請求項4に記載の文字認識装置における文字認識方法。 When the character cutout means surrounds the character image on the dropout image with the smallest rectangle, it is parallel to the centerline through the vertical centerline on the rectangular screen and the character cutout reference position. The character recognition method in the character recognition device according to claim 4, wherein a seventh step of calculating the positional deviation amount is executed by calculating a positional deviation amount from a straight line. 前記文字切り出し手段に、前記ドロップアウト画像上における文字画像の重心を求め、前記重心と、前記文字切り出し基準位置とのずれ量を算出することにより、前記位置ずれ量算出を行う第8工程を実行させることを特徴とする請求項4に記載の文字認識装置における文字認識方法。 It said character segmentation means obtains a center of gravity of the character image on the dropout image, and the center of gravity by calculating the deviation between the character extraction reference position, executes an eighth step of performing the positional deviation amount calculating The character recognition method in the character recognition apparatus of Claim 4 characterized by the above-mentioned.
JP2007235246A 2007-09-11 2007-09-11 Character recognition device and character recognition method in character recognition device Active JP5054472B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007235246A JP5054472B2 (en) 2007-09-11 2007-09-11 Character recognition device and character recognition method in character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007235246A JP5054472B2 (en) 2007-09-11 2007-09-11 Character recognition device and character recognition method in character recognition device

Publications (2)

Publication Number Publication Date
JP2009069951A JP2009069951A (en) 2009-04-02
JP5054472B2 true JP5054472B2 (en) 2012-10-24

Family

ID=40606169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007235246A Active JP5054472B2 (en) 2007-09-11 2007-09-11 Character recognition device and character recognition method in character recognition device

Country Status (1)

Country Link
JP (1) JP5054472B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6030917B2 (en) * 2012-10-24 2016-11-24 グローリー株式会社 Character cutting device, character cutting method, and character recognition device
JP2020086847A (en) 2018-11-22 2020-06-04 株式会社Pfu Image processing system, control method, and control program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2639165B2 (en) * 1990-03-19 1997-08-06 日本電気株式会社 Character extraction device
JP3022655B2 (en) * 1991-10-29 2000-03-21 日本電気株式会社 Character recognition device
JPH0668299A (en) * 1992-08-19 1994-03-11 Hitachi Ltd Display method and correction method for read result and data reader
JPH07160814A (en) * 1993-12-10 1995-06-23 Hitachi Ltd Optical character recognizing method
JPH07192087A (en) * 1993-12-27 1995-07-28 Nec Corp Optical character reader
JP4176175B2 (en) * 1996-09-27 2008-11-05 富士通株式会社 Pattern recognition device
WO2004107257A1 (en) * 2003-05-30 2004-12-09 Fujitsu Limited Forms processing program, method, and device

Also Published As

Publication number Publication date
JP2009069951A (en) 2009-04-02

Similar Documents

Publication Publication Date Title
US8724925B2 (en) Misalignment detecting apparatus, misalignment detecting method, and computer program product
WO2012120587A1 (en) Text string cut-out method and text string cut-out device
US11551350B2 (en) Inspecting for a defect on a print medium with an image aligned based on an object in the image and based on vertices of the inspection target medium and the reference medium
JP2020123940A (en) Inclination detection device, reading device, image processing apparatus, and inclination detection method
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
US11514568B2 (en) Image processing apparatus, image processing method, and storage medium
JP2013186562A (en) Image detection apparatus and method
JP6665595B2 (en) Character recognition device, method and program
JP5054472B2 (en) Character recognition device and character recognition method in character recognition device
US11430235B2 (en) Image processing apparatus, image processing method, and storage medium
US11750747B2 (en) Inspection apparatus capable of preventing lowering of position matching accuracy, method of controlling same, and storage medium
JP3600380B2 (en) Image processing method and fax character recognition device
US10091390B2 (en) Image processing apparatus and image processing method for extracting feature points of a document image
US10009508B2 (en) Image processing apparatus for reading check boxes
JP2003271942A (en) Method of recording bar-code, and method and device for correcting image
WO2011129114A1 (en) Form, form processing device, form processing method, and recording medium
JP3640488B2 (en) Image processing method
US11838454B2 (en) Inspection apparatus, control method thereof, and storage medium
US20240029238A1 (en) Inspection apparatus, method of controlling the same, inspection system, and storage medium
JP5146199B2 (en) Difference extraction apparatus and difference extraction program
US20240177296A1 (en) Inspection apparatus, method of controlling the same, and storage medium
JP5757299B2 (en) Form design device, form design method, and form design program
US11704921B2 (en) Image processing apparatus, image processing method, and storage medium
JP2022178533A (en) Image processing apparatus
EP2945099B1 (en) Character presence determination system and character presence determination method

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100820

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120723

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120727

R150 Certificate of patent or registration of utility model

Ref document number: 5054472

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250