JP5054472B2 - Character recognition device and character recognition method in character recognition device - Google Patents
Character recognition device and character recognition method in character recognition device Download PDFInfo
- Publication number
- JP5054472B2 JP5054472B2 JP2007235246A JP2007235246A JP5054472B2 JP 5054472 B2 JP5054472 B2 JP 5054472B2 JP 2007235246 A JP2007235246 A JP 2007235246A JP 2007235246 A JP2007235246 A JP 2007235246A JP 5054472 B2 JP5054472 B2 JP 5054472B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- dropout
- character recognition
- cutout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
本発明は、帳票表面の画像を読み込むことにより文字の認識をする文字認識装置に関し、特に、帳票上におけるドロップアウトカラーの画像も、非ドロップアウトカラーの画像も、どちらも読み込める文字認識装置に関するものである。 The present invention relates to a character recognition apparatus that recognizes characters by reading an image on the surface of a form, and more particularly to a character recognition apparatus that can read both a dropout color image and a non-dropout color image on a form. It is.
従来から、はがき、伝票、アンケート、テストの解答用紙等の様々な帳票に記載された文字、記号等を認識する装置として文字認識装置が使用されている。一般に文字認識装置に読み込まれる帳票は、人の目には見えるが文字認識装置では読み込めない色であるドロップアウトカラーで印刷された部分と、文字認識装置で読み込むことが可能な色である非ドロップアウトカラーで印刷された部分とを含んでいる。 Conventionally, a character recognition device has been used as a device for recognizing characters, symbols, and the like described in various forms such as postcards, slips, questionnaires, and test answer sheets. In general, a form that is read by a character recognition device is a portion that is printed in a dropout color that is visible to the human eye but cannot be read by the character recognition device, and a non-drop that is a color that can be read by the character recognition device. Parts printed in out color.
従来の文字認識装置は、帳票を1枚ずつ次々と搬送し、搬送しながら帳票表面の画像を1枚ずつ読み込み、読み込んだ画像中の文字、記号等のうち帳票端から決められた位置にある文字、記号等の画像を切り取って、切り取った画像を認識対象として認識していた。 The conventional character recognition apparatus conveys the form one by one, reads the image on the surface of the form one by one while conveying it, and is in a position determined from the edge of the form among characters, symbols, etc. in the read image. Images such as characters and symbols are cut out, and the cut out images are recognized as recognition targets.
しかしながら、帳票を搬送しながら画像の読み込みをしている最中に搬送の遅れ等の搬送誤差が発生した場合、読み込んだ画像が伸長することによって帳票端から決められた位置に本来有るはずの認識対象文字等がずれて別の場所に存在することになる。このため、帳票端から決められた位置の画像を切り取っても、認識対象の文字画像を正しく切り取ることができないため、認識対象の文字がうまく認識ができないという問題があった。 However, if a transport error such as a transport delay occurs during the reading of an image while transporting a form, it recognizes that it should be at the position determined from the end of the form by expanding the read image. The target character or the like is shifted and exists in another place. For this reason, there is a problem that even if the image at the position determined from the edge of the form is cut out, the character image to be recognized cannot be cut out correctly, so that the character to be recognized cannot be recognized well.
画像の読み込み中に搬送誤差が発生しても搬送誤差を補正し、文字画像を正しく切り取ることができる文字認識装置として、「文字認識装置及び文字認識方法」(特許文献1)が提案されている。 “Character recognition device and character recognition method” (Patent Document 1) has been proposed as a character recognition device that corrects a conveyance error even if a conveyance error occurs during image reading and can correctly cut out a character image. .
特許文献1に記載された文字認識装置は、複数の文字記入枠と、これらの文字枠それぞれに対応し、かつ、隣接して設けられたプレプリント情報とを持つ帳票のイメージに基づいて文字の切り取り、文字の認識を行うことを特徴としている。具体的には、前記文字認識装置は、プレプリント情報を利用して文字枠位置を補正し、位置の補正をした文字枠を基にして文字画像の切り出しを行い、切り出した文字画像から文字の認識を行う。
The character recognition device described in
これにより、画像の読み込み中に搬送誤差が発生しても、文字画像を正しく切り出すとともに、文字認識を正しく行うことができるとしている。
従来の文字認識装置は、画像の読み込み中に搬送誤差が発生した場合、読み込んだ画像が伸長することにより、認識対象文字の位置がずれるので、正しく文字画像を切り出すことができず、そのため、切り出した文字画像の認識を行っても文字が正確に認識できなかった。 In the conventional character recognition device, when a conveyance error occurs during reading of an image, the read image is expanded and the position of the character to be recognized is shifted. Therefore, the character image cannot be correctly cut out. Even if the character image was recognized, the characters could not be recognized correctly.
また、帳票のカットずれ、印刷ずれがあった場合も帳票表面上での文字位置がずれるので正しく文字画像を切り出すことができず、そのため、切り出した文字画像の認識を行っても文字が正確に認識できなかった。 In addition, even if there is a slippage deviation or printing slippage on the form, the character position on the form surface is misaligned, so the character image cannot be cut out correctly. Therefore, even if the cutout character image is recognized, the character is accurately I couldn't recognize it.
更に、特許文献1に記載された文字認識装置は、搬送誤差を補正するためのプレプリント情報を予め帳票に印刷しておく必要があり、従来の帳票を使用することができなかった。そのため、新たな帳票が必要となり、コスト高にもなっていた。
Furthermore, the character recognition apparatus described in
更にまた、特許文献1に記載された文字認識装置は、搬送誤差が発生していなくてもプレプリント情報に基づいて位置の補正処理を実施するので、処理速度が遅くなるという問題があった。
Furthermore, the character recognition device described in
本発明は、このような実情に鑑みてなされたものであり、文字の位置ずれが発生しても正しく文字認識が可能で、処理速度も遅くならない文字認識装置及び文字認識装置における文字認識方法を提供しようとするものである。 The present invention has been made in view of such circumstances, and provides a character recognition device capable of correctly recognizing a character even when a character misalignment occurs and does not slow down the processing speed, and a character recognition method in the character recognition device. It is something to be offered.
本発明の課題は、下記の各発明によって解決することができる。
すなわち、本発明の文字認識装置及び文字認識方法は、ドロップアウトカラーで印刷された文字枠を有する帳票の前記文字枠内に記載された文字の認識をする文字認識装置であって、
前記帳票上におけるドロップアウトカラーの画像も、非ドロップアウトカラーの画像も、どちらの画像も読み込むことができる全画像読み込み手段と、前記帳票上における非ドロップアウトカラーの画像のみ読み込むことができる文字画像読み込み手段と、前記帳票の端の位置を検出し、帳票端位置に関する情報を取得する帳票端検出手段と、前記帳票の端の位置を基準とした、帳票上における前記文字枠位置又は前記文字位置に関するフォーマットパラメータ指定位置が記憶されたフォーマットパラメータ記憶手段と、前記文字画像読み込み手段によって読み込んだドロップアウト画像から文字画像を切り出す文字切り出し手段と、前記文字切り出し手段によって切り出された文字画像から文字を認識する文字認識手段と、を備え、
前記文字切り出し手段が、
前記帳票端検出手段によって検出された帳票端に関する情報とフォーマットパラメータ記憶手段に記憶されているフォーマットパラメータ指定位置とを用いてドロップアウト画像上における文字配置位置と文字切り出し基準位置を算出する第1工程と、
前記第1工程によって算出した文字切り出し基準位置と配置位置とを比較し、前記基準位置と配列位置との位置ずれの有無を判定する第2工程と、
前記第2工程によって位置ずれがないと判定したとき、前記文字切り出し基準位置を基にして文字の切り出しを行う第3工程と、
前記第2工程によって位置ずれがあると判定したとき、全画像読み込み手段によって読み込んだ非ドロップアウト画像から前記第1工程によって算出した文字配置位置を基準とした読み取り領域内の文字枠位置を検出する第4工程と、
前記第4工程によって検出した文字枠位置に基づいて前記ドロップアウト画像から文字の切り出しを行う第5工程とを実行し、
前記文字認識手段が、前記第3工程又は第5工程によって切り出した文字の認識行う第6工程とを実行することを主な特徴としている。
The problems of the present invention can be solved by the following inventions.
That is, the character recognition device and the character recognition method of the present invention are character recognition devices for recognizing characters written in the character frame of a form having a character frame printed in dropout color,
All image reading means capable of reading both images of a dropout color and a non-dropout color on the form, and a character image capable of reading only a non-dropout color image on the form A reading means; a form edge detecting means for detecting the position of the edge of the form; and acquiring information relating to the edge position of the form; and the character frame position or the character position on the form based on the position of the edge of the form Format parameter storage means for storing format parameter designation positions, character cutout means for cutting out a character image from the dropout image read by the character image reading means, and recognition of characters from the character image cut out by the character cutout means Character recognition means for
The character cutout means is
A first step of calculating a character arrangement position and a character cutout reference position on the dropout image using information on the form edge detected by the form edge detection means and the format parameter designation position stored in the format parameter storage means. When,
A second step of comparing the character cutout reference position calculated in the first step with the arrangement position and determining whether or not there is a positional deviation between the reference position and the arrangement position;
A third step of cutting out characters based on the character cutout reference position when it is determined in the second step that there is no misalignment;
When it is determined that there is a displacement in the second step, the character frame position in the reading area is detected based on the character arrangement position calculated in the first step from the non-dropout image read by the whole image reading means. A fourth step;
Run a fifth step for cutting out a character from the dropout image based on the character frame position detected by said fourth step,
A main feature is that the character recognition means executes a sixth step of recognizing the character cut out in the third step or the fifth step.
これにより、帳票に記載された文字に位置ずれが発生していない場合は、文字切り出し基準位置の補正を行わないので、高速な文字認識処理が可能となり、位置ずれが発生している場合は、非ドロップアウト画像から認識した文字枠文字枠を基にして文字画像を切り出すことによって、文字の位置ずれが発生しても正しく文字認識を行うことができる。
Thus, if the positional deviation in the character described in the document does not occur, since not corrected character extraction reference position, speed character recognition processing is possible, if the positional displacement has occurred By cutting out the character image based on the character frame recognized from the non-dropout image, the character can be correctly recognized even if the character is misaligned.
更に、本発明は、前記文字切り出し手段が、前記ドロップアウト画像上における文字画像を最も小さい長方形で囲った場合の、前記長方形の画面上における縦方向の中心線と、前記文字切り出し基準位置を通って前記中心線に平行な直線との位置ずれ量を算出することによって前記位置ずれ量算出を行う。 Further, according to the present invention, the character cutout unit passes a vertical center line on the rectangular screen and the character cutout reference position when the character image on the dropout image is surrounded by the smallest rectangle. The positional deviation amount is calculated by calculating the positional deviation amount with respect to a straight line parallel to the center line.
更にまた、本発明は、前記文字切り出し手段が、前記ドロップアウト画像上における文字画像の重心を求め、前記重心と、前記文字切り出し基準位置とのずれ量を算出することによって前記位置ずれ量算出を行う。 Still further, in the present invention, the character cutout unit calculates the positional deviation amount by calculating a center of gravity of the character image on the dropout image and calculating a deviation amount between the center of gravity and the character cutout reference position. Do.
以上、説明したように、本発明の文字認識装置によれば、搬送誤差、帳票のカットずれ、帳票の印刷ずれ等により帳票上の文字位置がずれて認識された場合においても、文字を切り出すときは、ドロップアウト画像から切り出すので、ドロップアウトカラーで印刷された文字枠が切り出されることがなく、文字認識の障害となる文字以外の画像の切り出しを防ぎ、高精度な文字認識を可能とすることができる。 As described above, according to the character recognition device of the present invention, when a character is cut out even when the character position on the form is recognized to be misaligned due to conveyance error, form cut deviation, form print deviation, etc. Cuts out from the dropout image, so that the character frame printed in the dropout color is not cut out, and it is possible to prevent high-precision character recognition by preventing the cutting out of images other than the characters that hinder character recognition. Can do.
更に、帳票に記載された文字に位置ずれが発生していない場合は、文字切り出し基準位置の補正を行わないので、高速な文字認識処理を可能とすることができる。 Furthermore, when there is no positional deviation in the characters described in the form, the character extraction reference position is not corrected, so that high-speed character recognition processing can be performed.
以下、添付図面を参照しながら、本発明の文字認識装置を実施するための最良の形態を詳細に説明する。
<構成>
本発明の一実施形態に係る文字認識装置の構成について図を用いて説明する。図1は、本発明の一実施形態に係る文字認識装置の構成図である。
図1に示すように、本発明の文字認識装置は、画像読み込み手段1と、帳票端検出手段2と、文字切り出し手段3と、フォーマットパラメータ記憶手段4と、文字認識手段5とから構成されている。
The best mode for carrying out the character recognition device of the present invention will be described below in detail with reference to the accompanying drawings.
<Configuration>
A configuration of a character recognition device according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram of a character recognition apparatus according to an embodiment of the present invention.
As shown in FIG. 1, the character recognition apparatus of the present invention comprises an image reading means 1, a form edge detection means 2, a character cutout means 3, a format parameter storage means 4, and a character recognition means 5. Yes.
画像読み込み手段1は、全画像読み込み手段6と、文字画像読み込み手段7とから構成されている。
全画像読み込み手段6は、帳票表面に記載されているドロップアウトカラーで印刷された文字枠と、非ドロップアウトカラーで印刷された文字とをイメージセンサにより読み込む。イメージセンサには、CCDイメージセンサやCMOSイメージセンサなどを使用することができる。
The image reading means 1 comprises an all image reading means 6 and a character image reading means 7.
The all image reading means 6 reads the character frame printed in the dropout color described on the form surface and the character printed in the non-dropout color by the image sensor. As the image sensor, a CCD image sensor, a CMOS image sensor, or the like can be used.
ドロップアウトカラーとは、モノクロの画像読み込み手段でカラー原稿を読み込んだとき読み込むことのできない色のことを言い、通常は画像読み込み手段に使用されている光源の色がドロップアウトカラーに該当する。画像読み込み手段がカラー画像を読み込むことができる場合には、RGBのうちどれかの色をドロップアウトカラーに設定することができる。 The dropout color refers to a color that cannot be read when a color original is read by a monochrome image reading means, and usually the color of the light source used in the image reading means corresponds to the dropout color. If the image reading means can read a color image, any color of RGB can be set as a dropout color.
例えば、赤色をドロップアウトカラーに設定した場合は、RGBのうちR、即ち赤色(Red)と、読み込んだ部分とのコントラストの差をイメージとして読み込む。これにより、ドロップアウトカラーである赤色で印刷された部分は、赤色とコントラストの差がないので、イメージとして読み込むことができず、その部分だけ何も印刷されていないように読み込まれる。 For example, when red is set as the dropout color, the contrast difference between R of RGB, that is, red (Red), and the read portion is read as an image. As a result, the portion printed in red, which is the dropout color, has no difference in contrast with the red color, so that it cannot be read as an image, and the portion is read so that nothing is printed.
即ち、全画像読み込み手段6は、RGBのうちドロップアウトカラーに設定された色以外の色も読み込むことにより、ドロップアウトカラーで印刷された文字枠も読み込むことができる。以下、全画像読み込み手段6によって読み込まれた画像を非ドロップアウト画像と称する。 That is, the all-image reading means 6 can also read a character frame printed in the dropout color by reading colors other than those set as the dropout color among RGB. Hereinafter, the image read by the whole image reading means 6 is referred to as a non-dropout image.
文字画像読み込み手段7は、帳票表面に記載されている、非ドロップアウトカラーで記載された文字等をイメージセンサにより読み込むが、ドロップアウトカラーで印刷された文字枠等は読み込むことができない。以下、文字画像読み込み手段7によって読み込まれた画像をドロップアウト画像と称する。 The character image reading means 7 reads characters and the like written in the non-dropout color described on the surface of the form by the image sensor, but cannot read the character frame and the like printed in the dropout color. Hereinafter, the image read by the character image reading means 7 is referred to as a dropout image.
帳票端検出手段2は、画像読み込み手段1によって読み込まれた画像を基にして帳票端を検出する。また、帳票端検出手段は、画像認識ではなく光学センサや機械的センサによっても帳票端を認識することができる。 The form edge detection means 2 detects the form edge based on the image read by the image reading means 1. Further, the form edge detecting means can recognize the form edge not by image recognition but also by an optical sensor or a mechanical sensor.
文字切り出し手段3は、帳票端検出手段2によって検出された帳票端の位置情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置情報とから、帳票表面上において文字の記載されている位置を計算し、その位置にある文字画像を切り出す処理を行う。 The character cutout means 3 is based on the position information of the form edge detected by the form edge detection means 2 and the character position information with reference to the form edge stored in the format parameter storage means 4. The position described is calculated, and the character image at that position is cut out.
また、文字切り出し手段3は、帳票端検出手段2によって検出された帳票端の位置情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置情報のみならず、全画像読み込み手段6によって読み込まれた文字枠の画像を基にして、文字の記載されている位置を計算し、その位置にある文字画像を切り出す処理を行うこともできる。
The character cutout means 3 reads not only the position information of the form edge detected by the form edge detection means 2 and the character position information based on the form edge stored in the format parameter storage means 4, but also reads all images. Based on the image of the character frame read by the
これにより、帳票のイメージを読み込む際の帳票の搬送誤差などにより、帳票イメージが伸長して読み込まれても、文字枠の画像情報を使用することにより、文字の記載位置の位置ずれを補正して文字画像を切り出すことが可能となる。 As a result, even if the form image is expanded and read due to an error in carrying the form when reading the form image, the character frame image information is used to correct the misalignment of the character description position. A character image can be cut out.
フォーマットパラメータ記憶手段4には、前述の通り、帳票の端の辺を基準とした文字位置情報や、文字枠の位置情報などが記憶されている。文字認識手段5は、文字切り出し手段3によって切り出された文字画像を基にして、文字の認識を行う。
As described above, the format
<全文字補正時の動作>
次に、本発明の一実施形態に係る文字認識装置の全文字補正時の動作について図を用いて説明する。図2(A)は、帳票を全画像読み込み手段6で読み込んだ例を示す図である。図2(B)は、帳票を文字画像読み込み手段7で読み込んだ例を示す図である。
<Operation when correcting all characters>
Next, the operation at the time of all character correction of the character recognition device according to the embodiment of the present invention will be described with reference to the drawings. FIG. 2A is a diagram showing an example in which a form is read by all image reading means 6. FIG. 2B is a diagram showing an example in which a form is read by the character image reading means 7.
まず、図2(A)を参照して説明する。全画像読み込み手段6は、帳票表面の画像の読み込みを行う。図2(A)に示すように、文字枠22と、文字23とが読み込まれている。ここで帳票上においては、文字枠22は、ドロップアウトカラーで印刷されており、文字23は、非ドロップアウトカラーで記載されている。
First, a description will be given with reference to FIG. The all image reading means 6 reads the image on the form surface. As shown in FIG. 2A, a
帳票端検出手段2は、読み込まれた帳票表面の画像から帳票の端の辺を認識することにより、帳票端を検出する。また、帳票端検出手段は、画像認識ではなく光学センサや機械的センサによっても帳票端を認識することができる。
The form
文字切り出し手段3は、帳票端検出手段2によって検出された帳票端位置に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置に関する情報とを用いて、非ドロップアウト画像上における文字が配置されている位置を計算する。次に、文字切り出し手段3は、計算された文字配置位置を基準とした予め定められた範囲の領域である、読み取り領域21内で文字枠22の認識を行い、認識した文字枠22を基に文字切り出し基準位置24を決定する。予め定められた範囲の領域である、前記読み取り領域21内で文字枠22の認識を行うことにより、帳票上に複数の文字枠があっても、誤認識することなく必要な文字枠を選択して認識することが可能となる。
The character cutout means 3 uses the information related to the form edge detected by the form edge detection means 2 and the information related to the character position stored with reference to the form edge stored in the format parameter storage means 4 to perform non-dropout. The position where the character is arranged on the image is calculated. Next, the
また、文字切り出し手段3は、帳票端検出手段2によって検出された帳票端位置に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字枠位置に関する情報を基にして、前記文字枠位置を基準として予め定められた範囲の領域である、読み取り領域内で文字枠22の認識を行い、認識した文字枠22を基に文字切り出し基準位置24を決定することもできる。予め定められた範囲の領域である、前記読み取り領域内で文字枠22の認識を行うことにより、帳票上に複数の文字枠があっても、誤認識することなく必要な文字枠を選択して認識することが可能となる。
更に、文字切り出し手段3は、非ドロップアウト画像全体から文字枠22の認識を行い、認識した文字枠を基にして文字切り出し基準位置24を決定することもできる。
Further, the character cutout means 3 is based on the information on the form edge position detected by the form edge detection means 2 and the information on the character frame position on the basis of the form edge stored in the format parameter storage means 4. It is also possible to recognize the
Further, the
次に、図2(B)を参照して説明する。文字切り出し手段3は、決定した文字切り出し基準位置24を基にして、文字の切り出しを行い、文字認識手段5が、切り出された画像から文字の認識を行う。この際、文字の切り出しは、ドロップアウト画像にて行う。これにより、ドロップアウト画像には、文字枠が写ってないので、切り出した領域内に文字枠が写っていることはなく、文字の認識において文字枠が認識の障害となることがないため、高精度な文字認識が可能となる。
Next, description will be made with reference to FIG. The
<リトライ処理でずれ補正をする場合の動作>
次に、本発明の一実施形態に係る文字認識装置のリトライ処理でずれ補正をする場合の動作について図を用いて説明する。図3(A)は、帳票を文字画像読み込み手段7で読み込んだ例を示す図である。図3(B)は、計算上の文字切り出し基準位置と実際の文字位置とのずれを示す図である。図3(C)は、帳票を全画像読み込み手段6で読み込んだ画像に計算上の文字枠位置を示した図である。図3(D)は、帳票を文字画像読み込み手段7で読み込んだ画像から文字を切り出した図である。
<Operation when correcting deviation by retry processing>
Next, the operation in the case of correcting the deviation in the retry process of the character recognition device according to the embodiment of the present invention will be described with reference to the drawings. FIG. 3A shows an example in which a form is read by the character image reading means 7. FIG. 3B is a diagram showing a deviation between the calculated character cutout reference position and the actual character position. FIG. 3C is a diagram showing the calculation character frame positions in the image read by the all-image reading means 6. FIG. 3D is a diagram in which characters are cut out from the image read by the character image reading means 7.
まず、図3(A)を参照して説明する。全画像読み込み手段6と文字画像読み込み手段7とは、帳票表面の画像の読み込みを行う。全画像読み込み手段6で読み込まれた画像は、非ドロップアウト画像であり、文字枠も文字も読み込まれている。文字画像読み込み手段7で読み込まれた画像は、この図に示すように、ドロップアウトカラーで記載された文字枠は読み込まれず、文字のみが読み込まれている。 First, a description will be given with reference to FIG. The all image reading means 6 and the character image reading means 7 read the image on the form surface. The image read by the all-image reading means 6 is a non-dropout image, and both character frames and characters are read. In the image read by the character image reading means 7, as shown in this figure, the character frame described in the dropout color is not read, but only the characters are read.
帳票端検出手段2は、読み込まれた帳票表面の画像から帳票の端の辺を認識することにより、帳票端を検出する。また、帳票端検出手段は、画像認識ではなく光学センサや機械的センサによっても帳票端を認識することができる。
The form
文字切り出し手段3は、帳票端検出手段2によって検出された帳票端に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字枠位置33または文字位置に関する情報とを用いて、ドロップアウト画像上における文字配置位置、及び、文字切り出し基準位置31を計算する。
The character cutout means 3 uses information on the form edge detected by the form edge detection means 2 and information on the
次に、図3(B)を参照して説明する。文字切り出し手段3は、計算された文字切り出し基準位置31とドロップアウト画面の文字23とのドロップアウト画面上における位置ずれを調べる。位置ずれは、文字切り出し基準位置31と文字23との位置ずれ量を求めることによって、位置ずれの有無を判断できる。
Next, a description will be given with reference to FIG. The character cutout means 3 checks the positional deviation on the dropout screen between the calculated character
例えば、次のようにして求めることができる。即ち、文字23を最も小さい長方形で囲った場合の、その長方形の平面上における縦方向と横方向の中心線を求める。前記長方形の縦方向の中心線と、文字切り出し基準位置31を通って前記縦方向の中心線に平行な直線との位置ずれ量を求める。同様に、前記長方形の横方向の中心線と文字切り出し基準位置31を通って前記横方向の中心線に平行な直線との位置ずれ量を求める。このようにして、位置ずれ量を求めることができる。
For example, it can be obtained as follows. That is, when the
また、位置ずれ量は、文字23の重心の位置を算出し、前記重心の位置を使用することによって求めることができる。具体的には、文字23の重心を求め、画像平面上における前記重心を通る水平線と、前記重心を通り、かつ、前記水平線と垂直な直線(以下、垂直線と称する。)を求める。文字切り出し基準位置31を通って前記水平線に平行な直線と、前記水平線との位置ずれ量を求める。同様に、文字切り出し基準位置31を通って前記垂直線に平行な直線と、前記垂直線との位置ずれ量を求める。このようにして、位置ずれ量を求めることができる。
Further, the amount of displacement can be obtained by calculating the position of the center of gravity of the
更に、前記重心の位置と、前記文字切り出し基準位置31とのずれ量を求め、これを位置ずれ量とすることもできる。
Furthermore, a deviation amount between the position of the center of gravity and the character
求めた位置ずれ量が予め決められた範囲の場合は、文字切り出し手段3は、文字の位置ずれはないと判断して、文字切り出し基準位置31を基にして前記ドロップアウト画像から文字23の画像を切り出す。また、前記文字23の画像切り出しは、フォーマットパラメータ記憶手段4に記憶された文字位置に関する情報を基にして切り出すこともできる。切り出された文字23は、文字認識手段5によって、文字が認識される。
When the obtained positional deviation amount is within a predetermined range, the
これにより、文字の位置ずれがない場合は、ずれ補正を行わないので文字認識の処理スピードを速めることができる。また、ドロップアウト画像から文字を切り出すので、文字枠が切り出されることがなく、切り出した画像には認識の障害となる文字枠が入っていないので、高精度な認識が可能となる。求めた2個の位置ずれ量のうち、何れか一つでも予め決められた範囲を超えている場合は、文字切り出し手段3は、文字の位置ずれがあると判断する。
As a result, when there is no character misalignment, the character recognition processing speed can be increased because the misalignment correction is not performed. Further, since characters are cut out from the dropout image, the character frame is not cut out, and the cut image does not include a character frame that becomes an obstacle to recognition, so that highly accurate recognition is possible. If any one of the two obtained misregistration amounts exceeds the predetermined range, the
次に、図3(C)を参照して説明する。文字切り出し手段3は、文字の位置ずれがあると判断した場合においては、以下のようにずれ補正を行う。文字切り出し手段3は、全画像読み込み手段6によって読み込まれた非ドロップアウト画像において、先に計算された前記文字配置位置に関する情報を適用し、前記文字配置位置を基準とした予め定められた領域である、読み取り領域21内で文字枠22の認識を行う。予め定められた範囲の領域である、前記読み取り領域21内で文字枠22の認識を行うことにより、帳票上に複数の文字枠があっても、誤認識することなく必要な文字枠を選択して認識することが可能となる。
文字切り出し手段3は、認識した文字枠22を基にして文字切り出し基準位置32を決定する。
Next, description will be made with reference to FIG. When it is determined that there is a character misalignment, the
The
また、文字切り出し手段3は、帳票端検出手段2によって検出された帳票端位置に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字枠位置33に関する情報を基にして、前記文字枠位置を基準として予め定められた範囲の領域である、読み取り領域21内で文字枠22の認識を行い、認識した文字枠22を基に文字切り出し基準位置32を決定することもできる。
更に、文字切り出し手段3は、非ドロップアウト画像全体から文字枠22の認識を行い、認識した文字枠を基にして文字切り出し基準位置32を決定することもできる。
Further, the character cutout means 3 is based on the information on the form edge position detected by the form edge detection means 2 and the information on the
Further, the
次に、図3(D)を参照して説明する。文字切り出し手段3は、決定した文字切り出し基準位置32を基にして、文字の切り出しを行い、文字認識手段5が切り出された画像から文字の認識を行う。この際、文字の切り出しは、ドロップアウト画像にて行う。
Next, description will be made with reference to FIG. The
これにより、ドロップアウト画像には、文字枠が写ってないので、切り出した領域内に文字枠が写っていることはなく、文字の認識において文字枠が認識の障害となることがないので、高精度の文字認識が可能となる。 As a result, since the character frame is not shown in the dropout image, the character frame is not shown in the clipped area, and the character frame does not become an obstacle to recognition in character recognition. Accurate character recognition is possible.
<全文字補正時の文字切り出しフロー>
次に、図4を参照して全文字補正時の文字切り出しフローについて更に説明する。図4は、全文字補正時の文字切り出しフローを示す図である。
文字切り出し手段3は、帳票端検出手段2によって検出された帳票端に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置または文字枠位置に関する情報(フォーマットパラメータ指定位置)とを用いて、非ドロップアウト画像上において文字枠の検出を行う(S41)。
<Character extraction flow when correcting all characters>
Next, with reference to FIG. 4, the character cutout flow when all characters are corrected will be further described. FIG. 4 is a diagram showing a character cutout flow when all characters are corrected.
The character cutout means 3 includes information on the form edge detected by the form edge detection means 2 and information on the character position or character frame position based on the form edge stored in the format parameter storage means 4 (format parameter designation position). ) Is used to detect a character frame on the non-dropout image (S41).
次に、文字切り出し手段3は、検出した文字枠22の画像から画面上での文字枠22の位置を計算し、文字枠22の位置情報を取得する(S42)。
文字切り出し手段3は、取得した文字枠22の位置情報を基にして、文字切り出し基準位置32を決定し、ドロップアウト画像から文字を切り出す(S43)。
文字認識手段5は、切り出された画像から読み取るべき文字成分を選択して、文字の認識を行う(S44)。
Next, the
The
The character recognition means 5 selects a character component to be read from the cut image and recognizes the character (S44).
<リトライ処理でずれ補正する場合の文字切り出しフロー>
次に、図5を参照してリトライ処理でずれ補正する場合の文字切り出しフローについて更に説明する。図5は、リトライ処理でずれ補正する場合の文字切り出しフローを示す図である。
<Character cutout flow for correcting misalignment in retry processing>
Next, with reference to FIG. 5, the character cutout flow in the case of correcting the deviation by the retry process will be further described. FIG. 5 is a diagram showing a character cutout flow in the case where deviation correction is performed by retry processing.
文字切り出し手段3は、帳票端検出手段2によって検出された帳票端に関する情報と、フォーマットパラメータ記憶手段4に記憶されている帳票端を基準とした文字位置に関する情報(フォーマットパラメータ指定位置)とを用いて、ドロップアウト画像上における文字配置位置、及び、文字切り出し基準位置31を計算する(S51)。
切り出し手段3は、計算された文字切り出し基準位置31と文字23との位置ずれを調べて、位置ずれの有無を判定する(S52)。
The character cutout means 3 uses information related to the form edge detected by the form edge detection means 2 and information related to the character position (format parameter designation position) stored in the format parameter storage means 4 as a reference. Then, the character arrangement position on the dropout image and the character
The
次に、文字切り出し手段3は、位置ずれがない場合は、文字切り出し基準位置を基にして、文字の切り出しを行い(S58)、位置ずれがある場合は、S54を実行する(S53)。 Next, when there is no position shift, the character cutout means 3 cuts out a character based on the character cutout reference position (S58), and when there is a position shift, executes S54 (S53).
文字切り出し手段3は、全画像読み込み手段6で読み込まれた非ドロップアウト画像において、先に計算された前記文字配置位置に関する情報を適用し、前記文字配置位置を基準とした予め定められた領域である、読み取り領域21内で文字枠22の検出及び認識を行い(S54)、その情報を基にして文字枠22の位置に関する情報を取得する(S55)。
文字切り出し手段3は、取得した文字枠22の位置に関する情報を基にして、ドロップアウト画像から文字の切り出しを行う(S56)。
文字認識手段5は、切り出された画像から読み取るべき文字成分を選択して、文字の認識を行う(S57)。
In the non-dropout image read by the whole image reading means 6, the character cutout means 3 applies the information relating to the character arrangement position calculated previously, and is a predetermined area based on the character arrangement position. The
The
The character recognizing means 5 selects a character component to be read from the clipped image and recognizes the character (S57).
以上、本発明の文字認識装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態における文字認識装置の構成及び機能に様々な変更・改良を加えることが可能である。 As mentioned above, although the specific embodiment was shown and demonstrated about the character recognition apparatus of this invention, this invention is not limited to these. Those skilled in the art can make various changes and improvements to the configuration and functions of the character recognition device in each of the above embodiments without departing from the scope of the present invention.
例えば、本発明の帳票端検出手段2、文字切り出し手段3、文字認識手段5が行う処理は、コンピュータの記憶装置に記憶されたプログラムによって、実施することができ、本発明の課題を解決して、同様の作用効果を奏することができる。 For example, the processing performed by the form edge detection means 2, the character cutout means 3, and the character recognition means 5 of the present invention can be executed by a program stored in a storage device of a computer. Similar effects can be obtained.
本発明の文字認識装置は、コンピュータのCPU、メモリ、補助記憶装置、ディスプレイ等を含むハードウェア資源上に構築されたOS、アプリケーション、光学センサ、等によって実現されるものであり、帳票上に記載された文字の認識という処理が上記のハードウェア資源を用いて具体的に実現されるものであるから、自然法則を利用した技術的思想に該当するものであり、帳票上に記載された文字を認識することを必要とする分野である、例えば、郵便の仕分け、宅配便の仕分け、アンケートの集計、テストの集計等の様々な分野において利用することができるものである。 The character recognition apparatus according to the present invention is realized by an OS, an application, an optical sensor, and the like built on hardware resources including a computer CPU, memory, auxiliary storage device, display, and the like, and is described on a form. Since the process of recognizing the written characters is specifically realized by using the above hardware resources, it corresponds to the technical idea using the laws of nature, and the characters described on the form are It can be used in various fields that need to be recognized, such as mail sorting, courier sorting, questionnaire counting, test counting, and the like.
1 画像読み込み手段
2 帳票端検出手段
3 文字切り出し手段
4 フォーマットパラメータ記憶手段
5 文字認識手段
6 全画像読み込み手段
7 文字画像読み込み手段
21 読み取り領域
22 文字枠
23 文字
24 文字切り出し基準位置
31 文字切り出し基準位置
32 文字切り出し基準位置
33 フォーマットパラメータ記憶手段に記憶されている帳票端を基準とした文字枠位置
DESCRIPTION OF
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007235246A JP5054472B2 (en) | 2007-09-11 | 2007-09-11 | Character recognition device and character recognition method in character recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007235246A JP5054472B2 (en) | 2007-09-11 | 2007-09-11 | Character recognition device and character recognition method in character recognition device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009069951A JP2009069951A (en) | 2009-04-02 |
JP5054472B2 true JP5054472B2 (en) | 2012-10-24 |
Family
ID=40606169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007235246A Active JP5054472B2 (en) | 2007-09-11 | 2007-09-11 | Character recognition device and character recognition method in character recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5054472B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6030917B2 (en) * | 2012-10-24 | 2016-11-24 | グローリー株式会社 | Character cutting device, character cutting method, and character recognition device |
JP2020086847A (en) | 2018-11-22 | 2020-06-04 | 株式会社Pfu | Image processing system, control method, and control program |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2639165B2 (en) * | 1990-03-19 | 1997-08-06 | 日本電気株式会社 | Character extraction device |
JP3022655B2 (en) * | 1991-10-29 | 2000-03-21 | 日本電気株式会社 | Character recognition device |
JPH0668299A (en) * | 1992-08-19 | 1994-03-11 | Hitachi Ltd | Display method and correction method for read result and data reader |
JPH07160814A (en) * | 1993-12-10 | 1995-06-23 | Hitachi Ltd | Optical character recognizing method |
JPH07192087A (en) * | 1993-12-27 | 1995-07-28 | Nec Corp | Optical character reader |
JP4176175B2 (en) * | 1996-09-27 | 2008-11-05 | 富士通株式会社 | Pattern recognition device |
WO2004107257A1 (en) * | 2003-05-30 | 2004-12-09 | Fujitsu Limited | Forms processing program, method, and device |
-
2007
- 2007-09-11 JP JP2007235246A patent/JP5054472B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009069951A (en) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8724925B2 (en) | Misalignment detecting apparatus, misalignment detecting method, and computer program product | |
WO2012120587A1 (en) | Text string cut-out method and text string cut-out device | |
US11551350B2 (en) | Inspecting for a defect on a print medium with an image aligned based on an object in the image and based on vertices of the inspection target medium and the reference medium | |
JP2020123940A (en) | Inclination detection device, reading device, image processing apparatus, and inclination detection method | |
US9626738B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US11514568B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2013186562A (en) | Image detection apparatus and method | |
JP6665595B2 (en) | Character recognition device, method and program | |
JP5054472B2 (en) | Character recognition device and character recognition method in character recognition device | |
US11430235B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US11750747B2 (en) | Inspection apparatus capable of preventing lowering of position matching accuracy, method of controlling same, and storage medium | |
JP3600380B2 (en) | Image processing method and fax character recognition device | |
US10091390B2 (en) | Image processing apparatus and image processing method for extracting feature points of a document image | |
US10009508B2 (en) | Image processing apparatus for reading check boxes | |
JP2003271942A (en) | Method of recording bar-code, and method and device for correcting image | |
WO2011129114A1 (en) | Form, form processing device, form processing method, and recording medium | |
JP3640488B2 (en) | Image processing method | |
US11838454B2 (en) | Inspection apparatus, control method thereof, and storage medium | |
US20240029238A1 (en) | Inspection apparatus, method of controlling the same, inspection system, and storage medium | |
JP5146199B2 (en) | Difference extraction apparatus and difference extraction program | |
US20240177296A1 (en) | Inspection apparatus, method of controlling the same, and storage medium | |
JP5757299B2 (en) | Form design device, form design method, and form design program | |
US11704921B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2022178533A (en) | Image processing apparatus | |
EP2945099B1 (en) | Character presence determination system and character presence determination method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20091211 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120723 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5054472 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |