JPH05233874A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH05233874A
JPH05233874A JP4030309A JP3030992A JPH05233874A JP H05233874 A JPH05233874 A JP H05233874A JP 4030309 A JP4030309 A JP 4030309A JP 3030992 A JP3030992 A JP 3030992A JP H05233874 A JPH05233874 A JP H05233874A
Authority
JP
Japan
Prior art keywords
skew
coordinates
reading
inclination
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4030309A
Other languages
Japanese (ja)
Other versions
JP2786044B2 (en
Inventor
Hiroshi Sasaki
央 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4030309A priority Critical patent/JP2786044B2/en
Publication of JPH05233874A publication Critical patent/JPH05233874A/en
Application granted granted Critical
Publication of JP2786044B2 publication Critical patent/JP2786044B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 大型帳票と非大型帳票とで異なるスキュー補
正手段を持つ光学的読み取り装置に関し,文字イメージ
の切り出し精度を向上させることを目的とする。 【構成】 帳票読み取り手段Aと,帳票の画像データを
格納する画像データ格納部1と,帳票原点の座標と帳票
上端の傾きとを検出する上端辺スキュー検出手段2と,
帳票サイズが大型帳票か大型帳票でないかを判定する帳
票サイズ判定手段2’と,帳票の左端もしくは右端の座
標を読み取り,帳票左端(右端)の図形を表すスキュー
グラフを作成するスキューグラフ作成手段3と,スキュ
ーグラフにより帳票の読み取り指定位置に対応する帳票
左端(右端)の傾きを求め,その傾きに基づいて読み取
り位置座標のスキュー補正をする大型帳票スキュー補正
手段4と,帳票原点座標と帳票上端辺の傾きによりスキ
ュー補正する非大型帳票スキュー補正手段4’とを備え
た構成を持つ。
(57) [Abstract] [Purpose] An optical reading device having different skew correction means for a large form and a non-large form is intended to improve the accuracy of extracting a character image. [Structure] Form reading means A, image data storage unit 1 for storing image data of a form, upper edge skew detection unit 2 for detecting coordinates of the origin of the form and inclination of the upper end of the form,
A form size determining means 2'for determining whether the form size is a large form or a large form, and a skew graph creating means 3 for reading the coordinates of the left end or the right end of the form and creating a skew graph representing a figure at the left end (right end) of the form. And the skew graph, the skew of the left edge (right edge) of the form corresponding to the designated reading position of the form is obtained, and skew correction of the coordinates of the reading position is performed based on the tilt, the origin coordinate of the form and the top end of the form. It has a configuration including a non-large form skew correction unit 4'which performs skew correction according to the inclination of the side.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は,大型帳票と通常使用さ
れる帳票(非大型帳票)とで異なる方法によりスキュー
補正する光学的読み取り装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical reading device for performing skew correction by a different method for a large form and a normally used form (non-large form).

【0002】帳票フォーマットが決められている帳票か
ら読み取られた帳票イメージが,フォーマット上で指定
された位置の文字イメージを切り出す場合,帳票が読み
取られた傾き(スキュー)から指定された座標位置を補
正する必要がある。
When a form image read from a form for which a form format is determined cuts out a character image at a position specified on the format, the specified coordinate position is corrected from the inclination (skew) at which the form is read. There is a need to.

【0003】特に,B4サイズを超える大型帳票の場合
には,帳票を光学文字読み取り装置により読み取る際の
スキューが一定でなく,読み取りのために帳票を搬送す
る際,帳票の傾きが時間とともに変化するため,スキュ
ー補正が困難になる。
In particular, in the case of a large form exceeding B4 size, the skew when the form is read by the optical character reading device is not constant, and when the form is conveyed for reading, the inclination of the form changes with time. Therefore, skew correction becomes difficult.

【0004】本発明は,大型帳票においては通常使用さ
れる非大型帳票とは異なる方法によりスキュー補正し,
文字イメージの切り出し精度を向上させるスキュー補正
手段を備えた光学的文字読み取り装置を提供する。
According to the present invention, skew correction is performed on a large form by a method different from that of a non-large form that is usually used,
Provided is an optical character reading device provided with skew correction means for improving the accuracy of cutting out a character image.

【0005】[0005]

【従来の技術】図6は光学的文字読み取り装置における
従来のスキュー補正方法を示す。図において,100は
画像メモリであって,光学的文字読み取り手段(図示せ
ず)により読み取られた帳票イメージを格納するもので
ある。101は画像メモリのX軸,101’は画像メモ
リのY軸,O(0,0)は画像メモリの座標原点を表
す。
2. Description of the Related Art FIG. 6 shows a conventional skew correction method in an optical character reader. In the figure, reference numeral 100 denotes an image memory for storing a form image read by an optical character reading means (not shown). Reference numeral 101 represents the X axis of the image memory, 101 'represents the Y axis of the image memory, and O (0,0) represents the coordinate origin of the image memory.

【0006】102は帳票イメージである。103は帳
票の上端辺(x方向),104は左端辺(y方向),A
(ux,uy)は帳票の左上端,P(X0 ,Y0 )は帳
票上の読み取り指定位置の点で,帳票上の座標(X0
0 )を持ち,装置座標(Xn, Yn)に対応する点で
ある。P’(Xn’,Yn’)はスキューがない場合の
読み取り指定位置P(X0 ,Y0 )に対応する点であ
る。
Reference numeral 102 is a form image. 103 is the top edge of the form (x direction), 104 is the left edge (y direction), A
(Ux, uy) is the upper left corner of the form, P (X 0 , Y 0 ) is the point at the designated reading position on the form, and the coordinates (X 0 ,
Y 0 ), which corresponds to the device coordinates (Xn , Yn). P ′ (Xn ′, Yn ′) is a point corresponding to the designated reading position P (X 0 , Y 0 ) when there is no skew.

【0007】スキュー補正がされた場合に,読み取り指
定位置P(X0 ,Y0 )に対して点P’(Xn’,Y
n’)の画像データが読み出されるので,帳票に傾きが
ある場合には,スキュー補正した点P(Xn,Yn)で
指定される画像メモリ100の位置の画像データを読み
出す必要がある。
[0007] When the skew correction is, the point for read designated position P (X 0, Y 0) P '(Xn', Y
Since the image data of (n ′) is read, when the form has an inclination, it is necessary to read the image data of the position of the image memory 100 designated by the skew-corrected point P (Xn, Yn).

【0008】従来のスキュー補正方法について説明す
る。画像メモリから帳票のイメージデータを切り出す場
合には,まず帳票の左上端Aの画像メモリ座標上での座
標(ux,uy)および帳票上端辺103の傾き(θ)
を求める。
A conventional skew correction method will be described. When cutting out the image data of the form from the image memory, first, the coordinates (ux, uy) on the image memory coordinates of the upper left corner A of the form and the inclination (θ) of the top edge 103 of the form are set.
Ask for.

【0009】求めたA(ux,uy)とθにより,帳票
の読み取り指定位置P(帳票上の座標(X0 ,Y0 ))
を画像メモリ上の座標位置P(Xn,Yn)に,傾きθ
に基づくスキュー補正を行い,点Pの読み取り指定位置
をP点のデータが格納されている画像メモリ上の座標に
変換する。
Based on the obtained A (ux, uy) and θ, the designated reading position P of the form (coordinates (X 0 , Y 0 ) on the form)
To the coordinate position P (Xn, Yn) on the image memory, and the inclination θ
Skew correction is performed based on the above, and the designated reading position of the point P is converted into coordinates on the image memory in which the data of the point P is stored.

【0010】点P(Xn,Yn)の画像イメージのデー
タを切り出し,文字認識を行う。図7は従来のスキュー
補正方法のフローを示す。必要に応じて図6を参照す
る。
Data of the image of the point P (Xn, Yn) is cut out and character recognition is performed. FIG. 7 shows a flow of a conventional skew correction method. If necessary, refer to FIG.

【0011】(1) イメージスキャナ(光学的文字読み
取り手段)から原画像イメージ(図6の帳票イメージ1
02)を入力して,画像メモリ格納用共用メモリ(図6
の画像メモリ100)に格納する。
(1) From the image scanner (optical character reading means), the original image image (form image 1 in FIG. 6)
02) to enter the shared memory for storing the image memory (see FIG. 6).
Image memory 100).

【0012】(2) 帳票イメージについて,その上端辺
103の傾きを求める。 (3) 帳票イメージ102について,その左上端座標A
(ux,uy)を調べる。
(2) The inclination of the upper edge 103 of the form image is calculated. (3) About the form image 102, the upper left corner coordinate A
Check (ux, uy).

【0013】(4) フォーマットで指定された文字の座
標(X0 ,Y0 )(帳票上の文字読み取り指定位置)に
ついて,左上端座標A(ux,uy)と上端辺103の
スキューから,文字座標(読み取り指定位置座標)のP
(X0 ,Y0 )を画像メモリ上の座標P(Xn,Yn)
にスキュー補正する。
(4) With respect to the coordinates (X 0 , Y 0 ) of the character specified in the format (character reading specified position on the form), the character is determined from the upper left edge coordinate A (ux, uy) and the skew of the upper edge 103. P of coordinates (specified reading position coordinates)
(X 0 , Y 0 ) is the coordinate P (Xn, Yn) on the image memory
Skew correction is performed.

【0014】(5) スキュー補正した文字座標(読み取
り位置座標)P(Xn,Yn)について,文字イメージ
を切り出す。 (6) 切り出した1文字イメージについて1文字認識す
る。
(5) A character image is cut out from the skew-corrected character coordinates (reading position coordinates) P (Xn, Yn). (6) Recognize one character for each character image cut out.

【0015】(7) 全文字について文字認識したかを判
断し,全文字について終了していなければ(4) 以降の処
理を繰り返す。全文字について終了していれば処理を終
了する。
(7) It is determined whether or not all the characters have been recognized, and if the processing has not been completed for all the characters, the processes from (4) onward are repeated. If all characters have been completed, the process ends.

【0016】[0016]

【発明が解決しようとする課題】図8は発明が解決しよ
うとする課題の説明図である。図において,100は画
像メモリ,102は帳票イメージ,110はヨレ部分で
あって,光学的文字読み取り装置において帳票を読み取
る際に,帳票の搬送にともない帳票の傾きが変化した部
分を表す。
FIG. 8 is an explanatory diagram of a problem to be solved by the invention. In the figure, reference numeral 100 is an image memory, 102 is a form image, and 110 is a twisted portion, which represents a portion in which the inclination of the form changes as the form is conveyed when the form is read by the optical character reader.

【0017】P(X0 ,Y0 )は帳票上の読み取り指定
位置の座標であって,画像メモリ100の座標(Xn,
Yn)に対応するものである。帳票が大型帳票の場合,
帳票を光学的読み取り装置に読み取る際に帳票がヨレ,
帳票の読み取り位置P(X0 ,Y0 )(画像メモリにお
いてスキュー補正された座標(Xn,Yn))が,帳票
のヨレのため,実際には図示のP’(Xn’,Yn’)
に格納される場合がある。
P (X 0 , Y 0 ) is the coordinate of the designated reading position on the form and is the coordinate (Xn,
Yn). If the form is a large form,
When the form is read by the optical reading device, the form is twisted,
The reading position P (X 0 , Y 0 ) of the form (coordinates (Xn, Yn) skew-corrected in the image memory) is actually the deviation of the form, so P '(Xn', Yn ') shown in the figure is actually used.
May be stored in.

【0018】このような場合には,読み取り位置P(X
0 ,Y0 )を帳票の上端辺の傾きθでスキュー補正して
(Xn,Yn)としても,実際には,指定された画像デ
ータは画像メモリ100のP’(Xn’,Yn’)の位
置に格納されているので,正しい読み取りを行うことが
できない。
In such a case, the reading position P (X
Even if 0 , Y 0 ) is skew-corrected with the inclination θ of the upper edge of the form to be (Xn, Yn), the designated image data is actually stored in P ′ (Xn ′, Yn ′) of the image memory 100. The correct reading cannot be performed because it is stored in the position.

【0019】本発明は,帳票がヨレて読み取られた場合
にも,画像メモリから正しく文字データを切り出すこと
のできる光学的文字読み取り装置におけるスキュー補正
方法を提供することを目的とする。
It is an object of the present invention to provide a skew correction method in an optical character reading device capable of correctly cutting out character data from an image memory even when a form is read and twisted.

【0020】[0020]

【課題を解決するための手段】本発明は,大型帳票につ
いては,帳票イメージから,帳票左端もしくは右端のグ
ラフを作成し,そのグラフから読み取り位置に対応する
帳票左端もしくは右端の傾きを求め,その傾きに基づい
て読み取り指定位置のスキュー補正を逐次行いながら画
像データ(文字イメージ)の切り出しを行うようにし
た。
According to the present invention, for a large form, a graph at the left end or the right end of the form is created from a form image, and the inclination of the left end or the right end of the form corresponding to the reading position is obtained from the graph, and the graph is obtained. The image data (character image) is cut out while sequentially correcting the skew of the designated reading position based on the inclination.

【0021】図1は,本発明の基本構成を示す。図にお
いて,Aは帳票読み取り手段であって,イメージスキャ
ナ等よりなるものである。1は画像データ格納手段であ
って,帳票読み取り手段(A)により読み取られた帳票
イメージを格納するものである。
FIG. 1 shows the basic configuration of the present invention. In the figure, A is a form reading means, which is composed of an image scanner or the like. An image data storage unit 1 stores a form image read by the form reading unit (A).

【0022】2は上端辺スキュー検出手段であって,帳
票の上端辺の傾き(スキュー)と,帳票原点(左上端の
点)を読み取るものである。3はスキューグラフ作成手
段であって,帳票左端もしくは右端の画像データ格納手
段1における座標を読み取り,帳票左端もしくは右端の
曲線を表すグラフであるスキューグラフを作成するもの
である。
Reference numeral 2 denotes an upper edge skew detecting means for reading the inclination (skew) of the upper edge of the document and the origin of the document (the upper left point). Reference numeral 3 denotes a skew graph creating means for reading the coordinates in the image data storage means 1 at the left end or right end of the form and creating a skew graph which is a graph representing a curve at the left end or the right end of the form.

【0023】4は大型帳票スキュー補正手段であって,
帳票上の読み取り指定位置に対応する位置の帳票の帳票
左端もしくは右端の傾きをスキューグラフより求め,そ
の位置における帳票の傾きにより,帳票上の読み取り指
定位置の座標値をスキュー補正するものである。4’は
非大型帳票スキュー補正手段であって,帳票上端辺の傾
きおよび帳票原点座標に基づいてスキュー補正するもの
である。
Reference numeral 4 denotes a large form skew correction means,
The skew of the left or right edge of the form at the position corresponding to the designated reading position on the form is obtained from the skew graph, and the coordinate value of the designated reading position on the form is skew-corrected by the skew of the form at that position. Reference numeral 4'denotes a non-large form skew correction means, which performs skew correction based on the inclination of the upper edge of the form and the coordinates of the origin of the form.

【0024】5は文字認識手段であって,読み取り指定
位置の画像データを切り出し,文字認識するものであ
る。
Reference numeral 5 is a character recognition means for recognizing characters by cutting out image data at a designated reading position.

【0025】[0025]

【作用】本発明の基本構成の動作を説明する。図2は本
発明のスキュー補正方法を示す。
The operation of the basic configuration of the present invention will be described. FIG. 2 shows the skew correction method of the present invention.

【0026】帳票読み取り手段Aは,帳票をイメージデ
ータとして読み取る。画像データ格納手段1は読み取ら
れた帳票イメージを格納する。上端辺スキュー検出手段
2は,画像メモリ100の帳票イメージにより,帳票上
端辺の傾きおよび帳票原点(帳票の左上端)の座標を求
める。
The form reading means A reads the form as image data. The image data storage means 1 stores the read form image. The upper edge skew detecting means 2 obtains the inclination of the upper edge of the form and the coordinates of the origin of the form (upper left end of the form) from the form image in the image memory 100.

【0027】帳票サイズ判定手段2’は帳票が大型帳票
(例えば,B4を超えるサイズの帳票)であるか,ある
いは非大型帳票(例えば,通常使用されるB4以下のサ
イズの帳票)であるかどうかを判定する。
The form size determining means 2'determines whether the form is a large form (for example, a size larger than B4) or a non-large size (for example, a size B4 or smaller size that is normally used). To judge.

【0028】判定結果が,非大型帳票であれば,非大型
帳票スキュー補正手段4’は,帳票の上端辺の傾きと帳
票原点の座標に基づいてスキュー補正をする(従来のス
キュー補正方法に同じ)。文字認識手段5は画像データ
格納手段1からスキュー補正された座標の画像データ
(文字イメージ)を切り出し,文字認識する。
If the determination result is a non-large form document, the non-large form skew correction means 4'corrects the skew based on the inclination of the upper edge of the form and the coordinates of the form origin (the same as the conventional skew correction method. ). The character recognition unit 5 cuts out the image data (character image) of the skew-corrected coordinates from the image data storage unit 1 and recognizes the character.

【0029】帳票サイズ判定手段2’の判定結果が,大
型帳票の場合には,大型帳票スキュー補正手段4は,大
型帳票に対するスキュー補正方法によりスキュー補正す
る(大型帳票のスキュー補正方法については後述す
る)。
When the determination result of the form size determination means 2'is a large form, the large form skew correction means 4 performs skew correction by a skew correction method for the large form (the skew correction method for the large form will be described later. ).

【0030】文字認識手段5は,画像データ格納手段1
からスキュー補正された座標の画像データ(文字イメー
ジ)を切り出し,文字認識する。図2により,本発明の
大型帳票スキュー補正方法を説明する(必要に応じて図
1を参照する)。図2は大型帳票スキュー補正方法を示
し,本発明の大型帳票スキュー補正手段4のスキュー補
正方法を示す。
The character recognition means 5 is the image data storage means 1
Image data (character image) with skew-corrected coordinates is cut out from and character recognition is performed. The large form skew correction method of the present invention will be described with reference to FIG. 2 (refer to FIG. 1 as necessary). FIG. 2 shows a large form skew correction method, and shows a skew correction method of the large form skew correction means 4 of the present invention.

【0031】図において,10は画像データ格納手段
(以後画像メモリと称する)である。11は画像メモリ
X軸,12は画像メモリY軸,O(0,0)は画像メモ
リ原点である。13は帳票イメージ,14は帳票の上端
辺,15は帳票の左端辺,16は帳票のヨレ部分を表
す。A(ux,uy)は帳票原点(帳票左上の点),P
(X0 ,Y0 )は帳票上の読み取り位置である。P’
(Xn,Yn)は帳票がヨレた結果,帳票上の読み取り
位置P(X0 ,Y0 )のデータが実際に格納されている
位置を示す。
In the figure, 10 is an image data storage means (hereinafter referred to as an image memory). 11 is the image memory X axis, 12 is the image memory Y axis, and O (0,0) is the image memory origin. Reference numeral 13 is a form image, 14 is an upper end side of the form, 15 is a left end side of the form, and 16 is a twisted portion of the form. A (ux, uy) is the origin of the form (the upper left point of the form), P
(X 0 , Y 0 ) is the reading position on the form. P '
(Xn, Yn) indicates the position where the data of the reading position P (X 0 , Y 0 ) on the form is actually stored as a result of the form being misaligned.

【0032】20はスキュー・グラフ,21はスキュー
補正におけるスキュー判定範囲を示す。まず,上端辺ス
キュー検出手段2は,帳票左端辺15もしくは右端辺の
画像メモリ10の座標データを読み取り,帳票上端辺1
4から下端にかけて,Δyに区切り,それぞれのΔyに
ついて,帳票左端辺15もしくは右端辺のスキュー・グ
ラフ20を作成する。Δyは帳票読み取り手段の帳票搬
送速度に依存し,緻密なスキューグラフを作成する場合
には狭く,精度が粗くても良い場合には幅を広く取る。
Reference numeral 20 is a skew graph, and 21 is a skew determination range in skew correction. First, the top edge skew detection means 2 reads the coordinate data of the image memory 10 at the left edge 15 or right edge of the form, and determines the top edge 1 of the form.
From 4 to the lower end, it is divided into Δy, and the skew graph 20 of the left edge 15 or the right edge of the form is created for each Δy. Δy depends on the form conveyance speed of the form reading means, and is set narrow when a precise skew graph is created, and wide when the precision may be rough.

【0033】次に、スキューグラフ補正手段4は,スキ
ューグラフを参照して,読み取り指定位置のスキュー補
正を行う。例えば,図の帳票上の読み取り位置P
(X0 ,Y0 )に対してスキュー補正する場合を考え
る。
Next, the skew graph correcting means 4 refers to the skew graph and corrects the skew at the designated reading position. For example, the reading position P on the form
Consider a case where skew correction is performed on (X 0 , Y 0 ).

【0034】上端辺のスキューから,読み取り位置P
(X0 ,Y0 )のY座標に対応する画像メモリのY座標
S を求める。次にYS を中心として幅Δhの範囲で帳
票の傾きを求め,その傾きに応じて,帳票読み取り位置
P(X0 ,Y0 )のスキュー補正を行い,帳票のP点の
データが格納されている画像メモリ上の位置P’(X
,Yn )を求める。
From the skew of the upper edge, the reading position P
(X0, Y0) Y coordinate of image memory corresponding to Y coordinate
YSAsk for. Then YSCentered at the range of width Δh
The inclination of the form is calculated, and the form reading position is calculated according to the inclination.
P (X0, Y0) Skew correction is performed and
Position P '(X
n , Yn ).

【0035】なお,ここで,Δhの幅は,要求されるス
キュー精度に応じて定められる。通常は,入力イメージ
に対する最大許容スキューとする。本発明によれば,帳
票サイズを判定し,ヨレの生じやすい大型帳票の場合に
は,通常使用される非大型帳票の場合と異なるスキュー
補正方法により指定された位置の画像データ(文字イメ
ージ)を正確に切り出すことができる。
Here, the width of Δh is determined according to the required skew accuracy. Usually, it is the maximum allowable skew for the input image. According to the present invention, the form size is determined, and in the case of a large form that is apt to be twisted, image data (character image) at a position specified by a skew correction method different from the case of a non-large form that is normally used is displayed. It can be cut out accurately.

【0036】[0036]

【実施例】図3は本発明の装置構成実施例を示す図であ
る。図において,30はマイクロプロセッサであって,
各手段の処理プログラムに基づいて,スキューグラフの
作成,各スキュー補正,文字の切り出し等の演算処理を
行うものである。31は上端辺のスキュー検出手段,3
2は帳票サイズ判定手段である。33は1文字切出し手
段,34は認識処理手段であって,切り出された1文字
分の画像データの文字認識を行うものである。35はイ
メージ・スキャナであって,帳票の読み取りを行うもの
である。36は画像格納用共用メモリ(画像メモリであ
って,イメージスキャナにより読み取られた帳票の画像
データを格納するものである。37はワークメモリであ
って,各手段のプログラムを展開し,マイクロプロセッ
サによる演算処理において演算データを格納するもので
ある。38はスキューグラフ作成手段であって,スキュ
ーグラフを作成するものである。39はスキュー補正手
段であって,大型帳票スキュー補正手段と非大型帳票ス
キュー補正手段とよりなるものである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 3 is a diagram showing an embodiment of the apparatus configuration of the present invention. In the figure, 30 is a microprocessor,
Based on the processing program of each means, skew graph creation, skew correction, character cutout, and other arithmetic processing are performed. 31 is a skew detecting means for the upper end side, 3
Reference numeral 2 is a form size determining means. Reference numeral 33 is a one-character cutting-out means, and 34 is a recognition processing means, which performs character recognition of the cut-out one-character image data. An image scanner 35 reads the form. Reference numeral 36 denotes a shared memory for image storage (an image memory for storing image data of a form read by an image scanner. 37 is a work memory for expanding the program of each means and using a microprocessor. The calculation data is stored in the calculation process. 38 is a skew graph creating means for creating a skew graph. 39 is a skew correcting means, which is a large form skew correcting means and a non-large form skew. Compensation means.

【0037】図4,図5はそれぞれ本発明の実施例のフ
ロー(1) ,(2) である。図は,図3における各手段のフ
ローを示し,図5のフローは図4のフローに続く部分を
表す。必要に応じて図3を参照する。
4 and 5 are flow charts (1) and (2) of the embodiment of the present invention. The figure shows the flow of each means in FIG. 3, and the flow of FIG. 5 shows the part following the flow of FIG. Refer to FIG. 3 as needed.

【0038】(1) イメーシスキャナ35から原画イメ
ージ(帳票イメージ)を入力し,画像メモリ格納用共用
メモリ36に格納する。 (2) 帳票イメージについて,上端辺のスキュー検出手
段31は上端辺のスキューを調べる。
(1) An original image (form image) is input from the image scanner 35 and stored in the shared memory 36 for storing image memory. (2) With respect to the form image, the skew detecting means 31 at the upper edge checks the skew at the upper edge.

【0039】(3) 帳票イメージについて,上端辺のス
キュー検出手段31はその左上端座標(ux,uy)を
調べる。 (4) 帳票サイズ判定手段32は大型帳票(例:B4サ
イズを越える帳票)であるか判定する。大型帳票であれ
ば,(5) に進み,大型帳票でなければ(12)に進む。
(3) Regarding the form image, the skew detecting means 31 on the upper edge checks the upper left edge coordinates (ux, uy). (4) The form size determination unit 32 determines whether the form is a large form (eg, a form exceeding B4 size). If it is a large form, proceed to (5). If it is not a large form, proceed to (12).

【0040】(5) 帳票イメージについて,左上端Y座
標(uy)から下端までのY方向の範囲をΔyで分割す
る。 (5’) 分割された各点で画像メモリのY軸から帳票イ
メージ左端辺までの距離を調べる。
(5) With respect to the form image, the range in the Y direction from the upper left Y coordinate (uy) to the lower end is divided by Δy. (5 ') Check the distance from the Y-axis of the image memory to the left edge of the form image at each divided point.

【0041】(6) 調べた距離を基に,スキューグラフ
を作成する。 以下,(7) 〜(9) は大型帳票スキュー補正手段の処理で
ある。 (7) 帳票のフォーマットで指定された文字の座標(X
0 ,Y0 )(読み取り指定位置の座標)について,その
0 に対応する画像メモリY軸の左端の座標Ys(帳票
上の座標(Y0 ,0)を上端辺の傾きによりスキュー補
正した画像格納用共用メモリ(画像メモリ)36のY座
標値)を求める。
(6) A skew graph is created based on the investigated distance. Below, (7) to (9) are the processes of the large form skew correction means. (7) Coordinates of the characters specified in the form format (X
0 , Y 0 ) (coordinates of the designated reading position), the image Y Y corresponding to Y 0 (the coordinate Ys at the left end of the Y axis (coordinates (Y 0 , 0) on the form) is skew-corrected by the inclination of the upper end side. The Y coordinate value of the shared storage memory (image memory) 36 is obtained.

【0042】(8) Ysの座標から上下にΔhの範囲の
スキューグラフを調べ,YS 点のスキューとする。 (9) YS とスキュー量から文字座標(X0 ,Y0 )に
ついて,(Xn ,Yn )にスキュー補正する。
(8) Check the skew graph in the range of Δh up and down from the Ys coordinate, and set it as the skew at the Y S point. (9) Y S and character coordinates from the skew amount (X 0, Y 0), (Xn , Yn ) To skew correction.

【0043】(10) スキュー補正した文字座標(X
,Yn )(読み出し指定座標)について文字イメー
ジを1文字切り出す。 (11) 切り出した1文字イメージについて1文字認識す
る。
(10) Skew-corrected character coordinates (X
n , Yn ) (One character image is cut out for the designated read coordinates). (11) Recognize one character for each character image cut out.

【0044】(12') 全文字について認識終了したか判定
する。全文字終了していれば処理を終了し,終了してい
なければ(4) 以降の処理を繰り返す。 (12) (4) の判断において,大型帳票でないと判断され
た場合には,非大型帳票スキュー補正手段が,フォーマ
ットで指定された文字の座標(読み取り指定位置の座
標)(X0 ,Y0 )について帳票の左上端の座標と上端
辺のスキューから,文字座標(X0 ,Y0 )にスキュー
補正する。以後,(10),(11)の処理により1文字の切り
出しと切り出した文字について1文字認識をする。さら
に,(12')の判断で全文字の認識を終了していなければ
(4) 以降の処理を繰り返し,全文字について認識を終了
したと判断されたら処理を終了する。
(12 ') It is judged whether recognition of all characters is completed. If all characters have been completed, the process is terminated, and if not completed, the processes from (4) onward are repeated. (12) If it is determined in the judgment of (4) that the form is not a large form, the non-large form skew correction means causes the coordinates of the characters designated in the format (coordinates of the designated reading position) (X 0 , Y 0 ) Is skew-corrected to the character coordinates (X 0 , Y 0 ) from the coordinates of the upper left corner and the skew of the upper edge. After that, by the processing of (10) and (11), one character is cut out and one character is recognized for the cut out character. Furthermore, if recognition of all characters has not been completed by the judgment of (12 ')
(4) The following processes are repeated, and if it is determined that the recognition has been completed for all characters, the process ends.

【0045】[0045]

【発明の効果】本発明によれば,大型帳票と通常使用さ
れる非大型帳票を自動的に選択し,非大型帳票の場合に
は従来通りに処理が可能であり,大型帳票の場合にはヨ
レを考慮して正確な文字の切り出しを行うことができ
る。
According to the present invention, a large form and a non-large form normally used can be automatically selected, and in the case of a non-large form, processing can be performed as usual, and in the case of a large form. Accurate cutting of characters can be performed in consideration of twisting.

【0046】そのため,本発明によれば,帳票の文字認
識の信頼性を大幅に向上させることが可能になる。
Therefore, according to the present invention, it is possible to greatly improve the reliability of character recognition of the form.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の基本構成を示す図である。FIG. 1 is a diagram showing a basic configuration of the present invention.

【図2】本発明の大型帳票スキュー補正方法を示す図で
ある。
FIG. 2 is a diagram showing a large form skew correction method of the present invention.

【図3】本発明の装置構成実施例を示す図である。FIG. 3 is a diagram showing a device configuration example of the present invention.

【図4】本発明の実施例フロー(1) を示す図である。FIG. 4 is a diagram showing an embodiment flow (1) of the present invention.

【図5】本発明の実施例フロー(2) を示す図である。FIG. 5 is a diagram showing an embodiment flow (2) of the present invention.

【図6】従来のスキュー補正方法を示す図である。FIG. 6 is a diagram showing a conventional skew correction method.

【図7】従来のスキュー補正方法のフローを示す図であ
る。
FIG. 7 is a diagram showing a flow of a conventional skew correction method.

【図8】発明が解決しようとする課題の説明図である。FIG. 8 is an explanatory diagram of a problem to be solved by the invention.

【符号の説明】[Explanation of symbols]

A :帳票読み取り手段 1 :画像データ格納手段 2 :上端辺スキュー検出手段 2’:帳票サイズ判定手段 3 :スキューグラフ作成手段 4 :大型帳票スキュー補正手段 4’:非大型帳票スキュー補正手段 5 :文字認識手段 A: Form reading unit 1: Image data storage unit 2: Top edge skew detection unit 2 ': Form size determination unit 3: Skew graph creation unit 4: Large form skew correction unit 4': Non-large form skew correction unit 5: Character Recognition means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 帳票読み取り手段(A)と,帳票の画像デ
ータを格納する画像データ格納手段(1) と,帳票原点の
座標と帳票上端の傾きとを検出する上端辺スキュー検出
手段(2) と,帳票サイズが大型帳票か大型帳票でないか
を判定する帳票サイズ判定手段(2') と,帳票の左端も
しくは右端の座標を読み取り,帳票左端もしくは右端の
図形を表すスキューグラフを作成するスキューグラフ作
成手段(3) ,とスキューグラフにより帳票の読み取り指
定位置に対応する帳票左端もしくは右端の傾きを求め,
その傾きに基づいて読み取り位置座標のスキュー補正を
する大型帳票スキュー補正手段(4) と,帳票原点座標と
帳票上端辺の傾きによりスキュー補正する非大型帳票ス
キュー補正手段(4')と,画像データ格納手段(1) にお
けるスキュー補正された座標の画像データを読み取り,
文字認識する文字認識手段(5) とを備えたことを特徴と
する光学的文字読み取り装置。
1. A form reading means (A), an image data storing means (1) for storing image data of the form, and an upper edge skew detecting means (2) for detecting coordinates of the origin of the form and inclination of the upper end of the form. And a form size determination means (2 ') for determining whether the form size is a large form or a large form, and a skew graph for reading the coordinates of the left end or the right end of the form and creating a skew graph representing the figure at the left end or the right end of the form. Using the creating means (3) and the skew graph, find the inclination of the left or right edge of the form corresponding to the designated reading position of the form,
Large form skew correction means (4) for skew correction of reading position coordinates based on the inclination, non-large form skew correction means (4 ') for skew correction based on the origin coordinate and inclination of the top edge of the form, and image data Read the image data of skew-corrected coordinates in the storage means (1),
An optical character reading device comprising character recognition means (5) for recognizing characters.
【請求項2】 帳票上の座標における読み取り指定点の
座標(X0 ,Y0 )とした時,帳票上の座標(0,
0 )の点を帳票上端辺と帳票原点座標に基づいてスキ
ュー補正した画像データ格納手段(1) におけるY軸の座
標をYsに対し,大型帳票スキュー補正手段(4) はYs
におけるスキューグラフの傾きに基づいてスキュー補正
を行うことを特徴とする光学的文字読み取り装置。
2. When the coordinates (X 0 , Y 0 ) of the designated reading point in the coordinates on the form are set, the coordinates on the form (0,
Y 0 ) point is skew-corrected based on the top edge of the form and the coordinates of the origin of the form, and the Y-axis coordinate in the image data storage means (1) is Ys, and the large-form slip correction means (4) is Ys
2. An optical character reading device characterized by performing skew correction based on the inclination of a skew graph in FIG.
JP4030309A 1992-02-18 1992-02-18 Optical character reader Expired - Lifetime JP2786044B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4030309A JP2786044B2 (en) 1992-02-18 1992-02-18 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4030309A JP2786044B2 (en) 1992-02-18 1992-02-18 Optical character reader

Publications (2)

Publication Number Publication Date
JPH05233874A true JPH05233874A (en) 1993-09-10
JP2786044B2 JP2786044B2 (en) 1998-08-13

Family

ID=12300179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4030309A Expired - Lifetime JP2786044B2 (en) 1992-02-18 1992-02-18 Optical character reader

Country Status (1)

Country Link
JP (1) JP2786044B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0926848A3 (en) * 1997-12-23 2004-04-07 Lucent Technologies Inc. Optical amplifier for bidirectional WDM optical communications systems
JP2010244386A (en) * 2009-04-08 2010-10-28 Canon Electronics Inc Image reading device, method for controlling image reading device, control program and storage medium
JP2014048731A (en) * 2012-08-29 2014-03-17 Fujitsu Frontech Ltd Character recognition device, program and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0926848A3 (en) * 1997-12-23 2004-04-07 Lucent Technologies Inc. Optical amplifier for bidirectional WDM optical communications systems
JP2010244386A (en) * 2009-04-08 2010-10-28 Canon Electronics Inc Image reading device, method for controlling image reading device, control program and storage medium
JP2014048731A (en) * 2012-08-29 2014-03-17 Fujitsu Frontech Ltd Character recognition device, program and method

Also Published As

Publication number Publication date
JP2786044B2 (en) 1998-08-13

Similar Documents

Publication Publication Date Title
JP2940960B2 (en) Image tilt detection method and correction method, and image information processing apparatus
JPH1139428A (en) How to correct the orientation of document video
JPH08287184A (en) Image cropping device and character recognition device
JP2786044B2 (en) Optical character reader
JPH07220023A (en) Table recognition method and apparatus thereof
JP3031579B2 (en) How to specify the character recognition area of a form
JPH0728935A (en) Document image processor
JPH05174184A (en) Optical character reader
US20200302209A1 (en) Systems and methods for separating ligature characters in digitized document images
JPH03263282A (en) Character segmenting method for character reader
JP2501150B2 (en) Laser welding method
JPH01156887A (en) Character recognizing device
JPH117493A (en) Character recognition processor
JP2608943B2 (en) Optical mark reading method
JP3356819B2 (en) Mark recognition device
JPH03250387A (en) Character segmenting system
JPH0850632A (en) Method and device for cutting out handwritten characters
JPH0844822A (en) Character recognition device
JPH11250179A (en) Character reocognition device and its method
JPH09237321A (en) Device for recognizing handwritten character
JPH04156694A (en) Character recognition system
JPH0483467A (en) Tilt correction method for read images
JPH0793479A (en) Optical character reader
JPH0554187A (en) Character pattern inclination detection method
JPS60156188A (en) Character segmentation system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980512