JPH06251199A - Character recognition pre-processing device - Google Patents

Character recognition pre-processing device

Info

Publication number
JPH06251199A
JPH06251199A JP5038615A JP3861593A JPH06251199A JP H06251199 A JPH06251199 A JP H06251199A JP 5038615 A JP5038615 A JP 5038615A JP 3861593 A JP3861593 A JP 3861593A JP H06251199 A JPH06251199 A JP H06251199A
Authority
JP
Japan
Prior art keywords
image
processing
character
inclination
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5038615A
Other languages
Japanese (ja)
Inventor
Takahiro Sakurai
隆博 桜井
Noriaki Otake
紀明 大竹
Masaomi Nakajima
正臣 中嶋
Yasuo Sanbe
靖夫 三部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP5038615A priority Critical patent/JPH06251199A/en
Publication of JPH06251199A publication Critical patent/JPH06251199A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To reduce burden on a central processing unit and to perform character recognition pre-processing at high speed by employing such constitution that the control of the character recognition pre-processing is performed by the central processing unit that is a first processor, and the execution of the character recognition pre-processing by an image processing device that is a second processor. CONSTITUTION:This device is constituted of the central processing unit 1 as the first processor, the image processing device 2 as the second processor, an image acquisition device 3 comprised of the reading part of an OCR, a memory device 4, and a bus line 5. The central processing unit 1 instructs the correction of inclination of an image stored in the memory device 4 and the segmentation of a character in a character area after inclination correction. The image processing device 2 corrects the inclination of the image on the memory device 4 based on such instruction, and also, segments the character stored at an instructed position on the memory device 4. Also, the image processing device 2 corrects the inclination of the image stored in the memory device 4 by affine transformation based on that of space in reading.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、光学式文字読み取り装
置(OCR:Optical Character Reader)等に使用する
文字認識前処理装置に関し、特に、画像から文字を切り
出す前処理を行う文字認識前処理装置に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition preprocessing device used in an optical character reader (OCR) or the like, and more particularly to a character recognition preprocessing device for performing preprocessing for cutting out a character from an image. It is about.

【0002】[0002]

【従来の技術】従来、手書き文字あるいは印刷文字など
の紙面上の文字を、対応するコード情報に変換する場合
にOCR等が用いられている。
2. Description of the Related Art Conventionally, OCR or the like has been used to convert characters on paper such as handwritten characters or printed characters into corresponding code information.

【0003】しかしながら、手書き文字あるいは印刷文
字の生成過程において、例えば印刷された文字に濃淡が
あるなど、必ずしも文字が理想的に生成されているとは
限らない。
However, in the process of generating a handwritten character or a printed character, the character is not always ideally generated, for example, the printed character has shading.

【0004】このためOCRにおいては、紙面上の文字
を含む多値画像(以下、画像という)を取得したなら
ば、文字認識が精度良く行えるように、画像から雑音等
を除いた後に、指定された文字領域から1文字づつ文字
を切り出す前処理が行われている。
Therefore, in the OCR, if a multi-valued image (hereinafter referred to as an image) containing characters on a paper surface is acquired, it is designated after removing noise and the like from the image so that character recognition can be performed accurately. Pre-processing for cutting out characters one by one from the character area is performed.

【0005】この前処理には、 (1)濃度補正:印刷された紙面の文字の濃淡を整える
こと。 (2)フィルタ:画像には、例えば、印刷時のインクの
飛沫などによる文字ではない部分、いわゆる雑音と呼ば
れる部分があるので、これを除去すること。 (3)2値化 :多階調で得られた画像を適切な閾値で
白と黒に量子化すること。 (4)切出し :2値化された文字パターンあるいは文
字領域から1文字づつの文字を出力すること。 がある。
This pre-processing includes: (1) Density correction: adjusting the shade of characters on the printed paper. (2) Filter: For example, the image has a portion that is not a character due to ink droplets during printing, that is, a so-called noise portion, and should be removed. (3) Binarization: Quantizing an image obtained with multiple gradations into white and black with an appropriate threshold value. (4) Clipping: Outputting one character at a time from a binarized character pattern or character area. There is.

【0006】図7は、前処理を行う従来装置の一例を示
すブロック構成図である。
FIG. 7 is a block diagram showing an example of a conventional apparatus for performing preprocessing.

【0007】図7においては、画像取得装置(例えば、
OCRの読み取り部)から一時記憶装置21に入力され
た画像を、濃度補正処理、フィルタ処理、2値化処理等
を行う処理装置22に直接入力し、これらの処理を行っ
た後の画像を記憶装置23に格納し、その後、記憶装置
23に格納された画像をバスライン20を通じて中央処
理装置24で読み出し、認識すべき文字を1文字づつ切
り出す切り出し処理を行っている。
In FIG. 7, an image acquisition device (eg,
The image input from the OCR reading unit) to the temporary storage device 21 is directly input to the processing device 22 that performs density correction processing, filtering processing, binarization processing, etc., and the image after performing these processing is stored. The image is stored in the device 23, and then the image stored in the storage device 23 is read by the central processing unit 24 through the bus line 20 to perform a cutting process for cutting out characters to be recognized one by one.

【0008】図8は、前処理を行う従来装置の他の一例
を示すブロック構成図であり、記憶装置25、処理装置
26、これらにバスライン20で結合された中央処理装
置27とから成っている。
FIG. 8 is a block diagram showing another example of a conventional device for performing preprocessing, which comprises a memory device 25, a processing device 26, and a central processing device 27 connected to these by a bus line 20. There is.

【0009】図9は、図8の構成における前処理手順を
示すフローチャートであり、まず、入力された画像は一
度記憶装置25に格納される(ステップ91)。
FIG. 9 is a flow chart showing the preprocessing procedure in the configuration of FIG. 8. First, the input image is once stored in the storage device 25 (step 91).

【0010】この格納された画像は中央処理装置27に
よって文字の傾き、位置ずれが補正され、記憶装置25
に再度格納される(ステップ92)。この後、濃度補正
処理、フィルタ処理、2値化処理が施され(ステップ9
3)、その後、中央処理装置27によって切り出し処理
が行われている(ステップ94)。この一連の処理を全
文字について行う(ステップ95)。
The central processing unit 27 corrects the inclination and displacement of the characters in the stored image, and the stored image is stored in the storage unit 25.
Are again stored in (step 92). After that, density correction processing, filter processing, and binarization processing are performed (step 9).
3) After that, the central processing unit 27 performs the cutting process (step 94). This series of processing is performed for all characters (step 95).

【0011】ところで、OCRに帳票等を入力して文字
を認識させる場合、帳票がその入力段階で図10の実線
で示す基準位置から破線で示す位置に傾いて入力され、
その結果として読み取った画像が傾いていることがあ
る。
By the way, when a form or the like is input to the OCR and characters are recognized, the form is input at the input stage while being inclined from the reference position shown by the solid line to the position shown by the broken line.
As a result, the read image may be skewed.

【0012】このような原因で傾いた画像は、その傾き
を補正しなければ、後工程において文字特徴を正しく抽
出できない。
In an image tilted due to such a cause, the character feature cannot be correctly extracted in a subsequent process unless the tilt is corrected.

【0013】そこで、このような帳票の傾きに起因した
画像の傾きの補正方法として、例えば、図7の構成にお
ける前処理装置では、一時記憶装置21と処理装置22
との間に遅延回路を設けて、図10に示すように画像の
上からn番目の走査線部分と上からn+1番目の走査線
部分をずらすことにより傾きを補正し、この補正後の画
像に対して濃度補正処理等を行っている。
Therefore, as a method of correcting the inclination of the image caused by the inclination of the form, for example, in the preprocessing apparatus having the configuration of FIG. 7, the temporary storage device 21 and the processing device 22 are used.
A delay circuit is provided between the first and second scanning lines to shift the n-th scanning line portion from the top of the image and the (n + 1) th scanning line portion from the top of the image to correct the inclination. On the other hand, density correction processing and the like are performed.

【0014】また、図8の構成における前処理装置で
は、前記傾きを補正する処理は中央処理装置27で行っ
ている。
Further, in the preprocessing apparatus having the configuration of FIG. 8, the processing for correcting the inclination is performed by the central processing unit 27.

【0015】この時、何番目の走査線をずらすか、ある
いは走査線何本に1本の割合でずらすかかによって、傾
きの補正程度が変る。
At this time, the degree of inclination correction varies depending on which scanning line is displaced or how many scanning lines are displaced at a ratio of one scanning line.

【0016】[0016]

【発明が解決しょうとする課題】しかしながら、本来、
画像の傾きの補正は、図10に示した傾きの補正方法の
ように平行四辺形から方形への平行変換によってなされ
るべきものではなく、正しくは回転変換によって補正さ
れるべきものである。
[Problems to be solved by the invention] However, originally,
The correction of the inclination of the image should not be performed by the parallel conversion from the parallelogram to the rectangle as in the correction method of the inclination shown in FIG. 10, but should be corrected by the rotation conversion.

【0017】従って、図10に示した傾きの補正方法で
は、後工程において文字特徴を正しく抽出できなくなる
という問題がある。
Therefore, the inclination correction method shown in FIG. 10 has a problem that the character feature cannot be correctly extracted in the subsequent process.

【0018】また、図8の構成における前処理装置で
は、前記回転変換による傾きの補正はCPU27で行う
ことになるが、このことによりCPU27の負荷が大き
くなるという問題があり、結果的に、文字認識前処理が
高速化できないということになる。
Further, in the pre-processing apparatus having the configuration of FIG. 8, the inclination correction by the rotation conversion is performed by the CPU 27, but this causes a problem that the load of the CPU 27 increases, and as a result, the character This means that the pre-recognition process cannot be speeded up.

【0019】本発明の目的は、中央処理装置の負荷を軽
減し、かつ文字認識前処理を高速で行うことを可能にす
る文字認識前処理装置を提供することにある。
An object of the present invention is to provide a character recognition preprocessing device which can reduce the load on the central processing unit and can perform the character recognition preprocessing at high speed.

【0020】本発明の他の目的は、画像の傾きを正しく
補正することができる文字認識前処理装置を提供するこ
とにある。
Another object of the present invention is to provide a character recognition preprocessing device which can correct the inclination of an image correctly.

【0021】[0021]

【課題を解決するための手段】前記目的を達成するため
に、本発明は、記憶装置に格納された文字を含む画像に
関し、読み取り時の基準位置に対する紙面の傾きを検出
すると共に、前処理対象画像領域を指示し、さらに該領
域中における文字の切り出し位置を指示する第1の処理
装置(中央処理装置)と、この第1の処理装置から通知
される前記紙面の傾きの情報に基づいて記憶装置に格納
された前記画像の傾きを補正し、傾き補正後の画像に対
して前記第1の処理装置から通知される前処理対象領域
内から文字領域を検出して前記第1の処理装置に通知
し、該通知に対して前記第1の処理装置から指示される
切り出し位置の文字を切り出す第2の処理装置(画像処
理装置)とから構成したものである。
In order to achieve the above object, the present invention detects an inclination of a paper surface with respect to a reference position at the time of reading an image including a character stored in a storage device, and preprocesses the object. A first processing unit (central processing unit) that designates an image region and further designates a character cutting position in the region, and stores it based on the information of the inclination of the paper notified from the first processing unit. The inclination of the image stored in the apparatus is corrected, and a character area is detected from the preprocessing target area notified from the first processing apparatus for the image after the inclination correction, and the first processing apparatus is detected. And a second processing device (image processing device) for notifying and notifying the character at the cutting position instructed by the first processing device in response to the notification.

【0022】また、前記第2の処理装置では、前記記憶
装置に格納された画像の傾きを、読み取り時の紙面の傾
きに基づいて当該画像の格納位置をアフィン変換して補
正するようにしたものである。
In the second processing device, the inclination of the image stored in the storage device is corrected by affine-transforming the storage position of the image based on the inclination of the paper surface at the time of reading. Is.

【0023】[0023]

【作用】前記手段によれば、第1の処理装置は、前記第
2の処理装置に対し、前記記憶装置に格納された画像の
傾きの補正と、傾き補正後の画像の文字領域にある文字
の切り出しを指示する。
According to the above-mentioned means, the first processing device is different from the second processing device in that the inclination of the image stored in the storage device is corrected and the characters in the character area of the image after the inclination correction are corrected. Instruct to cut out.

【0024】第2の処理装置は、第2の処理装置の前記
指示に基づいて、記憶装置上の画像の傾きを補正し、か
つ指示された記憶装置上の位置に格納されている文字を
切り出す。
The second processing device corrects the inclination of the image on the storage device based on the instruction of the second processing device, and cuts out the character stored at the instructed position on the storage device. .

【0025】また、前記第2の処理装置は、前記記憶装
置に格納された画像の傾きを、読み取り時の紙面の傾き
に基づいてアフィン変換によって補正する。
The second processing device corrects the inclination of the image stored in the storage device by affine transformation based on the inclination of the paper surface at the time of reading.

【0026】[0026]

【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0027】図1は本発明の一実施例の構成を示すブロ
ック構成図である。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【0028】図1において、1は第1の処理装置として
の中央処理装置(以下、CPUという)であり、2は第
2の処理装置としての画像処理装置である。
In FIG. 1, 1 is a central processing unit (hereinafter referred to as CPU) as a first processing unit, and 2 is an image processing unit as a second processing unit.

【0029】3は例えばOCRの読み取り部で構成され
る画像取得装置であり、4は画像を格納するための記憶
装置である。
Reference numeral 3 is an image acquisition device composed of, for example, an OCR reading unit, and 4 is a storage device for storing an image.

【0030】また、20はCPU1が発行する命令を画
像処理装置2に伝達するためのバスラインである。
Reference numeral 20 is a bus line for transmitting an instruction issued by the CPU 1 to the image processing apparatus 2.

【0031】図2は本実施例における画像処理装置2の
詳細な構成を示すブロック構成図であり、画像処理装置
制御部11、画像取得部12、格納位置算出部13、画
像処理部14および記憶装置制御部15により構成され
ている。
FIG. 2 is a block diagram showing the detailed arrangement of the image processing apparatus 2 in this embodiment. The image processing apparatus control unit 11, the image acquisition unit 12, the storage position calculation unit 13, the image processing unit 14 and the storage unit. It is configured by the device control unit 15.

【0032】図1において、CPU1は画像処理装置2
に対し、画像取得、濃度補正処理、フィルタ処理、2値
化処理、および切り出し処理等の命令を発行する。
In FIG. 1, the CPU 1 is an image processing apparatus 2
A command for image acquisition, density correction processing, filter processing, binarization processing, cutout processing, and the like is issued.

【0033】画像処理装置2は、画像取得装置3、記憶
装置4およびCPU1の3装置とのインターフェイスを
持ち、CPU1の命令に従い、画像取得、帳票の傾き補
正、濃度補正処理、フィルタ処理、2値化処理および切
り出し処理を実行する。
The image processing device 2 has an interface with three devices of the image acquisition device 3, the storage device 4 and the CPU 1, and in accordance with the instruction of the CPU 1, image acquisition, form inclination correction, density correction processing, filter processing and binary. The conversion processing and the cutout processing are executed.

【0034】図3は本実施例の動作手順を示すフローチ
ャートである。
FIG. 3 is a flow chart showing the operation procedure of this embodiment.

【0035】図3を用いて本実施例の動作を説明する。The operation of this embodiment will be described with reference to FIG.

【0036】まず、CPU1は画像処理装置2に対し画
像取得命令を発行する(ステップ31)。すると、画像
処理装置2は、この命令に従い、画像取得部12と記憶
装置制御部15を介して、画像取得装置3から送られて
くる画像を記憶装置4に格納し、同時に、取得した画像
のうち紙面上の領域と紙面以外の境界を検出し、検出結
果をCPU1に送る(ステップ32)。
First, the CPU 1 issues an image acquisition command to the image processing apparatus 2 (step 31). Then, the image processing device 2 stores the image sent from the image acquisition device 3 in the storage device 4 via the image acquisition unit 12 and the storage device control unit 15 according to this command, and at the same time, stores the acquired image. The area on the paper surface and the boundary other than the paper surface are detected, and the detection result is sent to the CPU 1 (step 32).

【0037】次に、CPU1は送られてきた紙面の境界
位置から、紙面の記憶装置4上での位置と傾き(図4の
(x,y)およびθを参照)を計算し、これを画像処理
装置2に通知する(ステップ33)。
Next, the CPU 1 calculates the position and the inclination (see (x, y) and θ in FIG. 4) of the paper surface on the storage device 4 from the boundary position of the paper surface that has been sent, and this is imaged. The processor 2 is notified (step 33).

【0038】画像処理装置2は、紙面1枚分の画像を記
憶装置4に格納し終えると、画像取得処理終了をCPU
1に通知する(ステップ34)。
When the image processing apparatus 2 finishes storing one sheet of the image in the storage device 4, the image processing apparatus 2 finishes the image acquisition processing by the CPU.
1 is notified (step 34).

【0039】次に、CPU1は、画像取得処理終了の通
知を受け取ると、濃度補正処理、フィルタ処理、2値化
処理を行う領域の紙面上の位置(図4の(xl0,yl
0))を決定し、この領域を画像処理装置2に通知し
(ステップ35)、引き続きこの領域に対する処理の実
行を命令する(ステップ36)。
Next, when the CPU 1 receives the notification of the end of the image acquisition processing, the position on the paper of the area where the density correction processing, the filtering processing and the binarization processing are performed ((xl0, yl in FIG. 4).
0)) is decided, this area is notified to the image processing apparatus 2 (step 35), and the execution of processing for this area is subsequently instructed (step 36).

【0040】格納位置算出部13は、ステップ33でC
PU1から通知された紙面の記憶装置4上での位置と傾
きに基づいてアフィン変換を行い、ステップ35で通知
された紙面上の位置から、その画素の記憶装置4上の格
納位置(図4の(xp0,yp0))を求める(ステッ
プ37)。
The storage position calculation unit 13 executes C in step 33.
Affine transformation is performed based on the position and the inclination of the paper surface on the storage device 4 notified from PU1, and the storage position on the storage device 4 of the pixel from the position on the paper surface notified in step 35 (see FIG. 4). (Xp0, yp0)) is calculated (step 37).

【0041】画像処理部14は、ステップ36による濃
度補正処理、フィルタ処理、2値化処理の命令に従い、
ステップ37で得られた画素に対して、濃度補正処理、
フィルタ処理、2値化処理を実行し、一連の処理が終了
すると、濃度補正処理、フィルタ処理、2値化処理終了
をCPU1に通知する。同時に、文字を構成する黒画素
の分布をCPU1に送る(ステップ38)。
The image processing unit 14 follows the instructions of the density correction process, the filter process, and the binarization process in step 36.
For the pixel obtained in step 37, density correction processing,
When the filter process and the binarization process are executed and a series of processes is completed, the CPU 1 is notified of the end of the density correction process, the filter process, and the binarization process. At the same time, the distribution of the black pixels forming the character is sent to the CPU 1 (step 38).

【0042】CPU1は、送られてきた黒画素の分布か
ら記憶装置4上の文字領域を推定し、切り出し位置を決
定し、画像処理装置2へ通知する(ステップ39)。
The CPU 1 estimates the character area on the storage device 4 from the distribution of the sent black pixels, determines the cutout position, and notifies the image processing device 2 (step 39).

【0043】CPU1は、前記濃度補正処理、フィルタ
処理、2値化処理終了の通知を受けた後、記憶装置4上
の切り出す位置を指定した切り出し処理命令を発行する
(ステップ40)。
After receiving the notification of the end of the density correction processing, the filtering processing, and the binarization processing, the CPU 1 issues a cutout processing command designating the cutout position on the storage device 4 (step 40).

【0044】画像処理装置2は、この切り出し処理命令
に従い指定された記憶装置4上の文字領域に格納されて
いる2値化された文字を切り出し、CPU1へ送る。こ
の切り出し処理を終了すると、CPU1に対して切り出
し処理の終了を通知する(ステップ41)。
The image processing device 2 cuts out the binarized character stored in the character area on the storage device 4 designated by the cutout processing command and sends it to the CPU 1. When the cutout process is completed, the CPU 1 is notified of the end of the cutout process (step 41).

【0045】CPU1は、、前記切り出し処理命令の発
行を、前処理対象となっている画像がなくなるまで繰り
返す。
The CPU 1 repeats the issuance of the cutout processing command until there are no more images to be preprocessed.

【0046】そして、画像処理装置2によって、全ての
文字領域に対する処理が終了すると(ステップ42)、
CPU1は画像処理装置2に対し、次の紙面の画像取得
命令を発行してステップ31に戻る。
When the image processing apparatus 2 completes the processing for all the character areas (step 42),
The CPU 1 issues a next paper image acquisition command to the image processing apparatus 2 and returns to step 31.

【0047】図4は本発明で用いたアフィン変換による
画像の傾きを補正する方法の説明図である。
FIG. 4 is an explanatory diagram of a method for correcting the inclination of an image by the affine transformation used in the present invention.

【0048】図4において、手書き文字、あるいは印刷
文字が生成された帳票がどの程度傾いて(回転して)画
像取得装置3に入力されたかは、紙面の境界(連続する
黒点(帳票外)から連続する白点(帳票内)に変化する
点)を検出することによって得られる。
In FIG. 4, how much the form in which the handwritten character or the printed character is generated is input to the image acquisition device 3 by inclining (rotating) is determined from the boundary of the paper surface (continuous black dots (outside the form). It is obtained by detecting continuous white dots (points that change into a form).

【0049】そこで、記憶装置4上での座標を(x,
y)だけ平行移動し、角度θだけ回転して帳票が入力さ
れたことをCPU1が算出したとすると、CPU1は画
像処理装置2に傾き補正処理を実行させるに先立ち、こ
の回転角度θを用いて、cosθ、sinθを算出し、
これらの算出結果および平行移動量(x,y)を画像処
理装置2に通知する。
Therefore, the coordinates on the storage device 4 are (x,
If the CPU 1 calculates that the document is input by parallel translation by y) and rotation by the angle θ, the CPU 1 uses this rotation angle θ before causing the image processing apparatus 2 to perform the tilt correction processing. , Cos θ, sin θ are calculated,
The image processing apparatus 2 is notified of the calculation result and the parallel movement amount (x, y).

【0050】その後、CPU1は、画像処理装置2に対
し、濃度補正処理、フィルタ処理、2値化処理を行う領
域を、始点(通常は左上の点)の帳票上の座標(x1,
y1)および帳票のサイズ(xsize,ysize)
で指定する。
After that, the CPU 1 causes the image processing apparatus 2 to set an area for density correction processing, filter processing, and binarization processing to the coordinates (x1, x1) of the starting point (usually the upper left point) on the form.
y1) and the size of the form (xsize, ysize)
Specify with.

【0051】画像処理装置2は与えられた帳票の始点の
座標(x1,y1)に対し、
The image processing apparatus 2 sets the coordinates (x1, y1) of the starting point of the given form to

【0052】[0052]

【数1】 [Equation 1]

【0053】のようにアフィン変換(回転および平行移
動)を格納位置算出部13が実行し、記憶装置4上にお
ける帳票の始点の座標(x1,y1)を得る。
As described above, the affine transformation (rotation and parallel movement) is executed by the storage position calculation unit 13 to obtain the coordinates (x1, y1) of the starting point of the form on the storage device 4.

【0054】隣の点は、(x1+1,y1)であり、こ
れを式(1)の(x1,y1)の部分に置き換えて前記
の処理を行うことによって隣の点の記憶装置4上の座標
が得られる。
The adjacent point is (x1 + 1, y1), and this is replaced with the portion (x1, y1) of the equation (1) to perform the above-mentioned processing, whereby the coordinate of the adjacent point on the storage device 4 is converted. Is obtained.

【0055】こうして得られた記憶装置4上の点の座標
は(xp+cosθ,yp−sinθ)である。
The coordinates of the point on the storage device 4 thus obtained are (xp + cos θ, yp-sin θ).

【0056】また、下の点は、(xl,yl+1)であ
り、これを式(1)の(x1,y1)の部分に置き換え
て前記の処理を行うことによって隣の点の記憶装置4上
の座標が得られる。
Further, the lower point is (xl, yl + 1), which is replaced with the portion (x1, y1) of the equation (1) and the above processing is performed, so that the next point on the storage device 4 is changed. The coordinates of are obtained.

【0057】こうして得られた記憶装置4上の点の座標
は(xp+sinθ,yp+cosθ)である。
The coordinates of the point on the storage device 4 thus obtained are (xp + sin θ, yp + cos θ).

【0058】これにより、始点のみアフィン変換を行
い、次の点からは(cosθ、−sinθ)あるいは
(sinθ,cosθ)を加えるだけで記憶装置4上に
おける全ての点の座標が得られる。
As a result, the affine transformation is performed only on the starting point, and from the next point, the coordinates of all points on the storage device 4 can be obtained by adding (cos θ, −sin θ) or (sin θ, cos θ).

【0059】従って、このようにして得られた点で構成
される領域は、傾きのない画像領域となる。そこで、こ
の領域の各画素の値を読み出すことによって傾きのない
画像を取得することができる。すなわち、傾きを補正し
た画像を取得することができる。
Therefore, the area formed by the points thus obtained is an image area without inclination. Therefore, an image without inclination can be obtained by reading the value of each pixel in this region. That is, it is possible to obtain an image in which the tilt is corrected.

【0060】以上のように、CPU1は、最初に回転量
と平行移動量とを画像処理装置2に与えるだけで、帳票
の画像が記憶装置4上にどのように格納されているかを
認識する必要がない。
As described above, the CPU 1 needs to recognize how the image of the form is stored in the storage device 4 only by first giving the rotation amount and the parallel movement amount to the image processing device 2. There is no.

【0061】図5は本発明の他の実施例の構成を示すブ
ロック構成図である。この実施例は、記憶装置4に2つ
の領域A5とB6を設け、一方の領域において画像取得
処理を行っている時は、他方の領域においては濃度補正
処理、フィルタ処理、2値化処理および切り出し処理を
同時に実行しようとすることに特徴がある。この他の構
成は先の実施例と同様である。
FIG. 5 is a block diagram showing the configuration of another embodiment of the present invention. In this embodiment, the storage device 4 is provided with two areas A5 and B6, and when image acquisition processing is being performed in one area, density correction processing, filter processing, binarization processing, and clipping are performed in the other area. The feature is that the processes are executed simultaneously. The other structure is similar to that of the previous embodiment.

【0062】図6は、図5の構成における実施例の動作
手順を示すフローチャートである。
FIG. 6 is a flow chart showing the operation procedure of the embodiment in the configuration of FIG.

【0063】まず、CPU1は画像処理装置2に対し記
憶装置4の一方の領域、例えば領域A5に対する画像取
得命令を発行する(ステップ61)。
First, the CPU 1 issues an image acquisition command to one area of the storage device 4, for example, the area A5, to the image processing apparatus 2 (step 61).

【0064】画像処理装置2は、画像取得装置3から送
られる画像を画像取得部12、記憶装置制御部15を介
して記憶装置4の領域A5に格納しながら、取得した画
像のうち、紙面上の領域と紙面以外の領域の境界を検出
し、検出結果をCPU1に送る(ステップ62)。
While the image processing apparatus 2 stores the image sent from the image acquisition apparatus 3 in the area A5 of the storage device 4 via the image acquisition unit 12 and the storage device control unit 15, among the acquired images, it is on the paper surface. The boundary between the area (1) and the area other than the paper surface is detected, and the detection result is sent to the CPU 1 (step 62).

【0065】次に、CPU1は、送られてきた紙面の境
界位置から、紙面の記憶装置4上における位置と傾きを
算出し、これを画像処理装置2に通知する(ステップ6
3)。
Next, the CPU 1 calculates the position and inclination of the paper surface on the storage device 4 from the boundary position of the paper surface that has been sent, and notifies the image processing device 2 of this (step 6).
3).

【0066】画像処理装置2は、紙面1枚分の画像を記
憶装置4の領域A5に格納し終えると、画像取得処理終
了をCPU1に通知する(ステップ64)。
When the image processing apparatus 2 finishes storing one sheet of the image in the area A5 of the storage device 4, it notifies the CPU 1 of the end of the image acquisition processing (step 64).

【0067】また、CPU1は、前述の画像取得命令の
発行と並行して、画像処理装置2の記憶装置4の他方の
領域、例えば領域B6に取得済の画像があれば、濃度補
正処理、フィルタ処理、2値化処理を行う領域を紙面上
の位置で決定し、これを画像処理装置2に通知し(ステ
ップ65)、引き続きその処理の実行を命令する(ステ
ップ66)。
Further, in parallel with the issuance of the above-mentioned image acquisition command, the CPU 1 performs density correction processing and filter if there is an acquired image in the other area of the storage device 4 of the image processing apparatus 2, for example, the area B6. The area to be processed and binarized is determined at a position on the paper surface, the image processing apparatus 2 is notified of this (step 65), and the execution of the processing is instructed (step 66).

【0068】画像処理装置2は、ステップ65の命令に
従い、格納位置算出部13において紙面の記憶装置4上
における位置と傾きを用いてアフィン変換を行い、前処
理対象領域の紙面上の位置から、記憶装置4上の格納位
置を求める(ステップ67)。
In accordance with the instruction of step 65, the image processing apparatus 2 performs affine transformation in the storage position calculation unit 13 using the position and the inclination of the paper surface on the storage device 4, and from the position on the paper surface of the preprocessing target area, The storage position on the storage device 4 is obtained (step 67).

【0069】次に画像処理装置2は、ステップ66の濃
度補正処理、フィルタ処理、2値化処理の命令に従い、
画像処理部14において、前処理対象領域の画像に対
し、濃度補正処理、フィルタ処理、2値化処理を行う。
処理が終了すると、濃度補正処理、フィルタ処理、2値
化処理終了をCPU1に通知する。同時に、文字を構成
する黒画素の分布をCPU1に送る(ステップ68)。
Next, the image processing apparatus 2 follows the instructions of the density correction processing, the filter processing, and the binarization processing in step 66.
The image processing unit 14 performs density correction processing, filter processing, and binarization processing on the image of the preprocessing target area.
When the process is completed, the CPU 1 is notified of the end of the density correction process, the filter process, and the binarization process. At the same time, the distribution of black pixels forming the character is sent to the CPU 1 (step 68).

【0070】CPU1は、送られてきた黒画素の分布か
ら文字領域を推定し、切り出し位置を決定し、画像処理
装置2へ通知する(ステップ69)。
The CPU 1 estimates the character area from the distribution of the black pixels sent, determines the cut-out position, and notifies the image processing apparatus 2 (step 69).

【0071】次にCPU1は、ステップ68において、
画像処理装置2からの濃度補正処理、フィルタ処理、2
値化処理終了の通知を受け取ると、切り出す位置を指定
した切り出し処理命令を発行する(ステップ70)。
Next, in step 68, the CPU 1
Density correction processing, filter processing, 2 from the image processing apparatus 2
When the notification of the end of the value conversion process is received, the cutout processing command designating the cutout position is issued (step 70).

【0072】すると、画像処理装置2は、この切り出し
処理命令に従い、指定された領域の2値化された文字を
切り出してCPU1へ送る。この切り出し処理が終了す
ると、CPU1に対して切り出し処理終了を通知する
(ステップ71)。
Then, the image processing apparatus 2 cuts out the binarized character in the designated area and sends it to the CPU 1 in accordance with the cutout processing command. When the cutout process is completed, the CPU 1 is notified of the end of the cutout process (step 71).

【0073】CPU1は、画像処理装置2に対し、濃度
補正処理、フィルタ処理、2値化処理を行う領域の設定
から切り出し処理までを、処理対象となる領域がなくな
るまで繰り返し命令する。(ステップ72)。
The CPU 1 repeatedly commands the image processing apparatus 2 to perform the density correction processing, the filtering processing, the binarization processing, and the clipping processing until the area to be processed is exhausted. (Step 72).

【0074】CPU1は全ての切り出し処理終了の通知
を受け取ると、画像処理装置2に対して記憶装置4の領
域を切り換え、すなわち領域B6に対しては画像取得命
令を、領域A5に対しては濃度補正処理、フィルタ処
理、2値化処理、切り出し処理の通知および命令を発行
する(ステップ73)。
When the CPU 1 receives the notification of the completion of all the cutout processing, it switches the area of the storage device 4 to the image processing apparatus 2, that is, an image acquisition command for the area B6 and a density for the area A5. Notifications and commands for correction processing, filter processing, binarization processing, and clipping processing are issued (step 73).

【0075】従って、本実施例では、同時に紙面2枚分
の前処理を行うことができる。
Therefore, in this embodiment, it is possible to simultaneously perform the pretreatment for two sheets of paper.

【0076】なお、前記各実施例においては、画像取得
装置をOCRの読み取り部で構成した例を挙げて説明し
たが、イメージスキャナ等の読み取り装置から画像を取
得する場合にも適用することができる。
In each of the above-described embodiments, an example in which the image acquisition device is composed of the reading unit of the OCR has been described, but it can be applied to the case of acquiring an image from a reading device such as an image scanner. .

【0077】[0077]

【発明の効果】以上説明したように本発明によれば、記
憶装置に格納された文字を含む画像に関し、読み取り時
の基準位置に対する紙面の傾きを検出すると共に、前処
理対象画像領域を指示し、さらに該領域中における文字
の切り出し位置を指示する第1の処理装置と、この第1
の処理装置から通知される前記紙面の傾きの情報に基づ
いて記憶装置に格納された前記画像の傾きを補正し、傾
き補正後の画像に対して前記第1の処理装置から通知さ
れる前処理対象領域内から文字領域を検出して前記第1
の処理装置に通知し、該通知に対して前記第1の処理装
置から指示される切り出し位置の文字を切り出す第2の
処理装置とから構成し、文字認識前処理の制御は第1の
処理装置である中央処理装置が行い、文字認識前処理の
実行は第2の処理装置である画像処理装置が行うように
したので、第1の処理装置としての中央処理装置の負荷
が軽減される。
As described above, according to the present invention, with respect to an image containing characters stored in a storage device, the inclination of the paper surface with respect to the reference position at the time of reading is detected and the image area to be preprocessed is designated. A first processing device for instructing a character cutting position in the area;
Of the image stored in the storage device on the basis of the information on the inclination of the paper notified from the processing device, and the pre-processing notified from the first processing device to the image after the inclination correction. The first character area is detected by detecting a character area from the target area.
And a second processing device that cuts out the character at the cutout position instructed by the first processing device in response to the notification, and the control of the character recognition preprocessing is performed by the first processing device. The central processing unit which is the second processing unit executes the character recognition preprocessing, and the image processing apparatus which is the second processing unit executes the character recognition preprocessing. Therefore, the load of the central processing unit as the first processing unit is reduced.

【0078】従って、負荷が軽減された分だけ文字認識
前処理を高速化することができるうえ、他の処理の制御
に充当し、前処理の処理速度および処理精度の向上が図
れるという効果がある。
Therefore, there is an effect that the character recognition preprocessing can be speeded up by the amount of reduction of the load, and it can be applied to control of other processing to improve the processing speed and processing accuracy of the preprocessing. .

【0079】また、第2の処理装置である画像処理装置
は、前記記憶装置に格納された画像の傾きを、読み取り
時の紙面の傾きに基づいて本来格納される格納位置を回
転および平行座標変換(アフィン変換)し、傾きのない
格納位置を算出して読み出すことによって補正している
ので、傾いた画像を正しく補正し、後工程において文字
特徴を精度良く抽出できるという効果がある。
The image processing apparatus, which is the second processing apparatus, rotates and parallel coordinates the inclination of the image stored in the storage device, based on the inclination of the paper surface at the time of reading, the original storage position. Since the correction is performed by (affine transformation), and the storage position without inclination is calculated and read out, there is an effect that the inclined image can be corrected correctly and the character feature can be accurately extracted in the subsequent process.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成を示すブロック構成図
である。
FIG. 1 is a block configuration diagram showing a configuration of an embodiment of the present invention.

【図2】図1の実施例における画像処理装置の詳細を示
すブロック構成図である。
FIG. 2 is a block configuration diagram showing details of an image processing apparatus in the embodiment of FIG.

【図3】図1の実施例の動作手順を示すフローチャート
である。
FIG. 3 is a flowchart showing an operation procedure of the embodiment shown in FIG.

【図4】図1の実施例に適用したアフィン変換の説明図
である。
FIG. 4 is an explanatory diagram of affine transformation applied to the embodiment of FIG.

【図5】本発明の他の実施例の構成を示すブロック構成
図である。
FIG. 5 is a block diagram showing the configuration of another embodiment of the present invention.

【図6】図6の実施例の動作手順を示すフローチャート
である。
6 is a flowchart showing an operation procedure of the embodiment of FIG.

【図7】従来の前処理装置の一例を示すブロック構成図
である。
FIG. 7 is a block diagram showing an example of a conventional pretreatment device.

【図8】従来の前処理装置の他の一例を示すブロック構
成図である。
FIG. 8 is a block diagram showing another example of a conventional pretreatment device.

【図9】図8の構成における前処理装置の動作を示すフ
ローチャートである。
9 is a flowchart showing an operation of the pretreatment device in the configuration of FIG.

【図10】文字の傾きを補正する従来方法の説明図であ
る。
FIG. 10 is an explanatory diagram of a conventional method for correcting the inclination of a character.

【符号の説明】 1…中央処理装置(第1の処理装置)、2…画像処理装
置(第2の処理装置)、3…画像取得装置、4…記憶装
置、5…記憶装置4の領域A、6…記憶装置4の領域
B、11…画像処理装置制御部、12…画像像取得部、
13…格納位置算出部、14…画像処理部、15…記憶
装置制御部、20…バスライン。
[Explanation of Codes] 1 ... Central processing unit (first processing unit), 2 ... Image processing unit (second processing unit), 3 ... Image acquisition unit, 4 ... Storage unit, 5 ... Region A of storage unit 4 , 6 ... Area B of the storage device 4, 11 ... Image processing device control unit, 12 ... Image image acquisition unit,
13 ... Storage position calculation unit, 14 ... Image processing unit, 15 ... Storage device control unit, 20 ... Bus line.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 三部 靖夫 東京都江東区豊洲三丁目3番3号 エヌ・ ティ・ティ・データ通信株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Yasuo Sanbe 3-3-3 Toyosu, Koto-ku, Tokyo NTT Data Communications Corporation

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 記憶装置に格納された文字を含む画像に
関し、読み取り時の基準位置に対する紙面の傾きを検出
すると共に、前処理対象画像領域を指示し、さらに該領
域中における文字の切り出し位置を指示する第1の処理
装置と、この第1の処理装置から通知される前記紙面の
傾きの情報に基づいて記憶装置に格納された前記画像の
傾きを補正し、傾き補正後の画像に対して前記第1の処
理装置から通知される前処理対象領域内から文字領域を
検出して前記第1の処理装置に通知し、該通知に対して
前記第1の処理装置から指示される切り出し位置の文字
を切り出す第2の処理装置とから成る文字認識前処理装
置。
1. With respect to an image containing characters stored in a storage device, an inclination of a paper surface with respect to a reference position at the time of reading is detected, a preprocessing target image area is designated, and a character cutting position in the area is detected. The first processing device that gives an instruction and the tilt of the image stored in the storage device are corrected based on the information of the tilt of the paper notified from the first processing device. A character region is detected from the pre-processing target region notified from the first processing device, the first processing device is notified of the character region, and the cut-out position specified by the first processing device in response to the notification is detected. A character recognition preprocessing device comprising a second processing device for cutting out a character.
【請求項2】 前記記憶装置に格納された画像の傾き
は、画像の格納位置を読み取り時の紙面の傾きに基づい
てアフィン変換して補正するものである請求項1記載の
文字認識前処理装置。
2. The character recognition preprocessing device according to claim 1, wherein the inclination of the image stored in the storage device is affine-transformed and corrected based on the inclination of the paper surface at the time of reading the storage position of the image. .
JP5038615A 1993-02-26 1993-02-26 Character recognition pre-processing device Pending JPH06251199A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5038615A JPH06251199A (en) 1993-02-26 1993-02-26 Character recognition pre-processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5038615A JPH06251199A (en) 1993-02-26 1993-02-26 Character recognition pre-processing device

Publications (1)

Publication Number Publication Date
JPH06251199A true JPH06251199A (en) 1994-09-09

Family

ID=12530162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5038615A Pending JPH06251199A (en) 1993-02-26 1993-02-26 Character recognition pre-processing device

Country Status (1)

Country Link
JP (1) JPH06251199A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0671721A2 (en) * 1994-03-10 1995-09-13 CABLE & WIRELESS PLC Communication system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01191987A (en) * 1988-01-28 1989-08-02 Canon Inc Character normalizing method
JPH0424781A (en) * 1990-05-15 1992-01-28 Canon Inc Document processor
JPH0465785A (en) * 1990-07-05 1992-03-02 Hitachi Eng Co Ltd Device for recognizing character
JPH04276888A (en) * 1991-03-04 1992-10-01 Sumitomo Electric Ind Ltd Character reader

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01191987A (en) * 1988-01-28 1989-08-02 Canon Inc Character normalizing method
JPH0424781A (en) * 1990-05-15 1992-01-28 Canon Inc Document processor
JPH0465785A (en) * 1990-07-05 1992-03-02 Hitachi Eng Co Ltd Device for recognizing character
JPH04276888A (en) * 1991-03-04 1992-10-01 Sumitomo Electric Ind Ltd Character reader

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0671721A2 (en) * 1994-03-10 1995-09-13 CABLE & WIRELESS PLC Communication system
EP0671721A3 (en) * 1994-03-10 1996-02-21 Cable & Wireless Plc Communication system.
US6125284A (en) * 1994-03-10 2000-09-26 Cable & Wireless Plc Communication system with handset for distributed processing

Similar Documents

Publication Publication Date Title
JP2986383B2 (en) Method and apparatus for correcting skew for line scan images
KR101399709B1 (en) Model-based dewarping method and apparatus
JP2930612B2 (en) Image forming device
JP3883696B2 (en) Method for scanning and detecting multiple photos and removing artificial edges
US7636483B2 (en) Code type determining method and code boundary detecting method
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH05250409A (en) High-speed detection for page direction
US6771842B1 (en) Document image skew detection method
US8229214B2 (en) Image processing apparatus and image processing method
JPH09130614A (en) Image processing unit
US7616837B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP3006466B2 (en) Character input device
EP0719034A1 (en) Improved character smoothing in scanners/printers
JPH06251199A (en) Character recognition pre-processing device
JP7341758B2 (en) Image processing device, image processing method, and program
JP2002133424A (en) Detecting method of inclination angle and boundary of document
JP2000187705A (en) Document reader, document reading method and storage medium
JPH09120430A (en) Image processor
JPS6214277A (en) Picture processing system
JP2827227B2 (en) Character recognition method
JPH11250179A (en) Character reocognition device and its method
JPH0962782A (en) Document reader
JP4439054B2 (en) Character recognition device and character frame line detection method
JP3162414B2 (en) Ruled line recognition method and table processing method
JP2789647B2 (en) Line image recognition method