JPS5872276A - Optical type character reading system - Google Patents

Optical type character reading system

Info

Publication number
JPS5872276A
JPS5872276A JP56169632A JP16963281A JPS5872276A JP S5872276 A JPS5872276 A JP S5872276A JP 56169632 A JP56169632 A JP 56169632A JP 16963281 A JP16963281 A JP 16963281A JP S5872276 A JPS5872276 A JP S5872276A
Authority
JP
Japan
Prior art keywords
pixel
image information
characters
row
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56169632A
Other languages
Japanese (ja)
Inventor
Osamu Shimizu
修 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP56169632A priority Critical patent/JPS5872276A/en
Publication of JPS5872276A publication Critical patent/JPS5872276A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

PURPOSE:To remove noises by converting an analog output signal from a two- dimensional sensor into digital picture information, storing the digital picture information in a picture information memory and detecting digital picture information corresponding to blanks other than characters. CONSTITUTION:A two-dimensional sensor 2 in a scanner part 1 photoelectrically converts characters projected on a sheet into analog information. The information is converted into digital picture information by a binary-coding circuit 4 in a discrimination processing part 3 and the output of the circuit 4 is stored in a picture information memory 5 and also sent to a blank detecting circuit 6, which detects blanks other than characters and noises. The output of the circuit 6 is sent to a removal circuit 7, which removes noises from the information outputted from the memory 5.

Description

【発明の詳細な説明】 本発明は用紙に記載された文字を走査して光学的に読み
取シ、この読み取ル信号を論履鵡履して文字を識別する
貌殿方式において、正規の文字otわpに存在するアナ
ログ画雑音を除去する方式K11lする。
DETAILED DESCRIPTION OF THE INVENTION The present invention uses a method in which characters written on paper are scanned and optically read, and the read signals are used to logically identify the characters. A method for removing analog image noise present in the picture is shown below.

光学的文字読取装置は用紙に記載された文字を光学的に
光電変換素子群上に投影し、この光電変換素子からの電
気信号を処理し樹枝状論通で信号の生起順序に従って判
定する°ことを行なうものである。このため、用紙上の
文字はすべてそのまま電気信号に変換され処理・判定さ
れるのであるが、正規の文字のまわ)Kス4ット状又は
線状Oアナログ画雑音が存在する場合には読取文字を誤
読した夛読み取れなか・つたシする可能性がある。今ま
で、このアナログ画雑音を除去する回路は提案されてい
なかった。
An optical character reading device optically projects characters written on paper onto a group of photoelectric conversion elements, processes electrical signals from the photoelectric conversion elements, and makes decisions according to the order in which the signals occur using a dendritic logic. This is what we do. For this reason, all characters on the paper are converted directly into electrical signals for processing and judgment, but if there is any analog image noise in the form of spots or lines around regular characters, it will be difficult to read. There is a possibility that the characters may be misread or unreadable. Until now, no circuit has been proposed to remove this analog image noise.

そこで、本発明は上述の欠点に鑑み正NAo読取文字以
外のアナログ画雑音を除去する光学的文字読取方式の提
供を目的とする。
Therefore, in view of the above-mentioned drawbacks, the present invention aims to provide an optical character reading method that removes analog image noise other than normal NAo read characters.

かかる目的を達成するため本発明としては、用紙に記載
された文字を二次元センサにて読み取〕上記文字の識別
を行なう文字読取方式において、上−二次元センサから
出力されるナナロダ画情報をディジタル画情味に変換し
、このディジタル画情報を画情報メモリに記憶すると共
に文字以外の余白に該当する上記ディジタル画情報を検
出し、 −上記余白に該当する上記 ディジタル画情報に基づ龜上記画情報メモリに含まれる
rイジタル画雑音を除去したことを特徴とする。
In order to achieve this object, the present invention uses a two-dimensional sensor to read the characters written on paper. In the character reading method for identifying the above-mentioned characters, the image information output from the upper two-dimensional sensor is digitalized. converting the digital image information into image information, storing this digital image information in the image information memory, and detecting the digital image information corresponding to the non-text margin; It is characterized by removing digital image noise contained in the information memory.

ζζで、図を参照しつつ本発明の詳細な説明する。第1
図において、用紙に記載された文字をI[K走査するス
キャナ部五内には二次元センサ2が備えられている。こ
の二次元センサ2は用紙上の文字の投影を充電変換して
アナログ画情報とするものである。二次元センナ2から
のアナログ画情報は識別処理部3内に至シニ麺化回路4
によってディジタル画情味に変換される。二値化回路4
の出力は画情報バッファ5にてそott一旦記憶される
と共に、用紙上における文字や雑音以外の余白を検出す
るための余白検出回路6にて処理される。ついで、この
余白検出回路6の出力が除去回路7に入力され、除去回
路7では画情報バッファ5からの情報を余白検出回路6
からの出力にて処理し雑音除去を行なうものである。
ζζ A detailed explanation of the invention will be given with reference to the figures. 1st
In the figure, a two-dimensional sensor 2 is provided within a scanner unit 5 that scans characters written on a sheet of paper. This two-dimensional sensor 2 charges and converts the projection of characters on paper into analog image information. The analog image information from the two-dimensional image sensor 2 is sent to the identification processing unit 3 to the Shinimen conversion circuit 4.
The image is converted into a digital image by . Binarization circuit 4
The output is temporarily stored in the image information buffer 5, and is processed in the margin detection circuit 6 for detecting margins other than characters and noise on the paper. Next, the output of the margin detection circuit 6 is input to the removal circuit 7, and the removal circuit 7 inputs the information from the image information buffer 5 to the margin detection circuit 6.
It processes the output from and removes noise.

以上が雑音除去の大略である。第2図以下にて雑音除去
方式の詳細を述べる。第゛2図は第1図におけるスキャ
ナ部10走査中での一視野状態を示すものである。この
菖2allでは13列X36行の画素を仮定して示しで
ある。この画素数に対応してアナログ画情報が作成され
ついでディジタル画情報が得られる。この情報は白情味
か黒情報かに分けられるのであるが0、たとえば文字情
報となる黒情報が果たして真実に正規の文字情報となる
か換型すれば雑音か否かを識別する必要がある。この識
別に幽シ壕ず白画素を決定する。
The above is an outline of noise removal. The details of the noise removal method will be described below in FIG. FIG. 2 shows the state of one field of view during scanning by the scanner section 10 in FIG. This irises 2all are shown assuming 13 columns x 36 rows of pixels. Analog image information is created corresponding to this number of pixels, and then digital image information is obtained. This information can be divided into white information or black information, but for example, it is necessary to identify whether black information that becomes text information actually becomes regular text information, or whether it is noise after conversion. . A white pixel is determined without hesitation in this identification.

たとえば、第3図(&)に示すアナログ画情報において
第3図(b)のように(n−1)行、n行、(net)
行を抽出する。このうち、たとえば任意の1画素に注目
した場合、この画素を白と決゛定するのにはこの画素自
体まず白画素でなければならず、tた、この注目画素を
中心として直前性における左又は右の6画素分の少なく
とも1個が白画素と認定される必要がある。注目−素を
中心として直前性において左又は右の6画素分の少なく
とも1個を白画素と認定するに当シ、注目画素の同一行
での左又は右に黒画素があるときその黒画素を含んでそ
の黒1iiiI素より左側又は右側の直前性は白画素と
みないとするよう定める。−この操作は注目画素が直前
性の白画素と連続性があるか否かをみる4のである。
For example, in the analog image information shown in FIG. 3(&), as shown in FIG. 3(b), (n-1) rows, n rows, (net)
Extract rows. For example, if we focus on any one pixel, in order to determine this pixel as white, this pixel itself must first be a white pixel, and the Alternatively, at least one of the six pixels on the right must be recognized as a white pixel. In order to recognize at least one of the six pixels to the left or right of the pixel of interest as a white pixel in the immediate vicinity, if there is a black pixel to the left or right of the pixel of interest in the same row, that black pixel is identified as a white pixel. It is determined that the pixel directly to the left or right of the black pixel including the black pixel is not considered to be a white pixel. - This operation is to check whether the pixel of interest has continuity with the immediately preceding white pixel.

第3図(b)において、n行1行の画素を注目画素とし
た場合、n行1列の画素は白画素であ如しか%nn行列
、3列とも白画素であってn−1行1列、2列、3列と
も白画素であるので、この注目白画素は前行の白画素と
連続であると認定する。jlli1列と最終列を注目画
素とした場合を第4図に示す。第4図の斜lを注目jl
素とした場合、この注目画素が白画素(○印)であると
、第4図(−の如くn−1行の1列又は最終列が白画素
のとき、第4@(b)の如くn行の2列又は最終−1列
まで白画素でn−1行の2列又は最終−1列の白画素の
とき、第4図(e)の如くn行の3列又は最終−2列ま
で白画素でn−1行の3列又は最終−2列が白画素のと
き、菖411(イ)、(・)、θ)も同様、注目画素社
前行(n−1行)と連続性ある白画素としている。
In Fig. 3(b), if the pixel in row n and row 1 is the pixel of interest, the pixel in row n and column 1 is a white pixel, and the pixel in row n and column 1 is a white pixel. Since the first, second, and third columns are all white pixels, this white pixel of interest is recognized as being continuous with the white pixel in the previous row. FIG. 4 shows a case where the first column of jlli and the last column are the pixels of interest. Note the diagonal l in Figure 4.
If the pixel of interest is a white pixel (marked with a circle), the pixel in Figure 4 (if the first or last column of the n-1 row is a white pixel, as shown in Figure 4 @ (b)) When the second column of n rows or the last -1 column are white pixels, and the white pixels are in the second column of n-1 rows or the last -1 column, the third column of n rows or the last -2 column as shown in Figure 4(e). When the 3rd column of the n-1 row or the last -2nd column is a white pixel, the irises 411 (a), (・), θ) are also continuous with the previous row (n-1 row) of the pixel of interest. The white pixels have a distinctive character.

第2図に戻シ、第10行、jIB列を注目画素Xとする
とき、この画素Xと同一行の左側6列は白画素であるの
でこの白画素と対応する第9行をみるとき全て黒画素で
あると共に、画lAXと同一行の右側の2列は白1ji
II素としても3列、4列と黒画素であシこの右側2列
に轟る第9行は黒1ikI素となるので、結果的に注目
画素Xは第9行にて全て黒画素と関連しており白画素と
して連続性を持たせることはできない。第10行第9列
の画素Yf:注目画素としたときも同様である。
Returning to Figure 2, when the 10th row, jIB column is the pixel of interest X, the 6 columns on the left side of the same row as this pixel In addition to being a black pixel, the two columns on the right in the same row as the picture 1AX are white 1ji.
As a II element, the 3rd and 4th columns are black pixels, and the 9th row in the 2nd column to the right becomes a black 1ikI element, so as a result, the target pixel X is all related to black pixels in the 9th row. Therefore, it is not possible to provide continuity as a white pixel. The same applies when pixel Yf in the 10th row and 9th column is set as the pixel of interest.

$2図の13列X36行の画素に対して白画素の連続性
の有無を決定した結果、画素XとYのみ連続性無しと決
定される。このため、白画素群は黒画素及びm素XYを
除いた画素となる。
As a result of determining the presence or absence of continuity of white pixels for the pixels in 13 columns and 36 rows in the $2 diagram, only pixels X and Y are determined to have no continuity. Therefore, the white pixel group consists of pixels excluding the black pixel and the m-element XY.

第2図ではn行の注目画素に対してn−1行との連続性
の有無を決めたのであるが、ついで第5図に示すように
第2図の方法とは全く逆にn行の注目画素に対してn+
1行との連続性の有無を決める。この結果、第5図中1
〜hに示す画素が連続性無しとされこのa −hの画素
及び黒画素を除いて連続性ある白画素群が見出されζう
して、第2図、第5図に示す連続性ある白画素群換言す
れば確実な白画素群が決まシ、ついでアナログ画雑音の
判定と除去を行なう。
In Fig. 2, the presence or absence of continuity with row n-1 was determined for the pixel of interest in row n, but then, as shown in Fig. 5, in a complete opposite of the method shown in Fig. n+ for the pixel of interest
Determine whether there is continuity with one line. As a result, 1 in Figure 5
The pixels shown in ~h are not continuous, and a continuous white pixel group is found excluding the pixels a - h and the black pixels. In other words, a reliable white pixel group is determined, and then analog image noise is determined and removed.

この判定と除去に際しては籐6図に示す選択方法を実行
する。第2図および菖5図で示す連続性ある白画素群か
ら各行内にて中点を求める。
For this determination and removal, the selection method shown in Figure 6 is executed. A midpoint is found within each row from the continuous white pixel group shown in FIGS. 2 and 5.

すなわち第6図に示すように同一行内にてO印で示す白
画素の中点を求める。中点が行ごとに1個又は2個の場
合はその行には黒画素がないかあっても一つの個所だけ
である。しかし、中点が3個以上になるとき文字を表わ
す黒−素以外の雑音があることとして、3個以上の中点
から2個を選択する。九とえば、第6図に示すn−1行
とn行とにつき着目するとn−1行は中点が2個で問題
はないが、n行は中点が3個であるので1個減らす必要
がある二この場合、n−1行の中点とn行の中点の関連
性をみるKn−1行の右側の中点はn行の右側の中点に
関連させ、n−1行の左側の中点はn行の中央か左負い
ずれに関連させるかが問題となるがこの場合中央列に近
い中央の中点を選択する・こうして、各行ごとに3個以
上の中点があるとき2個ずつ選択していく。そして、選
択されない中点と選択され友中点との間の黒画素はアナ
ログ画雑音として除去する。
That is, as shown in FIG. 6, the midpoint of white pixels indicated by O marks in the same row is determined. If there is one or two midpoints per row, then that row has no black pixels or only one black pixel. However, when there are three or more midpoints, it is assumed that there is noise other than black elements representing characters, and two of the three or more midpoints are selected. For example, looking at rows n-1 and n in Figure 6, row n-1 has two midpoints, so there is no problem, but row n has three midpoints, so reduce it by one. In this case, look at the relationship between the midpoint of row n-1 and the midpoint of row n.The midpoint on the right side of row n-1 is related to the midpoint on the right side of row n, and the midpoint of row n-1 is related to the midpoint of row n-1. The question is whether the left midpoint should be related to the center of n rows or the left and negative. In this case, select the center midpoint close to the center column. In this way, there are three or more midpoints in each row. Select two items at a time. Black pixels between the unselected midpoint and the selected midpoint are removed as analog image noise.

菖2図および第5図の連続性ある白画素群については1
617図のように中点が決まり、第8図のように中点が
選択される。この結果、アナログ雑音除去によシ第9図
に示す文字にできる。
1 for the continuous white pixel group in Figures 2 and 5.
The midpoint is determined as shown in FIG. 617, and the midpoint is selected as shown in FIG. As a result, the characters shown in FIG. 9 can be obtained by removing analog noise.

第2図以下の説明では数字の3につき雑音除去を実行し
たのであるが、他の数字でも同じであp中点は必ず2個
所選択されることになる。
In the explanation following FIG. 2, noise removal was performed for the number 3, but the same is true for other numbers, and two p-midpoints are always selected.

たとえば数字8につき連続性ある白画素を決定した場合
、8の字の黒画素で囲まれる部分は連続性ある白画素と
みなされないので、8の字の両脇にある白画素によシ中
点は2個となる。
For example, when determining continuous white pixels for the number 8, the part surrounded by the black pixels of the number 8 is not considered to be continuous white pixels, so the white pixels on both sides of the number 8 are used as the midpoint. becomes 2 pieces.

菖2#Aおよび第5図に示すように、連続性ある白画素
を求めるためn行の注目画素につき実行するとき、n−
1行(往)とn+1行(復)とを対象にするのは第1列
や最終列付近にのみ存在するアナログ画雑音を除去する
のに有効である。
As shown in Iris #2#A and FIG.
Targeting row 1 (forward) and row n+1 (return) is effective in removing analog image noise that exists only near the first column or the last column.

以上の説明がjI1図に示す余白検出回路6および除去
回路7の処理機能である。第10図はこれら回路の更に
詳細な図である。j11図に示す二次元センナ2からは
雑音を含むディジタル画情報が画情報メモリ5と余白検
出回路6に入力される。画情報メモリ5では二゛個のメ
モリ5m、5bによシこの雑音を含むディジタル画情報
が記録される。一方、余白検出回路6ではまず上→下方
向余白検出回路6aによシ第2図に示す連続性ある白画
素が選択される。この選択結果は画情報メモリ6bに記
憶される。更に、下→上方向余白検出回路6Cによシ第
5図に示す連続性ある白画素が選択され、この結果は画
情報メモリ6dに記憶される。8は画情報メモリ制御回
路である。
The above description is the processing function of the margin detection circuit 6 and removal circuit 7 shown in FIG. FIG. 10 is a more detailed diagram of these circuits. Digital image information including noise is inputted to the image information memory 5 and the margin detection circuit 6 from the two-dimensional sensor 2 shown in FIG. In the image information memory 5, digital image information including this noise is recorded in two memories 5m and 5b. On the other hand, the margin detection circuit 6 first selects the continuous white pixels shown in FIG. 2 by the top-to-bottom margin detection circuit 6a. This selection result is stored in the image information memory 6b. Furthermore, the continuous white pixels shown in FIG. 5 are selected by the bottom to top margin detection circuit 6C, and the result is stored in the image information memory 6d. 8 is an image information memory control circuit.

除去回路7では余白検出回路6による連続性ある白画素
の中点のうち2個を選択し、2個選択された中点に挾ま
れた領域外の画素を消去するものである。
The removal circuit 7 selects two of the midpoints of the continuous white pixels determined by the margin detection circuit 6, and erases pixels outside the area between the two selected midpoints.

以上実施例にて説明したように本発明によれば、雑音除
去を可能にでき正規の読取文字のみを抽出でき誤読や読
取不能は回避できた。
As described above in the embodiments, according to the present invention, it is possible to remove noise, extract only properly readable characters, and avoid misreading and unreadable characters.

【図面の簡単な説明】[Brief explanation of drawings]

jI1図ないし無lO図は本発明による光学式文字読取
方式の実施ガで、第1図はブロック幽、第2図および第
5図は白画素選択の説明図、第3図−)(b)は白画素
選択の説明図、第4図−)〜α)は第1列と最終列を注
目画素とした1合の白画素選択のための説明図、菖6図
は中点選択のための説明図、第7図および第8図は中点
選択と中点削障のための説明図、第9図は雑音除去後の
文字/4ターンを示す図、第1O図は第1図よシ更に詳
しい説明圀である。 図面中、 6は余白検出回路、 5は画情報メモリ、 7は除去回路である。 特許出願人 住友電気工業株式会社 代理人 弁塩士 光 石 士 部 (他1名) 第2図 第3虐 (b)(a) (1)シ1(2)刊 −一−−− 第4図 (f)   口市四ヨ 囲洞■i 第5図 第6図 図 第9図
Figures 1 through 10 illustrate the implementation of the optical character reading system according to the present invention, where Figure 1 shows a block diagram, Figures 2 and 5 are illustrations of white pixel selection, and Figure 3-) (b) is an explanatory diagram of white pixel selection, Figures 4-) to α) are explanatory diagrams of white pixel selection of 1 row with the first and last columns as the target pixels, and Diagram 6 is an explanatory diagram of white pixel selection for midpoint selection. Explanatory diagrams, Figures 7 and 8 are explanatory diagrams for midpoint selection and midpoint cutting failure, Figure 9 is a diagram showing characters/4 turns after noise removal, and Figure 1O is a diagram similar to Figure 1. This is a more detailed explanation. In the drawing, 6 is a margin detection circuit, 5 is an image information memory, and 7 is a removal circuit. Patent Applicant Sumitomo Electric Industries Co., Ltd. Agent Attorney: Shibu Mitsuishi (and 1 other person) Figure 2 Section 3 (b) (a) (1) Published by Ci1 (2) -1--- No. 4 Figure (f) Kuchichi Shiyo Ido ■i Figure 5 Figure 6 Figure 9

Claims (1)

【特許請求の範囲】[Claims] 用紙に記載された文字を二次元センナにて読み取〕上記
文字の識別を行なう文字読取方式において、上記二次元
センサから出力されるアナ璽ダ画情報をディジタル画情
報に変換し、このディジタル画情報を画情報メモリに記
憶すると共に文字以外の余白に#幽する上記ディジタル
画情報を検出し、上記余白に皺幽する上記ディジタル画
情報に基づき上記画情報メ篭りに含まれるディジタル画
雑音を除去したことを特徴とする光学式文字読取方式。
Reading the characters written on paper with a two-dimensional sensor] In the character reading method for identifying the characters, the analog seal image information output from the two-dimensional sensor is converted into digital image information, and this digital image information is is stored in the image information memory, and the digital image information that appears in the margins other than the characters is detected, and digital image noise contained in the image information is removed based on the digital image information that appears in the margins. An optical character reading method that is characterized by:
JP56169632A 1981-10-23 1981-10-23 Optical type character reading system Pending JPS5872276A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56169632A JPS5872276A (en) 1981-10-23 1981-10-23 Optical type character reading system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56169632A JPS5872276A (en) 1981-10-23 1981-10-23 Optical type character reading system

Publications (1)

Publication Number Publication Date
JPS5872276A true JPS5872276A (en) 1983-04-30

Family

ID=15890091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56169632A Pending JPS5872276A (en) 1981-10-23 1981-10-23 Optical type character reading system

Country Status (1)

Country Link
JP (1) JPS5872276A (en)

Similar Documents

Publication Publication Date Title
JP4288756B2 (en) Information code approximate existence area estimation method, information code reading method and apparatus, and recording medium
JP2007081458A (en) Image processing apparatus and control method of image processing apparatus
US4797940A (en) Optical character reader
JP4392907B2 (en) Character extraction method
JPS5872276A (en) Optical type character reading system
JP2001109887A (en) Area extracting method, method and device for extracting address area, and image processor
JPH0548510B2 (en)
JP2732608B2 (en) Background image erasing and binarization processing method for linear figure image and apparatus therefor
JPH0119193B2 (en)
JP3020293B2 (en) Attribute determination method
JP2906608B2 (en) Optical character reader
JP3281786B2 (en) Braille copying machine
JPS61221982A (en) Calculating device for surrounding length of picture pattern
JP2573665B2 (en) Optical character reader
JP2646642B2 (en) Image inside / outside area judgment system
JPS5911153B2 (en) Optical character reading method
JPH0442714B2 (en)
JP2925275B2 (en) Optical character reader
JPH09185317A (en) Braille recognition system
JP2000155800A (en) Optical information reader and storage medium
JPH11161739A (en) Character recognizing device
JPS63211480A (en) Optical character reader
JPH02187883A (en) Document reader
JPH05274473A (en) Optical character reader
JPH0997303A (en) Optical information reader