JPH03154183A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH03154183A
JPH03154183A JP1291161A JP29116189A JPH03154183A JP H03154183 A JPH03154183 A JP H03154183A JP 1291161 A JP1291161 A JP 1291161A JP 29116189 A JP29116189 A JP 29116189A JP H03154183 A JPH03154183 A JP H03154183A
Authority
JP
Japan
Prior art keywords
document
sheet
white level
image
image area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1291161A
Other languages
Japanese (ja)
Inventor
Takashi Akimoto
隆 秋元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1291161A priority Critical patent/JPH03154183A/en
Publication of JPH03154183A publication Critical patent/JPH03154183A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To read character information described in an original without fail by extracting more than an allowable value, for which skew is generated from the tip of a sheet image by conveyance, as a white level. CONSTITUTION:A sheet 11 generating the skew during the conveyance is irradiated with light from a light source 12 and reflected light is made incident from the sheet 11 to a photoelectric conversion part 13, converted to multilevel image data and inputted to a white level memory 14 and a binarizing circuit 16. The multilevel image data stored at the prescribed address of the white level memory 14 are converted to the while level from the right end to L and from the left end to L in the tip of the image data. The binarizing circuit 16 compares the multilevel image data, which are inputted from the photoelectric conversion part 13, with the converted white level, binarizes the data in an image buffer 17 while maintaining an oblique state by the skew. Thus, all described characters can be read.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、原稿に記載されている文字情報を認識する装
置のうち、特に、当該原稿が斜めの状態で搬送される、
所謂スキニーによりパターン認識における文字の読取率
の低下を防止する光学式文字読取装置に関する。
[Detailed Description of the Invention] [Objective of the Invention] (Industrial Application Field) The present invention relates to a device for recognizing character information written on a manuscript, particularly when the manuscript is conveyed in an oblique state. ,
The present invention relates to an optical character reading device that prevents a decrease in character reading rate in pattern recognition due to so-called skinny.

(従来の技術) 従来の光学式文字読取装置は、原稿に記載されている文
字を読取るため、搬送される原稿(以下、シートという
。)の白地である白レベルを基準とする2値化を用いて
いる。上記2値化による処理は、搬送されるシートに光
を照射して当該シートからの反射光を光電変換して得ら
れるシートの先端部(クリーンエリア)の白レベルをメ
モリに1スキヤン(走査)分記憶する。メモリに記憶さ
れる白レベルは、予め搬送されるシートの画像領域であ
る標準化パターンの抽出イメージのレベルと比較される
。比較により上記白レベルの原稿の画像領域が白値に、
原稿の文字等が黒値に変換されてシートバッファに記憶
される。上記2値化の処理において、シートが斜めの状
態で搬送されると原稿に記憶されている文字情報を正確
に読取るのが容易でなかった。
(Prior Art) In order to read characters written on a document, a conventional optical character reading device performs binarization based on the white level of the white background of the document being conveyed (hereinafter referred to as a sheet). I am using it. The above binarization process involves one scan of the white level of the leading edge of the sheet (clean area) obtained by irradiating light onto the sheet being conveyed and photoelectrically converting the reflected light from the sheet into memory. Memorize minutes. The white level stored in the memory is compared with the level of the extracted image of the standardized pattern, which is the image area of the sheet to be conveyed in advance. By comparison, the image area of the document with the above white level becomes the white value,
Characters and the like on the original are converted into black values and stored in the sheet buffer. In the binarization process described above, if the sheet is conveyed in an oblique state, it is difficult to accurately read the character information stored in the document.

(発明が解決しようとする課題) 従来の装置は、シートがスキニーの状態で搬送されてイ
メージバッファ17に記憶されると第4図に示す如く、
2値化されたシートイメージ18が斜めの状態で記憶さ
れる。このシートイメージ18が斜めの状態に記憶され
るときシートイメージ18に記載されている英文字rA
J〜rlJのうちrGJが読取れなくなり、シートイメ
ージ18の英文字を正確に読取れないことによる装置の
信頼性の低下を招来するおそれがあり、その対策が切望
されていた。
(Problems to be Solved by the Invention) In the conventional apparatus, when a sheet is conveyed in a skinny state and stored in the image buffer 17, as shown in FIG.
The binarized sheet image 18 is stored in an oblique state. When this sheet image 18 is stored in an oblique state, the English letters rA written on the sheet image 18
Among J to rlJ, rGJ becomes unreadable, and the reliability of the device may be lowered due to the inability to accurately read the English characters on the sheet image 18, and a countermeasure for this problem has been desperately needed.

本発明は、上記に鑑みてなされたものであり、その目的
としては、原稿が斜めの状態で搬送されても原稿の画像
領域を正確に抽出することにより、原稿に記載されてい
る文字情報を確実に読取り装置の信頼性を向上する光学
式文字読取装置を提供することにある。
The present invention has been made in view of the above, and an object of the present invention is to accurately extract the image area of the document even when the document is conveyed at an angle, thereby extracting character information written on the document. An object of the present invention is to provide an optical character reading device that reliably improves the reliability of the reading device.

[発明の構成] (課題を解決するための手段) 上記目的を達成するため、本発明は、文字情報の記載さ
れている原稿が搬送され、当該原稿に光を照射して当該
原稿からの反射光から搬送される原稿の画像領域を検出
する領域検出手段と、この領域検出手段により検出され
る原稿の画像領域を記憶する記憶手段と、 この記憶手段に記憶されている原稿の画像領域の先端の
左右両端部から当該原稿が斜めに搬送されるときの原稿
の画像領域の先端の左右両端部までを当該原稿の画像領
域として抽出する抽出手段と、 この抽出手段により前記抽出された画像領域と前記領域
検出手段により検出された原稿の画像領域とを比較して
、当該抽出された画像領域を2値化する2値化手段と、 を備えたことを要旨とする。
[Structure of the Invention] (Means for Solving the Problems) In order to achieve the above object, the present invention provides that a document on which character information is written is conveyed, light is irradiated onto the document, and light is reflected from the document. Area detection means for detecting an image area of a document being conveyed from light; storage means for storing the image area of the document detected by the area detection means; and the leading edge of the image area of the document stored in the storage means. an extraction means for extracting as an image area of the document from both left and right ends of the document to both right and left ends of the leading edge of the image area of the document when the document is conveyed diagonally; The present invention further comprises: binarization means for comparing the image area of the document detected by the area detection means and binarizing the extracted image area.

(作用) 上記構成を備えた光学式文字読取装置においては、文字
情報の記載されている原稿が搬送され、当該原稿に光を
照射して当該原稿からの反射光により搬送される原稿の
画像領域を検出する。検出される原稿の画像領域は、記
憶手段に記憶されている当該原稿の先端の左右両端部か
ら当該原稿が斜めに搬送されるときの当該原稿の画像領
域の先端の左右両端部までを当該原稿の画像領域と抽出
する。この抽出された画像領域と前記検出された原稿の
画像領域とを比較して、当該抽出された画像領域を2値
化するので、原稿に記載されている文字情報を正確に読
取ることができる。
(Function) In the optical character reading device having the above configuration, a document on which character information is written is conveyed, the document is irradiated with light, and the image area of the document is conveyed by light reflected from the document. Detect. The image area of the document to be detected extends from both left and right ends of the leading edge of the document stored in the storage means to both left and right ends of the leading edge of the image area of the document when the document is conveyed diagonally. Extract the image area. This extracted image area is compared with the detected image area of the document, and the extracted image area is binarized, so that character information written on the document can be accurately read.

(実施例) 以下、図面を用いて本発明の詳細な説明する。(Example) Hereinafter, the present invention will be explained in detail using the drawings.

第1図は本発明の光学式文字読取装置に係る一実施例の
構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of an embodiment of the optical character reading device of the present invention.

上記光学式文字読取装置は、光源12.光電変換部13
(領域検出手段)および白レベルメモリ14(記憶手段
)を有するものである。
The optical character reading device includes a light source 12. Photoelectric conversion section 13
(area detection means) and a white level memory 14 (storage means).

光源12は、搬送される原稿(以下、シートという。)
に光を照射するものであり、例えば蛍光燈等の光を照射
するものであればよい。
The light source 12 is a document that is being transported (hereinafter referred to as a sheet).
For example, any device that irradiates light such as a fluorescent light may be used.

光電変換部13は光電変換素子およびA−Dコンバータ
を有し、シート11から入射される反射光をディジタル
画像信号である多値のイメージデータに変換して後述す
る白レベルメモリ14および2値化回路16に出力する
ものである。上記光電変換素子には、例えばCCD形あ
るいはMO3形イメージセンサの半導体センサー、ビジ
コン。
The photoelectric conversion unit 13 has a photoelectric conversion element and an A-D converter, and converts the reflected light incident from the sheet 11 into multivalued image data, which is a digital image signal, and converts it into a white level memory 14 and binarization, which will be described later. It is output to the circuit 16. The photoelectric conversion element is, for example, a semiconductor sensor such as a CCD type or MO3 type image sensor, or a vidicon.

イメージディセクタ等がある。There are image dissectors, etc.

白レベルメモリ14は、光電変換部13から入力される
イメージデータを所定アドレスに記憶するものである。
The white level memory 14 stores image data input from the photoelectric conversion section 13 at a predetermined address.

また、上記光学式文字読取装置は、白レベル修正回路1
5(抽出手段)、2値化回路16(2値化手段)および
イメージバッファ17を有するものである。
Further, the optical character reading device has a white level correction circuit 1.
5 (extraction means), a binarization circuit 16 (binarization means), and an image buffer 17.

上記白レベル修正回路15は、白レベルメモリ14の所
定アドレスに1己憶されているイメージデータを読出し
て当該イメージデータの先端(クリーンエリア)の左右
両端から予めメモリ(図示せず)に記憶している上記原
稿の標準化パターンである抽出パターンと比較する。比
較により上記イメージデータの先端の右端からLl、左
端からLlの距離までを原稿の画像領域とする白レベル
として白レベルメモリ14から2値化回路16に出力す
るものである。
The white level correction circuit 15 reads the image data stored at a predetermined address in the white level memory 14 and stores it in advance in a memory (not shown) from both left and right ends of the leading edge (clean area) of the image data. The extraction pattern is compared with the extracted pattern, which is the standardized pattern of the above manuscript. By comparison, the white level is outputted from the white level memory 14 to the binarization circuit 16 as the white level with the distance Ll from the right end and the distance Ll from the left end of the leading edge of the image data as the image area of the document.

2値化回路16は、光電変換部13から入力される多値
のイメージデータと白レベル修正回路15により抽出さ
れた白レベルとを比較して2値化するものである。即ち
、上記2値化回路16は、白レベル修正回路15により
抽出された白レベルのうち、シート11に記憶されてい
る英文字「A〜■」を黒値にする。また、2値化回路1
6は、上記英文字以外の白レベルのうちイメージデータ
を白値にする。
The binarization circuit 16 compares the multivalued image data inputted from the photoelectric conversion section 13 with the white level extracted by the white level correction circuit 15 and binarizes the data. That is, the binarization circuit 16 converts the English letters "A to ■" stored in the sheet 11 out of the white levels extracted by the white level correction circuit 15 into black values. In addition, the binarization circuit 1
6 sets the image data to a white value among the white levels other than the above-mentioned English characters.

イメージバッファ17は、2値化回路16により2値化
されたシートイメージを所定アドレスに記憶するもので
ある。
The image buffer 17 stores the sheet image binarized by the binarization circuit 16 at a predetermined address.

上記白レベル修正回路15によりシート11の白レベル
が抽出されて2値化回路16による2値化されるシート
イメージ18を第2図を用いて説明する。
The sheet image 18 from which the white level of the sheet 11 is extracted by the white level correction circuit 15 and binarized by the binarization circuit 16 will be described with reference to FIG.

前述した白レベルメモリ14の所定アドレスに搬送中に
シート11が斜め方向になる、所謂スキューの生じたシ
ートイメージ18が図中右側に斜め方向に記憶される。
A so-called skewed sheet image 18 in which the sheet 11 is oriented diagonally while being conveyed to a predetermined address in the white level memory 14 described above is stored diagonally on the right side in the figure.

白レベルメモリ14にイメージデータが記憶されると白
レベル修正回路15は、記憶されてるシートイメージ1
8の先端の図中左端からLl、右端からLlの範囲を白
レベルとして抽出する。
When the image data is stored in the white level memory 14, the white level correction circuit 15 adjusts the stored sheet image 1.
The range Ll from the left end in the figure and Ll from the right end of the tip of 8 is extracted as the white level.

ここで、上記白レベルとして抽出される図中LL2の距
離は、スキューしたシートイメージ18の左右端が全て
入るスキューの許容範囲の設定値以上である。上記白レ
ベル修正回路15により抽出された白レベルは、2値化
回路16により光電変換部13から人力される多値のイ
メージデータと比較され、シート11に記載されている
英文字rA−IJを黒値に、他のシートイメージ18の
領域を白値に2値化される。
Here, the distance LL2 in the figure extracted as the white level is greater than or equal to the set value of the allowable skew range in which all the left and right ends of the skewed sheet image 18 are included. The white level extracted by the white level correction circuit 15 is compared with the multivalued image data manually inputted from the photoelectric conversion unit 13 by the binarization circuit 16, and the English letters rA-IJ written on the sheet 11 are The area of the other sheet image 18 is binarized into a black value and a white value.

上記2値化回路16により2値化されたシートイメージ
18はシートバッファ17の所定アドレスに記憶される
。上記シートバッファ17の所定アドレスに記憶される
シートイメージ18を第3図に示す。シートイメージ1
8に記載されている英文字「A〜■」の全てがシートバ
ッファ17に記憶されるため、従来のシートバッファ1
7に記憶されるシートイメージ18と比較して、英文字
rGJの読取り不能を回避できる。
The sheet image 18 binarized by the binarization circuit 16 is stored at a predetermined address in the sheet buffer 17. FIG. 3 shows the sheet image 18 stored at a predetermined address in the sheet buffer 17. Sheet image 1
8 are all stored in the sheet buffer 17, so compared to the conventional sheet buffer 1.
In comparison with the sheet image 18 stored in 7, it is possible to avoid the unreadability of the English letters rGJ.

次にこの実施例の作用を説明する。Next, the operation of this embodiment will be explained.

まず、装置に電源投入後、搬送中にスキューの生じたシ
ート11に光源12から光が照射されてシート11から
反射光が光電変換部13に入射される。入射される反射
光は、光電変換部13により多値のイメージデータに変
換されて白レベルメモリ14および2値化回路16に入
力される。上記白レベルメモリ14の所定アドレスに記
憶されて多値のイメージデータは、白レベル修正回路1
5により当該イメージデータの先端の右端からし1、左
端からLlまで白レベルに変換される。変換された白レ
ベルは、2値化回路16により光電変換部13から人力
される多値イメージデータと比較されて2値化される。
First, after power is turned on to the apparatus, light is irradiated from the light source 12 onto the sheet 11 that has been skewed during conveyance, and reflected light from the sheet 11 is incident on the photoelectric conversion section 13 . The incident reflected light is converted into multivalued image data by the photoelectric conversion section 13 and input to the white level memory 14 and the binarization circuit 16. The multivalued image data stored at a predetermined address in the white level memory 14 is stored in the white level correction circuit 1.
5, the image data is converted into a white level from the right end to 1 and from the left end to Ll. The converted white level is compared with multi-valued image data manually inputted from the photoelectric conversion unit 13 by the binarization circuit 16 and is binarized.

2値化されたシートイメージ18は、シート11の英文
字が黒値に、他のシートイメージ18の領域が白値に変
換され、スキューにより斜めの状態のままイメージバッ
ファ17の所定アドレスに記憶される。シートバッファ
17に記憶されるシートイメージ18の英文字は、認識
回路(図示せず)により認識される。
In the binarized sheet image 18, the English characters on the sheet 11 are converted to black values, the areas of other sheet images 18 are converted to white values, and are stored in a predetermined address of the image buffer 17 in a diagonal state due to skew. Ru. The alphabetic characters in the sheet image 18 stored in the sheet buffer 17 are recognized by a recognition circuit (not shown).

これにより、スキューの状態で搬送されたシート11に
記載されている英文字rAJ〜rGJの全てを読取るこ
とができるので、従来の如くスキニーによりシート11
に記載されている英文字のうちrGJが読取れない状態
を回避できる。
As a result, all of the English characters rAJ to rGJ written on the sheet 11 conveyed in a skewed state can be read, so that the sheet 11 can be
It is possible to avoid a situation in which rGJ among the English characters written in is unreadable.

また、本実施例の応用例として、各種の画像を処理する
画像処理装置および各種のマーク(標章)を読取るマー
ク読取装置に適用することも可能である。
Further, as an application example of this embodiment, it is also possible to apply it to an image processing device that processes various images and a mark reading device that reads various marks (emblems).

以上、本発明はその要旨を逸脱しない範囲内で種々変更
して実施することができる。
As described above, the present invention can be implemented with various modifications within the scope of the invention.

[発明の効果] 以上説明したように、本発明によれば、シートイメージ
の先端より搬送により生じるスキューの生じる許容値以
上を白レベルとして抽出するので、原稿が斜めの状態で
搬送されても原稿の画像領域を正確に抽出することによ
り、原稿に記載されている文字情報を確実に読取り装置
の信頼性を向上できる。
[Effects of the Invention] As explained above, according to the present invention, since the white level is extracted from the leading edge of the sheet image to a value exceeding the allowable value for the skew caused by conveyance, even if the document is conveyed at an angle, the document By accurately extracting the image area, it is possible to reliably improve the reliability of the device that reads the character information written on the document.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の光学式文字読取装置に係る一実施例の
構成を示すブロック図、第2図は本発明により2値化さ
れたシートイメージを示す図、第3図は本発明によりシ
ートバッファに記憶されるシートイメージを示す図、第
4図は従来のシートバッファに記憶されるシートイメー
ジを示す図である。 12・・・光源 13・・・光電変換部 14・・・白レベルメモリ 15・・・白レベル修正回路 16・・・2値化回路 17・・・シートバッファ 18・・・シートイメージ
FIG. 1 is a block diagram showing the configuration of an embodiment of the optical character reading device of the present invention, FIG. 2 is a diagram showing a binarized sheet image according to the present invention, and FIG. A diagram showing a sheet image stored in a buffer. FIG. 4 is a diagram showing a sheet image stored in a conventional sheet buffer. 12... Light source 13... Photoelectric conversion unit 14... White level memory 15... White level correction circuit 16... Binarization circuit 17... Sheet buffer 18... Sheet image

Claims (1)

【特許請求の範囲】 文字情報の記載されている原稿が搬送され、当該原稿に
光を照射して当該原稿からの反射光から搬送される原稿
の画像領域を検出する領域検出手段と、 この領域検出手段により検出される原稿の画像領域を記
憶する記憶手段と、 この記憶手段に記憶されている原稿の画像領域の先端の
左右両端部から当該原稿が斜めに搬送されるときの原稿
の画像領域の先端の左右両端部までを当該原稿の画像領
域として抽出する抽出手段と、 この抽出手段により前記抽出された画像領域と前記領域
検出手段により検出された原稿の画像領域とを比較して
、当該抽出された画像領域を2値化する2値化手段と、 を備えたことを特徴とする光学式文字読取装置。
[Scope of Claims] An area detecting means for detecting an image area of the transported original document by irradiating light onto the original document and detecting an image area of the transported original document based on light reflected from the original document; A storage means for storing an image area of a document detected by the detection means; and an image area of the document when the document is conveyed diagonally from both left and right ends of the leading edge of the image area of the document stored in the storage means. an extraction means for extracting the left and right ends of the leading edge of the document as an image area of the document, and comparing the image area extracted by the extraction means with the image area of the document detected by the area detection means, An optical character reading device comprising: binarization means for binarizing the extracted image area;
JP1291161A 1989-11-10 1989-11-10 Optical character reader Pending JPH03154183A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1291161A JPH03154183A (en) 1989-11-10 1989-11-10 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1291161A JPH03154183A (en) 1989-11-10 1989-11-10 Optical character reader

Publications (1)

Publication Number Publication Date
JPH03154183A true JPH03154183A (en) 1991-07-02

Family

ID=17765236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1291161A Pending JPH03154183A (en) 1989-11-10 1989-11-10 Optical character reader

Country Status (1)

Country Link
JP (1) JPH03154183A (en)

Similar Documents

Publication Publication Date Title
JPS63158678A (en) Inter-word space detecting method
EP0505729B1 (en) Image binarization system
JP2002207996A (en) Method and device for detecting pattern defect
US20130221103A1 (en) Decoding method and decoding processing device
JPH03154183A (en) Optical character reader
JPH0548510B2 (en)
JP2590099B2 (en) Character reading method
JP3095437B2 (en) Character line detection cutout device and character reading device
JPS62120585A (en) Bar code recognizing device by image scanner
JP3230371B2 (en) Character recognition device and character recognition method
JPS61289476A (en) Format forming system for character reader
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JP3307782B2 (en) Character mark recognition device
JPH0119193B2 (en)
JPS6160475B2 (en)
JP5453193B2 (en) Tilt detection device, imaging device and method
JPH01217688A (en) Binarization circuit
JPS62107382A (en) Bar-code recognizing system
JPH04260181A (en) Character reader
JPH04167084A (en) Character reader
JPS58211280A (en) Character reader
JPS63136181A (en) Character reader
JPH02135586A (en) Optical character reader
JPH04134578A (en) Picture binarizing system
JP2000187706A (en) Paper sheets reader