JPH05225381A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH05225381A
JPH05225381A JP4023105A JP2310592A JPH05225381A JP H05225381 A JPH05225381 A JP H05225381A JP 4023105 A JP4023105 A JP 4023105A JP 2310592 A JP2310592 A JP 2310592A JP H05225381 A JPH05225381 A JP H05225381A
Authority
JP
Japan
Prior art keywords
image data
character
image
inclination
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4023105A
Other languages
Japanese (ja)
Inventor
Teruki Oikawa
晃樹 及川
Toshio Tsutsumida
敏夫 堤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP4023105A priority Critical patent/JPH05225381A/en
Publication of JPH05225381A publication Critical patent/JPH05225381A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To improve the performance of an optical character reader by eliminating the necessity of detailed correcting information calculating processing for a business form having no inclination and rapidly executing business form reading processing. CONSTITUTION:The optical character reader having an extracting operation compensating part 7 for calculating the inclination and positional deviation of a business form from business form data inputted by an image scanner 1 and stored in an image memory 2 and compensating the operation of a character data extracting part for extracting character data from the business form data and a character recognizing part 6 for recognizing a character from the extracted character data is also provided with a business form detecting part 8 for detecting the width of the business form based upon the image data inputted from the image scanner 1 and a skew variable measuring part 9 for measuring the inclination of the business form prior to the compensating operation of the compensating part 7 to control the operation of the compensating part 7.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、光学的に帳票を走査し
て読み取ったイメージデータにより、文字認識を行なう
光学式文字読み取り装置(OCR:Optical C
haracter Reader)に係わり、特に、走
査時における帳票の傾きや位置ずれに対する補正を効率
良く行なうのに好適な光学式文字読み取り装置に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading device (OCR: Optical C) for performing character recognition based on image data read by optically scanning a form.
The present invention relates to an optical character reading device suitable for efficiently correcting a tilt and a positional shift of a document during scanning.

【0002】[0002]

【従来の技術】従来、用紙に印刷、もしくは、手書きさ
れた文字イメージなどの認識システムにおける用紙の傾
き補正に関しては、例えば、社団法人 電子情報通信学
会編「電子情報通信ハンドブック」(1988年 オー
ム社発行)の第1114頁から第1115頁に記載のよ
うに、搬送系において、機械的に、用紙の傾きの補正を
行なうものや、次の図3に示すように、用紙の傾きを検
出して、補正するものがある。
2. Description of the Related Art Conventionally, for correcting the inclination of a paper in a recognition system of a character image printed or handwritten on a paper, for example, "Electronic Information and Communication Handbook" edited by Institute of Electronics, Information and Communication Engineers (1988 Ohmsha) As described on pages 1114 to 1115 in (Issue), the conveyance system mechanically corrects the inclination of the sheet, or detects the inclination of the sheet as shown in FIG. , There is something to correct.

【0003】図3は、従来の光学式文字読み取り装置の
構成を示すブロック図である。本図において、1は、イ
メージスキャナであり、文字読み取り処理を対象とした
帳票aを光学的に走査することにより、ライン単位のイ
メージデータbを出力する。また、2は、イメージメモ
リであり、イメージスキャナ1からのライン単位のイメ
ージデータbを、複数ライン分、順次、格納する。3
は、補正情報算出部であり、イメージメモリ2からのペ
ージイメージcにより、帳票の傾き、位置ずれを算出
し、補正パラメタeを出力する。4は、文字イメージデ
ータ抽出部としてのアドレス発生部であり、予め定めら
れたフォーマット定義情報dに基づいて、読み出しアド
レスfを発生させる。5は、アドレス変換部であり、補
正情報算出部3と共に、抽出動作補正部7を構成し、補
正パラメタeに基づき、アドレス発生部4からの読み出
しアドレスfに対し、帳票の傾き、位置ずれを補正する
ように、アドレスを変換した読み出しアドレスgを、イ
メージメモリ2に出力する。そして、6は、文字認識部
であり、アドレス変換部5より出力された読み出しアド
レスfに基づき、イメージメモリ2から切り出された文
字イメージhを基に、文字を認識し、認識結果iとして
出力する。
FIG. 3 is a block diagram showing the structure of a conventional optical character reading device. In the figure, reference numeral 1 is an image scanner, which optically scans a form a for character reading processing to output image data b in line units. An image memory 2 stores image data b from the image scanner 1 line by line for a plurality of lines in sequence. Three
Is a correction information calculation unit, which calculates the inclination and displacement of the form from the page image c from the image memory 2 and outputs the correction parameter e. Reference numeral 4 is an address generation unit as a character image data extraction unit, which generates a read address f based on predetermined format definition information d. Reference numeral 5 denotes an address conversion unit, which constitutes the extraction operation correction unit 7 together with the correction information calculation unit 3, and based on the correction parameter e, the inclination and position shift of the form with respect to the read address f from the address generation unit 4 are corrected. The read address g whose address is converted so as to be corrected is output to the image memory 2. A character recognition unit 6 recognizes a character based on the read address f output from the address conversion unit 5 based on the character image h cut out from the image memory 2 and outputs it as a recognition result i. ..

【0004】このように、従来の光学式文字読み取り装
置の場合、イメージスキャナ1に、帳票が傾いてセット
されると、イメージデータも、傾いたまま、イメージメ
モリ2に格納される。そのために、イメージメモリ2に
対し、傾きを検出する必要があり、アドレス発生部4で
発生する読み出しアドレスを変更するために、補正情報
算出部3とアドレス変換部5からなる抽出動作補正部7
を設けている。しかし、従来技術では、帳票の傾きが発
生したか否かに係わらず、補正情報算出部3による処理
時間のかかる詳細な補正情報の算出を行なっている。そ
のために、文字認識部の処理の開始を遅延させる原因と
なっており、結果的に、読み取り処理全体の速度が低下
する欠点があった。
As described above, in the case of the conventional optical character reading device, when the document is set in the image scanner 1 while being tilted, the image data is also stored in the image memory 2 while being tilted. Therefore, it is necessary to detect the inclination of the image memory 2, and in order to change the read address generated by the address generation unit 4, the extraction operation correction unit 7 including the correction information calculation unit 3 and the address conversion unit 5.
Is provided. However, in the related art, the correction information calculation unit 3 calculates detailed correction information that requires a long processing time, regardless of whether or not the document is tilted. Therefore, it causes the start of the processing of the character recognition unit to be delayed, and as a result, there is a drawback that the speed of the entire reading processing decreases.

【0005】[0005]

【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、帳票の傾きが発生したか否かに
係わらず詳細な補正情報算出処理を行なっていたため、
文字認識処理を即座に開始することができない点であ
る。本発明の目的は、これら従来技術の課題を解決し、
傾きが発生していない帳票に対しては、詳細な補正情報
算出処理を行なわず、文字認識処理を即座に開始し、帳
票の読み取り処理の高速化を可能とする光学式文字読み
取り装置を提供することである。
The problem to be solved is that in the prior art, detailed correction information calculation processing is performed regardless of whether or not the inclination of the form has occurred.
The point is that the character recognition process cannot be started immediately. The object of the present invention is to solve these problems of the prior art,
Provided is an optical character reading device capable of speeding up the reading process of a form by immediately starting the character recognition process without performing a detailed correction information calculation process on a form in which an inclination has not occurred. That is.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するた
め、本発明の光学式文字読み取り装置は、(1)文字読
み取り処理の対象となる帳票を光学的に走査して、ライ
ン単位のイメージデータを出力するイメージスキャナ
と、このイメージスキャナからのイメージデータを格納
するイメージメモリと、このイメージメモリに格納した
イメージデータから文字単位のイメージデータを抽出す
る文字イメージデータ抽出部と、イメージメモリに格納
したイメージデータに基づき、帳票の傾きと位置ずれを
算出して、文字イメージデータ抽出部の文字単位のイメ
ージデータの抽出動作を補正する抽出動作補正部と、こ
の抽出動作補正部の補正動作に基づき、文字イメージデ
ータ抽出部がイメージメモリから抽出した文字単位のイ
メージデータを基に、文字を識別する文字認識部とを備
えた光学式文字読み取り装置において、イメージスキャ
ナが出力するライン単位のイメージデータを用いて、帳
票の幅を検出する帳票幅検出部と、この帳票幅検出部が
検出する帳票の幅の変化に基づき、抽出動作補正部によ
るイメージメモリに格納したイメージデータを用いた帳
票の傾きと位置ずれの算出動作の前に、帳票の傾きを測
定するスキュー量測定部とを設け、このスキュー量測定
部の測定結果に基づき、抽出動作補正部の算出動作を制
御することを特徴とする。また、(2)上記(1)に記
載の光学式文字読み取り装置において、帳票幅検出部
は、イメージスキャナが出力するライン単位のイメージ
データから、一ライン分毎の白レベルもしくは黒レベル
のいずれか一方のドット数を順次に検出し、スキュー量
測定部は、この帳票幅検出部が順次に検出する一ライン
分のドット数の変化に基づき、帳票の傾きを測定するこ
とを特徴とする。
In order to achieve the above object, the optical character reading apparatus of the present invention comprises (1) optically scanning a form to be subjected to character reading processing to obtain image data in line units. An image scanner that outputs the image data, an image memory that stores the image data from the image scanner, a character image data extraction unit that extracts character-by-character image data from the image data stored in the image memory, and an image memory that stores the image data. Based on the image data, the inclination and position shift of the form are calculated, and the extraction operation correction unit that corrects the extraction operation of the image data in character units of the character image data extraction unit, and the correction operation of the extraction operation correction unit, Based on the character-based image data extracted from the image memory by the character image data extraction unit, In an optical character reading device equipped with a character recognition unit for identifying characters, a form width detection unit that detects the width of a form using image data output by an image scanner in line units, and this form width detection unit Based on the change in the width of the form to be detected, a skew amount measuring unit that measures the inclination of the form is used before the operation of calculating the inclination and position shift of the form using the image data stored in the image memory by the extraction operation correction unit. It is characterized in that the calculation operation of the extraction operation correction unit is controlled based on the measurement result of the skew amount measurement unit. (2) In the optical character reading device according to (1) above, the form width detection unit selects either a white level or a black level for each line from the image data output from the image scanner in line units. One of the features is that the number of dots is sequentially detected, and the skew amount measuring unit measures the inclination of the form based on the change in the number of dots for one line sequentially detected by the form width detecting unit.

【0007】[0007]

【作用】本発明においては、イメージスキャナが出力す
るライン単位のイメージデータをイメージメモリに格納
する過程で、補正情報算出を行なう前に、帳票の傾きを
検出する。そして、傾きが大きく、予め定めたしきい値
を超えた場合にのみ、補正情報算出に基づく傾きの補正
処理を行ない、帳票の傾きが小さい場合は、補正情報算
出を行なわず、即座に、文字認識処理を行なう。このこ
とにより、文字読み取り動作を高速化することができ
る。また、ここで検出した傾き情報を用いて、傾き状況
に応じた補正情報算出処理を行なうことにより、補正情
報算出を、さらに、精度良く行なうことができる。
In the present invention, the inclination of the form is detected before the correction information is calculated in the process of storing the image data for each line output from the image scanner in the image memory. Then, only when the inclination is large and exceeds the predetermined threshold value, the inclination correction processing based on the correction information calculation is performed, and when the inclination of the form is small, the correction information is not calculated and the character is immediately output. Perform recognition processing. As a result, the character reading operation can be speeded up. Further, the correction information can be calculated with higher accuracy by performing the correction information calculation process according to the tilt situation using the tilt information detected here.

【0008】[0008]

【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明を施した光学式文字読み取り
装置の本発明に係わる構成の一実施例を示すブロック図
である。本実施例の光学式文字読み取り装置は、図3に
示す従来の光学式文字読み取り装置で説明したイメージ
スキャナ1、イメージメモリ2、文字イメージデータ抽
出部としてのアドレス発生部4、補正情報算出部3とア
ドレス変換部5からなる抽出動作補正部7、そして、文
字認識部6に、本発明に係わる帳票の傾き検出を行なう
ための帳票幅検出部8とスキュー量測定部9とを設けて
構成されている。このような構成により、本実施例の光
学式文字読み取り装置は、イメージスキャナ1からのイ
メージデータを、イメージメモリ2に格納する過程で、
補正情報算出部3による補正情報算出を行なう前に、帳
票の傾きを検出し、帳票の傾きがない場合は、補正情報
算出を行なわず、即座に、文字認識処理を行ない、読み
取り処理全体を高速化させる。以下、このような動作を
説明する。尚、本実施例のイメージメモリ2に格納され
るイメージデータは、多階調画像とするが、本発明は、
これに限定されるものではない。また、イメージスキャ
ナ1、イメージメモリ2、補正情報算出部3、アドレス
発生部4、アドレス変換部5、文字認識部6のそれぞれ
に関しては、図3に示す従来のものと同じであり、その
動作説明は省略する。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of a configuration according to the present invention of an optical character reading device according to the present invention. The optical character reader of this embodiment is the image scanner 1 described in the conventional optical character reader shown in FIG. 3, the image memory 2, the address generator 4 as a character image data extractor, and the correction information calculator 3. An extraction operation correction unit 7 including an address conversion unit 5 and a character recognition unit 6 are provided with a form width detection unit 8 and a skew amount measurement unit 9 for detecting the inclination of a form according to the present invention. ing. With such a configuration, the optical character reading device according to the present embodiment stores the image data from the image scanner 1 in the image memory 2,
Before the correction information calculation unit 3 calculates the correction information, the inclination of the form is detected. If there is no inclination of the form, the correction information is not calculated and the character recognition process is immediately performed to speed up the entire reading process. Turn into Hereinafter, such operation will be described. The image data stored in the image memory 2 of this embodiment is a multi-gradation image.
It is not limited to this. Further, the image scanner 1, the image memory 2, the correction information calculation unit 3, the address generation unit 4, the address conversion unit 5, and the character recognition unit 6 are the same as those of the conventional one shown in FIG. Is omitted.

【0009】帳票幅検出部8は、イメージスキャナ1か
らのライン単位のイメージデータbを入力とし、帳票a
の先端を検出した後、予め決められたライン数分だけ、
各入力ライン毎に、帳票の幅を示す情報となる一ライン
分の白レベルドット数jを検出し、スキュー量測定部9
に、順次出力する。そして、スキュー量測定部9は、帳
票幅検出部6からの一ライン分の白レベルドット数jに
基づき、傾き情報kを測定し、抽出動作補正部7に送出
する。このスキュー量測定部9による帳票の傾き情報を
測定する動作に関して説明する。
The form width detection unit 8 receives the image data b in line units from the image scanner 1 as an input, and receives the form a.
After detecting the tip of the
For each input line, the number j of white level dots for one line, which is information indicating the width of the form, is detected, and the skew amount measuring unit 9
, And sequentially output. Then, the skew amount measuring unit 9 measures the tilt information k based on the number j of white level dots for one line from the form width detecting unit 6 and sends it to the extracting operation correcting unit 7. The operation of measuring skew information of the form by the skew amount measuring unit 9 will be described.

【0010】まず、帳票幅検出部8から入力された一ラ
イン分の白レベルドット数jのライン毎の差分値を計算
する。次に、この差分値を、予め決められたライン数分
累積し、これを増加量とする。そして、増加量の平均値
avを求め、この平均値avを、予め決められたしきい
値と比較して、傾き情報kとする。例えば、傾き情報k
は、 傾きなし=av≧しきい値α ・・・(1) 傾き(中)=しきい値α>av≧しきい値β ・・・(2) 傾き(大)=av<しきい値β ・・・(3) となる。
First, the difference value for each line of the white level dot number j for one line input from the form width detection unit 8 is calculated. Next, this difference value is accumulated for a predetermined number of lines, and this is set as the increase amount. Then, the average value av of the increase amount is obtained, and this average value av is compared with a predetermined threshold value to obtain inclination information k. For example, the tilt information k
Is no slope = av ≧ threshold value α (1) Slope (middle) = threshold value α> av ≧ threshold value β (2) Slope (large) = av <threshold value β ... (3).

【0011】このようにして、スキュー量測定部9で得
られた傾き情報kに基づき、補正情報算出部3とアドレ
ス変換部5とからなる抽出動作補正部7は、補正情報算
出部3の動作を制御する。例えば、傾き情報kが、上述
の(1)の「傾きなし」の場合には、補正情報算出部3
の補正情報算出を行なわない。このことにより、帳票
が、正常にセットされ、傾きがない場合には、補正情報
算出部3の動作が不要となり、即座に、文字認識部6に
よる文字認識処理を行ない、高速に読み取り処理を行な
うことができる。また、スキュー量測定部9からの傾き
情報kにより、補正情報算出部3で、傾き状況に応じた
補正情報算出処理を行なうようにすることも可能であ
り、補正情報算出を、さらに、精度良く行なうことがで
きる。
In this way, the extraction operation correction unit 7 including the correction information calculation unit 3 and the address conversion unit 5 operates the correction information calculation unit 3 based on the tilt information k obtained by the skew amount measurement unit 9. To control. For example, when the tilt information k is “no tilt” in (1) above, the correction information calculation unit 3
Correction information is not calculated. As a result, when the form is set normally and there is no inclination, the operation of the correction information calculation unit 3 becomes unnecessary, the character recognition unit 6 immediately performs the character recognition process, and the reading process is performed at high speed. be able to. It is also possible that the correction information calculation unit 3 performs the correction information calculation processing according to the tilt state based on the tilt information k from the skew amount measurement unit 9, and the correction information calculation can be performed more accurately. Can be done.

【0012】次に、図2を用いて、帳票幅検出部8での
処理を説明する。図2は、図1における帳票幅検出部の
本発明に係わる処理動作の一実施例を示す説明図であ
る。本図は、図1の帳票幅検出部8が、図1のイメージ
スキャナ1からのライン単位のイメージデータにより、
一ライン分の白レベルドット数jを検出する様子を示す
ものである。X軸方向を主走査方向、Y軸方向を副走査
方向としたとき、第nラインの一ラインにおいて、予め
決められたしきい値を超えた画素を白レベル画素とし、
その総和を求め、第nラインの白レベルドット数とす
る。本実施例においては、第1ラインでの白レベルドッ
ト数は4で、以下、第2ラインでは12、第3ラインで
は21、第4ラインでは28、第5ラインでは34、第
6ラインでは36、そして、第7ラインと第8ラインで
は37となっており、図1のスキュー量測定部9によ
り、帳票が傾いているものとして測定される。
Next, the processing in the form width detecting section 8 will be described with reference to FIG. FIG. 2 is an explanatory diagram showing an embodiment of the processing operation according to the present invention of the form width detection unit in FIG. This figure shows that the form width detection unit 8 of FIG. 1 uses the image data of the line unit from the image scanner 1 of FIG.
It shows how to detect the white level dot number j for one line. When the X-axis direction is the main scanning direction and the Y-axis direction is the sub-scanning direction, in one line of the n-th line, a pixel exceeding a predetermined threshold value is a white level pixel,
The sum is calculated and used as the number of white level dots in the nth line. In this embodiment, the number of white level dots in the first line is 4, and hereinafter, 12 in the second line, 21 in the third line, 28 in the fourth line, 34 in the fifth line and 36 in the sixth line. .., and 37 on the 7th line and the 8th line, which is measured by the skew amount measuring unit 9 in FIG. 1 as if the document is inclined.

【0013】以上、図1、および、図2を用いて説明し
たように、本実施例の光学式文字読み取り装置では、帳
票幅検出部とスキュー量測定部とを設けることにより、
イメージメモリへ帳票イメージデータを書き込む過程
で、帳票の傾きを検出するようにしているので、詳細な
補正情報の算出を開始する前に、帳票が傾いていたか否
かを事前に知ることができる。このことにより、帳票の
傾きがない場合は、補正情報検出を行なわず、文字認識
処理を即座に開始することが可能となり、読み取り処理
全体を高速化させることができる。また、スキュー量測
定部からの傾き情報により、傾き状況に応じた補正情報
算出処理を行なうようにすれば、補正情報算出を精度良
く行なうことができる。尚、本発明は、図1、および、
図2を用いて説明した実施例に限定されるものではな
い。例えば、本実施例の帳票幅検出部では、帳票の幅を
検出するために、帳票による白レベルのドット数を用い
ているが、帳票外の黒レベルのドット数を用いても、ス
キュー量測定部で、帳票の傾きを測定することができ
る。
As described above with reference to FIGS. 1 and 2, the optical character reading apparatus of this embodiment is provided with the form width detecting section and the skew amount measuring section.
Since the inclination of the form is detected in the process of writing the form image data in the image memory, it is possible to know in advance whether the form is inclined before the calculation of the detailed correction information is started. As a result, when there is no inclination of the form, the correction information is not detected and the character recognition process can be started immediately, and the entire reading process can be speeded up. Further, if the correction information calculation processing according to the tilt situation is performed based on the tilt information from the skew amount measuring unit, the correction information calculation can be performed accurately. The present invention is based on FIG.
The present invention is not limited to the embodiment described with reference to FIG. For example, in the form width detection unit of the present embodiment, the number of dots of the white level according to the form is used to detect the width of the form, but the skew amount is measured even if the number of dots of the black level outside the form is used. The department can measure the inclination of the form.

【0014】[0014]

【発明の効果】本発明によれば、傾きが発生していない
帳票に対しては、詳細な補正情報算出処理を行なわず、
文字認識処理を即座に開始することにより、帳票の読み
取り処理を高速化し、光学式文字読み取り装置の性能を
向上させることが可能である。
According to the present invention, detailed correction information calculation processing is not performed on a form in which no inclination has occurred,
By starting the character recognition processing immediately, it is possible to speed up the processing of reading the form and improve the performance of the optical character reading device.

【0015】[0015]

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明を施した光学式文字読み取り装置の本発
明に係わる構成の一実施例を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a configuration according to the present invention of an optical character reading device according to the present invention.

【図2】図1における帳票幅検出部の本発明に係わる処
理動作の一実施例を示す説明図である。
2 is an explanatory diagram showing an example of a processing operation according to the present invention of a form width detection unit in FIG. 1. FIG.

【図3】従来の光学式文字読み取り装置の構成を示すブ
ロック図である。
FIG. 3 is a block diagram showing a configuration of a conventional optical character reading device.

【符号の説明】[Explanation of symbols]

1 イメージスキャナ 2 イメージメモリ 3 補正情報算出部 4 アドレス発生部 5 アドレス変換部 6 文字認識部 7 抽出動作補正部 8 帳票幅検出部 9 スキュー量測定部 a 帳票 b ライン単位のイメージデータ c ページイメージ d フォーマット定義情報 e 補正パラメタ f 読み出しアドレス g アドレスを変換した読み出しアドレス h 文字イメージ i 認識結果 j 一ライン分の白レベルドット数 k 傾き情報 1 image scanner 2 image memory 3 correction information calculation unit 4 address generation unit 5 address conversion unit 6 character recognition unit 7 extraction operation correction unit 8 form width detection unit 9 skew amount measurement unit a form b image data in line units c page image d Format definition information e Correction parameter f Read address g Read address converted address h Character image i Recognition result j White level dot number for one line k Tilt information

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 文字読み取り処理の対象となる帳票を光
学的に走査して、ライン単位のイメージデータを出力す
るイメージスキャナと、該イメージスキャナからのイメ
ージデータを格納するイメージメモリと、該イメージメ
モリに格納したイメージデータから文字単位のイメージ
データを抽出する文字イメージデータ抽出手段と、上記
イメージメモリに格納したイメージデータに基づき、上
記帳票の傾きと位置ずれを算出して、上記文字イメージ
データ抽出手段の文字単位のイメージデータの抽出動作
を補正する抽出動作補正手段と、該抽出動作補正手段の
補正動作に基づき、上記文字イメージデータ抽出手段が
上記イメージメモリから抽出した文字単位のイメージデ
ータを基に、文字を識別する文字認識手段とを備えた光
学式文字読み取り装置において、上記イメージスキャナ
が出力するライン単位のイメージデータを用いて、ライ
ン単位で帳票の幅を検出する帳票幅検出手段と、該帳票
幅検出手段が検出するライン単位の帳票の幅の変化に基
づき、上記抽出動作補正手段による上記イメージメモリ
に格納したイメージデータを用いた帳票の傾きと位置ず
れの算出動作の前に、帳票の傾きを測定するスキュー量
測定手段とを設け、該スキュー量測定手段の測定結果に
基づき、上記抽出動作補正手段の帳票の傾きと位置ずれ
の算出動作を制御することを特徴とする光学式文字読み
取り装置。
1. An image scanner for optically scanning a form to be subjected to a character reading process to output image data in units of lines, an image memory for storing image data from the image scanner, and the image memory. Character image data extracting means for extracting character-by-character image data from the image data stored in the image data, and the character image data extracting means for calculating the inclination and displacement of the form based on the image data stored in the image memory. Based on the image data in character units extracted from the image memory by the character image data extraction means based on the correction operation of the extraction operation correction means for correcting the extraction operation of the image data in character units , An optical character reader equipped with character recognition means for identifying characters In the above arrangement, using the line-by-line image data output by the image scanner, a form width detection means for detecting the width of the form in line units and a change in the width of the form in line units detected by the form width detection means are used. Based on the above, the skew amount measuring means for measuring the inclination of the form is provided before the operation of calculating the inclination and the positional deviation of the form using the image data stored in the image memory by the extraction operation correcting means, and the skew amount is measured. An optical character reading device, characterized in that, based on a measurement result of the means, the operation of calculating the inclination and position shift of the form of the extraction operation correcting means is controlled.
【請求項2】 請求項1に記載の光学式文字読み取り装
置において、上記帳票幅検出手段は、上記イメージスキ
ャナが出力するライン単位のイメージデータから、一ラ
イン分毎の白レベルもしくは黒レベルのいずれか一方の
ドット数を順次に検出し、上記スキュー量測定手段は、
該帳票幅検出手段が順次に検出する一ライン分のドット
数の変化に基づき、帳票の傾きを測定することを特徴と
する光学式文字読み取り装置。
2. The optical character reading device according to claim 1, wherein the form width detecting means selects either a white level or a black level for each line from the image data output from the image scanner in line units. The number of dots on one side is sequentially detected, and the skew amount measuring means is
An optical character reading device characterized in that the inclination of a form is measured based on a change in the number of dots for one line, which the form width detecting means sequentially detects.
JP4023105A 1992-02-10 1992-02-10 Optical character reader Pending JPH05225381A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4023105A JPH05225381A (en) 1992-02-10 1992-02-10 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4023105A JPH05225381A (en) 1992-02-10 1992-02-10 Optical character reader

Publications (1)

Publication Number Publication Date
JPH05225381A true JPH05225381A (en) 1993-09-03

Family

ID=12101188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4023105A Pending JPH05225381A (en) 1992-02-10 1992-02-10 Optical character reader

Country Status (1)

Country Link
JP (1) JPH05225381A (en)

Similar Documents

Publication Publication Date Title
JPS63158678A (en) Inter-word space detecting method
JPH05225381A (en) Optical character reader
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JPH06131495A (en) Image information extraction system
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JP2581809B2 (en) Character extraction device
US20220335738A1 (en) Image processing system, image processing method, and storage medium
JP2725859B2 (en) Character line detection method
JPS6343788B2 (en)
JPH11250179A (en) Character reocognition device and its method
JP2747136B2 (en) Character recognition device
JP2865611B2 (en) Character feature extraction method and device, and character recognition method and device
JP2863671B2 (en) Print format creation device
JPH0465787A (en) Image reader
JP3356819B2 (en) Mark recognition device
JP2023021595A (en) Image processing device, image processing system, image processing method, and program
JPS62200486A (en) Character reader
JPH05314311A (en) Optical character reader
JPH05174179A (en) Document image processor
JPS59206987A (en) Letter recognizing device
JPH08123872A (en) Optical character reader
JPH09153111A (en) Optical character reader
JPS62279482A (en) Character recognizing device
JPH04299652A (en) Image reader
JPH04223584A (en) Optical character reader