JPH07296108A - Method and device for recognizing character - Google Patents

Method and device for recognizing character

Info

Publication number
JPH07296108A
JPH07296108A JP6085063A JP8506394A JPH07296108A JP H07296108 A JPH07296108 A JP H07296108A JP 6085063 A JP6085063 A JP 6085063A JP 8506394 A JP8506394 A JP 8506394A JP H07296108 A JPH07296108 A JP H07296108A
Authority
JP
Japan
Prior art keywords
frame
character
image data
recognized
recognizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6085063A
Other languages
Japanese (ja)
Inventor
Kenji Araki
賢治 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6085063A priority Critical patent/JPH07296108A/en
Publication of JPH07296108A publication Critical patent/JPH07296108A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide the character recognizing method with which described data can be recognized even without using any dedicated OCR paper and a format change accompanying the change of a described data item can be easily performed at low cost. CONSTITUTION:This device is composed of an image data input part 21, picture element deciding part 22 for deciding white and black picture elements for each line of inputted image data, black picture element counter 23 for counting the number of black picture elements in the line in a prescribed direction, black picture element comparing part 24 for comparing the amount of prescribed continued black picture elements with the value of the black picture element counter 23, frame recognizing part 26 for deciding whether the scanned lines express a frame or not according to the result of the black picture element comparing part 24, and character recognizing part 27 for recognizing the characters described inside that frame.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字認識方法及び文字
認識装置に係り、特に、シートに記載されている枠を検
出し、枠内の文字を認識する文字認識方法及び文字認識
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition method and a character recognition apparatus, and more particularly to a character recognition method and a character recognition apparatus for detecting a frame described on a sheet and recognizing a character within the frame.

【0002】通常は、所定のOCR記入用紙上の記入欄
を業務のパターンに合わせて設計し印刷業者に発注して
いるが、このOCR記入用紙は高価であるため、ワード
プロセッサ等の通常の印字装置を用いて、普通紙をデー
タの登録用紙として利用する方法が望まれている。
Normally, the entry fields on a predetermined OCR entry sheet are designed according to the business pattern and ordered from a printing company. However, since this OCR entry sheet is expensive, it is a normal printing device such as a word processor. There is a demand for a method of using plain paper as a data registration paper by using.

【0003】[0003]

【従来の技術】図10は、従来の文字認識処理を説明す
るための図である。同図に示す画像データがOCRシー
トに記入され、ファクシミリ通信により入力された画像
データを認識する例を示す。予め、“A,B,C,D”
が記入されているフィールドは、用紙の左端よりn、上
端よりmの位置に設定されている箇所を走査する、
“1”が記入されているフィールドは、用紙の左端より
r、上端よりoの位置から走査するようにOCR定義情
報が設定される。このように、同図に示すパターンの画
像データが入力された場合には、予め設定された位置を
走査して、所定の位置に記述されている文字を認識す
る。なお、同図では、枠を示しているが、実際には、フ
ァクシミリ送信された画像データ上には、枠はドロップ
アウトするために出力されない。
2. Description of the Related Art FIG. 10 is a diagram for explaining a conventional character recognition process. An example is shown in which the image data shown in the figure is written on an OCR sheet and the image data input by facsimile communication is recognized. In advance, "A, B, C, D"
In the field marked with, scan the location set at n from the left edge of the paper and m from the top edge,
In the field in which "1" is entered, the OCR definition information is set so that scanning is performed from the position r from the left end of the sheet and o from the upper end. In this way, when the image data of the pattern shown in the figure is input, the preset position is scanned and the character described at the predetermined position is recognized. Although a frame is shown in the figure, the frame is not actually output on the image data transmitted by facsimile because the frame is dropped out.

【0004】また、用紙が傾斜していたりすると正確な
枠の位置が認識できないため、補正マーク等を用いて位
置決めし、走査する方法が用いられる。
Further, if the paper is tilted, the position of the frame cannot be accurately recognized, so a method of positioning and scanning using a correction mark or the like is used.

【0005】これらの方法を用いて文字を走査する場合
を説明する。図11は、従来のOCR認識及び補正手順
を説明するための図である。 まず、ファクシミリマーク200とファクシミリ補正
マーク300により入力された画像データの縦方向の補
正を行う。 次に、OCR定義情報により文字認識位置を決める。 aのフィールドを文字認識する場合、まず、OCR定
義情報により、aの定義情報(開始位置、長さ)を取得
し、文字認識位置を決定する。この場合には、座標位置
(2,3)に位置付けされる。 次に、文字認識開始位置から指定された長さ分、決め
られた文字枠の大きさに対して機械的に順番に文字認識
処理を行う。
The case of scanning characters using these methods will be described. FIG. 11 is a diagram for explaining a conventional OCR recognition and correction procedure. First, the vertical correction of the image data input by the facsimile mark 200 and the facsimile correction mark 300 is performed. Next, the character recognition position is determined by the OCR definition information. When character-recognizing the field a, first, the definition information (start position, length) of a is acquired from the OCR definition information, and the character recognition position is determined. In this case, it is positioned at the coordinate position (2, 3). Next, the character recognition processing is mechanically performed in order for the specified length of the character frame from the character recognition start position.

【0006】上記の処理をOCR定義情報内の全てのフ
ィールドに対して行う。
The above processing is performed for all fields in the OCR definition information.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上記従
来の文字認識方法は、予めOCR定義情報により走査す
るフィールドを定義しておき、その情報に基づいて認識
処理を行うため、業務内容の変更等によりOCRの記入
データ項目の変更がある場合に、OCR定義情報も変更
しなければならない。また、記入データ項目の変更に伴
って、OCR記入用紙を印刷業者に発注しなければなら
ない。このOCR記入用紙は、記入欄の印刷等が特殊印
刷のために、コストが高いという問題もある。
However, in the above-described conventional character recognition method, the field to be scanned is defined in advance by the OCR definition information, and the recognition process is performed based on the information, so that the contents of the work may be changed. When the OCR entry data item is changed, the OCR definition information must be changed. Also, the OCR entry form must be ordered from the printing company as the entry data items are changed. This OCR entry sheet also has a problem that the cost is high because the printing of entry fields is special printing.

【0008】本発明は、上記の点に鑑みなされたもの
で、従来の問題点を解決し、専用のOCR用紙を用いな
くとも記入されているデータが認識でき、記入データ項
目の変更に伴う形式変更が容易に、しかも低価格で実現
することができる文字認識装置及び文字認識方法を提供
することを目的とする。
The present invention has been made in view of the above points, solves the problems of the prior art, and can recognize the entered data without using a dedicated OCR sheet, the format accompanying the change of the entered data items. An object of the present invention is to provide a character recognition device and a character recognition method that can be easily changed at low cost.

【0009】本発明の更なる目的は、当該特定の枠が検
出され、当該枠内に記載された文字を任意の処理に使用
できる文字認識装置及び文字認識方法を提供することで
ある。
A further object of the present invention is to provide a character recognition device and a character recognition method capable of detecting the specific frame and using the characters described in the frame for arbitrary processing.

【0010】[0010]

【課題を解決するための手段】本発明は、入力された画
像データの特定の枠内に記入されている文字を走査して
認識する場合において、予め読み取る位置及び長さを定
義せずに、画像データを走査し、黒画素の並びが所定の
値以上であり、かつ黒画素の並びが枠を構成しているれ
ば、特定の枠と認識し、特定の枠内に記入されている文
字を認識する。
The present invention, when scanning and recognizing a character written in a specific frame of input image data, does not define a position and a length to be read in advance, When the image data is scanned and the black pixel arrangement is more than a predetermined value and the black pixel arrangement constitutes a frame, it is recognized as a specific frame, and the characters entered in the specific frame are recognized. Recognize.

【0011】本発明の文字認識方法は、入力されたイメ
ージデータの特定の枠内に記入されている文字または、
記号の認識方法において、イメージデータを操作して、
所定の画素の並びが特定の枠を構成している部分を認識
し、認識した特定の枠内の画素を特定の枠内に記入され
た文字または記号として認識する。
The character recognition method of the present invention is a method of inputting characters or characters entered in a specific frame of image data,
In the symbol recognition method, operate the image data,
A portion in which a predetermined arrangement of pixels constitutes a specific frame is recognized, and the recognized pixel in the specific frame is recognized as a character or a symbol written in the specific frame.

【0012】また、本発明の文字認識方法は、入力され
たイメージデータの特定の枠内に記入された文字また
は、記号に基づいて任意の処理を行わせるイメージデー
タ処理方法において、イメージデータを操作して所定の
画素の並びが特定の枠を構成している部分を認識し、認
識した特定の枠内の画素を特定の枠内に記入された文字
として認識し、認識した特定枠の出現順位と、認識した
枠内の文字に基づいて、任意の処理を行う。
Further, the character recognition method of the present invention operates the image data in the image data processing method in which arbitrary processing is performed based on the characters or symbols written in a specific frame of the input image data. Recognize the part where the predetermined pixel arrangement constitutes a specific frame, recognize the pixels in the recognized specific frame as the characters written in the specific frame, and the appearance order of the recognized specific frame Then, arbitrary processing is performed based on the recognized characters in the frame.

【0013】また、本発明の文字認識装置は、入力され
たイメージデータの特定の枠内に記入された文字の認識
を行う文字認識装置において、イメージデータを走査し
て所定の画素の並びが特定の枠を構成している部分を認
識する枠認識手段と、枠認識手段で認識した特定の枠内
の画素を特定の枠内に記入された文字として認識する文
字認識手段とを有する。
Further, the character recognition device of the present invention is a character recognition device for recognizing a character entered in a specific frame of input image data, by scanning the image data to specify a predetermined pixel arrangement. The frame recognizing means for recognizing the portion forming the frame and the character recognizing means for recognizing the pixels in the specific frame recognized by the frame recognizing means as the characters written in the specific frame.

【0014】また、本発明の文字認識装置は、入力され
たイメージデータの特定の枠内に記入された文字に基づ
いて任意の処理を行うイメージデータ処理装置におい
て、イメージデータを走査して所定の画素の並びが該特
定の枠を構成している部分を認識する枠認識手段と、枠
認識手段で認識した特定の枠内の画素を該特定の枠内に
記入された文字として認識する文字認識手段と、枠認識
手段で認識した枠の出現順位と、文字認識手段で認識し
た枠内の文字とに基づいて、任意の処理を行う処理手段
とを有する。
Further, the character recognition apparatus of the present invention is an image data processing apparatus which performs an arbitrary process based on a character entered in a specific frame of input image data, and scans the image data to determine a predetermined value. Frame recognition means for recognizing a portion in which the arrangement of pixels constitutes the specific frame, and character recognition for recognizing pixels in the specific frame recognized by the frame recognition means as characters written in the specific frame And a processing unit that performs an arbitrary process based on the appearance order of the frame recognized by the frame recognition unit and the characters in the frame recognized by the character recognition unit.

【0015】[0015]

【作用】本発明は、予めOCR定義情報のように走査位
置を設定しておかなくとも、ワードプロセッサ等で、文
字を記入する枠を設け、利用者はその記入枠にデータを
記入する。そして、スキャナ等で走査時に所定の数以上
の黒画素数が連続する横軸、縦軸を判定し、その部分が
文字が記入されている文字枠であることを認識し、その
文字枠内に記入されている文字を読み取ることで、デー
タが認識できる。従って、特殊なインク等で印刷された
OCR専用紙を用いなくとも、ファクシミリ送信の際
に、利用者自身または、ワードプロセッサ等により、デ
ータを記入するための文字枠を印刷し、その枠内にデー
タを記入して、ファクシミリ送信する。受信側では、こ
の画像データの文字枠フィールドを走査することで、記
入されているデータを読み込むことができる。
According to the present invention, even if the scanning position is not set in advance like the OCR definition information, a frame for writing characters is provided by a word processor or the like, and the user writes data in the writing frame. Then, when scanning with a scanner or the like, the horizontal axis and the vertical axis where a predetermined number or more of black pixels are continuous are determined, and it is recognized that the part is a character frame in which a character is written, and within that character frame The data can be recognized by reading the written characters. Therefore, even if the OCR dedicated paper printed with special ink is not used, the character frame for entering the data is printed by the user or the word processor etc. at the time of facsimile transmission, and the data is written in the frame. Fill in and send by fax. On the receiving side, the written data can be read by scanning the character frame field of this image data.

【0016】さらに、特定の枠内に記載されている文字
や記号等を定義することによりアプリケーションプログ
ラム等種々の処理に利用することが可能となる。
Further, by defining the characters, symbols, etc. described in a specific frame, it becomes possible to use them for various processes such as application programs.

【0017】[0017]

【実施例】以下、図面とともに本発明の実施例を詳細に
説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0018】図1は、本発明の一実施例のシステム構成
を示す。同図に示すシステムは、ワードプロセッサで普
通紙に作成された記入シートに利用者がデータを書込
み、送信側のファクシミリ装置10により送信し、ファ
クシミリ装置10から受け取った、画像データの文字枠
を認識して、その枠内に記入されている文字を認識装置
20で文字認識するものである。なお、以下、枠内に記
入されている文字と表示するが、単なるマーク(記号)
も含まれる。
FIG. 1 shows the system configuration of an embodiment of the present invention. The system shown in the figure recognizes the character frame of the image data received from the facsimile machine 10 by the user writing the data on the entry sheet created on the plain paper by the word processor, transmitting the data by the facsimile machine 10 on the transmitting side. The recognition device 20 recognizes the characters entered in the frame. In addition, hereinafter, the characters written in the frame are displayed, but they are simply marks.
Is also included.

【0019】認識装置20は、画像データを走査するス
キャナ等の画像データ入力部21、入力された画像デー
タのライン毎の白画素及び黒画素を判定する画素判定部
22、所定の方向のラインの黒画素数を計数する黒画素
カウンタ23、ワークエリア25に格納されている所定
の黒画素の連続量と黒画素カウンタ23の値を比較する
黒画素比較部24、黒画素比較部24の結果により走査
したラインが枠を表しているか否かを判定する枠認識部
26、枠認識部26で枠を表していると判定された場合
に、その枠内に記入されている文字を認識する文字認識
部27より構成される。
The recognition device 20 includes an image data input unit 21 such as a scanner for scanning image data, a pixel determination unit 22 for determining white pixels and black pixels for each line of the input image data, and a line in a predetermined direction. According to the results of the black pixel counter 23 that counts the number of black pixels, the black pixel comparison unit 24 that compares the value of the black pixel counter 23 with the predetermined continuous amount of black pixels stored in the work area 25, and the result of the black pixel comparison unit 24. A frame recognition unit 26 that determines whether or not the scanned line represents a frame, and a character recognition that recognizes a character entered in the frame when the frame recognition unit 26 determines that the line represents a frame. It is composed of a section 27.

【0020】図2は、本発明の一実施例の文字認識を説
明するための図である。従来と異なり、行マークは不要
である。 まず、ファクシミリマーク200とファクシミリ補正
マーク300により入力された画像データの縦方向の補
正を行う。 画像データから文字認識フィールド(黒枠)を黒画素
の連続量により検出する。 X方向からY方向へ順次文字枠(黒枠)の有無を検索
し、存在した場合は、該当フィールド(黒枠)に対し、
文字認識処理を行う。 画像情報上に文字枠がなくなるまで上記のの処理を
行う。
FIG. 2 is a diagram for explaining character recognition according to an embodiment of the present invention. Unlike the conventional method, the line mark is unnecessary. First, the vertical correction of the image data input by the facsimile mark 200 and the facsimile correction mark 300 is performed. The character recognition field (black frame) is detected from the image data by the continuous amount of black pixels. The presence or absence of a character frame (black frame) is searched in order from the X direction to the Y direction.
Performs character recognition processing. The above processing is performed until there is no character frame on the image information.

【0021】図3は、本発明の一実施例の文字認識フィ
ールド検出動作の概要を示すフローチャートであり、図
4は、本発明の一実施例の走査方向を示す。
FIG. 3 is a flow chart showing the outline of the character recognition field detecting operation of the embodiment of the present invention, and FIG. 4 shows the scanning direction of the embodiment of the present invention.

【0022】ステップ1)最初に入力された画像データ
をイメージ展開する。
Step 1) The image of the first input image data is expanded.

【0023】ステップ2)画像データ中フィールドデー
タの走査が終了したら処理を終了する。
Step 2) When the scanning of the field data in the image data is completed, the processing is completed.

【0024】ステップ3)画像データのフィールドデー
タで黒画素を検出した場合に、まず、X軸をb方向に走
査し、黒画素を検出する毎に、黒画素の連続量をカウン
トする。
Step 3) When a black pixel is detected in the field data of the image data, first, the X axis is scanned in the b direction, and the continuous amount of black pixels is counted every time the black pixel is detected.

【0025】ステップ4)カウントされているX軸方向
bに走査したときに検出された連続した黒画素数と所定
の値を比較する。
Step 4) The number of consecutive black pixels detected when scanning in the X-axis direction b being counted is compared with a predetermined value.

【0026】ステップ5)比較した結果、所定の数以上
であれば、X軸方向に連続していると判定し、次に、当
該X軸に連続するY軸方向cのラインを走査する。上記
と同様に、Y軸方向cに黒画素を検出する毎に、Y軸方
向cの黒画素の連続量をカウントする。
Step 5) As a result of the comparison, if it is equal to or more than a predetermined number, it is determined to be continuous in the X-axis direction, and then the line in the Y-axis direction c continuous to the X-axis is scanned. Similar to the above, every time a black pixel is detected in the Y-axis direction c, the continuous amount of black pixels in the Y-axis direction c is counted.

【0027】ステップ6)ここで、カウントされたY軸
方向bに走査したときに検出された黒画素数と所定の値
を比較する。
Step 6) Here, the number of black pixels detected when scanning in the counted Y-axis direction b is compared with a predetermined value.

【0028】ステップ7)比較した結果、所定の数以上
であれば、Y軸方向cに連続していると判定し、当該Y
軸に連続するX軸を方向dを走査する。上記と同様に、
X軸の方向dに走査し、黒画素を検出する毎にX軸方向
dの黒画素の連続量をカウントする。
Step 7) As a result of the comparison, if the number is equal to or more than a predetermined number, it is determined that they are continuous in the Y-axis direction c, and the Y
The X axis, which is continuous with the axis, is scanned in the direction d. Similar to the above,
The scanning is performed in the X-axis direction d, and the continuous amount of black pixels in the X-axis direction d is counted every time a black pixel is detected.

【0029】ステップ8)カウントされているX軸方向
dに走査したときに検出された黒画素数と所定の値を比
較する。
Step 8) The number of black pixels detected when scanning in the counted X-axis direction d is compared with a predetermined value.

【0030】ステップ9)比較した結果、所定の黒画素
数以上であれば、X軸方向dに連続していると判定し、
当該X軸に連続するY軸eを走査する。上記と同様に、
Y軸方向eに黒画素を検出する毎にY軸方向eの黒画素
の連続量をカウントする。
Step 9) As a result of the comparison, if the number of black pixels is equal to or more than a predetermined number, it is determined that they are continuous in the X-axis direction d,
The Y-axis e which is continuous with the X-axis is scanned. Similar to the above,
Every time a black pixel is detected in the Y-axis direction e, the continuous amount of black pixels in the Y-axis direction e is counted.

【0031】ステップ10)上記の処理において、2方
向のX軸及び2方向のY軸が全て連続している場合に
は、読み取りフィールドを確定し、当該フィールド内に
記入してある文字を読み取る。
Step 10) In the above process, when the X-axis in the two directions and the Y-axis in the two directions are all continuous, the reading field is determined and the character written in the field is read.

【0032】ステップ11)読み取られた文字の認識処
理を行う。
Step 11) The recognition processing of the read character is performed.

【0033】次に、X軸及びY軸を走査し、画素数をカ
ウントする例を説明する。図5は、本発明の一実施例の
黒画素のカウントを取る例を示す。同図において、予め
設定される黒画素連続量は、3ビットとし、“1”は黒
画素を示し、“0”は白画素を示す。従って、少なくと
も3ビットの黒画素が連続していない場合には、文字枠
とは判定しないもとのとする。
Next, an example of scanning the X-axis and the Y-axis and counting the number of pixels will be described. FIG. 5 shows an example of counting black pixels according to an embodiment of the present invention. In the figure, the preset black pixel continuous amount is 3 bits, "1" indicates a black pixel, and "0" indicates a white pixel. Therefore, if at least 3 bits of black pixels are not continuous, it is determined not to be a character frame.

【0034】なお、カウントは、黒画素が連続する間
は、インクリメントし、不連続状態になった場合に、ゼ
ロクリアする。
The count is incremented while the black pixels are continuous, and is zero-cleared in the case of a discontinuous state.

【0035】このとき、同図(A)において、X軸の方
向bのビット配列は、 “11110111” であり、黒画素連続量は4ビット、3ビットであり、所
定の連続量と同値またはそれ以上であるので、連続して
いると判定される。Y軸の方向cのビット配列は、 “1110111101” であり、黒画素連続量は3ビット、4ビットであり、所
定の連続量と同値またはそれ以上であるので、連続して
いると判定される。X軸の方向dのビット配列は、 “11101111” であり、黒画素連続量は3ビット、4ビットであり、所
定の連続量と同値またはそれ以上であるので、連続して
いると判定される。Y軸の方向eのビット配列は、 “111110111” であり、黒画素連続量は5ビット、3ビットであるの
で、連続していると判定される。従って、同図(A)に
示すフィールドは、文字枠であると認識される。
At this time, in FIG. 9A, the bit arrangement in the direction b of the X axis is "11110111", and the black pixel continuous amount is 4 bits or 3 bits, which is equal to or equal to the predetermined continuous amount. Since it is above, it is determined that they are continuous. The bit arrangement in the direction c of the Y-axis is “1110111101”, and the black pixel continuous amount is 3 bits or 4 bits, which is equal to or larger than the predetermined continuous amount, so that it is determined to be continuous. . The bit arrangement in the direction d of the X axis is “11101111”, and the continuous black pixel amount is 3 bits or 4 bits, which is equal to or larger than the predetermined continuous amount, and thus is determined to be continuous. . The bit array in the direction e of the Y-axis is “111110111”, and the black pixel continuous amount is 5 bits and 3 bits, so it is determined that the black pixels are continuous. Therefore, the field shown in FIG. 9A is recognized as a character frame.

【0036】同図(B)において、X軸の方向bのビッ
ト配列は、 “01101111” であり、黒画素連続量は2ビット、4ビットであり、所
定の連続量より多いので、連続していると判定される。
Y軸の方向cのビット配列は、 “1100111011” であり、黒画素連続量は2ビット、3ビット、2ビット
であり、所定の連続量と同値である連続値があるので連
続していると判定される。X軸の方向dのビット配列
は、 “11100011” であり、黒画素連続量は3ビット、2ビットであり、所
定の連続量と同値の連続量があるので連続していると判
定される。Y軸の方向eのビット配列は、 “1011100110” であり、黒画素連続量は3ビット、2ビットであるので
所定の連続量と同値の連続量があるので、連続している
と判定される。従って、同図(B)に示すフィールド
は、上記の(A)より連続しているビット数が少ない
が、所定の連続量以上の連続するビット数があるので、
文字枠であると認識される。
In FIG. 7B, the bit arrangement in the direction b of the X axis is "01101111", and the continuous black pixel amount is 2 bits or 4 bits, which is larger than the predetermined continuous amount, so that the continuous black pixels are continuously generated. It is determined that
The bit arrangement in the direction c of the Y axis is “1100111011”, the black pixel continuous amount is 2 bits, 3 bits, and 2 bits, and there is a continuous value that is the same value as the predetermined continuous amount, so that it is continuous. To be judged. The bit arrangement in the direction d of the X-axis is “1110011”, the black pixel continuous amount is 3 bits and 2 bits, and since there is a continuous amount having the same value as the predetermined continuous amount, it is determined to be continuous. The bit arrangement in the direction e of the Y-axis is “1011100110”, and since the black pixel continuous amount is 3 bits and 2 bits, there is a continuous amount of the same value as the predetermined continuous amount, so it is determined to be continuous. . Therefore, in the field shown in FIG. 6B, the number of consecutive bits is smaller than that in the above-mentioned (A), but since there is a number of consecutive bits equal to or more than a predetermined continuous amount,
Recognized as a character frame.

【0037】同図(C)において、X軸の方向bのビッ
ト配列は、 “10110010” であり、黒画素連続量は2ビットしかないため、この時
点でこのX軸の方向bの黒画素の並びは、連続していな
いと判定され、文字枠とは認識されない。
In FIG. 7C, the bit array in the direction b of the X axis is "10110010", and since the continuous amount of black pixels is only 2 bits, the black pixels in the direction b of the X axis at this point. The line is determined not to be continuous and is not recognized as a character frame.

【0038】また、他の実施例として、文字枠が点線で
印刷されている場合には、所定の連続量を有するパター
ンの繰り返しがあるかどうかを判定する方法もある。図
6は、本発明の他の実施例の文字枠が点線である場合を
示す。例えば、所定の黒画素の連続量及び白画素の連続
量を2ビットずつとする。即ち、“1100”または
“0011”である場合には、黒画素のみが連続してい
なくとも点線で囲まれた文字枠として認識することも可
能である。例えば、この場合のカウントは、“110
0”または“0011”が出現したときにカウントをと
り、最低2組のパターンが出現した場合に点線で囲まれ
た文字枠とする。同図の例において、X軸のb方向の走
査において、ビット配列は、 “1100001101” であり、“1100”、“0011”があるため、点線
と判定する。次にY軸のc方向の走査において、ビット
配列は、 “1100011001” であり、“1100”“1100”があるため、X軸b
方向に連続する点線と判定する。X軸d方向の走査にお
いて、ビット配列は、 “11000011001” であり、“1100”“0011”があるため、Y軸c
方向に連続する点線と判定する。Y軸e方向の走査にお
いて、ビット配列は、 “1100100111” であり、“1100”、“0011”があるのでX軸d
方向に連続する点線と判定する。
As another embodiment, there is also a method of determining whether or not a pattern having a predetermined continuous amount is repeated when a character frame is printed with a dotted line. FIG. 6 shows a case where the character frame of another embodiment of the present invention is a dotted line. For example, the continuous amount of predetermined black pixels and the continuous amount of white pixels are set to 2 bits each. That is, in the case of "1100" or "0011", it is possible to recognize as a character frame surrounded by a dotted line even if only black pixels are not continuous. For example, the count in this case is "110.
When "0" or "0011" appears, the count is performed, and when at least two patterns appear, the character frame is surrounded by a dotted line. In the example of FIG. The bit array is “1100001101”, and there are “1100” and “0011”, so it is determined to be a dotted line.Next, in the scanning in the c direction of the Y axis, the bit array is “1100011001” and “1100”. Since there is "1100", X axis b
Judge as a dotted line continuous in the direction. In the scanning in the X-axis d direction, the bit array is “11000011001” and there are “1100” and “0011”, so that the Y-axis c
Judge as a dotted line continuous in the direction. In scanning in the Y-axis e direction, the bit array is "1100100111", and there are "1100" and "0011", so the X-axis d
Judge as a dotted line continuous in the direction.

【0039】また、上記において、単に黒画素の連続量
が2ビット以上と指定してもよい。さらに、ビットの連
続パターンを数種類設定してもよい。図6の例におい
て、ビット1がたっている部分は、黒画素であるので、
上記の“1100”、“0011”は4ビット単位で区
切ったが、nビット単位で区切ってパターンが出現する
回数により文字枠を判定してもよい。例えば、3ビット
づつ区切ると、“111”、“111”、“110”、
“100”、“011”、“001”が出現した場合に
は、点線で囲まれた文字枠と判定することも可能であ
る。
Further, in the above description, the continuous amount of black pixels may simply be designated as 2 bits or more. Further, several kinds of bit continuous patterns may be set. In the example of FIG. 6, since the part where bit 1 stands is a black pixel,
The above "1100" and "0011" are divided in 4-bit units, but the character frame may be determined by dividing the n-bit units and the number of times the pattern appears. For example, when divided into 3 bits, "111", "111", "110",
When "100", "011", and "001" appear, it is possible to determine that the character frame is surrounded by a dotted line.

【0040】なお、上記の実施例において、連続する黒
画素数をカウントする場合に時計回りに、枠の各辺を走
査したが、いずれの辺を起点としてどの方向に走査する
かは任意である。
In the above embodiment, when counting the number of consecutive black pixels, each side of the frame was scanned clockwise, but which side is the starting point and in which direction the scanning is optional. .

【0041】さらに、黒画素の連続または不連続状態を
検出するためにパリティチェックを用いてもよい。
Further, a parity check may be used to detect the continuous or discontinuous state of black pixels.

【0042】さらに、図8は、本発明の第2の実施例を
説明するための図である。
Further, FIG. 8 is a diagram for explaining the second embodiment of the present invention.

【0043】本実施例は、上記の実施例において、特定
の枠が検出され、その枠を定義して枠内のデータをコー
ド変換データとして扱う。これにより、認識された文字
枠内に文字データをアプリケーションプログラムで定義
された一意名で用いることが可能である。同図に示すの
は、発注伝票と、当該発注伝票の各枠に記入されている
データが編集された状態を示す。
In this embodiment, in the above embodiment, a specific frame is detected, the frame is defined, and the data in the frame is treated as code conversion data. As a result, it is possible to use the character data within the recognized character frame with the unique name defined by the application program. The figure shows an ordering slip and a state in which the data entered in each frame of the ordering slip is edited.

【0044】図9は、本発明の第2の実施例の認識後に
編集されるまでの動作を示すフローチャートである。以
下のフローチャートの動作を上記の図8の例に基づいて
説明する。
FIG. 9 is a flow chart showing the operation of the second embodiment of the present invention until the editing after the recognition. The operation of the following flowchart will be described based on the example of FIG.

【0045】最初に検索された3個の枠を品名コードと
対応させ、次に検索された3個の枠を数量と対応付ける
(ステップ101)。
The three retrieved frames are associated with the product name code, and the three retrieved frames are associated with the quantity (step 101).

【0046】次に、認識された結果が入力され(ステッ
プ102)、認識項目が英数字項目か、数値項目かを判
定し(ステップ103)、品名は英数字項目であるの
で、品名コードで品名テーブルを検索し(ステップ10
4)、合致している品名コードが存在しているかを判断
し、存在している場合には(ステップ105)、当該品
名テーブルから品名を取得する(ステップ106)。
Next, the recognition result is input (step 102), it is judged whether the recognition item is an alphanumeric item or a numeric item (step 103), and the product name is an alphanumeric item. Search the table (step 10
4) It is determined whether a matching product name code exists, and if it exists (step 105), the product name is obtained from the product name table (step 106).

【0047】また、認識項目が数値項目の場合には(ス
テップ103)、ニューメリックチェックを行い(ステ
ップ107)、エラーがない場合には、当該数値項目の
数値を取得し(ステップ108)、品名と共に1レコー
ド分のデータを編集する(ステップ109)。上記の処
理を最終行まで行い、最終行の処理が終了したら、品目
数、発注数量合計等の集計処理を行い、データ編集を終
了する(ステップ111)。
If the recognition item is a numeric item (step 103), a numeric check is performed (step 107). If there is no error, the numeric value of the numeric item is acquired (step 108) and the product name is entered. The data for one record is edited (step 109). The above process is performed up to the last line, and when the process of the last line is completed, the total number of items, the total of the ordered quantity, etc. are calculated, and the data editing is completed (step 111).

【0048】本発明は、上記の実施例に限定されること
なく、特許請求の範囲内において、種々応用、変更が可
能である。
The present invention is not limited to the above-described embodiments, and various applications and modifications are possible within the scope of the claims.

【0049】[0049]

【発明の効果】上述のように本発明によれば、黒画素の
連続量をカウントし、所定の値以上の連続量を有するラ
インを4方向に走査した場合には、文字枠として認定
し、その文字枠内の文字の認識処理を行うことができ
る。従って、専用のOCRシートを用いなくとも、通常
のワードプロセッサまたは、利用者自身が普通紙に作成
した枠内に文字を書き込んでファクシミリ通信を行い、
認識処理を行うことが可能となるため、コストが削減さ
れる。また、専用のOCRシートのように、業務内容が
変更される毎に、新たにOCRシートを設計し直し、業
者に印刷を発注することなく、ワードプロセッサや利用
者により任意のフォーマットでデータの入力が可能とな
る。
As described above, according to the present invention, the continuous amount of black pixels is counted, and when a line having a continuous amount of a predetermined value or more is scanned in four directions, it is recognized as a character frame, It is possible to perform the recognition process of the characters in the character frame. Therefore, even if a dedicated OCR sheet is not used, an ordinary word processor or a user writes characters in a frame created on plain paper to perform facsimile communication,
Since the recognition processing can be performed, the cost is reduced. In addition, like a dedicated OCR sheet, every time the work content is changed, a new OCR sheet is redesigned and data can be input in an arbitrary format by a word processor or user without ordering printing from a vendor. It will be possible.

【0050】また、認識できた特定の枠内に記載された
文字、記号等をアプリケーション等の種々の処理に一意
名を定義することにより種々の業務に用いることが可能
となる。
Further, it is possible to use the characters, symbols and the like described in the recognized specific frame for various jobs by defining a unique name for various processes such as an application.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のシステム構成図である。FIG. 1 is a system configuration diagram of the present invention.

【図2】本発明の一実施例の文字認識を説明するための
図である。
FIG. 2 is a diagram for explaining character recognition according to an embodiment of the present invention.

【図3】本発明の一実施例の文字認識フィールド検出動
作のフローチャートである。
FIG. 3 is a flowchart of a character recognition field detecting operation according to an embodiment of the present invention.

【図4】本発明の一実施例の走査方向を示す図である。FIG. 4 is a diagram showing a scanning direction according to an embodiment of the present invention.

【図5】本発明の一実施例の黒画素のカウントをとる例
を示す図である。
FIG. 5 is a diagram showing an example of counting black pixels according to an embodiment of the present invention.

【図6】本発明の他の実施例の文字枠が点線である場合
を示す図である。
FIG. 6 is a diagram showing a case where a character frame according to another embodiment of the present invention is a dotted line.

【図7】本発明の一実施例の文字枠内のデータ項目を一
意にアプリケーションに指定する例を示す図である。
FIG. 7 is a diagram showing an example of uniquely specifying a data item in a character frame to an application according to an embodiment of the present invention.

【図8】本発明の第2の実施例を説明するための図であ
る。
FIG. 8 is a diagram for explaining the second embodiment of the present invention.

【図9】本発明の第2の実施例の認識後に編集されるま
での動作を示すフローチャートである。
FIG. 9 is a flowchart showing an operation until recognition and editing in the second embodiment of the present invention.

【図10】従来の文字認識処理を説明するための図であ
る。
FIG. 10 is a diagram for explaining a conventional character recognition process.

【図11】従来のOCR認識及び補正手順を説明するた
めの図である。
FIG. 11 is a diagram for explaining a conventional OCR recognition and correction procedure.

【符号の説明】[Explanation of symbols]

10 ファクシミリ装置 20 認識装置 21 画像データ入力部 22 画素判定部 23 黒画素カウンタ 24 黒画素比較部 25 ワークエリア(所定カウント数) 26 枠認識部 27 文字認識部 100 行マーク 200 ファクシミリマーク 300 ファクシミリ補正マーク 10 Facsimile device 20 Recognition device 21 Image data input unit 22 Pixel determination unit 23 Black pixel counter 24 Black pixel comparison unit 25 Work area (predetermined count) 26 Frame recognition unit 27 Character recognition unit 100 line mark 200 Facsimile mark 300 Facsimile correction mark

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 入力されたイメージデータの特定の枠内
に記入されている文字または、記号の認識方法におい
て、 該イメージデータを操作して、所定の画素の並びが該特
定の枠を構成している部分を認識し、 認識した特定の枠内の画素を該特定の枠内に記入された
文字または記号として認識することを特徴とする文字認
識方法。
1. A method of recognizing a character or a symbol written in a specific frame of input image data, wherein the image data is manipulated so that a predetermined pixel arrangement constitutes the specific frame. A character recognizing method, characterized in that a part in which a particular part is recognized is recognized, and a pixel in the recognized specific frame is recognized as a character or a symbol written in the specific frame.
【請求項2】 入力されたイメージデータの特定の枠内
に記入された文字または、記号に基づいて任意の処理を
行わせるイメージデータ処理方法において、該イメージ
データを操作して所定の画素の並びが該特定の枠を構成
している部分を認識し、 認識した特定の枠内の画素を該特定の枠内に記入された
文字として認識し、 該認識した特定枠の出現順位と、認識した枠内の文字に
基づいて、任意の処理を行うことを特徴とする文字認識
方法。
2. An image data processing method for performing an arbitrary process based on a character or a symbol entered in a specific frame of input image data, wherein the image data is operated to arrange a predetermined pixel array. Recognizes a portion forming the specific frame, recognizes a pixel in the recognized specific frame as a character written in the specific frame, and recognizes the appearance order of the recognized specific frame. A character recognition method characterized by performing arbitrary processing based on characters in a frame.
【請求項3】 入力されたイメージデータの特定の枠内
に記入された文字の認識を行う文字認識装置において、 該イメージデータを走査して所定の画素の並びが該特定
の枠を構成している部分を認識する枠認識手段と、 該枠認識手段で認識した特定の枠内の画素を該特定の枠
内に記入された文字として認識する文字認識手段とを有
することを特徴とする文字認識装置。
3. A character recognition device for recognizing a character entered in a specific frame of input image data, wherein the image data is scanned and a predetermined pixel array constitutes the specific frame. Character recognition characterized by having a frame recognizing means for recognizing an existing portion and a character recognizing means for recognizing pixels in a specific frame recognized by the frame recognizing means as characters written in the specific frame apparatus.
【請求項4】 入力されたイメージデータの特定の枠内
に記入された文字に基づいて任意の処理を行うイメージ
データ処理装置において、 該イメージデータを走査して所定の画素の並びが該特定
の枠を構成している部分を認識する枠認識手段と、 該枠認識手段で認識した特定の枠内の画素を該特定の枠
内に記入された文字として認識する文字認識手段と、 該枠認識手段で認識した枠の出現順位と、該文字認識手
段で認識した枠内の文字とに基づいて、任意の処理を行
う処理手段とを有することを特徴とする文字認識装置。
4. An image data processing apparatus for performing an arbitrary process based on a character entered in a specific frame of input image data, wherein the image data is scanned and a predetermined arrangement of pixels has the specific pixel arrangement. A frame recognition means for recognizing a part forming a frame, a character recognition means for recognizing pixels in a specific frame recognized by the frame recognition means as characters written in the specific frame, and the frame recognition A character recognition apparatus comprising: a processing unit that performs an arbitrary process based on the appearance order of the frame recognized by the means and the characters in the frame recognized by the character recognition unit.
JP6085063A 1994-04-22 1994-04-22 Method and device for recognizing character Pending JPH07296108A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6085063A JPH07296108A (en) 1994-04-22 1994-04-22 Method and device for recognizing character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6085063A JPH07296108A (en) 1994-04-22 1994-04-22 Method and device for recognizing character

Publications (1)

Publication Number Publication Date
JPH07296108A true JPH07296108A (en) 1995-11-10

Family

ID=13848181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6085063A Pending JPH07296108A (en) 1994-04-22 1994-04-22 Method and device for recognizing character

Country Status (1)

Country Link
JP (1) JPH07296108A (en)

Similar Documents

Publication Publication Date Title
US5025484A (en) Character reader device
JP3962891B2 (en) Document image processing apparatus, document image processing method, and storage medium
JP2967309B2 (en) Image processing device
JPH04313958A (en) Picture processor
JPH03144863A (en) Detecting method and correcting method for inclination of picture and picture information processor
JPH04229763A (en) Picture processing unit and its method
JPH10162099A (en) Method and device for recognizing rectangular object, and program product for recognizing rectangular object
US5666549A (en) Method and system for processing a document transmitted via facsimile in an initially input form stored in a knowledge base
US5271067A (en) Optical character recognition apparatus
US5649028A (en) Connect-the-dots drawing production device
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
JPS638889A (en) Information processor
JPH07296108A (en) Method and device for recognizing character
JP2004504650A (en) Methods and systems for form recognition and digitized image processing
JP2000187705A (en) Document reader, document reading method and storage medium
JPH096865A (en) Method and device for generating format information
JPH03263282A (en) Character segmenting method for character reader
JPH08305791A (en) Image recognizing device and control sheet
JPH02138674A (en) Method and device processing document
JPH06208650A (en) Method and device for recognizing information
JPH04323772A (en) Graphic identification code input device
JP2001126025A (en) For ocr format parameter generation method
JP3077580B2 (en) Character reader
JPH04321376A (en) Picture processing unit
JPH04288691A (en) Character recognition device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030513