JPH05342409A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH05342409A
JPH05342409A JP4145145A JP14514592A JPH05342409A JP H05342409 A JPH05342409 A JP H05342409A JP 4145145 A JP4145145 A JP 4145145A JP 14514592 A JP14514592 A JP 14514592A JP H05342409 A JPH05342409 A JP H05342409A
Authority
JP
Japan
Prior art keywords
character
frame
entry
segmenting
entry frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4145145A
Other languages
Japanese (ja)
Inventor
Daisuke Nishiwaki
大輔 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4145145A priority Critical patent/JPH05342409A/en
Publication of JPH05342409A publication Critical patent/JPH05342409A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To correctly recognize characters protruded out of character entry frames. CONSTITUTION:This device is provided with a character segmenting means to select an area larger than the entry frame from slip images as the segmenting area of characters in the case of segmenting an area equivalent to one character by using the size information of the description frame stored in an entry frame size information part 114 at a character segmenting part 112 under the control of a control part 115 from the images of a reading object slip stored in a slip image memory 111 of a character segmenting means 11 by a photoelectric converting means 10 of a character pattern input means 1. Thus, even the character protruded out of the entry frame can be segmented without being partially missed, this is recognized by a character recognizing means 2, and the machine code of the relevant character is outputted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、帳票上に記入された文
字パターンを読み取り、読み取った文字パターンから文
字を認識する文字認識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for reading a character pattern written on a form and recognizing a character from the read character pattern.

【0002】[0002]

【従来の技術】従来の文字認識装置においては、文字の
記入位置を指定するために、帳票上に記入枠を設定して
いる。この記入枠への文字の記入時に、筆記者に対し見
本文字で示すような字体の制限を設けることは現在なく
なっているが、記入枠には文字の大きさの変動を抑える
効果があり、比較的自由な字体に対する安定な読み取り
性能の実現に寄与することはよく知られている。参考文
献としては、安田道夫:“文字読み取り装置はどのよう
に構成されているか”,日経エレクトロニクス197
5.1.27、及び橋本新一郎:“文字認識概論”、電
気通信協会があげられる。記入枠は、文字認識装置にお
ける記入制限の一つであり、記入枠をはみ出さない文字
の記入を筆記者に求めている。したがって、文字は記入
枠内部にはみ出すことなく記入されていることを前提と
しており、各文字は記入枠の内部に相当する部分のイメ
ージを帳票から切り出して認識している。
2. Description of the Related Art In a conventional character recognition device, an entry frame is set on a form in order to specify a character entry position. At the time of writing characters in this entry frame, there is no longer any restriction on the typeface for the writer as shown in the sample characters, but the entry frame has the effect of suppressing fluctuations in the size of the letters. It is well known that it contributes to the realization of stable reading performance for free-form fonts. As a reference, Michio Yasuda: “How is a character reader configured?”, Nikkei Electronics 197
5.1.27, and Shinichiro Hashimoto: “Introduction to Character Recognition”, Telecommunications Association. The entry frame is one of the entry restrictions in the character recognition device, and requires the writer to enter characters that do not extend beyond the entry frame. Therefore, it is premised that the characters are entered without protruding into the entry frame, and each character recognizes the image of the portion corresponding to the inside of the entry frame by cutting out from the form.

【0003】[0003]

【発明が解決しようとする課題】上述した従来の文字認
識装置では、実際の運用面において文字がこの記入枠を
はみ出すことがしばしばあり、記入枠内部のみを切り出
して認識している従来方式では誤読が生じる場合が存在
するという欠点を有している。
In the above-described conventional character recognition device, characters often protrude from the entry frame in actual operation, and misreading occurs in the conventional method in which only the inside of the entry frame is cut out and recognized. There is a drawback that there are cases where

【0004】以下に、図5を用いてこの例を説明する。
従来方式の文字認識装置は、記入枠の内部を切り出すの
で、図5の上段のように記入枠をはみだして記入された
文字パターンはそれぞれ図5中段に示すような切り出し
結果となる。これらを文字認識手段に送った場合の認識
結果としては、例えば図5下段のようなり、正しい読み
取りを行うことができない。これは図5中段の切り出し
結果を見てもわかるように記入枠の外を無視する結果、
残り記入枠内部に相当する部分のパターンが別の文字に
似てしまうためである。
This example will be described below with reference to FIG.
Since the conventional character recognition device cuts out the inside of the entry frame, the character patterns that are entered outside the entry frame as shown in the upper part of FIG. 5 have the cutting results shown in the middle part of FIG. 5, respectively. The recognition result when these are sent to the character recognition means is, for example, as shown in the lower part of FIG. 5, and correct reading cannot be performed. This is the result of ignoring the outside of the entry frame, as you can see from the cutting result in the middle of Fig. 5,
This is because the pattern of the portion corresponding to the inside of the remaining entry frame resembles another character.

【0005】本発明の目的は、上述のごとき記入枠をは
みだした文字パターンを正しく読み取ることができる文
字認識装置を提供することにある。
An object of the present invention is to provide a character recognizing device which can correctly read a character pattern which is out of the entry frame as described above.

【0006】[0006]

【課題を解決するための手段】本発明の文字認識装置
は、帳票上に記入された文字パターンを電気信号に変換
し、電気信号に変換された帳票パターンを用いて文字を
切り出す文字パターン入力手段を備えた文字認識装置に
おいて、前記文字パターン入力手段が、該文字パターン
を電気信号に変換し、電気信号に変換された帳票パター
ンを用いて、文字の記入位置を指示するために帳票上に
印刷された記入枠内に記入された文字を切り出す際に、
帳票上の記入枠よりも大きな領域を各文字の切り出し領
域として文字切り出しを行うことが可能であるように構
成されている。
A character recognition device of the present invention is a character pattern input means for converting a character pattern written on a form into an electric signal and cutting out characters using the form pattern converted into the electric signal. In the character recognition device, the character pattern input means converts the character pattern into an electric signal, and prints on the form to indicate the writing position of the character using the form pattern converted into the electric signal. When cutting out the characters entered in the entered entry frame,
Characters can be cut out by using an area larger than the entry frame on the form as a cutout area for each character.

【0007】[0007]

【作用】本発明の作用を図4に示す例を用いて説明す
る。
The operation of the present invention will be described with reference to the example shown in FIG.

【0008】文字記入枠をはみ出して記入された文字に
ついて、従来の切り出し方式を用いると読み誤りを生じ
るパターンのうち、文字の大きさのみが読み誤りの主因
となるものについては、実際の文字記入枠より大きな部
分を切り出し対象領域として切り出すことで解決でき
る。図4の上段の帳票記入例に対し、例えば一点鎖線で
示すように記入枠の周辺部を含む領域を文字切り出し対
象とできるようにする。このような切り出し領域を設定
することで、図4の中段に示すような部分的な欠落のな
い文字イメージが得られる。その結果、図4の下段に示
すように、文字認識手段においてこのような部分的欠落
のある文字パターンに対する読み取り方式を新たに付加
することなく正しい読み取りが行われる。
Regarding the characters that are written out of the character entry frame, if a conventional cutout method causes a reading error, only the size of the character is the main cause of the reading error. The problem can be solved by cutting out a part larger than the frame as the cutout target area. In contrast to the form entry example in the upper part of FIG. 4, for example, an area including the peripheral portion of the entry frame can be targeted for character extraction as indicated by a dashed line. By setting such a cutout area, a character image without partial omission as shown in the middle part of FIG. 4 can be obtained. As a result, as shown in the lower part of FIG. 4, correct reading is performed in the character recognizing means without newly adding a reading method for such a partially missing character pattern.

【0009】[0009]

【実施例】以下、図面により本発明の実施例について説
明する。図2は、本発明の一実施例を示す文字認識装置
のブロック図である。図2の文字認識装置は、文字パタ
ーン入力手段1及び文字認識装置2を含んで構成され
る。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 2 is a block diagram of a character recognition device showing an embodiment of the present invention. The character recognition device of FIG. 2 includes a character pattern input means 1 and a character recognition device 2.

【0010】文字パターン入力手段1は、帳票上に記入
されたイメージを取り込む手段である。さらに、文字パ
ターン入力手段1は、文字のイメージを電気信号に変換
する光電変換手段10、電気信号に変換されたイメージ
Y1から1文字分の読み取り対象となる部分を切り出す
文字切り出し手段11を含んで構成される。このうち光
電変換手段10としは、通常のイメージスキャナーを用
いればよい。
The character pattern input means 1 is means for taking in an image written on a form. Further, the character pattern input means 1 includes a photoelectric conversion means 10 for converting a character image into an electric signal, and a character cutting means 11 for cutting out a portion to be read for one character from the image Y1 converted into the electric signal. Composed. Of these, a normal image scanner may be used as the photoelectric conversion means 10.

【0011】また、文字切り出し手段11は、図1に示
すような帳票画像メモリ111、文字切り出し112、
切り出しデータバッファ113、記入枠大きさ情報格納
部114、制御部115を含んで構成される。
The character cut-out means 11 has a form image memory 111, a character cut-out 112, as shown in FIG.
It includes a cutout data buffer 113, an entry frame size information storage unit 114, and a control unit 115.

【0012】帳票画像メモリ111は、図2に示す光電
変換手段10によって変換された帳票イメージに相当す
る電気信号を格納するメモリであり、帳票1枚分のイメ
ージを格納できるような記憶容量を有する。また、文字
切り出し部112は、該帳票画像メモリ111内に格納
されているイメージより、1文字分の読み取り対象領域
を切り出す部分であり、帳票に記入された文字枠よりも
大きな領域を切り出すことが可能である。
The form image memory 111 is a memory for storing electric signals corresponding to the form image converted by the photoelectric conversion means 10 shown in FIG. 2, and has a storage capacity capable of storing an image of one form. .. The character cutout unit 112 is a portion that cuts out a read target area for one character from the image stored in the form image memory 111, and can cut out an area larger than the character frame filled in the form. It is possible.

【0013】図3は、文字切り出し部112が1文字分
の読み取り対象領域の切り出しを行う動作の流れを示
す。図3においてはじめに記入された文字線が記入枠を
はみ出しているかどうかを判定し(ステップ31,3
2)、はみ出していない場合は文字枠内部のみを切り出
しの対象領域とする(ステップ33)。また、ステップ
32で文字線が記入枠からはみ出している場合には、こ
の記入文字の外接枠を求め(ステップ34)、その外接
枠を切り出しの領域とする(ステップ35)。
FIG. 3 shows a flow of operation in which the character cutout unit 112 cuts out a read target area for one character. In FIG. 3, it is determined whether or not the first character line entered is out of the entry box (steps 31, 3).
2) If there is no protrusion, only the inside of the character frame is set as the target region for clipping (step 33). If the character line is out of the entry frame in step 32, the circumscribing frame of the entered character is determined (step 34), and the circumscribing frame is set as the cutout area (step 35).

【0014】ステップ32における文字線が文字枠をは
み出しているかどうかの判定は、記入された文字線が文
字枠に相当する部分と重なっているかどうかを帳票画像
メモリ111を用いて制御部1115上で判定すればよ
い。また、記入文字に対する外接枠は、例えば記入枠の
中心を基準に上下方向、左右方向にスキャンを行い文字
線の存在する横方向の最大値、最小値、縦方向の最大
値、最小値を検出することにより求める。このとき文字
枠をはみ出しているか、いないかの判定を行わず、予め
全ての記入枠に対して、文字パタンの外接枠を検出し、
切り出しを行ってもよい。また、記入枠に対し、予め近
接する文字枠に接しない程度の大きな切り出し領域を設
定しておいても同様の効果が得られる。
In step 32, it is determined whether or not the character line is out of the character frame by using the form image memory 111 on the control unit 1115 by checking whether or not the written character line overlaps with a portion corresponding to the character frame. Just make a decision. For the circumscribing frame for the entered characters, for example, the maximum value in the horizontal direction, the minimum value, the maximum value in the vertical direction, and the minimum value in the vertical direction where the character lines exist are detected by scanning in the vertical direction and the horizontal direction with the center of the input frame as a reference. To obtain. At this time, without judging whether the character frame is protruding or not, the circumscribing frame of the character pattern is detected in advance for all the input frames,
You may cut out. In addition, the same effect can be obtained by setting a large cutout area in advance so that it does not come into contact with an adjacent character frame.

【0015】記入枠大きさ情報格納部114は帳票上に
印刷されている文字枠の大きさを格納する部分であり、
1文字分の領域を切り出し領域の設定時に参照される。
また、切り出しデータバッファ113は、文字切り出し
部112により切り出された文字イメージを切り出しデ
ータとして格納する。そして、制御部115は前述11
1から114までの各装置を制御するものである。
The entry box size information storage section 114 is a section for storing the size of the character box printed on the form,
The area for one character is referred to when setting the cutout area.
The cutout data buffer 113 also stores the character image cut out by the character cutout unit 112 as cutout data. Then, the control unit 115 causes the above-mentioned 11
It controls each device from 1 to 114.

【0016】文字認識手段2は、該文字パターン入力手
段1によって切り出された1文字分のイメージY2から
該当する文字種の機械コードY3を出力する部分であ
り、読み取り対象に応じ、適宜その方式は選択すればよ
い。
The character recognizing means 2 is a part for outputting a machine code Y3 of a corresponding character type from the image Y2 for one character cut out by the character pattern inputting means 1, and the method is appropriately selected according to the object to be read. do it.

【0017】また、本実施例では、1つの文字枠につき
1文字を記入する場合について述べているが、住所や電
話番号などの文字列を一括記入する際に設けられる記入
欄に対しても適応が可能である。
Further, in the present embodiment, one character is written in one character frame, but it is also applicable to an entry field provided when collectively writing a character string such as an address or a telephone number. Is possible.

【0018】このように、文字枠より大きな領域から文
字を切り出すことにより、記入枠をはみ出して記入され
ている文字を正しく読み取ることができる。また、本発
明を有する文字認識装置の文字認識手段においては、図
5で説明した前述の要因による文字パターンの部分的欠
落を考慮に入れた設計をする必要がないため、文字認識
時の時間的負荷、装置の規模が軽減される。
As described above, by cutting out a character from an area larger than the character frame, it is possible to correctly read the character that has been written out of the entry frame. Further, in the character recognition means of the character recognition device having the present invention, it is not necessary to design in consideration of the partial omission of the character pattern due to the above-described factors described in FIG. The load and the scale of the device are reduced.

【0019】[0019]

【発明の効果】以上説明したように、本発明の文字認識
装置は、文字枠より大きな領域から文字を切り出すこと
により、記入枠をはみ出して記入されている文字を正し
く読み取れるようになり、文字読み取り性能が向上する
という効果がある。
As described above, according to the character recognition device of the present invention, by cutting out a character from an area larger than the character frame, it is possible to correctly read the character that has been written out of the entry frame. This has the effect of improving performance.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の文字認識装置の文字切り出し手段の一
実施例を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a character cutting means of a character recognition device of the present invention.

【図2】図1に示す文字切り出し手段を含んだ本発明の
文字認識装置の一実施例を示すブロック図である。
FIG. 2 is a block diagram showing an embodiment of a character recognition device of the present invention including the character cutting means shown in FIG.

【図3】図1に示す文字切り出し手段における動作の一
例を示すフローチャート図である。
FIG. 3 is a flowchart showing an example of an operation of the character cutting means shown in FIG.

【図4】本発明の文字認識装置の動作を説明するための
説明図である。
FIG. 4 is an explanatory diagram for explaining the operation of the character recognition device of the present invention.

【図5】従来の文字認識装置の動作を説明するための説
明図である。
FIG. 5 is an explanatory diagram for explaining the operation of the conventional character recognition device.

【符号の説明】[Explanation of symbols]

1 文字パターン入力手段 2 文字認識手段 10 光電変換手段 11 文字切り出し手段 111 帳票画像メモリ 112 文字切り出し部 113 切り出しデータバッファ 114 記入枠大きさ情報格納部 115 制御部 1 Character pattern input means 2 Character recognition means 10 Photoelectric conversion means 11 Character cutout means 111 Form image memory 112 Character cutout section 113 Cutout data buffer 114 Entry frame size information storage section 115 Control section

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 帳票上に記入された文字パターンを電気
信号に変換し、電気信号に変換された帳票パターンを用
いて文字を切り出す文字パターン入力手段を備えた文字
認識装置において、前記文字パターン入力手段が、該文
字パターンを電気信号に変換し、電気信号に変換された
帳票パターンを用いて、文字の記入位置を指示するため
に帳票上に印刷された記入枠内に記入された文字を切り
出す際に、帳票上の記入枠よりも大きな領域を各文字の
切り出し領域として文字切り出しを行うことが可能であ
ることを特徴とする文字認識装置。
1. A character recognition device comprising character pattern input means for converting a character pattern written on a form into an electric signal and cutting out characters using the form pattern converted into the electric signal. The means converts the character pattern into an electric signal, and uses the form pattern converted into the electric signal, and cuts out the character written in the entry frame printed on the form to indicate the writing position of the character. At this time, the character recognition device is characterized in that it is possible to perform character extraction by using an area larger than the entry frame on the form as an extraction area for each character.
JP4145145A 1992-06-05 1992-06-05 Character recognizing device Withdrawn JPH05342409A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4145145A JPH05342409A (en) 1992-06-05 1992-06-05 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4145145A JPH05342409A (en) 1992-06-05 1992-06-05 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH05342409A true JPH05342409A (en) 1993-12-24

Family

ID=15378462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4145145A Withdrawn JPH05342409A (en) 1992-06-05 1992-06-05 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH05342409A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277092A (en) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd Character and image segmentation device, character and image segmentation method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277092A (en) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd Character and image segmentation device, character and image segmentation method, and program

Similar Documents

Publication Publication Date Title
JP3996579B2 (en) Form processing system for identifying active areas of machine-readable forms
US6466954B1 (en) Method of analyzing a layout structure of an image using character recognition, and displaying or modifying the layout
US7321688B2 (en) Image processor for character recognition
US8229214B2 (en) Image processing apparatus and image processing method
JPH04270485A (en) Printing character recognition device
US6983077B2 (en) Image processor
JPH05342409A (en) Character recognizing device
JPH07121734A (en) Character image editing device
JP2002109470A (en) Image recognition device, image recognition method, and computer readable recording medium stored with image recognition program
JPH08237404A (en) Selection of optical character recognition mode
JP3391987B2 (en) Form recognition device
JP4040231B2 (en) Character extraction method and apparatus, and storage medium
JP2570571B2 (en) Optical character reader
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JP4204185B2 (en) Character recognition device, character recognition method, and recording medium
JP3269889B2 (en) Optical character reading system
JP3052438B2 (en) Table recognition device
JP2923004B2 (en) Image generation device
JP2922356B2 (en) Character recognition processor
JP2931041B2 (en) Character recognition method in table
JP2708604B2 (en) Character recognition method
JP2001209755A (en) Device and method for correcting miswriting and computer readable recording medium with miswriting correction program stored therein
JPH01245376A (en) Character segmenting device for character reader
JPH09179936A (en) Ruled-line erasing method and character recognition method
JP2001265317A (en) Bitmap font, method and device for generating bitmap font, method and device for generating document data using dedicated font characters, and method and device for recognizing characters

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990831