JPS59158476A - Character reader - Google Patents
Character readerInfo
- Publication number
- JPS59158476A JPS59158476A JP58032427A JP3242783A JPS59158476A JP S59158476 A JPS59158476 A JP S59158476A JP 58032427 A JP58032427 A JP 58032427A JP 3242783 A JP3242783 A JP 3242783A JP S59158476 A JPS59158476 A JP S59158476A
- Authority
- JP
- Japan
- Prior art keywords
- character
- reading
- character set
- characters
- filled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は、光学的文字読取装置に関する−〔発明の技
術的背景とその問題点〕
一般に、光学的文字読取装置(以下OCRと称する)に
おいて、読取速度の向上及び読取精度のために行なう読
取り文字種の指定(以下キャラクタセットと称する)は
、予めフォーマットコントロール情報として与えられて
いる。[Detailed Description of the Invention] [Technical Field of the Invention] The present invention relates to an optical character reading device - [Technical Background of the Invention and Problems Therewith] Generally, in an optical character reading device (hereinafter referred to as OCR), Designation of read character types (hereinafter referred to as character set), which is performed to improve reading speed and reading accuracy, is given in advance as format control information.
従来、キャラクタセットを行なう方式は1例えば第1図
に示すような認識文字(例えば128種)となる数字(
0〜9)、英字(p、−z)、仮名文字および記号(コ
、?等)等が印刷されている帳票1が用いられる。この
帳票1には、キャラクタセット帳票であることを示すI
D番号2を記入する文字枠2aおよび認識文字に対応す
る文字枠3aが設けられている1、そして、キャラクタ
セットを行なう際、その文字に対応する文字枠3a内に
所定の文字3、即ちセットを意味する文字を記入するこ
とになる。Conventionally, the method of character setting is 1. For example, as shown in Figure 1, numbers (128 types) are recognized characters (128 types).
0 to 9), alphabetic characters (p, -z), kana characters, and symbols (ko, ?, etc.) are printed on the form 1. This form 1 contains an I which indicates that it is a character set form.
A character frame 2a in which the D number 2 is written and a character frame 3a corresponding to the recognized character are provided 1, and when character setting is performed, a predetermined character 3, that is, a set character, is provided in the character frame 3a corresponding to the character. You will need to enter the characters that mean .
このようにして記入された帳票1をOCRが読取ること
により、キャラクタセット処理が行なわれることになる
。しかしながら、従来の方式では、漢字読取用のOCR
においては読取対数文字が数千様に及ぶため、数千様の
読取対象文字の全てが印刷された帳票を用いることにな
り、多大なキャラクタセットの処理時間が必要となる。Character set processing is performed by reading the form 1 filled out in this manner by the OCR. However, in the conventional method, OCR for reading kanji
Since the number of logarithmic characters to be read ranges into the thousands, a form in which all of the thousands of characters to be read are printed is used, which requires a large amount of character set processing time.
また、読取対象文字が多いため、キャラクタセット用帳
票の枚数が増大する欠点もあった。Furthermore, since there are many characters to be read, there is also the drawback that the number of sheets for character setting increases.
この発明は上記の事情に鑑みて々されたもので、漢字読
取用OCRの場合でも、キャラクタセット用帳票の枚数
およびキャラクタセットの処理時間を減少して、文字読
取処理全体の効率を向上できる文字読取装置を提供する
ことを目的とする。This invention was made in view of the above circumstances, and even in the case of OCR for reading kanji, it is possible to improve the efficiency of the entire character reading process by reducing the number of forms for character setting and the processing time for character setting. The purpose is to provide a reading device.
この発明は、予め設けた文字枠内にフォーマットコント
ロール情報として必要な行番号、フィールド番号、キャ
ラクタセット文字およびキャラクタセット文字の指定を
行なう制御文字を直接に記入するキャラクタセット用帳
票を使用する。この帳票に記入された各種の情報がOC
Rにより読取られ、その読取結果に基づいて制御手段が
キャラクタセットデータを編集する。制御手段から出力
するキャラクタセットデータが、フォーマットコントロ
ール情報として記憶装置に記憶されることになる。とれ
により、数千様の漢字の読取用OCRの場合でも、数千
様の読取対象文字が印刷された帳票の用意を不必要にし
、少ない処理時間でキャラクタセット処理を行々うとと
ができるものである7、
〔発明の実施例〕
以下図面を殊照してこの発明の一実施例について説明す
る。第2図はこの発明に係るブロック図を示すもので、
1θは光学的文字読取装置(以下OCRと称する)でキ
ャラクタセット用帳票(第3図の20)に記入された各
種文字を読取る。OCR制御装置11は、0CR10の
読取結果に基づいてキャラクタセットデータを編集し出
力する。12は外部記憶装置(メモリ)で、OCR制御
装置11から出力するキャラクタセットデータをフォー
マットコントロール情報として記憶する。出力装置13
は、キャラクタセットデータに応じた文字・母ターンを
出力する。The present invention uses a character set form in which line numbers, field numbers, character set characters, and control characters for specifying character set characters necessary as format control information are directly written in a character frame provided in advance. Various information entered in this form is OC
The character set data is read by R, and the control means edits the character set data based on the reading result. The character set data output from the control means is stored in the storage device as format control information. As a result, even in the case of OCR for reading thousands of kanji characters, it is unnecessary to prepare a form on which thousands of characters to be read are printed, and character set processing can be performed in less processing time. 7. [Embodiment of the Invention] An embodiment of the invention will be described below with particular reference to the drawings. FIG. 2 shows a block diagram according to this invention.
1θ reads various characters written on the character set form (20 in FIG. 3) using an optical character reading device (hereinafter referred to as OCR). The OCR control device 11 edits and outputs character set data based on the reading result of 0CR10. Reference numeral 12 denotes an external storage device (memory) that stores character set data output from the OCR control device 11 as format control information. Output device 13
outputs the character/mother turn according to the character set data.
さらに、この発明では第3図に示すようなキャラクタセ
ット用帳票(以下単に帳票と称する)20が使用される
。この帳票20には、キャラクタセット用帳票であるこ
とを示すID番号21を記入する文字枠21a、行番号
記入用文字枠22&、フィールド番号記入用文字枠23
hおよびキャラクタセット記入用文字枠24aが設けら
れている。これらの文字枠21a〜24aは、通常ドロ
ップアウトカラーで印刷される。Further, in the present invention, a character set form (hereinafter simply referred to as a form) 20 as shown in FIG. 3 is used. This form 20 includes a character frame 21a in which an ID number 21 indicating that it is a character set form is entered, a character frame 22 for entering line numbers, and a character frame 23 for entering field numbers.
h and a character frame 24a for entering a character set are provided. These character frames 21a to 24a are usually printed in dropout colors.
尚、ID番号2ノは事前に印刷されているものとする。It is assumed that ID number 2 has been printed in advance.
このような構成において、その動作を説明する。壕ず、
帳票20に対してキャラクタセットを行なう読取エリア
を指定するために、文字枠22aへ行番号を記入し、文
字枠23aへフィールド番号を記入する。この場合、行
番号とは被読取対象の帳票(即ち、通常使用される帳票
)の読取指定の行番号であり、フィールド番号はその指
定行中のフィールドを指定する番号である。さらに、文
字枠24aに対して所望のキャラクタセット文字を記入
する。具体的には、例えば第4図に示すように記入する
。この場合、行番号が「1」であり、フィールド番号が
「2」であるため、被読取対象の帳票の第1行目の第2
フイールドに対するキャラクタセットが行なわれるとと
になる。そして、文字枠24aにキャラクタセット文字
を直接記入するもので、このとき例えばキャラクタセッ
ト制御文字25゜26により字種指定を行なう。この制
御文字25.26により、その間に記入された文字(こ
の例では数字)がキャラクタセットされることになる7
、さらに、例えば「丁、目、番、地、号、ノ、−1のよ
うな文字が文字枠24aに直接記入されると、それぞれ
の文字がキャラクタセットされることになる。The operation of this configuration will be explained. No trenches,
In order to designate the reading area for performing character setting on the form 20, a line number is written in the character box 22a, and a field number is written in the character box 23a. In this case, the line number is the line number designated for reading of the form to be read (that is, the form that is normally used), and the field number is the number specifying the field in the specified line. Furthermore, a desired character set character is written in the character frame 24a. Specifically, the information is entered as shown in FIG. 4, for example. In this case, the line number is "1" and the field number is "2", so the second line of the first line of the form to be read is
The character set for the field is done. Then, character set characters are directly written in the character frame 24a, and at this time, the character type is designated by, for example, character set control characters 25 and 26. These control characters 25 and 26 cause the characters written between them (numbers in this example) to be set to character 7.
Furthermore, for example, when characters such as "Cho, Me, Ban, Ji, Go, No, -1" are written directly in the character frame 24a, each character is set as a character.
このようにして記入された帳票20が、第2図に示す0
CRI Oで読取られる。0CRI 0は、読取結果を
OCR制御装置11に出力する。The form 20 filled out in this way is shown in FIG.
Read by CRIO. 0CRI 0 outputs the reading result to the OCR control device 11.
結果に基づいて、TD番号2ノを検知し、キャラクタセ
ット処理を行なうことになる。即ち、帳票20に文字枠
22a〜24aに記入された文字群に基づいて、キャラ
クタセットデータを編集し、メモリ12に出力する。メ
モリ12は、OCR制御装置11からのキャラクタセッ
トデータをフォーマットコントロール情報として格納す
る。寸だ、キャラクタセットデータが出力装置13に送
C)れて、表示装置等にキャラクタセット文字・!ター
ンを出力することになる。Based on the results, TD number 2 is detected and character set processing is performed. That is, character set data is edited based on the character group written in the character frames 22a to 24a on the form 20 and output to the memory 12. The memory 12 stores character set data from the OCR control device 11 as format control information. The character set data is sent to the output device 13, and the character set characters are displayed on the display device, etc. This will output a turn.
このようにして、キャラクタセット用帳票20に漢字読
取等に必要なキャラクタセット文字が記入され、この帳
票20が0CRIOにより読取られる。イー゛して、O
CR制御装置11のキャラクタセット処理により、帳票
20に記入されたキャラクタセット文字群に基づいて、
キャラクタセットデータが編集されてメモリ12にフォ
ーマットコントロール情報として格納される。In this way, character set characters necessary for reading Chinese characters, etc. are written on the character set form 20, and this form 20 is read by the 0CRIO. E, O
Based on the character set character group entered in the form 20 by the character set processing of the CR control device 11,
Character set data is edited and stored in memory 12 as format control information.
したがって、例えば第4図に示すキャラクタセット文字
に基づくキャラクタセットが行なわれると、被読取対象
の帳票に対して第1行目の第2フイールドに数字および
「丁、目、番、地、号、ノ、−」の文字が記入されてい
るものとしてOCRは読取処理を行なう。Therefore, for example, when a character set is performed based on the character set characters shown in FIG. The OCR performs a reading process assuming that the characters ``-'' are written.
以上詳述したようにこの発明によれば、フォーマットコ
ントロール情報として必要なキャラクタセント文字をキ
ャラクタセット用帳票に直接記入する1、これにより、
漢字読取用キャラクタセットデータを容易に作成するこ
とができ、漢字読取用OCRの読取動作を確実に実現で
きる。したがって、読取文字が数千種に及ぶ漢字読取用
0Crtの場合でも、キャラクタセット用帳票の枚数お
よびキャラクタセット処理時間を大幅に減少することが
でき、結果的にOCRの文字読取処理の効率を向上する
ことができるものである。As detailed above, according to the present invention, the character cent character required as format control information is directly entered in the character set form 1, thereby:
The character set data for reading kanji can be easily created, and the reading operation of OCR for reading kanji can be reliably realized. Therefore, even in the case of 0Crt for reading kanji, which has several thousand types of characters to read, it is possible to significantly reduce the number of sheets for character setting and the character setting processing time, and as a result, improve the efficiency of OCR character reading processing. It is something that can be done.
第1図は従来のキャラクタセット用帳票の構成を示す図
、第2図はこの発明の一実施例に係る文字読取装置の構
成を示すブロック図、第3図はこの発明の一実施例に係
るキャラクタセット用帳票の構成を示す図、第4図は第
3図の帳票に対する記入方式の一例を説明するだめの図
である。
1θ・・・光学的文字読取装置(OCR)、11・・・
OCR制御装置、12・・・メモリ、13・・・出力装
H120・・・キャラクタセット用帳票。
出願人代理人 弁理士 鈴 江 武 彦第1図
第2図FIG. 1 is a diagram showing the structure of a conventional character set form, FIG. 2 is a block diagram showing the structure of a character reading device according to an embodiment of the present invention, and FIG. 3 is a diagram showing the structure of a character reading device according to an embodiment of the present invention. FIG. 4 is a diagram showing the structure of a character set form, and is a diagram for explaining an example of the entry method for the form of FIG. 3. 1θ...Optical character reader (OCR), 11...
OCR control device, 12...Memory, 13...Output device H120...Character set form. Applicant's representative Patent attorney Takehiko Suzue Figure 1 Figure 2
Claims (1)
ィールド番号、キャラクタセット文字およびキャラクタ
セット文字種の指定を行なう制御文字を直接に記入する
だめの文字枠を有するキャラクタセット用帳票と、この
キャラクタセット用帳票に記入された情報を読取る光学
的文字読取手段と、この光学的文字読取手段からの読取
結果に基づいてキャラクタセットデータを編集し出力す
る制御手段と、この制御手段から出力するキャラクタセ
ットデータをフォーマットコントロール情報として記憶
する記憶手段とを具備することを特徴とする文字読取装
置。A character set form with a character frame for directly entering line numbers, field numbers, character set characters, and control characters for specifying the character set character type required as format control information, and a character set form that is filled in on this character set form. an optical character reading means for reading the information read by the optical character reading means, a control means for editing and outputting character set data based on the reading result from the optical character reading means, and a character set data outputted from the control means as format control information. A character reading device characterized by comprising a storage means for storing information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58032427A JPS59158476A (en) | 1983-02-28 | 1983-02-28 | Character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58032427A JPS59158476A (en) | 1983-02-28 | 1983-02-28 | Character reader |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59158476A true JPS59158476A (en) | 1984-09-07 |
JPH0373913B2 JPH0373913B2 (en) | 1991-11-25 |
Family
ID=12358649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58032427A Granted JPS59158476A (en) | 1983-02-28 | 1983-02-28 | Character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59158476A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63113787A (en) * | 1986-10-31 | 1988-05-18 | Nec Corp | On-slip data input system for character recognition device |
JPS63286987A (en) * | 1987-05-19 | 1988-11-24 | Sanyo Electric Co Ltd | Recognition system for character |
JPH06215180A (en) * | 1993-01-14 | 1994-08-05 | Masamichi Sugawara | Image information analyzing method for input sheet |
-
1983
- 1983-02-28 JP JP58032427A patent/JPS59158476A/en active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63113787A (en) * | 1986-10-31 | 1988-05-18 | Nec Corp | On-slip data input system for character recognition device |
JPS63286987A (en) * | 1987-05-19 | 1988-11-24 | Sanyo Electric Co Ltd | Recognition system for character |
JPH06215180A (en) * | 1993-01-14 | 1994-08-05 | Masamichi Sugawara | Image information analyzing method for input sheet |
Also Published As
Publication number | Publication date |
---|---|
JPH0373913B2 (en) | 1991-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2740335B2 (en) | Table reader with automatic cell attribute determination function | |
JPS59158476A (en) | Character reader | |
JPS5833784A (en) | Word processor with framing function | |
JP2584973B2 (en) | Recognition result output method in character recognition device | |
JPS6019355A (en) | Document forming device | |
JPS6321158A (en) | Printer output device | |
JP2626769B2 (en) | Output control device and method | |
JP2611971B2 (en) | Output device | |
JPH05174017A (en) | Automatic editing table processor | |
JPS6322992B2 (en) | ||
JPH07111727B2 (en) | Document reader | |
JPH04170671A (en) | Document preparing machine | |
KR950011809B1 (en) | Korean character compound writing method in laser printer | |
JPS6411985B2 (en) | ||
JP2933947B2 (en) | Image processing method and apparatus | |
JPH01103467A (en) | Document output method | |
JPH0447449A (en) | Document preparing device | |
JPH01245376A (en) | Character segmenting device for character reader | |
JPS629435B2 (en) | ||
JPS60164873A (en) | Word processor provided with simple language for preparation of table | |
JPS63237123A (en) | Graphic pattern printing system | |
JPH01286867A (en) | Document preparing device | |
JPH01236324A (en) | Program design supporting system | |
JPH0430050B2 (en) | ||
JPS63113787A (en) | On-slip data input system for character recognition device |