JPS62177682A - Character reader - Google Patents

Character reader

Info

Publication number
JPS62177682A
JPS62177682A JP61017806A JP1780686A JPS62177682A JP S62177682 A JPS62177682 A JP S62177682A JP 61017806 A JP61017806 A JP 61017806A JP 1780686 A JP1780686 A JP 1780686A JP S62177682 A JPS62177682 A JP S62177682A
Authority
JP
Japan
Prior art keywords
sheet
size
information
sheet size
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61017806A
Other languages
Japanese (ja)
Inventor
Akinori Hosokawa
細川 昭則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61017806A priority Critical patent/JPS62177682A/en
Publication of JPS62177682A publication Critical patent/JPS62177682A/en
Pending legal-status Critical Current

Links

Landscapes

  • Conveying Record Carriers (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To eliminate the work to classify mixed documents for a size beforehand and to improve work efficiency by detecting a sheet size, controlling FC information by the result, reading a character, classifying a document for the size and executing the discharging. CONSTITUTION:Respective documents are read by an optical scanning by a photoelectric converting part 11 and the image data are stored into a sheet buffer 12. A sheet size detecting part 13 detects the document size based on the image data and outputs sheet size information to an OCR control part 16. A system control part 19, based on the sheet size information from the control part 16, removes the format control (FC) information corresponding to the equivalent document from a floppy 18 and outputs through the control part 16 to a recognizing part 14. The recognizing part 14 cuts out the character pattern of the document by the FC information, executes the recognizing processing of the character with a dictionary 15 and outputs the result to the control part 16. a sorter part 17, in accordance with the instruction of the control part 16, classifies the document to complete the reading processing for the same size and executes successively the discharging processing to the same pocket respectively.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、光学的に文字を読み取る文字読取装置に関す
る。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a character reading device that optically reads characters.

(従来の技術) 従来の文字読取装置(以下、OCRと称す)は、読み取
るべき1種類の帳票の縦、横のサイズを予めOCRの制
御部に設定し、その設定されたサイズデータに基づくフ
ォーマットコントロール情報(以下、FC情報と称す)
に従って、帳票の読み取り処理が行われていた。
(Prior Art) In a conventional character reading device (hereinafter referred to as OCR), the vertical and horizontal sizes of one type of form to be read are set in advance in the OCR control unit, and a format is created based on the set size data. Control information (hereinafter referred to as FC information)
Accordingly, the document reading process was performed.

しかしながら、上記方法では、種々のサイズが混在して
いる帳票の読み取りを行なう場合、予めサイズごとに帳
票を分類し、そのサイズ毎に処理を行なわなければなら
ないという欠点があり、非常に大きな時間を費やすもの
であった。
However, the above method has the disadvantage that when reading forms that have a mixture of various sizes, it is necessary to classify the forms by size in advance and perform processing for each size, which takes a very large amount of time. It was something to spend.

(発明が解決しようとする問題点) 上記した如く、種々のサイズの帳票の処理を行なう場合
には予め同サイズの帳票を分類し、そのサイズ枚にOC
R制御部に設定する必要があり、しかもサイズの異なっ
た帳票が大口に混在している場合には、上記帳票サイズ
分類による処理前段階作業は、非常に大きな時間のロス
と作業能率の低下を生じさせる。
(Problems to be Solved by the Invention) As mentioned above, when processing forms of various sizes, the forms of the same size are classified in advance, and the OC is applied to sheets of the same size.
It is necessary to set this in the R control section, and if there are a large number of documents of different sizes mixed together, the pre-processing work based on the document size classification described above will result in a huge loss of time and a decrease in work efficiency. bring about

そこで本発明の目的は、サイズの異なる帳票が混在して
いても予めサイズ分類することなく読み取り処理でき、
しかも読み取った帳票をそのサイズ毎に分類排出処理で
きるような文字読取装置を提供しようとするものである
Therefore, it is an object of the present invention to be able to read and process even if forms of different sizes are mixed together without classifying them by size in advance.
Moreover, the present invention aims to provide a character reading device that can classify and eject read documents according to their sizes.

[発明の構成コ (問題点を解決するための手段) すなわち、本発明による文字読取装置にあっては、光電
変換部によって帳票を読み取りその画像データを出力し
て、帳票単位でシートバッファに格納させる。そして、
シートサイズ検出部によって、上記シートバッファに格
納された画像データに基づく帳票サイズを検出し、その
検出結果に基づいてシートサイズ情報を出力させるよう
にする。そして、上記シートサイズ検出部から出力され
るシートサイズ情報に基づき、文字認識するためのフォ
ーマットコントロールデータを出力させ、このフォーマ
ットコントロールデータに基づいて上記シートバッファ
に格納された画像データの文字0識を行ない、上記シー
トサイズ情報に基づいて文字認識後の帳票をサイズごと
に該当するポケットに分類格納させるように構成するも
のである。
[Configuration of the Invention (Means for Solving Problems) In other words, in the character reading device according to the present invention, a photoelectric conversion section reads a form, outputs the image data, and stores it in a sheet buffer in units of forms. let and,
The sheet size detection section detects the form size based on the image data stored in the sheet buffer, and outputs sheet size information based on the detection result. Then, based on the sheet size information output from the sheet size detection section, format control data for character recognition is output, and character zero recognition of the image data stored in the sheet buffer is determined based on this format control data. Based on the sheet size information, the documents after character recognition are classified and stored in corresponding pockets for each size.

(作用) 上記のようにして構成される文字読取装置にあっては、
光電変換部で帳票の一枚一枚が光学的走査によって読み
取られ、その画像データがシートバッファに格納される
。そして、シートサイズ検出部によって、上記シートバ
ッファに格納された画像データに基づき帳票サイズが検
出されシートサイズ情報が出力される。そして、このシ
ートサイズ情報に基づいてフォーマットコントロールデ
ータが出力され、このフォーマットコントロールデータ
に基づいて上記シートバッファに格納された画像データ
の文字認識が行われる。このようにして、文字認識処理
が終了すると、帳票は上記シートサイズ情報に基づいて
サイズごとに該当するポケットに分類格納される。
(Function) In the character reading device configured as described above,
Each sheet of the form is optically scanned by the photoelectric conversion section, and the image data is stored in a sheet buffer. Then, the sheet size detection section detects the form size based on the image data stored in the sheet buffer and outputs sheet size information. Then, format control data is output based on this sheet size information, and character recognition of the image data stored in the sheet buffer is performed based on this format control data. In this manner, when the character recognition process is completed, the forms are sorted and stored in corresponding pockets for each size based on the sheet size information.

(実施例) 以下図面を参照してこの発明の一実施例を説明する。第
1図はこの発明による光学的文字読取装置の構成を説明
するためのブロック図である。
(Embodiment) An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram for explaining the configuration of an optical character reading device according to the present invention.

この光学的文字読取装置は、光電変換部11、シートバ
ッファ12、シートサイズ検出部13、認識部14、辞
書15、OCR制御部16、ソータ部17、フロッピー
18およびシステム制御部19とから構成されている。
This optical character reading device includes a photoelectric conversion section 11, a sheet buffer 12, a sheet size detection section 13, a recognition section 14, a dictionary 15, an OCR control section 16, a sorter section 17, a floppy disk 18, and a system control section 19. ing.

光電変換部11はOCR制御部16からの命令により、
光学的走査により帳票の読み取りを行ない、そのデータ
をシートバッファ12に出力している。
The photoelectric conversion unit 11 receives a command from the OCR control unit 16 to
The form is read by optical scanning and the data is output to the sheet buffer 12.

シートバッファ12は光電変換部11から出力されるシ
ート一枚方のイメージデータを順次記憶保持する。シー
トサイズ検出部13はシートバッファ12と接続して、
シートバッファに格納されたシートイメージの垂直射影
および水平射影の検出を行なうことにより、シートバッ
ファ12に取り込まれたシートのサイズ検出をして、そ
のシートサイズ情報をOCR制御部16に出力している
。認識部14はシートバッファ12に格納されたシート
イメージから文字パターンを切り出し、その文字認識を
辞書15を介して処理し、その読み取り情報をOCRa
ill Ia部16に出力している。辞書15は文字認
識するための標準パターンが格納されており、認識部1
4と接続している。OCR制御部16はシートサイズ検
出部13、認識部14、システム制御部19と接続し、
装置全体の制御を行ないシートサイズ検出結果に基づい
てソータ部17を駆動させている。ソータ部17はOC
R!、11 tl1部16の制御により、シートサイズ
検出結果に基づく帳票の分類排出処理を行なっている。
The sheet buffer 12 sequentially stores and holds the image data of each sheet output from the photoelectric conversion section 11. The sheet size detection unit 13 is connected to the sheet buffer 12,
By detecting the vertical projection and horizontal projection of the sheet image stored in the sheet buffer, the size of the sheet taken into the sheet buffer 12 is detected, and the sheet size information is output to the OCR control section 16. . The recognition unit 14 cuts out a character pattern from the sheet image stored in the sheet buffer 12, processes the character recognition through the dictionary 15, and converts the read information into OCRa.
It is output to the ill Ia section 16. The dictionary 15 stores standard patterns for character recognition, and the recognition unit 1
It is connected to 4. The OCR control unit 16 is connected to the sheet size detection unit 13, the recognition unit 14, and the system control unit 19,
It controls the entire apparatus and drives the sorter section 17 based on the sheet size detection result. Sorter section 17 is OC
R! , 11 Under the control of the tl1 unit 16, the document is classified and discharged based on the sheet size detection results.

システム制御部19はシステム全体の制御を行なってい
るもので、OCR制御部16からのシートサイズ検出情
報および文字読み取り結果情報を供給し、フロッピー1
8に格納されているFC情報の取り出し制御を行なって
いる。
The system control unit 19 controls the entire system, and supplies sheet size detection information and character reading result information from the OCR control unit 16.
It controls the retrieval of FC information stored in 8.

すなわち、上記のように構成される文字読取装置にあっ
ては、まず種々のサイズが混在している帳票の一枚一枚
が、光電変換部11によって光学的走査により読み取ら
れ、そのデータがシートバッファ12に出力される。シ
ートバッファ12はOCR制御部16からの読み出し命
令により光電変換部11から出力されたデータに基づき
帳票パターンの取り込みを行なっていく。この場合、シ
ートバッファ12に取り込まれた帳票イメージに従い、
第2図に示すように、シートサイズ検出部13によって
、入力された帳票のサイズ検出が行なわれる。
That is, in the character reading device configured as described above, first, each document of various sizes is read by optical scanning by the photoelectric conversion unit 11, and the data is transferred to the sheet. It is output to the buffer 12. The sheet buffer 12 takes in a form pattern based on the data output from the photoelectric conversion section 11 in response to a read command from the OCR control section 16. In this case, according to the form image imported into the sheet buffer 12,
As shown in FIG. 2, the sheet size detection section 13 detects the size of the input form.

第2図は上記帳票のサイズ検出手段を説明するだめのシ
ートバッファ12とシートサイズ検出部13との関連を
示す図である。最大シートサイズまで検出できるシート
バッファ12内に、検出すべき帳票イメージ22が取り
込まれる。そして、帳票イメージ22を取り込んだシー
トバッファ12の垂直射影23および水平射影24の検
出を行ない、その垂直射影23および水平射影24の検
出結果に基づき帳票イメージ22の縦および横のサイズ
の検出を行なうように構成されている。すなわち、帳票
イメージ22がシートバッファ12に設定された場合、
シートバッファ22内に斜線で示すように帳票イメージ
22のサイズに対応する余白部分ができる。この状態は
帳票イメージ22のサイズによって異なってくるため、
この状態のシートバッファ22の垂直射影23および水
平射影24を検出することによって、帳票イメージ22
のサイズ検出が行なえるものである。
FIG. 2 is a diagram showing the relationship between the sheet buffer 12 and the sheet size detecting section 13 for explaining the form size detecting means. A form image 22 to be detected is taken into a sheet buffer 12 that can detect up to the maximum sheet size. Then, the vertical projection 23 and horizontal projection 24 of the sheet buffer 12 that has taken in the form image 22 are detected, and the vertical and horizontal sizes of the form image 22 are detected based on the detection results of the vertical projection 23 and horizontal projection 24. It is configured as follows. That is, when the form image 22 is set in the sheet buffer 12,
A margin corresponding to the size of the form image 22 is created in the sheet buffer 22 as indicated by diagonal lines. This state differs depending on the size of the form image 22, so
By detecting the vertical projection 23 and horizontal projection 24 of the sheet buffer 22 in this state, the form image 22 is
It is possible to detect the size of

なお、上記帳票イメージ22が傾いて取り込まれてきた
場合、シートバッファ12は、例えば帳票イメージ22
を形成る4点のうち少なくとも2点の座標を求めること
によりその傾き角θを検出し、その情報をシートサイズ
検出部13に出力する。シートサイズ検出部13は、こ
の傾き角θの情報に基づき垂直射影23および水平射影
24から得られるシートサイズを補正し、正しいシート
サイズ検出を行なう。
Note that, if the form image 22 is captured at an angle, the sheet buffer 12 may, for example,
The inclination angle θ is detected by determining the coordinates of at least two of the four points forming the sheet size, and the information is output to the sheet size detection section 13. The sheet size detection unit 13 corrects the sheet size obtained from the vertical projection 23 and the horizontal projection 24 based on the information on the inclination angle θ, and performs correct sheet size detection.

このようにして、シートバッファ12における帳票パタ
ーンの取り込みが終了すると、シートサイズ検出部13
は検出したシートサイズ情報をOCR制御部16に出力
する。このOCR制御部16はシートサイズ検出部13
からのシートサイズ情報をシステム制御部19に出力す
る。システム制御部19はこのシートサイズ情報に基づ
きフロッピー18に格納しであるFC情報を取り出し、
該当帳票に対応するFC情報をOCR制御部16を介し
て認識部14に出力する。この認識部14は上記FC情
報によりシートバッファ12から送られる帳票の文字パ
ターンを切り出し、その文字を辞書15を用いて認識処
理し、その読み取り結果をOCR制御部16を介して再
びシステム制御部19に転送する。
In this way, when the sheet buffer 12 finishes capturing the form pattern, the sheet size detection section 13
outputs the detected sheet size information to the OCR control section 16. This OCR control section 16 is a sheet size detection section 13.
The sheet size information from is output to the system control unit 19. Based on this sheet size information, the system control unit 19 retrieves the FC information stored in the floppy disk 18,
The FC information corresponding to the corresponding form is output to the recognition unit 14 via the OCR control unit 16. The recognition unit 14 cuts out the character pattern of the form sent from the sheet buffer 12 based on the FC information, processes the characters for recognition using a dictionary 15, and sends the reading results back to the system control unit 19 via the OCR control unit 16. Transfer to.

上記のようにして帳票の文字認識処理が終了すると、O
CR制御部16はシートサイズ情報に基づきソータ部1
7を駆動させる。ソータ部17は○CR制御部16から
の命令に従い、文字読み取り処理の終了した帳票を同一
サイズごとに分類し、それぞれ同一のポケットに順次排
出処理を行なっている。
When the character recognition process for the form is completed as described above, O
The CR control unit 16 controls the sorter unit 1 based on the sheet size information.
Drive 7. The sorter unit 17 sorts the forms for which the character reading process has been completed according to the same size according to instructions from the ○CR control unit 16, and sequentially discharges them into the same pocket.

なお、帳票の文字情報が不要な場合には、上記OCR制
御部16がシートサイズ情報によりポケット判断を行な
い、ソータ部17を駆動させるようにしても良い。
Incidentally, if the character information of the form is not required, the OCR control section 16 may make a pocket determination based on the sheet size information and drive the sorter section 17.

このようにして、サイズの異なる多数の帳票は、シート
バッファ12およびシートサイズ検出部13よってサイ
ズ検出され、必要な場合には認識部14によって文字H
OEが行われる。そして、サイズ検出された帳票はソー
タ部11によって該当サイズのポケットに順次分類排出
処理されるようになる。
In this way, the sheet buffer 12 and the sheet size detection unit 13 detect the size of a large number of forms with different sizes, and if necessary, the recognition unit 14 detects the letters H.
OE is performed. Then, the documents whose size has been detected are sequentially sorted and discharged into pockets of the corresponding size by the sorter section 11.

[発明の効果] 以上のようにこの発明によれば、シートサイズ検出部に
よってシートサイズの検出を行ない、この検出結果によ
ってFC情報を制御して文字読み収りを行なうことによ
り、サイズの違う帳票の混在読み取りを可能にし、しか
も読み取った帳票をサイズ毎に分類し排出することがで
きるようになる。したがって、サイズの違う帳票が大量
に混在している場合でも、予めサイズごとに分類してお
く必要がなくなり作業能率が向上するものである。
[Effects of the Invention] As described above, according to the present invention, the sheet size is detected by the sheet size detecting section, and the FC information is controlled based on the detection result to read and fit the characters, thereby allowing documents of different sizes to be read. This makes it possible to read a mixture of documents, and also to sort and output the read documents by size. Therefore, even when a large number of forms of different sizes coexist, there is no need to classify them by size in advance, which improves work efficiency.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明の一実施例に係わる光学的文字読取装
置を説明するためのブロック図、第2図は上記第1図に
示したシートバッファおよびシートサイズ検出部との関
連を説明するための図である。 11・・・光電変換部、12・・・シートバッファ、1
3・・・シートサイズ検出部、14・・・認識部、15
・・・辞書、16・・・OCR制御部、11・・・ソー
タ部、18・・・フロッピー、1つ・・・システム制御
部、22・・・帳票イメージ、23・・・シートバッフ
ァ12の垂直射影、24・・・シートバッファ12の水
平射影。 1a1  図 第2図
FIG. 1 is a block diagram for explaining an optical character reading device according to an embodiment of the present invention, and FIG. 2 is a block diagram for explaining the relationship with the sheet buffer and sheet size detection section shown in FIG. 1 above. This is a diagram. 11... Photoelectric conversion unit, 12... Sheet buffer, 1
3... Sheet size detection unit, 14... Recognition unit, 15
. . . Dictionary, 16 . Vertical projection, 24...Horizontal projection of the sheet buffer 12. 1a1 Figure 2

Claims (1)

【特許請求の範囲】 光学的走査により帳票を読み取り、画像データを出力す
る光電変換部と、 この光電変換部から出力される画像データを帳票単位で
格納するシートバッファと、 このシートバッファ部に格納された画像データに基づき
帳票サイズを検出し、シートサイズ情報を出力するシー
トサイズ検出手段と、 このシートサイズ検出手段から出力されたシートサイズ
情報に基づいて、文字認識を行なうためのフォーマット
コントロールデータを出力するフォーマットコントロー
ルデータ出力手段と、上記フォーマットコントロールデ
ータに基づいて上記シートバッファに格納された画像デ
ータから文字認識を行なう文字認識手段と、 上記シートサイズ情報に基づいて文字認識後の帳票をサ
イズごとに該当するポケットに分類格納するソータ手段
とを具備したことを特徴とする文字読取装置。
[Scope of Claims] A photoelectric conversion unit that reads a form by optical scanning and outputs image data; a sheet buffer that stores the image data output from the photoelectric conversion unit in units of forms; and a sheet buffer that stores the image data in the sheet buffer unit. sheet size detection means for detecting the form size based on the image data and outputting sheet size information; and format control data for character recognition based on the sheet size information output from the sheet size detection means. A format control data output means for outputting, a character recognition means for performing character recognition from the image data stored in the sheet buffer based on the format control data, and a form for each size after character recognition based on the sheet size information. A character reading device characterized by comprising: a sorting means for sorting and storing the characters in corresponding pockets.
JP61017806A 1986-01-31 1986-01-31 Character reader Pending JPS62177682A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61017806A JPS62177682A (en) 1986-01-31 1986-01-31 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61017806A JPS62177682A (en) 1986-01-31 1986-01-31 Character reader

Publications (1)

Publication Number Publication Date
JPS62177682A true JPS62177682A (en) 1987-08-04

Family

ID=11953969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61017806A Pending JPS62177682A (en) 1986-01-31 1986-01-31 Character reader

Country Status (1)

Country Link
JP (1) JPS62177682A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60201482A (en) * 1984-03-26 1985-10-11 Fujitsu Ltd Optical reader

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60201482A (en) * 1984-03-26 1985-10-11 Fujitsu Ltd Optical reader

Similar Documents

Publication Publication Date Title
JPH0221383A (en) Optical character reader
JPS62177682A (en) Character reader
JPH06103358A (en) Image input device
JP3394162B2 (en) Form classification processing system
JP2009011874A (en) Business form sorting method, and optical character reading system using the same
JPS5949671A (en) Optical character reader
JP2606816B2 (en) Character reader
JPH01259476A (en) Character reader
JPH03212779A (en) Device for recognizing character
JP2722550B2 (en) Optical character reader
JPS63257081A (en) Document input system
JP2002342709A (en) Method for processing various slips
JPH08272884A (en) Form classifying and processing method and system
JPS62177686A (en) Optical character reader
JPH04109380A (en) Optical character reader
JPH0765124A (en) Character recognition device
JPS61196382A (en) Character segmenting system
JPH04251395A (en) Optical character/graphic reader
JPH04139593A (en) Postal code number recognition device
JP2002052365A (en) Sorting device and sorting treatment method
JPH0273468A (en) Electronic filing system
JPS6277684A (en) Optical reader
JPH08249421A (en) Recognizing method for reverse character
JPH0434468B2 (en)
JP2002216066A (en) Data inputting method and form classifying device