JPH0934988A - Character recognizing sheet and processor for the same - Google Patents

Character recognizing sheet and processor for the same

Info

Publication number
JPH0934988A
JPH0934988A JP7178516A JP17851695A JPH0934988A JP H0934988 A JPH0934988 A JP H0934988A JP 7178516 A JP7178516 A JP 7178516A JP 17851695 A JP17851695 A JP 17851695A JP H0934988 A JPH0934988 A JP H0934988A
Authority
JP
Japan
Prior art keywords
character
image
control information
recognition
recognition processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7178516A
Other languages
Japanese (ja)
Inventor
Kiyonori Sekiguchi
清典 関口
Hiroshi Sasa
博司 佐々
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP7178516A priority Critical patent/JPH0934988A/en
Publication of JPH0934988A publication Critical patent/JPH0934988A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide versatility and the degree of freedom for the format of a character recognizing sheet and to provide flexibility for the kind of the format and the purpose of use by providing a mark for read timing control for images described in a character description column and control information column. SOLUTION: The reading of an OCR sheet 1 by a scanner 2 is performed by detecting the timing mark. When the timing mark is detected, based on the position where this timing mark is detected, image data at the part of the character description column (frame) and image data in the control information description column at the position corresponding to this character description column are read and stored in a memory 11. First of all, the recognition of control information is performed corresponding to the image data read from the control information description column. Next, the processing routine of image data read from the character description column is selected based on the recognized result of this control information. That processing routines is divided into 16 and any one of them is executed according to the recognized result of control information.

Description

【発明の詳細な説明】Detailed Description of the Invention

【発明の属する技術分野】本発明は、手書きデータの機
械処理に使用される文字認識シートおよびその処理装置
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition sheet used for machine processing of handwritten data and a processing apparatus therefor.

【従来の技術】従来の文字認識シートは、認識すべき文
字が入力されている文字記入欄と、この文字記入欄に記
入された画像の読取タイミング制御用のマークとがあら
かじめ印刷により設けられていた。また、上述した文字
認識シートの認識処理を行なう従来の文字認識処理装置
は、上記読取タイミング制御用のマークにより上記文字
記入欄を読取位置を特定し、この位置特定した文字記入
欄に記入されている画像を読み取って認識処理するよう
に構成されていた。このとき、上記文字認識シートの各
文字記入欄に記入される文字の種類は、記入欄の位置ご
とにあらかじめ指定されていて、この指定に基づいて各
文字記入欄に記入された画像の認識処理を行なってい
た。たとえば、「0」〜「9」の数字が指定された文字
記入欄については、その文字記入欄に記載された画像が
数字であるとの前提により、記入された数字が「0」〜
「9」のいずれであるかを認識する処理が実行される。
同様に、「A」〜「Z」のアルファベット文字が指定さ
れた文字記入欄については、その文字記入欄に記載され
た画像がアルファベットであるとの前提により、記入さ
れたアルファベット「A」〜「Z」のいずれであるかを
認識する処理が実行される。このように、文字記入欄の
位置ごとにあらかじめ文字種等の属性を指定して置くこ
とにより、その文字記入欄に記入された画像からの文字
認識処理を高効率かつ高確度で行なわせることができ
る。
2. Description of the Related Art In a conventional character recognition sheet, a character entry field in which a character to be recognized is entered and a mark for controlling the reading timing of the image entered in the character entry field are provided in advance by printing. It was Further, the conventional character recognition processing device for performing the recognition processing of the character recognition sheet described above specifies the reading position of the character entry box by the mark for the reading timing control, and the reading position is specified in the specified character entry field. It is configured to read an existing image and perform recognition processing. At this time, the type of characters to be entered in each character entry field of the above character recognition sheet is specified in advance for each position of the entry field, and the recognition processing of the image entered in each character entry field based on this specification. Was being done. For example, regarding a character entry field in which a number of “0” to “9” is designated, the entered number is “0” to “” on the assumption that the image described in the character entry field is a number.
A process of recognizing which of "9" is performed is executed.
Similarly, regarding the character entry fields in which alphabetic characters “A” to “Z” are designated, the written alphabets “A” to “” are assumed on the assumption that the image described in the character entry field is the alphabet. Processing for recognizing which of the “Z” is performed is executed. In this way, by previously specifying the attributes such as the character type for each position of the character entry field, it is possible to perform the character recognition process from the image entered in the character entry field with high efficiency and high accuracy. .

【発明が解決しようとする課題】しかし、かかる構成に
よれば、文字認識シートのフォーマットに汎用性と自由
度がなく、認識処理が可能なフォーマットの種類があら
かじめ限定されてしまうとともに、各フォーマットの用
途がそれぞれ単一種類に限定されてしまう、という問題
があった。上述の問題は以下の理由で生じる。すなわ
ち、文字認識シートに記入された文字の認識処理は、そ
の文字が記入されている記入欄の位置によって判定され
る文字属性に基づいて行なわれる。この記入欄の位置と
文字属性との関係はあらかじめ登録設定する必要があ
り、それ以外については文字認識の処理を行なうことが
できない。このため、認識処理が可能なフォーマットの
種類があらかじめ限定されてしまうとともに、各フォー
マットの種類がそれぞれ単一用途に限定されてしまうこ
とになる。本発明は、上述した課題に鑑みてなされたも
ので、文字認識シートのフォーマットに汎用性と自由度
を持たせ、これによりフォーマットの種類および用途に
融通性を持たせることができる文字認識シートおよびそ
の処理装置を提供することを目的とする。
However, according to such a configuration, the format of the character recognition sheet does not have versatility and flexibility, the types of formats that can be recognized are limited in advance, and the format of each format is limited. There is a problem that the usage is limited to a single type. The above problem occurs for the following reasons. That is, the recognition process of the character entered on the character recognition sheet is performed based on the character attribute determined by the position of the entry field in which the character is entered. The relationship between the position of this entry field and the character attribute must be registered and set in advance, and otherwise the character recognition process cannot be performed. Therefore, the types of formats that can be recognized are limited in advance, and the types of each format are limited to a single use. The present invention has been made in view of the above-mentioned problems, and a character recognition sheet having a versatility and flexibility in the format of the character recognition sheet, which allows flexibility in the type and use of the format, and It is an object to provide the processing device.

【課題を解決するための手段】本発明は上述の課題を解
決するため、文字認識シートには、認識すべき文字が入
力されている文字記入欄と、この文字記入欄に記入され
る文字の認識処理に関する制御情報が記入される制御情
報欄と、上記文字記入欄および上記制御情報欄に記入さ
れた画像の読取タイミング制御用のマークという構成を
備える。また、文字認識処理装置には、文字記入領域と
制御情報領域とが対応づけられた複数の記入欄を有する
印刷シート上に記入された画像を読み取る読取手段と、
この読取手段により読みとられた画像から文字画像と制
御情報を区分して抽出する画像制御部と、上記文字画像
を格納する第1の記憶手段と、上記制御情報を格納する
第2の記憶手段と、この第2の記憶手段に格納された制
御情報を解析して認識処理の指定を行なう解析手段と、
この解析手段により指定される認識処理を用いて上記第
1の記憶手段に格納された文字画像の認識処理を行なう
認識処理手段という構成を備える。
In order to solve the above-mentioned problems, the present invention provides a character recognition sheet in which a character entry field in which a character to be recognized is entered and a character entry field. It is provided with a control information field in which control information regarding the recognition process is entered, and a mark for controlling the reading timing of the image entered in the character entry field and the control information field. Further, the character recognition processing device, a reading means for reading an image written on a print sheet having a plurality of entry fields in which a character entry area and a control information area are associated with each other,
An image control unit that distinguishes and extracts a character image and control information from the image read by the reading unit, a first storage unit that stores the character image, and a second storage unit that stores the control information. And an analysis unit that analyzes the control information stored in the second storage unit and specifies the recognition process.
The recognition processing means is provided for recognizing the character image stored in the first storage means by using the recognition processing designated by the analyzing means.

【発明の実施の形態】以下、本発明の実施例を図を参照
しながら説明する。なお、図において、同一符号は同一
または相当部分を示すものとする。図1は本発明の一実
施例による文字認識処理装置の概略構成を示すものであ
って、1は文字認識シートとしてのOCRシート、2は
読取手段としてのスキャナー、3は画像制御部、4は認
識情報格納メモリー、5は制御情報解析部、6は文字認
識処理部、11は制御画像データ格納メモリー、12は
認識出力データを格納するデータ格納メモリー、13は
OCRフォーマット情報格納部である。ここで、OCR
シート1は、詳細は後述するが、文字記入領域と制御情
報領域とが対応づけられた複数の記入欄を有する。スキ
ャナー2は、結像光学系をなすレンズ7、CCDイメー
ジセンサ8、読取制御部9、A/D変換器10などによ
り構成され、OCRシート1の読み取りを行なう。画像
制御部3は、スキャナー2が読み取った画像データか
ら、文字情報を含む文字画像データと制御情報を含む制
御画像データを抽出する。認識情報格納メモリー(第1
の記憶手段)4は上記文字画像データと制御画像データ
を一時的に格納する。この認識情報格納メモリー4に格
納されたデータは文字画像データと制御画像データとに
分別され、文字画像データは文字認識処理部6へ転送さ
れて格納され、制御画像データは制御画像データ格納メ
モリー(第2の記憶手段)11へ転送されて格納され
る。制御情報解析部5は、制御画像データメモリー11
に格納された制御情報を解析して認識処理プログラム
(認識アナロジー)の指定を行なう。文字認識処理部6
は、制御情報解析部5により指定される認識処理プログ
ラムを用いて、上記認識情報格納メモリー4に格納され
た文字画像データの文字認識処理を実行する。この実行
により認識された文字データはデータ格納メモリー12
に格納される。図2は本発明の一実施例によるOCRシ
ート(認識シート)の概略構成を示す。先ず、同図
(a)において、1はOCRシート、101は認識すべ
き文字が入力されている文字記入欄、102は文字記入
欄101に記入される文字の認識処理に関する制御情報
が記入される制御情報欄、103上記文字記入欄101
および上記制御情報欄102に記入された画像の読取タ
イミング制御用のマークをそれぞれ示す。同図(b)は
上記文字記入欄101と上記制御情報欄102の一つだ
けを取り出して示す。この場合、文字記入欄101と制
御情報欄102は互いに対応させられている。図3は制
御情報欄102に記入される制御情報とその定義の例を
示す。同図に示す例の場合、各制御情報欄はそれぞれ4
列1行のマーキング枠(マス)にて構成され、各マーキ
ング枠内を塗りつぶすかどうかの組み合せにより、認識
処理方法を定めるための各種の定義が表現されるように
なっている。この場合の定義としては、たとえば次のよ
うなものが用意されている。先ず、図3の左欄について
は、たとえば以下の(1)〜(7)のように、個々の文
字記入欄に対する定義が行なわれる。 (1)4列のマスのすべてがブランク(空白)の場合
は、この制御情報欄102に対応する文字記入欄の文字
属性が数字であると定義され、この定義により数字専用
の文字認識プログラムが指定される。 (2)4列のマスのうち、1列目がマーク(塗りつぶ
し)であって、2,3,4列目がブランク(空白)の場
合は、この制御情報欄102に対応する文字記入欄に対
する認識制御が「英字」であると定義され、この定義に
より英字専用の認識プログラムが指定される。 (3)4列のマスのうち、2列目がマーク(塗りつぶ
し)であって、1,3,4列目がブランク(空白)の場
合は、この制御情報欄102に対応する文字記入欄に対
する認識制御が「カタカナ」であると定義され、この定
義によりカタカナ専用の認識プログラムが指定される。 (4)4列のマスのうち、1,2列目がマーク(塗りつ
ぶし)であって、3,4列目がブランク(空白)の場合
は、この制御情報欄102に対応する文字記入欄に対す
る認識制御が「イメージ」であると定義され、この場合
は、対応する文字記入欄内の画像がそのままイメージ情
報として扱われる。 (5)3列目がマーク(塗りつぶし)であって、1,
2,4列目がブランク(空白)の場合は、対応する文字
記入欄に対する認識制御が「癖字」であると定義され
て、癖字専用の認識プログラムが指定される。 (6)1,3列目がマーク(塗りつぶし)であって、
2,4列目がブランク(空白)の場合は、対応する文字
記入欄に対する認識制御が「反転」であると定義され
て、その反転に対応する認識プログラムが指定される。 (7)2,3列目がマーク(塗りつぶし)であって、
1,5列目がブランク(空白)の場合は、対応する文字
記入欄に対する認識制御が「音声読み上げ」であると定
義されて、その音声読み上げに対応する認識プログラム
が指定される。 次に、図3の右欄については、たとえば以下の(1)〜
(7)のように、行単位あるいは複数の文字記入欄に対
する一括の定義が行なわれる。すなわち、4列目がマー
ク(塗りつぶし)の場合は、左欄の1〜3列目のマーク
/ブランクパターンに対応する定義が行単位で一括して
行なわれる。たとえば、1〜3列目のマーク/ブランク
パターンが「ブランク/マーク/ブランクの場合、左欄
では「カタカナ」が個別に定義されるが、右欄ではその
「カタカナ」が行単位で一括定義される。図4はOCR
シートから文字等を認識処理する際の処理フローチャー
トの一例を示す。同図において、スキャナーによるOC
Rシートの読み取りは、タイミングマークを検出するこ
とから行なわれる。タイミングマークが検出されると、
このタイミングマークの検出位置に基づいて、文字記入
欄(枠)部分の画像データとこの文字記入欄に位置対応
する制御情報記入欄の画像データを読み取ってメモリー
に格納する。そして、まず、制御情報記入欄から読み取
った画像データにより、制御情報(OMR)の認識を行
なう。次に、この制御情報の認識結果に基づき、文字記
入欄から読み取られた画像データの処理ルーチンを選択
する。図4に示した例では、その処理ルーチンが16に
分かれていて、そのいずれか一つが上記制御情報の認識
結果に従って実行される。図5はOCRシート(認識シ
ート)の別の実施例の要部を示す。図2に示した実施例
では、文字記入欄(枠)101と制御情報記入欄102
は1対1で対応させられて設けられていたが、図5の
(a)(b)に示す実施例では、文字記入欄101の1
行に対して制御情報記入欄102は一つだけ設けられて
いる。この場合でも、各行の1つずつの制御情報記入欄
102にそれぞれ行単位の指定を行なうマーク102−
4を付すことにより、その行内のすべての文字記入欄1
01に対する処理プログラムの指定を行なうことができ
る。この場合、行単位の指定を行なうマーク102−4
いわゆる行指定マーク102−4は、あらかじめマーク
(塗りつぶし)に印刷しておくことにより、記入者の手
間を大幅に省くことができる。図6は、図5に示したよ
うな行指定マークを含むOCRシートを認識処理する際
の処理フローチャートの一例を示す。同図に示す処理で
は、文字記入欄の読み取りおよびメモリーへの格納が行
単位で行なわれる。また、制御情報記入欄から読み取ら
れた画像データから行指定マークが認識されたか否かを
フラグ登録することが行なわれる。文字記入欄からの読
み取られた画像データの認識処理ルーチン(R1〜R1
6)は、制御情報記入欄から読み取られた画像データの
認識結果に従って選択される。各認識処理ルーチン(R
1〜R16)内ではそれぞれ、上記フラグ登録の有無す
なわち行指定マークの有無に応じて、個別の枠単位また
は行単位での認識処理を実行する。制御情報欄の認識結
果により文字認識処理ルーチンが選択された場合は、そ
の認識文字のキャラクタコードがメモリー出力される。
また、制御情報欄の認識結果によりイメージ処理ルーチ
ン(R16)が選択された場合は、対応する文字記入欄
からの読み取り画像データはイメージファイル番号を付
与されてメモリーへ出力される。図7は、図1に示した
OCRフォーマット情報格納部13の内容例を示す。O
CRフォーマット情報格納部13には、上述したきた認
識処理を行なうためのフォーマット情報が格納されてい
る。同図において、領域14は、タイミングマークのサ
イズ規格、OCRシートのサイズ規格、文字間間隔、文
字数最大等の一般フォーマットタイプが記されている。
領域15には、タイミングマーク総数、原稿先端から先
頭マーク(タイミングマーク)までの距離、各マーク間
の距離、および認識制御コードと制御定義内容を対照さ
せた認識制御テーブル16など、読み取りおよび認識処
理に必要な固有情報が記されている。さらに、定型のO
CRシートに対する認識処理のために、特定の認識制御
テーブル161も設けられている。この特定認識制御テ
ーブル161には、認識処理プログラムおよび各種処理
パラメータがあらかじめ定められている定型のOCRシ
ートを認識処理する際に利用される。図8はOCRシー
ト1にてイメージ処理箇所を枠単位で指定する場合の例
を示す。同図に示すように、1行の文字記入欄の中の1
つ枠に位置対応する制御情報欄にてイメージ処理を指定
する記入を行なえば、その文字記入欄(枠)から読み取
られる画像データだけをイメージ情報として処理させる
ことができる。図9はOCRシート1にてイメージ処理
箇所を行単位で指定する場合の例を示す。この場合は、
タイミングマーク103にて指示される各行の頭にある
制御情報欄にてイメージ処理を指定する記入を行なえ
ば、行単位でのイメージ処理指定を行なうことができ
る。図10は1行中に文字(たとえば、数字、英字、カ
タカナ)とイメージを混在して指定する場合の例を示
す。この場合は、文字記入欄(枠)101と制御情報記
入欄102とを1対1で設けたOCRシート1を使用
し、各制御情報欄にそれぞれに制御情報を記入すること
により、1行中に複数の文字種とイメージを混在させる
ことができる。図11はOCRシート1にて、指定エリ
ア内に複数のイメージエリアをX,Yの座標で指定する
場合の例を示す。同図において、(X11,Y11),
(X21,Y21)は各イメージエリアの左上端を、
(X12,Y12),(X22,Y22)は各イメージ
エリアの左下欄をそれぞれ指定する。これらの座標情報
は、たとえば図7の特定認識テーブル161から与えら
れる。図12はOCRシート1にて、マーク外をイメー
ジエリアとして処理させる場合の例を示す。この例で
は、タイミングマーク103にて指示された領域外をあ
らかじめイメージエリアとみなして処理させる。図13
はOCRシート1にて、図11の場合と同様、X,Y座
標で指定した任意領域をイメージエリアとする場合の例
を示す。その座標情報(X1,Y1)−(X2,Y2
は、たとえば図7の特定認識テーブル161から与えら
れる。図14は、本発明による文字認識処理装置の動作
フローチャートの一実施例を示す。同図において、OC
Rシートの読み取りを開始して最初に実行されるルーチ
ンR1では、タイミングマークの検出を行ない、このタ
イミングマークの検出位置を基準にして切り出される画
情報から制御情報を検出し、この制御情報に基づいて行
指定の有無を判定する。ここで、行指定無しと判定され
た場合は、ルーチンR2にて、文字ごとの制御情報に基
づき、1文字ずつ文字属性を判定しながら文字認識処理
を行なう。また、行指有りと判定された場合は、ルーチ
ンR3にて、行ごとの制御情報に基づき、行単位で文字
属性を判定しながら各行内の文字認識処理を行なう。こ
のとき、文字ごとの制御情報あるいは行ごとの制御情報
は「イメージ」を指定する場合もある。この場合は、そ
の「イメージ」が指定された部分の情報をイメージファ
イルとして処理する。図15はイメージファイルの格納
フォーマット例を示す。同図に示すように、イメージ情
報は、実情報であるイメージデータ(圧縮データ)ファ
イル4Aと、その格納先アドレスを検索するためのイメ
ージ検索ファイル4Bとに分けてファイル化される。図
16は、上記イメージ検索ファイル4Bからイメージデ
ータファイル4Aを検索して送信出力させるときの処理
の流れをブロック化して示したものである。同図におい
て、イメージデータ格納メモリー41に格納されたイメ
ージデータは、イメージ検索ファイル4Bから与えられ
るアドレス情報に基づいて選択的に読み出され、文字コ
ードデータとともに送信出力される。この場合、制御情
報によってイメージ処理が指定された文字等の画像は、
データ圧縮部31にてMH符号化方式の圧縮データに変
換されてからイメージデータ格納メモリー41に格納さ
れている。このMH圧縮されて格納されたデータが、イ
メージ検索ファイル4Bから与えられるアドレス情報に
基づいて選択的に出力される。図17は、OCRシート
1において、文属性などを指定する制御情報を認識ソフ
ト指定項として、文字等の記入枠とは別の領域にまとめ
て配置させる場合を示す。同図において、(a)はOC
Rシート1の一部を示する。このOCRシート1には文
字記入欄101が設けられているが、この文字記入欄1
01の画像情報を認識処理するためのプログラム情報す
なわち文字属性等の制御情報については、(b)に示す
ように、文字記入欄101とは別に設けられた認識ソフ
ト指定項110の中にまとめて記載されている。つま
り、文字記入欄101に記載されている文字等を認識す
るためのプログラム情報が、認識ソフト指定項110内
に一括して記載されている。この認識ソフト指定項11
0はOCRシート1上のあらかじめ指定された領域に置
かれる。図18は、図17のOCRシート1を認識処理
する場合のフローチャートの一例を示す。同図におい
て、OCRシートの読み取りを開始して最初に実行され
るルーチンR1では、タイミングマークの検出を行な
い、このタイミングマークの検出位置を基準にして切り
出される画情報から上記認識ソフト指定項110の有無
が検索される。ここで、認識ソフト指定項110が無か
った場合、つまり認識ソフト指定項が無効であった場合
は、ルーチンR2にて、文字記入欄ごとに設けられた制
御情報記入欄の制御情報に基づく認識処理が実行され
る。他方、認識ソフト指定項110が合った場合、つま
り認識ソフト指定項が有効であった場合は、ルーチンR
3にて、その認識ソフト指定項110内の制御情報に基
づく認識処理が実行される。以上のように、本実施例に
よれば、文字画像とこの文字画像を認識処理する際に必
要となる属性等の制御情報のどちらも認識シートから取
得することができるため、文字認識シートのフォーマッ
トに汎用性と自由度を持たせることができ、これにより
フォーマットの種類および用途に融通性を持たせること
が可能となる。なお、本発明は上述した実施例に限定さ
れるものではなく、上述した以外にも種々の実施態様が
可能である。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. In the drawings, the same reference numerals denote the same or corresponding parts. FIG. 1 shows a schematic configuration of a character recognition processing apparatus according to an embodiment of the present invention, in which 1 is an OCR sheet as a character recognition sheet, 2 is a scanner as a reading means, 3 is an image controller, and 4 is A recognition information storage memory, 5 is a control information analysis unit, 6 is a character recognition processing unit, 11 is a control image data storage memory, 12 is a data storage memory for storing recognition output data, and 13 is an OCR format information storage unit. Where OCR
The sheet 1 has a plurality of entry fields in which a character entry area and a control information area are associated with each other, the details of which will be described later. The scanner 2 is composed of a lens 7 forming an imaging optical system, a CCD image sensor 8, a reading control unit 9, an A / D converter 10, and the like, and reads the OCR sheet 1. The image control unit 3 extracts character image data including character information and control image data including control information from the image data read by the scanner 2. Recognition information storage memory (first
Storage means 4) temporarily stores the character image data and the control image data. The data stored in the recognition information storage memory 4 is separated into character image data and control image data, the character image data is transferred to and stored in the character recognition processing unit 6, and the control image data is stored in the control image data storage memory ( It is transferred to and stored in the second storage means) 11. The control information analysis unit 5 includes a control image data memory 11
The control information stored in is analyzed to specify the recognition processing program (recognition analogy). Character recognition processing unit 6
Performs a character recognition process of the character image data stored in the recognition information storage memory 4 using a recognition processing program designated by the control information analysis unit 5. The character data recognized by this execution is the data storage memory 12
Stored in. FIG. 2 shows a schematic structure of an OCR sheet (recognition sheet) according to an embodiment of the present invention. First, in FIG. 1A, 1 is an OCR sheet, 101 is a character entry field in which characters to be recognized are entered, and 102 is control information regarding the recognition process of the characters entered in the character entry field 101. Control information column, 103 Character entry column 101
And the marks for controlling the reading timing of the image entered in the control information column 102, respectively. FIG. 2B shows only one of the character entry field 101 and the control information field 102. In this case, the character entry field 101 and the control information field 102 are associated with each other. FIG. 3 shows an example of control information entered in the control information column 102 and its definition. In the case of the example shown in the figure, each control information column is 4
The marking frame (mass) is arranged in one row in each column, and various definitions for defining the recognition processing method are expressed by a combination of whether or not each marking frame is filled. In this case, the following definitions are prepared, for example. First, with respect to the left column of FIG. 3, each character entry column is defined as in (1) to (7) below. (1) If all of the cells in the four columns are blank (blank), the character attribute of the character entry field corresponding to this control information field 102 is defined to be a number, and by this definition, a character recognition program dedicated to numbers is used. It is specified. (2) If the first column is a mark (fill) and the second, third, and fourth columns are blanks (blanks) among the cells in the four columns, the character entry column corresponding to the control information column 102 The recognition control is defined to be "alphabetic", and this definition specifies a recognition program dedicated to alphabetic characters. (3) In the case where the second column is a mark (fill) and the first, third, and fourth columns are blanks (blanks) among the cells in the fourth column, the character entry column corresponding to the control information column 102 The recognition control is defined as "katakana", and this definition specifies a recognition program dedicated to katakana. (4) In the case where the first and second columns are the mark (fill) and the third and fourth columns are blank (blank) in the squares of the fourth column, the character entry column corresponding to the control information column 102 The recognition control is defined as "image", and in this case, the image in the corresponding character entry field is directly treated as image information. (5) The third column is a mark (fill),
When the 2nd and 4th columns are blank (blank), the recognition control for the corresponding character entry field is defined as "habit character", and the recognition program dedicated to the habit character is designated. (6) The first and third columns are marks (fills),
When the second and fourth columns are blank (blank), the recognition control for the corresponding character entry field is defined as "reverse", and the recognition program corresponding to the reverse is designated. (7) The second and third columns are marks (painted),
When the first and fifth columns are blank (blank), the recognition control for the corresponding character entry field is defined as "speech reading", and the recognition program corresponding to the speech reading is designated. Next, regarding the right column of FIG. 3, for example, the following (1) to
As in (7), a batch definition is made for each line or for a plurality of character entry fields. That is, when the fourth column is a mark (filling), the definitions corresponding to the marks / blank patterns in the first to third columns in the left column are collectively performed on a row-by-row basis. For example, if the mark / blank pattern in the 1st to 3rd columns is “blank / mark / blank,” “Katakana” is individually defined in the left column, but that “Katakana” is collectively defined in line units in the right column. It Figure 4 is OCR
An example of the processing flowchart at the time of performing a character etc. recognition process from a sheet | seat is shown. In the figure, the OC by the scanner
Reading the R sheet is performed by detecting the timing mark. When the timing mark is detected,
Based on the detected position of the timing mark, the image data of the character entry field (frame) and the image data of the control information entry field corresponding to the position of this character entry field are read and stored in the memory. Then, first, the control information (OMR) is recognized based on the image data read from the control information entry field. Next, the processing routine of the image data read from the character entry field is selected based on the recognition result of the control information. In the example shown in FIG. 4, the processing routine is divided into 16 and any one of them is executed according to the recognition result of the control information. FIG. 5 shows a main part of another embodiment of the OCR sheet (recognition sheet). In the embodiment shown in FIG. 2, the character entry column (frame) 101 and the control information entry column 102
Are provided in a one-to-one correspondence, but in the embodiment shown in FIGS.
Only one control information entry field 102 is provided for each row. Even in this case, the mark 102 for designating each line in the control information entry column 102 of each line
By adding 4, all character entry fields in that line 1
A processing program for 01 can be designated. In this case, the mark 102-4 for designating a line unit
By printing the so-called line designation mark 102-4 on the mark (fill-in) in advance, the time and effort of the writer can be greatly saved. FIG. 6 shows an example of a processing flowchart when the recognition processing is performed on the OCR sheet including the row designation mark as shown in FIG. In the process shown in the figure, reading of the character entry field and storage in the memory are performed in units of lines. Further, a flag is registered whether or not the line designation mark is recognized from the image data read from the control information entry field. A recognition processing routine for the image data read from the character entry field (R1 to R1
6) is selected according to the recognition result of the image data read from the control information entry field. Each recognition processing routine (R
1 to R16), recognition processing is executed in individual frame units or line units according to the presence or absence of the flag registration, that is, the presence or absence of the line designation mark. When the character recognition processing routine is selected according to the recognition result in the control information column, the character code of the recognized character is output to the memory.
When the image processing routine (R16) is selected according to the recognition result in the control information column, the image data read from the corresponding character entry column is output to the memory with an image file number. FIG. 7 shows an example of the contents of the OCR format information storage unit 13 shown in FIG. O
The CR format information storage unit 13 stores format information for performing the above-described recognition process. In the figure, in the area 14, general format types such as the timing mark size standard, the OCR sheet size standard, the inter-character spacing, and the maximum number of characters are described.
The area 15 includes the total number of timing marks, the distance from the leading edge of the document to the leading mark (timing mark), the distance between the marks, and the recognition control table 16 that compares the recognition control code with the control definition content. The required specific information is described in. Furthermore, the standard O
A specific recognition control table 161 is also provided for the recognition processing on the CR sheet. The specific recognition control table 161 is used when performing a recognition process on a standard OCR sheet in which a recognition process program and various process parameters are predetermined. FIG. 8 shows an example of the case where the image processing location is designated in the OCR sheet 1 in units of frames. As shown in the figure, 1 in the character entry field on one line
By making an entry for designating image processing in the control information column corresponding to the position of one frame, only the image data read from the character entry column (frame) can be processed as image information. FIG. 9 shows an example in which the image processing location is designated in the OCR sheet 1 in units of lines. in this case,
If the image processing is designated in the control information column at the head of each line designated by the timing mark 103, the image processing can be designated on a line-by-line basis. FIG. 10 shows an example in which characters (for example, numbers, letters, and katakana) and images are mixedly specified in one line. In this case, the OCR sheet 1 in which the character entry fields (frames) 101 and the control information entry fields 102 are provided in a one-to-one manner is used, and the control information is entered in each control information field, so that one line Multiple character types and images can be mixed in. FIG. 11 shows an example in which a plurality of image areas are designated in the designated area by the X and Y coordinates on the OCR sheet 1. In the figure, (X11, Y11),
(X21, Y21) is the upper left corner of each image area,
(X12, Y12) and (X22, Y22) designate the lower left columns of the respective image areas. These pieces of coordinate information are given from the specific recognition table 161 of FIG. 7, for example. FIG. 12 shows an example in which the outside of the mark is processed as an image area on the OCR sheet 1. In this example, the area outside the area designated by the timing mark 103 is regarded as an image area in advance and processed. FIG.
In the OCR sheet 1, as in the case of FIG. 11, an example in which an arbitrary area designated by X and Y coordinates is used as an image area is shown. The coordinate information (X1, Y1)-(X2, Y2
Is given from the specific recognition table 161 of FIG. 7, for example. FIG. 14 shows an embodiment of an operation flowchart of the character recognition processing apparatus according to the present invention. In the figure, OC
In the routine R1 which is first executed after starting the reading of the R sheet, the timing mark is detected, the control information is detected from the image information cut out based on the detected position of this timing mark, and based on this control information The presence or absence of line designation. If it is determined that no line is designated, the routine R2 performs character recognition processing while determining the character attribute of each character based on the control information for each character. If it is determined that the line finger is present, the routine R3 performs the character recognition process in each line while determining the character attribute for each line based on the control information for each line. At this time, "image" may be designated as the control information for each character or the control information for each line. In this case, the information of the portion designated by the "image" is processed as an image file. FIG. 15 shows an example of the storage format of the image file. As shown in the figure, the image information is divided into an image data (compressed data) file 4A which is actual information and an image search file 4B for searching the storage destination address thereof and is made into a file. FIG. 16 is a block diagram showing the flow of processing when the image data file 4A is searched from the image search file 4B and is transmitted and output. In the figure, the image data stored in the image data storage memory 41 is selectively read out based on the address information given from the image search file 4B, and is transmitted and output together with the character code data. In this case, images such as characters for which image processing is specified by the control information are
The data is stored in the image data storage memory 41 after being converted into compressed data of the MH coding system by the data compression unit 31. The MH-compressed and stored data is selectively output based on the address information given from the image search file 4B. FIG. 17 shows a case in which control information for designating a sentence attribute or the like is collectively arranged in an area different from an entry frame for characters and the like in the OCR sheet 1 as a recognition software designation item. In the figure, (a) is OC
A part of the R sheet 1 is shown. The OCR sheet 1 is provided with a character entry field 101.
The program information for recognizing 01 image information, that is, the control information such as character attributes, is summarized in the recognition software designation item 110 provided separately from the character entry field 101, as shown in (b). Has been described. That is, the program information for recognizing the characters and the like described in the character entry field 101 is collectively described in the recognition software designation item 110. This recognition software designation item 11
0 is placed in a predetermined area on the OCR sheet 1. FIG. 18 shows an example of a flow chart when the recognition processing of the OCR sheet 1 of FIG. 17 is performed. In the figure, in the routine R1 that is first executed after starting reading the OCR sheet, the timing mark is detected, and the recognition software designation item 110 of the recognition software designation item 110 is obtained from the image information cut out based on the detection position of the timing mark. Presence / absence is searched. Here, when there is no recognition software designation item 110, that is, when the recognition software designation item is invalid, in the routine R2, the recognition processing based on the control information of the control information entry column provided for each character entry column. Is executed. On the other hand, if the recognition software designation item 110 matches, that is, if the recognition software designation item is valid, the routine R
At 3, the recognition process based on the control information in the recognition software designation item 110 is executed. As described above, according to the present embodiment, since both the character image and the control information such as attributes necessary for the recognition processing of this character image can be obtained from the recognition sheet, the character recognition sheet format The versatility and the degree of freedom can be given to the, so that it becomes possible to have flexibility in the types and uses of the formats. The present invention is not limited to the above-described embodiments, and various embodiments other than those described above are possible.

【発明の効果】以上の説明から明らかなように、本発明
は、認識すべき文字が入力されている文字記入欄と、こ
の文字記入欄に記入される文字の認識処理に関する制御
情報が記入される制御情報欄と、上記文字記入欄および
上記制御情報欄に記入された画像の読取タイミング制御
用のマークという構成を備えた文字認識シートを使用す
ることにより、文字画像とこの文字画像を認識処理する
際に必要となる属性等の制御情報のどちらも上記文字認
識シートから取得することができるため、文字認識シー
トのフォーマットに汎用性と自由度を持たせることがで
き、これによりフォーマットの種類および用途に融通性
を持たせることができる、という効果を有するものであ
る。
As is apparent from the above description, according to the present invention, the character entry field in which the character to be recognized is entered and the control information regarding the recognition process of the character entered in the character entry field are entered. A character image and this character image are recognized by using a character recognition sheet having a control information section, a character entry section, and a mark for controlling the reading timing of the image entered in the control information section. Since both of the control information such as attributes required when performing the character recognition sheet can be obtained from the character recognition sheet, it is possible to give versatility and flexibility to the character recognition sheet format. It has the effect that flexibility can be given to the intended use.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例による文字認識シートおよび
その処理装置の概略構成図
FIG. 1 is a schematic configuration diagram of a character recognition sheet and a processing apparatus thereof according to an embodiment of the present invention.

【図2】本発明の一実施例によるOCRシート(認識シ
ート)の概略構成図
FIG. 2 is a schematic configuration diagram of an OCR sheet (recognition sheet) according to an embodiment of the present invention.

【図3】制御情報欄に記入される制御情報とその定義の
例を示す図
FIG. 3 is a diagram showing an example of control information entered in a control information column and its definition.

【図4】OCRシートから文字等を認識処理する際の処
理例を示すフローチャート
FIG. 4 is a flowchart showing a processing example when recognizing characters and the like from an OCR sheet.

【図5】OCRシートの別の実施例の要部を示す図FIG. 5 is a diagram showing a main part of another embodiment of the OCR sheet.

【図6】行指定マークを含むOCRシートを認識処理す
る際の処理例を示すフローチャート
FIG. 6 is a flowchart showing a processing example when recognizing an OCR sheet including a row designation mark.

【図7】図1に示したOCRフォーマット情報格納部の
内容例を示す図
FIG. 7 is a diagram showing an example of contents of an OCR format information storage section shown in FIG.

【図8】OCRシートにてイメージ処理箇所を枠単位で
指定する場合の例を示す図
FIG. 8 is a diagram showing an example in which an image processing location is specified in frame units on an OCR sheet.

【図9】OCRシートにてイメージ処理箇所を行単位で
指定する場合の例を示す図
FIG. 9 is a diagram showing an example of a case where image processing locations are specified in units of lines on an OCR sheet.

【図10】1行中に文字とイメージを混在して指定する
場合の例を示す図
FIG. 10 is a diagram showing an example in which a character and an image are mixedly specified in one line.

【図11】OCRシートにて、指定エリア内に複数のイ
メージエリアを座標指定する場合の例を示す図
FIG. 11 is a diagram showing an example in which a plurality of image areas are coordinate-designated in a designated area on an OCR sheet.

【図12】OCRシートにて、マーク外をイメージエリ
アとして処理させる場合の例を示す図
FIG. 12 is a diagram showing an example in which the outside of the mark is processed as an image area on the OCR sheet.

【図13】OCRシート1にて、座標指定した領域をイ
メージエリアとする場合の例を示す図
FIG. 13 is a diagram showing an example in which a coordinate-designated area is used as an image area on the OCR sheet 1.

【図14】本発明による文字認識処理装置の動作フロー
チャートの一実施例を示す図
FIG. 14 is a diagram showing an embodiment of an operation flowchart of the character recognition processing apparatus according to the present invention.

【図15】イメージファイルの格納フォーマット例を示
す図
FIG. 15 is a diagram showing an example of a storage format of an image file.

【図16】イメージ検索ファイルからイメージデータを
再生して出力する処理の流れを示すブロック図
FIG. 16 is a block diagram showing the flow of processing for reproducing and outputting image data from an image search file.

【図17】OCRシートにおいて、文字等の記入枠とは
別の領域にまとめて配置させる場合を示す図
FIG. 17 is a diagram showing a case where the OCR sheet is collectively arranged in an area different from the entry frame for characters and the like.

【図18】図17のOCRシートを認識処理する場合の
処理例を示すフローチャート
FIG. 18 is a flowchart showing a processing example when the OCR sheet of FIG. 17 is recognized.

【符号の説明】[Explanation of symbols]

1 文字認識シートとしてのOCRシート 2 読取手段としてのスキャナー 3 画像制御部 4 認識情報格納メモリー 5 制御情報解析部 6 文字認識処理部 7 結像光学系をなすレンズ 8 CCDイメージセンサ 9 読取制御部 10 A/D変換器 11 制御画像データ格納メモリー 12 認識出力データを格納するデータ格納メモリー 13 OCRフォーマット情報格納部 101 文字記入欄 102 制御情報欄 103 読取タイミング制御用のマーク 110 認識ソフト指定項 31 データ圧縮部(MH圧縮部) 1 OCR sheet as a character recognition sheet 2 Scanner as a reading unit 3 Image control unit 4 Recognition information storage memory 5 Control information analysis unit 6 Character recognition processing unit 7 Lens forming an imaging optical system 8 CCD image sensor 9 Reading control unit 10 A / D converter 11 Control image data storage memory 12 Data storage memory for storing recognition output data 13 OCR format information storage unit 101 Character entry column 102 Control information column 103 Mark for read timing control 110 Recognition software designation item 31 Data compression Section (MH compression section)

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 認識すべき文字が入力されている文字記
入欄と、この文字記入欄に記入される文字の認識処理に
関する制御情報が記入される制御情報欄と、上記文字記
入欄および上記制御情報欄に記入された画像の読取タイ
ミング制御用のマークとを備えた文字認識シート。
1. A character entry field in which a character to be recognized is entered, a control information field in which control information regarding recognition processing of characters entered in the character entry field is entered, the character entry field and the control. A character recognition sheet having a mark for controlling the reading timing of the image entered in the information column.
【請求項2】 複数の文字記入欄に記入された各文字の
認識処理を一括指定する制御情報欄を有することを特徴
とする請求項1に記載の文字認識シート。
2. The character recognition sheet according to claim 1, further comprising a control information field for collectively designating recognition processing of each character entered in a plurality of character entry fields.
【請求項3】 認識すべき文字が文字種等の属性ごとに
区別されて記入される文字記入欄と、この文字記入欄全
体について上記区分に対応した認識処理プログラムを指
定する制御情報が記入される制御情報記入欄と、上記文
字記入欄に記入された画像の読取タイミング制御用のマ
ークとを有する請求項1または2に記載の文字認識シー
ト。
3. A character entry field in which characters to be recognized are distinguished by attributes such as character types, and control information designating a recognition processing program corresponding to the above classification is entered for the entire character entry field. The character recognition sheet according to claim 1, further comprising a control information entry field and a mark for controlling the reading timing of the image entered in the character entry field.
【請求項4】 認識すべき文字が記入される文字記入欄
と、この文字記入欄に記入される文字の認識処理に関す
る制御情報が記入される制御情報欄と、上記文字記入欄
および上記制御情報記入欄が設定された領域外に設けら
れた領域であってイメージ情報が記入されるイメージ記
入欄とを有する請求項1から3のいずれかに記載の文字
認識シート。
4. A character entry field in which a character to be recognized is entered, a control information field in which control information regarding the recognition processing of the character entered in this character entry field is entered, the above-mentioned character entry field and the above control information. The character recognition sheet according to any one of claims 1 to 3, further comprising: an area provided outside the area in which the entry field is set and an image entry field in which image information is entered.
【請求項5】 文字記入領域と制御情報領域とが対応づ
けられた複数の記入欄を有する印刷シート上に記入され
た画像を読み取る読取手段と、この読取手段により読み
とられた画像から文字画像と制御情報を区分して抽出す
る画像制御部と、上記文字画像を格納する第1の記憶手
段と、上記制御情報を格納する第2の記憶手段と、この
第2の記憶手段に格納された制御情報を解析して認識処
理の指定を行なう解析手段と、この解析手段により指定
される認識処理を用いて上記第1の記憶手段に格納され
た文字画像の認識処理を行なう認識処理手段とを備えた
文字認識処理装置。
5. A reading means for reading an image written on a print sheet having a plurality of entry fields in which a character entry area and a control information area are associated with each other, and a character image from the image read by the reading means. And an image control section for separately extracting control information, a first storage means for storing the character image, a second storage means for storing the control information, and a second storage means. An analyzing means for analyzing the control information and designating the recognition processing and a recognition processing means for performing the recognition processing of the character image stored in the first storage means by using the recognition processing designated by the analyzing means. A character recognition processing device provided.
【請求項6】 一つの制御情報によって複数の文字画像
に対する認識処理を一括指定する処理手段を備えたこと
を特徴とする請求項5に記載の文字認識処理装置。
6. The character recognition processing apparatus according to claim 5, further comprising processing means for collectively designating recognition processing for a plurality of character images according to one control information.
【請求項7】 制御情報によってイメージ処理が指定さ
れた文字画像をMH符号化方式の圧縮データに変換して
出力させる処理手段を備えたことを特徴とする請求項5
または6に記載の文字認識処理装置。
7. A processing means for converting a character image whose image processing is designated by the control information into compressed data of MH coding system and outputting the compressed data.
Alternatively, the character recognition processing device according to item 6.
【請求項8】 印刷シート上の制御情報領域が無記入の
場合に、特定の認識処理が指定されたものとして文字画
像の認識処理を行なうことを特徴とする請求項5または
6に記載の文字認識処理装置。
8. The character according to claim 5, wherein when the control information area on the print sheet is blank, the character image recognition process is performed assuming that a specific recognition process is designated. Recognition processing device.
【請求項9】 複数の文字記入領域を有する印刷シート
上に記入された画像を読み取る読取手段と、上記文字記
入領域の設定に関するフォーマット情報を記憶するフォ
ーマット記憶手段と、上記フォーマット情報に基づき上
記読取手段により読み取られた画像から認識すべき画像
を抽出する画像制御部と、この画像制御部により抽出さ
れた画像を格納する記憶手段と、上記文字記入領域に記
入される画像の属性に対応して認識処理プログラムを切
り替えて上記記憶手段に格納されている画像の認識処理
を行なう認識処理手段とを備えたことを特徴とする文字
認識処理装置。
9. A reading means for reading an image written on a print sheet having a plurality of character writing areas, a format storing means for storing format information relating to the setting of the character writing area, and the reading based on the format information. An image control unit for extracting an image to be recognized from an image read by the means, a storage unit for storing the image extracted by the image control unit, and an attribute of the image written in the character writing area. A character recognition processing device, comprising: a recognition processing means for switching a recognition processing program to perform recognition processing of an image stored in the storage means.
JP7178516A 1995-07-14 1995-07-14 Character recognizing sheet and processor for the same Pending JPH0934988A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7178516A JPH0934988A (en) 1995-07-14 1995-07-14 Character recognizing sheet and processor for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7178516A JPH0934988A (en) 1995-07-14 1995-07-14 Character recognizing sheet and processor for the same

Publications (1)

Publication Number Publication Date
JPH0934988A true JPH0934988A (en) 1997-02-07

Family

ID=16049845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7178516A Pending JPH0934988A (en) 1995-07-14 1995-07-14 Character recognizing sheet and processor for the same

Country Status (1)

Country Link
JP (1) JPH0934988A (en)

Similar Documents

Publication Publication Date Title
US7764923B2 (en) Material processing apparatus and method for grading material
JPH1011531A (en) Slip reader
KR100268367B1 (en) Image processing method and apparatus
CN115618847B (en) Method and device for analyzing PDF document and readable storage medium
JP4655824B2 (en) Image recognition apparatus, image recognition method, and image recognition program
CN109726369A (en) A kind of intelligent template questions record Implementation Technology based on normative document
JP2003018393A (en) Image processing system
JP2007005950A (en) Image processing apparatus and network system
JP2008108114A (en) Document processor and document processing method
US6958755B1 (en) Personalized computer fonts
JP4807618B2 (en) Image processing apparatus and image processing program
JP3319203B2 (en) Document filing method and apparatus
JP2004504650A (en) Methods and systems for form recognition and digitized image processing
JP2001052110A (en) Document processing method, recording medium recording document processing program and document processor
JPH0934988A (en) Character recognizing sheet and processor for the same
JP4894184B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP4261883B2 (en) Form processing apparatus, form processing method, and program
JPH08305791A (en) Image recognizing device and control sheet
JP4651407B2 (en) Image processing apparatus, computer program, and storage medium
JP3463300B2 (en) Mark sheet and mark sheet direction detecting method and apparatus
JP2544589B2 (en) Document processing method and apparatus
JP2682873B2 (en) Recognition device for tabular documents
JPH0661112B2 (en) Pattern recognition method
JPH0652156A (en) Method and device for processing document
JP2007033725A (en) Device, method and program for processing educational material