JPH03125285A - 入力用データ媒体・光学文字読取り装置 - Google Patents

入力用データ媒体・光学文字読取り装置

Info

Publication number
JPH03125285A
JPH03125285A JP1264140A JP26414089A JPH03125285A JP H03125285 A JPH03125285 A JP H03125285A JP 1264140 A JP1264140 A JP 1264140A JP 26414089 A JP26414089 A JP 26414089A JP H03125285 A JPH03125285 A JP H03125285A
Authority
JP
Japan
Prior art keywords
entry
character
data medium
data
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1264140A
Other languages
English (en)
Inventor
Hiromitsu Kuno
浩光 久野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP1264140A priority Critical patent/JPH03125285A/ja
Publication of JPH03125285A publication Critical patent/JPH03125285A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (分野) 本発明は、光学文字読取り装置への入力用データ媒体、
及び光学文字読取り装置に関する。以下、光学文字読取
り装;ηのことを、OR(’:というものとする。
(従来技術) 従来の01えCでは、データ媒体上の文字を、縦横のマ
トリクスに細分化された小範囲の明暗で検知し、それら
の小範囲の明暗のパターンから文字の特徴を抽出して、
文字認識していた。
しかしながら、小範囲の明暗のパターンから文字の特徴
を抽出するには、問題があった。それは、乱雑な字や癖
字は誤読してしまう事である。平仮名でさえ、「と」と
「て」と「こ」の識別が困難な文字を書く人がいる程で
ある。その為、文字認識のために、膨大、複雑なソフト
ウェアが必要であった。
もう−・つの問題は、どの程度の文字ならば正しく識別
し、どの程度の文字は誤読するのか、はっきり分らない
事である0通常、光学文字読取り装置用の用紙に記入す
る場合は、かい害で記入する規則であるが、人によって
字の大きさや形は様々である。接するべき線と線が離れ
てたり、逆に余分な線が突出ていたりする。その場合、
どの程度なら正しく読取れ、どの程度以1−だと誤読す
るのかは、O+ZCにかけないと分らない。
(解決しようとする問題点) 文字を誤読する事なく認識することが、ORCを含むシ
ステムの技術課題である。しかしながら、何等記入ルー
ルの無い文字を誤読せず認識する事は不可能である。そ
の理由は、記入ルールの無い文字は人間でさえ、識別で
きない場合が有るからである。そしてかい書記式という
記入ルールを設けても、その問題は解決されない、どこ
までがかい害で、どこまでがかい書でないかを、記入者
が判断できないからである。その為、記入者が判断でき
る、記入ルールを設ける必要がある。
そこで本発明が解決しようとする問題点は、0ItC川
の入力用データ媒体において、記入した文字が、記入ル
ール内であるかを判断できる書式ににすること、である
。そしてその入力用データ媒体用のo rt cをつく
ることである。
く解決手段) 懸かる問題の解決の為、本発明のORCに人力するデー
タ媒体の書式を、筆記する線の始点と終点の位置を限定
する書式とし、OrI Cはそのデータ媒体から文字認
識することを解決手段とするものである。
より詳しくは、光学文字読取り装置への入力用データ媒
体において、 その入力用データ媒体は、筆記始点、筆記終点の範囲を
示す、所定の大きさの記入枠が、所定の位置に、所定の
数だけ印刷してある書式である、入力用データ媒体を構
成することを手段とする。
そしてその入力用データ媒体上の文字を、光学的に検知
し、文字として認識する、光学文字読取り装置において
、 所定のデータ媒体とデータ媒体送出手段と光字文字読取
り手段からなり、 そのデータ媒体は、筆記始点、筆記終点の範囲を示す、
所定の大きさの記入枠が、所定の位置に、所定の数だけ
印刷してある書式とし、データ媒体送出手段は、そのデ
ータ媒体を1枚ずつ光学文字読取り手段へ送出す手段を
もち、光学文字読取り手段は、データ媒体中の、記入枠
と記入枠の間を繋ぐ筆記線の有無を検知し、その筆記線
の有無の組合わせから文字を認識する、ことを解決手段
とするものである。
ここでいう、筆記とは、手書きの筆記のほか、機械で印
字した文字も含むものである。またここでいう、文字と
は、−m的な文字の他に、記号も含むものである。つま
り、平仮名、片仮名、漢字、アルファベット、ギリシャ
文字、ハングル文字、絵文字の他に、数字、数学記号、
物理単位、−最記号などである。
データ媒体の、所定の位置に、所定の数だけ印刷してあ
る、−文字弁の記入枠を、以後は記入枠群というものと
する。
(fl:用) 本発明の入力用データ媒体の書式は、−文字ごとに記入
枠群を設けた横或なので、記入する文字寸法2文字形状
1文字位置を限定、統一・させる作用をもつ。
また本発明の光学文字読取り装置の光学文字読取り手段
は、文字認識の初期過程で、記入枠間を繋ぐ筆記線の有
無を検知するので、初期過程での人力データ量は、少な
くて済む、その入力データ畦は、記入枠間に引ける線の
数だけのビット数で足りる0図1に示す記入枠群で、文
字データ検知した場合、その人力データ量は、4バイト
で足りる。10個の丸は記入枠1・・・であり、記入枠
間を繋ぐ点線は記入可能な線を示す、これらの点線を記
入枠単位で区切って数えると、31本になる。
この線の有無を0,1で記憶すれば、31ビツト、つま
り4バイト足らずで一文字分の入カデータを保持できる
。UAlは、「ア1の文字を記入した場合で、記入枠間
を繋ぐ線の数は5木である。この線の有無をIOJ、1
1.1で記憶し、線の位;ξを人力データの桁に対応さ
せれば、31ビツトで入力データを保持できるわG1で
ある。
従来の方法と比較すると、その差が良く分る。
従来は、図2に示す様な、縦横に細分化した7トリクス
2・・・単位での明暗を人力データとして保持していた
為、その人力データ星は膨大にな−つていた。仮に縦横
20に細分化した7トリクス2・・・で文字データ検知
した場合、2002乗で400ビツトの人力データ敏と
なる。バイト数では50バイトにもなってしまう。
(実施例) 図3を参照として本発明の入力用データ媒体の実h1例
を説明する。
まず、図3の実線部は、データ媒体の一文字分の書式で
ある。縦横3列の記入枠1・・・と、その中央列のLに
もう一つの記入枠1・・・が、−7分の記入枠群である
。これらの記入枠群間の線の有無を肥大枠単位で区1.
11つて数えると、31本になる。
この線の有無を0.lで記憶し、 ・文字分の人力デー
タとして保持する。−文字分の人力データは、4バイト
、つまり32ビツトとする。入力用データ媒体とする上
では、この記入枠群を複数個、並べて記入欄とするもの
である6 次に、図3〜11を参照として光学文字読取り装置の説
明をする。ただしデータ媒体の工;ト明は前述の通りで
ある。またデータ媒体送出手段は、積重ねられた紙片を
、−枚ずつ紙送りしていく機械的な手段なので、詳しい
説明は略す。従来のカードリーダや、コピー機や、ファ
ックス機で用いられている、紙送出手段と等価な手段を
用いる。
光学文字読」■り手段は、データ媒体から文字データを
抽出する抽出過程と、文字データから文字認識する認識
過程からなる。まず抽出過程では、データ媒体送出手段
で送り込まれたデータ媒体の記入枠群の位置を検知する
。もちろん、−行目の一文字目から読む、その記入枠群
の記入枠間の線の有無を検知する。
記入枠間の線は限度を超えて曲か−)でいると、検知さ
れない、その許容範囲を小ずのが、図3である0点線3
・・・で許容範囲を小している。この範囲内で記入枠間
を線で繋げば、その線は有効である。基本的な記入ルー
ルは、記入枠間を直線で結ぶということである。勿論、
ここでいう直線とは人が平常に書く時の誤差を許容する
ものである。
更に計測に説明すると、まず機械がデータ媒体1・、の
明11hを、微少範囲のマトリクス2・・・で検知する
。この時点で記入枠l・・・の位置を認1する。記入枠
、つまり幾何学的に閘じた線である丸を、認識する0次
に記入枠間の許容範囲内で、時点のマトリクス2・・・
が繋がっているかを判定する。各記入枠間でその処理を
終えれば、抽出過程は完了である。
図4の場合は、左の記入枠l・・・間は5許容範囲内で
線が繋がっているので、有効である。右の記入枠】・・
・間は、許容範囲外で線が繋がっているので、無効であ
る。
次に記入枠群間の線の有無と人力データの対応を、記入
枠群の!へ位で具体的に示4゛0人力データの32ビツ
トの谷桁と、記入枠群間の線の41無を、対応させる0
図5,6に示す記入枠群の下記の数字は、人力データの
桁数を示す、−行[1,左の記入枠群から人力データを
ヘキサ表示で表してい(と、# OOOOOO(+ 1
 I−1、#000000041]、# OOOOOO
O8)(、#0O00001CHI 、 #0OOOO
040夏1、 #0O000080H、#0O0001
00H、#0OOO040011、# OOOOO80
0Hlとなり、最後の、記入枠群は、#4000000
011となる。そして1ア1の場合は、#010088
18Hである。
続いて、[46の2行1−12文字[1がらの記入枠群
の入力データを説明する。2行112文字目は何も記入
していないので、# OOOOOOOOHである。
次の記入枠群は、規則で許されてない記入枠間を繋いで
いるので、この記入線は無効である。ただ、誤記入があ
った事を32ビツト目にデータ保持することとし、#8
0000000)1になる。
次の肥大枠a丁は、記入線が途中でとぎれているが、記
入枠間を繋いでいるので、# 0080800011で
ある。
次の記入枠JjFは、用1111で1:′rされてない
記入枠間を繋いでいるので、この記入線は無効である。
ただ、誤記入があったICを32と71・11にデータ
保持するので、# 80000000 t[である。
次の記入枠群は、蛇行した線であるが、記入枠間を繋い
でいるので、この記入線は無効であり、# OOOOO
O20Hである。
次の記入枠群は、記入線が途中でとぎれているので、#
 l 0000000 Llである。
次の記入枠群は、線が多少面がっているが、その曲がり
は許容範囲内なので、#000004001−■である
次の記入枠群は、同じ記入枠間を繋いでいるが、線が許
容範囲を超えて曲がっているので、#10000000
Jiである。
次の記入枠群は、交差した線の一方がずれているが、そ
のずれは許容範囲内なので、#0O000280+1で
ある。
次の記入枠群は、同じ記入枠間を繋いでいるが、線が許
容範囲を超えて曲がっているので、#10000080
+1である。
次の記入枠群は、同じ記入枠間を塗り)1−シた場合で
、#0O040ΔA311である。
次の記入枠群は、記入枠間に点がうっである場合で、空
白ではなく、誤記入が一応あったとし、#800000
0011である。
次の記入枠群は、2文字分の記入枠群の間を繋いだ場合
で、2文字分の人力データは、#800000001−
1.#8000000(月4である。
次の記入枠群は、記入枠に点をうった場合で、# 80
000000 Nである。
次に2誤記人の場合の人力データと、その人力データか
ら文字認識する過程のjiト明をする0次の記入枠群は
rア」の誤記で、ド端部が記入枠に届いていないので、
人力データは#8000881811である0文字認識
する過程では、この人力データに該当する文字は無く、
かつ最上位ビットに1が立っているので、少なくとも1
区間の誤記入が有ることが分る。更に、入力データ#0
OOO8818Hに何か1区間の線を加えて文字にする
としたら、中央下の垂直線しかなく、その文字は「ア」
となる、ただし誤記入があったので、最上位ビットは1
で#8t008818Hとなる。あるいは、この「ア」
という文字を適宜の文字コードにしてデータ保持する1
例えばrsOG46コードのJ l5C6220(8ビ
ツトかな文字コード>、JISC6226(16ビツト
漢字コー・ド)やEBCDICコード(英数字)、AS
CIIコード(英数字)等である。勿論、他の文字コー
ドに変換せずに、4バイトのデータとしてデータ保持す
ることも可能である。印字する場合はそのまま記入枠間
の線で印字することが出来る。
次の2つの記入枠群も「ア」の誤記である。111者は
、下端部を下に真直ぐ降ろして記入するべきところを、
左斜め下の記入枠に繋いでいるので、入力データは#0
0808818Hとなる。後者は、上端から左斜め下の
記入枠に繋いでいるので、#00008418Nとなる
。 7−め、各文字の誤記入の入力データパターンを想
定しておけば、誤記入の補正認識も可能となる。
図6の5行目5文字目の記入枠群の左肩に記した丸印4
は、誤記入したため記入を取消しにする為の印とする。
この記入枠の人力データは無しになる。
続いて図7〜11にカナ文字、数字、アルファベット、
漢字、記号の記入例である0図7.8が[ア1から「ワ
ヲンJと句点、読点である。
fヤユヨ」の間に記しているのは、仲ばず音の記号の横
書き用と縦書き用である。
図9.10は数字とアルファベットで、数字は記入枠群
の右半分に記し、アルファベットは出来るだけ記入枠群
の左半分に記す様にする。
続く図10の3行目2文字目からは、カナ文字の濁音、
半濁音の記入例で、1ガ1.rバ」のカナ文字である。
4行目からは、カナ小文字の記入例で、[ア。
イ、つ、工1オ、ツ、ヤ、ユ、ヨ」でアル、カナ小文字
はそのまま記入したうえに、最」−記入枠5と右」二記
入枠6間を繋ぐものとする。
最後の記入枠群は、改行の記号である。
図11の1行「」1文字1」は、郵便番号の記号と、住
所を表す記号と、漢字1’ ifi 、区、町Jである
、例えば、予め国内の住所のデータを本装置にもってい
れば、住所記号後のカナ文字を漢字として変換して認識
することも出来る0例えば、住所記号後の入力データが
[カナガワケンカワサキ゛市ナカハラ区シンマルコ町」
であった場合、その文字を[神奈川県用崎市中原区新丸
子町1と認識することも出来る。
次の記入枠群は、電話番号、FAX番号の記号である。
次の記入枠群は、株式会社2名前を表す記号と、漢字1
才」である。
3行目の記入枠群は、男性2女性を表す記号と、漢字「
月1日」と単位「%」である。
4行目の記入枠群は、漢字「千、万1円」とカッコ記号
の’(1)Jである。
5行目の記入枠群は、時間表示の09:32である。4
桁の数字の真中に「=」の記号があることから、その文
字を「9時32分」と認識することも出水る。
その他にも、記入枠群で造り得る記号を設定すれば、よ
り高度なデータ人力が出来る。
また記入枠はORCで検知できるものとし°C説明した
が、ドロップアウトカラーのインクで印刷することも出
来る。その場合の例が図11のガイド枠7で、記入枠の
位置をORCで検知できる。ようにするものである、ガ
イド枠7の太い部分が、記入枠の位置を示す座標となっ
ているので、間接的に記入枠の位:6を検知できるわけ
である。
実施例においては、記入枠群の構成、データ記入上の規
則等を定めたが、本発明はこれに限定されるものではな
い、記入枠の数や配置の異なる構成も設定し得る。
(効果) 本発明の入力用データ媒体は、文字寸法1文字形状1文
字位置を限定、統一させる作用をもつので、光学文字読
取り装置に入力して誤認する様な、文字の記入を防ぐ効
果をもつ。
また記入ルールは、記入枠間を直線で結ぶという簡単な
ものなので、正しい記入かを記入者が判断できる。
また筆記始点、筆記終点は前後左右にずれても記入枠内
であれば良いので、記入し易い。
本発明の光学文字読取り装置は、前記のデータ媒体を用
いているので、文字位置2文字寸法9文字形状が統一さ
れるので、誤読が減少する。
【図面の簡単な説明】
図1は本発明の入力用データ媒体の実施例の図である0
図2は従来のORCでの文字データ抽出過程の説明のた
めの図である0図3も入力用データ媒体の実施例の図で
あり、図4は本発明の光学文字読取り装置での文字デー
タ抽出過程の説明のための図であり、図5〜11はデー
タ媒体の記入枠への記入具体例の図である。 1・・・記入枠、      2・・・マトリクス、3
・・・点線、       4・・・丸印、5・・・最
上記入枠、 7・・・ガイド枠。 6・・・右上記入枠、

Claims (2)

    【特許請求の範囲】
  1. (1)光学文字読取り装置への入力用データ媒体におい
    て、 その入力用データ媒体は、筆記始点、筆記終点の範囲を
    示す、所定の大きさの記入枠が、所定の位置に、所定の
    数だけ印刷してある書式である、入力用データ媒体。
  2. (2)所定の入力用データ媒体上の文字を、光学的に検
    知し、文字として認識する、光学文字読取り装置におい
    て、 所定の入力用データ媒体とデータ媒体送出手段と光学文
    字読取り手段からなり、 そのデータ媒体は、筆記始点、筆記終点の範囲を示す、
    所定の大きさの記入枠が、所定の位置に、所定の数だけ
    印刷してある書式とし、 データ媒体送出手段は、そのデータ媒体を1枚ずつ光学
    文字読取り手段へ送出する手段をもち、光学文字読取り
    手段は、データ媒体中の、記入枠と記入枠の間を繋ぐ筆
    記線の有無を検知し、その筆記線の有無の組合わせから
    文字を認識する手段をもつ、光学文字読取り装置。
JP1264140A 1989-10-11 1989-10-11 入力用データ媒体・光学文字読取り装置 Pending JPH03125285A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1264140A JPH03125285A (ja) 1989-10-11 1989-10-11 入力用データ媒体・光学文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1264140A JPH03125285A (ja) 1989-10-11 1989-10-11 入力用データ媒体・光学文字読取り装置

Publications (1)

Publication Number Publication Date
JPH03125285A true JPH03125285A (ja) 1991-05-28

Family

ID=17399017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1264140A Pending JPH03125285A (ja) 1989-10-11 1989-10-11 入力用データ媒体・光学文字読取り装置

Country Status (1)

Country Link
JP (1) JPH03125285A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0592865U (ja) * 1992-05-18 1993-12-17 正道 菅原 キャラクタ記入用マークシート
JPH0619048U (ja) * 1992-08-18 1994-03-11 正道 菅原 Ocr用入力シート

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0592865U (ja) * 1992-05-18 1993-12-17 正道 菅原 キャラクタ記入用マークシート
JPH0619048U (ja) * 1992-08-18 1994-03-11 正道 菅原 Ocr用入力シート

Similar Documents

Publication Publication Date Title
EP0299383B1 (en) Method of reading identification code sheets
US5204515A (en) Method of reading identification code sheets using borders to determine scan angle
US6611351B1 (en) Method of printing complete MICR checks on blank sheets from host program data using laser printers
AU1362288A (en) Apparatus and method of encoding and decoding barcodes
US4159471A (en) Communication system using binary compatible characters
JPH03161891A (ja) 表形式文書読取装置
US7864986B2 (en) Optical mark reading that uses a disregard state as part of an unambiguous symbology of marks to fill into response bubbles
US3852720A (en) Method and apparatus for automatically generating korean character fonts
US5140645A (en) Computer compatible character for reliable reading by photoreader
US3699518A (en) Method and machine for reading handwritten cursive characters
JPH03125285A (ja) 入力用データ媒体・光学文字読取り装置
US5244235A (en) Machine readable document and method for forming same
ITRM930179A1 (it) Apparecchio e procedimento per il riconoscimento di caratteri manoscritti.
JPH1125209A (ja) 情報入力装置、情報入力方法、記憶媒体、及び二次元バーコード印刷装置
KR20020065596A (ko) 크래디트 카드 구매
CN201336039Y (zh) 机械条码铭牌
JP4719920B2 (ja) バーコードの作成方法及びバーコードワープロ
US6701013B1 (en) System for recognition of hand-written characters
JPH04143876A (ja) デジタルデータ記録紙のデジタルデータ読取装置
JPS62290984A (ja) パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
JPS62177586A (ja) 文書作成装置
JPH08129604A (ja) データ記入用シート
JPS6016136Y2 (ja) フアクシミリ入力用紙
JPH0637944U (ja) 光学的文字読取り用帳票
CN104008412A (zh) 一种图书的排架方法