JPS60183688A - 光学文字読取方式 - Google Patents
光学文字読取方式Info
- Publication number
- JPS60183688A JPS60183688A JP59040015A JP4001584A JPS60183688A JP S60183688 A JPS60183688 A JP S60183688A JP 59040015 A JP59040015 A JP 59040015A JP 4001584 A JP4001584 A JP 4001584A JP S60183688 A JPS60183688 A JP S60183688A
- Authority
- JP
- Japan
- Prior art keywords
- data
- information
- entry
- output
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
本発明は光学文字iiy’5取方式、特に光学文字読取
装(δ(以下OCRと称す)により文字記入フォーマッ
トを自動的に検出して読取結果を出力する文字読取方式
に関するものである。
装(δ(以下OCRと称す)により文字記入フォーマッ
トを自動的に検出して読取結果を出力する文字読取方式
に関するものである。
〈従来技術〉
近年、OCRの普及によりコンピュータのデータ入力効
率は大幅に改善されて来た。しかし、従来OCRが読み
取れる帳票は記入フォーマット、すなわち、文字の記入
位置、桁数等をあらかじめ細部に亘りOCRの読取プロ
グラム、あるいはパラメータとして与えておく必要があ
った。このため、記入フォーマットが変わる毎にパラメ
ータを設定し11す心安があり、当然1限票もその45
度変更することから、多様性への対応が問題になって来
0 すなわち、OCRの普及と共に0Cai使用する人の範
囲が拡がり、当初専門家によって利用若し、くは管理さ
れていた状況から、非専門家も扱う状況へと変化して来
た。このため、前記のような帳票や読取プログラムの多
様性への対応が増々大きな問題となって来た。
率は大幅に改善されて来た。しかし、従来OCRが読み
取れる帳票は記入フォーマット、すなわち、文字の記入
位置、桁数等をあらかじめ細部に亘りOCRの読取プロ
グラム、あるいはパラメータとして与えておく必要があ
った。このため、記入フォーマットが変わる毎にパラメ
ータを設定し11す心安があり、当然1限票もその45
度変更することから、多様性への対応が問題になって来
0 すなわち、OCRの普及と共に0Cai使用する人の範
囲が拡がり、当初専門家によって利用若し、くは管理さ
れていた状況から、非専門家も扱う状況へと変化して来
た。このため、前記のような帳票や読取プログラムの多
様性への対応が増々大きな問題となって来た。
このようなことから望捷しいのは出来るだけIii’i
便に帳票が準備出来、且つi、ノε取プログラムが作成
出来ることであり、具体的対応例としてl) P C用
紙の利用とか、1:だ取プログラムを実帳票を抗剤せる
だはで作成する方法等が出現している。しかし、これら
の改善策も帳票と読取プログラムの両面を併せて改−1
1する・ものではないi’cめ、依然として非専問家に
とって必ずしもOCRが1更利なものとはいえない状況
であった。
便に帳票が準備出来、且つi、ノε取プログラムが作成
出来ることであり、具体的対応例としてl) P C用
紙の利用とか、1:だ取プログラムを実帳票を抗剤せる
だはで作成する方法等が出現している。しかし、これら
の改善策も帳票と読取プログラムの両面を併せて改−1
1する・ものではないi’cめ、依然として非専問家に
とって必ずしもOCRが1更利なものとはいえない状況
であった。
一般的に、 Q!14票のフォーマットを規定せず何で
も自由に肴、み暇るOCRが理想であるが、(支体f的
にはこのレベルは当面不可能と考えられている。
も自由に肴、み暇るOCRが理想であるが、(支体f的
にはこのレベルは当面不可能と考えられている。
−歩譲って考えると、汎用帳壁vこ出来るだけ自由に記
入した文字(!’l’をOCRが自動的に、Jvみ取る
ことが、前記問題点を緩和し、理想に近づける具体的方
策といえる。ここでいう出来るだけ自由にとは、極〈簡
1(1な利約、あるいはルールを設定し、その上で自由
にi記入するということである。しかも、そのルールは
日常生活の習慣に基づくものであれは、一般に容易に受
け入れられるものになると考えられ、実用性が増すこと
になる。しかし、ここでいうルールは、OCRにとって
論理的に解訪、a丁能でなければならない。
入した文字(!’l’をOCRが自動的に、Jvみ取る
ことが、前記問題点を緩和し、理想に近づける具体的方
策といえる。ここでいう出来るだけ自由にとは、極〈簡
1(1な利約、あるいはルールを設定し、その上で自由
にi記入するということである。しかも、そのルールは
日常生活の習慣に基づくものであれは、一般に容易に受
け入れられるものになると考えられ、実用性が増すこと
になる。しかし、ここでいうルールは、OCRにとって
論理的に解訪、a丁能でなければならない。
ルールの程度とOCTNによる自動読取の611を馬鹿
は当然相関があることになるが、OCRが論理的に解読
回部な範囲においては、単に処理の複雑さの程度として
扱うことが可能である。ここで、OCRが論理的に厘r
読可能ンよルールの限界の::;「明が問題であるよう
に考えられるが、OCRの利用者がルールを理解して協
力的に対応する範囲によ、−いて、現実的に限界を設定
出来るので、厳密な証明は必要なく、結果としての利用
価値の評価にひいて、ルールの適性が試されるのみであ
る。
は当然相関があることになるが、OCRが論理的に解読
回部な範囲においては、単に処理の複雑さの程度として
扱うことが可能である。ここで、OCRが論理的に厘r
読可能ンよルールの限界の::;「明が問題であるよう
に考えられるが、OCRの利用者がルールを理解して協
力的に対応する範囲によ、−いて、現実的に限界を設定
出来るので、厳密な証明は必要なく、結果としての利用
価値の評価にひいて、ルールの適性が試されるのみであ
る。
さて、出来るだけ自由に記入出来るよう提供する汎用帳
票は、記入枠17縦、備一様に設定したものでよく、装
置や利用者の便宜の上にかいて股h1してあらかじめ用
意することが出来、この汎用郭・票全体のe’jt取ブ
aグラムj、;i、0(、:i(の中にあらかじめ組み
込める従来型のものでよい。
票は、記入枠17縦、備一様に設定したものでよく、装
置や利用者の便宜の上にかいて股h1してあらかじめ用
意することが出来、この汎用郭・票全体のe’jt取ブ
aグラムj、;i、0(、:i(の中にあらかじめ組み
込める従来型のものでよい。
く発明の目的〉
本発明の目的は、記入ルールに従って記入された汎用帳
票を読み取らせるip、帳票にの全文字をブランクを含
めて読み取った後、全文字情叩を一時記憶し、該全文字
配列を用いて帳票上に出現した文字記入者の意図すると
ころの記入レイアウト情報を抽出、処理し、帳票上の文
字データ群と記入方法の情報をルールに照して自動的に
得ることによりあらかじめ詳細フォーマットプログラム
を用意することなく、汎用フォーマット上文字配列から
記入フォーマントラ検出して不要データを除去し、記入
者が意図するところの必要な読取結果を出力する光学文
字読取方式を提供することにある。
票を読み取らせるip、帳票にの全文字をブランクを含
めて読み取った後、全文字情叩を一時記憶し、該全文字
配列を用いて帳票上に出現した文字記入者の意図すると
ころの記入レイアウト情報を抽出、処理し、帳票上の文
字データ群と記入方法の情報をルールに照して自動的に
得ることによりあらかじめ詳細フォーマットプログラム
を用意することなく、汎用フォーマット上文字配列から
記入フォーマントラ検出して不要データを除去し、記入
者が意図するところの必要な読取結果を出力する光学文
字読取方式を提供することにある。
〈発明の構成〉
本発明によれば、光学読取装置と、汎用帳票に記入され
た文字等を前記光学読取装置によりブランクも含めて読
み取って得た全文字情報を一時記憶する手段と、該全文
字情報配列を用いて帳票上の記入レイアウト情報を抽出
する手段と、該記入レイアウト情報を処理して帳票上に
記入された交る。
た文字等を前記光学読取装置によりブランクも含めて読
み取って得た全文字情報を一時記憶する手段と、該全文
字情報配列を用いて帳票上の記入レイアウト情報を抽出
する手段と、該記入レイアウト情報を処理して帳票上に
記入された交る。
〈実施例〉
次に本発明の実施例について、図面を用いて説明する。
第1図は本発明の一実施例のブロック借成図で、lはO
CR,2は一時記憶装置、3はレイアウト情報抽出部、
4はフォーマット情報抽出部、5は読取結果出力部であ
る。
CR,2は一時記憶装置、3はレイアウト情報抽出部、
4はフォーマット情報抽出部、5は読取結果出力部であ
る。
一般的なOCRlで読み取られた汎用帳典の読取結果1
1はブランクを含めて、汎用帳票のフォーマントに合致
した文字配列で一時記憶装置2に格納される。一時記憶
装置2の出力21はレイアウト情報抽出部3に与えられ
る。レイアウト情報抽出部3において帳票上の文字配列
、すなわち、上記一時記憶2の内容から記入レイアラ)
tW報が抽出され、出力31としてフォーマット情報
抽出部4に与えられる。次にフォーマント情報抽出部4
において、文字配列に対して、同一グループに槙するデ
ータ群の分類、記入位1^1の4i(I:認、石づめと
左づめのチェックを行い、結果をフォーマット情報41
として読取結果出力部5に与える。最終的に’AJI取
結果出力部5において、一時記憶の内容21を読み出し
ながら、フォーマット情報41を用いて不安なデータを
除去し、記入者の意図する必快なデータのみを最終出力
51として出力することにより、汎用帳票上に記入ルー
ルに基づいて記入されたデータを読み取る。
1はブランクを含めて、汎用帳票のフォーマントに合致
した文字配列で一時記憶装置2に格納される。一時記憶
装置2の出力21はレイアウト情報抽出部3に与えられ
る。レイアウト情報抽出部3において帳票上の文字配列
、すなわち、上記一時記憶2の内容から記入レイアラ)
tW報が抽出され、出力31としてフォーマット情報
抽出部4に与えられる。次にフォーマント情報抽出部4
において、文字配列に対して、同一グループに槙するデ
ータ群の分類、記入位1^1の4i(I:認、石づめと
左づめのチェックを行い、結果をフォーマット情報41
として読取結果出力部5に与える。最終的に’AJI取
結果出力部5において、一時記憶の内容21を読み出し
ながら、フォーマット情報41を用いて不安なデータを
除去し、記入者の意図する必快なデータのみを最終出力
51として出力することにより、汎用帳票上に記入ルー
ルに基づいて記入されたデータを読み取る。
@2図は本発明による読取方式の一実施例における汎用
帳票と文字記入例を示すものである。同図に示す如く、
まず汎用帳票SはA5版横置きで、1行当り20文字、
全体で12行の汎用フォーマットになっている。この2
0文字X12行の汎用帳票Sは、第1図で示した一般的
な0CRtでI:JII。
帳票と文字記入例を示すものである。同図に示す如く、
まず汎用帳票SはA5版横置きで、1行当り20文字、
全体で12行の汎用フォーマットになっている。この2
0文字X12行の汎用帳票Sは、第1図で示した一般的
な0CRtでI:JII。
み取るよう、0CRxに卦いてプログラムされ−Cいる
。このような汎用帳票は、市販のOClもで十分読み取
れるので1)l′細説明は省略する。
。このような汎用帳票は、市販のOClもで十分読み取
れるので1)l′細説明は省略する。
第2図において、I限票上部に示す1〜20の数字F1
7カラム番号全表わし、同じく左部にノF丁■〜■の数
字は行(1を号を表わす。四角で示す各ます目は文字記
入枠を表わし、記入枠内の各数字等は文字記入例を表わ
す。記入される文字は数字に限らなく、OCRで読み取
り可能な範囲で何でもよい。
7カラム番号全表わし、同じく左部にノF丁■〜■の数
字は行(1を号を表わす。四角で示す各ます目は文字記
入枠を表わし、記入枠内の各数字等は文字記入例を表わ
す。記入される文字は数字に限らなく、OCRで読み取
り可能な範囲で何でもよい。
芒で、同図における文字記入は、実施例において以下の
ような記入ルールでなされている。
ような記入ルールでなされている。
ルールl:行単位でフォーマットが変わったときブラン
ク行全入れる。(例。
ク行全入れる。(例。
行■、■、■)
ルール2:1行中、ブランクでフィールドの切れ目とす
る。但し、左右端カラ か0 ムはフランクなくても切才り目とす る。
る。但し、左右端カラ か0 ムはフランクなくても切才り目とす る。
ルール3:左づめ、右づめについて。
A)各フィールドの五艶1かそろっ
ていればuづめとする
B)各フィールドの左端がそろっ
ていなく、君臨がそ7)ってい
れば右づめとする
このようなルール1〜ルール3ば[1常(史用するデー
タの記入方法とほぼ同じもので、人間同志の間でも使用
され得る一般[19なもので、CICR向きに限定した
ことが日常業務活動にJiえる影沼′は少ない。尚、上
記ルール1〜ルール3の説明中、フィールドとは1組の
データf表わすもので、例えば第2図■行のカラム18
〜20のrlooJは1つのフィールドであるという如
くである。
タの記入方法とほぼ同じもので、人間同志の間でも使用
され得る一般[19なもので、CICR向きに限定した
ことが日常業務活動にJiえる影沼′は少ない。尚、上
記ルール1〜ルール3の説明中、フィールドとは1組の
データf表わすもので、例えば第2図■行のカラム18
〜20のrlooJは1つのフィールドであるという如
くである。
また、ルール3について、若干の補則がある。
これは例えば業務上5桁のフィールドであるが、ある帳
票に記入する時、た捷たま右づめで3桁しかデータがな
いというような場合の記入方法について、ルール3′f
:意識して左右づめが聞達われないようにする必装があ
る。つまり、第2し1■〜■行のカラム16〜20のフ
ィールドについて、このフィールドは5債であるが、デ
ータが右づめのrlooJ、r210J、r350Jで
あっても、そのまま3桁記入した寸まだと、ルール3A
)により左づめになってし捷う。このときrlooJに
ついて図の如<roolooJと記入しておけげ5桁の
データになり、結果として右づめになる。
票に記入する時、た捷たま右づめで3桁しかデータがな
いというような場合の記入方法について、ルール3′f
:意識して左右づめが聞達われないようにする必装があ
る。つまり、第2し1■〜■行のカラム16〜20のフ
ィールドについて、このフィールドは5債であるが、デ
ータが右づめのrlooJ、r210J、r350Jで
あっても、そのまま3桁記入した寸まだと、ルール3A
)により左づめになってし捷う。このときrlooJに
ついて図の如<roolooJと記入しておけげ5桁の
データになり、結果として右づめになる。
これを補則とする。
補則二右づめデータについて、フィールド長より記入?
−夕が少ない時、ルール3 に黒して盛装な桁へだけ左側に[01 を付加しておく。
−夕が少ない時、ルール3 に黒して盛装な桁へだけ左側に[01 を付加しておく。
(但し一番上の行のみでよい)
次に第3図を用いて、記入データとルールの関係及びデ
ータ群の定@を詳しく説明する。第3図は第2図の記入
例をより詳細に示すものである。
ータ群の定@を詳しく説明する。第3図は第2図の記入
例をより詳細に示すものである。
第3図において、■行目、■行目、■行目に、全行ブラ
ンクの行であり、前記ルールlに従って、データは3つ
のデータグループDI、D2,1)3に分かねる。つま
り、■、■行目はグループI) 1、■〜■行目はグル
ー7″Dz、■〜■行目はグループD3である。尚、■
行目は余白である。
ンクの行であり、前記ルールlに従って、データは3つ
のデータグループDI、D2,1)3に分かねる。つま
り、■、■行目はグループI) 1、■〜■行目はグル
ー7″Dz、■〜■行目はグループD3である。尚、■
行目は余白である。
前記ルール2に従ってグループDlは3つのデータフィ
ールドDI l、Dt 2.D+ 3から成り、ルール
3に従って1)11,012は4桁の右づめデータ、D
t3(d3桁の左づめデータである。ここで、Dll、
Dt2中のΔはブラ・/りを示す。
ールドDI l、Dt 2.D+ 3から成り、ルール
3に従って1)11,012は4桁の右づめデータ、D
t3(d3桁の左づめデータである。ここで、Dll、
Dt2中のΔはブラ・/りを示す。
例えば、■〕11において[Δ△13J 、rl 65
8]は共VC4桁で同質の2つのデータであり、[ΔΔ
13J Hrl 3Jと同じであり、説明のため△(ブ
ランク)を付加しである。012.DI3も同様である
。また、データグループD2.D3においても同様に図
の如く成っている。
8]は共VC4桁で同質の2つのデータであり、[ΔΔ
13J Hrl 3Jと同じであり、説明のため△(ブ
ランク)を付加しである。012.DI3も同様である
。また、データグループD2.D3においても同様に図
の如く成っている。
(IYっで、第3図のデータは、まず4桁の右づめデー
タが2フイールドおよび3桁の圧づめデータが1フイー
ルドから成る2行分のデータと、3桁の右づめデータが
1フイールドおよび5桁の右づめデータが1フイールド
から成る3行分のデータと、13桁の左づめデータが1
フイールドおよび3桁の左づめデータが1フイールドか
らりyる3行分のデータが記入され−Cいることになる
。
タが2フイールドおよび3桁の圧づめデータが1フイー
ルドから成る2行分のデータと、3桁の右づめデータが
1フイールドおよび5桁の右づめデータが1フイールド
から成る3行分のデータと、13桁の左づめデータが1
フイールドおよび3桁の左づめデータが1フイールドか
らりyる3行分のデータが記入され−Cいることになる
。
次に、第4図を用いて処理の流れを説明する。
8114図の処理は、一般のOCRにより全文字を読み
取って一時記憶した後の処理を示すもので、レイアウト
悄■)抽出処理は第1図のレイアウト情報抽出部3にお
いてなされるもので一時記憶装置2の記憶9内谷から貸
車Grで各ブロックの圧君臨検出をした後、ブランク行
の検出を併せて行い、その後データグループを検出する
。
取って一時記憶した後の処理を示すもので、レイアウト
悄■)抽出処理は第1図のレイアウト情報抽出部3にお
いてなされるもので一時記憶装置2の記憶9内谷から貸
車Grで各ブロックの圧君臨検出をした後、ブランク行
の検出を併せて行い、その後データグループを検出する
。
次に第4図のフォーマット情報抽出処卯は、第1図のフ
ォーマット情報抽出部4においてなされるもので、デー
タグループ4σに各フィールドの左右端を検出し、左づ
め、右づめのチェックを行う。
ォーマット情報抽出部4においてなされるもので、デー
タグループ4σに各フィールドの左右端を検出し、左づ
め、右づめのチェックを行う。
更に、第4図の読取結果出力処理は、第1図の読取結果
出力処理部5においてなされるもので、一時記憶装置2
に記憶された内容からフォーマット情報に従って必要デ
ータのみ抽出して出力される。
出力処理部5においてなされるもので、一時記憶装置2
に記憶された内容からフォーマット情報に従って必要デ
ータのみ抽出して出力される。
これらの一連の処理の詳細を次に説明する。
第5図は第4図のレイアウト情報抽出の瀞程で作成され
るレイアウトテーブルの例を示す捕、四回であり、第3
図のす1<柴について各行のフィールド1.2.3のブ
ランクを除いた文字のみのブロックの左右端のカラム数
を検出した結果を全頁に亘って示す。例えば第5図中0
)行のブ07りjの情報r5−6Jは[5−1が左端カ
ラム、「6」が右μカラムを示す。つ′!Fシ第3図の
l) t 1 tp 「Δ△13」のフィールドのうち
ブランクを除いたブロック[13]の左端つまり[lJ
はカラム5にありこね、がこのブロックの五:l示し、
右端「3」はカラム6にありこれがこのブロックの石!
;にを示す。す、不同様であるがここでブロックとは各
フィールドのうちブランクを除いた部分をいう。寸だ、
レイアウトテーブル中△は全カラムブランクすなわちブ
ランク行を示す。
るレイアウトテーブルの例を示す捕、四回であり、第3
図のす1<柴について各行のフィールド1.2.3のブ
ランクを除いた文字のみのブロックの左右端のカラム数
を検出した結果を全頁に亘って示す。例えば第5図中0
)行のブ07りjの情報r5−6Jは[5−1が左端カ
ラム、「6」が右μカラムを示す。つ′!Fシ第3図の
l) t 1 tp 「Δ△13」のフィールドのうち
ブランクを除いたブロック[13]の左端つまり[lJ
はカラム5にありこね、がこのブロックの五:l示し、
右端「3」はカラム6にありこれがこのブロックの石!
;にを示す。す、不同様であるがここでブロックとは各
フィールドのうちブランクを除いた部分をいう。寸だ、
レイアウトテーブル中△は全カラムブランクすなわちブ
ランク行を示す。
第5図に示したテーブルは、第7図にフローチャートを
示ずどころの各ブロックの左右11,1検出処理によっ
て抽出されるもので、各処理中のリードとは一時記憶処
理2の内容をAftみ出すことを示し、カラムとは各桁
を示す。“また、セットとI″i第5図のテーブル作1
1にのための行番号、ブロック番号の登録を、記憶とは
テーブルへの111き込みを示す。
示ずどころの各ブロックの左右11,1検出処理によっ
て抽出されるもので、各処理中のリードとは一時記憶処
理2の内容をAftみ出すことを示し、カラムとは各桁
を示す。“また、セットとI″i第5図のテーブル作1
1にのための行番号、ブロック番号の登録を、記憶とは
テーブルへの111き込みを示す。
第7[シ)で示す処理は;t+8+t+の処FII!に
続くもので、:′88図の処理は、第7図に75す処理
によって作成される第5191に示すところのレイアウ
トテーブルをj利いてなされるものである。第8図の処
理は、レイアウトテーブルの各行の情報taみ出してチ
ェックし、ブランク行を分pHσ情報としながら各デー
タグループの登録と、各グループに属する対象行t1〒
月を抽出し、第6図VC示すようなフォーマットデープ
ルのノε側’l” ” 1ris分を作成する。つ才り
、ここではブランク行検出とチータグlレープt61t
X!。
続くもので、:′88図の処理は、第7図に75す処理
によって作成される第5191に示すところのレイアウ
トテーブルをj利いてなされるものである。第8図の処
理は、レイアウトテーブルの各行の情報taみ出してチ
ェックし、ブランク行を分pHσ情報としながら各デー
タグループの登録と、各グループに属する対象行t1〒
月を抽出し、第6図VC示すようなフォーマットデープ
ルのノε側’l” ” 1ris分を作成する。つ才り
、ここではブランク行検出とチータグlレープt61t
X!。
行っている。
第9図は、第4図で示すフォーマント情報抽出処理の詳
細を示すフローチャートであり、第8図で示した処理に
引続いてなされ、第6図に例として示すようなフォーマ
ットテーブルの右0111Tzを作成するものである。
細を示すフローチャートであり、第8図で示した処理に
引続いてなされ、第6図に例として示すようなフォーマ
ットテーブルの右0111Tzを作成するものである。
第6図中T2の部分について、各データグループ内にお
いてフィールド1゜2.3は第5図のレイアウトテーブ
ルのブロック1.2.3の左端最少値と石娼最太値から
抽出された結果であり、左右借値(在−右)と左づめ、
右づめの判別結果()E/右)から成る。例えばテーブ
ルグループD1のフィールドlは行(1)、■において
左右端値r3−6j且つ「右づめ」となっている。これ
は第5図のレイアウトテーブル中■。
いてフィールド1゜2.3は第5図のレイアウトテーブ
ルのブロック1.2.3の左端最少値と石娼最太値から
抽出された結果であり、左右借値(在−右)と左づめ、
右づめの判別結果()E/右)から成る。例えばテーブ
ルグループD1のフィールドlは行(1)、■において
左右端値r3−6j且つ「右づめ」となっている。これ
は第5図のレイアウトテーブル中■。
■行についてブロック1のデータr5−6J及びr3−
6」から左端最少値「3」、右端最大イ+ji r61
よって抽出されている。尚、第91!/lにおける[記
入エラー」とは前記ルール1〜ルール3Vc;I’と反
したものを(筒用しているもので実用上あった方がよく
、操作者に表示等で1lil¥υできるようにしである
。
6」から左端最少値「3」、右端最大イ+ji r61
よって抽出されている。尚、第91!/lにおける[記
入エラー」とは前記ルール1〜ルール3Vc;I’と反
したものを(筒用しているもので実用上あった方がよく
、操作者に表示等で1lil¥υできるようにしである
。
第9図の処理の次にQま、第4図の、b°d取結!42
出力処理がなされる。この処理では、第6図のノオーマ
ソトケーブルの対象行frT号と、各フィールドの)A
−マット′ll11¥トへtlケにノ五右%a値で示さ
れるカラム省7号を用いて、−特記1.((装置1τ、
2の内答金j)vり出し−C出力する。すなわち、第3
図に示したll’に耶では汐!1えばデータグループI
)Iの■、()行l」についてはカラムニーS〜6を4
11jからbVるフィールド1の情報とし、カラーZ%
l0−1:う’j;r:4桁からj7シるフィールド2
の情報とし、カラム18〜20を3桁から成るフィール
ド3の情(弔として1(ソリ出して出力する。以下デー
タグループD2.D3についても同様に行うことで、−
頁分りごつき記入者が意図するところの必要データのみ
を出力出来る。
出力処理がなされる。この処理では、第6図のノオーマ
ソトケーブルの対象行frT号と、各フィールドの)A
−マット′ll11¥トへtlケにノ五右%a値で示さ
れるカラム省7号を用いて、−特記1.((装置1τ、
2の内答金j)vり出し−C出力する。すなわち、第3
図に示したll’に耶では汐!1えばデータグループI
)Iの■、()行l」についてはカラムニーS〜6を4
11jからbVるフィールド1の情報とし、カラーZ%
l0−1:う’j;r:4桁からj7シるフィールド2
の情報とし、カラム18〜20を3桁から成るフィール
ド3の情(弔として1(ソリ出して出力する。以下デー
タグループD2.D3についても同様に行うことで、−
頁分りごつき記入者が意図するところの必要データのみ
を出力出来る。
尚、この場合例えば■行目のフィールド1のデータは「
△Δ13Jとなるが、これFi2行目と桁をそろλるた
めにブランクを自!期的に出力するものであり、他も同
様である。
△Δ13Jとなるが、これFi2行目と桁をそろλるた
めにブランクを自!期的に出力するものであり、他も同
様である。
以上の説明では、各種処理の過程で抽出される情報のテ
ーブル万1についてid帳票例に合せた1911として
表現したが、各処理のフローチャートからもわかるよう
に、処理そのものtl(用]O−VCJ、っているので
、当然帳票例に示したもの以外も処理可能なことは明白
である。
ーブル万1についてid帳票例に合せた1911として
表現したが、各処理のフローチャートからもわかるよう
に、処理そのものtl(用]O−VCJ、っているので
、当然帳票例に示したもの以外も処理可能なことは明白
である。
また、前述した如く、記入ルールは処理としてアルゴリ
ズム化できるものなら特に実施例に示したものでなくて
もよいが、データ記入の自然さを保イア゛することが望
せしい。
ズム化できるものなら特に実施例に示したものでなくて
もよいが、データ記入の自然さを保イア゛することが望
せしい。
〈発明の効果〉
本発明文字10′と取方式は帳票を用途に合せて個別に
設計する必要がないので、ocit全170便に使月1
するに際して極めて有用である。
設計する必要がないので、ocit全170便に使月1
するに際して極めて有用である。
第1図は本発明による文字読LVy、方式の一実施例の
ブロック図、@2図は汎用帳票と交1r−記入の例を示
す図、第3図は第2図に示すものの1.ノリ+y結宋け
る処理フa−の概略ケ示す図、第5図は抽出されたレイ
アウXi〒報の1列をデープル化して示す財1、第6図
tコ侠出され/ζフォーマット情柿のZttテーブル化
して示す図、記7図はレイアウトft′i報’r 1l
l1113する処理のフローチャート、第8図、め91
はフォーマット情♀11)出処即のフローチャートを分
割して示す。 I FiOCR12は一11J j:己i、::j装置
暇4. ?はし・1アウト情fl抽出部、4はフメーマ
ノト情1:)抽出iiB、5(Iま読取鯖屍出力部であ
る。 代1P人 弁理士 内 原 ″と 第づ回 早3−フ1 第J −1’Jノ1 第7耐 v2yし1
ブロック図、@2図は汎用帳票と交1r−記入の例を示
す図、第3図は第2図に示すものの1.ノリ+y結宋け
る処理フa−の概略ケ示す図、第5図は抽出されたレイ
アウXi〒報の1列をデープル化して示す財1、第6図
tコ侠出され/ζフォーマット情柿のZttテーブル化
して示す図、記7図はレイアウトft′i報’r 1l
l1113する処理のフローチャート、第8図、め91
はフォーマット情♀11)出処即のフローチャートを分
割して示す。 I FiOCR12は一11J j:己i、::j装置
暇4. ?はし・1アウト情fl抽出部、4はフメーマ
ノト情1:)抽出iiB、5(Iま読取鯖屍出力部であ
る。 代1P人 弁理士 内 原 ″と 第づ回 早3−フ1 第J −1’Jノ1 第7耐 v2yし1
Claims (1)
- 汎用帳票に記入された文字等をブランクも含めて読、み
取って得た全文字情報を一時記憶する手段と、該全文字
情報配列を用いて帳票上の記入レイアウト情flik抽
出する手段と、該記入レイアウト情報を処理して帳票上
に記入された文字データl:′l−と記入方法の[%全
自動的に得る手段とを含むことを特徴とする光学文字読
取方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59040015A JPH0664624B2 (ja) | 1984-03-02 | 1984-03-02 | 光学文字読取方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59040015A JPH0664624B2 (ja) | 1984-03-02 | 1984-03-02 | 光学文字読取方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60183688A true JPS60183688A (ja) | 1985-09-19 |
JPH0664624B2 JPH0664624B2 (ja) | 1994-08-22 |
Family
ID=12569077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59040015A Expired - Lifetime JPH0664624B2 (ja) | 1984-03-02 | 1984-03-02 | 光学文字読取方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0664624B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61281377A (ja) * | 1985-06-07 | 1986-12-11 | Hitachi Ltd | 文書画像理解装置 |
JPS6464085A (en) * | 1987-09-04 | 1989-03-09 | Toshiba Corp | Slip format registering device |
JPH01130293A (ja) * | 1987-11-16 | 1989-05-23 | Nec Corp | 文書画像解析方式 |
JPH01191986A (ja) * | 1988-01-27 | 1989-08-02 | Toshiba Corp | 読取装置 |
JPH0378892A (ja) * | 1989-08-23 | 1991-04-04 | Fuji Electric Co Ltd | 表形式文書の認識装置 |
JPH03134784A (ja) * | 1989-10-20 | 1991-06-07 | Hitachi Ltd | 光学読取装置 |
JPH10154191A (ja) * | 1996-11-26 | 1998-06-09 | Nec Corp | 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体 |
JPH10291143A (ja) * | 1997-04-21 | 1998-11-04 | Calsonic Corp | 生産計画の最適化システム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57114974A (en) * | 1981-01-09 | 1982-07-17 | Toshiba Corp | Optical character reader |
JPS60146373A (ja) * | 1984-01-11 | 1985-08-02 | Hitachi Ltd | パタ−ン認識方式 |
-
1984
- 1984-03-02 JP JP59040015A patent/JPH0664624B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57114974A (en) * | 1981-01-09 | 1982-07-17 | Toshiba Corp | Optical character reader |
JPS60146373A (ja) * | 1984-01-11 | 1985-08-02 | Hitachi Ltd | パタ−ン認識方式 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61281377A (ja) * | 1985-06-07 | 1986-12-11 | Hitachi Ltd | 文書画像理解装置 |
JPS6464085A (en) * | 1987-09-04 | 1989-03-09 | Toshiba Corp | Slip format registering device |
JPH01130293A (ja) * | 1987-11-16 | 1989-05-23 | Nec Corp | 文書画像解析方式 |
JPH01191986A (ja) * | 1988-01-27 | 1989-08-02 | Toshiba Corp | 読取装置 |
JPH0378892A (ja) * | 1989-08-23 | 1991-04-04 | Fuji Electric Co Ltd | 表形式文書の認識装置 |
JPH03134784A (ja) * | 1989-10-20 | 1991-06-07 | Hitachi Ltd | 光学読取装置 |
JPH10154191A (ja) * | 1996-11-26 | 1998-06-09 | Nec Corp | 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体 |
JPH10291143A (ja) * | 1997-04-21 | 1998-11-04 | Calsonic Corp | 生産計画の最適化システム |
Also Published As
Publication number | Publication date |
---|---|
JPH0664624B2 (ja) | 1994-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Parthiban et al. | Optical character recognition for English handwritten text using recurrent neural network | |
CA1229894A (en) | Cryptographic analysis system | |
KR101376863B1 (ko) | 문서 시각 구조의 문법 분석 | |
KR100801224B1 (ko) | 사용자 필적 구현 시스템 및 방법 | |
JPS60183688A (ja) | 光学文字読取方式 | |
Lin | Header and footer extraction by page association | |
ITRM930179A1 (it) | Apparecchio e procedimento per il riconoscimento di caratteri manoscritti. | |
Harris | Corpus linguistics as a method for the decipherment of rongorongo | |
CN113836941A (zh) | 一种合同导航方法及装置 | |
Birkenes | North Frisian dialects: A quantitative investigation using a parallel corpus of translations | |
Sojka et al. | Optical character recognition of mathematical texts in the DML-CZ project | |
JP3014123U (ja) | 文字認識装置 | |
US20240289550A1 (en) | System and method for generating embeddings in pre-trained text detection and extraction neural network model and fine-tuning the same | |
JPH0514952B2 (ja) | ||
TWI664604B (zh) | 電腦手寫中文字集創建及應用系統 | |
Thilakarathna et al. | English Character Recognition of an Image and Voicing System | |
Herrmann | Guidelines for Writing a High-Quality Thesis with the PSIThesis Template | |
Briggs | Incomprehensibility Reduced-The Digitization of Balzac Resources | |
JPS63263588A (ja) | 文字読取装置 | |
JP2024000690A (ja) | 文書情報構造化装置、文書情報構造化方法およびプログラム | |
Quelhas | Typography: The Legacy of Manuel Pereira da Silva | |
Sojka et al. | Towards digital mathematical library: optical character recognition of mathematical texts | |
JPS6344269A (ja) | 文書認識処理装置 | |
JP2743995B2 (ja) | 文字読取装置 | |
JPS60245073A (ja) | 文字処理装置 |