JPS5960685A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS5960685A
JPS5960685A JP57171394A JP17139482A JPS5960685A JP S5960685 A JPS5960685 A JP S5960685A JP 57171394 A JP57171394 A JP 57171394A JP 17139482 A JP17139482 A JP 17139482A JP S5960685 A JPS5960685 A JP S5960685A
Authority
JP
Japan
Prior art keywords
character
candidate
data
characters
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57171394A
Other languages
English (en)
Inventor
Toyoshi Sato
佐藤 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP57171394A priority Critical patent/JPS5960685A/ja
Publication of JPS5960685A publication Critical patent/JPS5960685A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技レト1分野〕 この発明はキャラクタセット方式の光学的文字読取装置
(−関する。
〔発明の技術的背景とその問題点〕
従来、光学的文字読取装置(NJ、下OORと称する)
には、文字認識方式としてキャラクタセット方式と呼ば
れるものがある。この方式の0’OR1’j:、例えば
帳票上(二記録された文字を読取る場合、予め読取行毎
(二発生する可能性のある文字(=相当するキャラクタ
セット文字を記憶しておく。そして、まず帳票上を光学
的に定食して得られた1文字分の文字データに対してサ
ブキャラクタセット(英数字およびカナ文字等の文字デ
ータ群)等に基づいて文字認識処理を行なう。この認識
結果と上記キャラクタセット文字とを照合して、認mT
Q結果である読取文字がその行にあるべき文字であるか
否かをチェックす°る(キャラクタセットチェックと称
する)。
そして、照合結果がキャラクタセット文字とマツチする
読取文字である場合5その読取文字は正常な認識処理の
答えとして出力する。また、キャラクタセット文字とマ
ツチしない場合には、その読取文字をリジェクトするこ
とになる。
し2かしながら、上記のようなOCR,では、認識処理
の後(二認識結果とキャラクタセット文字とを照合して
読取文字が正常であるか否かを判定するため、以下のよ
うな欠点がある。1ず第1に、認識結果である文字に相
当するキャラクタセット文字が記憶されていない場合、
キャラクタセットチェックではその読取文字を全てリジ
ェクトすることになる。そのため、文字の読耳又効率(
正続率)が著しく低下すること(二なる。
第2に、上記キャラクタセット文字が多数の場合にね、
キャラクタセットチェックに要する処理1消間は多大と
なる。したがって、OCR全体の読取処理スピードに悪
影譬を与えること(二なる。
〔発明の目的〕
この発明げt、f己の知悄を絋みてfc妬れたもので、
キャラクタセット方式のOCRにおいて、キャラクタセ
ットチェックを行なう場合、キャラクタセットチェック
に要する処理時、間を誠少し、芒ら(二文字の読取効率
を向上できるようにした光学的文字読l!i!装置を提
供することを目的とする。
〔発明の概、要〕
すなわちこの発明においては、用紙(=記録さ力た1文
字分の文字データに対して#、l:j似する候補文字を
、例えば4Fブキヤラクタセツト(二基づいて候補文字
選択回路で)ら出力する。上配候抽交字に対して、予め
読取可能性のあるキャラタデータ(二基づいてキャラク
タセットチェックをキャラクタ照合手段(二おいて行な
う。そして、上包(′、のようなチェックの結果が候補
文字(二対して複数のキャラクタデータと合致する場合
、判定回路において上記文字データに相当する読取文字
を判定するものである。
〔発明の′−A施例〕
以下1’14J而?然照してこの発明の一実施例につい
て説明する。第1図はこの発明(二係るO ’0 )L
の部分的構成を示すブロック図で、1は候補文字選択回
路である。この候補文字選択回路1は、人力文字データ
Dに対して予め辞書メモリ2に)(11φされた例えば
サブキャラクタセット(英数字およびカナ文字等)に基
づいて類似した候補文字0■(1を選択して午ヤラグタ
照合回路3に出力する。このキャラクタ照合回路3は、
候補文字OH、とキャラクタセット文字(以下キャラク
タデータと称する)O8とを照会して、そのH54合砧
呆に截づく候補文字0■(、またはOH。
を出力する。上記キャラクタデータO8は、続取対家で
ある用紙上の読取フィールド(通常1行分の文字が記録
されている)に出魂する可能性のある検数の文字群であ
わ、予めOCRの外部からキャラクタセットメモリ4に
記憶されている。
ここで、キャラクタ照合回路3は、照合結果にlルづい
て1戻補文字01(1がキャラクタデータO8の中で複
Hの文字と合致する場合、その複数の候補文字OH,を
判定回路5に出力する。
なた、キャラクタデータCBの中で1文字と合致する場
合には、その候補文字OH8を答として答バッファメモ
リ6に出力する。判定回路5は、候補文字O11,に相
当する基左パターンを判定用辞書メモリ7から続出し、
その基準パターンと入力文字データI)のパターンとを
照合する。この照合結果(二基づいて、候補文字OH。
の中で1文字のみが合致した」島台には、その候補文字
を答として判定し答バッファメモリ6に出力する。また
、候補文字CH,の全文字が否定された場合および複f
iの文字が合致した場合には、判定回路5は読取不用と
し2てリジェクトする。
このような構成において、動作を説明すると、fず駆動
<g号a(通常図示してない00 Rの制御回路から出
力する)により、入力文字データDの1文字分が候補文
字選択回路1(二与えられる。この入力文字データ(以
下入力データと称する)Dは、用紙上の読取フィールド
に記録された文字が光学的に走査されて得られた2値化
データである。候補文字選択回路1は、上記のように辞
書メモリ2内のデータ(サブキャラクタセット)に基づ
いて入力データDに対して類イ1jlIj−の島い刀の
文字からn個(1個でもよい)の(ft補文字OH,−
&選択して大分類を行なう。
キャラクタ照合回路3は、候補文字0■(1とキャラク
タセットメモリ4内のキャラクタデータO8とを照合す
る。この照合結果l:基づいて、1:W己のように候補
文字OH1に対してキャラクタデータO8の1文字が合
致する場合、その合致する候補文字aHsは答バッファ
メモリ6に与えられる。したがって、この候補文字OH
が、入力データDの読取文字として認識てれること(:
なる。また、候補文字OH,に対して、キャラクタデー
タC8の複数の文字が合致する場合、その候補文字0)
I、は判定回路5f二与えられる。
具体的には、例えば第2図に示すような読取フィールド
(二九−いて、「0」〜「9」 、「Y」および「Z」
以外の文字は出現【−ないものとする。したがって、キ
ャラクタセットメモリ4には、肩′丸3図に示すような
キャラクタデータosが予め記憶されているものとする
。なお、この場合辞書メモリ2には、「0」〜「9」お
よびrAJ〜rZJのみのデータが肖己憶されていれば
よい。ここで、第2図の21の文字(「0」が、入力デ
ータDとして候補文字選択1q11i1に与えられると
、候補文字OH、として例えばrOj  、rOJ  
、rQJの文字がキャラクタ照合回路3に出力する。キ
ャラクタ照合回路3では、上記の候補文字OH,と第3
図に示すキャラクタデータO8とを照合する。この場合
、合致するのtゴ「0」のみである。したがって、「0
」である候補文字OH,が答バッファメモリ6に転送さ
れるととl二なる。同様(二、第2図の22の文字rZ
Jが入力データDとして、候補文字選択回路1に与えら
れ、候補文字OH1としてr2J 、rZJ 、rIJ
の文字がキャラクタ照合回路3に出力したとする。この
場合、キャラクタデータO8と合致するのは、「2」と
rZJである。したがって、「2」と「Z」でおる候補
文字OH6が判定回路5に出力することになる。そして
、判定回路5では、r2Jと「Z」に411当する基軸
パターンが判定用辞へメモリ7から請出され、この基簿
・パターンと人力データDのパターン(すなわち「Z」
である)とが間合きれる。この判定結果において、合致
するパターンが「Z」のみであわ、ば、候補文字のrZ
Jが入力データDの読取文字として認識され、答バッフ
ァメモリ6に与えられる。なお、上記のように、「2」
と「Z」(二相当する基剤パターンが共に入力データD
のパターンと合致した場合、または両者とも合致せず否
定された場合(=は、判定回路3は読取不可として入力
データT)をリジェクトすることになる。
このようにして、入力データDに対する読取が行なわれ
ることになる。この場合、上記のように入力データDは
、捷ず候補文字選択回路IC二おいて、大分61処理が
行なわれて所定の個数からなる候補文字OH,が選択さ
れる。したがって、キャラクタ照合回路3では人力デー
タDにおいて、限られた個数の候補文字OH8のみとキ
ャラクタデータC8との照合を行なうことC−なり、照
合処理時間を大幅に減少することができる。すなわち、
従来のようにキャラクタデータの4てにおいてキャラク
タセットチェックを行なう場合に対して、この発明では
前もってキャラクタセットテエッグの対象が絞られてチ
ェック範囲の候補文字数が少なく斤っでいるため、キャ
ラクタセットチェック処理のスピードを大幅(11%め
ることかできる。はらに、上記のように入力データDに
対して大分類処理が行なわれた後、キャラクタセットチ
ェックが行なわれるため、キャラクタデータC8にある
文字が候補文字として出力される可能性が爾くなり、読
取処シ効率が向上する利点がある。すなわち、従来のよ
うに入力データの認識処理の後、その認識結果(すなわ
ち答となる)(二対し7てキャラクタセットチェックを
行斥っだ場合、認識結果に相当するキャラクタデータが
々いと、入力データをリジェクトすること(二なり、読
取処理効率が著しく低下することになる。これに対して
、ごの発明でに、上記のよう(二大分類処理の後にキャ
ラクタセットチェックを行なうため、最終の答とし2て
出力される時点では、リジェクトされる率が少々くなっ
ている。したがって、読取処理効率が毘〈なり、正続率
(入力データDを正1−<読取る率)を向上できること
になる。
〔発明の効果〕
以上詳述したようにこの発明によれば、キャラクタセッ
ト方式の0OR(:おいて、キャラクタセットチェック
を行なう場合、キャラクタセットチェック(=要する処
理時間を大幅(二減少することができ、OORの処理ス
ピードを高めることができる。また、文字の読取処理効
率を島めることかできるため、最終の答を出力する時点
でのりジエグトを少々くすることができ、正続率を向上
できるものである。
【図面の簡単な説明】
菌1図はこの発明の一実施例に係る光学的文字読取装置
の部分的構成を示すブロック図、鞘2図IJその動作を
説明するための読取フィールドの一例を示す図、第3図
はその動作を説明するだめのキャラクタセットメモリの
′M成図である。 l・・・侯袖文字JVす択手段、3・・・キャラクタ照
合回路、4・・・キャラクタセットメモリ、5・・・判
定回路。 出劇人伏理入 弁理土鈴江武 彦

Claims (1)

    【特許請求の範囲】
  1. 用紙に記録された文字行の中で1文字分の文字データに
    対して類似する候補文字を出力する候補文字選択手段と
    、予め読取可能性のめる所定の文字に相当する複数のキ
    ャラクタデータを記憶する記憶手段と、上記候補文字選
    択手段から出力する候補文字と上記キャラクタデータと
    を照合してその照合結果に基づく候補文字を出力するキ
    ャラクタ照合手段と、上記照合結果が上記候補文字シ一
    対して複数のキャラクタデータと合致する場合上記1文
    字分の文字データに相当する候補文字を判定する利足手
    段とを具備することを特徴とする光学的文字読取装置。
JP57171394A 1982-09-30 1982-09-30 光学的文字読取装置 Pending JPS5960685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57171394A JPS5960685A (ja) 1982-09-30 1982-09-30 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57171394A JPS5960685A (ja) 1982-09-30 1982-09-30 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS5960685A true JPS5960685A (ja) 1984-04-06

Family

ID=15922341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57171394A Pending JPS5960685A (ja) 1982-09-30 1982-09-30 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS5960685A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04120831U (ja) * 1991-04-17 1992-10-28 株式会社クボタ 屋根棟用換気装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5422728A (en) * 1977-07-21 1979-02-20 Nec Corp Character identifying system suited for reading of variable character set

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5422728A (en) * 1977-07-21 1979-02-20 Nec Corp Character identifying system suited for reading of variable character set

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04120831U (ja) * 1991-04-17 1992-10-28 株式会社クボタ 屋根棟用換気装置

Similar Documents

Publication Publication Date Title
US4484348A (en) Figure recognizing system
JPS62221088A (ja) 光学式文字読取装置
JPH10230226A (ja) 住所読み取り装置
JPS5960685A (ja) 光学的文字読取装置
JP2732593B2 (ja) 文字読取システム
JPH06103402A (ja) 名刺認識装置
JPH0535919A (ja) 文字識別装置
JP2924356B2 (ja) 光学文字読取装置
JP2980059B2 (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JPS63282586A (ja) 文字認識装置
JP2845463B2 (ja) パターン認識装置
JPS62177686A (ja) 光学的文字読取装置
JPS6095689A (ja) 光学的文字読取装置
JPH07116606A (ja) 郵便物あて名認識装置及びあて名認識方法
JPS5851390A (ja) 活字文字認識装置
JP2743995B2 (ja) 文字読取装置
JPH0475557B2 (ja)
JPH1153474A (ja) 文字列認識方法
JPH01259476A (ja) 文字読取装置
JPS60138689A (ja) 文字認識方法
JPH05324899A (ja) 郵便物記載住所認識装置
JPS59188783A (ja) 文字判定処理方式
JPH07105321A (ja) 単語認識装置、住所認識装置及び単語認識方法
JPS60254388A (ja) 光学的文字読取装置
JPS61148585A (ja) 文字認識装置