JPS5850078A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS5850078A
JPS5850078A JP56149038A JP14903881A JPS5850078A JP S5850078 A JPS5850078 A JP S5850078A JP 56149038 A JP56149038 A JP 56149038A JP 14903881 A JP14903881 A JP 14903881A JP S5850078 A JPS5850078 A JP S5850078A
Authority
JP
Japan
Prior art keywords
character
characters
video signal
reference value
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56149038A
Other languages
English (en)
Other versions
JPH0119193B2 (ja
Inventor
Masahiro Okawa
大川 正廣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56149038A priority Critical patent/JPS5850078A/ja
Publication of JPS5850078A publication Critical patent/JPS5850078A/ja
Publication of JPH0119193B2 publication Critical patent/JPH0119193B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、再走査を行なう機能を有する文字認識装置に
関する。
文字l!繊は、文字を記載した媒体を光学的に走査して
その走査線上の媒体の明暗に対応するアナログビデオ信
号を得、これを多値ビデオ信号に変換してメモ、すに蓄
え、それを読出して2億化し、1文字分切出し、特徴を
抽出して辞書と比較して文字を解読し、といりた要領で
行なわれる。この場舎被解読文字に対応する辞書内文字
が正しいもの1つに決x′)tり解読されればよいが、
該当文字なし又は#轟文字複数個あ)となるつま如解読
できない場金は再走査することが行なわれる。を九被解
読文字に対応する辞書内文字が1つ選択されてもそれで
正しいかという問題は残る0例えば乱暴又は両省に書い
た数字1は6とも7とも誤読され、8は9ともなる。誤
読を避けるには2度読んでみる、−pt、it再走査す
るのが有効である。
再走査の従来法は、原稿文字の光電変換からや)直すメ
カニカル リスキャン、多値ビデオ信号から2値ビデオ
信号へ変換する際使用する閾値を変更するエレクトリッ
ク リスキャンのどちらかである。いずれにしても文字
読取シ速度は再走査しないときに比べて再走査回数には
!反比例して小になる。
本発明はこの読龜)速度低下を可及的に抑えようとする
もので特徴は2値ビデオ信号に変換された文字信号が画
くパターンから凹部、ループなどの文字特徴を抽出し、
該特徴から文字認識を行なう装置において、前記文字特
徴が有る、無いを決定する基準値を可変としてシき、一
度認識した文字に対する再走査IIcおいては皺基準値
を変更して文字特徴抽出を行なうようにしてなる点くあ
る。
以下図面を参拙しながらこれを詳細に説明する。
第1図は文字IIi識のプロセスを説明する図である。
原稿上の文字は移動体に取付けたフォトセルCODライ
ンスキャナなどの走査装置によ)光電変換され、得られ
たアナリグ信勺はム、4変換されて多値ビデオ信号KI
J)、図示しないがメモリに書込まれる。原稿が伝票で
あると、これには印刷された文字と書込まれた文字とが
あ砂、これらは明暗の程度が異なる。即ち一般に印刷文
字は濃く、手書き文字は薄い、そζで濃い文字に対して
は閾値を下げ(黒レベル側ヘシフトする)、薄い文字に
対し・ては閾値を上けて2値化するという方法をとる。
こうして2値化し大ビデオ信号は−1メモリに書込み、
次いで位置決めつまり1文字切出しを行なう、その後、
切出した1文字分の2値ビデオ信号が画くパターンに対
して!微抽出を行なう。
抽出する文字特徴には種々のものかあり%X−Y軸への
投影(X、Y座標上の黒ビットの数の和を各Y、x座標
毎に求めたもの)、凹部、ループ有無などがその−、二
の例である。後者の特徴抽出要領を第2図、第S図で説
明すると、点PはX軸に平行な線で両端が黒部外つまり
文字パターンに央癲る線分の2等分点であるが、該線を
Y軸方向で変えて点Pの軌跡を求めると線りとなる。こ
の線りがある長さム以上あ2とき文字パターンは点P近
傍で凹んでいると解釈し、この文字は凹部有抄という特
徴を持つとする0図示の数字3はY軸方向で見て上と下
に、またX軸方向でみて右側に1個、左側に2@の凹部
があり、このように5つの凹部を持つ数字は0〜9の中
和はないから被験体は数字「3」であるということに表
る。また数字3はX軸に沿りて左側から見ると図示の線
分4e 4e zsが見え、線分414と4では大きな
X方向シフ)(X@とする)があるから、か\るずれ為
を持つ3線分を有するという特徴を加えると、数字「5
」の認識は一層正確になる。上記の4゜X@は所定の特
徴と認めるか否かの基準値(閾値)であって、とbらは
所定値以上忙しないと、例えば4#0でもよいとすると
、直線の積りで書いた線も着千曲っていれば凹部ありと
なる誤砂を生じてしまう。
第3図は手書きの数字「8」を示すが、これは本来なら
ループは2つある。しかし上のループは完全々ループで
はないことがあり、また下のループは幅Wが狭いととが
ある。ループである以上幅Wはある値(基準値) We
以上あることが必要で、鶴=0なら単なる充実棒である
。っま)ループは、両端を黒ビットで閉じら・れる所定
長さm以上のX方向線分かあシ、この線分をY軸方向で
移動させると走読的に変化して行って上、下端では長さ
零になるという如き条件で判定できる。
所で従来の文字認識では*m対象の文字から抽出する特
徴の種類、つまb凹部有)か否か、ループ有りか否かは
変えず、またどの程度以上刃ら該特徴有りとするかつま
)基阜値亀固定でありた。
そして前述のように再走査では光電変換からやり直して
みる、多値ビデオ信号から2値ビデオ信号への変換の際
の閾値を変えてみるということであ5え、しかし前者の
場合は全部の工程を最初から中り直すととkなるのでl
i!繊所景時間が大に!択後者もこれに準じる。本発明
は特徴抽出の基準値を変えようとするものである。
館4図(−はアルファベットの8を、(h)け数字の5
を示す、これらの文字はよく似ておl>、x軸方向右側
および左側から見て共に凹部がTom、x。
!投影成分も似たようなものである。唯8は最後に跳ね
があり仁の部分に!!1部qがあることが文字8のポイ
ン)1&る。凹部判定の要領は前述の通〕であるが、と
の凹部QKおける前述の長さtは本来短く、基準値4を
大にすると凹部なしKfiるケースが増大する。そこで
再走査のときは基準値4を小にして凹部有〕やをチェッ
クしてみると、無しと判断されたケースでも有りとなる
ケースが出てきて数字5との区別をつけることができる
特徴抽出における基準値変j!なら、あとは辞書と対比
しての文字判定、#当文字抽出つまり答導出、その編集
、補正であるから、文字認識所要時間の増大は可及的に
抑制できる。なお第1図の答の編集、補正とは、抽出し
た特徴による文字判定で答が複数個でてくる、又は該当
なしとなるあるいは1つの該当文字がでてきたが、リス
キャンにより基準値を変更して文字認識した所正しい答
えが1つでてtI九場合その答を文字群中O該当位置へ
詰めるまたは既にある#轟文字と交替させる等の処理を
いう。
以上説明し喪ように本発明では文字特徴抽出における基
準値を変えて再走査するので、所要時間をさ#1ど増大
させずK11t識率あるいは認識精度を向上させること
ができ、甚だ有効である。なお本発明は光電変換からO
あるいは2値化からの再走査と組合せて使用してもよい
【図面の簡単な説明】
第1図は本発明の概要説明用ブ四ツク図、第2図〜第4
図は特徴抽出要領の説明図である。 図面でt、Wは凹部、ループ判定の基準を提供出願人 
富士通株式会社

Claims (1)

    【特許請求の範囲】
  1. 2値ビデオ信勺に変換された文字信号が画くパターンか
    ら凹部、ループなどの文字特徴を抽出し該特徴から文字
    認識を行なう装置において、前記文字特徴が有る、無い
    を決定する基準値を可変としておき、一度認識した文字
    に対する再走査においては該基準値を変更して文字特徴
    抽出を行なうよう忙してなることを特徴とする文字認識
    装置。
JP56149038A 1981-09-21 1981-09-21 文字認識装置 Granted JPS5850078A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56149038A JPS5850078A (ja) 1981-09-21 1981-09-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56149038A JPS5850078A (ja) 1981-09-21 1981-09-21 文字認識装置

Publications (2)

Publication Number Publication Date
JPS5850078A true JPS5850078A (ja) 1983-03-24
JPH0119193B2 JPH0119193B2 (ja) 1989-04-10

Family

ID=15466292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56149038A Granted JPS5850078A (ja) 1981-09-21 1981-09-21 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5850078A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58210793A (ja) * 1982-06-01 1983-12-08 Katsuo Motoi 外耳道内双方向通話装置
JP2007001548A (ja) * 2005-06-27 2007-01-11 Isuzu Motors Ltd 空気抵抗低減装置
JP2007001545A (ja) * 2005-06-27 2007-01-11 Isuzu Motors Ltd 空気抵抗低減装置
JP2007196783A (ja) * 2006-01-25 2007-08-09 Nissan Diesel Motor Co Ltd 車両の空気抵抗低減装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58210793A (ja) * 1982-06-01 1983-12-08 Katsuo Motoi 外耳道内双方向通話装置
JPS6328560B2 (ja) * 1982-06-01 1988-06-08 Katsuo Motoi
JP2007001548A (ja) * 2005-06-27 2007-01-11 Isuzu Motors Ltd 空気抵抗低減装置
JP2007001545A (ja) * 2005-06-27 2007-01-11 Isuzu Motors Ltd 空気抵抗低減装置
JP2007196783A (ja) * 2006-01-25 2007-08-09 Nissan Diesel Motor Co Ltd 車両の空気抵抗低減装置

Also Published As

Publication number Publication date
JPH0119193B2 (ja) 1989-04-10

Similar Documents

Publication Publication Date Title
US7949187B2 (en) Character string recognition method and device
CN107766854A (zh) 一种基于模板匹配实现快速页码识别的方法
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
JPS5850078A (ja) 文字認識装置
US5790701A (en) Character recognition apparatus using edge images
JPH10222602A (ja) 光学式文字読取装置
JPS6037952B2 (ja) 最適二値化方式
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3710164B2 (ja) 画像処理装置及び方法
JP2590099B2 (ja) 文字読取方式
JP2677007B2 (ja) 線判別システム
JP2877380B2 (ja) 光学的文字読取装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPH0916715A (ja) 文字認識装置および方法
JPS61147379A (ja) 光学式文字読取装置
EP1303830B1 (en) Method and device for recording of information
JPS61290581A (ja) 検索情報抽出記憶装置
JPH096909A (ja) 文字読取装置
JP2674475B2 (ja) 文字読取装置
JP2015049784A (ja) 文字補正装置及び文字補正方法とプログラム
JPS6379193A (ja) 文字読取装置
JPS61121184A (ja) 文字認識装置
JPS5914078A (ja) 帳票読取装置
JPH03273371A (ja) 文字認識装置
JPS61125687A (ja) パタ−ン抽出方式