JPS5851390A - 活字文字認識装置 - Google Patents

活字文字認識装置

Info

Publication number
JPS5851390A
JPS5851390A JP56150368A JP15036881A JPS5851390A JP S5851390 A JPS5851390 A JP S5851390A JP 56150368 A JP56150368 A JP 56150368A JP 15036881 A JP15036881 A JP 15036881A JP S5851390 A JPS5851390 A JP S5851390A
Authority
JP
Japan
Prior art keywords
font
printed
information
character
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56150368A
Other languages
English (en)
Inventor
Toru Kato
亨 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56150368A priority Critical patent/JPS5851390A/ja
Publication of JPS5851390A publication Critical patent/JPS5851390A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、活字文字1i111装曾、特に検数種類の印
字装置にて印字される可能性のある例えば帳票上の活字
文字を読取る活字文字認識装置において。
同一帳票に関しであるいは帳票上の同一フィールドに関
しては同一7オントで印字されている可能性が高い点に
着目し、読取シ結果の候補に対して7オント・ナンバ情
報をあわせて判定せしめておき、最終判定までの間に上
記7オント・ナンバ情報を反訣せしめるようにした活字
文字認識装置に関するものである。
最近データ処理システムを用いた業務が大キく進展され
、帳票上に印字された活字文字を読取るに蟲って亀、必
らずしも同一印字装置にて同一フォントの活字で印字さ
れていないものを読取ることが必要となっている■この
ような場合0例えば成る活字文字が、成るフォントのも
とでは「o」と読め、また他のフォントのもとではrO
Jと読めることなどかあ)、それらのいずれであ基かを
判定せしめるよう認識装置をつくることは実質上不可能
に近い。
本発明は、上記の点を解決することを1的としており1
例えば同−帳票上の印字に関してはあるいは帳票上の同
一フィールド内での印字に関しては、同一フォントの活
字で印字されている可能性が高い点に注目し、フォント
・ナンバ情報を認識判定に反映させて上記の点を解決す
ることを目的としている。そしてそのため0本発明の活
字文字認識装置は、複数個の印字活字文字を読取って夫
々特徴抽出を行ない、辞書に格納されている標準特徴情
報と照合して上記印字活字文字を認識する活字文字認識
装置において、上記辞書に格納する標準特徴情報とカテ
ゴリ情報とに対応してm#カテゴリが答として得られる
場合における当該活字文字のフォント・ナンバ情報を格
納するよう構成すると共和、上記標準特徴情報と照合す
る答候補判定回路部からの1つi喪は複数の候補出力を
上記カテゴリ情報と上記フォント・ナンバ情報との対応
情報として出力するよう構成きれてなシ、かつ上記候補
出力中の7オント・ナンバ情報を各フォント・ナンバ対
応にヒストグラムを作成してフォントを決定するフォン
ト決定回路部をそなえ。
骸決定された7オントにもとづいて上記各活字文字に対
応する答を上記候補出力の中から選択するようにしたこ
とを特徴としている。以下図面を参照しつつ説明する。
第1図は本発明に用いる辞書の一実施例構成、゛第2図
(4)ないし0は本発明において認識処理が行なわれる
一実施例の過程を説明する説明図、第3図は本発明の一
実施例構成を示す。
本発明に用いる辞書においては、第1図図示の如<、S
準特徴情報V(と当該標準特徴情報をもつ文字のカテゴ
リ情報A4とが対応づけられて格納されると共に、当該
標準特徴情報にもとづいて答(カテゴリ情報)が得られ
る場合の7オント・ナンバ情報を格納しておくようにさ
れる。即ち。
第1図図示の例で言えば、未知活字文字の特徴情報が標
準特徴情報v1と照合をとれ、当該未知活字文字がカテ
ゴリ情報A1によって指示されるカテゴリに属するとし
て答を得九場合には、当該未知活字文字がフォント・ナ
ンバ「3」のフォントを用いて印字されているものとみ
なすように、辞書が作成される0同様に同じ未知活字文
字がカテゴリ情報A2によって指示されるカテゴリに属
するとして答を得た場合には、当該未知活字文字がフォ
ント・ナンバ「5」のフォントを用いて印字されている
屯のとみなすように辞書が作成される。
第2図囚ないし0は本発明において認識処理が行なわれ
る一実施例過程を説明する説明図を示している。
今例えば帳票上の文字が4個あシ、第2図(2)図示の
如く。
(1)  第一文字について当該文字が1文字[Uであ
る場合にはフォント・ナンバ情報「3」の7オントで印
字されてお)0文字rBJである場合にはフォント・ナ
ンバ情報「4」のフォントで印字されており0文字「3
」である場合にはフォント・ナンバ情報「6」のフォン
トで印字されていると判定され。
(1)  第二文字について当該文字が0文字「0」で
ある場合にはフォント・ナンバ情報「1」のフォントで
印字されており9文字「0」である場合にはフォント・
ナンバ情報「3」のフォントで印字されていると判定さ
れ。
(1)  第三文字について当該文字が1文字「3」で
ある場合にはフォント・ナンバ情報「3」のフォントで
印字されておシ、1文字「フ」である場合には7オント
・ナンバ情報「3」のフォントで印字されてお)0文字
「〉」である場合にはフォント・ナンバ情報rlJまた
は「5」のフォントで印字されていると判定され。
(財)鮪四文字について当該文字が9文字「6」である
場合には7オント・ナンバ情報「3」のフォントで印字
されておシ0文字「0」である場合にはフォント・ナン
バ情報「6」の7オントで印字されていると判定され たとする。本発明の一実施例においては、当し帳票上の
活字が1例えば英・数字のみであるか、仮名文字を含ん
でいるかなどによって、読取シモードを選定するように
している。このためI/c第2第2因囚第三文字の場合
のように同一7オント・ナンバの亀とで答が複数個存在
するものとされたとしても、当該モードが英・数字リー
ド・モードであると指示されていれば、第2図(6)図
示の如く第三文字に関して答が文字「7」となるものは
排除される。
このようにして得られ九4個の各文字についての各候補
について、第2図(O図示の如く、各フォント・ナンバ
毎に頻度を調べ、#頻度が例えば総文字数(リジェクト
とされ丸文字を゛除く)の手分より屯大きい値をもつフ
ォント・ナンバを抽出する。図示の場合には7オント・
ナンバ情報「3」をもつフォントにて印字畜れているも
のとみなし。
第2図0図示の如く、上述の4個の文字が「8036」
であると認識するようにされる。
第3図は本発明の一実施例構成を示す0図中の符号lは
例えば帳票上の文字を読取った画像情報。
字は位置決め回路であって帳票上の画像情報から所定の
位置枠内(1文字毎の枠内)のii俸情報を抽出すべく
位置決め情報を決定する本の、3は決定された位置決め
情報を表わしている04は特徴抽出回路部であって1位
置決め情報に亀とづいて選択され九範囲内(位置枠内)
の画像情報につhで特徴抽出を行危う。5は抽出畑れた
特徴情報を表わしている。6は辞書であって第1図を参
照して説明した如き情報を格納しており、tた7は各候
補判定回路部であって、辞書6から読出された  一情
報と上記抽出された特徴情報5とを照合して第2図■を
参照して説明した如き各候補を判定する。
8は各候補及び7オント・ナンバ情報番表わし。
9は当該読取りが行なわれている場合の#I2図0を参
照して説明した如きリード・モード情報を表わしている
。10は答編集部であって最終的な認識を行なう。11
はリード・モード・チェック回路部であって、リード・
モード情報9を受取り。
各候補のうちで当該リード・モードに該当しないものを
排除する。12はフォント決定回路部を表わし、13は
オア論理部であって上記各候補におけるフォント・ナン
バ情報のオア論理をとる。
14は7オント一カウンタ制御回路部であって。
図示15として示す各7オント・カウンタ列にヒストグ
ラムを作成せしめる。16はトータル・大喪ヒストグラ
ムと上記トータル・カウンタ16の内容とにもとづいて
1図示17で示す7オント・ナンバを決定する。そして
、上記答編集部10は。
決定された7オント・ナンバと各候補及び7オント・ナ
ンバ情報8とから鮪2図■を参照して説明した如く、最
終答情報18を得る。なお1図示19は装置全体を制御
する認識制御回路部を表わしている。
以上説明した如く1本発明によれば、未知活字文字につ
いて各候補が抽出され、尚皺答候補が正解であるとすれ
ば当該未知活字文字が如何なるフォントにて印字されて
いるかを一緒に抽出する。
そして各文字が共通の7オントをもって印字きれている
ものとみなし、上記各候補の中から正解を得るようKさ
れる。仁のために、フォントを異にした印字が行なわれ
ている帳票が混在していても。
各帳票あるいは各フィールドの内容を正しく読取ること
が可能となる。
【図面の簡単な説明】
第1図は本発明に用いる辞書の一実施例構成。 第2図(2)危いし0は本発明において認識処理が行な
われる一実施例の過程を説明する説明図、第3図は本発
明の一実施例構成を示す。 図中、4は特徴抽出回路部、6は辞書、7は各候補判定
回路部、lOは答編集部、11はリード・モード・チェ
ック回路部、12はフォント決定回路部を表わす。 特許出願人 富士通株式会社 代理人弁理士 森 1) 寛

Claims (1)

  1. 【特許請求の範囲】 複数個の印字活字文字を読取って夫々特徴抽出を行々%
    A、辞書に格納されている標準特徴情報と照合して上記
    印字活字文字を認識する活字文字認識装置において、上
    記辞書に格納する標準特徴情報とカテゴリ情報とに対応
    して当該カテゴリが答として得られる場合における当該
    活字文字のフォント・ナンバ情報を格納するよう構成す
    ると共に。 上記標jIk特徴情報と照合する各候補判定回路部から
    の1つま九は複数の候補出力を上記カテゴリ情報と上記
    フォント・ナンバ情報との対応情報として出力するよう
    構成畜れてなシ、かつ上記候補出力中の7オント・ナン
    バ情報を各フォント・ナンバ対応にヒストグラムを作成
    して7オントを決定する7オント決定回路部をそなえ、
    腋決定され九フォントにもとづいて上記各活字文字に対
    応する答を上記候補出力の中から選択するようにしたこ
    とを特徴とする活字文字認識装置。
JP56150368A 1981-09-22 1981-09-22 活字文字認識装置 Pending JPS5851390A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56150368A JPS5851390A (ja) 1981-09-22 1981-09-22 活字文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56150368A JPS5851390A (ja) 1981-09-22 1981-09-22 活字文字認識装置

Publications (1)

Publication Number Publication Date
JPS5851390A true JPS5851390A (ja) 1983-03-26

Family

ID=15495460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56150368A Pending JPS5851390A (ja) 1981-09-22 1981-09-22 活字文字認識装置

Country Status (1)

Country Link
JP (1) JPS5851390A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8657022B2 (en) 2009-10-08 2014-02-25 Kidde Technologies, Inc. Fire suppression system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8657022B2 (en) 2009-10-08 2014-02-25 Kidde Technologies, Inc. Fire suppression system

Similar Documents

Publication Publication Date Title
US5029223A (en) Constraint driven-on line recognition of handwritten characters and symbols
US5621818A (en) Document recognition apparatus
US4274079A (en) Apparatus and method for dynamic font switching
US4491965A (en) Character recognition apparatus
Amin et al. Recognition of printed Arabic text using neural networks
JPS5851390A (ja) 活字文字認識装置
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JPS592191A (ja) 手書き日本語文の認識処理方式
Amin Recognition of printed Arabic text using machine learning
JP3151866B2 (ja) 英文字認識方法
JPS6336389A (ja) 文字読取装置
JP2538543B2 (ja) 文字情報認識装置
JP2529421B2 (ja) 文字認識装置
JP2924356B2 (ja) 光学文字読取装置
JPS6095689A (ja) 光学的文字読取装置
Amin et al. Automatic recognition of printed Arabic text using neural network classifier
JP3428504B2 (ja) 文字認識装置
JPS61114388A (ja) 文字入力装置
JPH10162103A (ja) 文字認識装置
JPH0514952B2 (ja)
JPS60138689A (ja) 文字認識方法
JPS6118080A (ja) 文字認識装置
JPH11134439A (ja) 単語認識方法
JPH0496882A (ja) 全角/半角判定方法