JPS5851390A - 活字文字認識装置 - Google Patents
活字文字認識装置Info
- Publication number
- JPS5851390A JPS5851390A JP56150368A JP15036881A JPS5851390A JP S5851390 A JPS5851390 A JP S5851390A JP 56150368 A JP56150368 A JP 56150368A JP 15036881 A JP15036881 A JP 15036881A JP S5851390 A JPS5851390 A JP S5851390A
- Authority
- JP
- Japan
- Prior art keywords
- font
- printed
- information
- character
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、活字文字1i111装曾、特に検数種類の印
字装置にて印字される可能性のある例えば帳票上の活字
文字を読取る活字文字認識装置において。
字装置にて印字される可能性のある例えば帳票上の活字
文字を読取る活字文字認識装置において。
同一帳票に関しであるいは帳票上の同一フィールドに関
しては同一7オントで印字されている可能性が高い点に
着目し、読取シ結果の候補に対して7オント・ナンバ情
報をあわせて判定せしめておき、最終判定までの間に上
記7オント・ナンバ情報を反訣せしめるようにした活字
文字認識装置に関するものである。
しては同一7オントで印字されている可能性が高い点に
着目し、読取シ結果の候補に対して7オント・ナンバ情
報をあわせて判定せしめておき、最終判定までの間に上
記7オント・ナンバ情報を反訣せしめるようにした活字
文字認識装置に関するものである。
最近データ処理システムを用いた業務が大キく進展され
、帳票上に印字された活字文字を読取るに蟲って亀、必
らずしも同一印字装置にて同一フォントの活字で印字さ
れていないものを読取ることが必要となっている■この
ような場合0例えば成る活字文字が、成るフォントのも
とでは「o」と読め、また他のフォントのもとではrO
Jと読めることなどかあ)、それらのいずれであ基かを
判定せしめるよう認識装置をつくることは実質上不可能
に近い。
、帳票上に印字された活字文字を読取るに蟲って亀、必
らずしも同一印字装置にて同一フォントの活字で印字さ
れていないものを読取ることが必要となっている■この
ような場合0例えば成る活字文字が、成るフォントのも
とでは「o」と読め、また他のフォントのもとではrO
Jと読めることなどかあ)、それらのいずれであ基かを
判定せしめるよう認識装置をつくることは実質上不可能
に近い。
本発明は、上記の点を解決することを1的としており1
例えば同−帳票上の印字に関してはあるいは帳票上の同
一フィールド内での印字に関しては、同一フォントの活
字で印字されている可能性が高い点に注目し、フォント
・ナンバ情報を認識判定に反映させて上記の点を解決す
ることを目的としている。そしてそのため0本発明の活
字文字認識装置は、複数個の印字活字文字を読取って夫
々特徴抽出を行ない、辞書に格納されている標準特徴情
報と照合して上記印字活字文字を認識する活字文字認識
装置において、上記辞書に格納する標準特徴情報とカテ
ゴリ情報とに対応してm#カテゴリが答として得られる
場合における当該活字文字のフォント・ナンバ情報を格
納するよう構成すると共和、上記標準特徴情報と照合す
る答候補判定回路部からの1つi喪は複数の候補出力を
上記カテゴリ情報と上記フォント・ナンバ情報との対応
情報として出力するよう構成きれてなシ、かつ上記候補
出力中の7オント・ナンバ情報を各フォント・ナンバ対
応にヒストグラムを作成してフォントを決定するフォン
ト決定回路部をそなえ。
例えば同−帳票上の印字に関してはあるいは帳票上の同
一フィールド内での印字に関しては、同一フォントの活
字で印字されている可能性が高い点に注目し、フォント
・ナンバ情報を認識判定に反映させて上記の点を解決す
ることを目的としている。そしてそのため0本発明の活
字文字認識装置は、複数個の印字活字文字を読取って夫
々特徴抽出を行ない、辞書に格納されている標準特徴情
報と照合して上記印字活字文字を認識する活字文字認識
装置において、上記辞書に格納する標準特徴情報とカテ
ゴリ情報とに対応してm#カテゴリが答として得られる
場合における当該活字文字のフォント・ナンバ情報を格
納するよう構成すると共和、上記標準特徴情報と照合す
る答候補判定回路部からの1つi喪は複数の候補出力を
上記カテゴリ情報と上記フォント・ナンバ情報との対応
情報として出力するよう構成きれてなシ、かつ上記候補
出力中の7オント・ナンバ情報を各フォント・ナンバ対
応にヒストグラムを作成してフォントを決定するフォン
ト決定回路部をそなえ。
骸決定された7オントにもとづいて上記各活字文字に対
応する答を上記候補出力の中から選択するようにしたこ
とを特徴としている。以下図面を参照しつつ説明する。
応する答を上記候補出力の中から選択するようにしたこ
とを特徴としている。以下図面を参照しつつ説明する。
第1図は本発明に用いる辞書の一実施例構成、゛第2図
(4)ないし0は本発明において認識処理が行なわれる
一実施例の過程を説明する説明図、第3図は本発明の一
実施例構成を示す。
(4)ないし0は本発明において認識処理が行なわれる
一実施例の過程を説明する説明図、第3図は本発明の一
実施例構成を示す。
本発明に用いる辞書においては、第1図図示の如<、S
準特徴情報V(と当該標準特徴情報をもつ文字のカテゴ
リ情報A4とが対応づけられて格納されると共に、当該
標準特徴情報にもとづいて答(カテゴリ情報)が得られ
る場合の7オント・ナンバ情報を格納しておくようにさ
れる。即ち。
準特徴情報V(と当該標準特徴情報をもつ文字のカテゴ
リ情報A4とが対応づけられて格納されると共に、当該
標準特徴情報にもとづいて答(カテゴリ情報)が得られ
る場合の7オント・ナンバ情報を格納しておくようにさ
れる。即ち。
第1図図示の例で言えば、未知活字文字の特徴情報が標
準特徴情報v1と照合をとれ、当該未知活字文字がカテ
ゴリ情報A1によって指示されるカテゴリに属するとし
て答を得九場合には、当該未知活字文字がフォント・ナ
ンバ「3」のフォントを用いて印字されているものとみ
なすように、辞書が作成される0同様に同じ未知活字文
字がカテゴリ情報A2によって指示されるカテゴリに属
するとして答を得た場合には、当該未知活字文字がフォ
ント・ナンバ「5」のフォントを用いて印字されている
屯のとみなすように辞書が作成される。
準特徴情報v1と照合をとれ、当該未知活字文字がカテ
ゴリ情報A1によって指示されるカテゴリに属するとし
て答を得九場合には、当該未知活字文字がフォント・ナ
ンバ「3」のフォントを用いて印字されているものとみ
なすように、辞書が作成される0同様に同じ未知活字文
字がカテゴリ情報A2によって指示されるカテゴリに属
するとして答を得た場合には、当該未知活字文字がフォ
ント・ナンバ「5」のフォントを用いて印字されている
屯のとみなすように辞書が作成される。
第2図囚ないし0は本発明において認識処理が行なわれ
る一実施例過程を説明する説明図を示している。
る一実施例過程を説明する説明図を示している。
今例えば帳票上の文字が4個あシ、第2図(2)図示の
如く。
如く。
(1) 第一文字について当該文字が1文字[Uであ
る場合にはフォント・ナンバ情報「3」の7オントで印
字されてお)0文字rBJである場合にはフォント・ナ
ンバ情報「4」のフォントで印字されており0文字「3
」である場合にはフォント・ナンバ情報「6」のフォン
トで印字されていると判定され。
る場合にはフォント・ナンバ情報「3」の7オントで印
字されてお)0文字rBJである場合にはフォント・ナ
ンバ情報「4」のフォントで印字されており0文字「3
」である場合にはフォント・ナンバ情報「6」のフォン
トで印字されていると判定され。
(1) 第二文字について当該文字が0文字「0」で
ある場合にはフォント・ナンバ情報「1」のフォントで
印字されており9文字「0」である場合にはフォント・
ナンバ情報「3」のフォントで印字されていると判定さ
れ。
ある場合にはフォント・ナンバ情報「1」のフォントで
印字されており9文字「0」である場合にはフォント・
ナンバ情報「3」のフォントで印字されていると判定さ
れ。
(1) 第三文字について当該文字が1文字「3」で
ある場合にはフォント・ナンバ情報「3」のフォントで
印字されておシ、1文字「フ」である場合には7オント
・ナンバ情報「3」のフォントで印字されてお)0文字
「〉」である場合にはフォント・ナンバ情報rlJまた
は「5」のフォントで印字されていると判定され。
ある場合にはフォント・ナンバ情報「3」のフォントで
印字されておシ、1文字「フ」である場合には7オント
・ナンバ情報「3」のフォントで印字されてお)0文字
「〉」である場合にはフォント・ナンバ情報rlJまた
は「5」のフォントで印字されていると判定され。
(財)鮪四文字について当該文字が9文字「6」である
場合には7オント・ナンバ情報「3」のフォントで印字
されておシ0文字「0」である場合にはフォント・ナン
バ情報「6」の7オントで印字されていると判定され たとする。本発明の一実施例においては、当し帳票上の
活字が1例えば英・数字のみであるか、仮名文字を含ん
でいるかなどによって、読取シモードを選定するように
している。このためI/c第2第2因囚第三文字の場合
のように同一7オント・ナンバの亀とで答が複数個存在
するものとされたとしても、当該モードが英・数字リー
ド・モードであると指示されていれば、第2図(6)図
示の如く第三文字に関して答が文字「7」となるものは
排除される。
場合には7オント・ナンバ情報「3」のフォントで印字
されておシ0文字「0」である場合にはフォント・ナン
バ情報「6」の7オントで印字されていると判定され たとする。本発明の一実施例においては、当し帳票上の
活字が1例えば英・数字のみであるか、仮名文字を含ん
でいるかなどによって、読取シモードを選定するように
している。このためI/c第2第2因囚第三文字の場合
のように同一7オント・ナンバの亀とで答が複数個存在
するものとされたとしても、当該モードが英・数字リー
ド・モードであると指示されていれば、第2図(6)図
示の如く第三文字に関して答が文字「7」となるものは
排除される。
このようにして得られ九4個の各文字についての各候補
について、第2図(O図示の如く、各フォント・ナンバ
毎に頻度を調べ、#頻度が例えば総文字数(リジェクト
とされ丸文字を゛除く)の手分より屯大きい値をもつフ
ォント・ナンバを抽出する。図示の場合には7オント・
ナンバ情報「3」をもつフォントにて印字畜れているも
のとみなし。
について、第2図(O図示の如く、各フォント・ナンバ
毎に頻度を調べ、#頻度が例えば総文字数(リジェクト
とされ丸文字を゛除く)の手分より屯大きい値をもつフ
ォント・ナンバを抽出する。図示の場合には7オント・
ナンバ情報「3」をもつフォントにて印字畜れているも
のとみなし。
第2図0図示の如く、上述の4個の文字が「8036」
であると認識するようにされる。
であると認識するようにされる。
第3図は本発明の一実施例構成を示す0図中の符号lは
例えば帳票上の文字を読取った画像情報。
例えば帳票上の文字を読取った画像情報。
字は位置決め回路であって帳票上の画像情報から所定の
位置枠内(1文字毎の枠内)のii俸情報を抽出すべく
位置決め情報を決定する本の、3は決定された位置決め
情報を表わしている04は特徴抽出回路部であって1位
置決め情報に亀とづいて選択され九範囲内(位置枠内)
の画像情報につhで特徴抽出を行危う。5は抽出畑れた
特徴情報を表わしている。6は辞書であって第1図を参
照して説明した如き情報を格納しており、tた7は各候
補判定回路部であって、辞書6から読出された 一情
報と上記抽出された特徴情報5とを照合して第2図■を
参照して説明した如き各候補を判定する。
位置枠内(1文字毎の枠内)のii俸情報を抽出すべく
位置決め情報を決定する本の、3は決定された位置決め
情報を表わしている04は特徴抽出回路部であって1位
置決め情報に亀とづいて選択され九範囲内(位置枠内)
の画像情報につhで特徴抽出を行危う。5は抽出畑れた
特徴情報を表わしている。6は辞書であって第1図を参
照して説明した如き情報を格納しており、tた7は各候
補判定回路部であって、辞書6から読出された 一情
報と上記抽出された特徴情報5とを照合して第2図■を
参照して説明した如き各候補を判定する。
8は各候補及び7オント・ナンバ情報番表わし。
9は当該読取りが行なわれている場合の#I2図0を参
照して説明した如きリード・モード情報を表わしている
。10は答編集部であって最終的な認識を行なう。11
はリード・モード・チェック回路部であって、リード・
モード情報9を受取り。
照して説明した如きリード・モード情報を表わしている
。10は答編集部であって最終的な認識を行なう。11
はリード・モード・チェック回路部であって、リード・
モード情報9を受取り。
各候補のうちで当該リード・モードに該当しないものを
排除する。12はフォント決定回路部を表わし、13は
オア論理部であって上記各候補におけるフォント・ナン
バ情報のオア論理をとる。
排除する。12はフォント決定回路部を表わし、13は
オア論理部であって上記各候補におけるフォント・ナン
バ情報のオア論理をとる。
14は7オント一カウンタ制御回路部であって。
図示15として示す各7オント・カウンタ列にヒストグ
ラムを作成せしめる。16はトータル・大喪ヒストグラ
ムと上記トータル・カウンタ16の内容とにもとづいて
1図示17で示す7オント・ナンバを決定する。そして
、上記答編集部10は。
ラムを作成せしめる。16はトータル・大喪ヒストグラ
ムと上記トータル・カウンタ16の内容とにもとづいて
1図示17で示す7オント・ナンバを決定する。そして
、上記答編集部10は。
決定された7オント・ナンバと各候補及び7オント・ナ
ンバ情報8とから鮪2図■を参照して説明した如く、最
終答情報18を得る。なお1図示19は装置全体を制御
する認識制御回路部を表わしている。
ンバ情報8とから鮪2図■を参照して説明した如く、最
終答情報18を得る。なお1図示19は装置全体を制御
する認識制御回路部を表わしている。
以上説明した如く1本発明によれば、未知活字文字につ
いて各候補が抽出され、尚皺答候補が正解であるとすれ
ば当該未知活字文字が如何なるフォントにて印字されて
いるかを一緒に抽出する。
いて各候補が抽出され、尚皺答候補が正解であるとすれ
ば当該未知活字文字が如何なるフォントにて印字されて
いるかを一緒に抽出する。
そして各文字が共通の7オントをもって印字きれている
ものとみなし、上記各候補の中から正解を得るようKさ
れる。仁のために、フォントを異にした印字が行なわれ
ている帳票が混在していても。
ものとみなし、上記各候補の中から正解を得るようKさ
れる。仁のために、フォントを異にした印字が行なわれ
ている帳票が混在していても。
各帳票あるいは各フィールドの内容を正しく読取ること
が可能となる。
が可能となる。
第1図は本発明に用いる辞書の一実施例構成。
第2図(2)危いし0は本発明において認識処理が行な
われる一実施例の過程を説明する説明図、第3図は本発
明の一実施例構成を示す。 図中、4は特徴抽出回路部、6は辞書、7は各候補判定
回路部、lOは答編集部、11はリード・モード・チェ
ック回路部、12はフォント決定回路部を表わす。 特許出願人 富士通株式会社 代理人弁理士 森 1) 寛
われる一実施例の過程を説明する説明図、第3図は本発
明の一実施例構成を示す。 図中、4は特徴抽出回路部、6は辞書、7は各候補判定
回路部、lOは答編集部、11はリード・モード・チェ
ック回路部、12はフォント決定回路部を表わす。 特許出願人 富士通株式会社 代理人弁理士 森 1) 寛
Claims (1)
- 【特許請求の範囲】 複数個の印字活字文字を読取って夫々特徴抽出を行々%
A、辞書に格納されている標準特徴情報と照合して上記
印字活字文字を認識する活字文字認識装置において、上
記辞書に格納する標準特徴情報とカテゴリ情報とに対応
して当該カテゴリが答として得られる場合における当該
活字文字のフォント・ナンバ情報を格納するよう構成す
ると共に。 上記標jIk特徴情報と照合する各候補判定回路部から
の1つま九は複数の候補出力を上記カテゴリ情報と上記
フォント・ナンバ情報との対応情報として出力するよう
構成畜れてなシ、かつ上記候補出力中の7オント・ナン
バ情報を各フォント・ナンバ対応にヒストグラムを作成
して7オントを決定する7オント決定回路部をそなえ、
腋決定され九フォントにもとづいて上記各活字文字に対
応する答を上記候補出力の中から選択するようにしたこ
とを特徴とする活字文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56150368A JPS5851390A (ja) | 1981-09-22 | 1981-09-22 | 活字文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56150368A JPS5851390A (ja) | 1981-09-22 | 1981-09-22 | 活字文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5851390A true JPS5851390A (ja) | 1983-03-26 |
Family
ID=15495460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56150368A Pending JPS5851390A (ja) | 1981-09-22 | 1981-09-22 | 活字文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5851390A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8657022B2 (en) | 2009-10-08 | 2014-02-25 | Kidde Technologies, Inc. | Fire suppression system |
-
1981
- 1981-09-22 JP JP56150368A patent/JPS5851390A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8657022B2 (en) | 2009-10-08 | 2014-02-25 | Kidde Technologies, Inc. | Fire suppression system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5029223A (en) | Constraint driven-on line recognition of handwritten characters and symbols | |
US5621818A (en) | Document recognition apparatus | |
US4274079A (en) | Apparatus and method for dynamic font switching | |
US4491965A (en) | Character recognition apparatus | |
Amin et al. | Recognition of printed Arabic text using neural networks | |
JPS5851390A (ja) | 活字文字認識装置 | |
RU2707320C1 (ru) | Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот | |
JPH10302025A (ja) | 手書き文字認識装置およびそのプログラム記録媒体 | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
Amin | Recognition of printed Arabic text using machine learning | |
JP3151866B2 (ja) | 英文字認識方法 | |
JPS6336389A (ja) | 文字読取装置 | |
JP2538543B2 (ja) | 文字情報認識装置 | |
JP2529421B2 (ja) | 文字認識装置 | |
JP2924356B2 (ja) | 光学文字読取装置 | |
JPS6095689A (ja) | 光学的文字読取装置 | |
Amin et al. | Automatic recognition of printed Arabic text using neural network classifier | |
JP3428504B2 (ja) | 文字認識装置 | |
JPS61114388A (ja) | 文字入力装置 | |
JPH10162103A (ja) | 文字認識装置 | |
JPH0514952B2 (ja) | ||
JPS60138689A (ja) | 文字認識方法 | |
JPS6118080A (ja) | 文字認識装置 | |
JPH11134439A (ja) | 単語認識方法 | |
JPH0496882A (ja) | 全角/半角判定方法 |