JPS6363954B2 - - Google Patents

Info

Publication number
JPS6363954B2
JPS6363954B2 JP56195615A JP19561581A JPS6363954B2 JP S6363954 B2 JPS6363954 B2 JP S6363954B2 JP 56195615 A JP56195615 A JP 56195615A JP 19561581 A JP19561581 A JP 19561581A JP S6363954 B2 JPS6363954 B2 JP S6363954B2
Authority
JP
Japan
Prior art keywords
character
pattern
voiced
block
recognition unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56195615A
Other languages
English (en)
Other versions
JPS5897783A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP56195615A priority Critical patent/JPS5897783A/ja
Publication of JPS5897783A publication Critical patent/JPS5897783A/ja
Publication of JPS6363954B2 publication Critical patent/JPS6363954B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は光学的文字読取装置(以下OCRと称
す)に関するものであり、更に詳しくは、カタカ
ナ又はひらがなの文字読取装置に関するものであ
る。
従来、濁点又は半濁点を有するカタカナ又はひ
らがなの文字をOCRで読取る場合、濁点又は半
濁点は1個の文字として取扱われていた。なぜな
らば、濁点又は半濁点を有するカタカナ又はひら
がなの文字が帳票の1文字枠にそのまま記入され
た場合、1文字を構成するブロツクの数が多いた
め、OCRの文字認識部は、濁点又は半濁点をノ
イズと間違えて認識するケースが多く、正しく認
識することが因難であつたからである。従つて、
濁点又は半濁点を有するカタカナ又はひらがなの
文字は帳票に記入される際、濁点又は半濁点は1
文字として別の1個の文字枠に記入されていた。
たとえば、カタカナの文字の場合を例にとると、
第1図aに示すように、「ガ」又は「プ」を帳票
の文字枠に記入するには、「カ」と「”」又は
「フ」と「゜」のように分けて夫々別の文字枠に
記入していた。しかし、このような記入方法であ
れば、通常使用されている文書の記入方法、すな
わち第1図bに示すように、1文字枠に「ガ」と
か「プ」を記入する方法、と異なり不便であつ
た。
本発明は、かかる不便を解消するためになされ
たもので、濁点又は半濁点を有するカタカナ又は
ひらがなの文字が1文字枠にそのまま記入されて
いても読取ることができるOCRを提供すること
を目的とする。
以下図面を参照して本発明の一実施例を説明す
る。
第2図は本発明に係るOCRを示すブロツク図
である。
図中1は第1のRAM、2は第2のRAM(以下
RAM1、RAM2と称す)である。このRAM
1、RAM2は光電変換されて得た1文字分の文
字パターン3を夫々に格納するという機能を有す
る。即ち、光電変換された1文字分の文字パター
ン3はRAM1には直後、RAM2にはORゲート
4を介して夫々に格納される。又これらのRAM
1およびRAM2にはLineアドレスカウンタ5と
ROWアドレスカウンタ6とが接続され、制御回
路7の出力するアドレスに従つて読み出し、書き
込みが行なわれる。
制御回路7は、本装置全体をコントロールする
回路であり、前述したようにRAM1および
RAM2に対し、アドレスカウンタ5,6を介し
てアドレスを指定し、読み出し信号は書き込み信
号を供給する他、RAM2に格納された、1文字
を構成するパターンブロツク(以下単にブロツク
と称す)各々について線縁追跡を行なう機能を具
備している。この線縁追跡により得られたデー
タ、たとえば各ブロツクの線縁のアドレス、周縁
長、高さ等は図示せぬレジスタに記憶される。
又、制御回路7は、上述した機能およびデータ
に基づいて、条件によつては、RAM1より出力
されるパターン信号8を直接文字認識部10へ送
るか、RAM2より出力されるパターン信号9を
直接文字認識部10へ送るか、又は、前記パター
ン信号8と、前記パターン信号9の極性がインバ
ータ11により反転させられた信号12とが
ANDゲート13に入力され、該ANDゲート13
から出力された信号14を文字認識部10へ送る
か、を判断し、夫々の信号を文字認識部10へ送
る機能をも有している。
一方、RAM1,2よりパターン信号8,9が
出力されたとき、該パターン信号8,9は制御回
路7に入力されるようになされている。又、制御
回路7は、必要があれば、RAM2のパターンの
一部のブロツクを消し込む為、白ビツト信号15
を出力し、ORゲート4を介してRAM2に前記
白ビツト信号15を送り、又、必要があれば前記
したブロツクのうち最大高さを有するブロツクの
高さおよび該ブロツクの上端、下端の位置のデー
タ16を文字認識部10へ供給するようになされ
ている。
文字認識部10は、前記パターン信号8,9
と、前記パターン信号8と前記パターン信号9の
極性を反転させられた信号12とがANDゲート
13を通された後の信号14と、又は必要がある
ときはパターン信号9が入力されるのと同時に入
力され得る前記最大高さを有するブロツクの高さ
および該ブロツクの上端、下端の位置のデータ1
6とにより、パターン認識を行ない、解答17を
出力する回路である。なお前記解答17は制御回
路7に入力され、該制御回路7は入力された前記
解答17の種類により異なる処理を行なう。
次に第3図のフローチヤートを参照して、カタ
カナの文字、特に「ガ」を読み取る場合を例にと
り、本実施例の動作を説明する。
1 ステツプでは、RAM1およびRAM2
夫々に、1文字分の文字パターンを書き込む。
すなわち、帳票の1文字枠に記入された文字
は光電変換されて1文字分の文字パターン3と
してRAM1およびRAM2に送られる。制御
回路7は、アドレスカウンタ5,6を制御して
RAM1およびRAM2のアドレスを指定し、
書き込み信号を送り、RAM1およびRAM2
に夫々同一の文字パターン3を書き込む。例え
ばカタカナの文字パターン「ガ」がRAM1お
よびRAM2に同じ様に書き込まれる。
2 ステツプでは、RAM2に書き込まれた文
字パターンの各ブロツクについて線縁追跡が行
なわれる。
すなわち、制御回路7は、アドレスカウンタ
5,6を制御して、RAM2の左端からRow方
向に走査を開始する。そして最初に黒ビツトが
検出されたアドレスをスタート地点として、例
えば第4図に示すブロツク「カ」のように、時
計方向に追跡が行なわれる。つまり、制御回路
7はスタート地点である黒ビツトから、追跡方
向左側が白ビツトとなるような次の黒ビツトを
求めて追跡を行なう。この追跡の過程で、追跡
された黒ビツトの数すなわち、ブロツクの線縁
の長さは、第5図に示すように8方向に分けら
れた方向コードについて、計数カウントされ
る。又、スタート地点のアドレス、及び追跡さ
れたブロツクの線縁のアドレスは、前述した図
示せぬレジスタに記憶される。追跡箇所がスタ
ート地点に戻つたとき、線縁追跡は終る。1文
字が複数個のブロツクで構成されている場合に
は、夫々のブロツクについてもすべて同様に追
跡、記憶が行なわれる。
3 ステツプでは制御回路7は、ステツプに
おいて各ブロツクについて線縁追跡を行なつた
結果得られたデータをもとに、次の2つの場合
に分ける。
(1) すべてのブロツクの周縁長lが夫々一定の
長さnより長い場合 (2) 一部のブロツクの周縁長lだけが一定の長
さnより長い場合 上記のように2つの場合に分ける理由は、
濁点又は半濁点を有するカタカナと、濁点又
は半濁点を有しないカタカナとを区別して認
識するためである。したがつて、ここでいう
一定の長さnは、文字枠に普通に記入される
濁点又は半濁点のブロツクのうち最大のブロ
ツクと考えられるブロツクの周縁の長さとし
ておく。
しかし、上記の分け方で、濁点又は半濁点
を有するカタカナと、濁点又は半濁点を有し
ないカタカナとを区別した場合、例外が生じ
る。この例外については後で述べる。
a 上記(1)の場合 制御回路7はRAM1が格納している文字
パターンを読み出し、パターン信号8とし
て、直接そのまま文字認識部10へ送る。そ
して文字認識部10では入力された前記パタ
ーン信号8により、パターン認識が行なわれ
る。
具体的には、「カ」「キ」などのように、1
つの大きなブロツクのみで構成されたカタカ
ナ、「ニ」「ハ」などのように、濁点又は半濁
点より大きなブロツクが複数個で構成されて
いるカタカナなど、濁点又は半濁点のないカ
タカナのほとんどがこの(1)の場合に属し、こ
れらは文字認識部10で認識される。
b (2)の場合 次のステツプに進む。
具体的に、この(2)の場合に属するカタカナ
は、「ガ」「プ」など濁点又は半濁点を有する
カタカナである。しかし、前述したように、
ここに例外がある。すなわち、「シ」「ソ」
「ツ」「ホ」「ン」は、濁点又は半濁点を有し
なくても、1文字の文字パターンのうち、一
部に周縁長lが一定の長さnより短かいブロ
ツクを含んでいる。したがつて、これらのカ
タカナはこの(2)の場合に属することになり、
上記濁点又は半濁点を有するカタカナと共に
次のステツプ以降で処理される。
4 ステツプでは、RAM2に書き込まれてい
る文字パターンのブロツクのうち、一部のブロ
ツクの消し込みが行なわれる。
ここで制御回路7は、ステツプにおいて各ブ
ロツクを線縁追跡した結果得たデータをもとに、
RAM2に書き込まれているパターンのうち次に
3つの条件に夫々あてはまるブロツクを選択し、
該ブロツクの消し込みを行なう。
(a) 周縁長lが一定の長さより長い (b) 最大高さを有するブロツクより左側にある (c) 文字枠中心より下にある 以上3つの条件を設けた理由は、RAM2に書
き込まれた文字パターンのうち濁点又は半濁点だ
けを残し、他のブロツクを消し込むためである。
すなわち、前のステツプまでにおいて、まだ認
識されないカタカナは 濁点又は半濁点を有するカタカナ 「シ」「ソ」「ツ」「ホ」「ン」のように周縁
長lが一定の長さnより短いブロツクを一部
に含むカタカナ の2種類があり、これらのカタカナからは濁
点又は半濁点を抽出するためである。具体的
には次の理由による。
(a)の条件を設けた理由 ステツプで述べたように、濁点又は半濁点以
外のブロツクは、全般に濁点又は半濁点より大き
いからである。
(b)の条件を設けた理由 上記で挙げたカタカナのうち「シ」「ソ」
「ツ」「ン」は(a)の条件にこの(b)の条件を加えるこ
とにより、1文字を構成するすべてのブロツクを
消し込むことができるからである。
(c)の条件を設けた理由 上記で挙げたカタカナのうち、(a),(b)の条件
が併用されても残る「ホ」は、この(c)の条件が加
えられることにより、「ホ」の1文字を構成する
すべてのブロツクを消し込むことができるからで
ある。
なお、上述した3つの条件に夫々該当するブロ
ツクをRAM2において消し込むには次の様にす
る。
すなわち、制御回路7は、ステツプで線縁追
跡した結果得られた各ブロツクの線縁のアドレス
に基づき、カウンタ5,6を介して、RAM2の
アドレスを指定し、書き込み信号を出力し、
RAM2に黒ビツトとして書き込まれたパターン
の中で該当するブロツクに白ビツトを書き込むも
のである。濁点又は半濁点を有するカタカナ、た
とえば、第6図(a)に示す「ガ」については、条件
にあてはまるブロツクはここでは「カ」であるか
ら、「カ」が消し込まれ、残りは(b)に示すように
「”」だけとなる。又、「シ」「ソ」など周縁長lが
一定の長さnより短いブロツクを一部に含む濁点
又は半濁点のないカタカナの場合にはブロツク全
くない「 」となる。
5 ステツプでは、RAM2のパターンが文字
認識部10に送られる。
すなわち、制御回路7は、ステツプで条件
にあてはまるブロツクが消し込まれた状態にあ
るRAM2のパターンを読み出しパターン信号
9として直接文字認識部10へ送る。それと同
時に、もとの文字パターンを構成しているブロ
ツクのうち、最大高さを有するブロツクの高さ
と該ブロツクの上端および下端の位置のデータ
16も文字認識部10へ入力させる。これは、
文字認識部10で濁点又は半濁点を認識させや
すくするためである。
例えば、第6図(a)に示す「ガ」の場合には(b)
に示す「”」が文字認識部10へ送られる。又、
「シ」「ソ」など周縁長lが一定の長さnより短
いブロツクを一部に含む濁点又は半濁点のない
カタカナの場合には、ブロツクの全くない「」
が文字認識部10へ送られる。
なお、文字認識部10は、このとき送られて
きたパターン信号9と、該パターン信号9と同
時に入力される前記最大高さを有するブロツク
の高さと該ブロツクの上端および下端の位置の
データ16とにより、パターン認識を行ない、
次の3通りの解答17を制御回路に送る。
(i)濁点 (ii)半濁点 (iii)濁点および半濁点以外例
えば前述した「ガ」の場合は、「”」が文字認識
部10において、濁点であるとの解答17が出
され、「シ」の場合にはブロツクの全くない「」
が文字認識部10において、濁点又は半濁点で
ないとの解答17が出される。
6 ステツプでは、制御回路7は、文字認識部
10から送られてきた前に記した3通りの解答
17を次の2つの場合に分ける。
(1) 前記解答17が濁点又は半濁点でない場合 (2) 前記解答17が濁点又は半濁点である場合 a(1)の場合 制御回路7は、RAM1のパターンをパター
ン信号9により文字認識部10に送る。
例えば、ここで文字認識部10に送られてく
るパターンは、前述したカタカナ「シ」「ソ」
等、夫々一部に周縁長が一定の長さより短いブ
ロツクを含む濁点又は半濁点のないカタカナで
ある。そして、このとき、文字認識部10は、
「シ」「ソ」などのカタカナを認識する。
b(2)の場合 次のステツプに進む。
なお、ここまでのステツプで、まだ認識されな
いカタカナは、濁点又は半濁点を有するカタカナ
だけとなる。
7 ステツプでは、パターン信号8と、パター
ン信号9の極性が反転させられた信号12とが
ANDゲート13を介されて、文字認識部10
へ入力される。
すなわち、制御回路7は、濁点又は半濁点を
有するカタカナの1文字のうち濁点又は半濁点
をとり除いたブロツクを認識するため、RAM
1のパターンそのままと、濁点又は半濁点のみ
であるRAM2のパターンの白黒を反転させた
ものとを重ね合わせる。
例えばRAM1のパターンは第6図aに示す
「ガ」であり、RAM2のパターンはこのとき
第6図bに示す「”」である。したがつて「ガ」
のパターン信号8と、「”」のパターン信号9の
極性がインバータ11により反転させられた信
号12とがANDゲート13に入力され、該
ANDゲート13から出力された信号14が文
字認識部10へ入力される。そして、文字認識
部10では、第6図cに示すパターン「カ」を
認識する。すなわち、ここで「ガ」のうちの
「カ」が分離されて認識されるわけである。
なお、文字認識部10へ送られるパターンの
うち濁点又は半濁点の前のブロツクがカ、サ、
ハ、タの各行以外の場合には、該パターンはリ
ジエクトされるように文字認識部10をセツト
しておけば、更に読取精度が上がる。
このようにして、1文字枠に記入された濁点
又は半濁点を有するカタカナは、濁点又は半濁
点のブロツクと、濁点又は半濁点がとり除かれ
たブロツクとに分離されて認識されることがで
きる。
本実施例ではカタカナの文字の場合を例にと
つて説明したが、ひらがなの文字の場合も同様
にして読み取ることが可能となる。
以上説明したように、本発明によれば、濁点
又は半濁点を有するカタカナ又はひらがなの1
文字を帳票に記入する際、濁点又は半濁点を1
文字として別の文字枠に記入する必要がなくな
る。
すなわち、濁点又は半濁点を有するカタカナ
又はひらがなの1文字が帳票の1文字枠に記入
された場合でも、本発明によるOCRは、従来
の文字認識部に何らハードウエア的な変更、改
造を加えることなく読み取ることができる。
【図面の簡単な説明】
第1図は帳票の文字枠に文字を記入する例を示
した図、第2図は本発明のOCRのブロツク図、
第3図は本発明の動作を示すフローチヤート、第
4図は線縁追跡の例を示す図であり、第5図はブ
ロツクの周縁を追跡するための8方向の図、第6
図は本発明による文字認識の為のパターン生成を
示した図である。 1……RAM1、2……RAM2、5……Line
アドレスカウンタ、6……Rowアドレスカウン
タ、7……制御回路、10……文字認識部。

Claims (1)

  1. 【特許請求の範囲】 1 光学的文字読取装置において、 光電変換された1文字分の文字パターンを夫々
    格納する第1および第2のメモリと、 この第2のメモリに格納された文字パターンを
    構成する各パターンブロツクについて線縁を追跡
    して各パターンブロツクの周縁長、高さを求める
    手段と、 前記各パターンブロツクの周縁長がすべて一定
    の長さより長い場合、前記第1のメモリに格納さ
    れている文字パターンを文字認識部へ転送する手
    段と、 前記パターンブロツクのうち一部のパターンブ
    ロツクが一定の長さより短い周縁長を有する場
    合、前記第2のメモリにおいて周縁長が一定の長
    さより長いパターンブロツク、文字枠中心より下
    にあるパターンブロツクおよび最大高さを有する
    パターンブロツクより左側にあるパターンブロツ
    クとを消去したのち、前記第2のメモリに格納さ
    れている文字パターンと、前記最大高さを有する
    パターンブロツクの上端、下端の位置情報とを文
    字認識部へ転送する手段と、 前記文字認識部において前記第2のメモリから
    転送された文字パターンの認識の結果、それが濁
    点又は半濁点であると判断されたとき、前記第1
    のメモリに格納されている文字パターンと、前記
    第2のメモリに格納されている文字パターンを反
    転させた文字パターンとを論理積回路を介して文
    字認識部へ転送する手段と、 前記文字認識部において前記第2のメモリから
    転送された文字パターンの認識の結果、それが濁
    点又は半濁点でないと判断されたとき、前記第1
    のメモリに格納されている文字パターンを文字認
    識部へ転送する手段とを具備することを特徴とす
    る光学的文字読取装置。
JP56195615A 1981-12-07 1981-12-07 光学的文字読取装置 Granted JPS5897783A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56195615A JPS5897783A (ja) 1981-12-07 1981-12-07 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56195615A JPS5897783A (ja) 1981-12-07 1981-12-07 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS5897783A JPS5897783A (ja) 1983-06-10
JPS6363954B2 true JPS6363954B2 (ja) 1988-12-09

Family

ID=16344106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56195615A Granted JPS5897783A (ja) 1981-12-07 1981-12-07 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS5897783A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60263275A (ja) * 1984-06-11 1985-12-26 Nec Corp 文字認識装置

Also Published As

Publication number Publication date
JPS5897783A (ja) 1983-06-10

Similar Documents

Publication Publication Date Title
US4295121A (en) Device for optical character reading
US4466123A (en) Apparatus and method for correcting contour line pattern images
JPH0546591B2 (ja)
JPS6363954B2 (ja)
JPS6046471B2 (ja) 文字読取装置
JPH0319589B2 (ja)
JPS55138603A (en) Detecting system of pattern position
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPH0475557B2 (ja)
JPS6061875A (ja) パターン認識装置における標準パターン作成方法
JPS5886668A (ja) Ocrフアクシミリシステム
JPH0557632B2 (ja)
JPS6160184A (ja) 光学的文字読取装置
JP2784004B2 (ja) 文字認識装置
JPS5831028B2 (ja) 文字認識装置
JPS57143684A (en) Business form processing system
JPS5827276A (ja) 光学的文字読取装置
JP2897351B2 (ja) マーカー除去装置
JPH0122958B2 (ja)
JPS5960690A (ja) 2値化装置
JPS59128677A (ja) 光学的文字読取装置
JPH0357506B2 (ja)
JPS56157581A (en) Character recognizing system
JPH0134497B2 (ja)
JPS60138689A (ja) 文字認識方法