JPH0520496A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0520496A
JPH0520496A JP3168067A JP16806791A JPH0520496A JP H0520496 A JPH0520496 A JP H0520496A JP 3168067 A JP3168067 A JP 3168067A JP 16806791 A JP16806791 A JP 16806791A JP H0520496 A JPH0520496 A JP H0520496A
Authority
JP
Japan
Prior art keywords
character
characters
black line
unit
separated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3168067A
Other languages
English (en)
Other versions
JP3027232B2 (ja
Inventor
Kazuo Ito
和郎 伊藤
Yoshimi Yamada
義美 山田
Hideo Tanimoto
英雄 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3168067A priority Critical patent/JP3027232B2/ja
Publication of JPH0520496A publication Critical patent/JPH0520496A/ja
Application granted granted Critical
Publication of JP3027232B2 publication Critical patent/JP3027232B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文字同士が、シェリフ以外で接触している場
合や2か所以上で接触している場合であっても文字を切
出すことができる。 【構成】 文字パタンを縦に走査したときに見つかる黒
線分の数を検出するブロック検出部22と、文字パタン
の中心部を縦に走査したときに見つかる黒線分の数N
とこの中心部から所定距離だけ離れた位置を縦に走査し
たときに見つかる黒線分の数N,Nに基づいて、文
字相互の分離位置を決めるブロック判定部23と、文字
切出し制御部24とを有する。文字切出し制御部24
は、投影又は輪郭追跡により文字を分離したときに検索
制御部により該当単語が検索できず、かつ、基準文字幅
より幅の広い文字が含まれている場合に、この幅の広い
文字について、ブロック検出部22により黒線分の数を
検出させ、ブロック判定部23により文字相互の分離位
置を決めさせる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿上の単語を光学的
に読取って翻訳情報を表示する文字認識装置に関し、詳
細には、単語を構成する文字の切出しに関する。
【0002】
【従来の技術】図2は、従来の文字認識装置の構成を示
すブロック図である。
【0003】同図に示されるように、従来の文字認識装
置は、原稿Pに印刷された英単語を光学的に読取る読取
部1と、この読取部1の出力信号を2値信号に変換する
信号変換部2と、この2値信号に基づいて英単語を構成
するアルファベットを切出す文字切出し部3と、予め文
字情報を格納している認識辞書4と、英単語を構成する
アルファベットを認識辞書4から選択する認識制御部5
とを備えている。また、この装置は、英単語の翻訳情報
を格納している意味辞書6と、認識されたアルファベッ
トから構成される英単語を意味辞書6において検索する
検索制御部7と、翻訳内容等を表示する表示部8とを備
えている。
【0004】尚、信号変換部2は、A/D変換部、イメ
ージメモリ、及び2値化回路等からなり、文字切出し部
3は、パタンメモリ、投影部、輪郭追跡部、及びこれら
の動作を制御する切出し制御部等からなる。
【0005】上記文字認識装置においては、一般に、投
影法や輪郭追跡法により文字切出しがなされている。投
影法は、文字パタンを縦方向に投影した場合の黒点数の
ヒストグラムに基づいて、文字を切出す方法である。こ
こで、図3は、図2の文字認識装置により読取られた2
値信号からなる文字パタンの例を示し、図4は、この文
字パタンを縦方向に投影した場合の黒点数のヒストグラ
ムを示す。また、輪郭追跡法は、文字パタンの外郭を追
跡してできる一筆書きパタンを文字部分とみなす方法で
ある。ここで、図5に、文字の外郭を追跡する様子を示
す。
【0006】また、本出願人は、特願平2−15718
1号の出願において、アルファベットのシェリフ同士が
接触している場合に文字を切出すことができる装置を提
案している。図6は、アルファベットのシェリフ同士が
接触している場合を示す説明図である。
【0007】
【発明が解決しようとする課題】しかしながら、上記い
ずれの従来例においても、アルファベット同士が、シェ
リフ以外で接触している場合や、2か所以上で接触して
いる場合には、正確な文字の切出しができないという問
題があった。ここで、図7は、アルファベット同士がシ
ェリフ以外で接触している場合を示し、図8は、アルフ
ァベット同士が2か所以上で接触している場合を示す。
【0008】そこで、本発明は上記課題を解決するため
になされたものであり、その目的とするところは、文字
同士が、シェリフ以外で接触している場合や2か所以上
で接触している場合であっても正確に文字を切出すこと
ができる文字認識装置を提供することにある。
【0009】
【課題を解決するための手段】本発明に係る文字認識装
置は、原稿上に横方向に並んだ文字の列からなる単語を
光学的に読取り電気信号に変換する読取部と、この電気
信号を2値の信号に変換する信号変換部と、上記2値の
信号からなる文字パタンを文字の縦方向に投影したとき
の黒点数の分布又は文字パタンの外郭の追跡結果に基づ
いて文字相互の分離位置を決定して文字を切出す文字切
出し部と、この切出された文字を認識する認識制御部
と、この認識された文字からなる単語を検索する検索制
御部と、を有する文字認識装置において、上記文字切出
し部が、文字パタンを縦に走査したときに見つかる黒線
分の数を検出するブロック検出部と、文字パタンの中心
部を縦に走査したときに見つかる黒線分の数とこの中心
部から所定の距離だけ離れた位置を縦に走査したときに
見つかる黒線分の数とに基づいて、文字相互の分離位置
を決めるブロック判定部と、上記投影又は上記輪郭追跡
により得られた情報に基づいて文字を分離したときに上
記検索制御部により該当単語が検索できず、かつ、この
検索できなかった単語の中に基準文字幅より幅の広い文
字が含まれている場合に、この幅の広い文字について、
上記ブロック検出部により黒線分の数を検出させ、上記
ブロック判定部により文字相互の分離位置を決めさせる
文字切出し制御部と、を有することを特徴としている。
【0010】
【作用】本発明においては、投影又は輪郭追跡により得
られた情報に基づいて文字を分離したときに検索制御部
により該当単語が検索できず、かつ、この検索できなか
った単語の中に基準文字幅より幅の広い文字が含まれて
いる場合に、この幅の広い文字について、縦方向の黒線
分の数を検出し、この黒線分の数に基づいて文字相互の
分離位置を決める。例えば、基準文字幅より幅の広い文
字の文字パタンの中心部Xにおける黒線分の数N
と、この中心部から左側に所定の距離だけ離れた位置
における黒線分の数Nと、この中心部から右側に
所定の距離だけ離れた位置Xにおける黒線分の数N
とを検出し、これら黒線分の数N,N,Nに基づ
いて、文字相互の分離位置を決める。
【0011】
【実施例】図1は、本発明に係る文字認識装置の一実施
例の構成を示すブロック図である。 同図に示されるよ
うに、本実施例の文字認識装置には、光源とCCDセン
サ等からなり、原稿Pに印刷された英単語を光学的に読
取る読取部11と、この読取部11の出力信号を2値信
号に変換する信号変換部12とが備えられている。この
信号変換部12は、A/D変換部、イメージメモリ、及
び2値化回路等からなる。
【0012】また、本実施例の装置には、この2値信号
に基づいて英単語を構成する文字(アルファベット)を
切出す文字切出し部13と、予めアルファベット情報を
格納している認識辞書14と、英単語を構成するアルフ
ァベットを認識辞書14から選択する認識制御部15と
が備えられている。また、この装置には、英単語の翻訳
情報を格納している意味辞書16と、認識されたアルフ
ァベットから構成される英単語を意味辞書16において
検索する検索制御部17と、翻訳内容等を表示する表示
部18とが備えられている。尚、以下の説明において
は、英単語について述べるが、他の言語であってもよ
い。
【0013】ここで、上記文字切出し部13には、2値
信号からなる文字パタンを格納するパタンメモリ19
と、この文字パタンを文字の縦方向に投影したときの黒
点数の分布を得る投影部20と、文字パタンの外郭を追
跡する輪郭追跡部21とが備えられている。
【0014】また、上記文字切出し部13には、文字パ
タンを縦に走査したときに見つかる黒線分(以下、ブロ
ックという。)の数を検出するブロック検出部22と、
ブロック数に基づいて文字相互の分離位置を決めるブロ
ック判定部23と、文字切出し部13の動作を制御する
文字切出し制御部24とが備えられている。投影部20
又は輪郭追跡部21により得られた情報に基づいて文字
を分離したときに検出制御部17により該当単語が検索
できず、かつ、この検索できなかった単語の中にアルフ
ァベットの文字配列ピッチから算出された基準文字幅よ
り幅の広い文字が含まれている場合には、この文字切出
し制御部24からの指令により、ブロック判定部23
が、上記幅の広い文字について、文字相互の分離位置を
決める。
【0015】図9乃至図13は、本実施例のブロック判
定部23による動作を説明するための説明図である。
【0016】ブロック判定部23は、図9に示されるよ
うに(ここでは、“dy”を示す)、幅の広い文字につ
いて、位置X,X,Xにおけるブロック数N
,Nを求める。ここで、ブロック判定部23が、
ブロック数N=1と判定したときには、位置Xで文
字を分離する。
【0017】また、図10に示されるように(ここで
は、“ra”を示す)、ブロック判定部23が、ブロッ
ク数N≧2、ブロック数N=1、ブロック数N
1と判定したときには、位置X又はXのうち、位置
に近い位置で文字を分離する。
【0018】また、図11に示されるように(ここで
は、“cy”を示す)、ブロック判定部23が、ブロッ
ク数N≧2、ブロック数N=1、ブロック数N
2と判定したときには、位置Xで文字を分離する。逆
に、ブロック判定部23が、ブロック数N≧2、ブロ
ック数N≧2、ブロック数N=1と判定したときに
は、位置Xで文字を分離する。
【0019】また、図12に示されるように(ここで
は、“dy”を示す)、ブロック判定部23が、ブロッ
ク数N≧2、ブロック数N≧2、ブロック数N
2と判定したときには、位置Xで、検出されたブロッ
クの最上部にあるものを切断した後、輪郭追跡を行う。
もし、この輪郭追跡により、文字を分離することができ
ないと判断されたときには、位置Xで、検出されたブ
ロックのうち最上部の一つ下にあるものを切断した後、
輪郭追跡を行う。さらに、この輪郭追跡により、分離し
ない場合には、図13に示されるように(ここでは、
“rf”を示す)、位置Xで強制的に2文字に分離す
る。
【0020】図14乃至図16は、本実施例の文字認識
装置の動作を示すフローチャートである。図14乃至図
16及び図1に基づいて、本実施例の動作を説明する。
【0021】先ず、読取部11の読取りで得られたらパ
タンメモリ19の文字パタンを投影部20により投影
し、輪郭追跡部21により追跡し(図14のS1)、こ
れらの結果に基づいて文字切出しを行い(S2)、切出
されたアルファベットを認識制御部15により認識する
(S3)。このようなアルファベット認識動作は、1単
語終了まで(例えば、ブランクの検出により判断され
る)繰り返される(S4)。
【0022】次に、検索制御部17は、S1からS4で
得られた英単語を意味辞書16から検索し(S5)、意
味辞書16に該当する英単語があれば(S6)、翻訳情
報を表示部18に表示する(S7)。また、意味辞書1
6に該当する英単語がなければ(S6)、個々のアルフ
ァベットの文字配列ピッチから基準文字幅を算出し(S
8)、この基準文字幅より幅の広い文字が無い場合には
(S9)、後処理をする(S10)。この後処理は、表
示部18に該当なしの表示をしたり、最も該当単語に近
い英単語を表示する等の処理である。
【0023】S9で、基準文字幅より大きい文字がある
場合には、図15のS11に進み、本発明における特徴
的な処理に入る。
【0024】先ず、ブロック検出部22が、基準文字幅
より幅の広い文字について、図9に示されるように、文
字パタンの中心部位置Xにおけるブロック数Nと、
この中心部から左側に所定の距離dwだけ離れた位置X
におけるブロック数Nと、この中心部から右側に所
定の距離dwだけ離れた位置Xにおけるブロック数N
とを検出する(S11)。ここで、文字パタンの中心
部Xは、文字パタンの左端座標をXとし、文字パタ
ンの右端座標をXとしたときに、(X+X)/2
より得られる。
【0025】次に、ブロック判定部23が、文字パタン
の中心部位置Xにおけるブロック数N≧2か否かを
判断し(S12)、ブロック数N=1と判定したとき
には、位置Xで文字を分離する(S13)。
【0026】S12で、ブロック判定部23が、ブロッ
ク数N≧2と判断したときには、S13に進み、ブロ
ック数N≧2か否かを判断する。ここで、ブロック数
=1であれば、S14で、ブロック数N≧2か否
かを判断し、ブロック数N=1であれば、位置X
はXのいずれか位置Xに近い方で切断する(S1
5)。
【0027】S14で、ブロック数N=1であれば、
位置Xで切断する(S16)。
【0028】また、S13でN≧2であれば、S17
に進み、ブロック数N≧2か否かを判断する。ここ
で、ブロック数N=1であれば、位置Xで切断する
(S18)。一方、ブロック数N≧2であれば、図1
6のS19に進み、位置Xで最上部のブロックのみを
切断し、その後、輪郭追跡をする(S20)。この輪郭
追跡により文字認識ができれば文字認識をし(S2
2)、図14のS5の単語辞書のサーチに移る。
【0029】S21で、分離できなければ、位置X
最下部のブロック(ブロック数が3以上の場合には、最
上部のブロックの直ぐ下のブロック)のみを切断し(S
23)、輪郭追跡をし(S24)、この輪郭追跡により
文字を分離できれば(S25)、S22の文字認識に進
み、文字分離できなければ位置Xで強制的に文字を分
離する(S26)。
【0030】以上説明したように、本実施例において
は、投影部20又は輪郭追跡部21により得られた情報
に基づいて文字を分離したときに検索制御部17により
該当単語が検索できず、かつ、この検索できなかった単
語の中に基準文字幅より幅の広い文字が含まれている場
合に、文字パタンの中心部Xにおけるブロック数N
と、この中心部から左側に所定の距離だけ離れた位置X
におけるブロック数Nと、この中心部から右側に所
定の距離だけ離れた位置Xにおけるブロック数N
を検出し、これらブロック数N,N,Nに基づい
て、文字相互の分離位置を決めることにより、アルファ
ベット同士が、シェリフ以外で接触している場合や、2
か所以上で接触している場合であっても、文字の切出し
ができる。
【0031】
【発明の効果】以上説明したように、本発明よれば、投
影又は輪郭追跡により該当単語が検索できなくても、文
字パタンの中心部におけるブロック数と、この中心部か
ら左側に所定の距離だけ離れた位置におけるブロック数
と、この中心部から右側に所定の距離だけ離れた位置に
おけるブロック数とに基づいて、文字相互の分離位置を
決めることにより、アルファベット同士が、シェリフ以
外で接触している場合や、2か所以上で接触している場
合であっても、文字の切出しができるので、文字認識率
を向上させることができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の一実施例の構成を
示すブロック図である。
【図2】従来の文字認識装置の構成を示すブロック図で
ある。
【図3】図2の文字認識装置により読取られた2値信号
からなる文字パタンの例を示す図である。
【図4】文字パタンを縦方向に投影した場合の黒点数の
ヒストグラムを示す図である。
【図5】文字の輪郭を追跡する様子を示す図である。
【図6】アルファベットのシェリフ同士が接触している
場合を示す説明図である。
【図7】アルファベット同士がシェリフ以外で接触して
いる場合を示す図である。
【図8】アルファベット同士が2か所以上で接触してい
る場合を示す図である。
【図9】本実施例のブロック判定部による動作を説明す
るための説明図である。
【図10】本実施例のブロック判定部による動作を説明
するための説明図である。
【図11】本実施例のブロック判定部による動作を説明
するための説明図である。
【図12】本実施例のブロック判定部による動作を説明
するための説明図である。
【図13】本実施例のブロック判定部による動作を説明
するための説明図である。
【図14】本実施例の文字認識装置の動作を示すフロー
チャート(その1)である。
【図15】本実施例の文字認識装置の動作を示すフロー
チャート(その2)である。
【図16】本実施例の文字認識装置の動作を示すフロー
チャート(その3)である。
【符号の説明】
11 読取部 12 信号変換部 13 文字切出し部 14 認識辞書 15 認識制御部 16 意味辞書 17 検索制御部 18 表示部 19 パタンメモリ 20 投影部 21 輪郭追跡部 22 ブロック検出部 23 ブロック判定部 24 文字切出し制御部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 原稿上に横方向に並んだ文字の列からな
    る単語を光学的に読取り電気信号に変換する読取部と、 この電気信号を2値の信号に変換する信号変換部と、 上記2値の信号からなる文字パタンを文字の縦方向に投
    影したときの黒点数の分布又は文字パタンの外郭の追跡
    結果に基づいて文字相互の分離位置を決定して文字を切
    出す文字切出し部と、 この切出された文字を認識する認識制御部と、 この認識された文字からなる単語を検索する検索制御部
    と、 を有する文字認識装置において、 上記文字切出し部が、 文字パタンを縦に走査したときに見つかる黒線分の数を
    検出するブロック検出部と、 文字パタンの中心部を縦に走査したときに見つかる黒線
    分の数とこの中心部から所定の距離だけ離れた位置を縦
    に走査したときに見つかる黒線分の数とに基づいて、文
    字相互の分離位置を決めるブロック判定部と、 上記投影又は上記輪郭追跡により得られた情報に基づい
    て文字を分離したときに上記検索制御部により該当単語
    が検索できず、かつ、この検索できなかった単語の中に
    基準文字幅より幅の広い文字が含まれている場合に、こ
    の幅の広い文字について、上記ブロック検出部により黒
    線分の数を検出させ、上記ブロック判定部により文字相
    互の分離位置を決めさせる文字切出し制御部と、 を有することを特徴とする文字認識装置。
  2. 【請求項2】 上記投影又は上記輪郭追跡により得られ
    た情報に基づいて文字を分離したときに上記検索制御部
    により該当単語が検索できず、かつ、この検索できなか
    った単語に基準文字幅より幅の広い文字が含まれている
    場合に、 上記ブロック検出部が、上記幅の広い文字に
    ついて、文字パタンの中心部Xにおける黒線分の数N
    と、この中心部から左側に所定の距離だけ離れた位置
    における黒線分の数Nと、この中心部から右側に
    所定の距離だけ離れた位置Xにおける黒線分の数N
    とを検出し、 上記ブロック判定部が、黒線分の数N,N,N
    基づいて、文字相互の分離位置を決めることを特徴とす
    る請求項1記載の文字認識装置。
  3. 【請求項3】 上記ブロック判定部が、N=1と判定
    したときには、位置Xで文字を分離することを特徴と
    する請求項2記載の文字認識装置。
  4. 【請求項4】 上記ブロック判定部が、N≧2、N
    =1、N≧2と判定したときには、位置Xで文字を
    分離することを特徴とする請求項2記載の文字認識装
    置。
  5. 【請求項5】 上記ブロック判定部が、N≧2、N
    =1、N=1と判定したときには、位置X又は位置
    のうち、位置Nに近い位置で文字を分離すること
    を特徴とする請求項2記載の文字認識装置。
  6. 【請求項6】 上記ブロック判定部が、N≧2、N
    ≧2、N=1と判定したときには、位置Xで文字を
    分離することを特徴とする請求項2記載の文字認識装
    置。
  7. 【請求項7】 上記ブロック判定部が、N≧2、N
    ≧2、N≧2と判定したときには、位置Xで、検出
    された黒線分の最上部にあるものを切断した後、輪郭追
    跡を行うことを特徴とする請求項2記載の文字認識装
    置。
  8. 【請求項8】 上記輪郭追跡により、文字を分離するこ
    とができないと判断されたときには、位置Xで、検出
    された黒線分のうち上記最上部の下にあるものを切断し
    た後、輪郭追跡を行うことを特徴とする請求項7記載の
    文字認識装置。
JP3168067A 1991-07-09 1991-07-09 文字認識装置 Expired - Fee Related JP3027232B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3168067A JP3027232B2 (ja) 1991-07-09 1991-07-09 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3168067A JP3027232B2 (ja) 1991-07-09 1991-07-09 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0520496A true JPH0520496A (ja) 1993-01-29
JP3027232B2 JP3027232B2 (ja) 2000-03-27

Family

ID=15861224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3168067A Expired - Fee Related JP3027232B2 (ja) 1991-07-09 1991-07-09 文字認識装置

Country Status (1)

Country Link
JP (1) JP3027232B2 (ja)

Also Published As

Publication number Publication date
JP3027232B2 (ja) 2000-03-27

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US4926492A (en) Optical character reading apparatus and method
US6804414B1 (en) Image status detecting apparatus and document image correcting apparatus
US4813078A (en) Character recognition apparatus
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JPH0757051A (ja) パターン認識装置
US5197107A (en) Character recognition apparatus
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPH0520496A (ja) 文字認識装置
AU613013B2 (en) Data acquisition control method and system for a hand held reader
JP2581809B2 (ja) 文字切出し装置
KR100286709B1 (ko) 영문자열에서의 개별문자 분리 방법
JP3133797B2 (ja) 文字認識方法及びその装置
JPH07160810A (ja) 文字認識装置
JP3710164B2 (ja) 画像処理装置及び方法
JPH11161739A (ja) 文字認識装置
JPH07168911A (ja) 文書認識装置
JPH0573718A (ja) 領域属性識別方式
JP2578767B2 (ja) 画像処理方法
JPH06301815A (ja) 文字認識装置
JPH06266893A (ja) 光学文字読取装置
JPH0452782A (ja) 文字読み取り装置
JPH0354684A (ja) 文字認識装置
JPH0527908B2 (ja)

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000118

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100128

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees