JP3027232B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3027232B2
JP3027232B2 JP3168067A JP16806791A JP3027232B2 JP 3027232 B2 JP3027232 B2 JP 3027232B2 JP 3168067 A JP3168067 A JP 3168067A JP 16806791 A JP16806791 A JP 16806791A JP 3027232 B2 JP3027232 B2 JP 3027232B2
Authority
JP
Japan
Prior art keywords
character
unit
word
black
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3168067A
Other languages
English (en)
Other versions
JPH0520496A (ja
Inventor
和郎 伊藤
義美 山田
英雄 谷本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3168067A priority Critical patent/JP3027232B2/ja
Publication of JPH0520496A publication Critical patent/JPH0520496A/ja
Application granted granted Critical
Publication of JP3027232B2 publication Critical patent/JP3027232B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿上の単語を光学的
に読取って翻訳情報を表示する文字認識装置に関し、詳
細には、単語を構成する文字の切出しに関する。
【0002】
【従来の技術】図2は、従来の文字認識装置の構成を示
すブロック図である。
【0003】同図に示されるように、従来の文字認識装
置は、原稿Pに印刷された英単語を光学的に読取る読取
部1と、この読取部1の出力信号を2値信号に変換する
信号変換部2と、この2値信号に基づいて英単語を構成
するアルファベットを切出す文字切出し部3と、予め文
字情報を格納している認識辞書4と、英単語を構成する
アルファベットを認識辞書4から選択する認識制御部5
とを備えている。また、この装置は、英単語の翻訳情報
を格納している意味辞書6と、認識されたアルファベッ
トから構成される英単語を意味辞書6において検索する
検索制御部7と、翻訳内容等を表示する表示部8とを備
えている。
【0004】尚、信号変換部2は、A/D変換部、イメ
ージメモリ、及び2値化回路等からなり、文字切出し部
3は、パタンメモリ、投影部、輪郭追跡部、及びこれら
の動作を制御する切出し制御部等からなる。
【0005】上記文字認識装置においては、一般に、投
影法や輪郭追跡法により文字切出しがなされている。投
影法は、文字パタンを縦方向に投影した場合の黒点数の
ヒストグラムに基づいて、文字を切出す方法である。こ
こで、図3は、図2の文字認識装置により読取られた2
値信号からなる文字パタンの例を示し、図4は、この文
字パタンを縦方向に投影した場合の黒点数のヒストグラ
ムを示す。また、輪郭追跡法は、文字パタンの外郭を追
跡してできる一筆書きパタンを文字部分とみなす方法で
ある。ここで、図5に、文字の外郭を追跡する様子を示
す。
【0006】また、本出願人は、特願平2−15718
1号の出願において、アルファベットのシェリフ同士が
接触している場合に文字を切出すことができる装置を提
案している。図6は、アルファベットのシェリフ同士が
接触している場合を示す説明図である。
【0007】
【発明が解決しようとする課題】しかしながら、上記い
ずれの従来例においても、アルファベット同士が、シェ
リフ以外で接触している場合や、2か所以上で接触して
いる場合には、正確な文字の切出しができないという問
題があった。ここで、図7は、アルファベット同士がシ
ェリフ以外で接触している場合を示し、図8は、アルフ
ァベット同士が2か所以上で接触している場合を示す。
【0008】そこで、本発明は上記課題を解決するため
になされたものであり、その目的とするところは、文字
同士が、シェリフ以外で接触している場合や2か所以上
で接触している場合であっても正確に文字を切出すこと
ができる文字認識装置を提供することにある。
【0009】
【課題を解決するための手段】本発明に係る文字認識装
置は、原稿上に横方向に並んだ文字の列からなる単語を
光学的に読取り電気信号に変換する読取部と、この電気
信号を2値の信号に変換する信号変換部と、上記2値の
信号からなる文字パタンの外郭を追跡する輪郭追跡部
と、この追跡結果に基づいて文字を認識する認識制御部
と、この認識された文字からなる単語を検索する検索制
御部とを有する装置であって、上記2値の信号からなる
文字パタンを文字の縦方向に投影したときの黒点数の分
布を得る投影部と、上記投影部により得られた黒点数の
分布に基づいて、文字パタンを縦に走査したときに見つ
かる黒線分の数を検出するブロック検出部と、上記輪郭
追跡部による追跡結果に基づいて上記認識制御部が認識
した単語が上記検索制御部により検索できなかった場合
に、この検索できなかった単語の中に基準文字幅より幅
の広い文字が含まれているどうかを判断する切出し制御
部と、上記切出し制御部が、検索できなかった単語の中
に基準文字幅より幅の広い文字が含まれていると判断し
た場合に、上記ブロック検出部が検出した黒線分の数の
うち、文字パタンの中心部を縦に走査したときに見つか
る黒線分の数とこの中心部から所定の距離だけ離れた位
置を縦に走査したときに見つかる黒線分の数とに基づい
て、文字相互の分離位置を決めるブロック判定部と有す
ることを特徴としている。
【0010】
【作用】本発明においては、投影又は輪郭追跡により得
られた情報に基づいて文字を分離したときに検索制御部
により該当単語が検索できず、かつ、この検索できなか
った単語の中に基準文字幅より幅の広い文字が含まれて
いる場合に、この幅の広い文字について、縦方向の黒線
分の数を検出し、この黒線分の数に基づいて文字相互の
分離位置を決める。例えば、基準文字幅より幅の広い文
字の文字パタンの中心部Xにおける黒線分の数N
と、この中心部から左側に所定の距離だけ離れた位置
における黒線分の数Nと、この中心部から右側に
所定の距離だけ離れた位置Xにおける黒線分の数N
とを検出し、これら黒線分の数N,N,Nに基づ
いて、文字相互の分離位置を決める。
【0011】
【実施例】図1は、本発明に係る文字認識装置の一実施
例の構成を示すブロック図である。 同図に示されるよ
うに、本実施例の文字認識装置には、光源とCCDセン
サ等からなり、原稿Pに印刷された英単語を光学的に読
取る読取部11と、この読取部11の出力信号を2値信
号に変換する信号変換部12とが備えられている。この
信号変換部12は、A/D変換部、イメージメモリ、及
び2値化回路等からなる。
【0012】また、本実施例の装置には、この2値信号
に基づいて英単語を構成する文字(アルファベット)を
切出す文字切出し部13と、予めアルファベット情報を
格納している認識辞書14と、英単語を構成するアルフ
ァベットを認識辞書14から選択する認識制御部15と
が備えられている。また、この装置には、英単語の翻訳
情報を格納している意味辞書16と、認識されたアルフ
ァベットから構成される英単語を意味辞書16において
検索する検索制御部17と、翻訳内容等を表示する表示
部18とが備えられている。尚、以下の説明において
は、英単語について述べるが、他の言語であってもよ
い。
【0013】ここで、上記文字切出し部13には、2値
信号からなる文字パタンを格納するパタンメモリ19
と、この文字パタンを文字の縦方向に投影したときの黒
点数の分布を得る投影部20と、文字パタンの外郭を追
跡する輪郭追跡部21とが備えられている。
【0014】また、上記文字切出し部13には、文字パ
タンを縦に走査したときに見つかる黒線分(以下、ブロ
ックという。)の数を検出するブロック検出部22と、
ブロック数に基づいて文字相互の分離位置を決めるブロ
ック判定部23と、文字切出し部13の動作を制御する
文字切出し制御部24とが備えられている。投影部20
又は輪郭追跡部21により得られた情報に基づいて文字
を分離したときに検出制御部17により該当単語が検索
できず、かつ、この検索できなかった単語の中にアルフ
ァベットの文字配列ピッチから算出された基準文字幅よ
り幅の広い文字が含まれている場合には、この文字切出
し制御部24からの指令により、ブロック判定部23
が、上記幅の広い文字について、文字相互の分離位置を
決める。
【0015】図9乃至図12は、本実施例のブロック判
定部23による動作を説明するための説明図である。
【0016】ブロック判定部23は、図9に示されるよ
うに(ここでは、“dy”を示す)、幅の広い文字につ
いて、位置XA,XB,XCにおけるブロック数NA
B,NCを求める。ここでは、数N A =1、N B =2、N
C =1である。
【0017】
【0018】また、図10に示されるように(ここで
は、“cy”を示す)、ブロック判定部23が、ブロッ
ク数NC≧2、ブロック数NA=1、ブロック数NB≧2
と判定したときには、位置XAで文字を分離する。逆
に、ブロック判定部23が、ブロック数NC≧2、ブロ
ック数NA≧2、ブロック数NB=1と判定したときに
は、位置XBで文字を分離する。
【0019】また、図11に示されるように(ここで
は、“dy”を示す)、ブロック判定部23が、ブロッ
ク数NC≧2、ブロック数NA≧2、ブロック数NB≧2
と判定したときには、位置XCで、検出されたブロック
の最上部にあるものを切断した後、輪郭追跡を行う。
た、図12に示される場合には(ここでは、“rf”を
示す)、検出されたブロックの最上部にあるものを切断
した後、輪郭追跡を行っても、文字を分離することがで
きない。この場合には、位置X C で、検出されたブロッ
クのうち最上部の一つ下にあるものをさらに切断した
後、再度、輪郭追跡を行う。
【0020】図13乃至図15は、本実施例の文字認識
装置の動作を示すフローチャートである。図13乃至図
15及び図1に基づいて、本実施例の動作を説明する。
【0021】先ず、読取部11の読取りで得られたらパ
タンメモリ19の文字パタンを投影部20により投影
し、輪郭追跡部21により追跡し(図13のS1)、こ
れらの結果に基づいて文字切出しを行い(S2)、切出
されたアルファベットを認識制御部15により認識する
(S3)。このようなアルファベット認識動作は、1単
語終了まで(例えば、ブランクの検出により判断され
る)繰り返される(S4)。
【0022】次に、検索制御部17は、S1からS4で
得られた英単語を意味辞書16から検索し(S5)、意
味辞書16に該当する英単語があれば(S6)、翻訳情
報を表示部18に表示する(S7)。また、意味辞書1
6に該当する英単語がなければ(S6)、個々のアルフ
ァベットの文字配列ピッチから基準文字幅を算出し(S
8)、この基準文字幅より幅の広い文字が無い場合には
(S9)、後処理をする(S10)。この後処理は、表
示部18に該当なしの表示をしたり、最も該当単語に近
い英単語を表示する等の処理である。
【0023】S9で、基準文字幅より大きい文字がある
場合には、図14のS11に進み、本発明における特徴
的な処理に入る。
【0024】先ず、ブロック検出部22が、基準文字幅
より幅の広い文字について、図9に示されるように、文
字パタンの中心部位置Xにおけるブロック数Nと、
この中心部から左側に所定の距離dwだけ離れた位置X
におけるブロック数Nと、この中心部から右側に所
定の距離dwだけ離れた位置Xにおけるブロック数N
とを検出する(S11)。ここで、文字パタンの中心
部Xは、文字パタンの左端座標をXとし、文字パタ
ンの右端座標をXとしたときに、(X+X)/2
より得られる。
【0025】次に、ブロック判定部23が、文字パタン
の中心部位置Xにおけるブロック数N≧2か否かを
判断し(S12)、ブロック数N=1と判定したとき
には、位置Xで文字を分離する(S13)。
【0026】S12で、ブロック判定部23が、ブロッ
ク数NC≧2と判断したときには、S13に進み、ブロ
ック数NA≧2か否かを判断する。ここで、ブロック数
A=1であれば、S14で、ブロック数NB≧2か否か
を判断し、ブロック数NB=1であれば、位置XA又はX
Bいずれかで切断する(S15)。
【0027】S14で、ブロック数N=1であれば、
位置Xで切断する(S16)。
【0028】また、S13でNA≧2であれば、S17
に進み、ブロック数NB≧2か否かを判断する。ここ
で、ブロック数NB=1であれば、位置XBで切断する
(S18)。一方、ブロック数NB≧2であれば、図1
6のS19に進み、位置XCで最上部のブロックのみを
切断し、その後、輪郭追跡をする(S20)。この輪郭
追跡により文字認識ができれば文字認識をし(S2
2)、図13のS5の単語辞書のサーチに移る。
【0029】S21で、分離できなければ、位置X
最下部のブロック(ブロック数が3以上の場合には、最
上部のブロックの直ぐ下のブロック)のみを切断し(S
23)、輪郭追跡をし(S24)、この輪郭追跡により
文字を分離できれば(S25)、S22の文字認識に進
み、文字分離できなければ位置Xで強制的に文字を分
離する(S26)。
【0030】以上説明したように、本実施例において
は、投影部20又は輪郭追跡部21により得られた情報
に基づいて文字を分離したときに検索制御部17により
該当単語が検索できず、かつ、この検索できなかった単
語の中に基準文字幅より幅の広い文字が含まれている場
合に、文字パタンの中心部Xにおけるブロック数N
と、この中心部から左側に所定の距離だけ離れた位置X
におけるブロック数Nと、この中心部から右側に所
定の距離だけ離れた位置Xにおけるブロック数N
を検出し、これらブロック数N,N,Nに基づい
て、文字相互の分離位置を決めることにより、アルファ
ベット同士が、シェリフ以外で接触している場合や、2
か所以上で接触している場合であっても、文字の切出し
ができる。
【0031】
【発明の効果】以上説明したように、本発明よれば、投
影又は輪郭追跡により該当単語が検索できなくても、文
字パタンの中心部におけるブロック数と、この中心部か
ら左側に所定の距離だけ離れた位置におけるブロック数
と、この中心部から右側に所定の距離だけ離れた位置に
おけるブロック数とに基づいて、文字相互の分離位置を
決めることにより、アルファベット同士が、シェリフ以
外で接触している場合や、2か所以上で接触している場
合であっても、文字の切出しができるので、文字認識率
を向上させることができる。
【図面の簡単な説明】
【図1】 本発明に係る文字認識装置の一実施例の構成
を示すブロック図である。
【図2】 従来の文字認識装置の構成を示すブロック図
である。
【図3】 図2の文字認識装置により読取られた2値信
号からなる文字パタンの例を示す図である。
【図4】 文字パタンを縦方向に投影した場合の黒点数
のヒストグラムを示す図である。
【図5】 文字の輪郭を追跡する様子を示す図である。
【図6】 アルファベットのシェリフ同士が接触してい
る場合を示す説明図である。
【図7】 アルファベット同士がシェリフ以外で接触し
ている場合を示す図である。
【図8】 アルファベット同士が2か所以上で接触して
いる場合を示す図である。
【図9】 本実施例のブロック判定部による動作を説明
するための説明図である。
【図10】 本実施例のブロック判定部による動作を説
明するための説明図である。
【図11】 本実施例のブロック判定部による動作を説
明するための説明図である。
【図12】 本実施例のブロック判定部による動作を説
明するための説明図である。
【図13】 本実施例の文字認識装置の動作を示すフロ
ーチャート(その1)である。
【図14】 本実施例の文字認識装置の動作を示すフロ
ーチャート(その2)である。
【図15】 本実施例の文字認識装置の動作を示すフロ
ーチャート(その3)である。
【符号の説明】
11 読取部 12 信号変換部 13 文字切出し部 14 認識辞書 15 認識制御部 16 意味辞書 17 検索制御部 18 表示部 19 パタンメモリ 20 投影部 21 輪郭追跡部 22 ブロック検出部 23 ブロック判定部 24 文字切出し制御部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−190679(JP,A) 特開 平4−52886(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/34

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 原稿上に横方向に並んだ文字の列からな
    る単語を光学的に読取り電気信号に変換する読取部と、 この電気信号を2値の信号に変換する信号変換部と、 上記2値の信号からなる文字パタンの外郭を追跡する輪
    郭追跡部と、 この追跡結果 に基づいて文字を認識する認識制御部と、 この認識された文字からなる単語を検索する検索制御部
    と、 を有する文字認識装置において 上記2値の信号からなる文字パタンを文字の縦方向に投
    影したときの黒点数の分布を得る投影部と、 上記投影部により得られた黒点数の分布に基づいて、
    字パタンを縦に走査したときに見つかる黒線分の数を検
    出するブロック検出部と、上記輪郭追跡部による追跡結果に基づいて上記認識制御
    部が認識した単語が上記検索制御部により検索できなか
    った場合に、この検索できなかった単語の中に基準文字
    幅より幅の広い文字が含まれているどうかを判断する切
    出し制御部と、 上記切出し制御部が、 検索できなかった単語の中に基準
    文字幅より幅の広い文字が含まれていると判断した場合
    に、上記ブロック検出部が検出した黒線分の数のうち、
    文字パタンの中心部を縦に走査したときに見つかる黒線
    分の数とこの中心部から所定の距離だけ離れた位置を縦
    に走査したときに見つかる黒線分の数とに基づいて、文
    字相互の分離位置を決めるブロック判定部と 有することを特徴とする文字認識装置。
  2. 【請求項2】 上記切出し制御部が、検索できなかった
    単語の中に基準文字幅より幅の広い文字が含まれている
    と判断した場合に、上記ブロック検出部が、上記幅の広
    い文字について、文字パタンの中心部XCにおける黒線
    分の数NCと、この中心部から左側に所定の距離だけ離
    れた位置XAにおける黒線分の数NAと、この中心部から
    右側に所定の距離だけ離れた位置XBにおける黒線分の
    数NBとを検出し、 上記ブロック判定部が、黒線分の数NA,NB,NCに基
    づいて、文字相互の分離位置を決めることを特徴とする
    請求項1記載の文字認識装置。
  3. 【請求項3】 上記ブロック判定部が、NC=1と判定
    したときには、位置XCで文字を分離することを特徴と
    する請求項2記載の文字認識装置。
  4. 【請求項4】 上記ブロック判定部が、NC≧2、NA
    1、NB≧2と判定したときには、位置XAで文字を分離
    することを特徴とする請求項2記載の文字認識装置。
  5. 【請求項5】 上記ブロック判定部が、NC≧2、NA
    2、NB=1と判定したときには、位置XBで文字を分離
    することを特徴とする請求項2記載の文字認識装置。
  6. 【請求項6】 上記ブロック判定部が、NC≧2、NA
    2、NB≧2と判定したときには、位置XCで、検出され
    た黒線分の最上部にあるものを切断した後、輪郭追跡を
    行うことを特徴とする請求項2記載の文字認識装置。
  7. 【請求項7】 上記輪郭追跡により、文字を分離するこ
    とができないと判断されたときには、位置XCで、検出
    された黒線分のうち上記最上部の下にあるものを切断し
    た後、輪郭追跡を行うことを特徴とする請求項6記載の
    文字認識装置。
JP3168067A 1991-07-09 1991-07-09 文字認識装置 Expired - Fee Related JP3027232B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3168067A JP3027232B2 (ja) 1991-07-09 1991-07-09 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3168067A JP3027232B2 (ja) 1991-07-09 1991-07-09 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0520496A JPH0520496A (ja) 1993-01-29
JP3027232B2 true JP3027232B2 (ja) 2000-03-27

Family

ID=15861224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3168067A Expired - Fee Related JP3027232B2 (ja) 1991-07-09 1991-07-09 文字認識装置

Country Status (1)

Country Link
JP (1) JP3027232B2 (ja)

Also Published As

Publication number Publication date
JPH0520496A (ja) 1993-01-29

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP3727971B2 (ja) 文書処理装置、及び文書処理方法
JP3411472B2 (ja) パターン抽出装置
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JP3027232B2 (ja) 文字認識装置
JP3787377B2 (ja) 文書方向判定方法及び装置及び文字認識方法及び装置
JP2868134B2 (ja) 画像処理方法及び装置
KR0186172B1 (ko) 문자 인식장치의 접촉문자 분리 및 특징 추출방법
JP3095470B2 (ja) 文字認識装置
KR100286709B1 (ko) 영문자열에서의 개별문자 분리 방법
JPH0728935A (ja) 文書画像処理装置
JP3379663B2 (ja) 文字認識装置
JP3052438B2 (ja) 表認識装置
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JP2581809B2 (ja) 文字切出し装置
JPH07168911A (ja) 文書認識装置
JP2982221B2 (ja) 文字読み取り装置
JPH10162104A (ja) 文字認識装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP3162575B2 (ja) 文字認識装置
JPH04276888A (ja) 文字読取装置
JPH09269970A (ja) 文字認識方法とその装置
JPH08171609A (ja) 文字列高速抽出装置
JPH11161739A (ja) 文字認識装置
JPS5831028B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000118

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100128

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees