JP2797848B2 - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JP2797848B2
JP2797848B2 JP4208664A JP20866492A JP2797848B2 JP 2797848 B2 JP2797848 B2 JP 2797848B2 JP 4208664 A JP4208664 A JP 4208664A JP 20866492 A JP20866492 A JP 20866492A JP 2797848 B2 JP2797848 B2 JP 2797848B2
Authority
JP
Japan
Prior art keywords
character
underline
graphic
detecting
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4208664A
Other languages
English (en)
Other versions
JPH0660224A (ja
Inventor
康雄 西嶋
武志 場生松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4208664A priority Critical patent/JP2797848B2/ja
Priority to US08/100,754 priority patent/US5391889A/en
Priority to KR1019930015110A priority patent/KR960001645B1/ko
Priority to GB9316225A priority patent/GB2269471B/en
Publication of JPH0660224A publication Critical patent/JPH0660224A/ja
Application granted granted Critical
Publication of JP2797848B2 publication Critical patent/JP2797848B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は光学式文字読取装置に関
する。
【0002】
【従来の技術】従来、光学式文字読取装置は、紙面から
の反射光を電気信号に変換し、その信号レベルの大小関
係から紙面レベルと文字レベルを識別して2値化した文
字図形に変換し、文字の切り出し、文字の正規化を行
う。その後、その文字図形と予め用意してある複数種の
文字カテゴリーの標準図形とを遂一比較照合して、一致
度の高い、つまりは不一致度の低い標準図形を検出し、
その図形に該当する文字カテゴリーをもって、入力文字
図形に対する認識結果として出力するようにしている。
【0003】
【発明が解決しようとする課題】上述した従来の光学式
文字読取装置では、例えば郵便物上の郵便番号の位置を
強調するあまり、その番号にアンダーラインが印刷され
且つそれが接触している場合、1文字として切り出した
入力文字図形に一部アンダーラインによる余分な情報が
入り込む為、標準図形との一致がとれず誤読あるいは読
み取り不能となっていた。
【0004】本発明の目的は、読取り対象文字がアンダ
ーラインに接触している場合、あるいは枠に囲まれてい
る場合でも、誤読を減少させ認識率を向上させることが
できる光学式文字読取装置を提供することにある。
【0005】
【課題を解決するための手段】本発明の光学式文字読取
装置は、紙面上の文字・図形を電気的な文字図形に変換
する変換手段と、この変換手段により変換された文字図
形にアンダーラインが存在するか否かを検出する第1の
検出手段と、この第1の検出手段による判定の結果アン
ダーラインが無い文字群から平均又は代表する文字の大
きさを検出する第2の検出手段およびアンダーラインが
接触している文字列に対してはこのアンダーラインの領
域を検出するとともにこのアンダーラインを除去する第
1の除去手段と、この第1の除去手段により前記アンダ
ーラインが除去された文字列を対象に文字切り出し処理
を施す切り出し手段と、この切り出し手段により切り出
された文字の大きさを前記第2の検出手段により検出さ
れた平均又は代表する文字の大きさに基づき仮想的に設
定しこの設定された文字の大きさ情報に基づきアンダー
ラインを除去した文字図形を正規化する正規化手段と、
この正規化手段により正規化された文字図形と予め用意
された標準図形とを比較照合する際アンダーラインとし
て除去された領域を比較照合の対象領域から除外する除
外手段とを備える構成であり、また、前記正規化手段
に、アンダーラインを除去した文字図形がその文字幅の
情報より半角文字と判断された場合には、文字の高さ方
向に対しては前記平均又は代表する文字の大きさ情報に
基づき正規化を行い、幅方向に対しては前記半角文字の
幅情報に基づき正規化を行う手段を備える構成としても
よいし、更に前記変換手段で変換された文字図形がアン
ダーラインと接触しているのではなく、枠で囲まれてい
る場合、この枠の有無を検出する第3の検出手段と、前
記枠が文字列と接触している場合、この枠を除去する第
2の除去手段とを備える構成としてもよい。
【0006】
【実施例】次に本発明について図面を参照して説明す
る。
【0007】図1は本発明の一実施例を示すブロック図
である。図1において、光電変換部1は読み取るべき紙
面の所定領域を走査した際の紙面からの反射光に応じ、
電気的な2値の映像信号に変換する。2値の映像信号の
一例を図2に示す。図2の20は郵便番号を示してお
り、アンダーラインと接触していることを示している。
文字列検出部2は、図2に示された映像信号に基づき、
文字塊の並らびにより、文字列を検出する。
【0008】文字切り出し回路(I)3は、文字列の映
像信号に基づき、1文字づつ文字を切り出す。文字切り
出しの例を図3に示す。図3では、文字の外接する長方
形をもって1文字としているので、アンダーラインのあ
る「345」は1文字とみなされる。文字大きさ検出回
路4は、公知の技術により前述した切り出された文字の
大きさ,つまり外接する長方形の高さ及び幅を検出する
とともに、平均又は代表とする文字の大きさを検出す
る。
【0009】アンダーライン領域検出回路5は文字列の
アンダーライン領域を検出する。図4はアンダーライン
領域を検出する原理を示した図で、2値の映像信号に対
して、“黒”メッシュを公知の技術である投影法で,つ
まり“黒”メッシュの出現頻度を計数し、その分布によ
り、出現頻度の高い領域をもってアンダーライン領域と
見倣すものである。
【0010】アンダーライン除去回路6は、図4に示さ
れたアンダーライン領域を対象に、その領域部を論理的
に除去するもので、その結果の一例を図5に示す。文字
切り出し回路(II)7は、図5の映像信号に対して、
再度文字切り出し処理を施すもので、その結果の一例を
図6に示す。
【0011】尚、図6中破線で示された部分は、文字大
きさ検出回路4にて得られた平均の文字の大きさ又は代
表する文字の大きさにより、仮想的に与えられた文字の
大きさ(高さ)である。
【0012】正規化回路8は、切り出された文字の大き
さを文字大きさ検出回路4により検出された平均又は代
表する大きさに基づき仮想的に設定し、1文字毎に一定
の大きさに正規化する。但し、正規化を行う際に、文字
の重心あるいは文字の中心点がずれないように除去され
た部分を考慮して行う。例えば、図7は文字「5」の正
規化パターン(縦方向16メッシュ,横方向10メッシ
ュ)を示すが、領域Aはアンダーラインで除去された領
域である。つまり、図6で示された仮想の文字の高さで
正規化されたものである。
【0013】照合禁止領域検出回路9は、図7におい
て、領域Aを検出する。照合判定回路10は、基本的に
は、辞書11に予め格納してある標準図形と正規化パタ
ーンとを比較照合し、文字を判定する。その際に、照合
禁止領域検出回路9で検出した領域Aに相当する部分を
比較照合から除外する,つまり正規化パターン及び辞書
中、領域Aに対してゲート信号をかけるものである。
【0014】以下、文字「5」についての判定照合を例
に挙げて具体的に説明する。なお、辞書11に格納され
る文字カテゴリー「5」の標準文字図形は、例えば図1
0に示すように、紙面部(白レベル)であるべき領域を
論理“1”(「×」印)で表した標準文字図形(図10
(a))と、文字信号部(黒レベル)であるべき領域を
論理“1”(「×」印)で表した標準文字図形(図10
(b))とからなる。この標準文字図形の大きさは、前
述した正規化パターンと同様に16×10メッシュで構
成されることは勿論である。
【0015】図9は照合判定回路10の具体的構成例を
示す図である。図9において、正規化回路8の出力であ
る正規化パターンは反転回路100と比較回路101と
に入力する。また、アンダーラインとして除去される領
域A信号は、反転回路100,比較回路101,比較回
路102に入力する。そして、辞書11からの標準文字
図形(白レベル)は比較回路101に入力し、標準文字
図形(黒レベル)は比較回路102に入力する。
【0016】まず、反転回路100では、正規化パター
ンの各メッシュ論理状態を反転する。その際に領域A信
号はゲート信号として機能し、図7の正規化パターンに
おけるアンダーライン除去領域Aの論理状態は変更され
ず図8のようにそのまま論理“0”(ブランク)の状態
が保持される。
【0017】比較回路101,102は、領域A信号に
よりゲートがかけられた辞書と両入力の各メッシュごと
の論理積をとることによって一致/不一致を判定し、一
致しなければ不一致信号を不一致数処理回路103へ出
力する。例えば、比較回路101では、図7の正規化パ
ターンと図10(a)の標準文字図形との比較をする
が、横の0〜9の列でかつ縦の0〜2の行における比較
では論理積は“0”となるから不一致信号は出力されな
い。また、比較回路102では、図8の反転正規化パタ
ーンと図10(b)の標準文字図形との比較をするが、
同領域に対して論理積は“0”となるから前述したと同
様に不一致信号は出力されない。以上要するに、比較回
路101,102では、アンダーライン領域を除外して
各標準文字図形ごとに一致/不一致の判定照合をしてい
るのである。
【0018】不一致数処理回路103では、両比較回路
101,102が出力する不一致信号を各標準文字図形
ごとに計数し、その計数結果を判定回路104に出力す
る。
【0019】判定回路104では、不一致数の最も少な
い文字を判定し、それを認識結果の第1候補として出力
する。
【0020】なお、本実施例では示していないが、正規
化回路8に、アンダーラインを除去した文字図形がその
文字幅の情報により半角文字と判断された場合には、文
字の高さ方向に対しては平均又は代表する文字の大きさ
情報に基づき正規化を行い、幅方向に対しては半角文字
の幅情報に基づき正規化を行う構成とすることも可能で
ある。
【0021】又、本発明の文字読取装置は、光電変換部
1で変換された文字図形がアンダーラインと接触してい
るのではなく、枠で囲まれている場合、この枠の有無を
検出する回路(図示せず)と、この枠が文字列と接触し
ている場合、この枠を除去する回路(図示せず)とを備
えて構成することも可能である。
【0022】
【発明の効果】以上説明したように本発明の光学式文字
読取装置によれば、走査領域内にアンダーライン領域あ
るいは枠領域があるときは、その領域を除外して比較照
合を行うようにしたので、正しい一致判定が行える場合
が多くなり、誤読が減少し認識率を向上させることがで
きるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】2値の映像信号の一例を示す図である。
【図3】文字切り出しの例を示す図である。
【図4】アンダーライン領域を検出する原理を示す図で
ある。
【図5】アンダーライン領域を除去した一例を示す図で
ある。
【図6】図5の映像信号に対して文字切り出し処理を行
った例を示す図である。
【図7】文字「5」の正規化パターンの一例を示す図で
ある。
【図8】文字「5」の反転した正規化パターンの一例を
示す図である。
【図9】図1の照合判定回路の構成例を示す図である。
【図10】(a)は図1の辞書に格納される標準文字図
形(白レベル)の例を示す図である。(b)は図1の辞
書に格納される標準文字図形(黒レベル)の例を示す図
である。
【符号の説明】
1 光電変換部 2 文字列検出部 3 文字切り出し回路(I) 4 文字大きさ検出回路 5 アンダーライン領域検出回路 6 アンダーライン除去回路 7 文字切り出し回路(II) 8 正規化回路 9 照合禁止領域検出回路 10 照合判定回路 11 辞書 100 反転回路 101,102 比較回路 103 不一致数処理回路 104 判定回路
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/20 G06K 9/34 G06K 9/42

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 紙面上の文字・図形を電気的な文字図形
    に変換する変換手段と、この変換手段により変換された
    文字図形にアンダーラインが存在するか否かを検出する
    第1の検出手段と、この第1の検出手段による判定の結
    果アンダーラインが無い文字群から平均又は代表する文
    字の大きさを検出する第2の検出手段およびアンダーラ
    インが接触している文字列に対してはこのアンダーライ
    ンの領域を検出するとともにこのアンダーラインを除去
    する第1の除去手段と、この第1の除去手段により前記
    アンダーラインが除去された文字列を対象に文字切り出
    し処理を施す切り出し手段と、この切り出し手段により
    切り出された文字の大きさを前記第2の検出手段により
    検出された平均又は代表する文字の大きさに基づき仮想
    的に設定しこの設定された文字の大きさ情報に基づきア
    ンダーラインを除去した文字図形を正規化する正規化手
    段と、この正規化手段により正規化された文字図形と予
    め用意された標準図形とを比較照合する際アンダーライ
    ンとして除去された領域を比較照合の対象領域から除外
    する除外手段とを備えることを特徴とする光学式文字読
    取装置。
  2. 【請求項2】 前記正規化手段に、アンダーラインを除
    去した文字図形がその文字幅の情報より半角文字と判断
    された場合には、文字の高さ方向に対しては前記平均又
    は代表する文字の大きさ情報に基づき正規化を行い、幅
    方向に対しては前記半角文字の幅情報に基づき正規化を
    行う手段を備えることを特徴とする請求項1記載の光学
    式文字読取装置。
  3. 【請求項3】 前記変換手段で変換された文字図形がア
    ンダーラインと接触しているのではなく、枠で囲まれて
    いる場合、この枠の有無を検出する第3の検出手段と、
    前記枠が文字列と接触している場合、この枠を除去する
    第2の除去手段とを備えることを特徴とする請求項1ま
    たは2記載の光学式文字読取装置。
JP4208664A 1992-08-05 1992-08-05 光学式文字読取装置 Expired - Fee Related JP2797848B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP4208664A JP2797848B2 (ja) 1992-08-05 1992-08-05 光学式文字読取装置
US08/100,754 US5391889A (en) 1992-08-05 1993-08-02 Optical character reading apparatus which can reduce reading errors as regards a character image if the character image is in contact with an unnecessary image.
KR1019930015110A KR960001645B1 (ko) 1992-08-05 1993-08-04 문자가 불필요한 영상과 접촉된 경우 문자에 관련하여 판독 에러를 감소시키는 광학식 문자 판독 장치
GB9316225A GB2269471B (en) 1992-08-05 1993-08-05 Optical character reading apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4208664A JP2797848B2 (ja) 1992-08-05 1992-08-05 光学式文字読取装置

Publications (2)

Publication Number Publication Date
JPH0660224A JPH0660224A (ja) 1994-03-04
JP2797848B2 true JP2797848B2 (ja) 1998-09-17

Family

ID=16560009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4208664A Expired - Fee Related JP2797848B2 (ja) 1992-08-05 1992-08-05 光学式文字読取装置

Country Status (4)

Country Link
US (1) US5391889A (ja)
JP (1) JP2797848B2 (ja)
KR (1) KR960001645B1 (ja)
GB (1) GB2269471B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69424096T2 (de) * 1993-07-16 2000-11-16 Sharp Kk Bildprozessor
JPH08221576A (ja) * 1994-12-12 1996-08-30 Toshiba Corp 文字列における直線検出方式、直線除去方式および宛名領域判別装置
JP3655451B2 (ja) * 1997-12-11 2005-06-02 富士通株式会社 紙葉鑑別装置
US20070058856A1 (en) * 2005-09-15 2007-03-15 Honeywell International Inc. Character recoginition in video data
JP5357612B2 (ja) * 2009-04-13 2013-12-04 株式会社日立ソリューションズ 下線除去装置
WO2016086341A1 (en) 2014-12-01 2016-06-09 Dongguan Zkteco Electronic Technology Co., Ltd System and method for acquiring multimodal biometric information
CN107209848B (zh) 2014-12-01 2020-10-13 厦门熵基科技有限公司 用于基于多模式生物识别信息的个人识别的系统和方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3629833A (en) * 1969-11-24 1971-12-21 Frederick M Demer Character recognition system employing a plurality of character compression transforms
CA946071A (en) * 1971-01-07 1974-04-23 Morris D. Freedman Character location and deskewing system for character recognition systems
US4292622A (en) * 1980-02-21 1981-09-29 Hendrix Electronics, Inc. System and method for processing horizontal line characteristics in an image
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
JPH03214378A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
CA2037173C (en) * 1990-03-30 1996-01-09 Hirofumi Kameyama Character recognizing system
US5253304A (en) * 1991-11-27 1993-10-12 At&T Bell Laboratories Method and apparatus for image segmentation

Also Published As

Publication number Publication date
JPH0660224A (ja) 1994-03-04
KR940006057A (ko) 1994-03-23
GB2269471A (en) 1994-02-09
GB9316225D0 (en) 1993-09-22
KR960001645B1 (ko) 1996-02-03
GB2269471B (en) 1996-04-24
US5391889A (en) 1995-02-21

Similar Documents

Publication Publication Date Title
JP2553608B2 (ja) 光学文字読取装置
Shijian et al. Script and language identification in noisy and degraded document images
JP2797848B2 (ja) 光学式文字読取装置
JPH02306386A (ja) 文字認識装置
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
US4596038A (en) Method and apparatus for character recognition
Song et al. A robust statistic method for classifying color polarity of video text
JPH0430070B2 (ja)
JPH0743755B2 (ja) 文字認識装置
JP2751865B2 (ja) 文字列認識装置
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
Ting et al. A syntactic business form classifier
JPH03271881A (ja) 光学式文字読取装置
JP2972443B2 (ja) 文字認識装置
JPS58165178A (ja) 文字読取り装置
JP2978801B2 (ja) 手書き文字認識の文字入力方式
JP2551631B2 (ja) 個人照合装置
JPS6111886A (ja) 文字認識方式
JP2963807B2 (ja) 郵便番号枠検出装置
JPH0426153B2 (ja)
JP2973898B2 (ja) 文字認識方法及び装置
JP2832035B2 (ja) 文字認識装置
JPH0628520A (ja) 文字認識装置
JPH04337892A (ja) パターン読取装置
JPH0353393A (ja) 文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070703

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080703

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090703

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100703

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110703

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110703

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees