JP2797848B2 - 光学式文字読取装置 - Google Patents
光学式文字読取装置Info
- Publication number
- JP2797848B2 JP2797848B2 JP4208664A JP20866492A JP2797848B2 JP 2797848 B2 JP2797848 B2 JP 2797848B2 JP 4208664 A JP4208664 A JP 4208664A JP 20866492 A JP20866492 A JP 20866492A JP 2797848 B2 JP2797848 B2 JP 2797848B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- underline
- graphic
- detecting
- width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
する。
の反射光を電気信号に変換し、その信号レベルの大小関
係から紙面レベルと文字レベルを識別して2値化した文
字図形に変換し、文字の切り出し、文字の正規化を行
う。その後、その文字図形と予め用意してある複数種の
文字カテゴリーの標準図形とを遂一比較照合して、一致
度の高い、つまりは不一致度の低い標準図形を検出し、
その図形に該当する文字カテゴリーをもって、入力文字
図形に対する認識結果として出力するようにしている。
文字読取装置では、例えば郵便物上の郵便番号の位置を
強調するあまり、その番号にアンダーラインが印刷され
且つそれが接触している場合、1文字として切り出した
入力文字図形に一部アンダーラインによる余分な情報が
入り込む為、標準図形との一致がとれず誤読あるいは読
み取り不能となっていた。
ーラインに接触している場合、あるいは枠に囲まれてい
る場合でも、誤読を減少させ認識率を向上させることが
できる光学式文字読取装置を提供することにある。
装置は、紙面上の文字・図形を電気的な文字図形に変換
する変換手段と、この変換手段により変換された文字図
形にアンダーラインが存在するか否かを検出する第1の
検出手段と、この第1の検出手段による判定の結果アン
ダーラインが無い文字群から平均又は代表する文字の大
きさを検出する第2の検出手段およびアンダーラインが
接触している文字列に対してはこのアンダーラインの領
域を検出するとともにこのアンダーラインを除去する第
1の除去手段と、この第1の除去手段により前記アンダ
ーラインが除去された文字列を対象に文字切り出し処理
を施す切り出し手段と、この切り出し手段により切り出
された文字の大きさを前記第2の検出手段により検出さ
れた平均又は代表する文字の大きさに基づき仮想的に設
定しこの設定された文字の大きさ情報に基づきアンダー
ラインを除去した文字図形を正規化する正規化手段と、
この正規化手段により正規化された文字図形と予め用意
された標準図形とを比較照合する際アンダーラインとし
て除去された領域を比較照合の対象領域から除外する除
外手段とを備える構成であり、また、前記正規化手段
に、アンダーラインを除去した文字図形がその文字幅の
情報より半角文字と判断された場合には、文字の高さ方
向に対しては前記平均又は代表する文字の大きさ情報に
基づき正規化を行い、幅方向に対しては前記半角文字の
幅情報に基づき正規化を行う手段を備える構成としても
よいし、更に前記変換手段で変換された文字図形がアン
ダーラインと接触しているのではなく、枠で囲まれてい
る場合、この枠の有無を検出する第3の検出手段と、前
記枠が文字列と接触している場合、この枠を除去する第
2の除去手段とを備える構成としてもよい。
る。
である。図1において、光電変換部1は読み取るべき紙
面の所定領域を走査した際の紙面からの反射光に応じ、
電気的な2値の映像信号に変換する。2値の映像信号の
一例を図2に示す。図2の20は郵便番号を示してお
り、アンダーラインと接触していることを示している。
文字列検出部2は、図2に示された映像信号に基づき、
文字塊の並らびにより、文字列を検出する。
像信号に基づき、1文字づつ文字を切り出す。文字切り
出しの例を図3に示す。図3では、文字の外接する長方
形をもって1文字としているので、アンダーラインのあ
る「345」は1文字とみなされる。文字大きさ検出回
路4は、公知の技術により前述した切り出された文字の
大きさ,つまり外接する長方形の高さ及び幅を検出する
とともに、平均又は代表とする文字の大きさを検出す
る。
アンダーライン領域を検出する。図4はアンダーライン
領域を検出する原理を示した図で、2値の映像信号に対
して、“黒”メッシュを公知の技術である投影法で,つ
まり“黒”メッシュの出現頻度を計数し、その分布によ
り、出現頻度の高い領域をもってアンダーライン領域と
見倣すものである。
れたアンダーライン領域を対象に、その領域部を論理的
に除去するもので、その結果の一例を図5に示す。文字
切り出し回路(II)7は、図5の映像信号に対して、
再度文字切り出し処理を施すもので、その結果の一例を
図6に示す。
きさ検出回路4にて得られた平均の文字の大きさ又は代
表する文字の大きさにより、仮想的に与えられた文字の
大きさ(高さ)である。
さを文字大きさ検出回路4により検出された平均又は代
表する大きさに基づき仮想的に設定し、1文字毎に一定
の大きさに正規化する。但し、正規化を行う際に、文字
の重心あるいは文字の中心点がずれないように除去され
た部分を考慮して行う。例えば、図7は文字「5」の正
規化パターン(縦方向16メッシュ,横方向10メッシ
ュ)を示すが、領域Aはアンダーラインで除去された領
域である。つまり、図6で示された仮想の文字の高さで
正規化されたものである。
て、領域Aを検出する。照合判定回路10は、基本的に
は、辞書11に予め格納してある標準図形と正規化パタ
ーンとを比較照合し、文字を判定する。その際に、照合
禁止領域検出回路9で検出した領域Aに相当する部分を
比較照合から除外する,つまり正規化パターン及び辞書
中、領域Aに対してゲート信号をかけるものである。
に挙げて具体的に説明する。なお、辞書11に格納され
る文字カテゴリー「5」の標準文字図形は、例えば図1
0に示すように、紙面部(白レベル)であるべき領域を
論理“1”(「×」印)で表した標準文字図形(図10
(a))と、文字信号部(黒レベル)であるべき領域を
論理“1”(「×」印)で表した標準文字図形(図10
(b))とからなる。この標準文字図形の大きさは、前
述した正規化パターンと同様に16×10メッシュで構
成されることは勿論である。
示す図である。図9において、正規化回路8の出力であ
る正規化パターンは反転回路100と比較回路101と
に入力する。また、アンダーラインとして除去される領
域A信号は、反転回路100,比較回路101,比較回
路102に入力する。そして、辞書11からの標準文字
図形(白レベル)は比較回路101に入力し、標準文字
図形(黒レベル)は比較回路102に入力する。
ンの各メッシュ論理状態を反転する。その際に領域A信
号はゲート信号として機能し、図7の正規化パターンに
おけるアンダーライン除去領域Aの論理状態は変更され
ず図8のようにそのまま論理“0”(ブランク)の状態
が保持される。
よりゲートがかけられた辞書と両入力の各メッシュごと
の論理積をとることによって一致/不一致を判定し、一
致しなければ不一致信号を不一致数処理回路103へ出
力する。例えば、比較回路101では、図7の正規化パ
ターンと図10(a)の標準文字図形との比較をする
が、横の0〜9の列でかつ縦の0〜2の行における比較
では論理積は“0”となるから不一致信号は出力されな
い。また、比較回路102では、図8の反転正規化パタ
ーンと図10(b)の標準文字図形との比較をするが、
同領域に対して論理積は“0”となるから前述したと同
様に不一致信号は出力されない。以上要するに、比較回
路101,102では、アンダーライン領域を除外して
各標準文字図形ごとに一致/不一致の判定照合をしてい
るのである。
101,102が出力する不一致信号を各標準文字図形
ごとに計数し、その計数結果を判定回路104に出力す
る。
い文字を判定し、それを認識結果の第1候補として出力
する。
化回路8に、アンダーラインを除去した文字図形がその
文字幅の情報により半角文字と判断された場合には、文
字の高さ方向に対しては平均又は代表する文字の大きさ
情報に基づき正規化を行い、幅方向に対しては半角文字
の幅情報に基づき正規化を行う構成とすることも可能で
ある。
1で変換された文字図形がアンダーラインと接触してい
るのではなく、枠で囲まれている場合、この枠の有無を
検出する回路(図示せず)と、この枠が文字列と接触し
ている場合、この枠を除去する回路(図示せず)とを備
えて構成することも可能である。
読取装置によれば、走査領域内にアンダーライン領域あ
るいは枠領域があるときは、その領域を除外して比較照
合を行うようにしたので、正しい一致判定が行える場合
が多くなり、誤読が減少し認識率を向上させることがで
きるという効果がある。
ある。
ある。
った例を示す図である。
ある。
示す図である。
形(白レベル)の例を示す図である。(b)は図1の辞
書に格納される標準文字図形(黒レベル)の例を示す図
である。
Claims (3)
- 【請求項1】 紙面上の文字・図形を電気的な文字図形
に変換する変換手段と、この変換手段により変換された
文字図形にアンダーラインが存在するか否かを検出する
第1の検出手段と、この第1の検出手段による判定の結
果アンダーラインが無い文字群から平均又は代表する文
字の大きさを検出する第2の検出手段およびアンダーラ
インが接触している文字列に対してはこのアンダーライ
ンの領域を検出するとともにこのアンダーラインを除去
する第1の除去手段と、この第1の除去手段により前記
アンダーラインが除去された文字列を対象に文字切り出
し処理を施す切り出し手段と、この切り出し手段により
切り出された文字の大きさを前記第2の検出手段により
検出された平均又は代表する文字の大きさに基づき仮想
的に設定しこの設定された文字の大きさ情報に基づきア
ンダーラインを除去した文字図形を正規化する正規化手
段と、この正規化手段により正規化された文字図形と予
め用意された標準図形とを比較照合する際アンダーライ
ンとして除去された領域を比較照合の対象領域から除外
する除外手段とを備えることを特徴とする光学式文字読
取装置。 - 【請求項2】 前記正規化手段に、アンダーラインを除
去した文字図形がその文字幅の情報より半角文字と判断
された場合には、文字の高さ方向に対しては前記平均又
は代表する文字の大きさ情報に基づき正規化を行い、幅
方向に対しては前記半角文字の幅情報に基づき正規化を
行う手段を備えることを特徴とする請求項1記載の光学
式文字読取装置。 - 【請求項3】 前記変換手段で変換された文字図形がア
ンダーラインと接触しているのではなく、枠で囲まれて
いる場合、この枠の有無を検出する第3の検出手段と、
前記枠が文字列と接触している場合、この枠を除去する
第2の除去手段とを備えることを特徴とする請求項1ま
たは2記載の光学式文字読取装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4208664A JP2797848B2 (ja) | 1992-08-05 | 1992-08-05 | 光学式文字読取装置 |
US08/100,754 US5391889A (en) | 1992-08-05 | 1993-08-02 | Optical character reading apparatus which can reduce reading errors as regards a character image if the character image is in contact with an unnecessary image. |
KR1019930015110A KR960001645B1 (ko) | 1992-08-05 | 1993-08-04 | 문자가 불필요한 영상과 접촉된 경우 문자에 관련하여 판독 에러를 감소시키는 광학식 문자 판독 장치 |
GB9316225A GB2269471B (en) | 1992-08-05 | 1993-08-05 | Optical character reading apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4208664A JP2797848B2 (ja) | 1992-08-05 | 1992-08-05 | 光学式文字読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0660224A JPH0660224A (ja) | 1994-03-04 |
JP2797848B2 true JP2797848B2 (ja) | 1998-09-17 |
Family
ID=16560009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4208664A Expired - Fee Related JP2797848B2 (ja) | 1992-08-05 | 1992-08-05 | 光学式文字読取装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5391889A (ja) |
JP (1) | JP2797848B2 (ja) |
KR (1) | KR960001645B1 (ja) |
GB (1) | GB2269471B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69424096T2 (de) * | 1993-07-16 | 2000-11-16 | Sharp Kk | Bildprozessor |
JPH08221576A (ja) * | 1994-12-12 | 1996-08-30 | Toshiba Corp | 文字列における直線検出方式、直線除去方式および宛名領域判別装置 |
JP3655451B2 (ja) * | 1997-12-11 | 2005-06-02 | 富士通株式会社 | 紙葉鑑別装置 |
US20070058856A1 (en) * | 2005-09-15 | 2007-03-15 | Honeywell International Inc. | Character recoginition in video data |
JP5357612B2 (ja) * | 2009-04-13 | 2013-12-04 | 株式会社日立ソリューションズ | 下線除去装置 |
WO2016086341A1 (en) | 2014-12-01 | 2016-06-09 | Dongguan Zkteco Electronic Technology Co., Ltd | System and method for acquiring multimodal biometric information |
CN107209848B (zh) | 2014-12-01 | 2020-10-13 | 厦门熵基科技有限公司 | 用于基于多模式生物识别信息的个人识别的系统和方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3629833A (en) * | 1969-11-24 | 1971-12-21 | Frederick M Demer | Character recognition system employing a plurality of character compression transforms |
CA946071A (en) * | 1971-01-07 | 1974-04-23 | Morris D. Freedman | Character location and deskewing system for character recognition systems |
US4292622A (en) * | 1980-02-21 | 1981-09-29 | Hendrix Electronics, Inc. | System and method for processing horizontal line characteristics in an image |
US4377803A (en) * | 1980-07-02 | 1983-03-22 | International Business Machines Corporation | Algorithm for the segmentation of printed fixed pitch documents |
JPH03214378A (ja) * | 1990-01-19 | 1991-09-19 | Sony Corp | 文字認識装置 |
CA2037173C (en) * | 1990-03-30 | 1996-01-09 | Hirofumi Kameyama | Character recognizing system |
US5253304A (en) * | 1991-11-27 | 1993-10-12 | At&T Bell Laboratories | Method and apparatus for image segmentation |
-
1992
- 1992-08-05 JP JP4208664A patent/JP2797848B2/ja not_active Expired - Fee Related
-
1993
- 1993-08-02 US US08/100,754 patent/US5391889A/en not_active Expired - Lifetime
- 1993-08-04 KR KR1019930015110A patent/KR960001645B1/ko not_active IP Right Cessation
- 1993-08-05 GB GB9316225A patent/GB2269471B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0660224A (ja) | 1994-03-04 |
KR940006057A (ko) | 1994-03-23 |
GB2269471A (en) | 1994-02-09 |
GB9316225D0 (en) | 1993-09-22 |
KR960001645B1 (ko) | 1996-02-03 |
GB2269471B (en) | 1996-04-24 |
US5391889A (en) | 1995-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2553608B2 (ja) | 光学文字読取装置 | |
Shijian et al. | Script and language identification in noisy and degraded document images | |
JP2797848B2 (ja) | 光学式文字読取装置 | |
JPH02306386A (ja) | 文字認識装置 | |
EP0144006B1 (en) | An improved method of character recognitionand apparatus therefor | |
US4596038A (en) | Method and apparatus for character recognition | |
Song et al. | A robust statistic method for classifying color polarity of video text | |
JPH0430070B2 (ja) | ||
JPH0743755B2 (ja) | 文字認識装置 | |
JP2751865B2 (ja) | 文字列認識装置 | |
JP3095437B2 (ja) | 文字行検出切出装置および文字読取装置 | |
Ting et al. | A syntactic business form classifier | |
JPH03271881A (ja) | 光学式文字読取装置 | |
JP2972443B2 (ja) | 文字認識装置 | |
JPS58165178A (ja) | 文字読取り装置 | |
JP2978801B2 (ja) | 手書き文字認識の文字入力方式 | |
JP2551631B2 (ja) | 個人照合装置 | |
JPS6111886A (ja) | 文字認識方式 | |
JP2963807B2 (ja) | 郵便番号枠検出装置 | |
JPH0426153B2 (ja) | ||
JP2973898B2 (ja) | 文字認識方法及び装置 | |
JP2832035B2 (ja) | 文字認識装置 | |
JPH0628520A (ja) | 文字認識装置 | |
JPH04337892A (ja) | パターン読取装置 | |
JPH0353393A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980602 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070703 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080703 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090703 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100703 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110703 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110703 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 14 |
|
LAPS | Cancellation because of no payment of annual fees |