JP3163698B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP3163698B2
JP3163698B2 JP34063491A JP34063491A JP3163698B2 JP 3163698 B2 JP3163698 B2 JP 3163698B2 JP 34063491 A JP34063491 A JP 34063491A JP 34063491 A JP34063491 A JP 34063491A JP 3163698 B2 JP3163698 B2 JP 3163698B2
Authority
JP
Japan
Prior art keywords
character
black
white
candidate
recognition method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34063491A
Other languages
English (en)
Other versions
JPH05174178A (ja
Inventor
昇 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP34063491A priority Critical patent/JP3163698B2/ja
Publication of JPH05174178A publication Critical patent/JPH05174178A/ja
Application granted granted Critical
Publication of JP3163698B2 publication Critical patent/JP3163698B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書類に印刷された文
字を認識する文字認識方法に関する。
【0002】
【従来の技術】文字を読み取る技術は、それがコンピュ
ータ等情報処理装置へのデータ入力をキーボードを用い
ずして直接に行なう省力装置の開発に直結することか
ら、社会的ニーズが強く、広く研究対象とされてきてい
る。文字図形の抽出は斜めの図形成分が多いので8連結
の処理が普通である。したがって、従来の文字認識方法
は、黒8連結図形のみを求め、文字候補パターンとして
いた。
【0003】
【発明が解決しようとする課題】しかし、黒8連結図形
における反転文字、縞模様中の文字等は、連結図形とし
ては大きすぎ、文字候補パターンとならなかった。また
文字候補パターンとなっても、反転文字は、白黒が逆に
なっているために、認識できなかった。本発明はこの課
題を解決するもので、文字認識方法で課題となっていた
反転文字、縞模様中の文字等も通常文字と同様に認識す
る文字認識方法の提供を目的とする。
【0004】
【課題を解決するための手段】本発明はこの目的を達成
するために、黒8連結縮小図形、白8連結縮小画像から
各々、黒8連結図形、白8連結図形の外接短形を求める
ことによって、文字領域、さらに文字候補パターンを抽
出し、またランレングスをとることによって、白黒逆の
場合も、文字特徴辞書と比較し文字候補を決定する文字
認識部を備える。
【0005】
【作用】本発明は上記した構成によって、反転文字、縞
模様中の文字を通常文字とほぼ同様の処理で認識するよ
うに作用する。
【0006】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。図1は本実施例における文字認識方
法の構成図である。
【0007】黒論理和縮小部1、白論理和縮小部2は2
値画像から各々縮小画像を求める。文字領域抽出部3、
4は各々の縮小画像から、文字領域を抽出する。文字切
り出し部5、6は抽出された文字領域の黒8連結、白8
連結の図形パターンの外接短形から、原画像の外接短形
を求め、切り出し文字候補パターンとする。文字特徴抽
出部7は切り出した文字候補パターンから、ランレング
スをとり、文字線のランレングスより短いものをノイズ
として特徴を抽出する。認識確度計算部8は、文字特徴
と文字特徴辞書9によって、認識確度を求める。文字認
識部10は認識確度にもとづいて、一つまたは複数の候
補を決定する。
【0008】処理全体の流れを、図2のフローチャート
を使って、説明する。はじめに、2値画像データを黒論
理和、白論理和で縮小する(ステップ1)。縮小画像か
ら文字領域を抽出する(ステップ2)。文字領域を黒画
素8連結、白画素8連結の領域に分割し文字候補図形を
得る(ステップ3)。候補図形のランレングスをとる
共に、その長さの短いものを文字線の一部ではないノイ
ズとして取り除き、文字候補図形の文字特徴を抽出する
(ステップ4)。文字特徴を文字特徴辞書と比較し、類
似度等の文字認識確度にもとづいて、一つまたは複数の
候補文字を決定する(ステップ5)。
【0009】具体例をもって、説明を補足する。図3が
本発明で対象とするa反転文字、b縞模様中の文字、c
通常文字である。図3bに対し黒論理和縮小を行なう
と、図4のようになる。ここで、黒論理和縮小とは、黒
を必ず残すように論理和をとりながら、縮小することで
あり、白論理和縮小とは、白を必ず残すように論理和を
とりながら縮小することである。図4に対し、外接短形
を求め、その大きさ、位置から文字領域を抽出し、抽出
した文字領域から原画像中の文字候補パターンを得る。
文字候補パターン中には、文字線以外のノイズが残って
いる。ここで、文字候補パターンのランレングスをと
り、ランレングスに対し、文字の特徴抽出を行なう。図
5のように白ランレングスの短いものをノイズとし、文
字特徴を抽出することによって、通常文字と同様に認識
することが可能となる。また、ランレングスの場合、白
黒逆に扱うことが、容易に可能であるから、同一のアル
ゴリズムでもって、反転文字も認識可能となる。
【0010】このように、本実施例によると、2値画像
の黒論理和縮小画像から黒8連結図形を求め、白論理和
縮小画像から白8連結図形を求めて文字候補パターンを
抽出し、ランレングスの短いものはノイズとして取り除
き、文字候補図形の文字特徴を抽出して辞書と比較して
文字を認識するので。反転文字、縞模様中の文字も普通
の文字と同様に認識できる。
【0011】
【発明の効果】以上の実施例から明らかなように、本発
明によると、文書を黒論理和縮小、白論理和縮小処理を
施し、文字線のノイズを取り除くことによって、反転文
字、縞模様等の文字領域を通常の文字領域と同様に抽出
し、さらに切り出された文字候補パターンのランレング
スをとり、その長さによって、文字線の一部であるかど
うかを判断しているので、反転文字を縞模様中の文字も
認識する文字認識方法を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識方法の構成
【図2】本発明の一実施例におけるフローチャート
【図3】本発明の一対象文字図
【図4】本発明の一対象例の処理過程の模式図
【図5】ランレングス・データの例を示す模式図
【符号の説明】
1 黒論理和縮小部 2 白論理和縮小部 3,4 文字領域抽出部 5,6 文字切り出し部 7 特徴抽出部 8 認識確度計算部 9 文字特徴辞書 10 文字認識部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力画像から、黒論理和縮小画像、白論理
    和縮小画像を求め、各々、黒8連結図形、白8連結図形
    の外接矩形を求め、大きさ、位置の分布によって、文字
    領域を抽出し、 前記文字領域の8連結図形を、文字候補図形として前記
    入力2値画像から切り出し、 黒文字候補図形、白文字候補図形のランレングスをと
    と共に、短いランレングスはノイズとして取り除き、文
    字候補図形の特徴を抽出し、 あらかじめ用意した文字特徴辞書と比較し、一つまたは
    複数の文字候補を決定する、ように制御することを特徴
    とする文字認識方法。
JP34063491A 1991-12-24 1991-12-24 文字認識方法 Expired - Fee Related JP3163698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34063491A JP3163698B2 (ja) 1991-12-24 1991-12-24 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34063491A JP3163698B2 (ja) 1991-12-24 1991-12-24 文字認識方法

Publications (2)

Publication Number Publication Date
JPH05174178A JPH05174178A (ja) 1993-07-13
JP3163698B2 true JP3163698B2 (ja) 2001-05-08

Family

ID=18338854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34063491A Expired - Fee Related JP3163698B2 (ja) 1991-12-24 1991-12-24 文字認識方法

Country Status (1)

Country Link
JP (1) JP3163698B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4322041B2 (ja) * 2003-04-25 2009-08-26 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体
JP5222776B2 (ja) * 2009-04-09 2013-06-26 日立オムロンターミナルソリューションズ株式会社 画像処理装置及び方法

Also Published As

Publication number Publication date
JPH05174178A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
JP7244223B2 (ja) 電子文書における強調テキストの識別
JP2002298085A (ja) 文字認識装置、文字認識方法、及び記録媒体
Demilew et al. Ancient Geez script recognition using deep learning
Shafait et al. Pixel-accurate representation and evaluation of page segmentation in document images
CN111899292A (zh) 文字识别方法、装置、电子设备及存储介质
Yadav et al. Text extraction in document images: highlight on using corner points
Singh et al. Feature extraction and classification techniques for handwritten Devanagari text recognition: a survey
Bukhari et al. Layout analysis of Arabic script documents
Lakshmi et al. An optical character recognition system for printed Telugu text
Rahiman et al. A detailed study and analysis of ocr research in south indian scripts
Dhandra et al. Word level script identification in bilingual documents through discriminating features
Ghanei et al. Localizing scene texts by fuzzy inference systems and low rank matrix recovery model
JP3163698B2 (ja) 文字認識方法
SAWAKI et al. Recognition of degraded machine-printed characters using a complementary similarity measure and error-correction learning
Dhandra et al. Word-wise script identification from bilingual documents based on morphological reconstruction
Normand et al. A background based adaptive page segmentation algorithm
Shanjana et al. Character segmentation in Malayalam Handwritten documents
Alshameri et al. A combined algorithm for layout analysis of Arabic document images and text lines extraction
JP2821285B2 (ja) 画像処理方法及び装置
Dhandra et al. On Separation of English Numerals from Multilingual Document Images.
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
CN112183538B (zh) 一种满文识别方法及系统
JP5531493B2 (ja) 文字認識装置、文字認識方法、プログラム及び記録媒体
Murthy et al. Nearest neighbor clustering based approach for line and character segmentation in epigraphical scripts

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees