JPH05174178A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH05174178A
JPH05174178A JP3340634A JP34063491A JPH05174178A JP H05174178 A JPH05174178 A JP H05174178A JP 3340634 A JP3340634 A JP 3340634A JP 34063491 A JP34063491 A JP 34063491A JP H05174178 A JPH05174178 A JP H05174178A
Authority
JP
Japan
Prior art keywords
character
pattern
candidate
black
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3340634A
Other languages
English (en)
Other versions
JP3163698B2 (ja
Inventor
Noboru Nakamura
昇 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP34063491A priority Critical patent/JP3163698B2/ja
Publication of JPH05174178A publication Critical patent/JPH05174178A/ja
Application granted granted Critical
Publication of JP3163698B2 publication Critical patent/JP3163698B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 新聞見出し等に使われる反転文字、縞模様中
の文字を認識する文字認識方法の提供を目的とする。 【構成】 2値画像の黒論理和縮小画像から黒8連結図
形、白論理和縮小画像から白8連結図形を求め、文字候
補パターンを抽出し、文字候補パターン中でランレング
スの短いものは、ノイズとする特徴抽出を行ない、辞書
の特徴ベクトルと比較し、文字を認識する構成を有す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書類に印刷された文
字を認識する文字認識方法に関する。
【0002】
【従来の技術】文字を読み取る技術は、それがコンピュ
ータ等情報処理装置へのデータ入力をキーボードを用い
ずして直接に行なう省力装置の開発に直結することか
ら、社会的ニーズが強く、広く研究対象とされてきてい
る。文字図形の抽出は斜めの図形成分が多いので8連結
の処理が普通である。したがって、従来の文字認識方法
は、黒8連結図形のみを求め、文字候補パターンとして
いた。
【0003】
【発明が解決しようとする課題】しかし、黒8連結図形
における反転文字、縞模様中の文字等は、連結図形とし
ては大きすぎ、文字候補パターンとならなかった。また
文字候補パターンとなっても、反転文字は、白黒が逆に
なっているために、認識できなかった。本発明はこの課
題を解決するもので、文字認識方法で課題となっていた
反転文字、縞模様中の文字等も通常文字と同様に認識す
る文字認識方法の提供を目的とする。
【0004】
【課題を解決するための手段】本発明はこの目的を達成
するために、黒8連結縮小図形、白8連結縮小画像から
各々、黒8連結図形、白8連結図形の外接短形を求める
ことによって、文字領域、さらに文字候補パターンを抽
出し、またランレングスをとることによって、白黒逆の
場合も、文字特徴辞書と比較し文字候補を決定する文字
認識部を備える。
【0005】
【作用】本発明は上記した構成によって、反転文字、縞
模様中の文字を通常文字とほぼ同様の処理で認識するよ
うに作用する。
【0006】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。図1は本実施例における文字認識方
法の構成図である。
【0007】黒論理和縮小部1、白論理和縮小部2は2
値画像から各々縮小画像を求める。文字領域抽出部3、
4は各々の縮小画像から、文字領域を抽出する。文字切
り出し部5、6は抽出された文字領域の黒8連結、白8
連結の図形パターンの外接短形から、原画像の外接短形
を求め、切り出し文字候補パターンとする。文字特徴抽
出部7は切り出した文字候補パターンから、ランレング
スをとり、文字線のランレングスより短いものをノイズ
として特徴を抽出する。認識確度計算部8は、文字特徴
と文字特徴辞書9によって、認識確度を求める。文字認
識部10は認識確度にもとづいて、一つまたは複数の候
補を決定する。
【0008】処理全体の流れを、図2のフローチャート
を使って、説明する。はじめに、2値画像データを黒論
理和、白論理和で縮小する(ステップ1)。縮小画像か
ら文字領域を抽出する(ステップ2)。文字領域を黒画
素8連結、白画素8連結の領域に分割し文字候補図形を
得る(ステップ3)。候補図形のランレングスをとり、
その長さの短いものを文字線の一部ではないノイズとし
て文字特徴を抽出する(ステップ4)。文字特徴を文字
特徴辞書と比較し、類似度等の文字認識確度にもとづい
て、一つまたは複数の候補文字を決定する(ステップ
5)。
【0009】具体例をもって、説明を補足する。図3が
本発明で対象とするa反転文字、b縞模様中の文字、c
通常文字である。図3bに対し黒論理和縮小を行なう
と、図4のようになる。ここで、黒論理和縮小とは、黒
を必ず残すように論理和をとりながら、縮小することで
あり、白論理和縮小とは、白を必ず残すように論理和を
とりながら縮小することである。図4に対し、外接短形
を求め、その大きさ、位置から文字領域を抽出し、抽出
した文字領域から原画像中の文字候補パターンを得る。
文字候補パターン中には、文字線以外のノイズが残って
いる。ここで、文字候補パターンのランレングスをと
り、ランレングスに対し、文字の特徴抽出を行なう。図
5のように白ランレングスの短いものをノイズとし、文
字特徴を抽出することによって、通常文字と同様に認識
することが可能となる。また、ランレングスの場合、白
黒逆に扱うことが、容易に可能であるから、同一のアル
ゴリズムでもって、反転文字も認識可能となる。
【0010】このように、本実施例によると、2値画像
の黒論理和縮小画像から黒8連結図形を求め、白論理和
縮小画像から白8連結図形を求めて文字候補パターンを
抽出し、ランレングスの短いものはノイズとして特徴を
抽出して辞書と比較して文字を認識するので、反転文
字、縞模様中の文字も普通の文字と同様に認識できる。
【0011】
【発明の効果】以上の実施例から明らかなように、本発
明によると、文書を黒論理和縮小、白論理和縮小処理を
施し、文字線のノイズを取り除くことによって、反転文
字、縞模様等の文字領域を通常の文字領域と同様に抽出
し、さらに切り出された文字候補パターンのランレング
スをとり、その長さによって、文字線の一部であるかど
うかを判断しているので、反転文字を縞模様中の文字も
認識する文字認識方法を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識方法の構成
【図2】本発明の一実施例におけるフローチャート
【図3】本発明の一対象文字図
【図4】本発明の一対象例の処理過程の模式図
【図5】ランレングス・データの例を示す模式図
【符号の説明】
1 黒論理和縮小部 2 白論理和縮小部 3,4 文字領域抽出部 5,6 文字切り出し部 7 特徴抽出部 8 認識確度計算部 9 文字特徴辞書 10 文字認識部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力2値画像から、黒論理和縮小画像、
    白論理和縮小画像を求め、各々、黒8連結図形、白8連
    結図形の外接短形を求め、大きさ、位置の分布によっ
    て、文字領域を抽出する文字領域抽出部と、前記文字領
    域の8連結図形を、文字候補図形として前記入力2値画
    像から切り出す文字切り出し部と、黒文字候補図形、白
    文字候補図形のランレングスをとり、短いランレングス
    はノイズとして、特徴を抽出する特徴抽出部と、あらか
    じめ用意した文字特徴辞書と比較し、一つまたは複数の
    文字候補を決定する文字認識部を備えた文字認識方法。
JP34063491A 1991-12-24 1991-12-24 文字認識方法 Expired - Fee Related JP3163698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34063491A JP3163698B2 (ja) 1991-12-24 1991-12-24 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34063491A JP3163698B2 (ja) 1991-12-24 1991-12-24 文字認識方法

Publications (2)

Publication Number Publication Date
JPH05174178A true JPH05174178A (ja) 1993-07-13
JP3163698B2 JP3163698B2 (ja) 2001-05-08

Family

ID=18338854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34063491A Expired - Fee Related JP3163698B2 (ja) 1991-12-24 1991-12-24 文字認識方法

Country Status (1)

Country Link
JP (1) JP3163698B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1619605A1 (en) * 2003-04-25 2006-01-25 Sharp Kabushiki Kaisha Image processing device, image processing method, image processing program, and computer-readable recording medium containing the program
JP2010244472A (ja) * 2009-04-09 2010-10-28 Hitachi Omron Terminal Solutions Corp 画像処理装置及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1619605A1 (en) * 2003-04-25 2006-01-25 Sharp Kabushiki Kaisha Image processing device, image processing method, image processing program, and computer-readable recording medium containing the program
EP1619605A4 (en) * 2003-04-25 2008-03-26 Sharp Kk IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD, IMAGE PROCESSING PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING THE PROGRAM
JP2010244472A (ja) * 2009-04-09 2010-10-28 Hitachi Omron Terminal Solutions Corp 画像処理装置及び方法

Also Published As

Publication number Publication date
JP3163698B2 (ja) 2001-05-08

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
JP4031210B2 (ja) 文字認識装置、文字認識方法、及び記録媒体
JP7244223B2 (ja) 電子文書における強調テキストの識別
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH05174178A (ja) 文字認識方法
JPH0528319A (ja) 画像処理方法及び装置
JP4136257B2 (ja) 文字認識装置、文字認識方法および記憶媒体
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JPH10162104A (ja) 文字認識装置
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH03217993A (ja) 文字サイズ認識装置
JPH04130979A (ja) 文字画像切出し方法
JPH05174185A (ja) 日本語文字認識装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH0528260A (ja) 輪郭ベクトル抽出方式
JPH1055411A (ja) フォント識別装置
JPH09114925A (ja) 光学式文字読取装置
JPH05108882A (ja) 文字認識装置
JPH06231306A (ja) 文字認識装置
JPH04291479A (ja) 罫線認識方法及び表処理方法
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
JPH05108880A (ja) 英文字認識装置
JPH0573721A (ja) 表認識装置
JPH0271379A (ja) 画像処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees