JP2537973B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2537973B2
JP2537973B2 JP63160065A JP16006588A JP2537973B2 JP 2537973 B2 JP2537973 B2 JP 2537973B2 JP 63160065 A JP63160065 A JP 63160065A JP 16006588 A JP16006588 A JP 16006588A JP 2537973 B2 JP2537973 B2 JP 2537973B2
Authority
JP
Japan
Prior art keywords
character
background
area
pixels
extraction unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63160065A
Other languages
English (en)
Other versions
JPH028976A (ja
Inventor
磨理子 竹之内
啓惠 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63160065A priority Critical patent/JP2537973B2/ja
Publication of JPH028976A publication Critical patent/JPH028976A/ja
Application granted granted Critical
Publication of JP2537973B2 publication Critical patent/JP2537973B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞,雑誌等の活字及び手書き文字を認識
し、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では、入力された画像を表示し、
オペレータがマウス等を用いて設定した認識対象領域に
ついて認識を行っていた。また、他の文字認識装置で
は、画像入力部から入力する原画像自体にカラーペン等
を用いてマークを付し、マークを認識することにより、
自動的に認識対象領域を抽出していた(例えば、長谷他
“マークを用いた印刷文書画像の領域抽出法”信学技報
Vol.83No.302PRL83−78)。
発明が解決しようとする課題 しかしながら、オペレータやマークにより認識対象領
域を指示する従来の技術では、例えば名刺のように空白
部分で文字領域を分割し予め認識対象領域の候補領域が
示されている文書に関しても、認識対象領域全域あるい
は周囲を指定するという煩雑な作業を必要とした。
本発明はかかる点に鑑みてなされたものであり、既に
空白部分で認識対象領域の候補領域が示されている文書
に関して、簡易な方法で自動的に認識対象領域を決定す
る文字認識装置を提供することを目的としている。
課題を解決するための手段 本発明は前記課題を解決するため、画像入力部で入力
した画像から一定幅以上の横方向背景部ランと一定高さ
以上の縦方向背景部ランとを抽出し、横方向背景部ラン
と縦方向背景部ランの両方に含まれる画素を背景画素と
する背景画素領域抽出部と、画像入力部で入力した画像
において、背景画素領域抽出部で抽出した背景画素以外
の画素の連結性を調べて文字領域を抽出する文字領域抽
出部とを備えている。
作用 本発明は前記した技術的手段により、背景画素領域抽
出部で認識対象領域である文字領域の区切り候補位置で
ある背景画素が抽出され、文字領域抽出部で入力した画
像の背景画素以外の画素の連結性を調べることにより自
動的に認識対象領域である文字領域を抽出することが可
能となる。
実 施 例 以下、本発明の実施例について図面を参照しながら説
明する。
第1図は、本発明による文字認識装置の一実施例の構
成図である。1は画像入力部であり、認識対象文字を含
む画像を走査して2値信号で画像メモリ2に格納する。
3は背景画素領域抽出部であり、文字領域の区切り候補
位置である背景画素領域を抽出する。4は文字領域抽出
部であり、背景画素領域抽出部3で抽出した背景画素領
域相互の関係を調べて文字領域を抽出する。5は文字切
り出し部であり、文字領域抽出部4で抽出した各々の文
字領域毎に認識対象文字を1字ずつ切り出す。6は認識
部であり、文字切り出し部5で切り出した認識対象文字
の特徴量を求め、あらかじめ辞書7に登録されている文
字の特徴量と照合し、最も似た文字を認識候補文字とし
て表示部8に表示する。
以上のように構成された文字認識装置について、第2
図に示す入力画像Pを例に説明する。
画像入力部1から入力された画像Pは文字部の黒画素
を1、背景部の白画素を0の2値データで画像メモリ2
に蓄えられる。
背景画素領域抽出部3では、認識対象領域である文字
領域の区切り候補位置である背景画素領域を抽出する。
まず、画像メモリ2に蓄えられている入力画像Pを横方
向に走査して、N画素以上(Nはあらかじめ設定)白画
素が連続する横方向背景部ランを抽出する。第3図aに
入力画像Pの横方向背景部ラン抽出結果を で示す。同様に、画像メモリ2に蓄えられている入力画
像Pを縦方向に走査して、N画素以上白画素が連続する
縦方向背景部ランを抽出する。第3図bに入力画像Pの
縦方向背景部ラン抽出結果を で示す。次に、横方向背景部ランと縦方向背景部ランの
両方に含まれる画素を背景画素とし、背景画素からなる
背景画素領域を抽出する。第3図cに入力画像Pの背景
画素領域抽出結果を示す。
文字領域抽出部4では、背景画素領域抽出部3で抽出
した背景画素領域相互の関係を調べて認識対象領域であ
る文字領域を抽出する。背景画素領域抽出部3で抽出し
た背景画素領域に含まれない画素の上下左右の連結性を
調べて、連結している画素の集りを文字領域とする。第
4図に入力画像Pの文字領域抽出結果Ai(i=1,2,…
…,5)を示す。
文字切り出し部5では、文字領域抽出部4で抽出した
文字領域毎に認識対象文字を切り出す。第5図に入力画
像Pの抽出された文字領域A3を示す。まず、文字領域内
の文字部全体の縦方向長さDvと横方向長さDhを比較し、
文字列方向が縦書きか横書きかを判定する。文字領域A3
の場合、Dv>Dhより縦書きである。次に、文字列方向判
定結果を用いて、文字領域を文字列方向と垂直に射影し
て文字部を形成する画素のヒストグラムHcを求める。ヒ
ストグラムHcの値が1画素以上である文字部の開始・終
了座標(Cs1,Ce1)……(Csi,Cei)……を用いて認識対
象文字画像を切り出す。
認識部6には切り出した認識対象文字画像Rが順次入
力される。第6図aに文字領域A3の切り出した認識対象
文字『文』の画像を示す。認識部6では、切り出した
『文]の各画素について、第6図bの矢印が示す方向に
着目画素を含んでM個以上(Mはあらかじめ設定)連っ
ているか否かを調べ方向コードを設定する。方向コード
毎に各画素の連結性を調べてストロークを抽出し、スト
ロークの数・位置・長さの特徴量を抽出する。第6図a
に認識対象文字『文』のストローク抽出結果を示す。抽
出した特徴量を辞書7に登録されている文字の特徴量と
照合し、最も似た文字「文」を認識候補文字とし、表示
部8に表示する。
発明の効果 本発明によれば、背景画素領域抽出部で認識対象領域
である文字領域の区切り候補位置である背景画素を抽出
し、文字領域抽出部で入力した画像の背景画素以外の画
素の連結性を調べて認識対象領域である文字領域を抽出
することにより、既に空白部分で認識対象領域の候補領
域が示されている文書に関して、簡易な方法で自動的に
認識対象領域を決定することが可能となる。
【図面の簡単な説明】
第1図は本発明における一実施例による文字認識装置の
構成図、第2図は入力画像の説明図、第3図は背景画素
領域抽出方法の説明図、第4図は文字領域抽出方法の説
明図、第5図は文字切り出し方法の説明図、第6図は文
字認識方法の説明図である。 3……背景画素領域抽出部、4……文字領域抽出部、5
……文字切り出し部、6……認識部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象文字を含む画像を入力する画像入
    力部と、前記画像入力部で入力した画像から一定幅以上
    の横方向背景部ランと一定高さ以上の縦方向背景部ラン
    とを抽出し、横方向背景部ランと縦方向背景部ランの両
    方に含まれる画素を背景画素とする背景画素領域抽出部
    と、前記画像入力部で入力した画像において、前記背景
    画素領域抽出部で抽出した背景画素以外の画素の連結性
    を調べて文字領域を抽出する文字領域抽出部と、前記文
    字領域抽出部で抽出した文字領域画像から認識対象文字
    を切り出す文字切り出し部と、前記文字切り出し部で切
    り出した認識対象文字を辞書と照合することにより認識
    候補文字を抽出する認識部を有することを特徴とする文
    字認識装置。
JP63160065A 1988-06-28 1988-06-28 文字認識装置 Expired - Fee Related JP2537973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63160065A JP2537973B2 (ja) 1988-06-28 1988-06-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63160065A JP2537973B2 (ja) 1988-06-28 1988-06-28 文字認識装置

Publications (2)

Publication Number Publication Date
JPH028976A JPH028976A (ja) 1990-01-12
JP2537973B2 true JP2537973B2 (ja) 1996-09-25

Family

ID=15707139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63160065A Expired - Fee Related JP2537973B2 (ja) 1988-06-28 1988-06-28 文字認識装置

Country Status (1)

Country Link
JP (1) JP2537973B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032770A (ja) * 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
US7099508B2 (en) 2001-11-29 2006-08-29 Kabushiki Kaisha Toshiba Document identification device, document definition method and document identification method

Also Published As

Publication number Publication date
JPH028976A (ja) 1990-01-12

Similar Documents

Publication Publication Date Title
US6640010B2 (en) Word-to-word selection on images
US5867277A (en) Reduced resolution document storage and retrieval system
JP2713622B2 (ja) 表形式文書読取装置
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
KR20000047428A (ko) 문자 인식 장치 및 방법
JPH01253077A (ja) 文字列検出方法
JP2537973B2 (ja) 文字認識装置
JP2661898B2 (ja) 文字認識装置
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3159087B2 (ja) 文書照合装置および方法
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JPH0797390B2 (ja) 文字認識装置
JPS63129484A (ja) 文字認識装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0772903B2 (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
Said Automatic processing of documents and bank cheques
JPH0578068B2 (ja)
JPH01137385A (ja) 文字認識装置
JPH0664628B2 (ja) 文字認識装置
JPS63311492A (ja) 文字認識装置
JPH0576671B2 (ja)
JPS63225883A (ja) 文字認識装置
JPS6378287A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees