JPH07160810A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07160810A
JPH07160810A JP5309012A JP30901293A JPH07160810A JP H07160810 A JPH07160810 A JP H07160810A JP 5309012 A JP5309012 A JP 5309012A JP 30901293 A JP30901293 A JP 30901293A JP H07160810 A JPH07160810 A JP H07160810A
Authority
JP
Japan
Prior art keywords
character
rectangle
recognition
detected
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5309012A
Other languages
English (en)
Inventor
Yumiko Ikemure
由美子 池牟禮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5309012A priority Critical patent/JPH07160810A/ja
Publication of JPH07160810A publication Critical patent/JPH07160810A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 スキャナから取り込んだ二値データから文字
領域を抽出し、段組された文書であっても正確に文字の
認識を行う。 【構成】 二値化された文字認識対象文書に対して、二
値画像データから黒画素が連結している箇所を検出し、
外接矩形情報として格納する手段と、外接矩形の大きさ
と縦横比に基づいて二値画素データから文字候補矩形を
抽出する手段と、文字候補矩形の配置から文字組方向と
行間を検出する手段と、検出した文字組方向に隣り合う
文字候補の矩形間距離から認識対象文書の段組情報を検
出する手段と、検出した行間と段組情報を基に同一段組
中の文字候補矩形を統合して行として認識する手段と、
認識された行中から文字領域を抽出する手段とを備え、
抽出された文字領域毎に文字認識する手段を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷文書のデータベー
ス化や文書の再利用のために、スキャナ等の光学的手段
を用いて文書画像を取り込み、取り込んだ画像データか
ら文字、図形、表等の属性毎に領域を抽出し、各属性に
応じた認識処理を行う文字認識装置に関するものであ
る。
【0002】
【従来の技術】以下、従来の文字認識装置における各プ
ロセスを説明する。
【0003】(1)スキャナにより取り込んだ二値画像
データから黒画素の連結状態を調べ、黒画素が連結して
いるかたまりに外接する矩形(本明細書において外接矩
形と呼ぶ)の角点の座標を検出し格納する。
【0004】(2)(1)で検出された外接矩形のう
ち、縦横比があらかじめ定められた閾値th1未満で、
かつ、外接矩形の幅と高さと比較して大きい方の長さが
あらかじめ定められた閾値th2未満の外接矩形を文字
候補矩形として抽出する。
【0005】(3)認識対象文書の基準文字サイズを文
字候補矩形の最頻サイズと仮定して、認識対象文書の基
準文字サイズを決定する。
【0006】(4)左右に隣接する各文字候補矩形間の
距離を算出する。これらの距離のうち、最も出現回数の
多い距離を認識対象文書の水平方向の矩形間距離とし、
出現回数とその矩形間距離を記憶する。
【0007】(5)上下に隣接する各文字候補矩形間の
距離を算出する。これらの距離のうち、最も出現回数の
多い距離を認識対象文書の垂直方向の矩形間距離とし、
出現回数とその矩形間距離を記憶する。
【0008】(6)(4),(5)で記憶した水平/垂
直方向の矩形間距離と出現回数から、文字組み方向、文
字間、行間を決定する。
【0009】(7)〔文字間<行間<領域間〕の条件を
用いて、文字候補矩形の統合有効距離を(6)で決定し
た行間の距離内として矩形の統合処理を行い、行(文字
列)を抽出する。
【0010】(8)抽出された行を基に文字領域を抽出
し、それぞれの文字領域について文字切り出し/認識を
行う。
【0011】
【発明が解決しようとする課題】しかしながら上記従来
の文字認識装置では、統合処理において、行を抽出する
際の文字統合の有効範囲を文字矩形から検出した行間内
としているため、段組構成を有する文書であって、行間
よりも段間が狭い文書に対しては、複数の行領域を1つ
の行領域として抽出してしまうといった課題を有してい
た。
【0012】
【課題を解決するための手段】本発明は、上記課題を解
決するため、二値化された文字認識対象文書に対して、
二値画像データから黒画素が連結している箇所を検出
し、外接矩形情報として格納する手段と、外接矩形の大
きさと縦横比に基づいて二値画像データから文字候補矩
形を抽出する手段と、文字候補矩形の配置から文字組方
向と行間を検出する手段と、検出した文字組方向に隣り
合う文字候補の矩形間距離から認識対象文書の段組情報
を検出する手段と、検出した行間と段組情報を基に同一
段組中の文字候補矩形を統合して行として認識する手段
と、認識された行中から文字領域を抽出する手段とを備
え、抽出された文字領域毎に文字認識する手段を備え
る。
【0013】
【作用】本発明は上記の構成により、認識対象文書の段
組数と位置を検出し、段間を超えないように文字矩形の
統合を行うことによって、領域間の狭い文書に対しても
文字領域の抽出が可能となった。
【0014】
【実施例】本発明の一実施例における文字認識装置につ
いて図面を参照して説明する。図1は本発明の一実施例
における文字認識装置のブロック図、図2は本発明の一
実施例における文字認識装置の機能ブロック図である。
【0015】図1において、1は図1の他の構成要素を
制御する中央処理装置(以下、CPUと略す)、2は文
字認識プログラムが格納されているリードオンリーメモ
リ(以下、ROMと略す)であり、ランダムアクセスメ
モリ(以下、RAMと略す)3には、スキャナ4で読み
取った画像データ及び認識プログラムのデータが格納さ
れる。5は外部からCPU1に対して指令を与えるため
のキーボードであり、6はCPU1によって認識された
認識結果を表示するCRTなどの表示装置である。
【0016】図2において、7はスキャナ4からなり、
取り込んだ画像データを文字領域検出のための画像デー
タに加工する画像データ取り込み部、8は取り込んだ画
像データより、画像処理の1手法である外接矩形の検出
を行う外接矩形検出部、9は外接矩形検出部8で検出し
た認識対象文書の外接矩形の中から文字を構成する外接
矩形を抽出する文字矩形判定部、10は文字矩形判定部
9で検出した文字矩形から認識対象文書の文字組方向を
決定する文字組方向判定部、11は文字矩形情報と文字
組方向判定結果から、認識対象文書の段組あり/なしを
判定して、段組ありの場合に段間位置を検出する段組あ
り/なし判定部、12は段組あり/なし結果と文字矩形
情報から文字列を検出し、文字列位置を検出する文字列
統合部、13は文字列統合部12で得た文字列情報か
ら、スキャナ4で取り込んだ認識対象文書の画像データ
に対応した文字領域の位置を算出する文字領域抽出部、
14は文字領域抽出部13で得た認識対象文書の文字領
域の位置とスキャナ4で取り込んだ画像データより文字
認識して文字コードを検出する文字認識部である。これ
ら画像データ取り込み部7、外接矩形検出部8、文字矩
形判定部9、文字組方向判定部10、段組あり/なし判
定部11、文字列統合部12、文字領域抽出部13及び
文字認識部14はCPU1がROM2内の文字認識プロ
グラムを実行することにより実現される。
【0017】図3,図4は本発明の一実施例における文
字認識装置のフローチャート、図5は本発明の一実施例
における文字認識装置で取り扱う外接矩形のデータ例示
図である。
【0018】以下、図3,図4,図5を参照しながら文
字領域抽出処理について説明する。画像データ取り込み
部7において、認識対象文書をスキャナ4により二値画
像データを取り込む(ステップS1)。取り込んだ二値
画像データを文字領域抽出処理を高速に行うために、解
像度100DPI程度にOR縮小して、RAM3に格納
する。
【0019】外接矩形検出部8で、縮小画像データの連
結黒画素の外接矩形を抽出する(ステップS2)。図5
の例では、画像データから検出された外接矩形はK1か
らK32までの32個の矩形が検出される。また図5に
おいて、左上が原点で、水平方向の座標をx、垂直方向
の座標をyとする。外接矩形は、左上の角点の座標(x
1,y1)と右下の角点の座標(x2,y2)で表現さ
れ、全ての外接矩形の座標情報はRAM3に格納され
る。
【0020】次にステップS3において、文字矩形判定
部9で、外接矩形の大きさ、縦横比より文字か文字以外
かに分類する。即ち、矩形の縦横比があらかじめ定めら
れた閾値th1以上であるか否かチェックする。閾値t
h1以上であれば罫線矩形として、矩形情報に非文字属
性が設定される(ステップS6)。閾値th1未満であ
れば、ステップS4へ移行する。ステップS4では、矩
形の短辺の長さがあらかじめ定められた閾値th2以上
か否かを検査する。閾値th2以上であればその矩形は
図形候補矩形として、矩形情報に非文字属性を設定する
(ステップS6)。閾値th2未満であればその矩形は
文字矩形として、矩形情報に文字属性を設定する(ステ
ップS5)。そして全ての矩形に対して属性付加が終了
したか検査し(ステップS7)、終了していなければス
テップS3へもどり、処理が終了していればステップS
8へ進む。
【0021】上記の属性付加処理で図5のK1〜K32
の矩形はすべて文字候補矩形となる。ステップS8にお
いて、文字属性が設定された矩形情報から、認識対象文
書の基準文字サイズを決定する。基準文字サイズは、各
文字候補矩形の幅と高さを求め、出現回数が最も多いも
のとする。
【0022】文字組方向判定部10では、ステップS8
で検出した基準文字サイズを基に、文字組方向を決定す
る(ステップS9)。さらに、検出された文字組方向と
文字候補矩形から、認識対象文書の行間を検出する。次
に、検出された文字組方向に従って認識対象文書の段間
の位置を検出する(ステップ10)。
【0023】段組あり/なし判定部11では、文字候補
矩形と文字組方向の隣接矩形との位置と数から、認識対
象文書の段組位置を検出する(ステップS11)。ここ
で図6は本発明の一実施例における文字認識装置により
認定される段間領域の例示図であり、図5の例では矩形
領域K9と矩形領域K10との間を通る縦長短冊状の段
間領域が認定される。
【0024】文字列統合部12において、行抽出のた
め、文字候補矩形の統合有効距離を行間の距離内とし
て、文字統合処理を行う。この時、矩形統合対象矩形が
段間にまたがっているか否か検査し、またがっていなけ
れば矩形の統合処理を行い、行(文字列)を抽出する
(ステップS12)。
【0025】文字領域抽出部13において、抽出された
行(文字列)から、行の文字サイズがほぼ等しくて、等
間隔に並んでいる箇所を検出して、文字領域を抽出する
(ステップS13)。ここで図7は本発明の一実施例に
おける文字認識装置で認定される文字領域の例示図であ
り、段間領域の上部、右部、左部に位置する文字領域
1、文字領域2、文字領域3が抽出される。
【0026】文字認識部14では、抽出された各文字領
域のそれぞれの内部において文字認識処理を行う(ステ
ップS14)。文字認識した結果と段組情報を文字編集
部へ渡し、文字認識した結果の文字編集を行う(ステッ
プS15)。尚、本実施例では、th1=30、th2
=100(いずれもドット)とした。
【0027】
【発明の効果】以上のように本発明は、文書を段組に対
応する文字領域に分割し、各文字領域内において行及び
文字の抽出を行うため、行間よりも領域間が狭い文書に
対しても領域の抽出が正確に行え、文字認識精度が向上
する。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識装置のブロ
ック図
【図2】本発明の一実施例における文字認識装置の機能
ブロック図
【図3】本発明の一実施例における文字認識装置のフロ
ーチャート
【図4】本発明の一実施例における文字認識装置のフロ
ーチャート
【図5】本発明の一実施例における文字認識装置で取り
扱う外接矩形のデータ例示図
【図6】本発明の一実施例における文字認識装置により
認定される段間領域の例示図
【図7】本発明の一実施例における文字認識装置で認定
される文字領域の例示図
【符号の説明】 1 中央処理装置 2 リードオンリーメモリ 3 ランダムアクセスメモリ 4 スキャナ 5 キーボード 6 表示装置 7 画像データ取り込み部 8 外接矩形検出部 9 文字矩形判定部 10 文字組方向判定部 11 段組あり/なし判定部 12 文字列統合部 13 文字領域抽出部 14 文字認識部 K1〜K32 外接矩形

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】二値化された文字認識対象文書に対して、
    二値画像データから黒画素が連結している箇所を検出
    し、外接矩形情報として格納する手段と、外接矩形の大
    きさと縦横比に基づいて前記二値画像データから文字候
    補矩形を抽出する手段と、前記文字候補矩形の配置から
    文字組方向と行間を検出する手段と、前記検出した文字
    組方向に隣り合う文字候補の矩形間距離から認識対象文
    書の段組情報を検出する手段と、前記検出した行間と段
    組情報を基に同一段組中の前記文字候補矩形を統合して
    行として認識する手段と、前記認識された行中から文字
    領域を抽出する手段とを備え、前記抽出された文字領域
    毎に文字認識する手段を備えることを特徴とする文字認
    識装置。
JP5309012A 1993-12-09 1993-12-09 文字認識装置 Pending JPH07160810A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5309012A JPH07160810A (ja) 1993-12-09 1993-12-09 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5309012A JPH07160810A (ja) 1993-12-09 1993-12-09 文字認識装置

Publications (1)

Publication Number Publication Date
JPH07160810A true JPH07160810A (ja) 1995-06-23

Family

ID=17987827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5309012A Pending JPH07160810A (ja) 1993-12-09 1993-12-09 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07160810A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251872A (ja) * 2008-04-04 2009-10-29 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
WO2015079790A1 (ja) * 2013-11-28 2015-06-04 シャープ株式会社 文字列認識装置および文字列認識方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
JP2009251872A (ja) * 2008-04-04 2009-10-29 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
WO2015079790A1 (ja) * 2013-11-28 2015-06-04 シャープ株式会社 文字列認識装置および文字列認識方法
JP2015106182A (ja) * 2013-11-28 2015-06-08 シャープ株式会社 文字列認識装置および文字列認識方法

Similar Documents

Publication Publication Date Title
JPH0721310A (ja) 文書認識装置
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
JPH09311905A (ja) 行検出方法および文字認識装置
JPH07160810A (ja) 文字認識装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH06187489A (ja) 文字認識装置
JP4228592B2 (ja) 文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2917427B2 (ja) 図面読取装置
JPH06180771A (ja) 英文字認識装置
JPH07168911A (ja) 文書認識装置
JP3095470B2 (ja) 文字認識装置
JP3936039B2 (ja) 網がけ領域抽出装置
JPH0713994A (ja) 文字認識装置
JP3000480B2 (ja) 文字領域区切り検出方法
JPH0628520A (ja) 文字認識装置
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JP2982221B2 (ja) 文字読み取り装置
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JP3190794B2 (ja) 文字切り出し装置
JP2683116B2 (ja) 罫線の除去方法
JPH0855185A (ja) 文字認識装置
JPH08171609A (ja) 文字列高速抽出装置
JPH0573714A (ja) 文字認識装置
JPH05274472A (ja) 画像認識装置