JPH06187489A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06187489A
JPH06187489A JP4337330A JP33733092A JPH06187489A JP H06187489 A JPH06187489 A JP H06187489A JP 4337330 A JP4337330 A JP 4337330A JP 33733092 A JP33733092 A JP 33733092A JP H06187489 A JPH06187489 A JP H06187489A
Authority
JP
Japan
Prior art keywords
character
rectangle
line
rectangles
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4337330A
Other languages
English (en)
Inventor
Yumiko Ikemure
由美子 池牟▲禮▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4337330A priority Critical patent/JPH06187489A/ja
Publication of JPH06187489A publication Critical patent/JPH06187489A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 スキャナから取り込んだ二値データの文字間
隔が広い文書でも正確に領域抽出できるようにする。 【構成】 スキャナ4から取り込んだ画像データを画像
データ縮小部8で縮小した上、外接矩形抽出部9で黒画
素が連結している箇所を検出して、連結している黒画素
の外接矩形の情報をメモリに格納する。そして、文字矩
形識別部10において外接矩形の大きさ,黒画素の数及び
黒画素の密度に基づいて文字候補の矩形を識別すると、
文字間・行間検出部11は文字候補矩形の上下左右に隣接
する矩形との矩形間距離とその出現回数から文字間・行
間を検出する。すると、行統合部12は、(文字間<行間
<領域間)の条件から文字候補矩形の統合有効距離を行
間として、矩形の統合処理によって行を抽出する。そこ
で、文字領域統合部13で抽出された行を基に文字領域を
抽出して、文字認識部14で文字認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷文書のデータベー
ス化や文書の再利用のために、スキャナ等の光学的手段
を用いて文書画像を取り込んだ上、取り込んだ画像デー
タから文字,図形,表等の属性毎に領域を抽出して、各
属性に応じた認識処理を行う文字認識装置に関するもの
である。
【0002】
【従来の技術】従来の文字認識装置は、スキャナにより
取り込んだ二値データの黒画素の連結状態を調べ、黒画
素が連結しているかたまりに外接する矩形(以下「外接
矩形」という)の座標を検出して、メモリに格納した
上、予め定められた閾値以下の大きさの外接矩形を文字
候補として抽出して、この文字候補の矩形(以下「文字
候補矩形」という)を統合することにより、行を抽出す
る。そして、基準となる文字候補矩形(以下「基準矩
形」という)に対して、上下左右の4方向で最も近い文
字候補矩形(以下「最短距離矩形」という)を検出した
上、図9のように文字領域の間隔が狭い文書に対して、
図10のような文字領域間にまたがった行統合を防ぐた
め、基準矩形と検出された文字候補矩形との距離が基準
矩形の矩形サイズの半分未満であれば、2つの矩形は同
一文字領域内に存在するとみなして、矩形の統合を行
う。このとき、基準矩形と検出された最短距離矩形が上
下に位置していれば縦組み文字列、左右に位置していれ
ば横組み文字列と決定する。そこで、検出された行情報
から領域の抽出を行って、同一方向に隣り合う行の幅が
等しく行間の距離が閾値以下であれば、2つの行は同一
領域内にあるとして領域の統合を行った後、抽出した文
字領域について、文字の切り出し及び認識処理を行う。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
方式では、矩形統合の有効距離を基準矩形の矩形サイズ
の半分未満としているため、図3のように文字間隔が文
字サイズの半分以上あるような文書では領域が複数に分
かれてしまうといった課題を有していた。
【0004】本発明は、このような課題に鑑みてなされ
たもので、文字間隔が広い文書でも正確に領域抽出でき
る文字認識装置を提供することを目的としている。
【0005】
【課題を解決するための手段】本発明は、文字統合処理
を軽減するために、スキャナより取り込んだ画像データ
を縮小する手段と、縮小データに対して外接矩形を検出
して、外接矩形の大きさが予め定められた閾値以下の矩
形を文字候補矩形として識別する手段と、識別した全文
字候補矩形の最頻サイズを認識対象文書の基準文字サイ
ズとする手段と、各文字候補矩形に対して左右に隣接す
る矩形を検出して、矩形間の距離を算出した上、最も出
現回数の多い距離を認識対象文書の水平方向の矩形間距
離として、出現回数と距離とを記憶させる手段と、各文
字候補矩形に対して上下に隣接する矩形を検出して、矩
形間の距離を算出した上、最も出現回数の多い距離を認
識対象文書の垂直方向の矩形間距離として、出現回数と
距離とを記憶させる手段と、検出した水平方向の矩形間
距離及び垂直方向の矩形間距離とそれらの出現回数か
ら、文字組み方向,文字間,行間を検出する手段と、
(文字間<行間<領域間)の条件を用いて、文字候補矩形
の統合有効距離を行間として矩形の統合処理を行って、
行を抽出する手段と、抽出された行を基に文字領域を抽
出して、それぞれの文字領域について文字の切り出し及
び認識を行う手段とからなるものである。
【0006】
【作用】本発明によれば、矩形を統合する有効距離を行
間とすることにより、文字間隔が広い文書でも領域抽出
を正確に行うことができる。
【0007】又、行統合処理を水平方向と垂直方向とで
それぞれ個別に行うことによって、縦組みと、横組みと
の混在文書にも対応できる。
【0008】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。図1は本発明の一実施例における
領域分割を実行する装置の構成を示したもので、1は領
域抽出を行う中央処理装置(以下「CPU」という)で、
このCPU1は、図2に示すように、画像データ取込部
7,画像データ縮小部8,外接矩形抽出部9,文字矩形
識別部10,文字間・行間検出部11,行統合部12,文字領
域統合部13,文字認識部14からなる。2は文字認識プロ
グラムを格納したリードオンリーメモリ(以下「RO
M」という)、3はスキャナ4で読み取った画像データ
及び認識プログラムのデータを格納するランダムアクセ
スメモリ(以下「RAM」という)、5は外部からCPU
1に対して指令を与えるためのキーボード、6はCPU
1が認識した認識結果を表示するCRTである。
【0009】以下、図3及び図4のフローチャートと図
5の画像データ例とを基に文字領域抽出処理について説
明する。
【0010】画像データ取込部7は、認識対象文書をス
キャナ4により2値画像データとして取り込んだ上〔ス
テップ1(以下各ステップを「S1」の如く表す)〕、そ
の取り込んだ二値画像データの文字領域抽出処理を画像
データ縮小部8において高速で行うために、例えば解像
度100DPI程度にOR縮小してRAM3に格納する(S
2)。
【0011】外接矩形抽出部9は、縮小された画像デー
タから黒画像が連結している箇所を検出して、連結して
いる黒画像の外接矩形を抽出した上、全ての外接矩形の
座標情報をRAM3に格納する(S3)。例えば、図5に
示した画像データは、図6に示したK1〜K8の8個の
外接矩形として抽出される。この外接矩形の座標系は左
上が原点で、水平方向の座標をxで、垂直方向の座標を
yで表し、又、外接矩形は左上の座標(x1,y1)と右
下の座標(x2,y2)とで表す。
【0012】文字矩形識別部10は外接矩形の大きさ,黒
画素の数及び黒画素の密度に基づいて文字か文字以外か
に識別して、文字候補の矩形を抽出する(S4)。この場
合、文字以外の属性矩形として識別するのは、次の5つ
の条件の内のいずれか1つを満たせばよい。即ち、 1) 外接矩形の黒画素数が閾値のとき 2) 矩形の縦横比が閾値FD_RATIO以上のとき 3) 外接矩形の短辺が閾値CHAR_MAX以上のとき 4) 外接矩形の長辺が閾値CHAR_MAX以上で、外
接矩形の黒画素密度が閾値PER_DIAG_MIN以
下のとき 5) 外接矩形の長辺が閾値CHAR_MAX以上で、外
接矩形の黒画素密度が閾値PER_DIAG_MAX以
上のとき 又、この条件に当てはまらなかったものは文字候補矩形
として識別される。例えば、図6のK1〜K8の矩形は
すべて文字候補矩形として識別される。
【0013】文字間・行間検出部11は、文字候補矩形を
基に、S5〜S12の処理を行う。
【0014】先ず、文字矩形識別部10で抽出した文字候
補矩形から各文字候補矩形の幅と高さを求めた上、その
中で出現回数が最も多いものを認識対象文書の基準文字
サイズとする(S5)。ただし、文字候補矩形の文字サイ
ズが閾値POINT_06に満たない場合には、基準文
字サイズをPOINT_06にし、又、出現回数が同数
の文字サイズが複数ある場合には、その中の最大サイズ
にする。例えば、図6の文字候補矩形の文字サイズが
5,8,9で、その出現回数はいずれも4回であるの
で、基準文字サイズは最も大きい数の9とする。
【0015】次に、水平方向の矩形間の最頻距離を検出
する。各文字候補矩形に対して隣接する矩形を検出し
て、その距離を求め、矩形間の距離の出現回数が最も多
かったものを認識対象文書の水平方向の矩形間距離とし
て、その出現回数をRAM3のhCountに、その距
離をRAM3のhDisにそれぞれ記憶させる(S5)。
例えば、図6の外接矩形の水平矩形間の距離hDisは
5で、その出現回数hCountは3である。
【0016】同様にして、垂直方向の矩形間の最頻距離
を検出して、垂直矩形間の距離をRAM3のvDis
に、その出現回数をRAM3のvCountに記憶させ
る(S5)。例えば、図6の外接矩形の垂直矩形間の距離
vDisは8で、その出現回数vCountは4であ
る。
【0017】このようにして検出した水平及び垂直矩形
間の距離と出現回数とから文字間・行間の決定を行う
(S6)。水平方向の矩形間距離の出現回数hCount
と垂直方向の矩形間距離の出現回数vCountとに差
がある場合はS7の処理を行い、差がない場合はS10の
処理を行う。このとき、hCountとvCountと
の差については、 |hCount−vCount|÷(hCount+vCount)×100 > 閾値CT_DIFF の条件を満たせば差があると判定する。例えば、図6で
は計算結果が14%で、閾値CT_DIFFより小さいの
で、出現個数には差がないと判定して、S10の処理を行
う。
【0018】又、出現回数に差があった場合には、水平
方向の矩形間距離の出現回数hCountと垂直方向の
矩形間距離の出現回数vCountとを比較して(S
7)、vCountが多ければ認識対象文書は縦組み文
書であると判定して、RAM3の矩形マージ方向フラグ
dirFlagに垂直方向情報を、文字ピッチchPi
tchに垂直方向の矩形間の距離vDisを、行間ピッ
チlnPitchに水平方向の矩形間の距離hDisを
それぞれセットする(S8)。hCountが多ければ認
識対象文書は横組み文書であると判定して、矩形マージ
方向フラグdirFlagに水平方向情報を、文字ピッ
チchPitchに水平方向の矩形間の距離hDis
を、行間ピッチlnPitchに垂直方向の矩形間の距
離vDisをそれぞれセットする(S9)。
【0019】又、出現回数に差がなかった場合には、水
平方向の矩形間距離hDisと垂直方向の矩形間距離v
Disを比較して(S10)、vDisがhDisよりも短
ければ、認識対象文書は縦組み文書と判定して、矩形マ
ージ方向フラグdirFlagに垂直方向情報を、文字
ピッチchPitchに垂直方向の矩形間の距離vDi
sを、行間ピッチlnPitchに水平方向の矩形間の
距離hDisをそれぞれセットする(S11)。そして、h
DisがvDisよりも短ければ、横組み文書と判定し
て、矩形マージ方向フラグdirFlagに水平方向情
報を、文字ピッチchPitchに水平方向の矩形間の
距離hDisを、行間ピッチlnPitchに垂直方向
の矩形間の距離vDisをそれぞれセットする(S12)。
【0020】例えば、図6では出現回数に差がなく、h
Disが5で、vDisの8よりも距離が短いので、S
12の処理を行って、dirFlag=水平方向,chP
itch=5,ln_Pitch=8がセットされる。
【0021】行統合部12は、このようにして検出した文
字間・行間から行統合を行い(S13)、矩形マージ方向フ
ラグdirFlagが垂直の場合は、垂直方向の矩形統
合(S14)、水平方向の矩形統合(S15)の順序で、dir
Flagが水平の場合は、水平方向の矩形統合(S16)、
垂直方向の矩形統合(S17)の順序で矩形の統合を行っ
て、行を抽出する。このとき、(文字間<行間<領域間)
の条件から、行統合の有効距離を文字間・行間検出部11
で検出した行間とする。例えば、図6では、dirFl
agが水平方向となっているので、水平方向の矩形統合
処理を行った後、垂直方向の矩形統合処理を行う。その
際の行統合の有効距離はlnPitch=8となり、矩
形統合の結果は図5のようになる。ここで、水平方向の
矩形の統合と垂直方向の矩形の統合をそれぞれ行うの
は、縦横混在文書に対応するためである。
【0022】文字領域統合部13は、行統合結果から文字
領域の抽出を行う(S18)。例えば、図7の行情報から抽
出した文字領域は図8のようになる。
【0023】そして、最後に抽出された文字領域に対し
て、文字認識処理を行う(S19)。
【0024】尚、本実施例では、 NOISE_MIN ≦ 2 FD_RATIO ≦ 30 CHAR_MAX ≦ 100 PER_DIAG_MIN ≦ 15 PER_DIAG_MAX ≦ 80 POINT_06 ≦ 8 CT_FIFF ≦ 20 の値とした。
【0025】
【発明の効果】以上説明したように、本発明によれば、
矩形を統合する有効距離を行間とすることにより、文字
間隔が広い文書でも正確に領域抽出することができると
いう効果を奏する。
【0026】又、行統合処理を水平方向と垂直方向とで
それぞれ個別に行うことによって、縦組みと横組みとの
混在文書にも対応できるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例における領域分割を実行する
装置のブロック図である。
【図2】本発明の一実施例のブロック図である。
【図3】本発明の一実施例のフローチャートである。
【図4】図3のフローチャートの続きである。
【図5】本発明の一実施例の説明に使用する画像データ
の一例である。
【図6】本発明の一実施例において図5の画像データの
外接矩形の抽出結果を示すものである。
【図7】本発明の一実施例において図6の外接矩形から
の行の抽出結果を示すものである。
【図8】本発明の一実施例において図7の行からの領域
の抽出結果を示すものである。
【図9】文字の領域の間隔が狭い画像データの例を示す
ものである。
【図10】図9の画像データの外接矩形の抽出結果を示
すものである。
【符号の説明】
1…中央処理装置(CPU)、 2…リードオンリーメモ
リ(ROM)、 3…ランダムアクセスメモリ(RAM)、
4…スキャナ、 5…キーボード、 6…CRT、
7…画像データ取込部、 8…画像データ縮小部、 9
…外接矩形抽出部、 10…文字矩形識別部、 11…文字
間・行間検出部、 12…行統合部、 13…文字領域統合
部、 14…文字認識部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 二値化された文字認識対象文書の画像デ
    ータを縮小する手段と、 黒画素が連結している箇所を検出して、連結している前
    記黒画素の外接矩形の情報をメモリに格納する手段と、 前記外接矩形の大きさ,前記外接矩形の縦横比及び黒画
    素密度から文字候補矩形を識別する手段と、 前記文字候補矩形の水平方向の矩形間隔及び垂直方向の
    矩形間隔を検出して、文字間及び行間を検出する手段
    と、 前記行間を基に前記文字候補矩形を統合して、行を抽出
    する手段と、 前記行を統合して文字領域を抽出する手段とを具備した
    ことを特徴とする文字認識装置。
JP4337330A 1992-12-17 1992-12-17 文字認識装置 Pending JPH06187489A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4337330A JPH06187489A (ja) 1992-12-17 1992-12-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4337330A JPH06187489A (ja) 1992-12-17 1992-12-17 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06187489A true JPH06187489A (ja) 1994-07-08

Family

ID=18307614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4337330A Pending JPH06187489A (ja) 1992-12-17 1992-12-17 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06187489A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063776A (ja) * 1996-08-16 1998-03-06 Fujitsu Ltd 文字列方向推定方法および装置
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
JP2019515374A (ja) * 2016-08-31 2019-06-06 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 画像内の文字領域を認識するための方法及び装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063776A (ja) * 1996-08-16 1998-03-06 Fujitsu Ltd 文字列方向推定方法および装置
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
JP2019515374A (ja) * 2016-08-31 2019-06-06 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 画像内の文字領域を認識するための方法及び装置
US10803338B2 (en) 2016-08-31 2020-10-13 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for recognizing the character area in a image

Similar Documents

Publication Publication Date Title
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JP3411472B2 (ja) パターン抽出装置
JPH06187489A (ja) 文字認識装置
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JP2845370B2 (ja) 文字認識方法
JP2868134B2 (ja) 画像処理方法及び装置
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
CN1983302A (zh) 行方向判定程序、方法以及装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH07160810A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JPH06180771A (ja) 英文字認識装置
JPH02116987A (ja) 文字認識装置
JP3095470B2 (ja) 文字認識装置
JP3437296B2 (ja) 文字列高速抽出装置
JP7043667B1 (ja) 情報処理装置、プログラム、及び情報処理方法
JPH07168911A (ja) 文書認識装置
JPH0628520A (ja) 文字認識装置
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JPH0589244A (ja) パターンマツチング方法及び装置
JPH0721309A (ja) 文書認識装置
JPH0449148B2 (ja)
JPH05274472A (ja) 画像認識装置
JP2978801B2 (ja) 手書き文字認識の文字入力方式