JPH0276084A

JPH0276084A - 高速文字図形分離装置

Info

Publication number: JPH0276084A
Application number: JP63227478A
Authority: JP
Inventors: Yukio Hayashi; 幸雄林
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1988-09-13
Filing date: 1988-09-13
Publication date: 1990-03-15
Anticipated expiration: 2013-09-21
Also published as: JP2800192B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は認識のためにあらかじめ人間がマーク付は等を
行っていない一般の文書を対象とした文書画像認識にお
いて、文字と図形が混在する文書から、文字領域と図形
領域を高速に・分離する高速文字図形分離装置に関する
ものである。

（従来技術）従来、文字図形混在文書から文字と図形を分離する手法
として、文字と図形の大きさの違いに着目したり、複雑
さの違いに着目する手法がある。

その−例としては、連結画素の外接矩形をとり、この矩
形の周辺長で文字と図形を識別するようにしたものがあ
る。しかし外接矩形゛をとるために連結画素を追跡した
のち連結画素の座標の最大、最小値等を求める処理等が
必要になり、画素数が増加すると処理時間が大きくなる
という問題があった。

（発明が解決しようとする課題）本発明は文字図形混在一般文書から、文字領域と図形領
域を、マスク処理によって高速にしかも画素数が増加し
ても処理時間が大きくなることなく、文字と図形を分離
する装置を提供することを目的とするものである。

（課題を解決するための手段）第１の発明本発明の第１の態様は、画像をデジタル化して入力する
入力手段（第１図１）と、画像を記憶するイメージメモ
リ（同図２）と、文字の周囲の一定の空白部を検出する
矩形枠（回）の形のマスクを有し、この空白部検出マス
クによって原画像の全面を１ドツトずつずらしながら走
査し、空白部検出マスクに適合する空白部を検出したと
き、空白部検出マスクに囲まれた領域内の画素群を抽出
する文字領域抽出手段と（同図３）、原画像から前記文
字領域抽出手段によって抽出した文字領域を取り除いて
図形領域を抽出する図形領域抽出手段（同図４）とを備
えた高速文字図形分離装置である。

第２の発明本発明の第２の態様は、画像をデジタル化して入力する
入力手段（第４図１１）と、画像を記憶するイメージメ
モリ（同図１２）と、原画像を左または右の一方向へ１
ドツトシフトし、原画像とそのシフトした画像との論理
積演算を行ない、その演算結果の画像をさらに前記方向
へ１ドツトシフトし、原画像とそのシフトした画像との
論理積演算を行なうというシフト動作と論理積演算を所
定の回数繰り返して、横方向に所定の画素数連続した空
白部を検出すると共に、原画像をよまたは下の一方向へ
１ドツトシフトし、原画像とそのシフトした画像との論
理積演算を行ない、その演算結果の画像をさらに前記方
向へ１ドツトシフトし、原画像とそのシフトした画像と
の論理積演算を行なうというシフト動作と論理積演算を
所定の回数繰り返ルで、縦方向に所定の画素数連続した
空白部を検出し、文字の周囲の一定の空白部を求める空
白部検出手段（同図１３）と、空白部検出手段の出力に
基づき文字領域を表わす文字マスクを生成する文字マス
ク生成手段（同図１４）と、前記文字マスクと原画像と
の論理積演算を行ない文字領域を抽出する文字領域抽出
手段（同図１５）と、原画像から前記文字領域抽出手段
によって抽出した文字領域を取り除いて図形領域を抽出
する図形領域抽出手段（同図１６）とを備えた高速文字
図形分離装置である。

（作用）本発明（第１の発明）の高速文字図形分離装置において
、文字領域抽出手段は、文字の周囲の一定の空白部を検
出する矩形枠の形をした空白部検出マスクによって原画
像の全面を１ドツトずつシフトながら走査する。走査の
結果空白部検出マスクに適合する空白部を検出したとき
、空白部検出マスクに囲まれた領域内の画素群を抽出す
る。原画像から前記文字領域抽出手段によって抽出した
文字領域を取り除いて図形領域を抽出する。

以上のように、本発明はマスクにより原画像の全面を走
査して文字を抽出するので、原画像の任意の位置に存在
する、マスクの大きさに合った文字を洩れな（抽出し文
字画像を得ることができる。

また、本発明においては、原画像から前記文字像を取り
除き図形領域を抽出するので、任意の角度の線分を含む
図形を抽出することができる。

本発明（第２の発明）の高速文字図形分離装置は、第１
の発明のマスク処理による文字領域抽出手段の文字図形
分離処理をシフト付き論理演算により行なうよう構成し
て、−層の高速化を計ったものである。その空白部検出
手段は第１の発明の矩形枠の形をした空白部検出マスク
の機能をシフト付き論理演算により行なう。即ち、原画
像を左または右の一方向へ１ドツトシフトし、原画像と
そのシ・フトした画像との論理積演算を行ない、その演
算結果の画像をさらに前記方向へ１ドツトシフトし、原
画像とそのシフトした画像との論理積演算を行なうとい
うシフト動作と論理積演算を所定の回数繰り返して、横
方向に所定の画素数連続した空白部を検出する。また、
原画像を上または下の一方向へ１ドツトシフトし、原画
像とそのシフトした画像との論理積演算を行ない、その
演算結果の画像をさらに前記方向へ１ドツトシフトし、
原画像とそのシフトした画像との論理積演算を行なうと
いうシフト動作と論理積演算を所定の回数繰り返して、
縦方向に所定の画素数連続した空白部を検出する。文字
マスク生成手段は、空白部検出手段の出力に基づき文字
領域を抽出するための文字マスクを生成する。文字領域
抽出手段は前記文字マスクと原画像との論理積演算を行
ない文字領域を抽出する。図形領域抽出手段は原画像か
ら前記文字領域抽出手段によって抽出した文字領域を取
り除いて図形領域を抽出する。

第２の態様の発明によれば、シフト付論理演算で文字図
形分離処理が可能なため、その処理のためのハード構成
が簡単となると共に、第１の態様の発明のマスクを走査
することに相当する処理が、文書−面を処理の単位とし
て一括して即ち並列的に処理できるので、処理速度が一
層高速になる。

（実施例）第１図は本発明の第１の態様に対応する実施例を示すも
ので、画像入力部１、イメージメモリ２、文字領域抽出
部３、図形領域抽出部４からなっている。画像入力部１
は文字図形混在一般文書をイメージスキャナ等により入
力し、デジタルデータ（２値データ）に変換するもので
ある。イメージメモリ２は画像入力部１の出力するデジ
タルデータ（原画像）を記憶するものである。文字領域
抽出部３は、第２図（ａ）に示すような矩形枠の形をし
たマスクａ（斜線部分）に黒画素がなければ、マスクｂ
の内部に相当する部分を文字領域として識別し、マスク
ｂ内の文字画像を抽出するものである。図形領域抽出部
４はイメージメモリのマスクｂ内の位置を消去する処理
を行ない図形画像を得るものである。

以上のように構成された本実施例の文字と図形を分離す
る動作の概要は次のとおりである。

５ｔｏｐＯ（初期化）：矩形枠の形をしたマスクａを原
画像の左上端にあわせ、処理結果を格納するメモリを初
期化（０）する。

５ｔａｐｌ　（白枠白黒画素検出）：第２図（ａ）の矩
形枠状のマスク（斜線部分）内に黒画素が存在するか調
べる。黒画素があればマスクｂ（マスクａの内部の領域
）内を白（０）に、そうでなければ黒（１）にする。

５ｔｏｐ２（文字領域検出）：原画像と上記マスクｂで
ＡＮＤをとり結果を結果格納用イメージメモリに保存す
る。

５ｔｏｐ３（再帰手続）：マスクａを１ｄａｔ右にシフ
トし５ｔｅｐｌに戻る。但し、右端に来たら、ｌ　ｄ　
ｏ　を下の左端にシフトさせ同様に行う。

右下端に来たら５ｔｅｐ４を実行する。即ち、マスク処
理を第３図に示すように１ｄｏｔずつシフトしながら原
画像−面に走査して行う。

５ｔｅｌ）４（図形領域抽出）：原画像から５ｔｏｐ２
で得られた文字画像を取り除き図形領域画像を得る。（
終了）マスク処理を施した例を第２図（ｃ）（ｄ）に示す。マ
スクの大きさは標準の文字サイズの例としてはマスクｂ
を文字サイズ（２４Ｘ２４ｄａｔ）に設定し、マスクａ
をマスクｂを囲む大きさ（２８Ｘ２８ｄａ　ｔ）とする
ことかできる。文字サイズの違う見出し文字、半月文字
等を抽出するためには、標準文字サイズとサイズの違う
マスクを用いて同様に文字図形分離処理を行う。

本実施例においては、マスクにより原画像の全面を走査
して文字を抽出するので、原画像の任意の位置に存在す
る、マスクの大きさに合った文字を洩れなく抽出し文字
画像を得ることができる。

また、本実施例においては、原画像から前記文字画像を
取り除き図形領域を抽出するので、任意の角度の線分を
含む図形を抽出できることができる。

また、文字図形の分離処理は、画像の内容にかかわらず
、マスクを画面−面に走査するだけの単純な処理であり
、高速化を計ることができ、しかも文字数が増えても、
処理時間がそれに応じて大きくならない利点がある。

第２の実施例第４図は本発明の第２の実施例を示すもので、画像入力
部１１、イメージメモリ１２、白枠白黒画素検出部１３
、文字マスク作成部１４、文字領域抽出部１５、図形領
域抽出部１６からなっている。

画像入力部１１は人力された文字図形混存一般文書を、
読み取りこれを２値のデジタルデータに変換する。変換
されたデジタルデータ（原画像）はイメージメモリ１２
に記憶される。

白枠白黒画素検出部１３、文字マスク作成部１４、文字
領域抽出部１５、図形領域抽出部１６の機能はシフト付
論理演算により行なわれる。

第５図はその動作（アルゴリズム）の説明のための図で
ある。第１の実施例のマスクの大きさに相当するシフト
距離は２５ｄａｔ（文字サイズ＋１）とした。

５ｔｅｌ）Ｏ（初期化）：原画像を白黒反転し、これを
画像Ａとする。

５ｔｅｌ）１　：画像Ａと画像Ａを右へ１ｄａｔシフト
した画像のＡＮＤをとり、これを画像Ｂとする。

５ｔｅｐ２：ｉ＝２〜２５まで以下の手順（Ｓｔｅｐ２
）をくり返す。

画像Ａと画像Ｂを１ｄｏｔ右ヘシフトした画像のＡＮＤ
をとり、これを新たに画像Ｂとする。このくり返しで得
られた結果を画像Ｃとする。

Ｓｔ’ｅｐ３：画像Ｃと画像Ｃを下へ２５ｄａｔシフト
した画像のＡＮＤをとり、これを画像Ｄセする。

５ｔｅｐ４：５ｔｅｐｌ、２と同様の手順を下へのシフ
トのＡＮＤ演算で行う。この結果を画像Ｅとする。

５ｔｅｐ５：画像Ｅと画像Ｅを２５ｄｏｔ右ヘシフトし
た画像のＡＮＤをとり、これを画像Ｆとする。

５ｔａｐ６：画像りと画像ＦのＡＮＤをとり、これを画
像Ｇとする。

５ｔｏｐ７（文字マスク作成）：画像Ｇを上に順々に２
５ｄａｔまでシフトしながらそれ自身と０Ｒをとり、こ
れを画像Ｈとする。さらに画像Ｈを左へ順々に２５ｄａ
　ｔまでシフトしながらＯＲをとり文字マスク作成処理
を施す。これを画像Ｉとする。

５ｔｏｐ８（文字領域抽出）：原画像と画像ＩのＡＮＤ
をとり文字画像Ｊを得る。

５ｔｅｐ９（図形領域抽出）：原画像から文字画像Ｊを
取り除き、図形領域画像Ｋを得る。（終了）前記アルゴリズムにおいて、５ｔｏｐ２．３は第１実施
例のマスクａ上部および下部の白枠内黒画素検出に相当
し、５ｔｅｐｉ　５はマスクａの左右部の白枠内黒画素
検出に相当する。５ｔｅｌ）６の白枠内黒画素検出の結
果は、原画像内の任意の位置の２４Ｘ２４ｄａｔのサイ
ズ内にサイズ外にはみ出さずに文字が含まれれば、画像
Ｇの前記位置のサイズ内右下画素が黒に、そうでなけれ
ば（図形又は文字が２４Ｘ２Ａｄｏｔサイズ外にはみ出
していれば）前記右下画素が白になる。

画像ＧをシフトとＯＲ演算により文字マスクを作成する
手順は第６図の下部に示されている。大域的には第７図
の様になる。

文字サイズの違う見出し文字、半角文字等を抽出できる
ようにするため、標準文字サイズとサイズの違うマスク
に相当するシフト距離を用いて同様に分離処理を行う。

この処理も同様にハードで高速に処理することが出来る
とともに並列処理も可能となる。

なお、画像Ｇから画像■を構成するとき、１ｄＯｔずつ
シフトしＯＲ演算を施すことを２５回行ったが、１ｄｏ
ｔの黒画素が２８Ｘ２８ｄａｔの黒画素になれば良いの
で、以下の様な方法をとってもよい。前記２５回のシフ
トを、１．２，３゜４．８，９ｄｏｔ　（２ｎｄｏｔ）
のシフトとＯＲ演算で５回の処理で行うことによって実
現可能である。左方向上方向ともにこれを行えば５０（
２５＋２°５）回の処理が１０（５＋５）回の処理で行
なうことができる。

本実施例によれば、シフト付論理演算で分離処理が可能
なため、処理が簡単となり、ノ＼−ド構成が簡単となる
。

また、第１の実施例のマスクを走査することに相当する
処理が、文書−面を処理の単位として一括して処理出来
るので、第１の実施例よりもさらに高速処理ができる。

（発明の効果）本発明によれば、マスクにより原画像の全面を走査し°
て文字を抽出するので、原画像の任意の位置に存在する
、マスクの大きさに合った文字を洩れな（抽出し文字画
像を得ることができる。

また、本発明によれば、原画像から前記文字画像を取り
除き図形領域を抽出するので、任意の角度の線分を含む
図形を抽出できることができる。

また、本発明によれば、文字図形の分離処理は、画像の
内容にかかわらず、マスクを画面−面に走査するだけの
単純な処理であり、高速化を計ることができ、しかも文
字数が増えても、処理時間がそれに応じて大きくならな
い利点がある。

また、本発明によれば、マスクにより原画像の全面を走
査する代りに、シフト付論理演算でその機能を実現し、
文字図形分離処理を行なう態様においては、文書−面を
処理の単位として一括して即ち並列的に処理できるので
、処理速度が一層高速になると共に、その処理のための
ハード構成が簡単となる。

【図面の簡単な説明】

第１図はマスク処理を用いた本発明の第１の実施例の概
略の構成を示す図である。第２図は第１の実施例の動作を説明するための図で、（
ａ）は白枠白黒画素検出マスク、（ｂ）は内部領域マス
ク、（Ｃ）は図形領域にマスク処理した例、（ｄ）は文
字領域にマスク処理した例をそれぞれ示すものである。第３図は文書−面にマスク処理を施す様子を示す図で゛
ある。第４図は本発明のシフト付き論理を用いる第２の実施例
の概略の構成を示す図である。第５図（ａ）は原画、（ｂ）は原画から抽出した図形領
域、（Ｃ）は原画から抽出した文字領域の例を示す図で
ある。第６図は第２の実施例のシフト付論理演算によるアルゴ
リズムを説明した図である。第７ｒＩ！Ｊは原画とマスクにより文字領域を抽出する
様子を説明する図である。１．１１・・・画像入力部、２．１２・・・イメージメ
モリ、１３・・・空白部検出部（白枠白黒画素検出部）
、１４・・・文字マスク作成部、３．１５・・・文字領
域抽出部、４．１６・・・図形領域抽出部。第１図第２図第４図シフト付３輪５を漢簀で１覚第５図（ａ）（ｂ）　　　　　　　　　　　　（ｃ）第６図第７藁像Ｉ

Claims

【特許請求の範囲】

（１）画像をデジタル化して入力する入力手段と、画像を記憶するイメージメモリと、文字の周囲の一定の空白部を検出する矩形枠状のマスク
を有し、この空白部検出マスクによって原画像の全面を
１ドットずつずらしながら走査し、空白部を検出したと
き、空白部検出マスクに囲まれた領域内の画素群を抽出
する文字領域抽出手段と、原画像から前記文字領域抽出手段によって抽出した文字
領域を取り除いて図形領域を抽出する図形領域抽出手段
とを備えたことを特徴とする高速文字図形分離装置。
（２）画像をデジタル化して入力する入力手段と、画像を記憶するイメージメモリと、原画像を左または右の一方向へ１ドットシフトし、原画
像とそのシフトした画像との論理積演算を行ない、その
演算結果の画像をさらに前記方向へ１ドットシフトし、
原画像とそのシフトした画像との論理積演算を行なうと
いうシフト動作と論理積演算を所定の回数繰り返して、
横方向に所定の画素数連続した空白部を検出すると共に
、原画像を上または下の一方向へ１ドットシフトし、原
画像とそのシフトした画像との論理積演算を行ない、そ
の演算結果の画像をさらに前記方向へ１ドットシフトし
、原画像とそのシフトした画像との論理積演算を行なう
というシフト動作と論理積演算を所定の回数繰り返して
、縦方向に所定の画素数連続した空白部を検出し、文字
の周囲の一定の空白部を求める空白部検出手段と、空白部検出手段の出力に基づき文字領域を表わす文字マ
スクを生成する文字マスク生成手段と、前記文字マスク
と原画像との論理積演算を行ない文字領域を抽出する文
字領域抽出手段と、原画像から前記文字領域抽出手段に
よって抽出した文字領域を取り除いて図形領域を抽出す
る図形領域抽出手段とを備えたことを特徴とする高速文字図形分離装置。