JPH0656618B2 - 画像情報の文字・図形分離方法 - Google Patents

画像情報の文字・図形分離方法

Info

Publication number
JPH0656618B2
JPH0656618B2 JP61113542A JP11354286A JPH0656618B2 JP H0656618 B2 JPH0656618 B2 JP H0656618B2 JP 61113542 A JP61113542 A JP 61113542A JP 11354286 A JP11354286 A JP 11354286A JP H0656618 B2 JPH0656618 B2 JP H0656618B2
Authority
JP
Japan
Prior art keywords
area
character
graphic
image information
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61113542A
Other languages
English (en)
Other versions
JPS62271080A (ja
Inventor
満 山田
昌彦 藤長
俊明 遠藤
和夫 蓮池
Original Assignee
国際電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国際電信電話株式会社 filed Critical 国際電信電話株式会社
Priority to JP61113542A priority Critical patent/JPH0656618B2/ja
Publication of JPS62271080A publication Critical patent/JPS62271080A/ja
Publication of JPH0656618B2 publication Critical patent/JPH0656618B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimiles In General (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字・図形の混在する文書を交換するミクスト
モード通信に係り、特に画像情報中の文字・図形の分離
を自動的に行う画像情報の文字・図形分離方法に関する
ものである。
(従来の技術) 文字・図形が混在する文書を伝送する手段としては、文
書の冒頭から逐一白黒画素を判別しながら送信するファ
クシミリ通信が通常用いられている。しかし、このファ
クシミリ通信は文字及び図形に関係なく画素単位で処理
するため伝送効率が極めて悪いという問題があった。
このファクシミリ通信を改善した通信方法として、近年
文字と図形とを分離し、文字についてはキャラクタコー
ドにより符号化し、図形は従来の画素単位で符号化する
ミクストモード通信が注目を浴びている。このミクスト
モード通信は分離された文字領域をキャラクタコードで
符号化するため、従来の画素単位の符号化に比べて伝送
効率が大幅に改善させるとともに、受信側で文字の変更
あるいは文字の位置を変更する文書編集も可能であると
いう特徴を有している。
第1図は文字と図形とが混在する文書を示したもので、
この文書が従来のミクストモード通信を用いた場合どの
ように文字と図形とが分離されるかを説明する。
(1)文字・図形を含む白黒2値の文書画像は例えばラン
レンブス平滑化アルゴリズムにより「行」方向(x方
向)を走査し、互いに隣り合う白画素のランレングスが
予め定めた閾値C以下のときには、これらの白画素を黒
画素に変換するとともに黒画素はそのまま黒画素として
識別する。
(2)同様に「列」方向(y方向)についても行う。
(3)行方向と列方向との結果について黒画素の“AN
D”をとり黒領域を決定する。
(4)更に、黒領域である各閉領域の大きさを予め定めた
基準により判定を行い、各閉領域の大きさが予め定めた
判別基準に従って文字領域(領域A)と、図形領域(領
域B)とを判別することにより文字と図形領域とを分離
する。
分離された文字領域と図形領域はそれぞれ適した符号化
により伝送する。
(発明が解決しようとする問題点) しかし、従来の文字・図形分離方式は平面的に文字領域
と図形領域とに分離するだけであり、階層的な構造を行
っておらず、第1図の図形領域(領域B)にはまだ文字
が含まれていても領域Bの文字を識別することが困難で
あった。
特に、図形が“表”のような大部分が文字から構成され
ている場合に、従来の文字・図形分離方式では“表”全
体を図形領域として判定し、画素単位(ドット)で処理
する。従って、文字領域のキャラクタコードによる符号
化に比べて、伝送効率の悪い画素単位による符号化を多
く用いなければならず伝送効率の低下、さらに画素単位
で表示される文字の文書編集が不可能であるという欠点
があった。
従って、文字と図形とが混在する文書において、出来る
だけ文字領域と図形領域とを効率良く、かつ正確に分離
する方式が強く望まれていたが、今まで何ら開示されて
いなかった。
(問題点を解決するための手段) 本発明は上述した従来技術の欠点に鑑みなされたもの
で、文字と図形とが混在する文書において、文字領域と
図形領域とを効率良く、かつ正確に分離できうる画像情
報の文字・図形分離方法を提供することを目的とする。
本発明の特徴は、文字・図形の混在文書を白黒2値画像
に変換されている入力画像情報を、画像中の黒領域の境
界追跡により閉領域を抽出し、各抽出された閉領域の包
含関係を解析(以下、「トポロジー解析」と称す)し
て、これを階層的な木構造(以下、「トポロジカル構
造」と称す)で記述したのち、トポロジカル構造を通信
方式に適合するように文字と図形が分離されたドキュメ
ント構造に変換することにある。
以下に図面を用いて本発明を詳細に説明する。
(発明の構成及び作用) 第2図は本発明による文字・図形の階層的分離方式の手
順を示すブロック図であり、文字と図形とが混在する文
書1は、スキャナーなどにより白黒2値画像情報となる
ように白黒2値変換され、次いで黒領域の境界追跡によ
り閉領域を抽出し、抽出された閉領域の内部構造を解析
するトポロジー解析2が施されて、各閉領域の階層的な
関係を記述したトポロジカル構造4を作成する。更に、
トポロジカル構造4を文字と図形とに分離して符号化し
やすいように構造変更5して、最終的なドキュメント構
造を作成することにより、文字と図形とが完全に分離す
る。
以下に本発明の特徴であるトポロジー解析3及びトポロ
ジカル構造4の手順を中心に、第1図の入力画像を例に
とり詳細に説明する。
(1)トポロジー解析 トポロジー解析3の手順は次のとおりである。
1)ラスタースキャンにより始点となる黒画素を発見
し、その点により8連結の境界追跡を行い閉領域を抽出
する。この時各境界座標を記憶しておく。
2)抽出された閉領域のメディア(文字・図形)解析を
行う。第3図は、文字・図形の判別基準(欧文文書の場
合)を示したものである。抽出閉領域に外接する四角形
の大きさにより、図中の斜線部に該当する場合には文
字、その他の場合には図形と判別される。本判別基準で
は横方向の文字の接触も考慮してあり、図の閾値はそれ
ぞれ、W:対象文字の最大幅、h:対象文字の最大
高、h:対象文字の最小高を示している。
3)文字と判別された時には、文字ノードに対応する領
域に順次書き込む。
4)図形と判別した時には、その閉領域を持つ子ノード
を作成する。また第1図の例のように穴がある場合に
は、内境界内の領域を持つ孫ノードを作成する。ここで
領域の抽出は第4図に示す方法によって実現できる。す
なわち第4図−(a)のような対象閉領域に対し、外境界
内部は、境界追跡によって記憶された境界上の2点(x
is,y)、(xie,y)にはさまれたラインの
集合と考えられる。そこで、この2点にはさまれたライ
ンの各座標の画素値をライン毎に順にコピーすることに
よって、外境界内部を表す第4図−(b)が得られる。同
時に各画素値を反転させてライン毎に順次コピーすると
第4図−(c)のような反転画像が得られる。ここで第4
図−(c)における外境界は第4図−(a)の内境界に対応し
ている。そこで、第4図−(c)の画像に対して、第4図
−(a)より(b)(c)を得たと同じ処理、すなわち、外境界
を追跡したように、内境界追跡を行い、画素値をライン
毎に順にコピーを行うことにより内境界内部を表す第4
図−(d)が得られ、同時に各画素値を反転させてライン
毎に順次コピーすることにより第4図−(e)が得られ、
第4図−(a)における内境界内領域を抽出した結果とな
っている。
5)4)で得られた内境界内領域に黒画素が含まれてい
なければ処理を終了する。また含まれていればこの孫ノ
ードを親として1)〜4)を繰り返す。
(2)トポロジカル構造 第5図は、第1図に示した画像に対して以上の処理を行
った結果得られたトポロジガル構造を示している。
この図において、第1レベルのノードは、第1図に示さ
れる画像全体を示すもので、第2レベルのノードとして
は、文字領域を表す文字ノードと図形領域を表す子ノー
ドが作成されている。この子ノードに対応する図形領域
は深層構造を持つため前述のアルゴリズムによって抽出
された内部領域に対応する孫ノード1及び2が第3レベ
ルとして作成される。さらに、これら孫ノードに対応す
る領域の画像に対して、処理が引き続き行われ、孫ノー
ド1の下位には文字ノードが1つ、孫ノード2の下位に
は1つの文字ノードと図形を示す子ノードが第4レベル
として加えられる。第4レベルのノードに対応する図形
領域には、深層構造が存在しないため処理はここで終了
する。
以上により本発明の要旨である文字領域と図形領域との
階層的分離を目的とした構造化が終了する。しかし、ミ
クストモード通信を行う際には、例えば、CCITT勧告
T.73に規定される。ページ(P)、フレーム(F)及びブロ
ック(B)からなるレイアウト構造(ドキュメント構造)
に一致させる必要がある。
従って、以下では本発明のトポロジカル構造からCCITT
勧告T.73規定されているドキュメント構造への変換手
順について説明する。
(3)構造変換の及びドキュメント構造 1)ルート(第1レベル)のノードをページとし、奇数
レベルのノードで下位ノードを持たないものは消去して
おく。
2)偶数レベルのノードは、下位ノードがない場合に
は、ブロックとする。その他の場合にはフレームとし、
対応領域と1つ下位のすべてのノードの領域の排他的論
理和をとった結果をコンテントとして持つブロックを当
該フレームの下位に加える。
3)奇数レベルのノードは、下位ノードの数が複数の場
合にはフレームとし、単数のときには消去し同時に下位
ノードを上位ノードの下に加える。
4)構造木にたいしてドップダウンの2)〜3)を繰り
返す。第6図は、第5図に示したトポロジカル構造を上
述の手順でレイアウト構造に変換した結果を示してい
る。第5図における第1レベルのノードは1)により第
6図において、ページとなっている。次に、第5図にお
ける第2レベルのノードは2)により、第6図におい
て、文字ノードはそのままブロックに、また図形領域を
持つノードは、フレームとなっている。同時にこの図形
領域と第3レベルの2つのノード(孫ノード1、2)の
持つ領域の排他的論理和をとった結果をコンテントとす
るブロックがフレームのしたに加えられている。さらに
第5図の第3レベルにある孫ノード1は3)により、消
去され、その下位にある第4レベルの文字ノードがブロ
ックとして、前述フレームの下位に加えられる。孫ノー
ド2については3)によりフレームとする。最後に、孫
ノード2の下位にある第4レベルの文字ノード及び子ノ
ードは2)により各々ブロックとして追加される。
以上のように本発明では、図形領域を階層的に分離する
ことにより、図形領域内に含まれている文字を効率良
く、かつ正確に分離することが可能となる。
次に、上述した階層的分離を行うための装置構成につい
て説明する。
第7図は本発明による文字・図形階層的分離方式の概略
図であり、7はスキャナ(図示せず)から入力した画像
情報を任意レベルで2値化をおこない、2値化情報を内
蔵のメモリに記憶させるための入力部、8は本発明の特
徴である画像の構造解析を行うとともにメディア(文字
及び図形)の判別を行って構造化データを得るための構
造解析部、9は構造解析部8により分離された文字領域
が正しいか否かを判定し、正しい場合にはキャラクタコ
ードに変換するための文字認識部、10はディスクなどに
より構造化されたデータを蓄積するための蓄積部で、蓄
積部10の出力は印刷、編集、伝送などに供される。
ところで、文字認識部9は既存の技術を用いたもので、
著書(「文字認識概論」橋本編著:電気通信協会、オー
ム社、昭和57年3月発行)等で知られている。従って、
本発明の特徴である構造解析部8について詳細に説明す
る。
第8図は本発明による構造解析部8のブロック図であ
り、11は白黒2値で表される画像に対して8連結の境界
追跡を行い境界座標値を記憶するための境界追跡部、12
は境界追跡部12で抽出された閉領域の大きさにより文字
と図形の判別をおこなうための文字・図形分離部、13及
び14は文字または図形領域のデータを記憶するためのデ
ータ記憶部、15は文字・図形分離部12によって判別され
た図形領域の内部領域を抽出するための内部領域抽出
部、16は抽出されたすべての内部領域に対して黒画素が
ないか否かを判定する終了判定部、17は終了判定部16で
すべての内部領域に黒画素がないと判定されてトポロジ
ー解析が終了したと見なされた場合に、データ記憶部13
及び14に記憶されていたデータをコンバータ部18へ送る
ためのゲート回路、18はトポロジカル構造をドキュメン
ト構造(レイアウト構造)に変換するためのコンバータ
部である。
すなわち、本発明の構造解析部8は、境界追跡部11で閉
領域を作成し、閉領域の大きさから文字領域であるかあ
るいは図形領域であるかを判定して文字・図形分離部12
で分離し、分離された各々の図形領域については再び閉
領域が包含されているかどうかを検索して内部領域抽出
部15で抽出し、図形領域内に閉領域が存在すると前回と
同様な境界追跡部11及び文字・図形分離部12による文字
と図形の分離を繰り返すことにより構造化し、最終的に
文字領域と図形領域とを正確に分離することができる。
なお、上述の説明では、ひとつの文書内にひとつの図形
領域がある場合を例にとり説明したが、複数個の図形領
域がある場合には、各々の図形領域をひとつの内部領域
抽出部15及び終了換出部16を用いて順次内容領域を抽出
するか、あるいは複数個の内部領域抽出部15及び終了検
出器16を設けておき、すべての閉領域に黒画素がなくな
ったことを検出した時点でゲート回路17を動作させるよ
うにしても良い。
また、トポロジカル構造をCCITT勧告のドキュメント構
造に変換する場合を例にとり説明したが、これに限定さ
れることなく他のドキュメント構造に変換しても良い。
(発明の効果) 以上のように本発明は画像中の黒領域の境界追跡により
閉領域を抽出し、抽出された閉領域の内部構造を繰り返
し解析することにより文字領域と図形領域とを効率良
く、かつ正確に分離することができる。従って、以後の
文書編集も容易となり、かつ分離領域毎に適した符号化
により伝送効率及び蓄積効率の優れたミクストモード通
信が可能となり画像情報量の低減及び伝送速度の向上の
点で発明の効果が極めて大である。
【図面の簡単な説明】
第1図は従来の文字・図形分離方式を説明するための内
部構造をもつ文書例、第2図は本発明による文字・図形
階層的分離方法の流れを示すブロック図、第3図は、本
発明による文字・図形の判別基準を示す図、第4図は、
本発明による閉領域の内部構造の抽出方法を説明するた
めの図、第5図は本発明のよるトポロジカル構造図、第
6図は本発明によるトポロジカル構造をドキュメント構
造に変換した変換図、第7図は、本発明による文字・図
形階層的分離方法の概略図、第8図は本発明のよる構造
解析部のブロック図である。 7…入力部、8…構造解析部、 9…文字認識部、10…蓄積部、 11…境界追跡部、12…文字・図形分離部、 13,14…データ記憶部、 15…内部領域抽出部、 16…終了検出部、17…ゲート回路、 18…コンバータ部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 蓮池 和夫 東京都目黒区中目黒2丁目1番23号 国際 電信電話株式会社研究所内 (56)参考文献 電子通信学会技術研究報告 PRL83− 70 向田ほか 「境界追跡を利用した流れ 図中の文字と図形の分離」 電子通信学会技術研究報告 PRL83− 2 鈴木ほか 「2値画像のトポロジカル な構造解析のための境界追跡、アルゴリズ ム」

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字と図形とが混在する2値画像情報を文
    字領域と図形領域とに分離する文字・図形分離方法にお
    いて、 該2値画像情報に含まれる黒画素の外境界の追跡を行う
    ことにより閉領域を抽出し、該閉領域毎に対応する外境
    界内部領域の第1のコピー画像領域を作成する第1のス
    テップと、 各該第1のコピー画像領域の大きさにより前記文字領域
    と前記図形領域とに分離する第2のステップと、 各該図形領域の内境界の追跡を行い内部領域を抽出し、
    該内部領域毎に対応する内境界内部領域の第2のコピー
    画像領域を作成する第3のステップとから少なくともな
    り、 該第3のステップにより得られた前記第2のコピー画像
    領域を前記2値画像情報とみなした上で、前記第1のス
    テップから前記第3のステップまでを、全ての前記2値
    化画像情報に黒画素が含まれなくなるまで繰り返すこと
    により、 前記文字領域と前記図形領域とを階層的に分離すること
    を特徴とする画像情報の文字・図形分離方法。
JP61113542A 1986-05-20 1986-05-20 画像情報の文字・図形分離方法 Expired - Fee Related JPH0656618B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61113542A JPH0656618B2 (ja) 1986-05-20 1986-05-20 画像情報の文字・図形分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113542A JPH0656618B2 (ja) 1986-05-20 1986-05-20 画像情報の文字・図形分離方法

Publications (2)

Publication Number Publication Date
JPS62271080A JPS62271080A (ja) 1987-11-25
JPH0656618B2 true JPH0656618B2 (ja) 1994-07-27

Family

ID=14614952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61113542A Expired - Fee Related JPH0656618B2 (ja) 1986-05-20 1986-05-20 画像情報の文字・図形分離方法

Country Status (1)

Country Link
JP (1) JPH0656618B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08303820A (ja) * 1995-05-11 1996-11-22 Yashima Kogyo Kk エアコン室外機用取付金具
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02126242U (ja) * 1989-03-24 1990-10-17
JP3950777B2 (ja) 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
電子通信学会技術研究報告PRL83−2鈴木ほか「2値画像のトポロジカルな構造解析のための境界追跡、アルゴリズム」
電子通信学会技術研究報告PRL83−70向田ほか「境界追跡を利用した流れ図中の文字と図形の分離」

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08303820A (ja) * 1995-05-11 1996-11-22 Yashima Kogyo Kk エアコン室外機用取付金具
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region

Also Published As

Publication number Publication date
JPS62271080A (ja) 1987-11-25

Similar Documents

Publication Publication Date Title
US8155445B2 (en) Image processing apparatus, method, and processing program for image inversion with tree structure
US7170647B2 (en) Document processing apparatus and method
US6072941A (en) Image processing apparatus and method which classifies images according to attributes
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
US6360006B1 (en) Color block selection
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JPH03126181A (ja) 文書画像の領域分割方法
JP2644477B2 (ja) 画像処理方法
JP3624013B2 (ja) 画像処理方法及び装置
JP3378108B2 (ja) 二値イメージ出力装置
JP3030126B2 (ja) 画像処理方法
JPS62121589A (ja) 文字切出し方法
JP2789622B2 (ja) 文字/図形領域判定装置
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JPH05159062A (ja) 文書認識装置
JP2800205B2 (ja) 画像処理装置
JP2877548B2 (ja) 文書画像の属性判別方法
JP2721415B2 (ja) 文字画像抽出方法
JP3471925B2 (ja) 複写装置及び画像処理方法
JP4129320B2 (ja) 画像処理装置及び記録媒体
JPH0646253A (ja) 文書画像の領域抽出方法
JPH0660220A (ja) 文書画像の領域抽出方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees