JP2800205B2 - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2800205B2
JP2800205B2 JP63308156A JP30815688A JP2800205B2 JP 2800205 B2 JP2800205 B2 JP 2800205B2 JP 63308156 A JP63308156 A JP 63308156A JP 30815688 A JP30815688 A JP 30815688A JP 2800205 B2 JP2800205 B2 JP 2800205B2
Authority
JP
Japan
Prior art keywords
image
area
representative
calculating means
coordinate value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63308156A
Other languages
English (en)
Other versions
JPH02153482A (ja
Inventor
俊樹 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP63308156A priority Critical patent/JP2800205B2/ja
Publication of JPH02153482A publication Critical patent/JPH02153482A/ja
Application granted granted Critical
Publication of JP2800205B2 publication Critical patent/JP2800205B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、論文、雑誌等の不定形な文書のレイアウト
構造を認識し、電子文書のレイアウト構造として再利用
するための画像処理装置に関する。
〔従来の技術〕
近年、ワークステーションやワードプロセッサ等を用
いて電子文書を作成する方式としては、文書のレイアウ
トを先に決定してから編集を行うものがある。この方式
では、記憶装置に記憶される文書編集ファイル上に各属
性を持つ枠(例えば横書き枠、縦書き枠、ビットマップ
枠等)を割り付け、それらの枠の中に横書き、縦書きの
文字やイメージ情報等を挿入して文書を編集していた。
従来、このレイアウト属性を認識する方式としては、論
文「Document Analysis System(K.Y.Wong,IBM J.RES.D
EVELOP.・VOL.26・NO.6・NOVEMBER1982)」でランレン
グス・スムージング・アルゴリズムが提唱されている。
この論文に書かれれいるアルゴリズムは、アルファベッ
ト等の英文の原稿、つまり横書き原稿の黒画素と黒画素
の間にある白画素のランレングスが、ある閾値内なら
ば、その白画素を全て黒画素に変換することによって同
一レイアウト属性をもつピクセルを連結させて、レイア
ウト属性を認識していた。
〔発明が解決しようとする課題〕
ところが、上記論文のアルゴリズムは、上述したごと
く横書きの原稿用に開発されたもので、例えば第7図
(a)に示すような、日本語等の横書き/縦書き混在の
原稿に対しては、横書きと縦書きの文字列をそれぞれ別
々に認識することができず、第7図(a)の縦書き領域
(右上部分)が第7図(b)に示すように、レイアウト
属性が縦書きのピクセルを連結せずに、細切れの状態に
なってしまい全く意味をなさないという問題点があっ
た。また、上記アルゴリズムは、閾値を必要とし、この
閾値を自動的に抽出することも容易でなく、ユーザーに
よって入力されており、手数がかかっていた。さらに抽
出された横書き領域は、1つのつながりのある横書き領
域(段落)として抽出されるのではなく、1行の横書き
文字列(閾値が不安定なときには、1行の横書き文字列
も分離してしまう。)として抽出されてしまうため、後
の認識処理において領域の指定が必要となり、操作が複
雑になるという問題点があった。
本発明は、上記問題点に鑑みなされたもので、閾値を
必要とせずに、横書き/縦書き混在の原稿から横書き文
字列、縦書き文字列、横書き/縦書き以外の領域を容易
に認識することができる画像処理装置を提供することを
課題とする。
〔課題を解決するための手段〕
本発明では、入力した原稿の画像から画像入力装置
(イメージスキャナー)で生成した2値画像に対して同
じレイアウト属性(例えば横書き、縦書き、横書き/縦
書き以外のもの)をもつ黒ピクセルを連結させる連結手
段を有し、該連結された黒ピクセルに基づきレイアウト
属性を認識する画像処理装置において、前記連結部で連
結された各ピクセル群の領域を求める領域算出手段と、
前記領域算出手段で求めた領域の代表座標値(各領域の
最小座標値と最大座標値の中点)を求める代表座標値算
出手段と、代表座標値算出手段で求めた各代表座標値に
対し、N(Nは整数)番目(隣の文字列内の領域が持つ
代表座標値の確率が高い値で、一般的には3番目と4番
目)に近接する他の代表座標値との距離を求める距離算
出手段と、前記距離算出手段で求めた距離の中から代表
値(モード値及び標準偏差)を求める代表値算出手段
と、前記代表値算出手段で求めた値(モード値に標準偏
差を加えた値)に応じて前記各ピクセル群の領域を連結
させる連結部等の領域連結手段と、前記領域連結手段で
の連結に応じて属性の異なるそれぞれのレイアウト属性
を認識するレイアウト認識部等のレイアウト属性認識手
段とを具える。
〔作用〕
領域連結手段では、代表座標値の個々に対して他の代
表座標値との距離が、モード値に標準偏差を加えた値以
下ならば、2つの代表座標値を有する領域のピクセルを
連結しており、このピクセルを連結させた画像に対し、
レイアウト認識部が境界追跡処理を行い、これにより抽
出された矩形領域から各矩形領域が持つレイアウト属性
を認識する。
従って、横書き/縦書き混在の原稿からでも人手を介
さず、横書き文字列、縦書き文字列、横書き/縦書き以
外の領域等の属性の異なるそれぞれのレイアウト属性を
認識、識別することができる。
〔実施例〕
本発明の実施例を第1図乃至第6図の図面に基づき詳
細に説明する。
第1図は、本発明に係る画像処理装置の概略構成を示
すブロック図である。図において、画像処理部10は、ピ
クセルの連結部、レイアウト認識部からなり、制御プロ
グラム等により画像入力装置11、イメージエディター1
2、画像メモリ13、ディスプレイ装置14等の各機器の制
御及び情報、信号等の入出力制御を時分割で並行して行
う。
画像入力装置11及びイメージエディター12は、原稿の
画像を入力し、上記画像から2値化したディジタル画像
を生成している。生成されたディジタル画像は、画像メ
モリ13に格納されており、画像処理部10のピクセルの連
結部は上記格納されたディジタル画像に対し、同一レイ
アウト属性をもつピクセルを連結させ、さらに認識部に
よってピクセルの連結部で処理されたディジタル画像か
ら画像のレイアウト構造が認識される。また、画像処理
部10は、入力又は出力されたディジタル画像及び認識さ
れたレイアウト構造に関するデータをCPT等からなるデ
ィスプレイ装置15に表示させている。
次に、第2図乃至第6図に基づき画像処理部10の各処
理を実現するためのアルゴリズムを説明する。
まず画像処理装置では、画像入力装置11の図示しない
画像読取装置(イメージスキャナー等)を用いて上述し
た第7図(a)の原稿を走査し、上記画像入力装置11又
はイメージエディター12によって2値のディジタル画像
を生成し、その生成したディジタル画像(以下、「2値
画像」という。)(第4図(a)参照)を画像メモリ13
に格納する。第2図において、次に画像処理部10の連結
部は、上記画像メモリ13内の2値画像に対して、ラスタ
ー走査を開始し(ステップ101)、今のピクセルが黒か
どうかを判断する(ステップ102)。ここで、今のピク
セルが黒の場合には、一般的な境界追跡処理(例えば、
文献「画像認識と画像理解」啓学出版・1986・157ペー
ジ〜158ページにある方法)を上記黒ピクセルから開始
するとともに(ステップ103)、現在境界追跡をしてい
る黒ピクセル群の最小座標値(Xmin,Ymin)及び最大座
標値(Xmax,Ymax)を求める(第5図参照)(ステップ1
04)。そして、追跡処理が終了したならば(ステップ10
5)、上記求めた最小座標値(Xmin,Ymin)と最大座標値
(Xmax,Ymax)との中点を代表座標値として定める(第
5図参照)(ステップ106)。そして、代表座標値の決
定が終了した場合、またステップ102で黒のピクセルが
上記画像メモリ13内に存在しなくなった場合には、ラス
ター走査の終了かどうか判断する(ステップ107)。
ここで、ラスター走査が終了していない場合には、ス
テップ102に戻って、黒ピクセルを検出する。また、ラ
スター走査が終了した場合には、決定した代表座標値の
個々に対して、3番目と4番目に近接した代表座標値と
の距離を求める(ステップ108)。
一般的に、ある代表座標値との距離が3番目と4番目
に近接した代表座標値とは、隣の文字列内の領域が持つ
代表座標値の確率が高い。例えば、第6図の2行目の
「像」をみると、1番目に近い代表座標値が「メ」、2
番目が「画」、3番目が「図」、4番目が「出」とな
る。このうち、3番目と4番目の「図」と「出」は、隣
の文字列内の領域である。各代表座標値に対し、この3
番目と4番目と代表座標値の距離を求めることにより、
文字列と文字列の距離が計られ、同一レイアウト属性を
持つピクセルを1つのつながりのある領域として連結す
ることが可能となる。
次に、上記求めた各距離値に対するモード値(求めた
各距離の中で出現頻度の最多の値)と多少のバラツキを
考慮した標準偏差とを求める(ステップ109)。そし
て、上記モード値に標準偏差を加えた距離Lを算出する
(ステップ110)。上記距離Lは、隣り合う文字列を区
別するためのもので、代表座標値の個々に対して、他の
代表座標値との距離が上記距離L以下ならば、上記2つ
の代表座標値が同一レイアウト属性を持つ文字列内のも
のと判断して、上記2つの代表座標値がもつ画像メモリ
13内のピクセルを連結させる(ステップ111)。上記連
結には、2つの矩形領域内にある任意の1つの黒ピクセ
ル同士を直線で結ぶ方法がある(第4図(c)参照)。
次に、上記同一レイアウト属性を持つピクセルを連結
させた画像メモリ13内の2値画像に対しラスター走査を
開始して(ステップ112)、黒ピクセルを検出し(ステ
ップ113)、さらに一般的な境界追跡処理を行い(ステ
ップ114)、境界追跡をしている黒ピクセル群の最小座
標値(Xmin,Ymin)及び最大座標値(Xmax,Ymax)を求め
る(ステップ115)。これによって、上記最小座標値(X
min,Ymin)及び最大座標値(Xmax,Ymax)を対角線とす
る2値画像の複数の矩形領域が抽出できる(第4図
(d)参照)。画像処理部10のレイアウト認識部は、抽
出された上記各矩形領域から矩形領域が持つレイアウト
属性を識別する(ステップ118)。ここで、上記レイア
ウト属性として横書き領域縦書き領域/それ以外の領域
の3つを考えると、上記レイアウト認識部は、以下のよ
うに、 [横書き領域]…水平方向に黒画素の周辺分布図を作成
したときに、周期的な波形が得られるもの(第4図
(e)参照) [縦書き領域]…垂直方向に黒画素の周辺分布図を作成
したときに、周期的な波形が得られるもの(第4図
(f)参照) [それ以外の領域]…水平方向並びに垂直方向に黒画素
の周辺分布図を作成したときに、周期的な波形が得られ
ないもの(第4図(g)参照) によって各レイアウト属性を識別できる。
従って、本発明では、連結された同一レイアウト属性
を持つ領域に対し、周辺分布図の周期的な波形を求めて
各レイアウト属性を識別するので、横書き/縦書き混在
の原稿に対しても、横書きと縦書きの領域をそれぞれ別
々に認識することができる。このため、ユーザの指定し
たレイアウト属性を持つ領域のみを抽出してディスプレ
イ14に出力することが可能となる。また、アルゴリズム
は、閾値を必要としないため、閾値の抽出及び人手によ
る閾値入力の手間が省け、これにより操作の簡単化が図
られる。
なお、実施例では、モード値に標準偏差を加えた距離
によって、隣り合う文字列を区別したが、本発明はこれ
のみに限らず、3番目と4番目に近接した代表座標値と
の距離の平均値に標準偏差を加えた距離によって、隣り
合う文字列を区別することも可能である。
〔発明の効果〕
以上説明したように、本発明では、同一レイアウト属
性を持つピクセルの連結によって異なるレイアウト属性
を持つ領域を分離し、同一のレイアウト属性を持つ領域
を抽出することができるので、横書き/縦書き混在の原
稿からでも人手を介さず、横書き文字列、縦書き文字
列、横書き/縦書き以外の領域等の異なるそれぞれのレ
イアウト属性を容易に認識、識別することができる。
【図面の簡単な説明】
第1図は本発明に係る画像処理装置の概略構成を示すブ
ロック図、第2図、第3図は第1図に示した画像処理装
置のレイアウト認識の処理動作を説明するためのフロー
チャートを示す図、第4図は上記処理動作の各行程での
イメージを示す図、第5図は黒ピクセルの連結動作を説
明するための図、第6図は代表座標値の近接関係を示す
図、第7図は従来のレイアウト認識処理動作でのイメー
ジを示す図である。 10……画像処理部、11……画像入力装置、12……イメー
ジエディター、13……画像メモリ、14……ディスプレ
イ。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】原稿の画像から生成した2値画像に対して
    同じレイアウト属性をもつピクセルを連結させる連結手
    段を有し、該連結されたピクセルに基づきレイアウト属
    性を認識する画像処理装置において、 前記連結手段で連結された各ピクセル群の領域を求める
    領域算出手段と、 前記領域算出手段で求めた領域の代表座標値を求める代
    表座標値算出手段と、 前記代表座標値算出手段で求めた各代表座標値に対し、
    N(Nは整数)番目に近接する他の代表座標値との距離
    を求める距離算出手段と、 前記距離算出手段で求めた距離の中から代表値を求める
    代表値算出手段と、 前記代表値算出手段で求めた値に応じて前記各ピクセル
    群の領域を連結させる領域連結手段と、 前記領域連結手段での連結に応じて属性の異なるそれぞ
    れのレイアウト属性を認識するレイアウト属性認識手段
    と を具えたことを特徴とする画像処理装置。
JP63308156A 1988-12-06 1988-12-06 画像処理装置 Expired - Fee Related JP2800205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63308156A JP2800205B2 (ja) 1988-12-06 1988-12-06 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63308156A JP2800205B2 (ja) 1988-12-06 1988-12-06 画像処理装置

Publications (2)

Publication Number Publication Date
JPH02153482A JPH02153482A (ja) 1990-06-13
JP2800205B2 true JP2800205B2 (ja) 1998-09-21

Family

ID=17977571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63308156A Expired - Fee Related JP2800205B2 (ja) 1988-12-06 1988-12-06 画像処理装置

Country Status (1)

Country Link
JP (1) JP2800205B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012860B (zh) * 2022-12-29 2024-01-16 华南师范大学 一种基于图像识别的教师板书设计水平诊断方法及装置

Also Published As

Publication number Publication date
JPH02153482A (ja) 1990-06-13

Similar Documents

Publication Publication Date Title
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US6411731B1 (en) Template-based image recognition and extraction
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
US5553217A (en) Document layout using tiling
US7170647B2 (en) Document processing apparatus and method
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US5892854A (en) Automatic image registration using binary moments
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
EP1081648B1 (en) Method for processing a digital image
JPH06203138A (ja) 画像編集システム
JPH0721320A (ja) 自動スクリプト決定装置
EP1017011A2 (en) Block selection of table features
JP2800205B2 (ja) 画像処理装置
EP0600613A2 (en) Improvements in image processing
JPH0612540B2 (ja) 文書作成支援装置
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
JP2786355B2 (ja) 文章画像の属性判別方法
JP2881066B2 (ja) 文章画像の属性判別方法
JPH0535914A (ja) 画像傾き検出方法
JP2755299B2 (ja) 画像処理方法
JPH0830725A (ja) 画像処理装置及び方法
JP2931041B2 (ja) 表内文字認識方法
JP2002269574A (ja) 囲み領域抽出アルゴリズムの性能を向上させるランレングスに基づく連結成分と輪郭追跡
JPH0271379A (ja) 画像処理装置
JP2954218B2 (ja) 画像処理方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees