JPS6255769A - 文書画像の処理装置 - Google Patents

文書画像の処理装置

Info

Publication number
JPS6255769A
JPS6255769A JP60193738A JP19373885A JPS6255769A JP S6255769 A JPS6255769 A JP S6255769A JP 60193738 A JP60193738 A JP 60193738A JP 19373885 A JP19373885 A JP 19373885A JP S6255769 A JPS6255769 A JP S6255769A
Authority
JP
Japan
Prior art keywords
image
rectangular area
format
grammar
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60193738A
Other languages
English (en)
Other versions
JPH07107711B2 (ja
Inventor
Junichi Tono
東野 純一
Yasuaki Nakano
中野 康明
Hiromichi Fujisawa
藤沢 浩道
Hirotada Ueda
博唯 上田
Seiji Kashioka
誠治 柏岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60193738A priority Critical patent/JPH07107711B2/ja
Publication of JPS6255769A publication Critical patent/JPS6255769A/ja
Publication of JPH07107711B2 publication Critical patent/JPH07107711B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は画像処理方式に係わり、特に入力画像のレイア
ウトを電子的に変更して画像を出力する装置に好適な画
像理解方式に関する。
〔発明の背景〕
従来の電子的文書画像ファイル装置は単に文書の各ペー
ジを画像として格納するのみであり、検索のための二次
情報は別にキーボードなどの符号変更など編集をしたシ
、文書の内容を連想させるようなインデックス1面塚を
あらかじめ抽出するために、クロスヘヤ・カーソルやマ
ウスなどの座標入力手段によってその画像領域を外部か
ら与える必要があった。しかし、ファイルの入力・編集
作業を省力化するためには文書中に記載されている表題
や著者などを自動的に読み取って二次情報を生成するこ
とが望ましい。さらに検索を高度化するためには図表の
キャプションや章・節表現の自動入力あるいは本文自体
の認識による自動キーワード抽出などが必要となる。ま
た対象文書の画像を表題・著者・要約・本文・図・写真
などの部分に分割すること、文字の部分は認識して符号
化すること、さらに%複数の文書から必要な領域を抽出
して、抄録誌などを作成することは、記憶スペースの削
減や検索単位の多様化のためにも要請されていた。
従来技術ではこのような問題点に対処するため、文書の
中の対象領域を外部から指定し、画像を抽出したシ、文
字認識装置によって文字データに自動的に変換する文法
が提案されている。
O情報処理学会第28回合国大会講演論文「画像処理を
応用した文書画像ファイルの一検索方式」(論文集5C
−1,昭和59年) 0特許公開公報昭和60−17565号「画像記憶検索
装置」(昭和60年1月29日公開)しかし、この方法
は検索対象領域の指定に人手がかかるという問題点があ
る。
人手指定方式の問題点に対処するため、画像処理ケ行う
ことによって対象領域を自動的に抽出したり、文書の内
容を理解しその理解結果に基づいて文書の処理を行う方
式がある。
0情報処理学会第29回全国大会講演論文「ドキュメン
ト画像用情報システム用新聞見出し抽出アルゴリズム」
(論文集6M−9,昭和59年)0特許公報昭和59−
39065号「郵便物宛名文字列検出装置」(昭和59
年9月20日公告)0情報処理学会第23回全国大会講
演論文「複雑な構造をもつ文書画像の自動解析」 (論
文集6C−2、昭和56年) しかし、これらの文書処理技術は、画像データを単純に
処理する方式(ボトムアップ方式)のため、抽出した領
域に意味を与えることが困難であったシ、あらかじめ領
域に意味を与えてから画像データを処理する方式(トッ
プダウン方式)を採用してはいるが、その処理手順が制
御プログラム中に記述された方式でめるため、処理する
文書の糧類を変更することは容易ではなかった。
すなわち、これらの文書理解技術は新聞や、郵便物の宛
先を対象としたものであるため、論文誌や特許公報のよ
うにある程度定型化されてはいるが、その書式が多種多
様にわたるような文書に対して、検索のため必要な表題
や著者などの二次情報を効率的に抽出する目的には必ず
しも適しない。
また、二次情報抽出を失敗したとき抽出方法を改良して
行く手段は適当なものがない。
画像を出力する方法に関しては、従来文字を主体とした
システム(Te、l()や1図形を主体としたシステム
(GKS)などがある。前者は印刷時の活字めm択を自
動化することを目的としている。
後者は図形や画像の合成を目的としたものであるため、
文書を画像として理解してからその内容に応じた画1諏
を出力することは考慮されていない。
画像を配置する方法に関しては、上記のシステムでは茨
示装置の分解能と整合をとるため座標系を任意に設定で
きる。また画面上の位置もビューボートなる矩形領域に
よって任意に設定できる。しかし、座標系またはビュー
ボートは階層的に表現することはできない。
さらに、意味情報の付加された画像領域を再配置できる
適切な方式がなかった。
〔発明の目的〕
本発明の目的は、定盤化された一般の文書を対象とし、
その構造に従って部分画賛に分割するとともに、この部
分画賛を再配置することによっである構造の画賛を得る
ことと、必要な′#s会には文字部や図形部を認識し、
その画賛領域を、あらかじめ登録した画像に変更しうる
画像理解方式を提供することにある。
〔発明の概要〕
かかる目的を達成するために、本発明においては画像の
構造を表現する文法を用い、この文法によって表現され
た記述を構文解析することにより、未知入力画賛の構造
を把握する。そして、出力すべき画像のレイアウト構造
を、上記文法によって表現し、その記述に従って画像を
再配置する。上記の文法では、文書画像を矩形領域の集
合として表現し、上記矩形領域の絶対的あるいは相対的
な大きさ及び矩形領域間の絶対的あるいは相対的な関係
を表す数量を変数として含んでいる。また、矩形領域の
探索方法を指定することができる。さらに、矩形領域を
また矩形領域の集合として表現し、このような階層的な
表現によって、文書の書式を細部に至るまで表現できる
各種文−vK対し、上記の文法に従って表現された文書
の書式があらかじめメモリ内に格納されている。構文解
析部では未知文書が入力されると、文書書式で指定され
た探索方法に従って矩形領域を探索し、探索が成功した
か否かの情報と探索時に定まるパラメータ(矩形領域の
絶対的あるいは相対的な大きさ及び矩形慣域間の絶対的
あるいは相対的な関係)を表す数値を抽出する。構文解
析部は、上記のパラメータの数値を又11W式の中の変
数に代入し、次の解析を行うことKよシ、順次文書の構
造解析を進める。解析が終了し、画賛の内容が理解され
た後、上記の文法に従って画像を再び配置出力する。従
って、出力用の書式が格納されたメモリの内容を変更す
ることによって異なった書式で画像を出力することもで
きる。
以下に本発明の詳細な説明する。第1図、第2図に一定
の書式を有する技術論文の一部の例を示す。以下の説明
では対象として技術論文を例にとるが、他の文書であっ
ても文法の形式が若干異なるのみであり文法の一部を変
更すれば本発明が適用でき、本発明は上記技術論文の一
例に限定されるものではない。43図は、第1.2図の
内容を理解して表題、著者名、代表図を表形式の構造を
もつレイアウトに変更した出力画像である。
次に、文書の構造を表現する文法(以下文書文法と略す
る)の−例を示す。
(defform  F (form Fl  (10901040))(for
m  F2      ・・・・・・・・・   )(
form  F3      ・・・・・・・・・  
 ))(defform  Fl (form Fil (10901050))(for
m F12 (10906090)))(defmac
  LINE−1(%1)(point  ?Y1 (
mode IN  Y LE8S))(paint  
?Y2(mode OUT Y LE8S))(for
m  %1  (0?W  ?Y1  ?Y2)))上
記の文法を第4図の文書画像の例を参照して説明する。
最初のdefform p・・・・・・は、書式Fが第
5図のように%書式F1の下部に書式F2及びF3が横
に並んだものが付随して構成されることを示す。
第4図では第5図に対応し九Fl、F2.F’30部分
は破線で囲んで示しである。書式名F1の次の()で挾
まれた4個の数値 は書式Fに対応する全領域を100X100としたとき
の書式F1の領域の位置を示す。ここで。
座標系は左上を原点としている。領域を示す数値は、X
座標の最小値、X脹標の最大値、Y座標の最小値、YF
M標の最大値である。この例のようにパラメータの値が
既知のときは、その値を直接記述すればよい。同様に、
書式F2、書式F3も矩形領域で記述する。
次f) def form F 1 ””は、V弐F1
が、さらに’l弐FilとF12が縦に並んで構成され
る仁とを示す。すなわち、書式FilのY方向の領域は
10から50であり、書式F12のY方向の領域は60
から90である。1弐Filと、書式F12の領域の位
置は、書式F1の左上を原点とした座標系で記述してい
る。従って、書式Fからみれば相対座標系になっている
このように、書式を矩形領域で表現し、この領域Ω集合
として階層的に次々と表現する事によって画像を一般化
して表現することができる。もちろん階層的ではなく、
第6図に示すように書式Fを基準として絶対座標系で記
述してもよい。この場合、第5図と同様の矩形領域を指
定するためKは下記のようKすればよい。
(defform p (form Fil (18821325))(for
m F12 (18822838))(form F2
     ”・’・  )(form F3     
・・・・・・・・・  ))次めdefmac LIN
E−1(%1)以降は、マクロ定義である。本マクロ定
義の本体である。以下の3行の記述は、矩形領域の上か
ら1行目が書式%1であることを表現したものである。
(point  ?Y1 (mode  IN  Y 
LE88) )(paint  ?Y2(mode O
UT Y LE88))(f o rm%1  (0?
W ?Y1 7Y2))ここで、?Wは書式の横方向の
大きさ、?Hは書式の縦方向の大きさを表す。?Y1.
?Y2は以下に述べるように探索によ1特定される変数
である。
paintはある条件を満足する点を探索し、変数に代
入することを示す。探索条件はmodeによって指定す
る。lN−0UTは探索点が白から黒への変化点か黒か
ら白への変化点かを示し、Yは探索軸(XまたはY)を
示し、LE8Sは探索方向を茨す。なお、この例には存
在しないがpaintに対応するものとして、area
がある。これは、後述するように探索範囲の領域を示す
探索方法をマクロ定義の記述を例に第7図を用いて説明
する。(A)は書式中KTitle・・・・・・、Au
thor・・・・・・なる行が存在することを示す。こ
れらの行のY方向の座標値、すなわち1行目が?Y1か
ら?Y2までに存在し、2行目が?Y3から?Y4まで
に存在していることを記述したのが(B)と(C)であ
る。前述したように(B)は1行目の書式が%1である
ことを定義したマクロ、同様に、(C)は2行目の書式
が%1であることを定義したマクロである。%付きの変
数は仮の変数であシ、マクロを呼び出した時の引き数に
おき換えられてから実行される。従って、これらマクロ
の呼び出しかたは以下のようにすればよい。
(LINE−I  Fl) (LINE−2F2) すなわち、1行目の書式がFl、2行目の書式がF2と
なる。(B)の2行目のpaintで指定される座標値
?Y1の探索条件は、IN Y LESSである。従っ
て、白から黒への変化点、探索軸はY、その方向はLE
SSすなわちY座標値の小さいものから探索するという
条件になっている。またY座標値の大きいものから探索
する場合はGR,EATERとすればよい。これらの条
件を満足するものが1行目の上限の座標値?Y1である
(H)の3行目のpaintで指定される1行目の下限
の座標値?Y2は上記の探索条件において、黒から白へ
の変化点であると記述すればよい。すなわち?Y2の探
索条件は、OUT  Y  LESSである。
次に、書式中の2行目を定義した(C)について説明す
る。2行目は1行目の次の行であるから、1行目の下限
?Y2を探索し、?Y3は探索範囲の領域をareaで
示す。すなわち、探索対象とする矩形領域を、 0  ?W  ?Y2  ?H とすることによって、1行目の下限からCB)と同様の
探索をすることができる。
文書の理解においては、文法に則って書かれた表現を参
照し、その中に記述された矩形傾城が文書に存在するか
否かを順次調べて行く。変数を含んで記述された矩形領
域が探索されると、その変数の数値が得られることとな
り、以後はその数値を変数に代入して用いる。
次に、矩形領域間の演算について説明する。実際の文書
では矩形以外の形状をした領域も出現する。第8図(A
) 、 (B)は矩形以外の形状をした領域の例である
。また、(C)は一つの矩形領域が二つの矩形領域に分
離した例を示す。第8図(A)。
(B)は、それぞれ破線で示すように、二つの矩形領域
の和あるいは差として考えられる。また、(C)は二つ
の矩形領域がつながって仮想的に一つの矩形領域に[ま
っていると考えれば、表現が単純になる。このような矩
形領域間の演算を可能にするため、次のように領域の仮
想的な転送を定義する。
(map & form F (space  ?W ?H) (position ((?XO?YO) (?Xm1n  ’lXmax  ?Ymin  ?Y
max))(・・・・・・ 第9図はこの定義の意味を示したものである。
5paceは、新しく書式Fとして幅?W、高さ?Hの
矩形領域を設定し、この領域中に転送が行われることを
示す。positionは転送先の矩形領域の左上の座
標を表す。4個の値 (7,)(min  7)Qnax ?Ymin  ?
Ymax)で示される転送元の矩形領域を、上記の転送
先に複写する。
この仮想的転送を第10図によシ具体的に説明する。解
析する対象である実際の書式が(A)のように配置され
てあったとする。これは多段組、もしくはタプルカラム
とよばれているものである。
書式F1と誉弐F2は、空間的に横並びとして配置され
ているが、意味的には(B)のように縦並びになってい
る。このような矩形領域間の演算は(map & fo
rm p (space  50 60) (position ((1010) (104010
40))Kよって表現できる。(B)に示す仮想的な書
式は(A)の5paceによって、幅50、高さ60の
矩形領域を設定する。そして(A)と(B)の関係を。
(position((1010) (1040104
0))のように表現する。(A)における矩形領域(1
0401040獄% CB)の(1010)を原点とす
る領域に転送される。
以上に説明した仮想的転送を組み合わせれば、第8図に
示したような複雑な形状の領域は二つ以上の矩形領域間
の演算によって表現することができる。たとえば、第8
図(A)は大きさの異なる二つの矩形領域を隣接させて
転送したものとして表現できる。
次に、画像を再配置する相合の岐横此の変更に伴う画像
転送方法を説明する。第11図は、矩形領域の縦横比に
対応して、画像の縮尺を変更して転送する場合を示す。
(1)は入力画像の矩形領域の幅がW、高さがHでその
領域の画像が文字Aのパターンであるとする。(2)は
転送先の矩形傾城の幅がW’、(8)は高さがH’ 、
(4)は幅がH’%高さがW′である場合1文字パター
ンが修正・転送されていることがわかる。これらの矩形
領域は前述したように文書文法で記述する。第12図は
、出力画像の縦横比を変更せずに転送する場合を示す。
(1)の入力画像を、(2)のように転送先の矩形領域
内部をxyzに分割する。(8)はx=0.(4)はy
=0、(5)はx=y、(6)は任意の分割比の場合で
ある。
以上の説明から分るように本発明で提案した文書文法で
は、文書の構造を矩形領域の組み合わせとして把握し、
矩形領域間の関係を文法で表現しているので文書の表現
力が増し、領域内の行数が不定の場合や、矩形領域が出
現するか否かが不定の場合など、従来取シ扱いが困難で
あった対象も記述できる。従って、多棟多様の文書の解
析と再配置が可能となる。
〔発明の実施例〕
以下1本発明の実施例について図面を用いて詳細に説明
する。
第13図は本発明の一冥施例による画像理解方式を採用
した装置の構成を示すブロック図である。
本実施例においては理解する画像を文書を対象にして述
べるが、一般の画像、す々わち図形や写真など濃淡画像
などが含まれている場合でも応用できる。装置の各部は
バス1に接続され、全体の動作は制御部2によシ制御さ
れる。文書3上の情報(文書画像情報)はスキャナ4に
よシ光電変換・ディジタル化されてディジタル画像とな
り、パス1を介してメモリ61に格納される。メモリ6
1は後述する62,63,64,65,66.67とと
もにメモリ6の一部をなす。ディジタル画像61をスキ
ャナ4から得る代わシに、光ディスクなどのディジタル
画像ファイル装置から読みこんでもよい。また、入力部
5から文字コード情報を得てそのコードに対応する画像
パターンをファイル8から読みこんでもよい。以下の説
明では1画素1ビツトに二値化するものとするが、1画
素を多値で表現してもよく、カラースキャナによシ光寛
変換して色情報を付与してもよい。文書画像に対しht
 M1部2によシ公知の位置補正処理、傾き補正処理な
どを行って得られる正規化画像がメモリ62に格納され
る。
前述した文法に従って書かれた対象文書の書式データが
、あらかじめメモリ64に格納されているものとする。
制御部2は、この書式データを用いて上記の正規化画像
の理解処理を行う。ここで理解処理とは、複数の矩形領
域に分解し、その各領域の分類を行うことをいう。理解
結果として得られる各領域のうち、認識対象領域として
あらかじめ定められた領域について、その部分の画像を
文字・図形認識部7に送って、内部の文字・図形パター
ンを認識させる。一般に元の文書画像は複雑な形状をし
ているが、文書理解結果として得られる@域は矩形形状
をしているので、公知の手法によυ文字・図形の切シ出
し・認識が容易にできる。文字認識結果として得られる
文字符号列あるいはそれを編集した文字符号列、または
図形認識結果として得られるベクトル・データあるいは
記号列などは、指定された領域の検索情報として使用で
きる。これらの検索情報に対応した画像パターンをファ
イル8から読みだし再配置すべきパターンとして使用で
きる。以上のようにして得られた入力文書の検索情報を
ファイル9に、再配置した文書のディジタル画像をファ
イル8に出力する。
文書のディジタル画像のファイル8への出力に際しては
1分解された複数の矩形領域単位で別々に出力してもよ
い。また、ファイル8とファイル9は同一のものとして
もよい。
さらに、前述した文法に従って書かれた再配置すべき出
力文書の書式データが、あらかじめメモリ65に格納さ
れているものとする。制御部2は、この書式データを用
いて上記の正規化画像の画像処理を行う。ここで、画像
処理とは、複数の矩形領域を再び合成し、ディジタル画
像63に格納する。そして画像出力部10によシ出力画
像を得ることをいう。
以下に文書理解処理の詳細を述べる。第14図及び第1
5図は1文書理解の処理の流れを説明する図である。処
理の流れは、PAD(P!・ogramAnalysi
s ])iagram)形式で省かれている。
100で文tjix像の輪郭抽出を行い、メモリ66に
格納する。輪郭抽出は公知の手法を使用すればよい。輪
郭抽出の代わシにいわゆる連結領域抽出法を使用しても
よい。200で抽出された各輪郭iからそのxP!Li
棒及びY座標の最大値と最小値Xm1n(i) Xma
x(i)  Ymin(i)  Ymax(i)を抽出
する。この4個の数値から輪郭iの外接長方形が求まる
。300,400,500はそれぞれ構文解析処理の初
期化1本体、終了判定である。
300ではメそす64に格納されている書式データを作
業用メモリ67に複写し、各種テーブルやプログラム内
部変数の初期化を行う。
構文解析処理の本体400は、410〜460から構成
される。410は、420〜450の処理を460で終
了判定が行われるまで繰シ返し行うように制御する。4
20では書式データ中のステートメントを取シ出す。処
理未了ステートメントとは、その中に含まれる変数で値
の定まっていないものがあるか、または対応する文書領
域がまだ決定されていないような行を指す。430は、
処理未了ステートメントが残っていない場合は440の
処理をスキップする判定である。この場合には終了判定
が行われることになる。420で取シ出したステートメ
ントが処理未了ステートメントの場合、440の処理が
行われる。440は、ステートメントの種類を判定して
分岐する部分で、ステートメントの種類に応じて処理の
内容が変化する。第14.15図及び以下の説明では、
formステートメント、すなわち (form FO (?Xm1n  ?Xmax  ?Ymi n  ?Y
max )(shrink  ?X  ?Y)) の場合についてのみ述べるが、他のステートメントでも
同様にそのステートメント特有の処理が行われる。
第15図441〜448は述語formを処理する部分
である。441では書式名称FOが登録済みか否かを調
べ、未登球ならば442で書式テーブルKFOを登録す
る。442では、変数名7)(min%7)(max、
 ?Ymin、?Ymaxt ?X% ?Yの位置に書
かれた文字列が変数か数値か、変数なら登録済みか否か
を調べ、未登録ンtらこれらを変数表に登録する。変数
が登録済みならばその値が確定しているか否かを調べ、
確定していなければform処理は終了する(この場合
このステートメントは処理未終了となる)。確定してい
れば、ステートメント中の変数名を上記の数値で曹き換
える。
具体例として。
?Xm1n=0.7 )(m a X = 90 %7
Ymin、7Ymax  :未登録 ?X    =5.?Y    =5、のとき、前記の
ステートメントは (form FO (090?Ymin  7Ymax) (shrink  B 5)) と書き換えられ、変数?Ymin、7Ymaxが変数テ
ーブルに登録されて、値未確定となる。
443で、ステートメント中の変数名が全て数値に誉き
換えられているか否かによシ分岐し、全て数値に曹き換
えられていたとき、444のf o rm’y4.行処
理を行う。form実行処理の詳細は445〜448で
表される。445は、200で抽出された輪郭iについ
て以下の処理を繰シ返すことを示す。446では、輪郭
iのX座標及びY座標の最小値と最大値 )(min(i)  xmax(i)  Ymin(i
)  Ymax(i)をステートメント中の変数 7)(min  7)(max  7Ymin  ?Y
max  ?X ?Yに対応する数値と比較し 7)(min()(min(i)()(max(i)(
?XmaX?Ymin(Ymin(i)<Ymax(i
)<?Ymax?X   (Xmax(i) −Xmi
n(i)?Y   (Ymax(i) −Ymin(i
)が成立する輪郭か否かを判定する。447では。
上記の条件が成立したとき、その@郭iをFOの成分テ
ーブルに登録する。448では、上記の条件が成立する
輪郭が存在しないとき、解析失敗のフラグを立てる。
以上説明したように441〜448の処理により、書式
データ中のステートメントformに対応する1#造が
入力画像に存在することを検出できる。
form以外のステートメントについても同様である。
formの場合には出力データはないが、ステートメン
トによっては、ステートメント中の変数に解析時に求め
たパラメータを代入するものもあり、その結果が他のス
テートメントで用いられる。
450では、解析失敗フラグを調べ、解析が失敗したと
き後戻りして再試行する。この場合、解析済みのステー
トメントに戻ってパラメータを代入した変数をまた以前
の状態に誉き直し、別の可能性を探索するように制御す
る。
460では、解析失敗フラグが立っていないか、あるい
は後戻シ再試行の後解析失敗フラグがあるかを検出し、
終了判定を行う。
500は解析の結果得られたデータを外部に受は渡す部
分である。外部に受は渡すデータとしては、書式名称に
対応して検出した矩形領域の文書上での座標などがある
解析失敗フラグを立てる指定のあるステートメントで解
析が失敗したとき、この文書は理解不能であシ、このと
きはりジエクト処理を行う。たとえば文書理解の最終結
果あるいは中間結果をコンソールIIK表示し、マンマ
シン的に修正する。
次に、form%行処理の内容を第16図を用いて具体
的に説明する。第16図(A)は画像中にノイズ成分や
文字1.A、2.B成分が存在している場合を示す。
(B)は、formステートメントの実行時のパラメー
タが。
(form  F(20801050)(sbrink
  O0))(C)は、formステートメントの実行
時のパラメータが、 (form F(20801050)(shrink 
 55))の場合である。図に示すように書式Fの成分
テーブルには、(B)の場合、ノイズ成分と、文字1゜
A成分が登録され、(C)の場合1文字1.A成分は登
録されるが、ノイズ成分はshr ink指定によつで
登録されず、除去される。また、書式Fの矩形領域がf
ormの実行後、図のように、領域内に含まれる文字成
分によって領域を正規化することができ、画像の内容に
応じて領域の大きさを柔軟に特定することができる。
第17図に、上記form実行時の輪郭成分の選択方法
を、具体的に説明する。第17図(A)は。
第16図(A)に示す輪郭画像を第14図200によっ
て処理した結果の外接長方形を示す。すなわち、5はノ
イズ成分、1−8は文字成分、さらに6−8は所謂内輪
郭である。これらの成分の)(min 、 Xmax 
、 Ymin 、 ’(tnaxを(B)に示す。
そして書式Fに含まれるか否かは 20 < Xm in (i)(Xmax (i) <
 8010(Ymtn(i)<Ymax(i) <50
5(Xmax(i) −Xmin(i)5(Ymax(
i)−Ymin(i) が成立するかどうかをもって判定する。この例では、輪
郭i = lと3が成立する。30文字成分は6の成分
を含んでいるから書式Fから除いてもよい。
次に理解処理の終了結果から画像を再配置する処理の詳
細を述べる。第18図は部分画像を配置する場合の概要
を図示したものである。ABCDなる文字コード情報か
ら対応する画像パターンを(2)に示すように配置する
。この例では文字パターンの幅をW、高さをH1文字の
間隔を8とした。そして(2)に示すように書式2で定
義される書式3に(1)の部分画像を転送する。この縮
尺は前述したように書式の矩形領域の比率によって決め
る。また。
画像を転送する機能として縮小、拡大、回転、アフィン
変換などをふくんでもよい。文字パターンは第19図(
1)(2)図に示すような輪郭データまたは画素データ
として格納しておく。第20図は第19図(1)で表わ
した輪郭データの特徴を記述した図である。(1)社そ
れぞれの折れ曲がり点をフラグと点列で記述している。
フラグは外輪郭か内輪郭かを示すもので、この場合1が
外輪郭2が内輪郭である。さらに点列は(2)に示すよ
うに1号とX庫標、Y座標で記述される。本実噸例では
説明の簡単化のため直線要素から構成される輪郭データ
を取り上げて入るが、もちろん2次関数やスプライン関
数などの数学的関数で表現してもよい。輪郭データで画
像を表現することによって縮小、拡大。
回転、アフィン変換などの処理が、画素データで表現す
る場合に比べて容易になる利点がおる。従って、文字パ
ターンのように数多くの大きさをもつフォントや変形し
た字体の作成にも使用できる。
第21図で矩形領域で記述する書式について説明する。
(1)、伐)は図のような部分画像が、(form G
−ABC(20801050) (free Y))(
form G−123(20805060) (fre
e X))によって(3)に示す書式を持った画像をえ
ることができる。freeは第12図に説明した画像の
転送時の配置を制御するパラメータである。この例では
(freeY)と指定された場合Y方向の比率がx=y
となるように、また(free)0は前記においてY軸
がX軸におきかえたものである。図22図は配置した部
分画像を一つの部分画像とみなして再び配置する様子を
示す、、  (A)、 CB)は次の等式(1)(2)
で記述される。
(defform G−ABC−123(widthl
oo)(height  60)(form G−AB
C(20801050)(free Y)) (form G−123(20805060)(fre
e X) ) ・・・・・・・・・(1) (defform G (width  100) (height  80)
(form G−ABC−123(080060))(
form G−Al:Ic−123(50100508
0)))・・・・・・・・・(2) (2)では(1)で定義した書式〇−ABC−123が
2回縮尺比1−2えて配置されている。書式G−ABC
−123はその書式の大きさが100X60(横長さを
widthで、縦長さをbeightで表現している。
)そしてこの書式の(20801050)の領域にG−
ABCがあシ% (20805060)の領域にG−1
23が存在することを示す。ここで作成した書式を使っ
て書式Gを定義する。(2)では書式°GにG−ABC
−123が(080060)と(501005080)
の領域に存在することを示す。
以上の処理方式によって画像を任意の書式に従って配置
することができる。第23図は同一の書式の文書が複数
存在した場合、ページ毎に文書の内容を理解した様子を
示す。そして第24図に示す書式に従って再び配置する
ことによって第25図に示すような抄録を作成すること
が可能になる。
この方法を詳細に説明する。第23図は文書の書式がF
、Pi、Fil、F12.F2.F3であシ、v式Fi
lに対応したpage毎の文字列が抽出される。第、2
4図は出力用の画像の書式Gを表現したものである。タ
イトル、の欄はGl、G2゜G3で14成する。これの
内容はpage毎にG1(page  1LG2 (p
age  iL G3(page  1)(iはpag
e数を示す)である。第25図は再び配置する書式毎の
部分画像を示す。これらの部分画像を第22図に説明し
たような方法で文法に従って配置iすればよい。
〔発明の効果〕
以上説明したごとく1本発明によれば入力した対象文書
の解析を自動的に行うことが可能であシ。
任意のレイアウトで出力することが可能になる。
さらに、対象となる文書を記述する文法と、出力する文
書の書式を記述する文法を同一の表現形式にすることが
できるため、多種多様な書式に容易に対応できる。豊た
、対象文書の構造が変化しても書式データを変更すれば
、直ちに対応できるなどの利点がある。
【図面の簡単な説明】
第1.2図は入力文書の一例を示す参考図、第3図は出
力文書の一例を示す参考図、第4,5゜6,7,8,9
,10,11.12図は本発明の詳細な説明するための
説明図、第13図は本発明の文書処理方式を実施する装
置の構成を示すブロック図、M14,15(1は第13
図中の制fii1部2における処理を説明するための流
れ図、第16゜17.18,19,20,21..22
図は第10図の処理内容を説明するための説明図、第2
3゜25図は文書の抄録作成に応用した場合の参考図で
ある。 1・・・パス、2・・・制狙°部、3・・・文薔、4・
・・スキャナ、5・・・入力部、6・・・メモリ、7・
・・文字・図形認識部、8.9・・・ファイル、10・
・・画像出力部、11・・・コ篤 1 図    f 
Z 図 ¥:J 3 図 篤 5 図 ■ g  凹 (A)            CB)(り い1          も。 カ −ρ 図 (,4,) (F3) 1シ  16   図 T (す L−−’J 冨17図 (Bン ¥y n図 (す ! y、 tct図 (す Hzρ図 (1ン ¥JZI   図 Vy  23  国 ■ 25 図 (1)富民q1 饅−匿司 (く)11ン1\−(llT2 層む一■ (3)書式〇3 (5)番人62(P甲1) ’d23図書戊7:12〜l)−口門贅1史1月”fr
  zs  図 (7) 書1く、61 (Fシ【962)i、2  自
1(PLaJtZ)  →(ざ)LいZ(PttpZ) 書氏F12(寒2) → (9) 書式 Er3  (PayZ)書l\乙F31
 (PザZ)   。

Claims (1)

  1. 【特許請求の範囲】 1、画像を複数個の矩形領域の集合として記述する文法
    に従つて書かれた表現を記憶する手段と、入力画像を光
    電変換することによりディジタル画像に変換する手段と
    、 上記入力ディジタル画像の中から上記の文法に従つて書
    かれた表現で指定される矩形領域を探索する矩形領域探
    索手段と、上記入力ディジタル画像を、出力ディジタル
    画像の中の上記の文法に従つて書かれた表現で指定され
    る矩形領域へ転送するディジタル画像転送手段と、ディ
    ジタル画像を可視変換することにより出力画像に変換す
    る手段と、 上記矩形領域探索手段の結果により、上記入力画像の構
    文を理解する画像構文理解手段とを有することを特徴と
    する画像理解方式。 2、特許請求範囲第1項記載の画像理解方式において、 上記文法は矩形領域の絶対的な、あるいは相対的な大き
    さを現わす数量を変数として、及び矩形領域間の絶対的
    な、あるいは相対的な関係を現わす数量を変数として含
    むことを特徴とする画像理解方式。 3、特許請求範囲第2項記載の画像理解方式において、 上記矩形領域探索手段は、該探索結果により矩形領域の
    絶対的な、あるいは相対的な大きさを特定することを特
    徴とする画像理解方式。 4、特許請求範囲第1項記載の画像理解方式において、 上記文法は、空間的に隔てられた複数の矩形領域から演
    算を行つて生成した仮想的な一つの矩形領域を含むこと
    を特徴とする画像理解方式。 5、特許請求範囲第3項記載の画像理解方式において、 上記矩形領域探索手段は、上記矩形領域の絶対的な、あ
    るいは相対的な大きさを現わす変数が存在しなくなるま
    で探索を行うことを特徴とする画像理解方式。 6、特許請求範囲第1項記載の画像理解方式において、 上記記憶手段は、上記複数個の矩形領域に対する属性を
    記憶していることを特徴とする画像理解方式。 7、特許請求範囲第1項記載の画像理解方式において、 上記画像構文理解手段は、上記矩形領域探索手段により
    求まる矩形領域内の画像パターンを認識することを特徴
    とする画像理解方式。 8、特許請求範囲第1項記載の画像理解方式において、 上記ディジタル画像転送手段は、入力ディジタル画像中
    の矩形領域を変換処理を伴つて出力ディジタル画像中の
    矩形領域へ転送することを特徴とする画像理解方式。 9、特許請求範囲第1項記載の画像理解方式において、 符号化された情報からディジタル画像を生成し、該画像
    を出力ディジタル画像に転送することを特徴とする画像
    理解方式。 10、特許請求範囲第1項記載の画像理解方式において
    、 画像構文理解手段からの結果にもとづいてディジタル画
    像を生成し、該画像を出力ディジタル画像に転送するこ
    とを特徴とする画像理解方式。
JP60193738A 1985-09-04 1985-09-04 文書画像の処理装置 Expired - Lifetime JPH07107711B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60193738A JPH07107711B2 (ja) 1985-09-04 1985-09-04 文書画像の処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60193738A JPH07107711B2 (ja) 1985-09-04 1985-09-04 文書画像の処理装置

Publications (2)

Publication Number Publication Date
JPS6255769A true JPS6255769A (ja) 1987-03-11
JPH07107711B2 JPH07107711B2 (ja) 1995-11-15

Family

ID=16312986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60193738A Expired - Lifetime JPH07107711B2 (ja) 1985-09-04 1985-09-04 文書画像の処理装置

Country Status (1)

Country Link
JP (1) JPH07107711B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04364584A (ja) * 1991-06-11 1992-12-16 Fujitsu Ltd マルチメディア処理装置
JPH11219442A (ja) * 1997-11-25 1999-08-10 Mitsubishi Electric Corp 文書編集出力装置
SG146421A1 (en) * 1999-06-30 2008-10-30 Silverbrook Res Pty Ltd Method and system for searching information using coded marks
US8031982B2 (en) 1999-05-25 2011-10-04 Silverbrook Research Pty Ltd Pen-shaped sensing device for sensing surface regions

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04364584A (ja) * 1991-06-11 1992-12-16 Fujitsu Ltd マルチメディア処理装置
JPH11219442A (ja) * 1997-11-25 1999-08-10 Mitsubishi Electric Corp 文書編集出力装置
US8031982B2 (en) 1999-05-25 2011-10-04 Silverbrook Research Pty Ltd Pen-shaped sensing device for sensing surface regions
US8295653B2 (en) 1999-05-25 2012-10-23 Silverbrook Research Pty Ltd Sensing device for sensing surface regions
SG146421A1 (en) * 1999-06-30 2008-10-30 Silverbrook Res Pty Ltd Method and system for searching information using coded marks
US7590622B2 (en) 1999-06-30 2009-09-15 Silverbrook Research Pty Ltd System for facilitating searches for data stored on a network
US7657510B2 (en) 1999-06-30 2010-02-02 Silverbrook Research Pty Ltd System for performing data searches on a network

Also Published As

Publication number Publication date
JPH07107711B2 (ja) 1995-11-15

Similar Documents

Publication Publication Date Title
EP0434930B1 (en) Editing text in an image
US4907285A (en) Image understanding system
DE10162156B4 (de) Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Verfahren
US20060294460A1 (en) Generating a text layout boundary from a text block in an electronic document
US20050210372A1 (en) Method and system for creating a table version of a document
US7149967B2 (en) Method and system for creating a table version of a document
JPH0352098B2 (ja)
JPWO2009087999A1 (ja) 目次構造特定装置
JPS6255769A (ja) 文書画像の処理装置
JPH0612540B2 (ja) 文書作成支援装置
JPH08221417A (ja) 構造化文書の新旧対照編集装置
JPS6154569A (ja) 文書画像処理方式
US20040019854A1 (en) Dynamically configurable page numbering system
JPH0259880A (ja) 文書読取装置
JPS61281377A (ja) 文書画像理解装置
JP4334987B2 (ja) 領域指定機能およびデータ切り出し機能を備えたdtp編集装置
JPH03127169A (ja) マルチメディア文書構造化方式
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP4462508B2 (ja) 情報処理装置並びに定義情報生成方法
JPH07193710A (ja) 文章画像処理装置
JPH10320412A (ja) 文書作成装置
JP3237709B2 (ja) 文書処理装置及び文書処理方法
JP2616522B2 (ja) 文書イメージ情報編集装置
KR100260249B1 (ko) 인포맵 도면을 오토캐드 도면으로의 변환방법
JPH11316792A (ja) 情報処理装置及び帳表作成方法