JP3178483B2 - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JP3178483B2
JP3178483B2 JP17370792A JP17370792A JP3178483B2 JP 3178483 B2 JP3178483 B2 JP 3178483B2 JP 17370792 A JP17370792 A JP 17370792A JP 17370792 A JP17370792 A JP 17370792A JP 3178483 B2 JP3178483 B2 JP 3178483B2
Authority
JP
Japan
Prior art keywords
document
image
area
contents
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17370792A
Other languages
English (en)
Other versions
JPH05342326A (ja
Inventor
尾崎正治
糸乘勝彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP17370792A priority Critical patent/JP3178483B2/ja
Priority to US08/071,006 priority patent/US5701500A/en
Publication of JPH05342326A publication Critical patent/JPH05342326A/ja
Application granted granted Critical
Publication of JP3178483B2 publication Critical patent/JP3178483B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿文書から所望の部
分を取り出してその原稿文書に関連する文書を作成する
文書処理装置に関し、特に抄録文書の作成や、目次の作
成、目次付き文書の作成、文書リストの作成などを自動
的に行うことのできる機器に関するものである。
【0002】
【従来の技術】雑誌等の出版物の多様化、DTP・ワー
ドプロセッサの普及にともない、文書の流通量が増加し
てきている。このため、多くの情報を文書の形で容易に
手に入れることが可能となった。情報が容易に手に入る
ようになったことは歓迎すべきである。しかしながら、
その量の多さに人間の処理能力が徐々に追い付かなくな
ってきている。さらに悪いことには、量が多くなるにつ
れ不必要な文書の割合が増大し、知りたい情報にたどり
つくためには内容を把握するのに無駄な努力を要するこ
とになってきている。
【0003】通常、書籍などではタイトルと著者の対な
どで目次が用意され、どの記事が所望とする内容なのか
を判断するのに役立っている。複数の文書の内容がある
程度簡単に把握できるような目次、サマリがあれば必要
な情報を得るための手掛かりとして非常に有用である。
【0004】
【発明が解決しようとする課題】しかし、多種の文書に
対してそのような目次、あるいはサマリは当然なく、個
別にその内容を参照しなければならなかった。望む情報
を取り出すだけでなく、いったん収集した多種の文書を
ファイリングしておく場合でも、サマリやリストあるい
は目次があれば後の検索のために有用である。しかし、
このような文書のサマリやリストの作成、あるいは目次
の作成は、従来は人手で行うしかなかった。したがっ
て、文書の量が増えればその管理の手間も増大していく
という問題点があった。
【0005】DTP文書などの電子化文書であれば文書
データベース技術を用いて、データベースに登録後、そ
のようなサマリや目次を作成することは可能である。し
かし、必要とする文書が電子化文書ではなく紙の文書で
しか入手できないものがまだ多く、そのような電子化文
書の文書データベース技術を直接的には用いることはで
きないという問題点があった。また、DTP・ワードプ
ロセッサで作成された文書でもタイトル、著者といった
論理的な属性を持つ文書となっていないものが多く、こ
れらの属性を付与してデータベースに登録する必要があ
った。
【0006】紙の文書を電子化文書に変換する技術とし
て文書認識技術がある(例えば特開昭64−15889
号公報あるいは特公昭61−32712号公報)。この
ような文書認識技術を用いることによって紙の文書の構
造を認識し、文字の部分は文字認識を行い、コード化し
て文書データベースに蓄えることができる。しかしなが
ら、文書認識技術のうち文字認識は非常に多くの計算機
コストを要し、しかも誤認識が生じる場合がまだ多い。
サマリを人が見て内容を把握するという目的だけであれ
ば、コード化された文字内容の再利用は行われず、文字
認識はほとんどが無駄な処理になってしまうという問題
点があった。
【0007】本発明は、上述のような諸問題を解決する
ことを課題とするものである。すなわち、本発明は原稿
の文書画像から所望の文書要素の箇所のみを取り出して
構成した文書画像を自動的に作成する文書処理装置を得
ることを目的とするものである。
【0008】また、本発明は、書式の異なる原稿を含む
複数の文書原稿の画像からそれぞれ概要を把握するのに
必要な文書要素を抽出し、所定の書式に従って配置して
サマリ文書群を生成する文書処理装置を得ることを目的
とするものである。
【0009】また、本発明は、複数の文書原稿の画像か
ら検索を容易にできるように配列したサマリ文書群を生
成することのできる文書処理装置を得ることを目的とす
る。
【0010】また、本発明は原稿の文書画像から見出し
の文書要素を取り出して目次を自動的に生成する文書処
理装置を得ることを目的とするものである。
【0011】また、本発明は原稿の文書画像から見出し
の文書要素を取り出して目次を自動的に生成すると共に
原稿の文書画像にページを付与することのできる文書処
理装置を得ることを目的とするものである。
【0012】
【0013】
【課題を解決するための手段および作用】本発明の文
処理装置は、1枚以上の原稿文書を画像として入力する
文書画像入力手段(図1の11、図19の191、図2
2の221、図23の231)と、その文書画像入力手
段から入力された文書画像上の画素の集まりを、それぞ
れ文書要素として意味のある塊として領域に分割する領
域分割手段(図1の12、図19の192、図22の2
22、図23の232)と、その領域分割手段によって
分割された文書画像上の各領域に、それぞれ文書の論理
的な意味付けを表す識別子を付与する論理識別子付与手
段(図1の13、図19の193、図22の223、図
23の233)と、その識別子付与手段によって付与さ
れた識別子を持つ文書領域のうち、サマリ作成に必要な
識別子を持つ文書要素を抽出する必要要素抽出手段(図
1の14、図19の194、図22の224、図23の
234)と、その必要要素抽出手段によって抽出された
文書要素に対応する領域の部分画像を基に出力画像を生
成する出力画像生成手段(図1の15、図19の19
8、図22の225、図23の235)とを具備する。
【0014】その動作においては、文書画像入力手段に
より入力され保持されている1枚以上の文書画像は、そ
れぞれ領域分割手段により文書要素として意味のある領
域に分割される。領域分割結果は、例えば、レイアウト
識別子、領域種別、領域の寸法、位置を含む領域情報と
領域間の関係を表す情報とを含むレイアウト構造情報と
して出力される。そして論理識別子付与手段によって各
領域に論理識別子が付与される。前記論理識別子付与手
段は、本発明の一態様では、対象となる文書に現れる文
書要素と文書要素間の相対的な位置関係を記述した構造
モデルをあらかじめ1つ以上保有し、領域分割手段から
得られた領域分割の結果のレイアウト構造と比較して合
致する構造モデルを選択し、各領域に対しタイトル、著
者、本文などのような領域に対する論理的な意味を持つ
論理識別子を高い精度で付与することができるもので
る。また、その論理識別子付与手段に登録する構造モデ
ルの変更や新規登録を行うためには入力手段(図22の
227、図23の239)を設けるとよい。必要要素抽
出手段は、サマリ作成に必要な識別子例えばタイトル、
著者、あらましなどを持つ文書要素を抽出する。具体的
には、必要要素抽出手段はあらかじめ定義された簡易な
言語で記述された必要要素の論理識別子を抽出指示デー
タとして保有しており、この抽出指示データと照合して
必要要素を抽出する。なお、この抽出指示データを必要
要素抽出手段に入力するための入力手段(図22の22
7、図23の239)を設ければ、抽出指示データの変
更を容易に行うことができる。出力画像生成手段は、そ
の必要要素抽出手段によって抽出された文書要素に対応
する領域の部分画像を基に出力画像を生成する。出力画
像の生成には、本発明では2つの態様があり、その一つ
は部分画像をそのまま再配置して出力画像を生成するも
のであり、他は部分画像を加工したのち再配置して出力
画像を生成するものである。後者の部分画像を加工した
のち再配置する態様は、前記必要要素抽出手段の必要要
素の指定に対してデザインパラメータを付与し、出力画
像生成手段でそのデザインパラメータに応じて抽出され
た文書要素に対応する領域の部分画像を変換・加工した
後、再配置することにより出力画像を生成するものであ
る。これによれば、出来上がったサマリ文書の見栄えが
よくなり、また、利用者がより理解しやすくなる。な
お、そのデザインパラメータを、あらかじめ定義された
フォーマットで記述されたデザイン指定の表として用意
し、そのデザイン指定の表を必要要素抽出手段に入力す
るための入力手段(図22の227、図23の239)
を設けることにより、必要に応じて出力文書のデザイン
を容易に変更することができる。出力画像生成手段によ
り生成された出力文書画像は、例えばプリンタやCRT
ディスプレイ装置などの可視化手段を用いることにより
可視化メディア上に可視化することができる。
【0015】また、本発明の他の態様では、上記サマリ
文書を作成するための文書処理装置において、さらに前
記文書要素選択手段によって選択された文書要素に対応
する領域の部分画像を文書画像ごとに論理識別子と対に
して保持しておく部分画像蓄積手段と、前記部分画像蓄
積手段に蓄積された画像から、ソーティングのキーとな
る論理識別子を持つ要素の部分画像を文字コード列に変
換する文字認識手段と、前記文字認識手段で得られた文
字コード列をもとにソーティングを行い、文書画像の出
力順序を決定するソーティング手段とを備え、前記出力
画像生成手段は、前記ソーティング手段によって得られ
た文書画像の出力順序にしたがって、前記必要要素抽出
手段によって抽出された文書要素に対応する領域の部分
画像を基に出力画像を生成するものである。その動作
は、部分画像蓄積手段に蓄積された画像から、ソーティ
ングのキーとなる論理識別子を持つ要素の部分画像を文
字認識手段により認識し、認識出力の文字コード列をソ
ーティング手段によりソーティングし、そのソーティン
グの結果は各サマリ文書画像を並べる順序を決めるため
に出力画像生成手段によって用いられる。キーとしては
例えば「日付」が用いられる。キーに用いる文字の種類
は限られるので、文字認識手段は極めて簡単な構成のも
のでよい。この発明の態様では、キーとなる要素を文字
認識してソーティングする機能を付加したので、複数の
サマリの文書がソーティングの結果を用いて順序よく並
べることができ、利用者が検索するのに容易となる。
【0016】また、本発明の他の態様による文書処理装
置は、目次を作成すめためのものであり、複数枚の文書
画像を保持する文書画像保持手段(図26の261)
と、前記文書画像保持手段から入力される各文書画像
を、文書要素として意味のある領域に分割する領域分割
手段(図26の262)と、その領域分割手段により得
られた文書要素に、論理的な意味付けを持つ識別子を付
与する論理識別子付与手段(図26の263)と、各文
書画像ごとに、そのページ番号を決定すると共に、前記
論理識別子付与手段により付与された識別子を基に目次
を構成するのに必要な文書要素を抽出する目次構成要素
抽出手段(図26の264〜5)と、その目次構成要素
抽出手段によって抽出された目次構成に必要な文書要素
および対応するページ番号を基に、一定のデザインによ
って目次画像を生成する出力画像生成手段(図26の2
68〜2610)とを備えている。その動作において、
目次構成要素抽出手段は、論理識別子を基に、目次を構
成するのに必要な文書要素を抽出する。またその文書要
素のあるページ番号を決定する。ページ番号決定のため
の具体的態様においては、処理対象とする文書画像の枚
数を数える画像枚数カウント手段(図26の264)を
設けると共に、前記目次構成要素抽出手段は、前記画像
枚数カウント手段のカウントした枚数と文書画像の処理
順番とによりページ番号を決定する。出力画像生成手段
は、目次構成に必要な文書要素および対応するページ番
号を基に、一定のデザインによって目次画像を生成す
る。この発明によれば、大量の文書に対して目次を自動
的に生成することができるので、何枚目にどの文書があ
るかを容易に知ることができる資料を簡単な操作によっ
て作るができる。
【0017】本発明の他の態様は、上記の目次作成用の
文書処理装置において、目次を作成するだけでなく、各
文書画像にページ番号を付与するようにしたものであ
る。すなわち、その文書処理装置において、前記目次構
成要素抽出手段は、各文書画像に対してページ番号に対
応する論理識別子の付与された文書要素をも抽出するも
のであり、前記出力画像生成手段は、目次およびページ
番号付き文書からなる出力画像を生成するために、前記
目次構成要素抽出手段によりページ番号に対応する論理
識別子の付与された文書要素が抽出された場合には、そ
の文書要素の領域を削除して新たにページ番号を付与
し、抽出されなかった場合には文書画像の所定の位置に
新たにページ番号を付与するページ番号付与手段(図2
6の267)を有する。この発明によれば、各文書画像
に対してページ番号を付け直すので、対応が分かりやす
い目次付きかつページ番号入りの文書を作成することが
できる。
【0018】
【実施例】
(第1の実施例)以下、添付図面にそって実施例の説明
を行う。本発明をデジタル複写機のような紙を入出力メ
ディアとするような機器に応用した例を図1に示す。こ
の実施例の装置は、同図に示すように、1枚以上の原稿
文書を画像として入力し、保持する文書画像入力部11
と、その文書画像入力部11から入力された文書画像上
の画素の集まりを、それぞれ文書要素として意味のある
塊として領域に分割する領域分割部12と、その領域分
割部12によって分割された文書画像上の各領域に、そ
れぞれ文書の論理的な意味での識別子を付与する論理識
別子付与部13と、その識別子付与手段13によって付
与された識別子を持つ文書領域のうち、サマリ作成に必
要な識別子を持つ文書要素を抽出する必要要素抽出部1
4と、その必要要素抽出部14によって抽出された文書
要素に対応する領域の部分画像をそのまま、あるいは加
工したのちに再配置して出力画像を生成する出力画像生
成15と、その出力画像生成部15が生成した出力文書
画像を可視化メディアである紙上に印刷して可視化する
プリントアウト部16とを備えている。
【0019】原稿画像入力部11はADF(オートドキ
ュメントフィーダ)が付属しているイメージスキャナの
機構そのものであり、ADFによって原稿を1枚づつ順
に読み取っていく。読み込みは副走査方向に光源とイメ
ージセンサからなる読み取り部をずらしながら主走査方
向の細長い領域を光源で照射し、反射した光をレンズで
集光してCCDイメージセンサ等によって電気信号に変
換し、二値のデジタル画像として入力画像メモリに取り
込む。もちろん、反射光の強弱をAD変換器を通して多
値の画像として入力しデジタル画像処理で二値化しても
かまわない。
【0020】領域分割部12は文書画像を入力として、
文字領域、図表領域などに分割する処理であり、文書認
識技術における領域分割処理に対応する。これは公知の
技術によって実現される。例えば特開昭64−1588
9公報あるいは特公昭61−32712公報等に示され
ている技術がそれにあたる。ここでの領域分割部12は
それぞれの領域を矩形に分割して出力する。この処理を
行う前に傾き補正、ノイズ除去等の前処理を行ってもよ
いことはいうまでもない。この処理で分割された領域は
文字、図形、けい線などに識別され、これらの種別も同
時に付加されて出力される。領域を表現する矩形は原稿
画像のx,y方向それぞれに平行な辺を持ち、対象とな
る領域を囲む最小矩形とする。領域を表現するデータは
基本的に「種別、左上点x座標、左上点y座標、幅、高
さ」の組で表現される。この処理から結果として出力さ
れる要素の列を文書のレイアウト構造と呼ぶ。
【0021】論理識別子付与部13は、領域分割部12
において得られた文書のレイアウト構造を入力とし、そ
れぞれに「タイトル」、「著者」、「本文」などといっ
た論理的な名称を識別子として付与するものである。こ
れは本出願人によって先に出願された特願平3−313
186号「文書論理構造認識および文書内容認識のため
の装置および方法」に記載されている技術を用いるのが
よい。この技術では、認識対象文書のレイアウトと論理
構造の対応を表現する構造モデルをあらかじめ登録して
おき、領域分割結果と構造モデルとのマッチングを行
い、マッチングが成功したものについてそれぞれの論理
的な意味を表現する名称を付与することを行う。名称が
付与されたレイアウト構造を論理構造と呼ぶ。
【0022】必要要素抽出部14ではサマリ作成に必要
な要素を取り出す。論理識別子付与部13で得られた論
理名称を持つ要素のうち、あらかじめ指定しておいた
「タイトル」「著者」「あらまし」などの論理名称を持
つ要素を取り出すことを行う。
【0023】出力画像生成部15では必要要素抽出部1
4で取り出された要素に対応する領域の部分画像を出力
画像メモリ151に順に配置してしていく。
【0024】プリントアウト部16では出力画像メモリ
151上の画像を受け取り、レーザビームプリント技術
を用いて紙の上に転写し、排出する。
【0025】次に、実際の文書例を用いて本実施例の動
作を処理の順に説明する。処理のフローチャートは図2
に示す。なお、ここでの例では文書は論文のカバーペー
ジで、図3〜図5に示すような3種類の論文が入力され
ることを想定している。以後座標系を図3中に示すよう
にページ右に向かう方向をx方向、ページ下に向かう方
向をy方向とする。利用者はまずサマリを作成したい論
文のカバーページを重ねてADF上に置く。操作パネル
上のスタートボタンを押すと1枚づつ文書が順にデジタ
ル画像として入力される(ステップS203)。
【0026】読み込まれた1枚の文書画像は領域分割部
12に送られ、領域分割処理が行われる(ステップS2
04)。領域分割処理部12での処理の結果、図3の文
書画像は図6に示すように文字が規則的に並んでいる領
域(文字ブロック領域)、大きな図形が存在する領域
(図形領域)、けい線が存在する領域(けい線領域)と
それ以外(余白)に分割される。領域分割の結果(レイ
アウト構造)は図7のようにテーブル形式で表現され、
論理識別子付与部13に送られる。
【0027】論理識別子付与部13では、受け取ったレ
イアウト構造と保持している構造モデルとのマッチング
を行い、レイアウト構造中の要素の論理的な意味合いを
示す名称を識別子として与える(ステップS205)。
論理的な意味合いを示す名称とは例えば「タイトル」、
「著者」、「サブタイトル」、「本文」、「脚注」、
「脚注罫」などである。通常、ある範囲で流通する文書
は「タイトル」、「著者」は上下配置になっているな
ど、ある程度固定的なデザインの文書が多い。この性質
を利用するのが構造モデルで、構造モデルとはすなわち
対象となる文書のデザインについてのテンプレートであ
る。これらテンプレートである構造モデルはあらかじめ
複数記憶しておく。構造モデルは要素をその種別(文字
ブロック、図形、けい線など)と対応する論理名称を持
つノード、これら要素間の相対的な位置関係をリンクと
するようなグラフ構造で表現される。この例における3
種類の文書の構造モデルは図8〜図10に示すようにな
る。マッチング処理とはすなわち登録してある複数の構
造モデルのうち、どれとマッチするかの判定を行うこと
である。まず、登録されている構造モデルを1つずつ取
り出し、構造モデルに記述されている要素間の相対的な
位置関係がすべて満たされているかどうかを調べる(ス
テップS206)。満たされていれば成功とし、満たさ
れていなければ成功するまで順にマッチング処理を起動
する。もし、すべての構造モデルとのマッチングが失敗
したならば入力文書は処理不可能というメッセージを機
器のパネルに表示し、次の文書の入力を行う。構造モデ
ルとのマッチングが成功した場合はレイアウト構造にお
ける要素と構造モデルのノードとの対応がわかるため、
これを利用してレイアウト構造のマッチングの対象とな
った各要素に構造モデルのノードに定義されている論理
名称を付与する。このようにレイアウト構造の要素に論
理名称が付与されたデータを論理構造と呼ぶ。図7のレ
イアウト構造と図8の構造モデルがマッチングが成功す
る。この論理構造を表現する実際のデータは図11に示
すように名称とそれに対応する要素の番号の対の列で表
現される。ここで対応する要素の番号とは図7の表にお
いて各要素にふられている番号欄の番号のことである。
図11の表で表現された対応と図7の表で表現されたレ
イアウト構造を合わせて必要要素抽出部14に送る。
【0028】必要要素抽出部14ではあらかじめ指定し
ておいた論理識別子を得られた論理構造から順に取り出
す(ステップS207)。ここでは「タイトル」「著
者」「あらまし」が指定されているものとする。この3
つの論理識別子は3種類の文書にいずれも含まれている
共通な識別子である。このため、異なるレイアウトがな
されている文書でも共通な識別子を持つものからサマリ
を作成することができる。これら3つの論理識別子に対
応する領域の部分画像を図3の入力文書画像から切り出
し、出力画像生成部15に送る。切り出された部分画像
は図12で示される。
【0029】出力画像生成部15では切り出した部分画
像データを順に出力画像メモリ151に配置していく
(ステップS211)。配置する位置のx座標は固定で
左マージン分確保しておく。y座標は直前に配置された
要素の矩形の下辺のy座標にあるマージンを加えた値を
記憶しておき、その位置に配置する。もし、配置しよう
とする領域矩形の高さが出力画像メモリ上に残っている
高さ(画像メモリのy座標の最大値と配置された要素の
一番下のy座標との差)より大きく、配置できない場合
は、出力画像メモリをプリントアウト部に送り、これま
で配置された内容を先に出力する(ステップS20
9)。こののち、出力画像メモリをクリア(出力すると
白紙の状態)し(ステップS210)、y座標の位置を
最上部(=上マージン)の値に戻し、新たに順に配置し
ていく(ステップS211)。1枚の文書の必要要素の
配置が終了したならば、次の文書との区切りを明らかに
しておくためにさらにマージンを加えてy座標の位置を
更新しておく。いま、最初の文書の要素がすべて配置さ
れた時点での画像メモリの状態は図13のようになる。
最後に配置した「あらまし」の画像の下辺のy座標が
a、要素間のマージンがb、1枚の文書の要素配置が終
了したときに加えるマージンがcである。したがって、
次の文書の「タイトル」はa+b+cの位置に配置され
る。
【0030】1枚の文書についての処理が終了したなら
ば、次の文書を読み込み、同様の処理を繰り返す。これ
をすべての文書について終了したならば、残っている出
力画像メモリをプリントアウト部16に送り、紙にマー
キングして処理を終了する(ステップS212、S21
3)。これによって得られた結果は図14に示すような
ものになり、サマリ文書ができあがる。
【0031】(第2の実施例)前述の実施例において、
文書の種類によって同じ識別子を持つ要素でも文字の大
きさなどが異なる場合、単に文書の部分画像を配置する
だけは体裁がととのわず、見栄えの悪いサマリ文書が出
力されてしまう。さらに出力されるサマリ文書を見栄え
を良くし、利用者がより理解しやすいようにするための
例をここでは述べる。この機能は、必要要素抽出部14
において必要要素の指定に論理識別子に加えて最終的な
文書要素のデザイン指示を与えておき、多種の文書にお
いて異なるデザイン(文字の大きさ、文字ブロックの幅
など)の要素をできるだけ共通なデザインに変更して出
力する処理を行うことにより実現される。この第2の実
施例の基本的な機器構成は第1の実施例と共通であり、
内部的な処理が拡張されている。変更される部分は領域
分割部12の出力のデータ構造が階層的になること、出
力画像生成部15で部分画像をそのまま出力画像メモリ
に配置するのではなく、デザイン指示に応じて画像変換
を行うことである。
【0032】まず、必要要素抽出部14において、必要
要素の指定に論理識別子だけでなく、最終的なデザイン
のためのパラメータを追加しておく。この指定は図15
に示すようなテーブルにより行う。
【0033】さらに領域分割部12の出力のうち、文字
ブロック領域に関しては図16に示すようにブロックの
中の行、行の中の文字と階層的な領域のデータを出力す
るように変更する。これは実際のデータ構造としては図
17のようにテーブル形式となり、上位・下位の階層関
係が要素番号によって規定されている。
【0034】必要要素抽出部14で、論理識別子から切
り出された必要要素の部分画像は指定されたデザインパ
ラメータとともに出力画像生成部15に送られ、文字画
像生成処理が行われる。文字画像生成処理は文字流し込
み処理、領域拡大・縮小処理の2つの処理からなる。文
字流し込み処理は文字ごとに切り出されている画像をあ
る幅に収まるように再配置するというものでこれは既存
の技術、例えば特開平3−122773公報記載の技術
がある。あるいは公知ではないが本出願人が先に出願し
た特願平4−090146号「文書処理装置」で開示さ
れている技術を用いるのが好適である。拡大・縮小処理
をこの処理の後に行うためにまず拡大率rを計算する。
拡大率はデザインパラメータで指定されている文字サイ
ズに対する入力文書における文字サイズとの比で表され
る。入力文書における「あらまし」領域の文字サイズは
文字行の高さの平均値から文字サイズは10ポイントで
あることがわかる。一方、個別デザインパラメータテー
ブルで指定されている文字サイズは8ポイントなので、
拡大(縮小)率を4/5とする。次にデザインパラメー
タの最大幅を拡大率で割って流し込みの幅を計算する。
「あらまし」はレイアウト幅が150mmという指定で
あるので、流し込み幅は187.5mmとなる。この幅
にこの文字領域中の文字が並ぶように再配置する。
【0035】文字流し込み処理を上記特願平4−090
146号の発明を用いて行う場合は、図32に示すよう
に流し込み処理に関連する部分を構成する。すなわち、
領域分割部には、入力画像メモリに保持されている文書
画像から、サブ文字パターンを抽出するサブ文字パター
ン抽出部324と、前記抽出の結果得られたサブ文字パ
ターンに関する情報を記憶するサブ文字パターン情報記
憶部325を設ける。また、出力画像生成部には、サブ
文字パターン情報記憶部325に記憶されたサブ文字パ
ターン情報をもとに、入力画像メモリ111に記憶され
たイメージ情報における各サブ文字パターンを切り出
し、所望の領域内に配置ルールに従って再配置する流し
込み処理部320を設ける。その流し込み処理部320
は、サブ文字パターンの配置に関する配置ルールを格納
する配置ルール記憶部323と、サブ文字パターン情報
記憶部325に記憶されたサブ文字パターン情報と配置
ルール記憶部323に記憶された配置ルールをもとに行
末行頭の配置の是非を判定する配置判定部322と、そ
の配置判定部322の判定結果と前記サブ文字パターン
情報記憶部325の記憶するサブ文字パターン情報に基
づき、入力画像メモリ111に記憶された文書画像から
サブ文字パターンを切り出して所望の領域内に配置する
配置処理部321とを有する。
【0036】サブ文字パターン抽出部324は、前記イ
メージ情報に対して、例えば黒画素塊に外接する矩形領
域を求め、一定の条件を満たすものを抽出するなどして
サブ文字パターンを抽出する。サブ文字パターン情報記
憶部325は、前記抽出したサブ文字パターンに関する
情報、例えば前記外接矩形領域の位置、範囲、行の高さ
に対する相対位置等の情報、を記憶する。前に述べたよ
うに、本実施例では図16および図17に示すように領
域分割部12は階層構造を以て文字領域を抽出するの
で、サブ文字パターンはその一番下位の層に該当する。
【0037】流し込み処理部320は、サブ文字パター
ン情報をもとに、入力画像メモリ111から各サブ文字
パターンを切り出し、これを所望の領域内に配置ルール
に従って流し込む。配置ルールは、例えば改行する際に
行末、行頭へ配置してはならないサブ文字パターンの条
件を定めるものである。すなわち、配置ルール記憶部3
23は、例えば改行する際に行末、行頭へ配置してはな
らないサブ文字パターンの条件を定める配置ルールを記
憶しており、配置判定部322は、サブ文字パターン情
報記憶部325に記憶された外接矩形情報等のサブ文字
パターンの属性情報を配置ルールと照合して、改行可能
性、サブ文字パターン間へのスペース挿入の要否などを
判定する。配置処理部321は、サブ文字パターン情報
における位置、範囲情報により入力画像メモリ111か
らサブ文字パターンを読み出して、配置判定部322の
判定結果に応じた再配置処理を行う。
【0038】次に領域拡大・縮小処理が呼び出され、拡
大率にしたがって、流し込まれた画像をレイアウト幅が
150mmとなるように拡大・縮小を行う。このように
して得られた変換画像を第1の実施例と同様に再配置し
ていく。
【0039】以上のような処理で得られた出力画像を第
18図に示す。図14に示す第1の実施例の出力画像に
比べてそれぞれ同じ識別子を持つ領域の文字の大きさが
揃い、また、それぞれの「あらまし」は文字ブロックの
幅が揃って非常に見栄えのよい出力が得られるのが分か
る。この出力画像はそれぞれ1ラインずつ読み取られ、
レーザビームプリンティングによって普通紙上に印字さ
れ出力される。
【0040】(第3の実施例)この第3の実施例は、第
1あるいは第2の実施例において、さらにファイリング
のためにソーティング機能を付加した構成のものであ
る。ソーティングは文書の部分画像からだけでは不可能
であるので、文字内容をコード化したデータが必要とな
る。このため、図19に示すように、第1または第2の
実施例における機器構成に加えて、部分画像蓄積部19
5と、文字認識部196、ソーティング処理部197と
を追加する。
【0041】いま、対象をオフィス内の文書ということ
を前提とし、対象としては図20に示すような部署間の
連絡書ということとする。連絡書は共通のレイアウトで
はあるが、さまざまなワードプロセッサで作成され、ハ
ードコピー文書として部署に送付されてくる。サマリと
して必要な論理識別子として「連絡書番号」、「発信部
署」、「日付」、「件名」とし、ソートキーを「日付」
とする。まず、サマリを作成したい複数の連絡書を重ね
て機器に備付けられているADFへ置く。順に原稿が読
み取られ、それぞれ読み込まれた文書画像は、領域分割
部192による領域分割、および論理識別子付与部19
3による論理構造ラベリングが施された後、必要要素抽
出部194へ送られる。必要要素抽出部194ではやは
りあらかじめ登録しておいた論理識別子を持つ部分画像
と領域データを対にして原稿の順番に部分画像蓄積部1
95に送り、登録していく。すべての原稿に対する処理
が終了した時点で、「日付」に対応する部分画像のみを
文字認識部196に順に送っていき、文字コードに変換
し、部分画像蓄積部195の各原稿のソートキーとして
追加する。ソーティング処理部197により日付のソー
トを行ったあと、そのソートの結果の順に各要素の画像
を出力画像生成部198に送り、画像変換を行ったあ
と、出力画像を生成し、プリントアウトしていく。認識
された文字コードは日付の場合は年月日の順に階層化さ
れ、文字コードから数値データに変換されソートされ
る。これによって出力された文書を図21に示す。
【0042】ここでの文字認識処理はソーティングに必
要な部分にだけ処理が行われるため、処理全体に対する
負荷は大きなものにはならない。これは一般的な文字認
識アルゴリズム、特徴量辞書を用いて実現してもかまわ
ない。しかし、例えば、日付だけであれば字種は数字
(和英)、年、月、日など十数個のもので足り、出現す
る文字パターンは“XX年YY月ZZ日”というパター
ンを仮定できるので、例えば「対象文書に関する知識を
援用した手書き文書からの文字切り出しの一提案」(馬
場口他、電子情報通信学会技術報告PRU85−63)
などに開示されている技術を用いてキー文字(ここでは
“年”,“月”,“日”)を最初に取り出しておき、そ
の前後はある限られた数字しか出現しないという知識を
利用して精度よく高速の文字認識処理を行うことができ
る。部署名なども同様に字種は限られており、“XX部
YY課”などの文字パターンを想定できる。このような
文字パターン、必要な字種の特徴量辞書だけを入れ替え
てやればいろいろな用途に用いることができる。これら
データの入れ替えは第1の実施例の最後で述べたように
構造モデルの変更および必要要素の論理識別子指定の変
更方法と同様に実現できる。
【0043】(第4の実施例)以上において説明した第
1〜第3の実施例の装置において、あらかじめ登録して
おくデータとして、論理識別子付与部では構造モデル
が、必要要素抽出部ではサマリ作成に必要な論理識別子
が必要となる。これらは対象文書が変更されないような
場合は固定的にROM(Read Only Memo
ry)に内部的に記憶させておけばよい。しかし、これ
らのデータは対象に応じて変更させることは容易であ
る。利用者が容易にこれらのデータを変更することがで
きるようにするための機器構成の例について説明する。
【0044】図22および図23にそれぞれ第1、第2
の実施例および第3の実施例にこのデータの変更のため
の技術を適用した構成を示す。構造モデルは図8で示し
たようにグラフ構造で表現される。まず、それを表現す
る簡易な言語を規定する。言語の文法を図24に示し、
図25に図8に示した論文のカバーページの構造モデル
の言語による記述例を示す。ここで示した記述例は最初
に要素種別と論理識別子からなる文書の要素の定義、次
に要素間の上下(図中”aboveBelow”)、左
右(同”leftRight”)などの相対的な位置関
係の定義が記述され、これによってグラフ構造が規定さ
れる。本実施例ではこれらの記述を機器内部に入力する
ためのデータ入力・解析部227を有する。データ入力
・解析部227として例えば、機器本体にフロッピーデ
ィスクドライブを装備しておく。ここではフロッピーデ
ィスクにファイルとして保存されている複数の構造モデ
ル記述を読み込んで内部的なデータ構造に展開すること
を行う。フロッピーディスク以外にシリアルポート等パ
ソコンなどを接続できるようにしておき、パソコンから
構造モデル記述を送信してやることで実現できる。ま
た、図15に示したような必要要素の論理識別子および
そのデザイン指定の表の入力も、あらかじめ定義された
簡易な言語あるいはフォーマットで記述されたデータを
データ入力・解析部227,239を介して外部から入
力することにより実現することができる。さらに実施例
3で示したソート・キーとなる文書要素の論理識別子、
文字認識のための文字パターン、特徴量辞書なども同様
にフロッピーディスク、シリアルポート等から入力する
ことができる。
【0045】以上に、サマリ作成のたの文書処理装置の
諸実施例について詳述したが、ここで、これらの変形・
置換例および他の装置への応用例等について挙げる。
【0046】1つの文書の必要要素の部分画像の配置が
終了したときはマージンを追加すると述べたが、それに
加えて区切り罫を挿入するとより分かりやすくなる。あ
るいは1つの文書の必要要素を囲み罫で囲むということ
も可能である。いずれも出力画像メモリに直接書き込ん
でいく操作であるので容易に実現できる。
【0047】出力画像メモリにはあらかじめサマリ文書
としてのタイトルを書き込んでおくこともできる。「論
文サマリ文書」という文字列の画像を予め登録してお
き、最初の要素を配置するまえに配置しておき、y座標
のどこまで配置されたかをその分加えておけばよい。フ
ッタなどにページ番号、作成日付などを入れることも同
様に効果的で、かつ容易に実現することができる。
【0048】プリントアウト部は実施例はすべて1色マ
ーキングを前提にしていたが、多色レーザプリント技
術、熱転写プリント技術などを用いたカラーマーキング
を行えば、さらに効果的である。フルカラーマーキング
が可能であれば多値の出力画像メモリを3色なら3つ用
意し、必要要素抽出部で指定されていた論理識別子に色
指定を追加し、その色指定に応じて出力画像メモリに書
き込む値を変化させればよい。
【0049】単なるサマリによる内容確認であれば、内
容の可視化手段としてプリントアウト部の代わりにビッ
トマップディスプレイで実現し、出力画像メモリの内容
をビットマップディスプレイの解像度に応じて表示させ
るだけでも目的を果たすことができ、必要なものだけを
紙にマーキングするということを行えば、紙資源の節約
にも貢献できる。
【0050】画像入力部を直接スキャナで実現する必要
はなく、光ディスクファイリングシステムなどに登録さ
れている多くの文書画像を順に送信してやることで実現
することができる。
【0051】(第5の実施例)次に、本発明の文書処理
装置を目次作成装置として構成した実施例について説明
する。この目次作成装置は、図26に示すように、文書
画像保持部261、領域分割部262、論理識別子付与
部263、画像枚数カウント部264、目次構成要素要
素抽出部265、目次構成要素蓄積部266、ページ番
号付加部267、数字データ格納部268、デザインデ
ータ格納部269、出力画像生成部2610、出力画像
メモリ2611およびプリントアウト部2612からな
る。なお、本実施例によれば、図27に示すような複数
の文書画像を入力し、図28に示すように各文書画像に
新たにページ番号を追加し、適当な文書画像中の項目を
用いて目次を自動的に生成することが可能である。
【0052】文書画像保持部261では、文書画像をデ
ィジタル画像として保持し、処理対象となる画像を提供
する。この文書画像保持部261は、文書画像をディジ
タル画像として取り込むことがでぎればよく、特定の手
段でなくてもよい。例えば、すでにデータベースとして
光ディスク装置などの記憶装置に入力されている文書画
像を使う場合は、この光ディスク装置が文書画像保持部
となり、また画像入力装置から新たに入力するのであれ
ば、この画像入力装置のローカルなメモリが文書画像保
持部となる。ここでは、簡単に画像入力装置で処理対象
となる文書画像を入力ものとして説明する。
【0053】画像枚数カウント部264では、処理対象
として入力された文書画像の枚数を計数する。この枚数
は、後の目次構成要素抽出部265においてページ番号
を計算するのに使用する。ページ番号の計数は単純に考
えて最初に入力された文書画像を1ページとすればよい
が、この場合、出力は最後のページとなる文書画像が最
後に出力され、そのあとに目次が出力される。なぜな
ら、目次は全ての文書画像に対する処理が終了しないと
画像を生成できないからである。複写機などの文書処理
装置を考えると、このような出力方法では、1ページ目
の文書画像が一番下にある紙として出力され、一度ペー
ジ番号順に並べかえなくてはならない。このような手間
を回避するために、最終ページとなる文書画像を最初に
読み込む必要があるが、これでは正しいページ番号をそ
のまま付加することができない。従って、予め入力枚数
を計数しておき、この値から各文書画像のページを算出
する必要がある。
【0054】入力された各文書画像は、領域分割部26
2によって文書要素として意味のある領域に分割する。
この処理は第1の実施例で説明したところと同じであ
る。すなわち、この処理は、文書認識技術における領域
分割処理であり、文書のディジタル画像を入力として、
文字領域、図表領域などに分割する処理に対応し、公知
の技術によって実現できる。領域分割処理の結果は、領
域の位置・大きさ、下位要素領域列、分類(文字領域、
図表領域などの区別)を組にしたレイアウト構造として
出力する。
【0055】各文書画像は論理識別子付与部263によ
って、各文書要素の領域に対して「タイトル」、「著
者」、「本文」などの論理的な識別子を付与するもので
ある。この処理も第1の実施例で説明したとおりであ
る。すなわち、認識対象のレイアウト構造と論理構造の
対応を表現する構造モデルを予め複数登録しておき、領
域分割結果と構造モデルとのマッチングによってそれぞ
れの論理的な意味を表現する名称が付与される。
【0056】目次構成要素抽出部265は、各文書画像
から、目次を構成するための文書要素とページ番号とを
取り出し、図29に示すようなテーブルを作成する。こ
のテーブルには目次とするための文書要素を表す部分を
文書画像から切り出した実際の画像も記録されている。
例えば、目次を構成する文書要素を文書中のタイトルと
すると、論理識別子付与部263において付与された論
理識別子中からタイトル部分を示す領域の情報すなわち
タイトルの領域の左上点の座標(X座標、Y座標)、
幅、および高さを取り出す。そして、その領域に対応す
る文書画像の部分画像を文書画像保持部261に保持さ
れている文書画像から切り出し、目次構成要素蓄積部2
66に格納し、前記テーブルにその部分画像のポインタ
を付加する。また、ページ番号はその文書画像がN番目
に処理されているとし、入力される文書画像がM枚とす
ると次式によりページ番号Pを求めることができる。 P=M−N+1 そして求めたページ番号Pを前記テーブルに格納する。
このようにして目次構成要素抽出部265により生成さ
れたテーブルは、各文書画像が処理される度に順番に目
次構成要素蓄積部266に蓄積される。この目次構成要
素蓄積部266は、各処理で抽出された目次構成要素を
一時的に蓄積するための手段であり、その構成が半導体
の記憶媒体上に構成されようとハードディスク上に構成
されようと構わない。
【0057】各文書画像は、上記の処理と共にページ番
号付加部267において新たにページ番号の追加が行わ
れる。この処理を図30に示すフローチャートを用いて
説明する。まず、各文書画像中にページ番号を表す論理
識別子が論理識別子付与部において付与されていないか
調べる(ステップS301)。ページ番号を表す論理識
別子が付与されている場合、その領域を文書画像のバッ
クグラウンドを表す画素で埋め尽くすことにより原稿の
ページ番号を削除する(ステップS302)。例えば、
文書画像が、文字などを表す黒画素を“1”で、その他
の部分を白画素“0”で表現されていると、ページ番号
を表す論理識別子が付与されている領域を白画素“0”
で埋め尽くす処理を行う。さらに、いま白画素で埋め尽
くした領域に、新たなページ番号の付加を行う(ステッ
プS304)。ページ番号を表す論理識別子が付与され
ていない文書画像に対しては、ページ番号を追加するた
めのある一定の大きさの領域を空けるために、各文書要
素の領域に対して拡大・縮小などを行う(ステップS3
03)。このようにして確保したページ番号のための領
域に、新たにページ番号の追加を行う(ステップS30
4)。ここで使用するページ番号は、目次構成要素抽出
部265によって抽出されたページ番号であり、このペ
ージ番号に相当する文字画像のデータを数字データ格納
部268から取り出して、文書画像を構成する他の部分
と合成して新たにページ番号が追加された文書画像を画
像生成部2610において生成する。
【0058】一方、目次を表す文書画像は、入力された
全ての文書画像に対して上記の処理を施した後、目次構
成要素蓄積部266に蓄積されているデータを用いて文
書画像を生成する。このとき、目次を構成する文書画像
のタイトル部分とページ番号はデザインデータ格納部2
69に格納されているデータに従って配置され、ページ
番号については数字データ格納部268から相当する文
字画像を取り出してきて、画像生成部2610において
目次を表す文書画像を生成する。このときのデザインデ
ータは図31に示すようなテーブルで表現され、各項目
ごとに領域の基準位置、最大幅、文字の大きさ、文字修
飾の方法などが記されている。それぞれの位置は、他の
項目に対する相対位置で表されているが、これは他の項
目の文字量によって配置する位置が異なってくるためで
ある。なお、単位は全てmmである。画像生成部261
0では、デザインデータ格納部269からのデザインデ
ータに従って各項目を配置するために、目次構成要素蓄
積部266に蓄積されているタイトルの画像を各文字を
表す部分画像に再分割を行う。この再分割した画像をデ
ザインデータで指定された場所に順次流し込んで行く。
この流しこみ処理は、例えば第2の実施例において、図
32を用いて説明した技術を用いることができる。以上
の処理によって、入力された複数の文書画像に新たにペ
ージ番号を付加して、対応する目次を生成することがで
きる。
【0059】本実施例では、文書画像中のタイトルを用
いて目次を生成する例を説明しているが、もちろん文書
画像の使用目的によって、文書画像中のタイトルではな
く、著者名や日付などを用いることも可能である。ま
た、本実施例では入力された文書画像中のタイトル部分
を文字認識し、文書画像中の文字と異なったフォントで
目次を生成することも可能である。
【0060】なお、以上に説明した第1ないし第5の実
施例において、原稿画像入力部、プリントアウト部、デ
ータ入力・解析部等は、既存のハードウェア技術によっ
て構成することができる。また、領域分割部、論理識別
子付与部、必要要素抽出部、ソーティング処理部、文字
認識部、出力画像生成部等の一部または全部を、ソフト
ウェアモジュールとして構成し、それらのソフトウェア
モジュールをROMあるいはその他の適宜の記憶装置に
格納し、中央処理装置により実行するようにしてもよ
く、あるいは、それらを個別の論理素子を組み合せた論
理回路によるハードウェアモジュールとして構成しても
よい。
【0061】
【発明の効果】本発明によれば、原稿の文書画像から所
望の文書要素の箇所のみを取り出して構成した文書画像
を自動的に作成することができる。したがって、従来は
人手により、あるいは文字認識装置によりコード化した
後にしかできなかった、文書のサマリやリストの作成、
あるいは目次の作成等が自動的にかつ容易にできるの
で、文書の量が増えてもその管理が容易となる。
【00062】また、本発明によれば、書式の異なる原
稿を含む複数の文書原稿の画像からそれぞれ概要を把握
するのに必要な文書要素を抽出し、所定の書式に従って
配置してサマリ文書群を自動的に生成する文書処理装置
を得ることができる。したがって、この装置により文書
をサマリ化して、文書管理を効率的に行うことができ
る。また、本発明は、複数の文書原稿の画像から抽出し
た特定の文書要素を文字認識し、それをキーとしてソー
ティングを行って、サマリ文書を配列するようにしたこ
とにより、必要な文書を検索するのが容易になる。
【0063】また、本発明によれば原稿の文書画像から
見出しの文書要素を取り出して目次を自動的に生成する
文書処理装置を得ることができるので、何枚目にどの文
書があるかを容易に知ることができる資料を簡単な操作
によって作るができる。
【0064】また、本発明のページ番号付加手段を設け
た態様によれば、各文書画像に対してページ番号を付け
直すので、対応が分かりやすい目次付きかつページ番号
入りの文書を作成することができる。
【図面の簡単な説明】
【図1】 第1の実施例の概略の構成を示すブロック図
【図2】 第1の実施例の処理の流れを示すフローチャ
ート
【図3】 入力された1枚目の文書画像の例を示す図
【図4】 入力された2枚目の文書画像の例を示す図
【図5】 入力された3枚目の文書画像の例を示す図
【図6】 図3の文書画像を領域分割した結果の例を示
す図
【図7】 領域分割の結果(レイアウト構造)をテーブ
ル形式で表現した例を示す図
【図8】 図3の文書画像のグラフ構造で表現された構
造モデルを示す図
【図9】 図4の文書画像のグラフ構造で表現された構
造モデルを示す図
【図10】 図5の文書画像のグラフ構造で表現された
構造モデルを示す図
【図11】 入力文書例と構造文書モデル例とのマッチ
ング結果の一例を示す図
【図12】 図3の文書画像例から切り出されたサマリ
作成に必要な3つの論理識別子に対応する領域の部分画
像を示す図
【図13】 1枚の文書の必要要素の配置を説明するた
めの図
【図14】 第1の実施例により作成されたサマリ文書
の例を示す図
【図15】 必要要素抽出部における必要要素の指定を
行うためのテーブルの例を示す図。
【図16】 領域分割部の処理結果の階層構造と入力文
書例との対応を示す図
【図17】 領域分割部の処理結果のデータの階層構造
を示す図
【図18】 第2の実施例により作成されたサマリ文書
の例を示す図
【図19】 第3の実施例の概略の構成を示すブロック
【図20】 第3の実施例の説明に用いる文書画像の例
を示す図
【図21】 第3の実施例により作成されたサマリ文書
の例を示す図
【図22】 第1、第2の実施例にデータの変更を行う
ためのデータ入力・解析部を設けた変形例を示す図
【図23】 第3の実施例にデータの変更を行うための
データ入力・解析部を設けた変形例を示す図
【図24】 構造モデルを表現する簡易な言語の文法を
示す図。
【図25】 図8に示した論文のカバーページを構造モ
デルの言語により記述した例を示す図
【図26】 文書処理装置を目次作成装置として構成し
た第5の実施例を示すブロック図
【図27】 目次作成のために入力された複数の文書画
像の例を示す図
【図28】 図27の文書画像に目次作成処理により目
次が作成され、ページ番号が付与された文書画像を示す
【図29】 目次構成要素の抽出結果を示すテーブルの
例を示す図
【図30】 ページ番号付加部による新たにページ番号
の追加を行う処理を示すフローチャート
【図31】 デザインデータテーブルを示す図
【図32】 文字の流し込み処理を行うための構成の一
例を示すブロック図
【符号の説明】
11,191,221,231…原稿画像入力部、1
2,192,222,232.262…領域分割部、1
3,193,223,233,263…論理識別子付与
部、14,194,224,234…必要要素抽出部、
15,198,225,238,2610…出力画像生
成部、151,2611…出力画像メモリ、16,19
9,226,2611…プリントアウト部、195,2
35…部分画像蓄積部、196,236…文字認識部、
197,237…ソーティング処理部、227,239
…データ入力・解析部、261…文書画像保持部、26
4…画像枚数カウント部、265…目次構成要素抽出
部、266…目次構成要素蓄積部、267…ページ番号
付加部、268…数字データ格納部、269…デザイン
データ格納部。
フロントページの続き (56)参考文献 特開 昭57−199066(JP,A) 特開 昭59−16040(JP,A) 特開 昭59−43432(JP,A) 特開 昭59−148944(JP,A) 特開 昭60−11918(JP,A) 特開 昭60−17522(JP,A) 特開 昭60−57422(JP,A) 特開 昭60−82374(JP,A) 特開 昭60−211567(JP,A) 特開 昭61−265662(JP,A) 特開 昭61−281377(JP,A) 特開 昭62−55769(JP,A) 特開 昭62−117059(JP,A) 特開 昭62−249270(JP,A) 特開 昭62−271171(JP,A) 特開 昭63−59658(JP,A) 特開 昭63−184159(JP,A) 特開 昭64−4864(JP,A) 特開 昭64−15889(JP,A) 特開 昭64−51567(JP,A) 特開 平1−100666(JP,A) 特開 平1−100667(JP,A) 特開 平1−194063(JP,A) 特開 平2−64852(JP,A) 特開 平2−183364(JP,A) 特開 平2−289061(JP,A) 特開 平3−3070(JP,A) 特開 平3−14184(JP,A) 特開 平3−27471(JP,A) 特開 平3−252859(JP,A) 特開 平4−107767(JP,A) 特開 平4−116765(JP,A) 特開 平5−334370(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 11/60 G06T 1/00 G06F 17/21 501 G06F 17/21 546 特許ファイル(PATOLIS) JICSTファイル(JOIS)

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】 1枚以上の原稿文書を画像として入力す
    る文書画像入力手段と、 その文書画像入力手段から入力された文書画像上の画素
    の集まりを、それぞれ文書要素として意味のある塊とし
    て領域に分割する領域分割手段と、 その領域分割手段によって分割された文書画像上の各領
    域に、それぞれ文書の論理的な意味付けを表す識別子を
    付与する論理識別子付与手段と、 その識別子付与手段によって付与された識別子を持つ文
    書領域のうち、サマリ作成に必要な識別子を持つ文書要
    素を抽出する必要要素抽出手段と、 その必要要素抽出手段によって抽出された文書要素に対
    応する領域の部分画像を基に出力画像を生成する出力画
    像生成手段と、 を具備することを特徴とする文書処理装置。
  2. 【請求項2】前記論理識別子付与手段において、対象と
    なる文書に現れる文書要素と要素間の相対的な位置関係
    を記述した構造モデルをあらかじめ1つ以上登録してお
    き、領域分割手段から得られた結果と合致する構造モデ
    ルを選択し、論理識別子を付与することを特徴とする請
    求項記載の文書処理装置。
  3. 【請求項3】前記論理識別子付与手段に登録する構造モ
    デルの変更や新規登録を行うための入力手段を設けたこ
    とを特徴とする請求項記載の文書処理装置。
  4. 【請求項4】あらかじめ定義された簡易な言語で記述さ
    れた必要要素の論理識別子を必要要素抽出部の抽出指示
    データとして入力するための入力手段を有することを特
    徴とする請求項記載の文書処理装置。
  5. 【請求項5】前記出力画像生成手段は、前記必要要素抽
    出手段によって抽出された文書要素に対応する領域の部
    分画像をそのまま再配置して出力画像を生成するもので
    あることを特徴とする請求項記載の文書処理装置。
  6. 【請求項6】前記必要要素抽出手段の必要要素の指定に
    対してデザインパラメータを付与し、出力画像生成手段
    でそのデザインパラメータに応じて抽出された文書要素
    に対応する領域の部分画像を変換・加工した後、再配置
    することにより出力画像を生成することを特徴とする請
    求項記載の文書処理装置。
  7. 【請求項7】前記出力画像生成手段は、文字ごとに切り
    出されている部分画像をデザインパラメータに指定され
    た領域の幅に収まるように再配置する文字流し込み処理
    と、デザインパラメータに指定された文字の大きさとな
    るように文字流し込み処理により得られた画像の領域拡
    大・縮小処理を行うものであることを特徴とする請求項
    記載の文書処理装置。
  8. 【請求項8】前記必要要素抽出手段にあらかじめ定義さ
    れたフォーマットで記述されたデザイン指定の表を入力
    するための入力手段を設けたことを特徴とする請求項
    記載の文書処理装置。
  9. 【請求項9】 前記出力画像生成手段により生成された
    出力文書画像を可視化メディア上に可視化する可視化手
    段を設けたことを特徴とする請求項記載の文書処理装
    置。
  10. 【請求項10】 請求項2記載の文書処理装置におい
    て、さらに前記文書要素選択手段によって選択された文
    書要素に対応する領域の部分画像を文書画像ごとに論理
    識別子と対にして保持しておく部分画像蓄積手段と、 前記部分画像蓄積手段に蓄積された画像から、ソーティ
    ングのキーとなる論理識別子を持つ要素の部分画像を文
    字コード列に変換する文字認識手段と、 前記文字認識手段で得られた文字コード列をもとにソー
    ティングを行い、文書画像の出力順序を決定するソーテ
    ィング手段とを備え、 前記出力画像生成手段は、前記ソーティング手段によっ
    て得られた文書画像の出力順序にしたがって、前記必要
    要素抽出手段によって抽出された文書要素に対応する領
    域の部分画像を基に出力画像を生成するものであること
    を特徴とする文書処理装置。
  11. 【請求項11】ソート・キーとなる文書要素の論理識別
    子、文字認識のための文字パターン、特徴量辞書などの
    文字認識およびソーティングのためのデータを入力する
    ための入力手段を設けたことを特徴とする請求項10
    載の文書処理装置。
  12. 【請求項12】 複数枚の文書画像を保持する文書画像
    保持手段と、 前記文書画像保持手段から入力される各文書画像を、文
    書要素として意味のある領域に分割する領域分割手段
    と、 その領域分割手段により得られた文書要素に、論理的な
    意味付けを持つ識別子を付与する論理識別子付与手段
    と、 各文書画像ごとに、そのページ番号を決定すると共に、
    前記論理識別子付与手段により付与された識別子を基に
    目次を構成するのに必要な文書要素を抽出する目次構成
    要素抽出手段と、 その目次構成要素抽出手段によって抽出された目次構成
    に必要な文書要素および対応するページ番号を基に、一
    定のデザインによって目次画像を生成する出力画像生成
    手段とを備えたことを特徴とする目次作成用の文書処理
    装置。
  13. 【請求項13】 処理対象とする文書画像の枚数を数え
    る画像枚数カウント手段を有すると共に、前記目次構成
    要素抽出手段は、前記画像枚数カウント手段のカウント
    した枚数と文書画像の処理順番とによりページ番号を決
    定することを特徴とする請求項請求項12記載の目次作
    成用の文書処理装置。
  14. 【請求項14】 前記目次構成要素抽出手段は、各文書
    画像に対してページ番号に対応する論理識別子の付与さ
    れた文書要素をも抽出するものであり、 前記出力画像生成手段は、目次およびページ番号付き文
    書からなる出力画像を生成するために、前記目次構成要
    素抽出手段によりページ番号に対応する論理識別子の付
    与された文書要素が抽出された場合には、その文書要素
    の領域を削除して新たにページ番号を付与し、抽出され
    なかった場合には文書画像の所定の位置に新たにページ
    番号を付与するページ番号付与手段を有することを特徴
    とする請求項請求項12記載の目次付き文書作成用の文
    書処理装置。
JP17370792A 1992-06-02 1992-06-09 文書処理装置 Expired - Fee Related JP3178483B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP17370792A JP3178483B2 (ja) 1992-06-09 1992-06-09 文書処理装置
US08/071,006 US5701500A (en) 1992-06-02 1993-06-01 Document processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17370792A JP3178483B2 (ja) 1992-06-09 1992-06-09 文書処理装置

Publications (2)

Publication Number Publication Date
JPH05342326A JPH05342326A (ja) 1993-12-24
JP3178483B2 true JP3178483B2 (ja) 2001-06-18

Family

ID=15965646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17370792A Expired - Fee Related JP3178483B2 (ja) 1992-06-02 1992-06-09 文書処理装置

Country Status (1)

Country Link
JP (1) JP3178483B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247237A (ja) * 1996-12-30 1998-09-14 Ricoh Co Ltd 文書画像処理装置および文書画像処理方法および情報記録媒体
JP3673615B2 (ja) * 1997-06-19 2005-07-20 キヤノン株式会社 画像処理装置及びその制御方法
JPH11203305A (ja) * 1998-01-12 1999-07-30 Ricoh Co Ltd 文書画像処理方法および記録媒体
JP3892626B2 (ja) 1999-08-25 2007-03-14 富士通株式会社 文書処理装置及び記憶媒体
JP2002150306A (ja) 2000-09-04 2002-05-24 Minolta Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
KR100435442B1 (ko) * 2001-11-13 2004-06-10 주식회사 포스코 문서 요약 방법 및 시스템
JP4789516B2 (ja) 2005-06-14 2011-10-12 キヤノン株式会社 文書変換装置、文書変換方法並びに記憶媒体
JP4776998B2 (ja) * 2005-07-20 2011-09-21 キヤノン株式会社 画像レイアウト編集装置およびその制御方法およびプログラム
JP4631749B2 (ja) 2006-03-03 2011-02-16 富士ゼロックス株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US7778953B2 (en) * 2007-02-19 2010-08-17 Kabushiki Kaisha Toshiba Document management apparatus and document management method
JP5176416B2 (ja) * 2007-07-20 2013-04-03 コニカミノルタビジネステクノロジーズ株式会社 文書処理装置、文書処理方法、および文書処理プログラム
JP5194995B2 (ja) * 2008-04-25 2013-05-08 コニカミノルタビジネステクノロジーズ株式会社 文書処理装置、文書サマリ作成方法および文書サマリ作成プログラム
JP5425307B2 (ja) * 2010-07-08 2014-02-26 三菱電機株式会社 キーワード変換装置、キーワード変換プログラム、記録媒体及びキーワード変換方法
JP6504104B2 (ja) * 2016-04-20 2019-04-24 京セラドキュメントソリューションズ株式会社 画像処理装置
JP7121363B2 (ja) * 2019-03-28 2022-08-18 ミールソリューションズ株式会社 大規模電子文書の版管理方法とその版管理システム
US11367296B2 (en) 2020-07-13 2022-06-21 NextVPU (Shanghai) Co., Ltd. Layout analysis

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57199066A (en) * 1981-06-02 1982-12-06 Toshiyuki Sakai File forming system for cutting of newspaper and magazine
JPH083828B2 (ja) * 1985-06-07 1996-01-17 株式会社日立製作所 文書画像理解装置
JPH01194063A (ja) * 1988-01-29 1989-08-04 Toshiba Corp 文書ファイル目次作成方式
JPH0264852A (ja) * 1988-08-31 1990-03-05 Canon Inc 文書処理装置
JPH0327471A (ja) * 1989-06-26 1991-02-05 Hitachi Ltd 画像登録方式

Also Published As

Publication number Publication date
JPH05342326A (ja) 1993-12-24

Similar Documents

Publication Publication Date Title
US5701500A (en) Document processor
JP3178483B2 (ja) 文書処理装置
JP4181892B2 (ja) 画像処理方法
US7681121B2 (en) Image processing apparatus, control method therefor, and program
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4854491B2 (ja) 画像処理装置及びその制御方法
US8520006B2 (en) Image processing apparatus and method, and program
US20040213458A1 (en) Image processing method and system
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP4502385B2 (ja) 画像処理装置およびその制御方法
US20120250048A1 (en) Image processing apparatus and image processing method
JP2009193356A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
US5950213A (en) Input sheet creating and processing system
JP4261988B2 (ja) 画像処理装置及び方法
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JPH06110996A (ja) テキストイメージ及び書式イメージの併合による自動イメージ生成
JPS58208865A (ja) 文書作成装置
JP2924462B2 (ja) 文書処理装置
JP4323856B2 (ja) 画像処理方法
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JPH0743718B2 (ja) マルチメディア文書構造化方式
JP4405604B2 (ja) 情報処理装置及び定義方法
JPH07262317A (ja) 文書処理装置
JPS6336671A (ja) 電子フアイルシステム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080413

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090413

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100413

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees