JP3178483B2

JP3178483B2 - 文書処理装置

Info

Publication number: JP3178483B2
Application number: JP17370792A
Authority: JP
Inventors: 尾崎正治; 糸乘勝彦
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1992-06-09
Filing date: 1992-06-09
Publication date: 2001-06-18
Anticipated expiration: 2016-06-18
Also published as: JPH05342326A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、原稿文書から所望の部
分を取り出してその原稿文書に関連する文書を作成する
文書処理装置に関し、特に抄録文書の作成や、目次の作
成、目次付き文書の作成、文書リストの作成などを自動
的に行うことのできる機器に関するものである。

【０００２】

【従来の技術】雑誌等の出版物の多様化、ＤＴＰ・ワー
ドプロセッサの普及にともない、文書の流通量が増加し
てきている。このため、多くの情報を文書の形で容易に
手に入れることが可能となった。情報が容易に手に入る
ようになったことは歓迎すべきである。しかしながら、
その量の多さに人間の処理能力が徐々に追い付かなくな
ってきている。さらに悪いことには、量が多くなるにつ
れ不必要な文書の割合が増大し、知りたい情報にたどり
つくためには内容を把握するのに無駄な努力を要するこ
とになってきている。

【０００３】通常、書籍などではタイトルと著者の対な
どで目次が用意され、どの記事が所望とする内容なのか
を判断するのに役立っている。複数の文書の内容がある
程度簡単に把握できるような目次、サマリがあれば必要
な情報を得るための手掛かりとして非常に有用である。

【０００４】

【発明が解決しようとする課題】しかし、多種の文書に
対してそのような目次、あるいはサマリは当然なく、個
別にその内容を参照しなければならなかった。望む情報
を取り出すだけでなく、いったん収集した多種の文書を
ファイリングしておく場合でも、サマリやリストあるい
は目次があれば後の検索のために有用である。しかし、
このような文書のサマリやリストの作成、あるいは目次
の作成は、従来は人手で行うしかなかった。したがっ
て、文書の量が増えればその管理の手間も増大していく
という問題点があった。

【０００５】ＤＴＰ文書などの電子化文書であれば文書
データベース技術を用いて、データベースに登録後、そ
のようなサマリや目次を作成することは可能である。し
かし、必要とする文書が電子化文書ではなく紙の文書で
しか入手できないものがまだ多く、そのような電子化文
書の文書データベース技術を直接的には用いることはで
きないという問題点があった。また、ＤＴＰ・ワードプ
ロセッサで作成された文書でもタイトル、著者といった
論理的な属性を持つ文書となっていないものが多く、こ
れらの属性を付与してデータベースに登録する必要があ
った。

【０００６】紙の文書を電子化文書に変換する技術とし
て文書認識技術がある（例えば特開昭６４−１５８８９
号公報あるいは特公昭６１−３２７１２号公報）。この
ような文書認識技術を用いることによって紙の文書の構
造を認識し、文字の部分は文字認識を行い、コード化し
て文書データベースに蓄えることができる。しかしなが
ら、文書認識技術のうち文字認識は非常に多くの計算機
コストを要し、しかも誤認識が生じる場合がまだ多い。
サマリを人が見て内容を把握するという目的だけであれ
ば、コード化された文字内容の再利用は行われず、文字
認識はほとんどが無駄な処理になってしまうという問題
点があった。

【０００７】本発明は、上述のような諸問題を解決する
ことを課題とするものである。すなわち、本発明は原稿
の文書画像から所望の文書要素の箇所のみを取り出して
構成した文書画像を自動的に作成する文書処理装置を得
ることを目的とするものである。

【０００８】また、本発明は、書式の異なる原稿を含む
複数の文書原稿の画像からそれぞれ概要を把握するのに
必要な文書要素を抽出し、所定の書式に従って配置して
サマリ文書群を生成する文書処理装置を得ることを目的
とするものである。

【０００９】また、本発明は、複数の文書原稿の画像か
ら検索を容易にできるように配列したサマリ文書群を生
成することのできる文書処理装置を得ることを目的とす
る。

【００１０】また、本発明は原稿の文書画像から見出し
の文書要素を取り出して目次を自動的に生成する文書処
理装置を得ることを目的とするものである。

【００１１】また、本発明は原稿の文書画像から見出し
の文書要素を取り出して目次を自動的に生成すると共に
原稿の文書画像にページを付与することのできる文書処
理装置を得ることを目的とするものである。

【００１２】

【００１３】

【課題を解決するための手段および作用】本発明の文書
処理装置は、１枚以上の原稿文書を画像として入力する
文書画像入力手段（図１の１１、図１９の１９１、図２
２の２２１、図２３の２３１）と、その文書画像入力手
段から入力された文書画像上の画素の集まりを、それぞ
れ文書要素として意味のある塊として領域に分割する領
域分割手段（図１の１２、図１９の１９２、図２２の２
２２、図２３の２３２）と、その領域分割手段によって
分割された文書画像上の各領域に、それぞれ文書の論理
的な意味付けを表す識別子を付与する論理識別子付与手
段（図１の１３、図１９の１９３、図２２の２２３、図
２３の２３３）と、その識別子付与手段によって付与さ
れた識別子を持つ文書領域のうち、サマリ作成に必要な
識別子を持つ文書要素を抽出する必要要素抽出手段（図
１の１４、図１９の１９４、図２２の２２４、図２３の
２３４）と、その必要要素抽出手段によって抽出された
文書要素に対応する領域の部分画像を基に出力画像を生
成する出力画像生成手段（図１の１５、図１９の１９
８、図２２の２２５、図２３の２３５）とを具備する。

【００１４】その動作においては、文書画像入力手段に
より入力され保持されている１枚以上の文書画像は、そ
れぞれ領域分割手段により文書要素として意味のある領
域に分割される。領域分割結果は、例えば、レイアウト
識別子、領域種別、領域の寸法、位置を含む領域情報と
領域間の関係を表す情報とを含むレイアウト構造情報と
して出力される。そして論理識別子付与手段によって各
領域に論理識別子が付与される。前記論理識別子付与手
段は、本発明の一態様では、対象となる文書に現れる文
書要素と文書要素間の相対的な位置関係を記述した構造
モデルをあらかじめ１つ以上保有し、領域分割手段から
得られた領域分割の結果のレイアウト構造と比較して合
致する構造モデルを選択し、各領域に対しタイトル、著
者、本文などのような領域に対する論理的な意味を持つ
論理識別子を高い精度で付与することができるもので
る。また、その論理識別子付与手段に登録する構造モデ
ルの変更や新規登録を行うためには入力手段（図２２の
２２７、図２３の２３９）を設けるとよい。必要要素抽
出手段は、サマリ作成に必要な識別子例えばタイトル、
著者、あらましなどを持つ文書要素を抽出する。具体的
には、必要要素抽出手段はあらかじめ定義された簡易な
言語で記述された必要要素の論理識別子を抽出指示デー
タとして保有しており、この抽出指示データと照合して
必要要素を抽出する。なお、この抽出指示データを必要
要素抽出手段に入力するための入力手段（図２２の２２
７、図２３の２３９）を設ければ、抽出指示データの変
更を容易に行うことができる。出力画像生成手段は、そ
の必要要素抽出手段によって抽出された文書要素に対応
する領域の部分画像を基に出力画像を生成する。出力画
像の生成には、本発明では２つの態様があり、その一つ
は部分画像をそのまま再配置して出力画像を生成するも
のであり、他は部分画像を加工したのち再配置して出力
画像を生成するものである。後者の部分画像を加工した
のち再配置する態様は、前記必要要素抽出手段の必要要
素の指定に対してデザインパラメータを付与し、出力画
像生成手段でそのデザインパラメータに応じて抽出され
た文書要素に対応する領域の部分画像を変換・加工した
後、再配置することにより出力画像を生成するものであ
る。これによれば、出来上がったサマリ文書の見栄えが
よくなり、また、利用者がより理解しやすくなる。な
お、そのデザインパラメータを、あらかじめ定義された
フォーマットで記述されたデザイン指定の表として用意
し、そのデザイン指定の表を必要要素抽出手段に入力す
るための入力手段（図２２の２２７、図２３の２３９）
を設けることにより、必要に応じて出力文書のデザイン
を容易に変更することができる。出力画像生成手段によ
り生成された出力文書画像は、例えばプリンタやＣＲＴ
ディスプレイ装置などの可視化手段を用いることにより
可視化メディア上に可視化することができる。

【００１５】また、本発明の他の態様では、上記サマリ
文書を作成するための文書処理装置において、さらに前
記文書要素選択手段によって選択された文書要素に対応
する領域の部分画像を文書画像ごとに論理識別子と対に
して保持しておく部分画像蓄積手段と、前記部分画像蓄
積手段に蓄積された画像から、ソーティングのキーとな
る論理識別子を持つ要素の部分画像を文字コード列に変
換する文字認識手段と、前記文字認識手段で得られた文
字コード列をもとにソーティングを行い、文書画像の出
力順序を決定するソーティング手段とを備え、前記出力
画像生成手段は、前記ソーティング手段によって得られ
た文書画像の出力順序にしたがって、前記必要要素抽出
手段によって抽出された文書要素に対応する領域の部分
画像を基に出力画像を生成するものである。その動作
は、部分画像蓄積手段に蓄積された画像から、ソーティ
ングのキーとなる論理識別子を持つ要素の部分画像を文
字認識手段により認識し、認識出力の文字コード列をソ
ーティング手段によりソーティングし、そのソーティン
グの結果は各サマリ文書画像を並べる順序を決めるため
に出力画像生成手段によって用いられる。キーとしては
例えば「日付」が用いられる。キーに用いる文字の種類
は限られるので、文字認識手段は極めて簡単な構成のも
のでよい。この発明の態様では、キーとなる要素を文字
認識してソーティングする機能を付加したので、複数の
サマリの文書がソーティングの結果を用いて順序よく並
べることができ、利用者が検索するのに容易となる。

【００１６】また、本発明の他の態様による文書処理装
置は、目次を作成すめためのものであり、複数枚の文書
画像を保持する文書画像保持手段（図２６の２６１）
と、前記文書画像保持手段から入力される各文書画像
を、文書要素として意味のある領域に分割する領域分割
手段（図２６の２６２）と、その領域分割手段により得
られた文書要素に、論理的な意味付けを持つ識別子を付
与する論理識別子付与手段（図２６の２６３）と、各文
書画像ごとに、そのページ番号を決定すると共に、前記
論理識別子付与手段により付与された識別子を基に目次
を構成するのに必要な文書要素を抽出する目次構成要素
抽出手段（図２６の２６４〜５）と、その目次構成要素
抽出手段によって抽出された目次構成に必要な文書要素
および対応するページ番号を基に、一定のデザインによ
って目次画像を生成する出力画像生成手段（図２６の２
６８〜２６１０）とを備えている。その動作において、
目次構成要素抽出手段は、論理識別子を基に、目次を構
成するのに必要な文書要素を抽出する。またその文書要
素のあるページ番号を決定する。ページ番号決定のため
の具体的態様においては、処理対象とする文書画像の枚
数を数える画像枚数カウント手段（図２６の２６４）を
設けると共に、前記目次構成要素抽出手段は、前記画像
枚数カウント手段のカウントした枚数と文書画像の処理
順番とによりページ番号を決定する。出力画像生成手段
は、目次構成に必要な文書要素および対応するページ番
号を基に、一定のデザインによって目次画像を生成す
る。この発明によれば、大量の文書に対して目次を自動
的に生成することができるので、何枚目にどの文書があ
るかを容易に知ることができる資料を簡単な操作によっ
て作るができる。

【００１７】本発明の他の態様は、上記の目次作成用の
文書処理装置において、目次を作成するだけでなく、各
文書画像にページ番号を付与するようにしたものであ
る。すなわち、その文書処理装置において、前記目次構
成要素抽出手段は、各文書画像に対してページ番号に対
応する論理識別子の付与された文書要素をも抽出するも
のであり、前記出力画像生成手段は、目次およびページ
番号付き文書からなる出力画像を生成するために、前記
目次構成要素抽出手段によりページ番号に対応する論理
識別子の付与された文書要素が抽出された場合には、そ
の文書要素の領域を削除して新たにページ番号を付与
し、抽出されなかった場合には文書画像の所定の位置に
新たにページ番号を付与するページ番号付与手段（図２
６の２６７）を有する。この発明によれば、各文書画像
に対してページ番号を付け直すので、対応が分かりやす
い目次付きかつページ番号入りの文書を作成することが
できる。

【００１８】

【実施例】

（第１の実施例）以下、添付図面にそって実施例の説明
を行う。本発明をデジタル複写機のような紙を入出力メ
ディアとするような機器に応用した例を図１に示す。こ
の実施例の装置は、同図に示すように、１枚以上の原稿
文書を画像として入力し、保持する文書画像入力部１１
と、その文書画像入力部１１から入力された文書画像上
の画素の集まりを、それぞれ文書要素として意味のある
塊として領域に分割する領域分割部１２と、その領域分
割部１２によって分割された文書画像上の各領域に、そ
れぞれ文書の論理的な意味での識別子を付与する論理識
別子付与部１３と、その識別子付与手段１３によって付
与された識別子を持つ文書領域のうち、サマリ作成に必
要な識別子を持つ文書要素を抽出する必要要素抽出部１
４と、その必要要素抽出部１４によって抽出された文書
要素に対応する領域の部分画像をそのまま、あるいは加
工したのちに再配置して出力画像を生成する出力画像生
成１５と、その出力画像生成部１５が生成した出力文書
画像を可視化メディアである紙上に印刷して可視化する
プリントアウト部１６とを備えている。

【００１９】原稿画像入力部１１はＡＤＦ（オートドキ
ュメントフィーダ）が付属しているイメージスキャナの
機構そのものであり、ＡＤＦによって原稿を１枚づつ順
に読み取っていく。読み込みは副走査方向に光源とイメ
ージセンサからなる読み取り部をずらしながら主走査方
向の細長い領域を光源で照射し、反射した光をレンズで
集光してＣＣＤイメージセンサ等によって電気信号に変
換し、二値のデジタル画像として入力画像メモリに取り
込む。もちろん、反射光の強弱をＡＤ変換器を通して多
値の画像として入力しデジタル画像処理で二値化しても
かまわない。

【００２０】領域分割部１２は文書画像を入力として、
文字領域、図表領域などに分割する処理であり、文書認
識技術における領域分割処理に対応する。これは公知の
技術によって実現される。例えば特開昭６４−１５８８
９公報あるいは特公昭６１−３２７１２公報等に示され
ている技術がそれにあたる。ここでの領域分割部１２は
それぞれの領域を矩形に分割して出力する。この処理を
行う前に傾き補正、ノイズ除去等の前処理を行ってもよ
いことはいうまでもない。この処理で分割された領域は
文字、図形、けい線などに識別され、これらの種別も同
時に付加されて出力される。領域を表現する矩形は原稿
画像のｘ，ｙ方向それぞれに平行な辺を持ち、対象とな
る領域を囲む最小矩形とする。領域を表現するデータは
基本的に「種別、左上点ｘ座標、左上点ｙ座標、幅、高
さ」の組で表現される。この処理から結果として出力さ
れる要素の列を文書のレイアウト構造と呼ぶ。

【００２１】論理識別子付与部１３は、領域分割部１２
において得られた文書のレイアウト構造を入力とし、そ
れぞれに「タイトル」、「著者」、「本文」などといっ
た論理的な名称を識別子として付与するものである。こ
れは本出願人によって先に出願された特願平３−３１３
１８６号「文書論理構造認識および文書内容認識のため
の装置および方法」に記載されている技術を用いるのが
よい。この技術では、認識対象文書のレイアウトと論理
構造の対応を表現する構造モデルをあらかじめ登録して
おき、領域分割結果と構造モデルとのマッチングを行
い、マッチングが成功したものについてそれぞれの論理
的な意味を表現する名称を付与することを行う。名称が
付与されたレイアウト構造を論理構造と呼ぶ。

【００２２】必要要素抽出部１４ではサマリ作成に必要
な要素を取り出す。論理識別子付与部１３で得られた論
理名称を持つ要素のうち、あらかじめ指定しておいた
「タイトル」「著者」「あらまし」などの論理名称を持
つ要素を取り出すことを行う。

【００２３】出力画像生成部１５では必要要素抽出部１
４で取り出された要素に対応する領域の部分画像を出力
画像メモリ１５１に順に配置してしていく。

【００２４】プリントアウト部１６では出力画像メモリ
１５１上の画像を受け取り、レーザビームプリント技術
を用いて紙の上に転写し、排出する。

【００２５】次に、実際の文書例を用いて本実施例の動
作を処理の順に説明する。処理のフローチャートは図２
に示す。なお、ここでの例では文書は論文のカバーペー
ジで、図３〜図５に示すような３種類の論文が入力され
ることを想定している。以後座標系を図３中に示すよう
にページ右に向かう方向をｘ方向、ページ下に向かう方
向をｙ方向とする。利用者はまずサマリを作成したい論
文のカバーページを重ねてＡＤＦ上に置く。操作パネル
上のスタートボタンを押すと１枚づつ文書が順にデジタ
ル画像として入力される（ステップＳ２０３）。

【００２６】読み込まれた１枚の文書画像は領域分割部
１２に送られ、領域分割処理が行われる（ステップＳ２
０４）。領域分割処理部１２での処理の結果、図３の文
書画像は図６に示すように文字が規則的に並んでいる領
域（文字ブロック領域）、大きな図形が存在する領域
（図形領域）、けい線が存在する領域（けい線領域）と
それ以外（余白）に分割される。領域分割の結果（レイ
アウト構造）は図７のようにテーブル形式で表現され、
論理識別子付与部１３に送られる。

【００２７】論理識別子付与部１３では、受け取ったレ
イアウト構造と保持している構造モデルとのマッチング
を行い、レイアウト構造中の要素の論理的な意味合いを
示す名称を識別子として与える（ステップＳ２０５）。
論理的な意味合いを示す名称とは例えば「タイトル」、
「著者」、「サブタイトル」、「本文」、「脚注」、
「脚注罫」などである。通常、ある範囲で流通する文書
は「タイトル」、「著者」は上下配置になっているな
ど、ある程度固定的なデザインの文書が多い。この性質
を利用するのが構造モデルで、構造モデルとはすなわち
対象となる文書のデザインについてのテンプレートであ
る。これらテンプレートである構造モデルはあらかじめ
複数記憶しておく。構造モデルは要素をその種別（文字
ブロック、図形、けい線など）と対応する論理名称を持
つノード、これら要素間の相対的な位置関係をリンクと
するようなグラフ構造で表現される。この例における３
種類の文書の構造モデルは図８〜図１０に示すようにな
る。マッチング処理とはすなわち登録してある複数の構
造モデルのうち、どれとマッチするかの判定を行うこと
である。まず、登録されている構造モデルを１つずつ取
り出し、構造モデルに記述されている要素間の相対的な
位置関係がすべて満たされているかどうかを調べる（ス
テップＳ２０６）。満たされていれば成功とし、満たさ
れていなければ成功するまで順にマッチング処理を起動
する。もし、すべての構造モデルとのマッチングが失敗
したならば入力文書は処理不可能というメッセージを機
器のパネルに表示し、次の文書の入力を行う。構造モデ
ルとのマッチングが成功した場合はレイアウト構造にお
ける要素と構造モデルのノードとの対応がわかるため、
これを利用してレイアウト構造のマッチングの対象とな
った各要素に構造モデルのノードに定義されている論理
名称を付与する。このようにレイアウト構造の要素に論
理名称が付与されたデータを論理構造と呼ぶ。図７のレ
イアウト構造と図８の構造モデルがマッチングが成功す
る。この論理構造を表現する実際のデータは図１１に示
すように名称とそれに対応する要素の番号の対の列で表
現される。ここで対応する要素の番号とは図７の表にお
いて各要素にふられている番号欄の番号のことである。
図１１の表で表現された対応と図７の表で表現されたレ
イアウト構造を合わせて必要要素抽出部１４に送る。

【００２８】必要要素抽出部１４ではあらかじめ指定し
ておいた論理識別子を得られた論理構造から順に取り出
す（ステップＳ２０７）。ここでは「タイトル」「著
者」「あらまし」が指定されているものとする。この３
つの論理識別子は３種類の文書にいずれも含まれている
共通な識別子である。このため、異なるレイアウトがな
されている文書でも共通な識別子を持つものからサマリ
を作成することができる。これら３つの論理識別子に対
応する領域の部分画像を図３の入力文書画像から切り出
し、出力画像生成部１５に送る。切り出された部分画像
は図１２で示される。

【００２９】出力画像生成部１５では切り出した部分画
像データを順に出力画像メモリ１５１に配置していく
（ステップＳ２１１）。配置する位置のｘ座標は固定で
左マージン分確保しておく。ｙ座標は直前に配置された
要素の矩形の下辺のｙ座標にあるマージンを加えた値を
記憶しておき、その位置に配置する。もし、配置しよう
とする領域矩形の高さが出力画像メモリ上に残っている
高さ（画像メモリのｙ座標の最大値と配置された要素の
一番下のｙ座標との差）より大きく、配置できない場合
は、出力画像メモリをプリントアウト部に送り、これま
で配置された内容を先に出力する（ステップＳ２０
９）。こののち、出力画像メモリをクリア（出力すると
白紙の状態）し（ステップＳ２１０）、ｙ座標の位置を
最上部（＝上マージン）の値に戻し、新たに順に配置し
ていく（ステップＳ２１１）。１枚の文書の必要要素の
配置が終了したならば、次の文書との区切りを明らかに
しておくためにさらにマージンを加えてｙ座標の位置を
更新しておく。いま、最初の文書の要素がすべて配置さ
れた時点での画像メモリの状態は図１３のようになる。
最後に配置した「あらまし」の画像の下辺のｙ座標が
ａ、要素間のマージンがｂ、１枚の文書の要素配置が終
了したときに加えるマージンがｃである。したがって、
次の文書の「タイトル」はａ＋ｂ＋ｃの位置に配置され
る。

【００３０】１枚の文書についての処理が終了したなら
ば、次の文書を読み込み、同様の処理を繰り返す。これ
をすべての文書について終了したならば、残っている出
力画像メモリをプリントアウト部１６に送り、紙にマー
キングして処理を終了する（ステップＳ２１２、Ｓ２１
３）。これによって得られた結果は図１４に示すような
ものになり、サマリ文書ができあがる。

【００３１】（第２の実施例）前述の実施例において、
文書の種類によって同じ識別子を持つ要素でも文字の大
きさなどが異なる場合、単に文書の部分画像を配置する
だけは体裁がととのわず、見栄えの悪いサマリ文書が出
力されてしまう。さらに出力されるサマリ文書を見栄え
を良くし、利用者がより理解しやすいようにするための
例をここでは述べる。この機能は、必要要素抽出部１４
において必要要素の指定に論理識別子に加えて最終的な
文書要素のデザイン指示を与えておき、多種の文書にお
いて異なるデザイン（文字の大きさ、文字ブロックの幅
など）の要素をできるだけ共通なデザインに変更して出
力する処理を行うことにより実現される。この第２の実
施例の基本的な機器構成は第１の実施例と共通であり、
内部的な処理が拡張されている。変更される部分は領域
分割部１２の出力のデータ構造が階層的になること、出
力画像生成部１５で部分画像をそのまま出力画像メモリ
に配置するのではなく、デザイン指示に応じて画像変換
を行うことである。

【００３２】まず、必要要素抽出部１４において、必要
要素の指定に論理識別子だけでなく、最終的なデザイン
のためのパラメータを追加しておく。この指定は図１５
に示すようなテーブルにより行う。

【００３３】さらに領域分割部１２の出力のうち、文字
ブロック領域に関しては図１６に示すようにブロックの
中の行、行の中の文字と階層的な領域のデータを出力す
るように変更する。これは実際のデータ構造としては図
１７のようにテーブル形式となり、上位・下位の階層関
係が要素番号によって規定されている。

【００３４】必要要素抽出部１４で、論理識別子から切
り出された必要要素の部分画像は指定されたデザインパ
ラメータとともに出力画像生成部１５に送られ、文字画
像生成処理が行われる。文字画像生成処理は文字流し込
み処理、領域拡大・縮小処理の２つの処理からなる。文
字流し込み処理は文字ごとに切り出されている画像をあ
る幅に収まるように再配置するというものでこれは既存
の技術、例えば特開平３−１２２７７３公報記載の技術
がある。あるいは公知ではないが本出願人が先に出願し
た特願平４−０９０１４６号「文書処理装置」で開示さ
れている技術を用いるのが好適である。拡大・縮小処理
をこの処理の後に行うためにまず拡大率ｒを計算する。
拡大率はデザインパラメータで指定されている文字サイ
ズに対する入力文書における文字サイズとの比で表され
る。入力文書における「あらまし」領域の文字サイズは
文字行の高さの平均値から文字サイズは１０ポイントで
あることがわかる。一方、個別デザインパラメータテー
ブルで指定されている文字サイズは８ポイントなので、
拡大（縮小）率を４／５とする。次にデザインパラメー
タの最大幅を拡大率で割って流し込みの幅を計算する。
「あらまし」はレイアウト幅が１５０ｍｍという指定で
あるので、流し込み幅は１８７．５ｍｍとなる。この幅
にこの文字領域中の文字が並ぶように再配置する。

【００３５】文字流し込み処理を上記特願平４−０９０
１４６号の発明を用いて行う場合は、図３２に示すよう
に流し込み処理に関連する部分を構成する。すなわち、
領域分割部には、入力画像メモリに保持されている文書
画像から、サブ文字パターンを抽出するサブ文字パター
ン抽出部３２４と、前記抽出の結果得られたサブ文字パ
ターンに関する情報を記憶するサブ文字パターン情報記
憶部３２５を設ける。また、出力画像生成部には、サブ
文字パターン情報記憶部３２５に記憶されたサブ文字パ
ターン情報をもとに、入力画像メモリ１１１に記憶され
たイメージ情報における各サブ文字パターンを切り出
し、所望の領域内に配置ルールに従って再配置する流し
込み処理部３２０を設ける。その流し込み処理部３２０
は、サブ文字パターンの配置に関する配置ルールを格納
する配置ルール記憶部３２３と、サブ文字パターン情報
記憶部３２５に記憶されたサブ文字パターン情報と配置
ルール記憶部３２３に記憶された配置ルールをもとに行
末行頭の配置の是非を判定する配置判定部３２２と、そ
の配置判定部３２２の判定結果と前記サブ文字パターン
情報記憶部３２５の記憶するサブ文字パターン情報に基
づき、入力画像メモリ１１１に記憶された文書画像から
サブ文字パターンを切り出して所望の領域内に配置する
配置処理部３２１とを有する。

【００３６】サブ文字パターン抽出部３２４は、前記イ
メージ情報に対して、例えば黒画素塊に外接する矩形領
域を求め、一定の条件を満たすものを抽出するなどして
サブ文字パターンを抽出する。サブ文字パターン情報記
憶部３２５は、前記抽出したサブ文字パターンに関する
情報、例えば前記外接矩形領域の位置、範囲、行の高さ
に対する相対位置等の情報、を記憶する。前に述べたよ
うに、本実施例では図１６および図１７に示すように領
域分割部１２は階層構造を以て文字領域を抽出するの
で、サブ文字パターンはその一番下位の層に該当する。

【００３７】流し込み処理部３２０は、サブ文字パター
ン情報をもとに、入力画像メモリ１１１から各サブ文字
パターンを切り出し、これを所望の領域内に配置ルール
に従って流し込む。配置ルールは、例えば改行する際に
行末、行頭へ配置してはならないサブ文字パターンの条
件を定めるものである。すなわち、配置ルール記憶部３
２３は、例えば改行する際に行末、行頭へ配置してはな
らないサブ文字パターンの条件を定める配置ルールを記
憶しており、配置判定部３２２は、サブ文字パターン情
報記憶部３２５に記憶された外接矩形情報等のサブ文字
パターンの属性情報を配置ルールと照合して、改行可能
性、サブ文字パターン間へのスペース挿入の要否などを
判定する。配置処理部３２１は、サブ文字パターン情報
における位置、範囲情報により入力画像メモリ１１１か
らサブ文字パターンを読み出して、配置判定部３２２の
判定結果に応じた再配置処理を行う。

【００３８】次に領域拡大・縮小処理が呼び出され、拡
大率にしたがって、流し込まれた画像をレイアウト幅が
１５０ｍｍとなるように拡大・縮小を行う。このように
して得られた変換画像を第１の実施例と同様に再配置し
ていく。

【００３９】以上のような処理で得られた出力画像を第
１８図に示す。図１４に示す第１の実施例の出力画像に
比べてそれぞれ同じ識別子を持つ領域の文字の大きさが
揃い、また、それぞれの「あらまし」は文字ブロックの
幅が揃って非常に見栄えのよい出力が得られるのが分か
る。この出力画像はそれぞれ１ラインずつ読み取られ、
レーザビームプリンティングによって普通紙上に印字さ
れ出力される。

【００４０】（第３の実施例）この第３の実施例は、第
１あるいは第２の実施例において、さらにファイリング
のためにソーティング機能を付加した構成のものであ
る。ソーティングは文書の部分画像からだけでは不可能
であるので、文字内容をコード化したデータが必要とな
る。このため、図１９に示すように、第１または第２の
実施例における機器構成に加えて、部分画像蓄積部１９
５と、文字認識部１９６、ソーティング処理部１９７と
を追加する。

【００４１】いま、対象をオフィス内の文書ということ
を前提とし、対象としては図２０に示すような部署間の
連絡書ということとする。連絡書は共通のレイアウトで
はあるが、さまざまなワードプロセッサで作成され、ハ
ードコピー文書として部署に送付されてくる。サマリと
して必要な論理識別子として「連絡書番号」、「発信部
署」、「日付」、「件名」とし、ソートキーを「日付」
とする。まず、サマリを作成したい複数の連絡書を重ね
て機器に備付けられているＡＤＦへ置く。順に原稿が読
み取られ、それぞれ読み込まれた文書画像は、領域分割
部１９２による領域分割、および論理識別子付与部１９
３による論理構造ラベリングが施された後、必要要素抽
出部１９４へ送られる。必要要素抽出部１９４ではやは
りあらかじめ登録しておいた論理識別子を持つ部分画像
と領域データを対にして原稿の順番に部分画像蓄積部１
９５に送り、登録していく。すべての原稿に対する処理
が終了した時点で、「日付」に対応する部分画像のみを
文字認識部１９６に順に送っていき、文字コードに変換
し、部分画像蓄積部１９５の各原稿のソートキーとして
追加する。ソーティング処理部１９７により日付のソー
トを行ったあと、そのソートの結果の順に各要素の画像
を出力画像生成部１９８に送り、画像変換を行ったあ
と、出力画像を生成し、プリントアウトしていく。認識
された文字コードは日付の場合は年月日の順に階層化さ
れ、文字コードから数値データに変換されソートされ
る。これによって出力された文書を図２１に示す。

【００４２】ここでの文字認識処理はソーティングに必
要な部分にだけ処理が行われるため、処理全体に対する
負荷は大きなものにはならない。これは一般的な文字認
識アルゴリズム、特徴量辞書を用いて実現してもかまわ
ない。しかし、例えば、日付だけであれば字種は数字
（和英）、年、月、日など十数個のもので足り、出現す
る文字パターンは“ＸＸ年ＹＹ月ＺＺ日”というパター
ンを仮定できるので、例えば「対象文書に関する知識を
援用した手書き文書からの文字切り出しの一提案」（馬
場口他、電子情報通信学会技術報告ＰＲＵ８５−６３）
などに開示されている技術を用いてキー文字（ここでは
“年”，“月”，“日”）を最初に取り出しておき、そ
の前後はある限られた数字しか出現しないという知識を
利用して精度よく高速の文字認識処理を行うことができ
る。部署名なども同様に字種は限られており、“ＸＸ部
ＹＹ課”などの文字パターンを想定できる。このような
文字パターン、必要な字種の特徴量辞書だけを入れ替え
てやればいろいろな用途に用いることができる。これら
データの入れ替えは第１の実施例の最後で述べたように
構造モデルの変更および必要要素の論理識別子指定の変
更方法と同様に実現できる。

【００４３】（第４の実施例）以上において説明した第
１〜第３の実施例の装置において、あらかじめ登録して
おくデータとして、論理識別子付与部では構造モデル
が、必要要素抽出部ではサマリ作成に必要な論理識別子
が必要となる。これらは対象文書が変更されないような
場合は固定的にＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏ
ｒｙ）に内部的に記憶させておけばよい。しかし、これ
らのデータは対象に応じて変更させることは容易であ
る。利用者が容易にこれらのデータを変更することがで
きるようにするための機器構成の例について説明する。

【００４４】図２２および図２３にそれぞれ第１、第２
の実施例および第３の実施例にこのデータの変更のため
の技術を適用した構成を示す。構造モデルは図８で示し
たようにグラフ構造で表現される。まず、それを表現す
る簡易な言語を規定する。言語の文法を図２４に示し、
図２５に図８に示した論文のカバーページの構造モデル
の言語による記述例を示す。ここで示した記述例は最初
に要素種別と論理識別子からなる文書の要素の定義、次
に要素間の上下（図中”ａｂｏｖｅＢｅｌｏｗ”）、左
右（同”ｌｅｆｔＲｉｇｈｔ”）などの相対的な位置関
係の定義が記述され、これによってグラフ構造が規定さ
れる。本実施例ではこれらの記述を機器内部に入力する
ためのデータ入力・解析部２２７を有する。データ入力
・解析部２２７として例えば、機器本体にフロッピーデ
ィスクドライブを装備しておく。ここではフロッピーデ
ィスクにファイルとして保存されている複数の構造モデ
ル記述を読み込んで内部的なデータ構造に展開すること
を行う。フロッピーディスク以外にシリアルポート等パ
ソコンなどを接続できるようにしておき、パソコンから
構造モデル記述を送信してやることで実現できる。ま
た、図１５に示したような必要要素の論理識別子および
そのデザイン指定の表の入力も、あらかじめ定義された
簡易な言語あるいはフォーマットで記述されたデータを
データ入力・解析部２２７，２３９を介して外部から入
力することにより実現することができる。さらに実施例
３で示したソート・キーとなる文書要素の論理識別子、
文字認識のための文字パターン、特徴量辞書なども同様
にフロッピーディスク、シリアルポート等から入力する
ことができる。

【００４５】以上に、サマリ作成のたの文書処理装置の
諸実施例について詳述したが、ここで、これらの変形・
置換例および他の装置への応用例等について挙げる。

【００４６】１つの文書の必要要素の部分画像の配置が
終了したときはマージンを追加すると述べたが、それに
加えて区切り罫を挿入するとより分かりやすくなる。あ
るいは１つの文書の必要要素を囲み罫で囲むということ
も可能である。いずれも出力画像メモリに直接書き込ん
でいく操作であるので容易に実現できる。

【００４７】出力画像メモリにはあらかじめサマリ文書
としてのタイトルを書き込んでおくこともできる。「論
文サマリ文書」という文字列の画像を予め登録してお
き、最初の要素を配置するまえに配置しておき、ｙ座標
のどこまで配置されたかをその分加えておけばよい。フ
ッタなどにページ番号、作成日付などを入れることも同
様に効果的で、かつ容易に実現することができる。

【００４８】プリントアウト部は実施例はすべて１色マ
ーキングを前提にしていたが、多色レーザプリント技
術、熱転写プリント技術などを用いたカラーマーキング
を行えば、さらに効果的である。フルカラーマーキング
が可能であれば多値の出力画像メモリを３色なら３つ用
意し、必要要素抽出部で指定されていた論理識別子に色
指定を追加し、その色指定に応じて出力画像メモリに書
き込む値を変化させればよい。

【００４９】単なるサマリによる内容確認であれば、内
容の可視化手段としてプリントアウト部の代わりにビッ
トマップディスプレイで実現し、出力画像メモリの内容
をビットマップディスプレイの解像度に応じて表示させ
るだけでも目的を果たすことができ、必要なものだけを
紙にマーキングするということを行えば、紙資源の節約
にも貢献できる。

【００５０】画像入力部を直接スキャナで実現する必要
はなく、光ディスクファイリングシステムなどに登録さ
れている多くの文書画像を順に送信してやることで実現
することができる。

【００５１】（第５の実施例）次に、本発明の文書処理
装置を目次作成装置として構成した実施例について説明
する。この目次作成装置は、図２６に示すように、文書
画像保持部２６１、領域分割部２６２、論理識別子付与
部２６３、画像枚数カウント部２６４、目次構成要素要
素抽出部２６５、目次構成要素蓄積部２６６、ページ番
号付加部２６７、数字データ格納部２６８、デザインデ
ータ格納部２６９、出力画像生成部２６１０、出力画像
メモリ２６１１およびプリントアウト部２６１２からな
る。なお、本実施例によれば、図２７に示すような複数
の文書画像を入力し、図２８に示すように各文書画像に
新たにページ番号を追加し、適当な文書画像中の項目を
用いて目次を自動的に生成することが可能である。

【００５２】文書画像保持部２６１では、文書画像をデ
ィジタル画像として保持し、処理対象となる画像を提供
する。この文書画像保持部２６１は、文書画像をディジ
タル画像として取り込むことがでぎればよく、特定の手
段でなくてもよい。例えば、すでにデータベースとして
光ディスク装置などの記憶装置に入力されている文書画
像を使う場合は、この光ディスク装置が文書画像保持部
となり、また画像入力装置から新たに入力するのであれ
ば、この画像入力装置のローカルなメモリが文書画像保
持部となる。ここでは、簡単に画像入力装置で処理対象
となる文書画像を入力ものとして説明する。

【００５３】画像枚数カウント部２６４では、処理対象
として入力された文書画像の枚数を計数する。この枚数
は、後の目次構成要素抽出部２６５においてページ番号
を計算するのに使用する。ページ番号の計数は単純に考
えて最初に入力された文書画像を１ページとすればよい
が、この場合、出力は最後のページとなる文書画像が最
後に出力され、そのあとに目次が出力される。なぜな
ら、目次は全ての文書画像に対する処理が終了しないと
画像を生成できないからである。複写機などの文書処理
装置を考えると、このような出力方法では、１ページ目
の文書画像が一番下にある紙として出力され、一度ペー
ジ番号順に並べかえなくてはならない。このような手間
を回避するために、最終ページとなる文書画像を最初に
読み込む必要があるが、これでは正しいページ番号をそ
のまま付加することができない。従って、予め入力枚数
を計数しておき、この値から各文書画像のページを算出
する必要がある。

【００５４】入力された各文書画像は、領域分割部２６
２によって文書要素として意味のある領域に分割する。
この処理は第１の実施例で説明したところと同じであ
る。すなわち、この処理は、文書認識技術における領域
分割処理であり、文書のディジタル画像を入力として、
文字領域、図表領域などに分割する処理に対応し、公知
の技術によって実現できる。領域分割処理の結果は、領
域の位置・大きさ、下位要素領域列、分類（文字領域、
図表領域などの区別）を組にしたレイアウト構造として
出力する。

【００５５】各文書画像は論理識別子付与部２６３によ
って、各文書要素の領域に対して「タイトル」、「著
者」、「本文」などの論理的な識別子を付与するもので
ある。この処理も第１の実施例で説明したとおりであ
る。すなわち、認識対象のレイアウト構造と論理構造の
対応を表現する構造モデルを予め複数登録しておき、領
域分割結果と構造モデルとのマッチングによってそれぞ
れの論理的な意味を表現する名称が付与される。

【００５６】目次構成要素抽出部２６５は、各文書画像
から、目次を構成するための文書要素とページ番号とを
取り出し、図２９に示すようなテーブルを作成する。こ
のテーブルには目次とするための文書要素を表す部分を
文書画像から切り出した実際の画像も記録されている。
例えば、目次を構成する文書要素を文書中のタイトルと
すると、論理識別子付与部２６３において付与された論
理識別子中からタイトル部分を示す領域の情報すなわち
タイトルの領域の左上点の座標（Ｘ座標、Ｙ座標）、
幅、および高さを取り出す。そして、その領域に対応す
る文書画像の部分画像を文書画像保持部２６１に保持さ
れている文書画像から切り出し、目次構成要素蓄積部２
６６に格納し、前記テーブルにその部分画像のポインタ
を付加する。また、ページ番号はその文書画像がＮ番目
に処理されているとし、入力される文書画像がＭ枚とす
ると次式によりページ番号Ｐを求めることができる。Ｐ＝Ｍ−Ｎ＋１そして求めたページ番号Ｐを前記テーブルに格納する。
このようにして目次構成要素抽出部２６５により生成さ
れたテーブルは、各文書画像が処理される度に順番に目
次構成要素蓄積部２６６に蓄積される。この目次構成要
素蓄積部２６６は、各処理で抽出された目次構成要素を
一時的に蓄積するための手段であり、その構成が半導体
の記憶媒体上に構成されようとハードディスク上に構成
されようと構わない。

【００５７】各文書画像は、上記の処理と共にページ番
号付加部２６７において新たにページ番号の追加が行わ
れる。この処理を図３０に示すフローチャートを用いて
説明する。まず、各文書画像中にページ番号を表す論理
識別子が論理識別子付与部において付与されていないか
調べる（ステップＳ３０１）。ページ番号を表す論理識
別子が付与されている場合、その領域を文書画像のバッ
クグラウンドを表す画素で埋め尽くすことにより原稿の
ページ番号を削除する（ステップＳ３０２）。例えば、
文書画像が、文字などを表す黒画素を“１”で、その他
の部分を白画素“０”で表現されていると、ページ番号
を表す論理識別子が付与されている領域を白画素“０”
で埋め尽くす処理を行う。さらに、いま白画素で埋め尽
くした領域に、新たなページ番号の付加を行う（ステッ
プＳ３０４）。ページ番号を表す論理識別子が付与され
ていない文書画像に対しては、ページ番号を追加するた
めのある一定の大きさの領域を空けるために、各文書要
素の領域に対して拡大・縮小などを行う（ステップＳ３
０３）。このようにして確保したページ番号のための領
域に、新たにページ番号の追加を行う（ステップＳ３０
４）。ここで使用するページ番号は、目次構成要素抽出
部２６５によって抽出されたページ番号であり、このペ
ージ番号に相当する文字画像のデータを数字データ格納
部２６８から取り出して、文書画像を構成する他の部分
と合成して新たにページ番号が追加された文書画像を画
像生成部２６１０において生成する。

【００５８】一方、目次を表す文書画像は、入力された
全ての文書画像に対して上記の処理を施した後、目次構
成要素蓄積部２６６に蓄積されているデータを用いて文
書画像を生成する。このとき、目次を構成する文書画像
のタイトル部分とページ番号はデザインデータ格納部２
６９に格納されているデータに従って配置され、ページ
番号については数字データ格納部２６８から相当する文
字画像を取り出してきて、画像生成部２６１０において
目次を表す文書画像を生成する。このときのデザインデ
ータは図３１に示すようなテーブルで表現され、各項目
ごとに領域の基準位置、最大幅、文字の大きさ、文字修
飾の方法などが記されている。それぞれの位置は、他の
項目に対する相対位置で表されているが、これは他の項
目の文字量によって配置する位置が異なってくるためで
ある。なお、単位は全てｍｍである。画像生成部２６１
０では、デザインデータ格納部２６９からのデザインデ
ータに従って各項目を配置するために、目次構成要素蓄
積部２６６に蓄積されているタイトルの画像を各文字を
表す部分画像に再分割を行う。この再分割した画像をデ
ザインデータで指定された場所に順次流し込んで行く。
この流しこみ処理は、例えば第２の実施例において、図
３２を用いて説明した技術を用いることができる。以上
の処理によって、入力された複数の文書画像に新たにペ
ージ番号を付加して、対応する目次を生成することがで
きる。

【００５９】本実施例では、文書画像中のタイトルを用
いて目次を生成する例を説明しているが、もちろん文書
画像の使用目的によって、文書画像中のタイトルではな
く、著者名や日付などを用いることも可能である。ま
た、本実施例では入力された文書画像中のタイトル部分
を文字認識し、文書画像中の文字と異なったフォントで
目次を生成することも可能である。

【００６０】なお、以上に説明した第１ないし第５の実
施例において、原稿画像入力部、プリントアウト部、デ
ータ入力・解析部等は、既存のハードウェア技術によっ
て構成することができる。また、領域分割部、論理識別
子付与部、必要要素抽出部、ソーティング処理部、文字
認識部、出力画像生成部等の一部または全部を、ソフト
ウェアモジュールとして構成し、それらのソフトウェア
モジュールをＲＯＭあるいはその他の適宜の記憶装置に
格納し、中央処理装置により実行するようにしてもよ
く、あるいは、それらを個別の論理素子を組み合せた論
理回路によるハードウェアモジュールとして構成しても
よい。

【００６１】

【発明の効果】本発明によれば、原稿の文書画像から所
望の文書要素の箇所のみを取り出して構成した文書画像
を自動的に作成することができる。したがって、従来は
人手により、あるいは文字認識装置によりコード化した
後にしかできなかった、文書のサマリやリストの作成、
あるいは目次の作成等が自動的にかつ容易にできるの
で、文書の量が増えてもその管理が容易となる。

【０００６２】また、本発明によれば、書式の異なる原
稿を含む複数の文書原稿の画像からそれぞれ概要を把握
するのに必要な文書要素を抽出し、所定の書式に従って
配置してサマリ文書群を自動的に生成する文書処理装置
を得ることができる。したがって、この装置により文書
をサマリ化して、文書管理を効率的に行うことができ
る。また、本発明は、複数の文書原稿の画像から抽出し
た特定の文書要素を文字認識し、それをキーとしてソー
ティングを行って、サマリ文書を配列するようにしたこ
とにより、必要な文書を検索するのが容易になる。

【００６３】また、本発明によれば原稿の文書画像から
見出しの文書要素を取り出して目次を自動的に生成する
文書処理装置を得ることができるので、何枚目にどの文
書があるかを容易に知ることができる資料を簡単な操作
によって作るができる。

【００６４】また、本発明のページ番号付加手段を設け
た態様によれば、各文書画像に対してページ番号を付け
直すので、対応が分かりやすい目次付きかつページ番号
入りの文書を作成することができる。

【図面の簡単な説明】

【図１】第１の実施例の概略の構成を示すブロック図

【図２】第１の実施例の処理の流れを示すフローチャ
ート

【図３】入力された１枚目の文書画像の例を示す図

【図４】入力された２枚目の文書画像の例を示す図

【図５】入力された３枚目の文書画像の例を示す図

【図６】図３の文書画像を領域分割した結果の例を示
す図

【図７】領域分割の結果（レイアウト構造）をテーブ
ル形式で表現した例を示す図

【図８】図３の文書画像のグラフ構造で表現された構
造モデルを示す図

【図９】図４の文書画像のグラフ構造で表現された構
造モデルを示す図

【図１０】図５の文書画像のグラフ構造で表現された
構造モデルを示す図

【図１１】入力文書例と構造文書モデル例とのマッチ
ング結果の一例を示す図

【図１２】図３の文書画像例から切り出されたサマリ
作成に必要な３つの論理識別子に対応する領域の部分画
像を示す図

【図１３】１枚の文書の必要要素の配置を説明するた
めの図

【図１４】第１の実施例により作成されたサマリ文書
の例を示す図

【図１５】必要要素抽出部における必要要素の指定を
行うためのテーブルの例を示す図。

【図１６】領域分割部の処理結果の階層構造と入力文
書例との対応を示す図

【図１７】領域分割部の処理結果のデータの階層構造
を示す図

【図１８】第２の実施例により作成されたサマリ文書
の例を示す図

【図１９】第３の実施例の概略の構成を示すブロック
図

【図２０】第３の実施例の説明に用いる文書画像の例
を示す図

【図２１】第３の実施例により作成されたサマリ文書
の例を示す図

【図２２】第１、第２の実施例にデータの変更を行う
ためのデータ入力・解析部を設けた変形例を示す図

【図２３】第３の実施例にデータの変更を行うための
データ入力・解析部を設けた変形例を示す図

【図２４】構造モデルを表現する簡易な言語の文法を
示す図。

【図２５】図８に示した論文のカバーページを構造モ
デルの言語により記述した例を示す図

【図２６】文書処理装置を目次作成装置として構成し
た第５の実施例を示すブロック図

【図２７】目次作成のために入力された複数の文書画
像の例を示す図

【図２８】図２７の文書画像に目次作成処理により目
次が作成され、ページ番号が付与された文書画像を示す
図

【図２９】目次構成要素の抽出結果を示すテーブルの
例を示す図

【図３０】ページ番号付加部による新たにページ番号
の追加を行う処理を示すフローチャート

【図３１】デザインデータテーブルを示す図

【図３２】文字の流し込み処理を行うための構成の一
例を示すブロック図

【符号の説明】

１１，１９１，２２１，２３１…原稿画像入力部、１
２，１９２，２２２，２３２．２６２…領域分割部、１
３，１９３，２２３，２３３，２６３…論理識別子付与
部、１４，１９４，２２４，２３４…必要要素抽出部、
１５，１９８，２２５，２３８，２６１０…出力画像生
成部、１５１，２６１１…出力画像メモリ、１６，１９
９，２２６，２６１１…プリントアウト部、１９５，２
３５…部分画像蓄積部、１９６，２３６…文字認識部、
１９７，２３７…ソーティング処理部、２２７，２３９
…データ入力・解析部、２６１…文書画像保持部、２６
４…画像枚数カウント部、２６５…目次構成要素抽出
部、２６６…目次構成要素蓄積部、２６７…ページ番号
付加部、２６８…数字データ格納部、２６９…デザイン
データ格納部。

フロントページの続き (56)参考文献特開昭57−199066（ＪＰ，Ａ) 特開昭59−16040（ＪＰ，Ａ) 特開昭59−43432（ＪＰ，Ａ) 特開昭59−148944（ＪＰ，Ａ) 特開昭60−11918（ＪＰ，Ａ) 特開昭60−17522（ＪＰ，Ａ) 特開昭60−57422（ＪＰ，Ａ) 特開昭60−82374（ＪＰ，Ａ) 特開昭60−211567（ＪＰ，Ａ) 特開昭61−265662（ＪＰ，Ａ) 特開昭61−281377（ＪＰ，Ａ) 特開昭62−55769（ＪＰ，Ａ) 特開昭62−117059（ＪＰ，Ａ) 特開昭62−249270（ＪＰ，Ａ) 特開昭62−271171（ＪＰ，Ａ) 特開昭63−59658（ＪＰ，Ａ) 特開昭63−184159（ＪＰ，Ａ) 特開昭64−4864（ＪＰ，Ａ) 特開昭64−15889（ＪＰ，Ａ) 特開昭64−51567（ＪＰ，Ａ) 特開平１−100666（ＪＰ，Ａ) 特開平１−100667（ＪＰ，Ａ) 特開平１−194063（ＪＰ，Ａ) 特開平２−64852（ＪＰ，Ａ) 特開平２−183364（ＪＰ，Ａ) 特開平２−289061（ＪＰ，Ａ) 特開平３−3070（ＪＰ，Ａ) 特開平３−14184（ＪＰ，Ａ) 特開平３−27471（ＪＰ，Ａ) 特開平３−252859（ＪＰ，Ａ) 特開平４−107767（ＪＰ，Ａ) 特開平４−116765（ＪＰ，Ａ) 特開平５−334370（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06T 11/60 G06T 1/00 G06F 17/21 501 G06F 17/21 546 特許ファイル（ＰＡＴＯＬＩＳ) ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】 1枚以上の原稿文書を画像として入力す
る文書画像入力手段と、その文書画像入力手段から入力された文書画像上の画素
の集まりを、それぞれ文書要素として意味のある塊とし
て領域に分割する領域分割手段と、その領域分割手段によって分割された文書画像上の各領
域に、それぞれ文書の論理的な意味付けを表す識別子を
付与する論理識別子付与手段と、その識別子付与手段によって付与された識別子を持つ文
書領域のうち、サマリ作成に必要な識別子を持つ文書要
素を抽出する必要要素抽出手段と、その必要要素抽出手段によって抽出された文書要素に対
応する領域の部分画像を基に出力画像を生成する出力画
像生成手段と、を具備することを特徴とする文書処理装置。
【請求項２】前記論理識別子付与手段において、対象と
なる文書に現れる文書要素と要素間の相対的な位置関係
を記述した構造モデルをあらかじめ1つ以上登録してお
き、領域分割手段から得られた結果と合致する構造モデ
ルを選択し、論理識別子を付与することを特徴とする請
求項１記載の文書処理装置。
【請求項３】前記論理識別子付与手段に登録する構造モ
デルの変更や新規登録を行うための入力手段を設けたこ
とを特徴とする請求項２記載の文書処理装置。
【請求項４】あらかじめ定義された簡易な言語で記述さ
れた必要要素の論理識別子を必要要素抽出部の抽出指示
データとして入力するための入力手段を有することを特
徴とする請求項１記載の文書処理装置。
【請求項５】前記出力画像生成手段は、前記必要要素抽
出手段によって抽出された文書要素に対応する領域の部
分画像をそのまま再配置して出力画像を生成するもので
あることを特徴とする請求項１記載の文書処理装置。
【請求項６】前記必要要素抽出手段の必要要素の指定に
対してデザインパラメータを付与し、出力画像生成手段
でそのデザインパラメータに応じて抽出された文書要素
に対応する領域の部分画像を変換・加工した後、再配置
することにより出力画像を生成することを特徴とする請
求項１記載の文書処理装置。
【請求項７】前記出力画像生成手段は、文字ごとに切り
出されている部分画像をデザインパラメータに指定され
た領域の幅に収まるように再配置する文字流し込み処理
と、デザインパラメータに指定された文字の大きさとな
るように文字流し込み処理により得られた画像の領域拡
大・縮小処理を行うものであることを特徴とする請求項
６記載の文書処理装置。
【請求項８】前記必要要素抽出手段にあらかじめ定義さ
れたフォーマットで記述されたデザイン指定の表を入力
するための入力手段を設けたことを特徴とする請求項６
記載の文書処理装置。
【請求項９】前記出力画像生成手段により生成された
出力文書画像を可視化メディア上に可視化する可視化手
段を設けたことを特徴とする請求項１記載の文書処理装
置。
【請求項１０】請求項2記載の文書処理装置におい
て、さらに前記文書要素選択手段によって選択された文
書要素に対応する領域の部分画像を文書画像ごとに論理
識別子と対にして保持しておく部分画像蓄積手段と、前記部分画像蓄積手段に蓄積された画像から、ソーティ
ングのキーとなる論理識別子を持つ要素の部分画像を文
字コード列に変換する文字認識手段と、前記文字認識手段で得られた文字コード列をもとにソー
ティングを行い、文書画像の出力順序を決定するソーテ
ィング手段とを備え、前記出力画像生成手段は、前記ソーティング手段によっ
て得られた文書画像の出力順序にしたがって、前記必要
要素抽出手段によって抽出された文書要素に対応する領
域の部分画像を基に出力画像を生成するものであること
を特徴とする文書処理装置。
【請求項１１】ソート・キーとなる文書要素の論理識別
子、文字認識のための文字パターン、特徴量辞書などの
文字認識およびソーティングのためのデータを入力する
ための入力手段を設けたことを特徴とする請求項１０記
載の文書処理装置。
【請求項１２】複数枚の文書画像を保持する文書画像
保持手段と、前記文書画像保持手段から入力される各文書画像を、文
書要素として意味のある領域に分割する領域分割手段
と、その領域分割手段により得られた文書要素に、論理的な
意味付けを持つ識別子を付与する論理識別子付与手段
と、各文書画像ごとに、そのページ番号を決定すると共に、
前記論理識別子付与手段により付与された識別子を基に
目次を構成するのに必要な文書要素を抽出する目次構成
要素抽出手段と、その目次構成要素抽出手段によって抽出された目次構成
に必要な文書要素および対応するページ番号を基に、一
定のデザインによって目次画像を生成する出力画像生成
手段とを備えたことを特徴とする目次作成用の文書処理
装置。
【請求項１３】処理対象とする文書画像の枚数を数え
る画像枚数カウント手段を有すると共に、前記目次構成
要素抽出手段は、前記画像枚数カウント手段のカウント
した枚数と文書画像の処理順番とによりページ番号を決
定することを特徴とする請求項請求項１２記載の目次作
成用の文書処理装置。
【請求項１４】前記目次構成要素抽出手段は、各文書
画像に対してページ番号に対応する論理識別子の付与さ
れた文書要素をも抽出するものであり、前記出力画像生成手段は、目次およびページ番号付き文
書からなる出力画像を生成するために、前記目次構成要
素抽出手段によりページ番号に対応する論理識別子の付
与された文書要素が抽出された場合には、その文書要素
の領域を削除して新たにページ番号を付与し、抽出され
なかった場合には文書画像の所定の位置に新たにページ
番号を付与するページ番号付与手段を有することを特徴
とする請求項請求項１２記載の目次付き文書作成用の文
書処理装置。