JPH10320412A - 文書作成装置 - Google Patents

文書作成装置

Info

Publication number
JPH10320412A
JPH10320412A JP9132025A JP13202597A JPH10320412A JP H10320412 A JPH10320412 A JP H10320412A JP 9132025 A JP9132025 A JP 9132025A JP 13202597 A JP13202597 A JP 13202597A JP H10320412 A JPH10320412 A JP H10320412A
Authority
JP
Japan
Prior art keywords
document
image
information
area
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9132025A
Other languages
English (en)
Inventor
Hiroteru Tsuchiya
博照 土屋
Takaharu Iwasaki
隆治 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TEC CORP
Original Assignee
TEC CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TEC CORP filed Critical TEC CORP
Priority to JP9132025A priority Critical patent/JPH10320412A/ja
Publication of JPH10320412A publication Critical patent/JPH10320412A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】文書検索の判断に必要な情報を適切に提示して
信頼性の向上を図る。 【解決手段】文書入力部11から入力した文書情報が画
像文書か電子化された構造化文書かを判定し、画像文書
は画像文書情報作成部18にて画像文書から文字、表、
図、写真の領域を判定し分割して画像領域の大きさや座
標を取得し、さらに分割した各領域の書誌的事項を判定
して画像領域の情報を作成し文書情報記憶部14に記憶
する。また、構造化文書はそのまま文書情報記憶部14
に記憶する。そして、画像文書は画像領域を複数組合わ
せて新たな画像文書を作成し、構造化文書は構造化要素
を抜き出したり、内容の要約を作成して新たな構造化要
素を生成しこれを複数組合わせて新たな構造化文書を作
成する。この作成した画像文書及び構造化文書を文書提
示部24により限られたスペースの紙面又は画面に提示
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、多量の文書を検索
する場合に使用する文書作成装置に関する。
【0002】
【従来の技術】例えば、多量の文書がデータベースに格
納されている場合に、このデータベースから必要な文書
を検索するにはすべての文書を読出して画面表示したの
で膨大な時間と労力を要することになり現実的ではな
い。このため、検索する複数の文書を例えば抄録のよう
な形式に編集して画面表示したり、印字出力することが
要求される。従来、このような要求に対処できるものと
しては、例えば、特開平7−146875号公報に記載
されたものが知られている。
【0003】これは、検索条件に基づいて画像データフ
ァイルから複数の特定ページを検索して縮小し、図22
に示すように、情報入力シート1の領域21 ,22 ,2
3 ,24 に印刷して出力し、ユーザはこの情報入力シー
ト1に印刷された特定ページを見て必要な文書を判断
し、改めて該当する文書のすべてを取り出すというもの
である。
【0004】
【発明が解決しようとする課題】しかし、このように単
に特定ページを縮小して提示するものでは、文書が多く
のページからなるなる場合、本来必要な情報が他のペー
ジにあると見過ごされることになり、このため判断に必
要な情報が不十分となって信頼性が低下するという問題
があった。また、文書の全ページを縮小して提示するこ
とも考えられるが、たとえ縮小しても印刷する用紙の枚
数が多くなり、また不要な文書を印刷する場合もあり用
紙を無駄に使用するという問題がある。
【0005】そこで請求項1記載の発明は、文書検索の
判断に必要な情報を適切に提示でき、信頼性を向上でき
る文書作成装置を提供する。
【0006】また、請求項2記載の発明は、手書き文書
も含めて文書検索の判断に必要な情報を適切に提示で
き、信頼性を向上できる文書作成装置を提供する。
【0007】また、請求項3記載の発明は、手書き文書
も含めて文書検索の判断に必要な情報を適切に提示でき
て信頼性を向上でき、しかも、画像文書については必要
な画像領域を組合わせた新たな画像文書を縮小して提示
するとともにその一部の画像領域を抜き出して提示する
ことで複数の文書の情報をまとめて適切に提示できる文
書作成装置を提供できる。
【0008】また、請求項4記載の発明は、手書き文書
も含めて文書検索の判断に必要な情報を適切に提示でき
て信頼性を向上でき、しかも、画像文書については必要
な画像領域を組合わせた新たな画像文書を縮小して提示
するとともにその一部の画像領域を抜き出して提示する
ことで複数の文書の情報をまとめて適切に提示でき、さ
らに、新たな画像文書を紙面にて提示した場合にはこの
画像文書の必要な画像領域を塗りつぶして読み込ませる
ことでその画像領域の文書のみを提示することができ必
要な情報をさらに適切に提示できる文書作成装置を提供
する。
【0009】
【課題を解決するための手段】請求項1記載の発明は、
文字、表、図、写真からなる文書情報を入力する文書入
力手段と、この文書入力手段にて入力した文書情報が画
像文書か電子化された構造化文書かを判定する文書判定
手段と、この文書判定手段が画像文書を判定したとき、
この画像文書から文字、表、図、写真の領域を判定し分
割して画像領域の大きさや座標を取得し、さらに分割し
た各領域の書誌的事項を判定して画像領域の情報を作成
する画像文書情報作成手段と、文書判定手段が構造化文
書を判定したときの構造化文書及び画像文書情報作成手
段にて作成した画像文書情報を記憶する情報記憶手段
と、この情報記憶手段に記憶した画像文書情報について
は画像領域を複数組合わせて新たな画像文書を作成し、
構造化文書については構造化要素を抜き出したり、内容
の要約を作成して新たな構造化要素を生成しこれを複数
組合わせて新たな構造化文書を作成する文書作成手段
と、この文書作成手段が作成した新たな画像文書及び新
たな構造化文書を限られたスペースの紙面又は画面に出
力して提示する文書提示手段とを設けたものである。
【0010】請求項2記載の発明は、文字、表、図、写
真からなる文書情報を入力する文書入力手段と、この文
書入力手段にて入力した文書情報が画像文書か電子化さ
れた構造化文書かを判定する第1の文書判定手段と、こ
の文書判定手段が画像文書を判定したときこの画像文書
がさらに整然とレイアウトされた画像文書か手書きの画
像文書かを判定する第2の文書判定手段と、この第2の
文書判定手段が整然とレイアウトされた画像文書を判定
したとき、この画像文書から文字、表、図、写真の領域
を判定し分割して画像領域の大きさや座標を取得し、さ
らに分割した各領域の書誌的事項を判定して画像領域の
情報を作成し、第2の文書判定手段が手書きの画像文書
を判定したとき、この画像文書が実際に描かれている部
分を最小限に囲む領域を求め、縦書きか横書きかを判定
して分割し、さらに分割した各領域の書誌的事項を判定
して画像領域の情報を作成する画像文書情報作成手段
と、文書判定手段が構造化文書を判定したときの構造化
文書及び画像文書情報作成手段にて作成した画像文書情
報を記憶する情報記憶手段と、この情報記憶手段に記憶
した画像文書情報については画像領域を複数組合わせて
新たな画像文書を作成し、構造化文書については構造化
要素を抜き出したり、内容の要約を作成して新たな構造
化要素を生成しこれを複数組合わせて新たな構造化文書
を作成する文書作成手段と、この文書作成手段が作成し
た新たな画像文書及び新たな構造化文書を限られたスペ
ースの紙面又は画面に出力して提示する文書提示手段と
を設けたものである。
【0011】請求項3記載の発明は、文字、表、図、写
真からなる文書情報を入力する文書入力手段と、この文
書入力手段にて入力した文書情報が画像文書か電子化さ
れた構造化文書かを判定する第1の文書判定手段と、こ
の文書判定手段が画像文書を判定したときこの画像文書
がさらに整然とレイアウトされた画像文書か手書きの画
像文書かを判定する第2の文書判定手段と、この第2の
文書判定手段が整然とレイアウトされた画像文書を判定
したとき、この画像文書から文字、表、図、写真の領域
を判定し分割して画像領域の大きさや座標を取得し、さ
らに分割した各領域の書誌的事項を判定して画像領域の
情報を作成し、第2の文書判定手段が手書きの画像文書
を判定したとき、この画像文書が実際に描かれている部
分を最小限に囲む領域を求め、縦書きか横書きかを判定
して分割し、さらに分割した各領域の書誌的事項を判定
して画像領域の情報を作成する画像文書情報作成手段
と、文書判定手段が構造化文書を判定したときの構造化
文書及び画像文書情報作成手段にて作成した画像文書情
報を記憶する情報記憶手段と、この情報記憶手段に記憶
した画像文書情報については画像領域を複数組合わせて
新たな画像文書を作成し、構造化文書については構造化
要素を抜き出したり、内容の要約を作成して新たな構造
化要素を生成しこれを複数組合わせて新たな構造化文書
を作成する文書作成手段と、この文書作成手段が作成し
た新たな画像文書及び新たな構造化文書を限られたスペ
ースの紙面又は画面に出力して提示する文書提示手段と
を設け、文書作成手段は、画像文書情報が整然とレイア
ウトされた画像文書のときは、各画像領域が文字、表、
図、写真のどの領域であるかの種別と各画像領域を指定
する領域番号を付加した新たな画像文書を縮小した画像
を複数並べて画像領域マップ部とし、この画像領域マッ
プ部の各縮小画像の画像領域の一部を複数組合わせて分
割領域提示部とし、この両部を合成して文書提示手段が
提示する画像文書を作成し、また、画像文書情報が手書
き画像文書のときは、分割した各画像領域を指定する領
域番号を付加した新たな画像文書を縮小した画像を複数
並べて画像領域マップ部とし、この画像領域マップ部の
各縮小画像の画像領域の一部を複数組合わせて分割領域
提示部とし、この両部を合成して文書提示手段が提示す
る画像文書を作成することにある。
【0012】請求項4記載の発明は、文字、表、図、写
真からなる文書情報を入力する文書入力手段と、この文
書入力手段にて入力した文書情報が画像文書か電子化さ
れた構造化文書かを判定する第1の文書判定手段と、こ
の文書判定手段が画像文書を判定したときこの画像文書
がさらに整然とレイアウトされた画像文書か手書きの画
像文書かを判定する第2の文書判定手段と、この第2の
文書判定手段が整然とレイアウトされた画像文書を判定
したとき、この画像文書から文字、表、図、写真の領域
を判定し分割して画像領域の大きさや座標を取得し、さ
らに分割した各領域の書誌的事項を判定して画像領域の
情報を作成し、第2の文書判定手段が手書きの画像文書
を判定したとき、この画像文書が実際に描かれている部
分を最小限に囲む領域を求め、縦書きか横書きかを判定
して分割し、さらに分割した各領域の書誌的事項を判定
して画像領域の情報を作成する画像文書情報作成手段
と、文書判定手段が構造化文書を判定したときの構造化
文書及び画像文書情報作成手段にて作成した画像文書情
報を記憶する情報記憶手段と、この情報記憶手段に記憶
した画像文書情報については画像領域を複数組合わせて
新たな画像文書を作成し、構造化文書については構造化
要素を抜き出したり、内容の要約を作成して新たな構造
化要素を生成しこれを複数組合わせて新たな構造化文書
を作成する文書作成手段と、この文書作成手段が作成し
た新たな画像文書及び新たな構造化文書を限られたスペ
ースの紙面又は画面に出力して提示する文書提示手段
と、文書入力手段が入力する文書情報に文書提示手段が
画像文書を出力して提示した紙面における画像領域の塗
りつぶし情報があると、塗りつぶした画像領域を認識し
て該当する領域番号を文書作成手段に通知する画像領域
指定シート解析手段とを設け、文書作成手段は、画像文
書情報が整然とレイアウトされた画像文書のときは、各
画像領域が文字、表、図、写真のどの領域であるかの種
別と各画像領域を指定する領域番号を付加した新たな画
像文書を縮小した画像を複数並べて画像領域マップ部と
し、この画像領域マップ部の各縮小画像の画像領域の一
部を複数組合わせて分割領域提示部とし、この両部を合
成して文書提示手段が提示する画像文書を作成し、ま
た、画像文書情報が手書き画像文書のときは、分割した
各画像領域を指定する領域番号を付加した新たな画像文
書を縮小した画像を複数並べて画像領域マップ部とし、
この画像領域マップ部の各縮小画像の画像領域の一部を
複数組合わせて分割領域提示部とし、この両部を合成し
て文書提示手段が提示する画像文書を作成し、さらに、
画像領域指定シート解析手段から領域番号の通知を受け
ると、この通知された領域番号に該当する画像領域の情
報を情報記憶手段から読出し合成して文書提示手段が提
示する画像文書を作成することにある。
【0013】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は文書作成装置の構成を示す
ブロック図で、11は文字、表、図、写真等からなる文
書情報を入力する文書入力手段を構成する文書入力部で
ある。この文書入力部11は、スキャナーからなる読取
り走査部12、モデムやネットワークアダプタからなる
通信部13を備え、前記読取り走査部12で原稿上に記
載された文書情報を読取って入力し、前記通信部13で
公衆回線やLANを介して遠隔地の端末等から文書情報
を受信して入力するようになっている。
【0014】14は情報記憶手段としての文書情報記憶
部で、ハードディスクや半導体メモリ等で構成してい
る。この文書情報記憶部14は、入力した画像文書や構
造化電子文書を記憶する文書格納部15、文書番号、形
態、画像領域管理テーブルへのポインタ、縮小画像への
ポインタを管理する文書管理テーブル16、分割した領
域の番号、種別、大きさ、位置、書誌的事項を管理数画
像領域情報管理テーブル17により構成している。
【0015】18は画像文書情報作成手段としての画像
文書情報作成部で、文書を領域に分割する領域抽出部1
9と領域の種別、書誌的事項を判定する領域識別部20
により構成している。21は文書作成手段を構成する提
示文書作成部で、分割した領域を複数組合わせて文書を
作成する画像合成文書作成部22と電子文書の構造化要
素を複数組み合わせて文書を作成する構造化合成文書作
成部23により構成している。
【0016】24は文書提示手段を構成する文書提示部
で、CRTディスプレイからなる画面出力部25とプリ
ンタからなる印字部26により構成している。27は画
像領域指定シート解析手段としての画像領域指定シート
解析部で、前記印字部26で印字出力した画像合成文書
における塗りつぶされた領域を識別するようになってい
る。
【0017】前記画像文書情報作成部18と提示文書作
成部21はその処理機能がプログラムとしてROMに組
込まれている。前記文書入力部11、文書情報記憶部1
4、画像文書情報作成部18、提示文書作成部21、文
書提示部24及び画像領域指定シート解析部27は互い
にバスライン28により接続している。
【0018】図2は文書作成装置が行う一連の処理を示
す流れ図で、ステップS11にて文書の入力処理か提示処
理かを判定し、文書の入力処理であれば、ステップS12
にて、前記文書入力部11による画像文書あるいは構造
化電子文書の入力処理を行う。この入力処理は読取り走
査部12による読取り走査あるいは通信部13による受
信処理にて行う。
【0019】ステップS12による文書の入力処理が終了
すると、続いて、ステップS13にて、入力した文書が画
像文書か構造化電子文書かを判定する。(第1の文書判
定手段) 入力文書が図5、図6、図11の(a) 、(b) に示すよう
な画像文書であると判定したときには、続いて、ステッ
プS14にて、前記画像文書情報作成部18の領域抽出部
19で図7、図8、図11の(c) 、(d) に示すように画
像領域に分割し、領域識別部20で分割した領域が写
真、文字、表、図のいずれであるかの領域の種別及び題
目、副題目、本文のいずれであるかの書誌的事項の種別
を判定し、図14に示すような画像領域情報管理テーブ
ル17を作成し情報を書込む。そして、ステップS15に
て、文書と情報を文書情報記憶部14に記憶する。この
とき、文書番号と、文書が手書き画像か整然とレイアウ
トされた画像か電子的に構造化されたものかの文書形態
と、文書形態が画像であるならば文書の画像領域情報管
理テーブル17へのポインタを文書管理テーブル16に
書込む。
【0020】また、前記ステップS11において文書の提
示処理を判定すると、文書の提示先が限られた大きさの
画面あるいは用紙であれば、続いて、ステップS16に
て、提示文書作成部21は文書管理テーブル16、画像
領域情報管理テーブル17及び文書格納部15から画像
領域、構造化要素に関する情報を取り出し、画像領域及
び構造化要素を組合わせて図9及び図10に示すような
提示文書を新たに作成する。続いて、ステップS17に
て、文書提示部24は画面出力部25、印字部26の一
方又は両方で作成した提示文書を提示する。すなわち、
画面表示部25はCRTディスプレイに表示し、印字部
26はプリンタにより用紙に印字出力する。
【0021】前記ステップS14における画像文書情報作
成部18の処理を詳細に述べると、図3に示すように、
先ず、ステップS21にて、入力した図5で示す文書A、
図6で示す文書Bの縮小画像を作成する。続いて、ステ
ップS22にて、各縮小画像を文書格納部15に格納し、
この格納部へのポインタを図13に示す文書管理テーブ
ル16の縮小画像へのポインタエリア16aに格納す
る。
【0022】続いて、ステップS23にて、画像文書が整
然とレイアウトされた画像文書か手書き画像文書かを判
定する。(第2の文書判定手段) 文書Aは整然とレイアウトされた画像であるので、図1
3の文書管理テーブル16の文書形態エリア16bにレ
イアウト画像文書を格納し、文書Aの画像をステップS
24にて、領域抽出部19により文書画像Aを領域分割
し、図5の文字群A1 は図7の領域a1 、図5の文字群
A2 は図7の領域a2 、図5の文字群A3は図7の領域
a3 、図5の表A4 は図7の領域a4 、図5の写真A5
は図7の領域a5 、図5の文字群A6 は図7の領域a6
と認識して各領域に分割する。
【0023】続いて、ステップS25にて、分割した各領
域A1 〜A6 の相対座標と大きさを領域番号A001〜
A006を付して画像領域情報管理テーブル17に格納
する。文書画像の座標系は図12に示すように、文書画
像31の左上を原点とし、水平右方向をx軸正方向、垂
直下方向をy軸正方向とする。領域32の相対座標は、
(X0 ,Y0 )、大きさは、高さH、幅Wのようにな
る。すなわち、文書Aの分割された領域a1 の相対座標
(X1 ,Y1 )、大きさ(H1 ,W1 )、領域a2 の相
対座標(X2 ,Y2 )、大きさ(H2 ,W2 )、領域a
3 の相対座標(X3 ,Y3 )、大きさ(H3 ,W3 )、
領域a4 の相対座標(X4 ,Y4 )、大きさ(H4 ,W
4 )、領域a5 の相対座標(X5 ,Y5 )、大きさ(H
5 ,W5 )、領域a6 の相対座標(X6 ,Y6 )、大き
さ(H6 ,W6 )をそれぞれ図14の画像領域情報管理
テーブル17の相対位置座標エリア17a、大きさエリ
ア17bに書込む。
【0024】続いて、ステップS26にて、各領域が文字
領域、図領域、表領域、写真領域のいずれであるかを判
定し、前記画像領域情報管理テーブル17の領域種別エ
リア17cに書込む。すなわち、文書画像Aにおいて
は、領域a1 ,a2 ,a3 ,a6 が文字領域、領域a4
が表領域、領域a5 が写真領域と識別されて書込まれ
る。続いて、ステップS27にて、各領域の書誌的事項を
判定する。これは領域の文書画像における位置や他の領
域に対する相対的な位置、大きさ等から判定する。文書
画像Aでは、領域a1 は最上位に位置し、他の領域の上
方を覆っているので主題目と判定し、書誌的事項エリア
17dには主題目を書込む。
【0025】同様にして図6に示す文書Bについても各
文字領域B1 〜B8 をそれぞれ図8に示すような領域b
1 〜b8 に分割し、それぞれ領域番号B001〜B00
8を付して相対座標、大きさ、領域種別、書誌的事項の
各情報を画像領域情報管理テーブル17に書込む。
【0026】前記ステッブS23にて、画像文書が手書き
画像文書と判定されたときは、ステップS28にて、図1
1の(a) に示す文書C及び図11の(b) に示す文書Dを
それぞれ最小限に囲む図11の(c) に示すブロックC1
、図11の(d) に示すブロックD1 を求める。続い
て、ステップS29にて、横書か縦書きかを判定する。
【0027】文書Cは横書なのでステップS30にて、図
11の(c) に示すように、ブロックC1 を上側Cu、左
側Cl、残りCrに分割する。また、文書Dは縦書きな
のでステップS31にて、図11の(d) に示すように、ブ
ロックD1 を上側Du、右側Dr、残りDlに分割す
る。ここで上側を分割するのは上側に目的、題目等の重
要な部分が描かれている場合が多いためである。続い
て、ステップS32にて、整然とレイアウトされた文書と
同様に各領域C,Cu,Cr,Cl,D,Du,Dr,
Dlの相対座標、大きさ、領域種別、書誌的事項を前記
画像領域情報管理テーブル17の各エリア17a,17
b,17c,17dに書込む。
【0028】前記ステップS16における提示文書作成部
21の処理を詳細に述べると、図4に示すように、先
ず、ステップS41にて、提示する文書が画像文書か構造
化された電子文書であるかを判定する。画像文書であれ
ば、ステップS42にて、前記画像合成文書作成部22に
よる処理を行う。例えば、画像文書の合成例として図1
3に示す文書管理テーブル16に管理されている文書番
号“A”、文書番号“B”から図9の合成画像文書41
を得る場合の画像合成文書作成部22の処理について述
べる。
【0029】この合成画像文書41は画像領域マップ部
42と分割領域提示部43からなる。先ず、画像領域マ
ップ部42の作成処理について説明する。ステップS42
では文書管理テーブル16から文書番号“A”の縮小画
像イメージへのポインタを取り出し、このポインタが示
す画像とその文書番号“A”を図9に44として示すよ
うに書込み、図7に示した文書Aの各領域のブロックを
図9に45として示すようにそれぞれ書込む。
【0030】続いて、ステップS43にて、図14の画像
領域情報管理テーブル17へのポインタを取り出し、各
領域の番号と領域種別、書誌的事項を取り出し、縮小イ
メージの領域に対応した領域番号、領域種別を図7の各
ブロック内の“A001−主題目”“A002−本文”
のように書込む。すなわち、文書Aの縮小イメージの領
域a1 には文書番号「A001」、書誌的事項「主題
目」と記すことになる。
【0031】文書Bについても同様に縮小画像イメー
ジ、文書番号“B”、領域番号、領域種別を図8に示す
ように作成し、文書番号“B”及び領域のブロックを図
9に46,47として示すように書込む。以上の処理に
より画像領域マップ部42を作成する。
【0032】次に分割領域提示部43の作成処理につい
て説明する。例えば、分割領域提示部43に図5に示す
文書Aの文字領域A1 及び表領域A4 と、図6に示す文
書Bの文字領域B1 を提示する処理について述べると、
図4のステップS44にて図14に示す画像領域管理テー
ブル17から領域A1 、すなわち領域番号A001の画
像情報である相対位置座標と大きさを取り出す。そし
て、前記文書格納部15に格納してある文書Aの原画像
から画像の左上を原点として相対位置座標(X1,Y1
)から大きさ(H1 ,W1 )の部分、すなわち、図7
に示す領域a1 に相当する矩形を切り出す。
【0033】続いて、ステップS45にて、切り出した文
字領域A1 を図9に48として示すように書込む。ま
た、画像領域情報管理テーブル17から領域番号“A0
01”とその領域種別“文字”を取り出し、“領域番号
−領域種別”の形で書込む。領域種別が文字であるなら
ば書誌的型を取り出して書込む。この場合、領域番号
“A001”と書誌的型“主題目”を図9に49として
示すように書込む。
【0034】以上の処理によって分割領域提示部43に
対する文書Aの文字領域A1 の書込みが終了する。同様
にして、表領域A4 についても画像領域情報管理テーブ
ル17から表領域A4 、すなわち、領域番号A004の
相対位置座標と大きさの文書Aの画像から図5の表領域
A4 のイメージ、すなわち図7の領域a4 に相当する矩
形を切り出し、表領域A4 と領域番号“A004”と書
誌的事項“表”を図9に50,51として示すように書
込む。同様に、図8の文書Bの文字領域B1 についても
処理を行い、文字領域B1 と領域番号“B001”と書
誌的事項“主題目”を図9に52,53として示すよう
に書込む。以上の処理により、分割領域提示部43が作
成され、新たな画像文書が作成されることになる。
【0035】図9では縮小画像45,47として画像分
割して領域を抽象化して矩形のブロック構造として書込
んだが、縮小イメージがそれほど小さくなく、元の画像
の文字、表、図を縮小しても十分オペレータが認識でき
る場合は縮小画像45,47に代えて図10に54,5
5として示すように原画像を縮小したものを画像領域マ
ップ部42に書込んでもよい。
【0036】図4のステップS41において提示する文書
が構造化された電子文書であると判定したときには、前
記構造化合成文書作成部23が合成文書の作成処理を行
う。先ず、ステップS46にて、論理要素に対する内容テ
キストを取り出す。構造化された電子文書は図18に示
すように主見出し、副見出し、結論等の論理的要素がリ
スト構造によって結ばれ階層構造を為している。従っ
て、論理要素に対する内容はリストを辿り取得できる。
そして、結論という論理要素があるならばこの内容を取
得する。
【0037】続いて、ステップS47にて、取得した内容
の文章の要約を作成する。要約の作成方法としては幾つ
かあり、例えば、図19に示す接続詞辞書を使用し、接
続詞によって結ばれているAとBの文章の重要でない一
方を削除することによって内容の要約は作成できる。続
いて、ステップS48にて、複数の文書の論理要素を組合
わせ、新しい文書に合成する。例えば、複数の各合成文
書の主見出しとステップS47で作成した要約を論理要素
として生成し組合わせ、図20のような階層構造の合成
文書を生成する。続いて、ステップS49にて、合成した
文書の各論理要素を配置する。すなわち、図21に示す
ように1枚の用紙に配置して提示する。
【0038】次に合成した文書を印字した用紙を画像領
域指定シートとして使用する場合について述べる。図9
に示す合成文書は、図5に示す文書Aの文字領域A1 と
表領域A4 と図6に示す文書Bの文字領域B1 を合成し
て提示した文書であるが、この合成文書が1枚の用紙に
印字出力されると、この用紙を画像領域指定シートとし
て使用することができる。すなわち、オペレータは、図
9の画像領域マップ部42に提示されている縮小画像文
書45,47におけるある領域、例えば、図7に示す領
域a3 とa5 及び図8に示す領域b4 とb7 を取り出し
て別途提示させたいときには先ず図9の合成文書を印字
した用紙61における縮小画像62,63の該当領域を
図15に示すように塗りつぶす。
【0039】そして、この該当領域の塗りつぶしを行っ
た用紙61を前記読取り走査部12により読取らせる。
この読取り走査部12が読取った情報は前記画像領域指
定シート解析部27に送られて解析される。すなわち、
画像領域指定シート解析部27は読取った情報から塗り
つぶされた領域を認識し、提示すべき画像領域を前記提
示文書作成部21に領域番号で通知する。
【0040】これにより、提示文書作成部21では画像
合成文書作成部22により指定された領域、すなわち、
文書Aにおける領域a3 の本文、領域a5 の写真、文書
Bにおける領域b4 の副題目、領域b7 の副題目を分割
領域提示部43に提示した図16に示すような合成文書
を得ることができる。
【0041】なお、縮小画像として原画像を縮小したも
のを画像領域マップ部42に書込んだ図10に示す合成
文書の場合も図17の(a) 、(b) に示すように縮小画像
の該当する領域を塗りつぶすことで同様の合成文書を得
ることができる。また、画像領域指定シートの入力方法
としては、読取り走査部12で読取って入力する他、遠
隔地にある端末で読取った情報を通信部13で受信して
入力することもできる。特に端末としてファクシミリ装
置を使用した場合は図15に示すように閲覧したい領域
を塗りつぶして送信することで指定ができる。
【0042】
【発明の効果】以上、請求項1記載の発明によれば、文
書検索の判断に必要な情報を適切に提示でき、信頼性を
向上できる。また、請求項2記載の発明によれば、手書
き文書も含めて文書検索の判断に必要な情報を適切に提
示でき、信頼性を向上できる。
【0043】また、請求項3記載の発明によれば、手書
き文書も含めて文書検索の判断に必要な情報を適切に提
示できて信頼性を向上でき、しかも、画像文書について
は必要な画像領域を組合わせた新たな画像文書を縮小し
て提示するとともにその一部の画像領域を抜き出して提
示することで複数の文書の情報をまとめて適切に提示で
きる。
【0044】また、請求項4記載の発明によれば、手書
き文書も含めて文書検索の判断に必要な情報を適切に提
示できて信頼性を向上でき、しかも、画像文書について
は必要な画像領域を組合わせた新たな画像文書を縮小し
て提示するとともにその一部の画像領域を抜き出して提
示することで複数の文書の情報をまとめて適切に提示で
き、さらに、新たな画像文書を紙面にて提示した場合に
はこの画像文書の必要な画像領域を塗りつぶして読み込
ませることでその画像領域の文書のみを提示することが
でき必要な情報をさらに適切に提示できる。
【図面の簡単な説明】
【図1】本発明の実施の形態を示す文書作成装置のブロ
ック図。
【図2】同実施の形態における文書作成装置が行う一連
の処理を示す流れ図。
【図3】同実施の形態における文書作成装置の画像文書
作成部の処理を示す流れ図。
【図4】同実施の形態における文書作成装置の提示文書
作成部の処理を示す流れ図。
【図5】同実施の形態において使用する整然とレイアウ
トされた画像文書の例である文書Aを示す図。
【図6】同実施の形態において使用する整然とレイアウ
トされた画像文書の例である文書Bを示す図。
【図7】同実施の形態における文書作成装置の画像文書
情報作成部により領域分割された文書Aを示す図。
【図8】同実施の形態における文書作成装置の画像文書
情報作成部により領域分割された文書Bを示す図。
【図9】同実施の形態において分割した画像領域をブロ
ック化した縮小画像を提示した合成文書例を示す図。
【図10】同実施の形態において原画像を縮小した縮小
画像を提示した合成文書例を示す図。
【図11】同実施の形態において使用する手書き文書例
及びこの手書き文書の領域分割方法を示す図。
【図12】同実施の形態における文書情報記憶部の画像
領域情報管理テーブルに格納する相対座標及び大きさの
概念を示す図。
【図13】同実施の形態における文書情報記憶部の文書
管理テーブルの構成を示す図。
【図14】同実施の形態における文書情報記憶部の画像
領域情報管理テーブルの構成を示す図。
【図15】同実施の形態における文書作成装置で印字出
力した合成文書の用紙を提示領域指定シートとして使用
する例を示す図。
【図16】図15の提示領域指定シートを使用して新た
な合成文書を作成した例を示す図。
【図17】図10の原画像を縮小した縮小画像を提示し
た合成文書の用紙を提示領域指定シートとして使用する
ときの縮小画像の塗りつぶし状態を示す図。
【図18】同実施の形態で使用する構造化された電子文
書の構成及び論理構造ツリーを示す図。
【図19】同実施の形態で使用する接続詞辞書の一例を
示す図。
【図20】同実施の形態において構造化電子文書から作
成した合成文書の論理構造ツリーを示す図。
【図21】同実施の形態において構造化電子文書から作
成した合成文書の配置例を示す図。
【図22】従来例を説明するための図。
【符号の説明】
11…文書入力部 14…文書情報記憶部 15…文書格納部 16…文書管理テーブル 17…画像領域情報管理テーブル 18…画像文書情報作成部 21…提示文書作成部 22…画像合成文書作成部 23…構造化合成文書作成部 24…文書提示部 27…画像領域指定シート解析部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文字、表、図、写真からなる文書情報を
    入力する文書入力手段と、この文書入力手段にて入力し
    た文書情報が画像文書か電子化された構造化文書かを判
    定する文書判定手段と、この文書判定手段が画像文書を
    判定したとき、この画像文書から文字、表、図、写真の
    領域を判定し分割して画像領域の大きさや座標を取得
    し、さらに分割した各領域の書誌的事項を判定して画像
    領域の情報を作成する画像文書情報作成手段と、前記文
    書判定手段が構造化文書を判定したときの構造化文書及
    び前記画像文書情報作成手段にて作成した画像文書情報
    を記憶する情報記憶手段と、この情報記憶手段に記憶し
    た画像文書情報については画像領域を複数組合わせて新
    たな画像文書を作成し、構造化文書については構造化要
    素を抜き出したり、内容の要約を作成して新たな構造化
    要素を生成しこれを複数組合わせて新たな構造化文書を
    作成する文書作成手段と、この文書作成手段が作成した
    新たな画像文書及び新たな構造化文書を限られたスペー
    スの紙面又は画面に出力して提示する文書提示手段とを
    設けたことを特徴とする文書作成装置。
  2. 【請求項2】 文字、表、図、写真からなる文書情報を
    入力する文書入力手段と、この文書入力手段にて入力し
    た文書情報が画像文書か電子化された構造化文書かを判
    定する第1の文書判定手段と、この文書判定手段が画像
    文書を判定したときこの画像文書がさらに整然とレイア
    ウトされた画像文書か手書きの画像文書かを判定する第
    2の文書判定手段と、この第2の文書判定手段が整然と
    レイアウトされた画像文書を判定したとき、この画像文
    書から文字、表、図、写真の領域を判定し分割して画像
    領域の大きさや座標を取得し、さらに分割した各領域の
    書誌的事項を判定して画像領域の情報を作成し、前記第
    2の文書判定手段が手書きの画像文書を判定したとき、
    この画像文書が実際に描かれている部分を最小限に囲む
    領域を求め、縦書きか横書きかを判定して分割し、さら
    に分割した各領域の書誌的事項を判定して画像領域の情
    報を作成する画像文書情報作成手段と、前記文書判定手
    段が構造化文書を判定したときの構造化文書及び前記画
    像文書情報作成手段にて作成した画像文書情報を記憶す
    る情報記憶手段と、この情報記憶手段に記憶した画像文
    書情報については画像領域を複数組合わせて新たな画像
    文書を作成し、構造化文書については構造化要素を抜き
    出したり、内容の要約を作成して新たな構造化要素を生
    成しこれを複数組合わせて新たな構造化文書を作成する
    文書作成手段と、この文書作成手段が作成した新たな画
    像文書及び新たな構造化文書を限られたスペースの紙面
    又は画面に出力して提示する文書提示手段とを設けたこ
    とを特徴とする文書作成装置。
  3. 【請求項3】 文字、表、図、写真からなる文書情報を
    入力する文書入力手段と、この文書入力手段にて入力し
    た文書情報が画像文書か電子化された構造化文書かを判
    定する第1の文書判定手段と、この文書判定手段が画像
    文書を判定したときこの画像文書がさらに整然とレイア
    ウトされた画像文書か手書きの画像文書かを判定する第
    2の文書判定手段と、この第2の文書判定手段が整然と
    レイアウトされた画像文書を判定したとき、この画像文
    書から文字、表、図、写真の領域を判定し分割して画像
    領域の大きさや座標を取得し、さらに分割した各領域の
    書誌的事項を判定して画像領域の情報を作成し、前記第
    2の文書判定手段が手書きの画像文書を判定したとき、
    この画像文書が実際に描かれている部分を最小限に囲む
    領域を求め、縦書きか横書きかを判定して分割し、さら
    に分割した各領域の書誌的事項を判定して画像領域の情
    報を作成する画像文書情報作成手段と、前記文書判定手
    段が構造化文書を判定したときの構造化文書及び前記画
    像文書情報作成手段にて作成した画像文書情報を記憶す
    る情報記憶手段と、この情報記憶手段に記憶した画像文
    書情報については画像領域を複数組合わせて新たな画像
    文書を作成し、構造化文書については構造化要素を抜き
    出したり、内容の要約を作成して新たな構造化要素を生
    成しこれを複数組合わせて新たな構造化文書を作成する
    文書作成手段と、この文書作成手段が作成した新たな画
    像文書及び新たな構造化文書を限られたスペースの紙面
    又は画面に出力して提示する文書提示手段とを設け、 前記文書作成手段は、画像文書情報が整然とレイアウト
    された画像文書のときは、各画像領域が文字、表、図、
    写真のどの領域であるかの種別と各画像領域を指定する
    領域番号を付加した新たな画像文書を縮小した画像を複
    数並べて画像領域マップ部とし、この画像領域マップ部
    の各縮小画像の画像領域の一部を複数組合わせて分割領
    域提示部とし、この両部を合成して前記文書提示手段が
    提示する画像文書を作成し、また、画像文書情報が手書
    き画像文書のときは、分割した各画像領域を指定する領
    域番号を付加した新たな画像文書を縮小した画像を複数
    並べて画像領域マップ部とし、この画像領域マップ部の
    各縮小画像の画像領域の一部を複数組合わせて分割領域
    提示部とし、この両部を合成して前記文書提示手段が提
    示する画像文書を作成することを特徴とする文書作成装
    置。
  4. 【請求項4】 文字、表、図、写真からなる文書情報を
    入力する文書入力手段と、この文書入力手段にて入力し
    た文書情報が画像文書か電子化された構造化文書かを判
    定する第1の文書判定手段と、この文書判定手段が画像
    文書を判定したときこの画像文書がさらに整然とレイア
    ウトされた画像文書か手書きの画像文書かを判定する第
    2の文書判定手段と、この第2の文書判定手段が整然と
    レイアウトされた画像文書を判定したとき、この画像文
    書から文字、表、図、写真の領域を判定し分割して画像
    領域の大きさや座標を取得し、さらに分割した各領域の
    書誌的事項を判定して画像領域の情報を作成し、前記第
    2の文書判定手段が手書きの画像文書を判定したとき、
    この画像文書が実際に描かれている部分を最小限に囲む
    領域を求め、縦書きか横書きかを判定して分割し、さら
    に分割した各領域の書誌的事項を判定して画像領域の情
    報を作成する画像文書情報作成手段と、前記文書判定手
    段が構造化文書を判定したときの構造化文書及び前記画
    像文書情報作成手段にて作成した画像文書情報を記憶す
    る情報記憶手段と、この情報記憶手段に記憶した画像文
    書情報については画像領域を複数組合わせて新たな画像
    文書を作成し、構造化文書については構造化要素を抜き
    出したり、内容の要約を作成して新たな構造化要素を生
    成しこれを複数組合わせて新たな構造化文書を作成する
    文書作成手段と、この文書作成手段が作成した新たな画
    像文書及び新たな構造化文書を限られたスペースの紙面
    又は画面に出力して提示する文書提示手段と、前記文書
    入力手段が入力する文書情報に前記文書提示手段が画像
    文書を出力して提示した紙面における画像領域の塗りつ
    ぶし情報があると、塗りつぶした画像領域を認識して該
    当する領域番号を前記文書作成手段に通知する画像領域
    指定シート解析手段とを設け、 前記文書作成手段は、画像文書情報が整然とレイアウト
    された画像文書のときは、各画像領域が文字、表、図、
    写真のどの領域であるかの種別と各画像領域を指定する
    領域番号を付加した新たな画像文書を縮小した画像を複
    数並べて画像領域マップ部とし、この画像領域マップ部
    の各縮小画像の画像領域の一部を複数組合わせて分割領
    域提示部とし、この両部を合成して前記文書提示手段が
    提示する画像文書を作成し、また、画像文書情報が手書
    き画像文書のときは、分割した各画像領域を指定する領
    域番号を付加した新たな画像文書を縮小した画像を複数
    並べて画像領域マップ部とし、この画像領域マップ部の
    各縮小画像の画像領域の一部を複数組合わせて分割領域
    提示部とし、この両部を合成して前記文書提示手段が提
    示する画像文書を作成し、さらに、前記画像領域指定シ
    ート解析手段から領域番号の通知を受けると、この通知
    された領域番号に該当する画像領域の情報を前記情報記
    憶手段から読出し合成して前記文書提示手段が提示する
    画像文書を作成することを特徴とする文書作成装置。
JP9132025A 1997-05-22 1997-05-22 文書作成装置 Pending JPH10320412A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9132025A JPH10320412A (ja) 1997-05-22 1997-05-22 文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9132025A JPH10320412A (ja) 1997-05-22 1997-05-22 文書作成装置

Publications (1)

Publication Number Publication Date
JPH10320412A true JPH10320412A (ja) 1998-12-04

Family

ID=15071754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9132025A Pending JPH10320412A (ja) 1997-05-22 1997-05-22 文書作成装置

Country Status (1)

Country Link
JP (1) JPH10320412A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000322424A (ja) * 1999-05-10 2000-11-24 Ntt Data Corp 文書検索方法及びシステム
JP2001351089A (ja) * 2000-06-09 2001-12-21 Canon Inc 画像管理装置および画像管理方法
JP2007226769A (ja) * 2006-01-24 2007-09-06 Ricoh Co Ltd 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000322424A (ja) * 1999-05-10 2000-11-24 Ntt Data Corp 文書検索方法及びシステム
JP2001351089A (ja) * 2000-06-09 2001-12-21 Canon Inc 画像管理装置および画像管理方法
JP2007226769A (ja) * 2006-01-24 2007-09-06 Ricoh Co Ltd 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム

Similar Documents

Publication Publication Date Title
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
US6002798A (en) Method and apparatus for creating, indexing and viewing abstracted documents
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US20090123071A1 (en) Document processing apparatus, document processing method, and computer program product
JPH1125113A (ja) 画像検索装置,画像検索用キーテキストの生成方法,並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20050210371A1 (en) Method and system for creating a table version of a document
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP3178483B2 (ja) 文書処理装置
JPH0314184A (ja) 文書画像再配置ファイリング装置
JP2010123002A (ja) 文書画像レイアウト装置
JP2012203491A (ja) 文書処理装置及び文書処理プログラム
JPH07210577A (ja) 情報アクセス装置
JPH10320412A (ja) 文書作成装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2008158777A (ja) 画像処理装置及び方法、コンピュータプログラム及び記憶媒体
JP2002108846A (ja) 文書画像処理装置、文書画像処理方法、および記録媒体
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JP4480109B2 (ja) 画像管理装置および画像管理方法
JP4501731B2 (ja) 画像処理装置
JP3480888B2 (ja) 文書情報管理システム
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
JP2002091950A (ja) 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
JPH08153110A (ja) 文書ファイリング装置及び方法
JPH05342325A (ja) 文書処理装置およびその装置のためのフォーム登録装置