JPH10177569A - 文書画像部分拡大表示方法および装置 - Google Patents

文書画像部分拡大表示方法および装置

Info

Publication number
JPH10177569A
JPH10177569A JP8337802A JP33780296A JPH10177569A JP H10177569 A JPH10177569 A JP H10177569A JP 8337802 A JP8337802 A JP 8337802A JP 33780296 A JP33780296 A JP 33780296A JP H10177569 A JPH10177569 A JP H10177569A
Authority
JP
Japan
Prior art keywords
information
character
document data
display
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8337802A
Other languages
English (en)
Inventor
Hideaki Ozawa
英昭 小澤
Takeya Suzuki
健也 鈴木
Kaori Ueno
香里 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8337802A priority Critical patent/JPH10177569A/ja
Publication of JPH10177569A publication Critical patent/JPH10177569A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 紙への印刷を目的とした電子文書情報を解像
度の低いディスプレイ上に表示した際でも、文書情報の
レイアウト情報を維持しつつ、文書情報中の微細な文字
情報の読取可能範囲を向上させる。 【解決手段】 画像ブロック生成部5により、文書デー
タベース3の検索で得られた電子文書データ中の文書デ
ータを、例えば大きな文字を使用する見出しや、文字の
大きさが均一な本文、小さな文字を使用する補足のよう
なブロックに分解し、かつ空白領域を求める。この各ブ
ロック間の空白域を詰め、文書データ全体を詰めて表示
することで生まれる空間を利用し、補足のような小さな
文字のブロックのデータの拡大率をブロック画像拡大率
計算部6で求める。画像レイアウト部8は、この拡大率
に従って画像化されたブロックを、元の電子文書データ
のレイアウト情報に基づいて空白域を詰めて文書データ
全体を配置し表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙に出力すること
を目的として作成された電子文書の情報を、紙に印刷し
たときのレイアウトを保ちつつ紙よりも解像度の低いデ
ィスプレイ上で、利用者が読み取れるようにする文書画
像データベースシステムに関するものである。
【0002】特に、カスタマーサポートサービスにおけ
るマニュアルのように、紙に印刷された情報を閲覧でき
るユーザと、他地点にいてデータベース化された情報を
閲覧するユーザとが、同一の情報を共有する様なデータ
ベースシステムに関するものである。
【0003】
【従来の技術】ワードプロセッサなどの普及により、大
量の文書情報が電子的に作成されているが、作成された
情報のほとんどは紙に印刷された形態で、情報の流通や
取得が行われている。情報を全て電子的に扱おうとする
中で、紙に印刷されていた電子文書の内、テキスト情報
をテキストデータベースとして構築し、検索する手法が
多く採られてきた。
【0004】しかしこの方法では、情報を取得しやすく
するために行ったレイアウトなどの情報が無くなってし
まい、情報の取得効率が落ちる。これに対し、レイアウ
トなどの情報を重視して紙に印刷した情報を画像情報と
して取り込み、ディスプレイ上に表示する光ファイリン
グシステムと呼ばれるような画像データベースシステム
も使用されてきた。
【0005】
【発明が解決しようとする課題】上記したような従来の
方式では、紙の解像度が600から1000dpiであ
るのに対し、ディスプレイの解像度が70から100d
piとおよそ10分の1の解像度しか持たないため、紙
に印刷する場合と同じ面積のディスプレイ上に情報を表
示しようとすると、小さい文字等は読取が困難であっ
た。この原因は、特に文字を構成する線分が、解像度が
低いために、表示されない結果、字として構成できなく
なってしまうためである。
【0006】この課題を解決する手法としては、文書画
像の一部のみを拡大して表示し、スクロールバーと呼ば
れる仕組みなどにより、利用者からの表示領域の変更に
対する要求に応じて、文書画像の表示する部分を移動す
る手法が多く取られてきた。
【0007】しかしこの方法では、一時には文書情報の
一部しか閲覧することができず、文書情報が作成された
際に与えられたレイアウトによる情報の一覧性の効果な
どを、失する結果となっていた。
【0008】特に、紙に印刷された情報を持つ閲覧者
と、同一の情報をディスプレイ上で閲覧する閲覧者が、
電話などの手段により離れた地点で同じ情報を、閲覧し
ようとする際には、必要な情報がどこに書かれているか
という情報の共有が必要である。よって、一部のみを表
示するのでは、現在見ているところが紙に印刷された時
のどの位置であるかを特定するのが困難であり、また小
さい文字情報が見えないような状態では、ディスプレイ
で閲覧する閲覧者は紙の情報を閲覧する人が指摘する微
細な文字の情報を、見つけにくいといった問題点があっ
た。
【0009】本発明はこのような問題点を解決するため
に、文書情報を解像度の低いディスプレイ上に表示した
際でも、文書情報のレイアウト情報を維持しつつ、文書
情報中の微細な文字情報の読取可能範囲を向上させるこ
とを課題とする。
【0010】
【課題を解決するための手段】上記の課題を解決するた
めの方法として、本発明は、紙に印刷することを目的と
して作成された電子文書データを、紙よりも解像度の低
いディスプレイ上で、紙に印刷された場合と同じような
レイアウト構造を保存しつつ、一覧表示し、かつ電子文
書データをディスプレイ上に表示するために画像化する
方法において、電子文書データ中で情報が記述されてい
る領域と空白領域を画素の周辺分布から判定する過程
と、前記判定された情報が記述されている領域に含まれ
る前記文書データ中の文字の大きさとその大きさの文字
の使用頻度を計測する過程と、前記文字の大きさと使用
頻度と前記空白領域から、あらかじめ定められた規則に
より、前記電子文書データを画像化する際に、前記情報
を含む各表示ブロックに対する解像度を電子文書データ
中の微細な文字情報を含む領域を拡大し、微細な文字情
報を含まない領域はそのまま保存するように決定する過
程と、前記決定された情報を含む表示ブロック毎の解像
度に従って、前記文書データを少なくとも2値以上の多
値画像データとして画像化する過程と、前記画像化され
た表示ブロックを元の電子文書データの配置情報に基づ
いて前記空白領域を縮小するように配置して、一覧でき
る表示画像データを生成する過程と、を有することこと
を特徴とする。
【0011】また、上記の方法において、前記電子文書
データ中で情報が記述されている領域と空白領域を画素
の周辺分布から判定する過程の後に、前記画素の周辺分
布の計測により判定された情報が記述されている領域に
対し、あらかじめ定められた文字の大きさに対して、そ
の大きさよりも大きな文字を計測する過程と、前記大き
な文字が当該領域中の文字情報に対して占める使用割合
を計算する過程と、あらかじめ定められた閾値と、前記
大きな文字の使用割合を比較して、前記大きな文字の縮
小、または大きな文字の使用の減少により縮小可能な領
域を判定し該縮小可能な領域を前記空白領域に加える過
程と、を有し、かつ、前記表示ブロックの解像度を決定
する過程の後に、前記縮小する文字または使用を減少さ
せる大きな文字に対し、ディスプレイに表示するために
画像化する際に、あらかじめ定められた文字色を指定し
てまたは値を与えて画像化する過程を有することを特徴
とする。
【0012】同じく上記の課題を解決するための装置と
して、本発明は、紙に印刷することを目的として作成さ
れた電子文書データを、紙よりも解像度の低いディスプ
レイ上で、紙に印刷された場合と同じようなレイアウト
構造を保存しつつ、一覧表示し、かつ電子文書データを
ディスプレイ上に表示するために画像化する装置におい
て、電子文書データ中で情報が記述されている領域と空
白領域を画素の周辺分布から判定する手段と、前記判定
された情報が記述されている領域に含まれる前記文書デ
ータ中の文字の大きさとその大きさの文字の使用頻度を
計測する手段と、前記文字の大きさと使用頻度と前記空
白領域から、あらかじめ定められた規則により、前記電
子文書データを画像化する際に、前記情報を含む各表示
ブロックに対する解像度を電子文書データ中の微細な文
字情報を含む領域を拡大し、微細な文字情報を含まない
領域はそのまま保存するように決定する手段と、前記決
定された情報を含む表示ブロック毎の解像度に従って、
前記文書データを少なくとも2値以上の多値画像データ
として画像化する手段と、前記画像化された表示ブロッ
クを元の電子文書データの配置情報に基づいて前記空白
領域を縮小するように配置して、一覧できる表示画像デ
ータを生成する手段と、を有することことを特徴とす
る。
【0013】また、上記の装置において、前記画素の周
辺分布の計測により判定された情報が記述されている領
域に対し、あらかじめ定められた文字の大きさに対し
て、その大きさよりも大きな文字を計測する手段と、前
記大きな文字が当該領域中の文字情報に対して占める使
用割合を計算する手段と、あらかじめ定められた閾値
と、前記大きな文字の使用割合を比較して、前記大きな
文字の縮小、または大きな文字の使用の減少により縮小
可能な領域を判定し該縮小可能な領域を前記空白領域に
加える手段と、前記縮小する文字または使用を減少させ
る大きな文字に対し、ディスプレイに表示するために画
像化する際に、あらかじめ定められた文字色を指定して
または値を与えて画像化する手段と、を新たに有するこ
とを特徴とする。
【0014】本発明では、紙に印刷することを目的とし
て作成された電子文書データを、紙よりも解像度の低い
ディスプレイ上で紙に印刷された場合と同じようなレイ
アウト構造を保存しつつ、一覧表示させるために、電子
文書データ中の文書データを、例えば大きな文字を使用
する見出しや、一番文字の大きさが均一な本文、小さな
文字を使用する補足のようなブロックに分解して、各ブ
ロック間の空白領域を詰め、文書データ全体を詰めて表
示することで生まれる空間を利用し、補足のような小さ
な文字のブロックのデータを拡大表示する。このよう
に、文書データ中の微細な文字情報を含む領域を大きく
拡大し、微細は文字情報は含まない領域はそのまま保存
し、それらの情報の領域間の空間を縮小することによ
り、文書データの一覧性を保持しつつ解像度の低いディ
スプレイ上で、電子文書データ中の微細な文字までを読
み取れるようにする。
【0015】また、本発明では、上記に加えて、見出し
のような大きな文字を多用する領域を縮小することによ
り、微細な文字を拡大するための空白領域を増加させ、
見出しのような特に利用者に着目させる領域について
は、先頭等の一部の文字のみ任意に大きくしたり、ディ
スプレイの持つ多色の表示機能を利用し、文字の大きさ
は本文と同じであっても、使用する文字の色を異なる色
としたりすることで、見出し等の情報として視認させ
る。このように、文書中で大きな文字を使用する見出し
のような領域の文字を、本文と同じ大きさの文字とした
り、あるいは数を減少させた任意の大きな文字としたり
し、かつ本文と同じ大きさの文字を使用する場合には本
文の文字の色とは異なる色で目立たせることにより、多
くの領域を使用する大きな文字による情報の空間を縮小
し、微細な文字情報の拡大の領域を確保し、文書データ
の一覧性を保持しつつ、文書データ中の微細な文字情報
をより大きく拡大することで、解像度の低いディスプレ
イ上で、電子文書データ中の微細な文字までを読み取れ
るようにする。
【0016】
【発明の実施の形態】以下、図を用いて本発明の実施形
態例を詳細に説明する。
【0017】《実施形態例1》図1に、本発明の第1の
実施形態例のシステム構成を示す。
【0018】本実施形態例におけるシステムは、利用者
が情報を閲覧し必要な情報を取得するための検索要求を
発行する操作表示装置1と、文書情報2を格納するデー
タベースを検索するための文書情報検索部2と、ワード
プロセッサやDTP(DeskTop Publish
ing)のシステムによって作成された電子データを格
納する文書データベース3と、検索された文書情報から
2値画像を生成する二値画像生成部4と、文書中で情報
が記述されている領域を抽出し情報の存在するブロック
分けを行う画像ブロック生成部5と、個々のブロックを
再配置しブロック毎に画像化する際の元画像に対する拡
大率を決定するブロック画像拡大率計算部6と、拡大率
に従いブロック毎の画像を少なくとも黒白2値以上の多
値による灰色画像として生成する多値画像生成部7と、
生成された画像ブロックをレイアウト規則によって配置
する画像レイアウト部8から構成される。
【0019】図2のフローチャートに、本実施形態例に
おける処理の流れを示す。
【0020】まず、ステップ11として利用者からの検
索要求を操作表示装置1において受け取る。利用者から
の検索要求のデータは、文書情報検索部2に送られ、ス
テップ12として文書データベース3を検索要求のデー
タで検索し、該当する文書データを獲得する。文書デー
タは、二値画像生成部4において、ステップ13として
あらかじめ定められた解像度を用いて文書データを2値
画像化する。文書データの形式の一例として、印刷用の
文書として多く用いられているPostScriptを
用いるならば、PostScriptインタプリタによ
り、2値画像データに変換できる。この2値画像化処理
は、従来技術により容易に達成できるので詳細は省略す
る。
【0021】次に2値画像化された文書データに対し、
画像ブロック生成部5において、黒画素の周辺分布を求
め、文書中に含まれる情報のブロックをステップ14と
して抽出する。周辺分布の計算の仕方としては、例えば
特願平4−237524号の「複合的な情報の構築方
式」に示されるような従来方法により、情報の記述され
た領域と、情報の含まれていない領域を判断することが
できる。処理の詳細については、特願平4−23752
4号等の従来技術から容易に類推できるので省略する。
この結果、図3(a)の原文書データに示すように、例
えば4段に分かれている文書画像は、4つの領域として
認識され、情報が存在しない領域を空き領域の面積を空
白域として記憶する。
【0022】次にブロック画像拡大率計算部6におい
て、各ブロックに分けられた領域の情報に対し、ステッ
プ15として使用されているフォントの大きさ毎の文字
数を文書データ中の文字を調べることでカウントし、使
用頻度が最大のフォントの大きさと、ブロック中の文字
数に対する割合を計算する。最頻使用フォントが小さい
部分は、画面上に表示した際に大きく拡大しなければ、
必要な情報を読み取ることができない。拡大する領域を
決定するために、ブロック画像拡大率計算部6中に持つ
文書ブロックデータアレイにおいて、ステップ16とし
て図4に示すデータ構造として、使用するフォントの小
さい順、さらに同じ大きさのフォントについては、文字
数に占める当該フォントの文字数の割合の高い順に、ブ
ロックを順序づけする。
【0023】次にステップ17として、ブロック画像拡
大率計算部6において、順序づけされた情報のブロック
に対し、フォントの大きさとディスプレイの解像度に対
してあらかじめ定められている閾値とフォントの大きさ
とを比較する。比較の結果、フォントが定められた値よ
りも小さい場合には、拡大する必要があるのでステップ
18として、表示する際の空白域を調べる。空白域が存
在する場合には、ステップ19として、各フォントの大
きさに対して定められたブロックの面積に対する拡大率
を、ブロックに与える。更に従来のブロックの大きさに
(拡大率−1.0)を乗じた値を、空白域の面積から減
じ、新しい空白域の面積とする。新しい空白域の値が負
になった場合には、新しい空白域の面積分を、情報のブ
ロックの面積から減ずる。
【0024】この結果各ブロックに対して、文字情報が
小さいためにディスプレイ上で、読み取りにくい文字に
対して、各ブロック毎に読み取れる文字のサイズまで、
画像化された情報を拡大することができる。
【0025】ステップ18の処理において、空白領域が
存在しない場合には、これ以上拡大した表示を行うこと
はできないので、ステップ21へ遷移する。この場合に
おいても、文書全体の中で、読取の困難さが高い、小さ
い文字の情報を特に拡大して表示することで、読み取り
がたさを軽減できる。
【0026】次にステップ20として、全ブロックにつ
いて、拡大率を決定したか否かを判定し、未決定のブロ
ックがある場含には、ステップ17へ戻る。全てのブロ
ックの拡大率を決定した場合には、ステップ21へ遷移
する。ステップ21としては、各ブロックの情報に対し
て設定された拡大率に従って、文書データを多値画像化
し、ブロックの領域毎に切り出す。各ブロックの情報
は、座標位置の値の小さい順にステップ22として順序
づけする。順序づけされた各ブロックは、ステップ23
として操作表示装置1上に表示することで、利用者に小
さい文字情報を拡大した文書画像を提供できる。
【0027】本実施形態例における処理結果の例として
は、図3(a)に示す4段のブロックに分かれた25の
原文書の文書情報の場合、本実施形態例の処理を実施す
ることで、例えば図3(b)に示す26の様な文書画像
が生成される。この結果、最下段の小さいフォントで記
述された文字の領域が拡大され、図3(c)に示す従来
手法のように、文書情報全体を均一の解像度で画像化し
た27の様な画像に対し、本実施形態例の処理による図
3(b)の26では最下段のブロックの小さい文字の領
域が拡大されている。
【0028】本実施形態例におけるブロック画像拡大率
計算部6中のブロック毎の使用しているフォントの種類
に対する順序づけを行うデータブロックアレイのデータ
構造は、図4に示す様に少なくとも、ブロックに含まれ
るフォントの大きさを示す情報と、当該のフォントを持
つ文字情報がブロックの情報中に占める割合と、当該ブ
ロックを示す識別子(ID)から構成される。
【0029】図5を用いて、本発明におけるブロック画
像拡大率計算部6における他の実施形態例を示す。例え
ば図5に示すように、画像のブロック中に多数の種類の
文字情報が使用され、文字の使用頻度が偏っていない文
書情報も存在する。このような文書情報に対しては、デ
ータブロックアレイ中にブロックを順序づけする際に、
次のような処理を行うことで、拡大率を決定するための
最適な順序づけを行うことが可能である。
【0030】順序づけの方法としては、例えば各大きさ
の文字の頻度を、文字の大きさで除して、全ての文字種
に対しての総和を求め、それを当該ブロックの頻度の値
とし、その値の小さい順に順序づけする。
【0031】一例として図5中のブロック28の様に大
きさ8の文字が26文字のブロックAと、大きさ8の文
字が18文字、大きさ6の文字が16文字のブロックB
の場合では、前述の方法では、最大頻度の文字は、いづ
れも8であり、最大頻度の高いブロックAが、最も優先
的に拡大すべき情報となる。これに対し本実施形態例で
は、ブロックAは、文字種が一つの為に最大頻度1.0
を8で除し、0.12となるのに対し、ブロックBは文
字の大きさ8の頻度0.53を8で除し、文字の大きさ
6の頻度0.47を6で除した値との総和を取るため、
0.066+0.079=0.15となる。よって、本
手法によりブロックBの方が優先的に、拡大すべきと判
断される。
【0032】ブロックA,Bに対し、ブロックCの様に
情報全体には影響を与えないような、一文のみが小さな
文字で表現されるような場合には、大きさ8の文字の頻
度の0.96を大きさ8で除し、文字の大きさ6の頻度
0.047を大きさ6で除した値との総和を取るため、
0.12+0.0077=0.13となる。この結果ブ
ロックBのように、小さい文字を多く含む情報を最優先
に拡大するとの判定が達成できる。
【0033】《実施形態例2》本発明の第2の実施形態
例としては、文書データ中に含まれる見出しの様な大き
な文字で記述された情報を、ディスプレイ上で読み取る
ことが可能な小さな文字に変換し、微細な文字を拡大す
るための領域を生成する。これにより、レイアウト情報
を保持して一覧性を保ちながら、読み取れる文字情報を
増やすことを可能にする。
【0034】図6を用いて本実施形態例の概要を詳細に
説明する。本実施形態例では、図6(a)の原文書デー
タ29中の大きな文字を使用する領域を小さくして、小
さい文字を拡大するが、単に見出しの文字の大きさを小
さくしてしまっては、ディスプレイ上で情報を閲覧する
人に見出しであることを認識しがたく、紙に印刷された
情報を閲覧する人と、ディスプレイ上で情報を閲覧する
人の間で、見出しの情報であることの概念が一致しなく
なる場合がある。そこで、本実施形態例では、白、黒に
加えて少なくとも1色以上の多色の表示が可能なディス
プレイおいて、見出しの情報の様な大きな文字の情報
を、図6(b)の30に示すように本文と色を変えて表
示することにより、ディスプレイ上での情報の閲覧者に
対して、文字の大きさは本文と同じ場合においても、見
出しとして認識させる事を達成できるようにする。
【0035】同様の効果としては、文字を斜めに表記す
るイタリック体によって見出しを表示したり、本文と見
出しを明朝体とゴシック体で、使い分けたりすることに
よっても達成できる。また章、節、項の様に多段階の見
出し階層があるような電子化文書データの場合、文字の
大きさが5段階や8段階にもなっている場合が存在する
が、縮小を行う際に、色と書体の組み合わせを変化させ
ることで、多段階の違いの視認は達成できる。
【0036】図7に本実施形態例のシステム構成を示
す。図7を用いて、本実施形態例のシステム構成を詳細
に説明する。
【0037】本実施形態例のシステム構成としては、利
用者からの検索要求を受け取る操作表示装置1から、文
書データを2値化し周辺分布を計算して、文書データを
ブロック化する画像ブロック生成部5までは、上記第1
の実施形態例と同様であり、容易に類推できるので省略
する。
【0038】画像ブロック生成部5で、情報の含まれる
領域の分割が行われた文書データは、表示を行うディス
プレイの解像度と大きさに対してあらかじめ定められて
いる標準的な読取可能な文字の大きさと、各ブロック中
で使用されている文字の大きさとを比較し、大きな文字
に対して、画像化する際の縮小率を決定する大文字情報
縮小率計算部31と、大きい文字による領域を縮小する
結果、他の小さい文字を拡大できる領域を計算する空白
領域計算部32が追加される。
【0039】空白領域が広がった文書画像データに対し
て、第1の実施形態例と同様にブロック画像拡大率計算
部6において、微細な文字を含む文書データのブロック
の拡大率が計算される。大きい文字のブロックに対して
は縮小率が決定され、小さい文字のブロックに対しては
拡大率が決定された文書データに対して、多値画像生成
部7において文書データを画像データに変換する。多値
画像生成部7では、第1の実施形態例において述べた機
能に加えて、縮小を行う文字情報のブロックに対して
は、文字の色をあらかじめ定められた本文とは異なる色
にして、画像化を行う。
【0040】画像レイアウト部8の機能、並びにレイア
ウトされた文書画像データを表示する操作表示装置1の
機能は、第1の実施形態例と同様であり、容易に類推で
きるので省略する。
【0041】図8に本実施形態例における処理例の過程
を示す。図8を用いてその処理例を詳細に説明する。
【0042】本実施形態例における処理のうち、図8の
ステップ11からステップ14までの処理は、第1の実
施形態例と同様であり、容易に類推できるので省略す
る。
【0043】上記処理により周辺分布を求められた文書
データは、大文字情報縮小率計算部31において、ステ
ップ35として、あらかじめ定められた標準的な文字よ
りも大きな文字を使用しているブロックを抽出する。例
えば72dpiの解像度を持ち、A4版の紙面領域を画
面に一覧的に表示する場合、標準的な本文の文字の大き
さを14ポイントのフォントであるとすると、例えば1
8ポイントや24ポイントの文字が、条件に該当する。
【0044】ステップ36として各ブロックに対し、標
準的な文字の大きさよりも大きい文字が、ブロック中に
含まれる割合を計算する。例えば図6(a)の20ポイ
ントの文字のブロックは、全ての文字が20ポイントで
あるため、割合の値は1.0となる。
【0045】ステップ37として大きな文字の含まれる
割合と、あらかじめ定められた閾値とを比較する。この
比較により例えば図9に示すような、ほとんどの文字標
準もしくはそれ以下の大きさの文字で記述され、強調の
為に特に一部の文字のみを大きくしているような、レイ
アウト的な効果が高い大きい文字の情報を保存すること
が可能である。
【0046】例えば一実施形態例における閾値として
は、文章の先頭の文字を強調するために、一文字もしく
は、一単語大きくするような場合ににおいては、一つの
ブロックの文字列が平均2文で、150文字程度に対し
て1文字から、5文字程度で、閾値の値は0.04とな
る。
【0047】図9の例では、文字の総数は183文字で
あり、大きな文字は、1文字であることから、頻度は、
0.0055となり、0.04よりも小さいので、縮小
せずに大きい文字の情報のまま、表示すべきであると判
定される。
【0048】ステップ38として閾値よりも大きい割合
を持つブロックに対し、大きな文字を標準の文字サイズ
とし、空白領域計算部32へ送り、縮小後のブロックの
大きさを決定する。空白領域の計算の仕方としては、文
書データ中に存在する文字の大きさと縮小する標準的な
文字の大きさに対し、標準的な文字の大きさを文書デー
タ中の大きな文字の大きさで除することによって、達成
できる。例えば前述の20ポイントの文字のブロック
を、14ポイントの文字のブロックに置き換える場合に
は、14を20で除し70%に縮小するという縮小後の
割合が決定される。
【0049】次にステップ39として空白領域を計算す
るために、(ブロックの大きさ)*(1−縮小後の割
合)の計算を行い、文字の大きさを縮小することにより
産み出された空白領域の大きさを獲得する。
【0050】計算された空白域は、ステップ40として
画像ブロック生成部5中で求められた、空白領域に追加
される。ステップ37で、大きな文字の使用頻度が閾値
よりも小さい場合には、ステップ40までの処理を行わ
ず、画像ブロック生成部5で生成されたブロックの大き
さは、そのまま保存する。
【0051】ステップ36からステップ40までの処理
を、大きな文字を使用しているブロック全てに対して行
う。
【0052】大きな文字の情報に縮小の処理を行った文
書データに対して、既に図2を用いて述べたステップ1
5からステップ20と同様の処理を行い、微細な文字情
報を含む領域の拡大率を計算する。この処理の過程は、
図2のステップ15からステップ20と同様であり、容
易類推できるので省略する。
【0053】微細な文字を含むブロックに対して拡大率
が決定された所で、多値画像生成部7において、ステッ
プ41として大きな文字を縮小したブロックの文字デー
タをあらかじめ定められた色で画像化する。例えば黒を
基本とするような通常の文書においては、赤もしくは、
青の文字とすることにより、本文の色との対比がはっき
りするため、当該部分に見出しのような本文とは、異な
った情報が記述されていることを、情報の閲覧者に認識
させることが可能となる。
【0054】ステップ42として他の文書データのブロ
ックに対し、第1の実施形態例と同様に、文書データを
拡大率にしたがって、画像データ化する。縮小、拡大処
理によって、情報の閲覧者が文字情報を読取可能な大き
さのブロックに変換された画像情報を、ステップ22と
してレイアウトし、ステップ23として操作表示装置1
上に表示する。ステップ22及びステップ23の処理
は、第1の実施形態例と同様であり容易に類推できるの
で省略する。
【0055】以上により、文書画像を紙よりも解像度の
低いディスプレイ上に表示する際に、文書中に含まれる
空白領域を有効に使うことで、読みにくい小さな文字を
大きく拡大し、利用者が文書情報を視認しやすくするこ
とが達成できる。
【0056】本発明による効果を定量的に表すために、
幾つかの文書情報を本発明と従来技術の方法でディスプ
レイ上に表示して評価を行った結果を示す。使用したの
は図10(a),(b),(c)、図11(a),
(b),(c)に示す様な、6種類の文字の大きさを使
用する文書データである。
【0057】表示した画面は、有効な情報の表示領域が
縦795ドット、横936ドットのディスプレイであ
る。A4の文書情報をそのまま表示しようとする場合に
は、68dpi相当であり、1ポイントの大きさの文字
は0.94ドットで表現される。従来技術と本発明の方
法で、読取可能な文字の大きさを、比較すると以下の様
になった。
【0058】
【表1】
【0059】第1の実施形態例の手法により、従来手法
の9ドット以下の文字を、11ポイント相当の文字の大
きさに変換でき、ほぼ文書中の全ての文字情報が可読と
なった。さらに、第2の実施形態例により、標準的な文
字の大きさを12ポイントとすることで、全ての文字を
12ポイントにすることが達成され、全ての文字が可読
となった。
【0060】
【発明の効果】以上で述べたとおり本発明により、文書
画像を紙よりも解像度の低いディスプレイ上に表示する
際に、文書中に含まれる空白領域を縮小して文字の表示
領域として有効に使うようにしたので、読みにくい小さ
な文字を大きく拡大し、利用者が文書情報を視認しやす
くすることが達成できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態例を示す文書画像部分
拡大表示装置の構成図である。
【図2】上記第1の実施形態例における文書画像部分拡
大表示方法を示す図であって、電子化文書データの微細
文字が拡大され、閲覧者にディスプレイ上で可読な情報
を提供する処理の過程を示すフローチャートである。
【図3】(a)は上記第1の実施形態例における原文書
データの例、(b)は上記第1の実施形態例による文書
画像部分拡大表示の例、(c)は比較のため従来手法に
よる画面表示の例を示す図である。
【図4】上記第1の実施形態例の文書画像部分拡大表示
方法における、ブロック画像拡大率計算部のデータブロ
ックアレイの構造例を示す図である。
【図5】上記第1の実施形態例において、ブロック画像
拡大率計算部で、拡大率が計算される電子化文書データ
の一部のブロックの情報を示す図である。
【図6】本発明の第2の実施形態例の文書画像部分拡大
表示方法を示す図であって、(a)は原文書データの
例、(b)は第2の実施形態例による画面表示の例を示
す図である。
【図7】上記第2の実施形態例の文書画像部分拡大表示
装置の構成図である。
【図8】上記第2の実施形態例における文書画像部分拡
大表示方法の処理の過程を示すフローチャートである。
【図9】上記第2の実施形態例における文書画像部分拡
大表示方法のデータを示す図である。
【図10】(a),(b),(c)は、本発明の手法を
評価するために使用したデータ(その1)を示す図であ
る。
【図11】(a),(b),(c)は、本発明の手法を
評価するために使用したデータ(その2)を示す図であ
る。
【符号の説明】
1…操作表示装置 2…文書情報検索部 3…文書データベース 4…二値画像生成部 5…画像ブロック生成部 6…ブロック画像拡大率計算部 7…多値画像生成部 8…画像レイアウト部 31…大文字情報縮小率計算部 32…空白領域計算部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 紙に印刷することを目的として作成され
    た電子文書データを、紙よりも解像度の低いディスプレ
    イ上で、紙に印刷された場合と同じようなレイアウト構
    造を保存しつつ、一覧表示し、かつ電子文書データをデ
    ィスプレイ上に表示するために画像化する方法におい
    て、 電子文書データ中で情報が記述されている領域と空白領
    域を画素の周辺分布から判定する過程と、 前記判定された情報が記述されている領域に含まれる前
    記文書データ中の文字の大きさとその大きさの文字の使
    用頻度を計測する過程と、 前記文字の大きさと使用頻度と前記空白領域から、あら
    かじめ定められた規則により、前記電子文書データを画
    像化する際に、前記情報を含む各表示ブロックに対する
    解像度を電子文書データ中の微細な文字情報を含む領域
    を拡大し、微細な文字情報を含まない領域はそのまま保
    存するように決定する過程と、 前記決定された情報を含む表示ブロック毎の解像度に従
    って、前記文書データを少なくとも2値以上の多値画像
    データとして画像化する過程と、 前記画像化された表示ブロックを元の電子文書データの
    配置情報に基づいて前記空白領域を縮小するように配置
    して、一覧できる表示画像データを生成する過程と、 を有することことを特徴とする文書画像表示方法。
  2. 【請求項2】 前記電子文書データ中で情報が記述され
    ている領域と空白領域を画素の周辺分布から判定する過
    程の後に、 前記画素の周辺分布の計測により判定された情報が記述
    されている領域に対し、あらかじめ定められた文字の大
    きさに対して、その大きさよりも大きな文字を計測する
    過程と、 前記大きな文字が当該領域中の文字情報に対して占める
    使用割合を計算する過程と、 あらかじめ定められた閾値と、前記大きな文字の使用割
    合を比較して、前記大きな文字の縮小、または大きな文
    字の使用の減少により縮小可能な領域を判定し該縮小可
    能な領域を前記空白領域に加える過程と、を有し、 かつ、前記表示ブロックの解像度を決定する過程の後
    に、 前記縮小する文字または使用を減少させる大きな文字に
    対し、ディスプレイに表示するために画像化する際に、
    あらかじめ定められた文字色を指定してまたは値を与え
    て画像化する過程を有する、 ことを特徴とする請求項1に記載の文書画像部分拡大表
    示方法。
  3. 【請求項3】 紙に印刷することを目的として作成され
    た電子文書データを、紙よりも解像度の低いディスプレ
    イ上で、紙に印刷された場合と同じようなレイアウト構
    造を保存しつつ、一覧表示し、かつ電子文書データをデ
    ィスプレイ上に表示するために画像化する装置におい
    て、 電子文書データ中で情報が記述されている領域と空白領
    域を画素の周辺分布から判定する手段と、 前記判定された情報が記述されている領域に含まれる前
    記文書データ中の文字の大きさとその大きさの文字の使
    用頻度を計測する手段と、 前記文字の大きさと使用頻度と前記空白領域から、あら
    かじめ定められた規則により、前記電子文書データを画
    像化する際に、前記情報を含む各表示ブロックに対する
    解像度を電子文書データ中の微細な文字情報を含む領域
    を拡大し、微細な文字情報を含まない領域はそのまま保
    存するように決定する手段と、 前記決定された情報を含む表示ブロック毎の解像度に従
    って、前記文書データを少なくとも2値以上の多値画像
    データとして画像化する手段と、 前記画像化された表示ブロックを元の電子文書データの
    配置情報に基づいて前記空白領域を縮小するように配置
    して、一覧できる表示画像データを生成する手段と、 を有することことを特徴とする文書画像表示装置。
  4. 【請求項4】 前記画素の周辺分布の計測により判定さ
    れた情報が記述されている領域に対し、あらかじめ定め
    られた文字の大きさに対して、その大きさよりも大きな
    文字を計測する手段と、 前記大きな文字が当該領域中の文字情報に対して占める
    使用割合を計算する手段と、 あらかじめ定められた閾値と、前記大きな文字の使用割
    合を比較して、前記大きな文字の縮小、または大きな文
    字の使用の減少により縮小可能な領域を判定し該縮小可
    能な領域を前記空白領域に加える手段と、 前記縮小する文字または使用を減少させる大きな文字に
    対し、ディスプレイに表示するために画像化する際に、
    あらかじめ定められた文字色を指定してまたは値を与え
    て画像化する手段と、 を新たに有することを特徴とする請求項1に記載の文書
    画像部分拡大表示装置。
JP8337802A 1996-12-18 1996-12-18 文書画像部分拡大表示方法および装置 Pending JPH10177569A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8337802A JPH10177569A (ja) 1996-12-18 1996-12-18 文書画像部分拡大表示方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8337802A JPH10177569A (ja) 1996-12-18 1996-12-18 文書画像部分拡大表示方法および装置

Publications (1)

Publication Number Publication Date
JPH10177569A true JPH10177569A (ja) 1998-06-30

Family

ID=18312113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8337802A Pending JPH10177569A (ja) 1996-12-18 1996-12-18 文書画像部分拡大表示方法および装置

Country Status (1)

Country Link
JP (1) JPH10177569A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350959A (ja) * 2005-06-20 2006-12-28 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2011216126A (ja) * 2011-08-01 2011-10-27 Casio Computer Co Ltd 情報出力装置および情報出力処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350959A (ja) * 2005-06-20 2006-12-28 Fuji Xerox Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2011216126A (ja) * 2011-08-01 2011-10-27 Casio Computer Co Ltd 情報出力装置および情報出力処理プログラム

Similar Documents

Publication Publication Date Title
JP4124494B2 (ja) 置換コンピュータ字体の供給方法及び装置
US8442324B2 (en) Method and system for displaying image based on text in image
EP1361544B1 (en) System and method for editing electronic images
US5784487A (en) System for document layout analysis
US5848184A (en) Document page analyzer and method
EP0539106B1 (en) Electronic information delivery system
US7460710B2 (en) Converting digital images containing text to token-based files for rendering
US6181838B1 (en) Mechanism for the capture of graphical representations
US7376272B2 (en) Method for image segmentation to identify regions with constant foreground color
US7512879B2 (en) Intelligent virtual paging paradigm
EP1739574B1 (en) Method of identifying words in an electronic document
EP0864987B1 (en) Document processing method and apparatus, corresponding program and storage unit
US6185341B1 (en) Image processing using vector data to reduce noise
US20030014445A1 (en) Document reflowing technique
US5579030A (en) Method and apparatus for display of text on screens
US5617115A (en) Word processing unit with document display function
US8386943B2 (en) Method for query based on layout information
JP2010123002A (ja) 文書画像レイアウト装置
US5455871A (en) Detecting function words without converting a scanned document to character codes
JP3083314B2 (ja) 文書処理方法及び装置
JP5182902B2 (ja) 文書イメージ出力装置
JPH10177569A (ja) 文書画像部分拡大表示方法および装置
Witten Elements of computer typography
Lee et al. Exploring the relationship between language and design: a study of Hong Kong newspapers
JP2000165634A (ja) 画像デ―タをメモリに蓄積する装置及び方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040706