JP2000163044A - 画像表示装置 - Google Patents

画像表示装置

Info

Publication number
JP2000163044A
JP2000163044A JP10338654A JP33865498A JP2000163044A JP 2000163044 A JP2000163044 A JP 2000163044A JP 10338654 A JP10338654 A JP 10338654A JP 33865498 A JP33865498 A JP 33865498A JP 2000163044 A JP2000163044 A JP 2000163044A
Authority
JP
Japan
Prior art keywords
area
image
line
output
output image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10338654A
Other languages
English (en)
Inventor
Masashi Hirozawa
昌司 広沢
Masafumi Yamanoue
雅文 山之上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP10338654A priority Critical patent/JP2000163044A/ja
Priority to KR10-2001-7006689A priority patent/KR100396728B1/ko
Priority to US09/857,398 priority patent/US6720965B1/en
Priority to CNB998138363A priority patent/CN1167043C/zh
Priority to PCT/JP1999/006561 priority patent/WO2000033289A1/ja
Priority to EP99973155.7A priority patent/EP1136980A4/en
Publication of JP2000163044A publication Critical patent/JP2000163044A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/39Control of the bit-mapped memory
    • G09G5/391Resolution modifying circuits, e.g. variable screen formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0407Resolution change, inclusive of the use of different resolutions for different screen areas
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/045Zooming at least part of an image, i.e. enlarging it or shrinking it

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文書画像データを単純に拡大または縮小する
と表示画面で見にくかった。 【解決手段】 入力画像格納手段1の入力画像から行分
割領域抽出手段2により行方向に複数の行分割領域を得
て、行分割領域を拡大縮小情報指定手段3により指示さ
れた倍率で、配置決定手段4により行分割領域の並び順
が変わらないように拡大または縮小して位置を決定し、
拡大縮小配置手段5により出力画像格納手段6の出力画
像に配置する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字や図・写真を
含む文書画像を見やすいように拡大または縮小して出力
する装置に関する。
【0002】
【従来の技術】文字や図・写真を含む文書画像を表示装
置で拡大または縮小する場合、画像全体を単純に拡大ま
たは縮小する技術が用いられている。また、ワードプロ
セッサやWWW(World Wide Web)ブラ
ウザのように、テキストデータを表示画面や印刷用紙の
大きさに応じて行の字数等を変更して文字や画像の再配
置を行ない、表示、印刷する技術も用いられている。
【0003】一方、画像データからなる文書画像に注目
すれば、特開平9−16713号公報に示されるよう
に、文書画像中の文字領域を非文字領域と区別して抽出
する技術があり、また特開平5−3280997号公報
に示されているように、画像データから本文行領域を抽
出し、行またはブロック単位で再配置を行なって画像を
出力する技術がある。
【0004】
【発明が解決しようとする課題】ところで、小説やマン
ガ等の本の各ページをスキャナ等で取り込んだ画像デー
タとしての文書画像を表示装置にページごとに表示させ
て読む際、文字が小さくて読みにくい場合に、この画像
を拡大しようとして単純に拡大すると、表示画面より画
像が大きくなって、文字が欠落してしまうという問題が
ある。
【0005】また、この欠落した部分を見るため、表示
装置にスクロールバーを設けて、それらを操作すること
により画像全体を見ることが可能となるが、縦または横
方向に操作する必要があり、操作性が悪いという問題が
ある。
【0006】また、画像の中で例えば文字領域の部分
等、必要な部分のみを拡大または縮小する場合には逐一
拡大または縮小の倍率を指定する必要があり、操作性が
悪いという問題がある。さらに、本のページのレイアウ
トが変わる度に拡大または縮小の倍率を変更する必要が
あり、やはり操作性が悪いという問題がある。
【0007】また、画像を縮小する場合、例えば縦に長
い画像を表示画面の縦方向に収まるぐらいに単純縮小し
ても、表示画面の横方向が余ってしまい、表示画面が有
効に利用されず、表示装置に表示される情報量が少なく
なるという問題がある。
【0008】本発明の目的は、上記問題点に鑑み、文字
や図・写真を含む画像データとしての文書画像を見やす
くするために表示画面を拡大または縮小する画像表示装
置を提供するものである。
【0009】
【課題を解決するための手段】請求項1に記載の画像表
示装置は、所定単位で記憶された入力画像を拡大または
縮小して出力画像上に再配置して表示する画像表示装置
であって、上記入力画像中の行領域を行方向に複数分割
した行分割領域を抽出する行分割領域抽出手段と、上記
抽出された行分割領域を単位として、行分割領域の並び
順を保持したまま拡大または縮小し、上記出力画像上に
再配置する処理手段と、を有することを特徴とする。
【0010】請求項2に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記行分割領域抽出
手段が抽出した行分割領域は、文字領域であることを特
徴とする。
【0011】請求項3に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記出力画像は所定
単位で記憶され、上記入力画像は順次拡大または縮小さ
れて、上記出力画像に再配置した時に再配置できない行
分割領域を上記出力画像に連続する他の出力画像に再配
置することを特徴とする。
【0012】請求項4に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記入力画像の縦あ
るいは横方向の少なくとも一方の寸法と拡大または縮小
の倍率との積が、上記出力画像の縦あるいは横方向の少
なくとも一方の寸法の小整数分の小整数倍になるように
設定されていることを特徴とする。この小整数(小整数
とは、1,2,3,‥の絶対値の比較的小さい整数と定
義)分の小整数倍は、整数倍または整数分の1を含んで
いる。従って、小整数分の小整数は、2/3や3(3/
1)などになる。
【0013】請求項5に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記処理手段は、組
版処理を入れて再配置することを特徴とする。
【0014】請求項6に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記入力画像は、背
景画像を除去されていることを特徴とする。
【0015】請求項7に記載の画像表示装置は、請求項
1に記載の画像表示装置において、表示の際の上記入力
画像の所定単位と上記出力画像の所定単位とが等しいこ
とを特徴とする。
【0016】請求項8に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記入力画像から図
・写真領域を検出する図領域検出手段と、検出した図・
写真領域を行分割領域と同一の倍率で拡大または縮小さ
れた時に上記出力画像より大きくならないように制限し
た倍率を求める図拡大縮小率算出手段と、を有し、上記
処理手段は、上記制限された倍率で拡大または縮小され
た図・写真領域が拡大または縮小された行分割領域と重
ならないように上記出力画像上に再配置することを特徴
とする。
【0017】請求項9に記載の画像表示装置は、請求項
1に記載の画像表示装置において、上記入力画像から図
・写真領域を検出する図領域検出手段と、検出した図・
写真領域を拡大または縮小した時に上記出力画像より大
きくなる時に、検出した図・写真領域を拡大または縮小
された時の大きさが収まるよう上記出力画像の大きさを
新たに設定する出力画像サイズ算出手段を有し、上記処
理手段は、新たに設定された出力画像上に拡大または縮
小された図・写真領域と拡大または縮小された行分割領
域とが重ならないように上記出力画像上に再配置するこ
とを特徴とする。
【0018】請求項10に記載の画像表示装置は、請求
項1に記載の画像表示装置において、上記入力画像から
本体領域と周辺領域を検出する本体周辺領域検出手段を
有し、上記処理手段は、上記入力画像での本体領域と周
辺領域との相対位置と上記出力画像での本体領域と周辺
領域との相対位置とが変わらないように、上記本体領域
と周辺領域とを再配置することを特徴とする。
【0019】請求項11に記載の画像表示装置は、所定
単位で記憶された入力画像を拡大して出力画像上に再配
置して表示する画像表示装置であって、上記入力画像か
ら本体領域を抽出する本体領域抽出手段と、抽出された
本体領域が上記出力画像と同じ大きさになるように拡大
率を求める拡大率算定手段と、複数の上記入力画像で求
めた拡大率から共通の拡大率を算出する拡大率共通化手
段と、上記入力画像を共通の拡大率で拡大し、上記出力
画像上に出力する処理手段と、を有することを特徴とす
る。
【0020】請求項12に記載の画像表示装置は、請求
項1または請求項11のいづれかに記載の画像表示装置
において、上記入力画像と上記出力画像との表示切替え
を指示する切替え手段を有することを特徴とする。
【0021】
【発明の実施の形態】〔実施の形態1〕図1に、本実施
の形態に係る要部ブロック図を示す。図1において、入
力画像格納手段1は入力画像を格納しておくICメモリ
や磁気メモリなどの記憶手段であり、スキャナーやビデ
オキャプチャーや通信ポートを含んでいてもよい。な
お、この入力画像は、小説やマンガ等の本をスキャナ等
でページ単位で読み取った画像データとしての文書画像
であり、本のページ単位で各画像データが順序付けられ
て格納されている。なお、ページ単位での格納に限ら
ず、見開きページや段組ごと等、所定の単位で格納して
あればよいが、以下の説明ではページ単位ごとに画像デ
ータが格納されているものとして説明する。
【0022】行分割領域抽出手段2は、入力画像格納手
段1に格納された入力画像をページ単位で行領域を抽出
し、それを複数の行分割領域に分割する。拡大縮小情報
指定手段3は、行分割領域の拡大縮小率と出力画像サイ
ズとを、固定値、計算、またはユーザーによる入力によ
り指定する。配置決定手段4は、行分割領域抽出手段2
からの行分割領域の情報と拡大縮小情報指定手段3から
の拡大縮小率と出力画像サイズの情報とから、各行分割
領域を出力画像上のどの位置にどのくらいの拡大縮小率
で配置するかを計算する。
【0023】拡大縮小配置手段5は、入力画像格納手段
1から得られる入力画像を拡大または縮小し、配置決定
手段4から得られる出力画像上の位置に配置する。この
ように倍率指定により再配置された画像は、出力画像と
して画像出力画像格納手段6に格納される。以上の構成
により、入力画像がページ単位で再配置処理されて出力
画像に格納される。
【0024】図2に、図1の構成を内装した本実施の形
態に係る電子ブックビューワとしての表示装置の外観図
を示す。100はCRTや液晶パネル等のビットマップ
表示可能な表示画面であり、101は入力画像格納手段
1の入力画像の表示と出力画像格納手段6の出力画像の
表示とのいづれかを同一の表示画面100内で切り替え
る切替え手段としてのボタンであり、102はページめ
くり手段としてのボタンである。このボタン102によ
り、ページ単位で入力画像を順次切り替えることができ
ると共に、出力画像がページ単位であれば、出力画像も
ページ単位で順次切り替えることができる。なお、図2
は、拡大縮小情報指定手段3としてのGUIを用いた倍
率指定のソフトボタンを表示した状態を示している。拡
大縮小情報指定手段3による倍率指定は、キーボードや
ボタンや音声などからの入力でもよく、ハードボタンま
たはソフトボタンを押すと一定刻みで倍率値が増減する
ようなものでも良く、また倍率値の増減に応じて、出力
画像がリアルタイムに変化するようにするのも、視覚的
に分かり易くて良い。また、拡大縮小情報指定手段3に
より出力画像は任意のサイズに変更可能であるが、特に
断らない限り、表示される出力画像は、表示される入力
画像と同一サイズの画像として説明する。また、出力画
像サイズは、通常、ページめくり操作やスクロール操作
の便宜のため、入力画像の縦横いづれか一方の寸法と同
じにしてあるのが望ましい。さらに、図2の装置に、拡
大または縮小後の出力画像を見るためのジョグダイヤル
等のスクロール操作指示手段を設けていてもよい。
【0025】次に、図1の行分割領域抽出手段2の動作
を図3のフローチャートを用いて説明する。まず、ステ
ップS1で画像の縦軸、横軸の投影を取り、ステップS
2へ進む。ステップS2で、画像中の文字列が縦行かど
うかを判断し、縦行と判断されればステップS3へ進
み、縦行でないと判断されればステップS6へ進む。ス
テップS3とステップS6の違いは、縦行か横行かの違
いなので、縦と横を変えるだけで同様の処理になる。ス
テップS3以降の処理であるステップS4、ステップS
5も縦と横を変えるだけでステップS7、ステップS8
と同様にして処理できる。従って、以降は、ステップS
6側だけで説明する。
【0026】ステップS6では、画像中から行領域を抽
出し、ステップS7へ進む。ステップS7では、各矩形
(各行領域)の中だけで横軸への投影を取り、ステップ
S8へ進む。ステップS8では、行領域を横に複数の領
域に分け、行分割領域抽出手段2を抜ける。
【0027】図4は図3のステップS1を行なった例で
ある。図4において、10は処理する入力画像、11は
入力画像10の濃度値を横軸(以下、x軸とも呼ぶ)に
投影した折れ線グラフ、12は入力画像10の濃度値を
縦軸(以下、y軸とも呼ぶ)に投影した折れ線グラフで
ある。グラフ11では、右方向を投影位置を表すPx
軸、上方向を投影値を表すVx軸、グラフ12では、下
方向を投影位置を表すPy軸、上方向を投影値を表すV
y軸とする。入力画像が二値画像の場合は、黒画素の数
を数えることに当たる。多値画像の場合は、濃度値の和
になる。図3では分かり易いように、投影結果の投影位
置と入力画像10の投影に使われた画素の位置がx軸方
向で揃うように、グラフ12と入力画像10を並べて表
現している。グラフ11も同様に、投影結果の投影位置
と入力画像10の投影に使われた画素の位置が揃うよう
にしてある。各位置の投影結果を例えば16bitの整
数値で表現するとすると、全投影結果は、16bit値
を要素とする画像幅の大きさの配列に収められることに
なる。
【0028】図3のステップS2を図5のフローチャー
トを用いて説明する。図5において、ステップS10
で、縦軸への投影が規則的かどうかを判断する。規則的
であるかどうかを判断する方法は色々考えられる。例え
ば、投影結果を周波数解析して、特定周波数の鋭いピー
クが存在するかどうかで判断する方法もある。ここでは
簡単に、まず投影結果を閾値で二値化する。結果は、例
えば、0,0,1,0,0,0,1,1,1,0,0,
0,1,1,1,0,0,0,1,1,1,0,0など
という値を持つ配列になる。ここで0のランレングスと
1のランレングスを調べ、ランレングスの度数分布を調
べる。先の例で言えば、0は、ランレングスが3の度数
が3、ランレングスが2の度数が2であり、1は、ラン
レングスが1の度数が1、ランレングスが3の度数が3
である。ランレングスが閾値T1より大きく、その度数
が閾値T2より大きい場合に、規則的であると判断す
る。例えば、T1を2、T2を2とすると、先の例は規
則的であると判断される。
【0029】図5のステップS10で、縦軸への投影が
規則的と判断された場合はステップS11へ向かい、規
則的でないと判断した場合はステップS12に向かう。
ステップS11では横軸への投影が規則的かどうかを判
断する。規則的である場合は、ステップS13に向か
い、規則的でない場合は、結合子P3に向かう。規則的
であるかどうかは、ステップS10と同様の方法で判断
すれば良い。
【0030】ステップS13では、縦軸投影の背景濃度
の幅と横軸投影の背景濃度の幅を比べて、縦軸投影の方
が大きいかどうかを判断する。これは先のランレングス
の例で言えば、背景濃度である0のランレングスを比較
することになる。閾値T1より大きく、その度数が閾値
T2より大きい、0のランレングスが複数ある場合は、
最も度数の大きいランレングスを比較の対象とする。先
の例で言えば、0のランレングスが3の度数が3、ラン
レングスが2の度数が2だったので、最も度数の多いラ
ンレングス値として3を比較対象として使う。縦と横で
最も度数の大きいランレングス値を比較して、大きいほ
うが幅が大きいと判断する。それ以外は結合子P2へ進
む。
【0031】ステップS13で縦軸の方が幅が大きいと
判断されたら、結合子P3へ進む。ステップS12で
は、横軸への投影が規則的かどうかを判断する。判断手
法は、ステップS11の手法と同様で良い。規則的であ
ると判断された場合は、結合子P2へ進む、規則的でな
いと判断された場合は、ステップS13に進む。
【0032】図3のステップS6では、ステップS2で
縦行でないと判断されているので、横行の領域を入力画
像から抽出すれば良い。図6の上の画像は、図4の一番
上の横行を抽出した例である。行を抽出する手法の例と
して、図3の例の説明で言えば、縦軸への投影結果を二
値化した時、1のランレングスの幅が閾値T3を越える
部分を行として判断してやれば良い。行と判断された部
分を、図6の上の画像の矩形領域の様に横に切り出せ
ば、行が抽出されたことになる。実際には、画像をコピ
ーするわけではなく、行の領域にあたる矩形の座標情
報、例えば左上角の座標値(left,top)と大き
さの情報(width,height)が得られれば充
分である。
【0033】図7は、n個の行がある時に、矩形の座標
情報がメモリ中に格納されている状態を模式的に示した
ものである。図7中の20、21は最初の行の左上隅の
座標値(left[0],top[0])を、22、2
3は大きさの情報(width[0],height
[0])を表す。例えば、各値が2バイトで表されてい
るとすると、top[0]のアドレス値は、left
[0]のアドレス値に2バイトずつ足せば求められる。
width[0],height[0]も同様にして、
2バイトずつ足していけばアドレス値が得られる。この
場合、1行分の矩形情報は、8バイトで表現される。各
行の矩形情報は、図7の様に並んで格納されているとす
る。例えば、rect[0]が1行目の矩形情報のメモ
リ領域の先頭アドレス、ここで言えば20のleft
[0]のアドレスを指すとする。すると2行目の矩形情
報のアドレスrect[1]は、(rect[0]+
8)と表現できる。このようにして、各行の矩形情報に
アクセスできるようになる。得られた矩形の位置情報
は、図3のステップS7に送られる。
【0034】ステップS7では、ステップS6から得ら
れた各行の矩形の位置情報を使って、各矩形(各行領
域)の中だけで横軸への投影を取る。図6の下の折れ線
グラフは、上の図形の投影を取った例である。投影結果
と矩形情報はステップS8に渡される。ステップS8で
は、ステップS7から得られた投影結果と矩形情報か
ら、行領域を横に複数の領域に分ける。この分け方は色
々な方法がある。例えば、分ける数が決まっている場合
は、行の幅をその数で割り、分割領域の平均の大きさを
求め、行をその平均の大きさで分けていき、仮の分割位
置とする。次に、ステップS7の投影結果を二値化し、
分割する位置に最も近い背景濃度0の位置を分割場所と
すれば良い。実際には、分割位置で完全に分けるのでは
なく、背景濃度0の部分は文字などはないと仮定して、
分割領域に含めなくても良い。端の部分も同様に濃度0
の部分は分割領域から除いて良い。高さに関しては、行
領域の高さをそのまま使えば良い。
【0035】図8(a)は、図4の画像の各行を2つに
分割したものである。ここでは、分かり易いように、画
像に重ねて、行分割領域を四角で囲ってある。1行目の
左の分割領域の最後の文字「ボ」と右の行分割領域の最
初の文字の「ウ」の間は、背景領域(濃度0)なので、
行分割領域に含めず、従って左右の行分割領域は接して
いない。4行目の左の行分割領域も、先頭部分が一文字
分下げられているので、その分は行分割領域に含めてい
ない。また、濃度0の部分を除くことで、行分割領域の
幅が0となるものは行分割領域ではないと判断して、除
いてしまってもよい。3行目では行分割領域は一つしか
ないが、これは右側の行分割領域が、背景濃度0の部分
を除いたら幅が0となってしまうので、行分割領域とし
て認めず、従って、この行の行分割領域は1つだけであ
る。
【0036】なお、図8(a)では行領域の分割数を決
めて分割したが、行分割領域の基準幅を決めておいて、
これに最も近い位置で分割するようにする方法もある。
最も近い位置で分割するのは、先に説明した手法と同様
の方法で実現できる。
【0037】図8(b)は、基準幅を決めて分割した例
である。ここでは、2文字分程度にするため、行分割領
域の高さの倍を基準幅としている。あるいは、分割数や
基準幅を決めず、濃度1のランレングスの最低幅だけを
決めて、それ以上の幅のものを行分割領域とし、それ以
下のものはノイズとして無視するか、周囲の行分割領域
に併合するという方法もある。
【0038】なお、各行の分割数を決めておけば、入力
画像を整数倍もしくは整数分の1に拡大縮小する時に、
処理を簡単にできる利点がある。つまり、2,3,‥の
分割数に対応させて倍率を2倍,3倍,‥にしておけ
ば、再配置の計算処理が簡単になる。また、基準幅や最
低幅を決めておけば、ノイズ等の除去に有効であり、出
力画像の行幅より整数分の1程度に小さくすれば、再配
置時に、より有効に出力画像を利用して表示できる。
【0039】図8(c)は、文字領域を抽出してから、
行分割領域を抽出した例である。文字領域を抽出する方
法はいくつかあるが、例えば、背景が白で文字が黒の場
合、まず、入力画像を2値化して、黒画素の連結領域に
対してラベリングする。これは、ラスタで黒画素を探
し、まだラベリングされていない黒画素があったら、そ
の画素にラベリングを行なう(番号をふる)。ここでは
その画素値をラベリングの番号に変えてしてしまうこと
で良い。例えば、背景濃度を0、(未ラベリングの)黒
画素濃度を255とすると、最初に発見した画素値25
5の画素の画素値を1にしてしまう。次にその画素値の
上下左右(あるいは斜めも)に画素値255の未ラベリ
ングの黒画素がないかどうかを探す。あればその画素も
ラベリング値にしてしまう。これを繰り返す。周囲にも
う未ラベリングの黒画素がなくなったら、ラベリング値
を一つ上げて2とし、再度、ラスタで未ラベリングの黒
画素を探す。これらを未ラベリングの黒画素が無くなる
まで繰り返すことで、全ての黒画素の連結領域に対して
ラベリングすることができる。次に各連結領域の外接矩
形領域を求める。これは連結領域内の画素位置の最大最
小値を縦、横で求めれば良い。1つの連結領域の情報
は、ラベリング値とその外接矩形領域の左上位置と大き
さで表現でき、処理結果は全ラベリング数のあとに、こ
れをラベリング個数分並べた形で格納すれば良い。格納
構造としては、後述の図10の1行分の行分割領域情報
と同様になる。なお、この矩形領域の面積が閾値Ta以
下のものは、ノイズと見なして、以下の処理からは除
く。
【0040】図9(a)は、各連結領域の外接矩形領域
を求めた例である。ここでは、分かりやすいように、外
接矩形領域40〜47が文字に対して上書きしてある。
各外接矩形領域間で、距離を求め、距離が閾値Td以下
のものは、同じ文字領域の一部とみなして、併合してし
まう。距離を求めるには、例えば、縦軸、横軸とも独立
で行なう。矩形uのx軸方向の範囲をu1〜u2(u1
≦u2)、矩形vのx軸方向の範囲をv1〜v2(v1
≦v2)とする。u1<u2≦v1≦v2の場合は、
(v1−u2)が距離である。v1≦u2≦v2あるい
はu1≦v2≦u2の場合は、距離は0である。v1≦
v2≦u1≦u2の場合は、(u1−v2)が距離であ
る。これをy軸方向でも行ない、小さい方の距離を矩形
間の距離とする。また、併合とは、画像上のラベリング
値をどちらかに統一し、外接矩形領域を求め直すことを
言う。まず、画像上で統一される方のラベリング値を持
つ画素を探し、統一する方のラベリング値を代入する。
また、先に説明した方法で結果を格納しているなら、統
一した方のラベリング情報の方に新しい外接矩形の位置
と大きさを代入する。統一された方のラベリング情報は
消去するため、その後に続くラベリング情報をずらしな
がらコピーする。最後に先頭に格納してある全ラベリン
グ数を1減らす。なお、1度併合したら、併合した矩形
領域を使って、再び各外接矩形領域間で距離を求める処
理からやり直す。これを併合処理がなくなるまで繰り返
す。一連の処理で最後に残った外接矩形が文字領域であ
る。図9(b)は、外接矩形領域の併合処理を繰り返し
行なった結果である。図9(a)の41、42、43が
併合されて48の文字領域に、図9(a)の46、47
が併合されて49の文字領域になっている。
【0041】文字領域の矩形情報と図4のx軸への投影
結果から得られる行領域情報から、行分割領域を得るこ
とは簡単である。行領域が分かれば、それに含まれる文
字領域は、その行に属する文字領域であると言える。行
領域の中での最小分割単位が文字領域なので、あとはそ
れらをどうまとめるかだけである。先に説明した投影だ
けで行なう方法の様に、分割数を決めて行なう方法でも
良いし、行分割領域の基準幅を決めて行なっても良い
し、一定文字数ずつまとめても良いし、あるいは何もま
とめず、文字領域をそのまま行分割領域としても良い。
また、行分割領域を図4の投影結果から求めなくても、
文字領域の矩形間距離で行領域を得る方法もある。
【0042】ステップS8で得られる行分割領域の情報
は、例えば図10の様にしてメモリ上に格納すれば良
い。図10において、30は全行数、31は最初の行に
存在する行分割領域の数s[0]であり、メモリ空間上
では30の後にs[0]個分だけ行分割領域の領域情報
が格納されている。32、33、34、35のL[0,
0]、T[0,0]、W[0,0]、H[0,0]は、
最初の行の最初の行分割領域情報、すなわち左上隅座標
値(L[0,0],T[0,0])、大きさ(W[0,
0],H[0,0])を表す。35以降は、同様の順で
行分割領域の領域情報が並んでいる。従って、最初の行
の最後の行分割領域情報37の値は、H[0,s[0]
−1]となる。37の次に、メモリ空間上では、次の行
の行分割領域数38の値s[1]が占める。38以下は
最初の行と同様に、行分割領域の個数と行分割領域情報
が並んでいる。各行分割領域情報のそれぞれの値が2バ
イトで表され、行分割領域数が1バイトで表されるとす
ると、例えば、2行目の3番目の行分割領域の幅へのポ
インタは、((s[0]のポインタ)+(1+(8×s
[0]))+(1+8×2+2×(3−1)))で計算
できる。このようにして、各行分割領域の情報に、ポイ
ンタ経由でアクセスできる。
【0043】次に、図1の配置決定手段4の動作を図1
1のフローチャートを用いて説明する。以下説明のた
め、入力画像中の行分割領域を入力行分割領域、配置決
定手段4で配置された行分割領域を出力行分割領域と呼
ぶ。配置決定手段4によって決定された出力行分割領域
情報も図10で説明したような方法で格納されるとす
る。但し、出力画像が1つに収まらず、複数に渡る場合
もありえるので、出力行分割領域情報は複数確保するこ
とができ、例えばメモリ上に確保する場合、各出力行分
割領域情報のメモリ領域のポインタ値(例えば4バイト
数で表現される)を並べた、いわゆる配列の状態で管理
する。この配列を出力配置配列と呼ぶとする。例えば、
n番目(0から数える)の出力行分割領域情報にアクセ
スしたい場合は、出力配置配列のn番目のポインタ値、
すなわち(n×4)から4バイトで表現される値を使っ
てアクセスすれば良い。以降、出力行分割領域情報にア
クセスする時は、特に記さない限り、上記の方法でカレ
ント出力ページの出力行分割領域情報にアクセスすると
する。また、現在、何番目の出力行分割領域情報の配置
を作成しているかを表すカレント出力ページ番号を最初
は0にしておく。出力ページ番号は、倍率指定により得
られるページ番号であり、全出力ページ数は、倍率指定
と再配置の仕方によって決まるが、効率良く再配置でき
た場合は、例えば1ページの入力画像を2倍にすると、
4ページ分のページ番号が付与される。
【0044】図11によれば、結合子P20を経由し
て、ステップS20で、次の入力行分割領域を得る。こ
れは、現在の行番号値(以下、入力行インデックス値と
呼ぶ)と、その行中の何番目の行分割領域かを示す値
(以下、入力行分割領域インデックス値と呼ぶ)を保持
していれば、図10で説明した方法でアクセスできる。
まず、入力行分割領域インデックス値に1を足した値
を、現在の行中の行分割領域数と比較し、行分割領域数
を越えるようだったら、次の行の行分割領域を使えば良
い。すなわち、入力行インデックス値を1増やして、入
力行分割領域インデックス値を0にすれば良い。
【0045】ステップS21は、ステップS20で得ら
れた次の入力行分割領域を、最後に配置した出力行分割
領域の後に配置するのかどうかを判断する。ステップS
21で、次の入力行分割領域を、最後の出力行分割領域
の後に配置するのが適当と判断された場合は、ステップ
S25に向かい、適当でないと判断された場合は、ステ
ップS27に向かう。
【0046】ステップS25では、前の行分割領域が単
語接続文字かどうかを判断する。例えば英文では、長い
英単語が行末に来た時に、適当な場所で英単語を分割
し、前半部分に「−」(ハイフン)をつけて行末に置
き、後半部分は次行に回すことがある。ここでいう単語
接続文字とは、このハイフンのことである。ここの処理
は、行分割領域が文字単位でないと難しいので、もし文
字単位でないならば、ステップS25、S26を飛ばし
て、結合子P22経由でステップS22にジャンプす
る。もし前の文字(行分割領域)がハイフンで、かつ、
その行の最後の文字であったならば、単語接続文字であ
ると判断し、ステップS26へ向かう。もし単語接続文
字でないと判断したら、結合子P22経由でステップS
22に向かう。ハイフンであるかどうかの判断は、文字
認識機能が必要だが、ここでは簡易な処理でも充分であ
る。すなわち、領域の大きさをみて、横幅(文字幅)は
他の行分割領域(文字領域)とほぼ同じだが、高さがほ
とんどなく、行の高さの中心付近に位置するものは、ハ
イフンであると判断してしまえば良い。前の文字の領域
を位置(Lp,Tp)、大きさ(Wp,Hp)、この現
在判断対象としている文字の領域を位置(Lg,T
g)、大きさ(Wg,Hg)とした場合、この判断は次
の式をすべて満たすかどうかで表せる。なお、ab
s()は絶対値を表し、Tw,Th,Tpは閾値であ
る。
【0047】abs(Wg−Wp)<Tw Hg/Hp<Th abs((Tg+Wg/2)−(Tp+Wp/2))<
Tp ステップS26では、ステップS25で単語接続文字と
判断されたので、前の文字、すなわちハイフン文字を出
力画像から除いてしまえば、最終的に出力画像上で単語
が接続されることになる。出力行分割領域だけ取り除い
ても、入力行分割領域が残っていると、拡大縮小配置手
段5の処理が面倒になるので、対応する入力行分割領域
も同時に除いてしまった方が良い。入力行分割領域を取
り除くには、該当する行の分割領域数を一つ減らし、該
当する行分割領域の格納領域の場所にその後の情報格納
領域を、一つの行分割領域の格納バイト数分、ずらしな
がら最後までコピーすれば良い。出力行分割領域の方は
作成中なので、単に分割領域数を一つ減らして、分割領
域インデックス値を一つ減らすだけで良い。処理後、結
合子P22を経て、ステップS22へ向かう。
【0048】ステップS22では、ステップS21で適
当であると判断されているので、次の入力行分割領域を
最後の出力行分割領域の後の位置に配置し、結合子P2
4を経て、ステップS24へ向かう。
【0049】一方、ステップS27では、この出力行中
の出力行分割領域間の均等再配置を行ない、ステップS
23へ向かう。ステップS23では、入力行分割領域の
配置位置を次の行の最初の位置に設定し、結合子P24
を経て、ステップS24へ向かう。ステップS24で
は、入力行分割領域が、最後の行分割領域かどうかを判
断し、最後ならば、配置決定手段4を抜け、最後でない
なら、結合子P20を経て、ステップS20へ向かう。
【0050】次に、図11のステップS21を図12の
フローチャートを用いて説明する。ステップS30は、
前の入力行分割領域後に改行されているかどうかを判断
する。改行されていると判断されたら、次の入力行分割
領域は次行の行頭として配置されるので、結合子P23
に向かう。改行されてないと判断されたら、結合子P3
0を経て、ステップS34に向かう。なお、ステップS
30で改行されていると判断された場合は、次行に配置
されるので、入力画像中の改行が出力画像でも保存され
ることになり、組版処理の一種の改行保存が実現でき
る。改行には、文脈上の意味の切れ目など、通常、何ら
かの意味が込められていることが多いので、その効果を
出力画像上でも維持できる利点がある。
【0051】ステップS34では、行分割領域中の文字
が、禁則文字かどうかを判断する。禁則文字と
は、「。」「、」「?」「!」などの通常、行頭には置
かない文字である。これは行の分割単位が文字単位でな
いと処理が難しいので、文字単位にしてない場合はこの
処理を省いて、ステップS30から直接、ステップS3
1にジャンプする。禁則文字かどうかを判別するには、
一般に文字認識機能が必要だが、対象とする文字数が少
ないので、簡単な認識処理でも充分である。例え
ば、「。」や「、」「.」「,」ならば、他の文字領域
に比べて面積が小さく下方に位置しているので、行分割
領域の領域情報がこれにあてはまる場合は、禁則文字と
みなしてしまって良い。「?」や「!」までも認識した
い場合は、「?」や「!」の2値ビットマップを適当な
大きさで予め作成しておき、行分割領域をこの大きさに
拡大縮小して2値化し、ドットの白黒が一致する数を数
える。この数がある閾値を越えるならば、「?」や
「!」であると判断できる。禁則文字であると判断され
た場合は、結合子P22へ向かい、そうでないと判断さ
れた場合は、ステップS31へ向かう。これによって、
組版処理の一種の禁則処理が実現できる。
【0052】ステップS31で、最後の出力行分割領域
の位置を得る。これは前回に配置した出力行分割領域の
位置を保存しておけば良い。次のステップS32で、ス
テップS31で得た最後の出力行分割領域の次の位置を
得る。「次の位置」とは、並んだ行分割領域が連続した
行のように見える位置を指す。図8(a)の画像の例で
言えば、「9回目を向かえた今年は」という行分割領域
の次の位置は、右隣の「、ローズボウルで全米」の行分
割領域である。
【0053】ステップS33で、ステップS32で決め
た位置に次の入力行分割領域を配置したら、出力画像の
大きさからはみでるかどうかを判断する。もしはみでる
と判断されたら、次の行に配置するので、結合子P23
に向かう。はみでていないと判断されたら、その位置に
配置するので、結合子P22に向かう。
【0054】次に、図12のステップS30を図13の
フローチャートで説明する。結合子P21から、ステッ
プS40で注目する入力行分割領域がその行の最後の入
力行分割領域かどうかを判断する。行中の最後の入力行
分割領域でないと判断されたら、その後で改行されてい
ることはないので、結合子P30へと向かう。
【0055】行中の最後の入力行分割領域であると判断
されたら、その後で改行されている可能性があるので、
ステップS41へと向かう。
【0056】ステップS41では、全ての入力行分割領
域の包含領域の枠を求める。外接四角形を求めると言っ
ても良い。包含する範囲を左上隅のX,Y座標値(L
c,Tc)と右下のX,Y座標値(Rc,Bc)とすれ
ば、Lcは全入力行分割領域の左端位置で最も小さい
値、Tcは全入力行分割領域の上端位置で最も小さい
値、Rcは全入力行分割領域の右端位置(左端位置+
幅)で最も大きい値、Bcは全入力行分割領域の下端位
置(上端位置+高さ)で最も大きい値、にすれば良い。
ステップS42で、行方向において、注目する入力行分
割領域の末尾と包含領域の枠との間隔が閾値Tr1以上
空いているかどうかを判断する。行末が大きく空いてい
れば、改行があったと判断できる。例えば、注目する入
力行分割領域の領域情報を左上座標(L1,T1)、大
きさを(W1,H1)とする。この行が横方向の行だと
すると、(Rc−(L1+W1)>Tr1)が成り立つ
なら、空いていると判断する。T1は、固定値でも良い
し、横行なら、1文字分なら行の高さH1、2文字分な
らH1×2と設定しても良い。また、H1でなく、各
行、各入力行分割領域の高さのメジアンなどを取って、
1文字分としても良い。あるいは、後に説明するよう
に、文字領域まで検出できているなら、その文字の幅や
高さをそのまま使っても良い。閾値Tr1以上空いてい
ると判断されれば、改行されているとして、結合子P2
3に向かう。空いていないと判断されれば、ステップS
43に向かう。
【0057】ステップS43では、次の入力行分割領域
の先頭と包含領域の枠との間隔が閾値Tr2以上空いて
いるかどうかを判断する。これは段落の最初などの字下
げなどを検出するためで、たまたま前の段落が行末に空
白がないほど行の最後まで文字があったとしても、次の
行で字下げがあれば、改行があったと判断できる。判断
手法はステップS42と同様で、例えば、次の入力行分
割領域の領域情報を左上座標(L2,T2)、大きさを
(W2,H2)とする。この行が横方向の行だとする
と、L2−Lc>Tr2が成り立つなら、空いていると
判断する。Tr2は、Tr1と同様に決めて良い。空い
ている、すなわち字下げされていると判断された場合
は、改行があったとして、結合子P23へ向かい、空い
ていないと判断された場合は、ステップS44へ向か
う。
【0058】ステップS44では、注目する入力行分割
領域と次の入力行分割領域との行間隔が閾値Tr3以上
空いているかどうかを判断する。もし閾値Tr3以上空
いていれば、次の行で字下げはしてないかもしれない
が、段落のまとまりがその行で終っていると思われるの
で、改行があったと判断できる。例えば、注目する入力
行分割領域の左上座標を(L1,T1)、大きさを(W
1,H1)とし、次の入力行分割領域の左上座標を(L
2,T2)、大きさを(W2,H2)とする。この行が
横行だとすれば、T2−(T1+H1)>T3が成り立
つならば、改行があったと判断し、結合子P23へ進
む。成り立たないならば、改行はなかったと判断し、結
合子P30へ進む。T3は、例えば、2行分の高さ、H
1×2もしくは、H2×2とすれば良い。
【0059】図12のステップS32で、最後に配置し
た出力行分割領域の次の位置を求めるには、次のように
すれば良い。例えば、最後に配置した出力行分割領域の
左上座標(L3,T3)、大きさ(W3,H3)とし、
次の入力行分割領域の大きさ(W4,H4)で横行であ
るとし、拡大縮小情報指定手段3から得られる縦方向、
横方向の拡大縮小率を(Rx,Ry)、行分割領域の間
隔をIrとする。このとき、次の入力行分割領域の配置
後の大きさ(W5,H5)は、W5=W4×Rx,H5
=H4×Ryとなり、左上座標(L5,T5)は、L5
=L3+W3+Ir,T5=T3+(H3/2)−(H
4×Ry/2)と表現できる。ここで、縦位置は行分割
領域の中心位置が合うようにしている。
【0060】Irの値は、後述するように、行分割領域
が、文字領域として検出されているなら、文字領域間の
平均的な間隔を算出して、Rx倍して使っても良い。文
字領域を検出していなくても、図3のステップS6で説
明したように、行分割領域中の投影結果を二値化して背
景画素のランレングス値を、文字領域の間隔とみなし
て、隣接する入力行分割領域間の間隔の平均値を用いて
もよい。
【0061】図10のステップS33で、次の入力行分
割領域をステップS32で求めた位置に配置するかどう
かを判断する。つまり、横行の場合、ステップS32で
入力行分割領域を配置した時に、右端が出力画像からは
みだすかどうかを見る。入力行分割領域を配置した時の
右端のX座標値R5は、R5=L5+W5であり、これ
と出力画像の横幅Woを比較して、R5がWoより大き
ければ、はみだすと判断して、結合子P23へ進み、大
きくない場合は、結合子P22へ進む。なお、配置可能
範囲を、出力画像一杯の幅でなく、右側マージン量Mr
を持たせるとしたら、R5と(Wo−Mr)を比較する
ことになる。
【0062】図11のステップS22で、次の入力行分
割領域を最後の出力行分割領域の後の位置に配置するに
は、次の様にすれば良い。横行なら、横方向の配置位置
は、図12のステップS32で得られているので、それ
を使えば良い。縦方向の配置位置は、ステップS32で
説明したように最後の出力行分割領域と中心を合わせる
ようにしても良いし、最後の出力行分割領域だけでな
く、その行に属する全ての出力行分割領域の縦位置の平
均値やメジアンを使って、中心を合わせるようにしても
良い。出力行分割領域の大きさも、ステップS32で求
めた値、すなわち入力行分割領域の大きさを(Rx,R
y)倍した値にしておけば良い。結果は、行分割領域の
情報を図10のように格納してあるなら、新たに同様の
格納領域を確保して、新たな配置場所が決まった行分割
領域から順に情報を追加格納していけば良い。追加する
時は、その行に含まれる行分割領域数を1増やすように
する。配置場所が次の行の最初になったら、新たな情報
格納領域でも、その行に行分割領域を追加することを終
え、次の行分割領域は次の行の最初の行分割領域として
追加するようにする。
【0063】次に、図11のステップS27を図14を
用いて説明する。以下の説明では、現在の出力行中の出
力行分割領域が対象であり、例として横行の場合を説明
する。ステップS80では、行頭の出力行分割領域の位
置を固定し、行末の出力行分割領域の位置を出力画像の
配置可能範囲一杯に配置するとして、出力行分割領域間
の平均間隔Seを計算し、ステップS81へ向かう。例
えば、出力行分割領域数がn個あり、左端がL[i]、
幅がW[i]で表現する(i=0〜n−1)。すると、
平均間隔は次式、Se=(Wo−Mr−L[0]−(W
[0]+...+W[n−1]))/(n−1)で表現
される。
【0064】ステップS81では、Seが閾値Teより
大きければ、Seを平均間隔として再配置に使うには大
き過ぎると判断し、ステップS82へ向かう。そうでな
い場合は、ステップS84へ向かう。
【0065】ステップS82では、行頭と行末の出力行
分割領域の位置を固定し、出力行分割領域間の平均間隔
Smを計算し、ステップS83へ向かう。Smは次式S
m=(L[n−1]−L[0]−(W[0]+...+
W[n−1]))/(n−1)で表現される。ステップ
S83では、求めたSmで出力行分割領域の位置を再配
置し、ステップS23へ向かう。再配置された新しい位
置L[i]は、次式、L[i]=L[i−1]+W[i
−1]+Smで求められる(i=1〜n−1)。ステッ
プS84では、求めたSeで出力行分割領域の位置を再
配置し、ステップS23へ向かう。再配置された新しい
位置L[i]は、次式L[i]=L[i−1]+W[i
−1]+Seで求められる(i=1〜n−1)。
【0066】次に、図11のステップS23で縦位置を
求める動作を図15を用いて説明する。。ステップS5
0では、平均行間隔Lmを得て、ステップS51に進
む。平均行間隔とは、隣接する行同士の(横行の場合)
上位置の間隔の平均である。従って、平均行間隔Lm
は、T[d+1,0]−T[d,0],(d=0〜n−
2,全部でn行とする)の平均値を計算すれば求められ
る。一部の行に大きな文字や図などが含まれている場合
は、単純平均でなく、メジアンを取ることで平均値とし
ても良い。
【0067】ステップS51では、入力行分割領域と、
前の行の入力行分割領域との上位置の間隔を、ステップ
S51で求めた平均行間隔Lmで割った値が、閾値Tm
以上かどうかを判断する。もし閾値Tm以上の場合は、
前の行との間に空行があるとして、ステップS52に向
かい、そうでない場合はステップS53に向かう。多く
の場合、閾値Tmは、1.5〜2.0程度にしておけば
良い。
【0068】ステップS52では、ステップS51で空
行があると判断されているので、例えば横行の場合、
(前の行との間隔×Ry)を前の行の出力行分割領域の
上位置にプラスした値を、新たな出力行分割領域の上位
置にすれば良い。空行は段落の切れ目など何らかの意味
があることが多い。入力画像中の空行が出力画像におい
ても保存されるので、この処理によって組版処理の一種
の空行保存される。
【0069】ステップS53では、前の行との間に空行
はないので、例えば横行の場合、Lm×Ryを前の行の
出力行分割領域の上位置にプラスした値を、新たな出力
行分割領域の上位置にすれば良い。
【0070】ステップS54では、ステップS52、ス
テップS53で求めた配置位置で、出力行分割領域が出
力画像の配置可能範囲の大きさを越えるかどうかを判断
する。ステップS52、ステップS53で求めた出力行
分割領域の上端位置をTa、入力行分割領域の高さをH
aとすると、出力行分割領域の下端Baは、Ba=Ta
+Ha×Ryとなり、出力画像の下マージン量をMbと
すると、Ba<Wo−Mbの時は出力画像の配置可能範
囲を越えていないと判断し結合子P50へ進み、それ以
外の時は越えているとして判断し、ステップS55へ進
む。つまり、ステップS54では、カレント出力ページ
にはいるかどうか判断している。
【0071】ステップS55では、新たな出力画像用の
出力行分割領域の情報を格納する領域を確保し、出力配
置配列に新たに確保した領域のポインタ値を追加し、カ
レント出力ページ番号を1増やし、出力行インデックス
値、入力行分割領域インデックス値を0にする。次に、
出力行分割領域の縦位置を情報領域に記録して、結合子
P50へ向かう。縦位置は、最初の行の位置なので、出
力画像の上マージン量Mtにしておけば良い。
【0072】次に、図11のステップS23で横位置を
求める動作を図16を用いて説明する。図16におい
て、まず図15の結合子P50からステップS60に向
かう。ステップS60では、対象とする入力行分割領域
が、入力画像上で行頭に位置していたかどうかを判断
し、行頭の場合はステップS61へ、行頭でない場合は
ステップS62へ向かう。行頭であるかどうかは、行分
割領域インデックス値が0かどうかをみれば分かる。
【0073】ステップS61では、ステップS60で行
頭と判断されたので、出力画像上でも行頭となるように
配置し、結合子P24へ向かう。入力行分割領域の横位
置をLi、出力画像の左側マージンをMlとすると、出
力行分割領域の左端位置は、(Li−Lc)×Rx+M
lで表される。
【0074】ステップS62では、入力行分割領域が配
置される位置の出力行インデックス値が、入力画像の全
行数を越えているかどうかを判断し、越えている場合
は、ステップS63へ向かい、越えていない場合は、ス
テップS64へ向かう。この判断手法は、図15のステ
ップS50と同様である。
【0075】ステップS63では、図13のステップS
41の説明で使った全ての入力行分割領域の包含範囲の
左端位置を、出力行分割領域の横位置として設定し、結
合子P24へ向かう。ステップS62で入力画像の行数
を越えていると判断されたので、参考にする行がなく、
ここでは出力画像の左マージン幅Mlを出力行分割領域
の左端位置として使うようにしている。
【0076】ステップS64では、出力行インデックス
値と同じ行インデックス値の入力行の、行頭の入力行分
割領域が字下げされているかどうかを調べる。字下げさ
れていればステップS66へ進み、字下げされていなけ
ればステップS65へ進む。字下げされているかどうか
の判断は、図13のステップS43の字下げ検出と同様
にすればよい。
【0077】ステップS65では、ステップS64で字
下げされていないと判断されており、さらにステップS
60で入力行領域は行頭でないと判断されているので、
出力行インデックス値をLnとすると、入力行インデッ
クス値がLnの行の最初の入力行分割領域の横位置L
[Ln−1,0]を、出力行分割領域の横位置とする。
位置を設定後、結合子P24へ向かう。
【0078】ステップS66では、ステップS60で入
力行分割領域が行頭でないと判断されているが、ステッ
プS64で字下げされていると判断されているので、字
下げされている入力行分割領域の行頭位置は使えず、ス
テップS63と同じく、出力画像の左マージン幅Mlを
出力行分割領域の左端位置として使うようにしている位
置を設定後、結合子P24へ向かう。
【0079】次に、図1の拡大縮小配置手段5を図17
を用いて説明する。ステップS70では、出力ページ番
号、入力行インデックス値、入力行分割領域インデック
ス値、出力行インデックス値、出力行分割領域インデッ
クス値を0に設定し、結合子P70を経て、ステップS
71へ向かう。以降、アクセスする出力行分割領域情報
は、出力配置配列中の出力ページ番号の出力行インデッ
クス番目のものである。
【0080】ステップS71では、次に処理を行なう入
力行分割領域、出力行分割領域の情報を得て、ステップ
S72に向かう。これは入力行インデックス値、入力行
分割領域インデックス値、出力行インデックス値、出力
行分割領域インデックス値を使ってアクセスすれば良
い。
【0081】ステップS72では、拡大縮小率を得て、
ステップS73に向かう。拡大縮小情報指定手段3で固
定の拡大縮小率になっている場合は、その値をそのまま
使えば良い。なお、後述するように、行分割領域によっ
て拡大縮小率が異なる場合は、出力行分割領域の大きさ
を入力行分割領域の大きさで割り、拡大縮小率を求め
る。入力行分割領域と出力行分割領域の間で矩形の縦横
比が同じなら、幅か高さかいずれかのみ計算すれば良い
が、縦横比が異なる場合は、縦拡大縮小率、横拡大縮小
率をそれぞれ幅、高さの比から計算する必要がある。
【0082】ステップS73では、拡大縮小された出力
行分割領域の画像を出力画像上に配置し、ステップS7
4へ向かう。出力行分割領域の画素を左上から右下へと
ラスタスキャンしながら、画素値を計算して求め、代入
していけば良い。例えば、出力行分割領域が、(Lo,
To)〜(Lo+Wo,To+Ho)の範囲で、入力行
分割領域が、(Li,Ti)〜(Li+Wi,Ti+H
i)の範囲であるとする。拡大縮小率(Rx,Ry)
は、(Rx,Ry)=(Wo/Wi,Ho/Hi)で求
められる。任意の出力位置(Xo,Yo)に対応する入
力位置(Xi,Yi)は、Xi=Li+(Xo−Lo)
/Rx,Yi=Ti+(Yo−To)/Ryで求められ
る。(Xo,Yo)の画素値をf(Xo,Yo)、(X
i,Yi)の画素値をg(Xi,Yi)と表現すれば、
f(Xo,Yo)=g(Xi,Yi)によって、出力画
素値が得られる。XoをLo〜Lo+Wo間、YoをT
o〜To+Ho間で1ずつ独立に動かして、(Xi,Y
i)を計算し、その画素値を得れば、出力行分割領域の
全ての画素値を得ることができる。しかし、(Xo,Y
o)が整数値の場合、(Xi,Yi)は整数値とは限ら
ないので、小数点以下を四捨五入して整数値にし、最近
傍の入力画素値を使うようにしても良い。あるいは、
(Xi,Yi)の小数点以下を切り捨てた整数値を(X
ii,Yii)とし、切り捨てられた週数点以下の値を
(Xis,Yis)とすると、f(Xo,Yo)=(1
−Yis)×((1−Xis)×g(Xii,Yii)
+Xis×g(Xii+1,Yii))+Yis×
((1−Xis)×g(Xii,Yii+1)+Xis
×g(Xii+1,Yii+1))によって、補間され
た出力画素値が得られるので、こちらを使っても良い。
一般に補間された画素値の方が滑らかである。
【0083】入力画素値g(x,y)は、入力画像格納
手段1から得られる入力画像上の位置(x,y)の画素
値から得られる。出力画素値f(x,y)は、出力画像
格納手段6の出力画像上の位置(x,y)の画素へ代入
すれば良い。
【0084】ステップS74では、現在処理している出
力行分割領域が、現在の出力行分割領域情報中の最後の
行分割領域かどうかを判断する。出力行インデックス値
が(行数−1)と等しく、出力行分割領域インデックス
値がその行の(行分割領域数−1)と等しければ、最後
の行分割領域である。もし最後ならばステップS75に
進み、最後でないならばステップS77に進む。
【0085】ステップS75では、現在処理している出
力ページ番号が最後のページかどうかを判断する。これ
は、配置決定手段4で使ったカレント出力ページ番号の
最後の値と出力ページ番号が等しければ最後のページで
あると判断できる。もし最後ならば拡大縮小配置手段5
を抜け、最後でないならばステップS76へ向かう。
【0086】ステップS76では、出力ページ番号を1
増やし、出力画像格納手段6にページ切替え信号を送
り、入力行分割領域を一つ進め、出力行インデックス値
と出力行分割領域インデックス値を0にし、結合子P7
0に進む。入力行分割領域を一つ進めるには、まず入力
行分割領域インデックス値を1増やし、もし現在の行中
の行分割領域数と等しかったら、入力行インデックス値
を1増やし、入力行分割領域インデックス値を0にす
る。ステップS77では、入力行分割領域と出力行分割
領域を一つ進め、結合子P70へ向かう。行分割領域を
一つ進めるやり方はステップS76と同様にすればよ
い。このようにして、拡大縮小配置手段5からアクセス
される出力画像は、ページごとに出力画像格納手段6に
格納される。
【0087】次に、以上の処理で得られる具体的な出力
画像を図18乃至図20を用いて説明する。図18は、
図8(a)の入力行分割領域を配置しなおしたものであ
る。横幅を入力画像の幅、拡大縮小率は2倍にしてある
ので、横幅は入力画像と変わらないが、縦幅は4倍近く
になっている。図19は、図8(b)の入力行分割領域
を配置しなおしたものである。これは横幅を入力画像の
幅、拡大縮小率は3倍にしてあるので、同様に、横幅は
入力画像と変わらないが、縦幅は9倍近くになってい
る。図20は、図8(a)の入力行分割領域を配置しな
おしたものである。横幅を入力画像の幅、拡大縮小率は
1/2倍にしてあるので、横幅は入力画像と変わらない
が、縦幅は1/4倍近くになっている。
【0088】さて、以上述べてきた処理をより具体的に
説明する。図2で説明したように、出力画像は入力画像
を表示する表示領域と同一サイズの表示画面に表示され
るものとする。
【0089】まず、最初に、従来の問題点を再度説明す
る。仮想的に、入力画像が100×100の大きさで、
表示画面も100×100の大きさとすると、倍率が2
倍の場合、出力画像は200×200の大きさになる。
入力画像DIN、出力画像DOUT、表示画像DDは、
図21に示したようになる。ここでは、表示画像DDを
見るには、スクロールバーBによる縦と横の両スクロー
ル操作が必要になり、操作性が悪い。
【0090】一方、本願発明においては、上記例におい
ては、入力画像DIN、出力画像DOUT、表示画像D
Dは、図22に示したようになる。ここでは、行分割領
域を2つにして、その分割数倍の2倍に拡大したもの
で、配置計算処理は簡単になっている。また、出力画像
の横幅または縦幅の一方を入力画像の横幅と同じにし
て、出力画像の横幅または縦幅の他方を拡大または縮小
すれば、縦スクロールまたは横スクロールの一方で済
む。つまり、出力画像が100×400、または400
×100の大きさになる。従って、縦スクロールまたは
横スクロールだけの操作で文章を読むことができ、縦と
横の両スクロールによる操作よりは操作性が向上する。
【0091】また、図22では、出力画像が1枚のペー
ジに収納される場合を示したが、通常は、入力画像と出
力画像は同一サイズの100×100の場合、縦方向の
長さが足りないので、複数ページ分の出力画像が必要と
なる。このように、出力画像もページ単位となるように
すれば、ページめくりボタンを押すだけで、ページめく
りができるため、スクロール操作よりもさらに操作が簡
単になる。出力画像を整数ページにするため、入力画像
の縦または横の寸法のいづれかの倍率を出力画像の縦ま
たは横の寸法のいづれかの整数倍とする方がページめく
り操作には望ましい。
【0092】また、入力画像の大きさが100×100
で倍率が1/2倍、出力画像の大きさが100×100
とする。この場合、入力画像を単純に1/2倍したら、
50×50になるが、出力画像は100×100なの
で、4つの入力画像で1つの出力画像ができる。出力画
像を整数ページにするため、入力画像の縦または横の寸
法のいづれかの倍率を出力画像の縦または横の寸法のい
づれかの整数分の1倍とする方がページめくり操作には
望ましい。また、この場合、行分割領域を再配置する必
要がなく処理が簡単になる。
【0093】次に、改行保存の組版処理の例を図23を
用いて説明する。図23では、各行を4分割し、1.5
倍に拡大したものである。入力画像DINの2行目の改
行が出力画像DOUTの上でも保存されている。
【0094】次に、入力画像から背景除去をする場合に
ついて図24を用いて説明する。例えば、図24(a)
のように、背景模様として、薄い斜めのストライプが入
力画像に引いてあり、その上に文字が黒で上書きされて
いるとする。この入力画像を2倍に拡大した出力画像は
図24(b)のようになり、出力画像作成時に、行分割
がうまくいかない、あるいは背景模様がうまくつながら
ないといった問題を生じる。そこで、この問題を解決す
るため、入力画像をそのまま用いるのでなく、予め背景
除去処理した入力画像を用いるのである。背景模様を除
く処理は、単純に行なうならば、例えば、背景模様は文
字などに比べて濃度が薄いと仮定して行なえば良い。ま
ず、入力画像から二値化閾値を得る。これは判別分析法
で求めても良いし、極端な場合、固定値でも良い。最も
単純な方法は、この閾値以下の画素を全て背景濃度(例
えば白など)にしてしまうことである。これらによっ
て、濃度の薄い背景模様は除去できる。このような処理
により、入力画像を図24(c)のようにしてから、図
24(d)のような出力画像を得るのである。
【0095】次に、入力画像に図・写真領域を含む場合
について説明する。この場合のブロック図は、図25に
示したようになる。図25は、図1のブロック図に、図
領域検出手段50と図拡大縮小率算出手段51とが付加
されたもので、他の符号は図1と同様であるので、説明
を省略する。
【0096】図領域検出手段50は、入力画像中の図・
写真領域を検出し、図・写真領域の情報を行分割領域抽
出手段2、図拡大縮小率算出手段51へ送る。配置決定
手段4で扱いやすくするために、行分割領域抽出手段2
では、図・写真領域も行分割領域として認識し、他の文
字に対応する行分割領域と同様に、図10と同様な形態
で格納しておく。
【0097】図拡大縮小率算出手段51は、拡大縮小情
報指定手段3から指定された出力画像の大きさと拡大縮
小率を得、図領域出検出手段50で検出した図・写真領
域を拡大または縮小した時に出力画像より大きくならな
いように制限した拡大縮小率を求め、配置決定手段4へ
送る。
【0098】次に、図領域検出手段50の動作を図26
を用いて説明する。図・写真領域を検出するのは、いわ
ゆる像域分離処理と呼ばれ、色々な方法が提案されてい
るが、以下に一例を示す。まず、ステップS90で、ま
ず入力画像を2値化し、ステップS91へ向かう。閾値
は、判別閾値で求めても良いし、画像によっては固定値
でも良い。ステップS91では、二値化された画像に対
して、ラベリングを行ない、それぞれ外接矩形を求め、
近いものは併合し、結合子P90を経て、ステップS9
2へ向かう。やり方は、行分割領域抽出手段2の処理と
同様の処理で良い。ステップS92では、全外接矩形の
中から文字領域候補を選び、結合子P91を経て、ステ
ップS93へ向かう。ステップS93では、全文字領域
候補から文字領域を選び、結合子P92を経て、ステッ
プS94へ向かう。ここで、文字候補領域から文字領域
が抽出できたので、図・写真領域を定義できるのだが、
文字領域でないものは全て図・写真領域とするか、文字
領域でも文字候補領域でもないものを図・写真領域とす
るかは判断が分かれる。もし文字領域でも文字候補領域
でもないものを図・写真領域とするならば、このステッ
プS93は必要ない。
【0099】ステップS94では、距離が近い図・写真
領域を併合し、結合子P93を経て、図領域検出手段を
終了する。図・写真領域の情報は、図10と同様の構造
で1行分の情報として格納すれば良い。
【0100】さらに、図26のステップS92を図27
を用いて詳細に説明する。ステップS100では、最初
の外接矩形領域を選択し、ステップS101へ向かう。
ステップS91で求めた外接矩形領域情報中の何番目
(0から始める)かを表す外接矩形インデックスq0を
保持しておけば良い。最初なので0に設定する。ステッ
プS101では、q0番目の矩形領域の大きさ(W6,
H6)とその縦横比が文字らしいかどうかを判定する。
次式 Twmin<W6<Twmax Thmin<H6<Thmax Trmin<W6/H6<Trmax (Twmin,Twmax,Thmin,Thmax,
Trmin,Trmaxは閾値である)を全て満たした
場合は、文字らしいと判定する。文字らしいと判断され
たら、ステップS102へ進み、文字らしくないと判定
されたら、ステップS104へ進む。
【0101】ステップS102では、外接矩形インデッ
クスq0の矩形を文字候補領域とし、区別できるよう
に、外接矩形情報中のラベリング部分の値を例えば−1
に設定して、ステップS103へ進む。ステップS10
3では、外接矩形インデックスq0が最後かどうかを判
断する。これは、情報格納領域の先頭の外接矩形数(ラ
ベリング数)と(q0+1)を比較して、同じならば最
後である。最後ならば結合子P91へ進み、最後でない
ならステップS104へ向かう。ステップS104で
は、外接矩形インデックスq0の値を1増やし、ステッ
プS101へ進む。
【0102】さらに、図26のステップS93を図28
を用いて詳細に説明する。ステップS110では、外接
矩形インデックスq1を0に設定し、ステップS111
へ進む。ステップS111では、q1の矩形が文字候補
領域ならば、ステップS112へ進み、文字候補領域で
ないならばステップS117へ進む。文字候補であるか
どうかは、ラベリング値が−1であるかどうかを見れば
分かる。
【0103】ステップS112では、外接矩形インデッ
クスq2を0に設定し、ステップS113へ進む。ステ
ップS113では、q2の矩形が文字領域か文字候補領
域で、かつq1≠q2ならばステップS114へ進み、
そうでないならばステップS118へ進む。文字領域か
どうかは、ラベリング値が−2であるかどうかを見れば
分かる。
【0104】ステップS114では、q1の矩形とq2
の矩形が、同じような大きさで、隣接しているかどうか
を調べる。隣接しているかどうかは、矩形間の距離が閾
値Tt以下かどうかで判断すれば良い。矩形間の距離
は、併合処理で定義した距離と同じで良い。同じような
大きさかどうかは、例えば、q1の矩形の大きさを(W
7,H7)、q2の矩形の大きさを(W8,H8)とす
ると、次式 abs(W7/W8−1)<Twt abs(H7/H8−1)<Tht (但し、Twt,Thtは閾値である)を全て満たすか
どうかを見れば良い。もし上記を満たす文字候補領域が
あればステップS115へ進み、なければステップS1
18へ進む。
【0105】ステップS115では、q1の矩形とq2
の矩形を共に文字領域であるとし、外接矩形情報中のラ
ベリング部分の値を−2に設定して、ステップS116
へ進む。ステップS116では、q2が最後かどうかを
判断する。これは、情報格納領域の先頭の外接矩形数
(ラベリング数)と(q2+1)を比較して、同じなら
ば最後である。最後ならばステップS117へ進み、最
後でないならステップS118へ向かう。ステップS1
17では、q1が最後かどうかを判断する。これは、情
報格納領域の先頭の外接矩形数(ラベリング数)と(q
1+1)を比較して、同じならば最後である。最後なら
ば結合子P92へ進み、最後でないならステップS11
9へ向かう。ステップS118では、q2の値を1増や
し、ステップS113へ進む。ステップS119では、
q1の値を1増やし、ステップS111へ進む。
【0106】さらに、図26のステップS94を図29
を用いて詳細に説明する。図・写真領域の定義に関して
は、ステップS93の所で述べた通りである。文字領域
以外は図・写真領域と定義するなら、ラベリング値が−
2のもの以外が図・写真領域である。文字領域以外は図
・写真領域と定義するなら、ラベリング値が−2か−1
のもの以外が図・写真領域である。ステップS120で
は、外接矩形インデックスq1を0に設定し、ステップ
S121へ進む。
【0107】ステップS121では、q1の矩形が図・
写真領域ならば、ステップS122へ進み、図・写真領
域でないならばステップS127へ進む。ステップS1
22では、外接矩形インデックスq2を0に設定し、ス
テップS123へ進む。ステップS123では、q2の
矩形が図・写真領域で、かつq1≠q2ならばステップ
S124へ進み、そうでないならばステップS128へ
進む。ステップS124では、q1の矩形とq2の矩形
が、隣接しているかどうかを調べる。隣接しているかど
うかは、矩形間の距離が閾値Tp以下かどうかで判断す
れば良い。矩形間の距離は、併合処理で定義した距離と
同じで良い。もし距離が近い図・写真領域があればステ
ップS125へ進み、なければステップS128へ進
む。
【0108】ステップS125では、q1の図・写真領
域とq2の図・写真領域を併合し、ステップS126へ
進む。併合の仕方は、まずq1とq2の外接矩形を求
め、その位置と大きさをq1の情報として更新させる。
次にq2の情報を除去するため、その後に続く矩形情報
をずらしながらコピーする。最後に先頭に格納してある
外接矩形数(ラベリング数)を1減らす。ステップS1
26では、q2が最後かどうかを判断する。これは、情
報格納領域の先頭の外接矩形数(ラベリング数)と(q
2+1)を比較して、同じならば最後である。最後なら
ばステップS127へ進み、最後でないならステップS
128へ向かう。
【0109】ステップS127では、q1が最後かどう
かを判断する。これは、情報格納領域の先頭の外接矩形
数(ラベリング数)と(q1+1)を比較して、同じな
らば最後である。最後ならば結合子P92へ進み、最後
でないならステップS129へ向かう。ステップS12
8では、q2の値を1増やし、ステップS123へ進
む。ステップS129では、q1の値を1増やし、ステ
ップS121へ進む。
【0110】次に、図25の図拡大縮小率算出手段51
についてさらに詳細に説明する。図拡大縮小率算出手段
51は、図領域検出手段50で検出した図・写真領域を
拡大縮小した時に出力画像より大きくならないように制
限した拡大縮小率を求める。指定された出力画像の大き
さや拡大縮小率は拡大縮小情報指定手段3から得られ
る。出力画像の大きさを(Wo,Ho)、上下左右のマ
ージンをMt,Mb,Ml,Mr、図・写真領域の大き
さを(Wpic,Hpic)とすると、画像幅一杯に拡
大縮小するには、横倍率Rh、縦倍率Rvは、次式 Rh=Wpic/(Wo−Ml−Mr) Rv=Hpic/(Ho−Mt−Mb) で表される。拡大指定された拡大縮小率が(Rx,R
y)であるとする。もし、縦横比が元の図・写真領域と
変わっても構わないならば、制限を行なうには、Rx<
Rhの時はRh=Rxに、Ry<Rvの時はRv=Ry
とし、図・写真領域の拡大縮小率として、(Rh,R
v)を使えば良い。もし、縦横比が元の図・写真領域と
変わらないようにするなら、制限を行なうには、次の手
順になる。
【0111】もし、Rh>RvならRm=Rv、そうで
ないなら、Rm=Rhとする。もし、Rx>RyならR
i=Ry、そうでないなら、Ri=Rxとする。もし、
Ri<RnならRn=Riとし、図・写真領域の拡大縮
小率として、(Rn,Rn)を使えば良い。得られた拡
大縮小率は、個々の図・写真領域によって異なるので、
個々の領域の情報も拡大縮小率と一緒に格納する必要が
ある。図10の個々の領域の情報、すなわち左上の座標
値と大きさに加えて、拡大縮小率の部分も加えておけば
良い。
【0112】図・写真領域の拡大縮小率は配置決定手段
4へ送られる。図・写真領域は、行分割領域抽出手段2
で行分割領域として登録されているので、配置決定手段
4では図11以下で説明した手法と同様で良い。但し、
拡大縮小率が文字領域と図・写真領域で違うので、拡大
縮小率を使う場合、それが図・写真領域かどうかを確認
し、もし図・写真領域ならば、図拡大縮小率算出手段5
1から得られた拡大縮小率を使うようにすれば良い。図
・写真領域かどうかを確認するには、行分割領域と図・
写真領域の位置と大きさとを比較して、一致すれば、注
目する行分割領域は図・写真領域であると判断すれば良
い。
【0113】以上の処理の具体例を図30に示す。図3
0では、拡大縮小情報指定手段による入力画像の倍率指
定が2倍であり、各行分割領域は2倍にされるが、その
場合、図・写真領域Pを2倍にすると、出力画像(この
場合、入力画像と同一サイズ)からはみでてしまうた
め、出力画像からはみでない倍率を計算して1.5倍に
している。図・写真領域は、通常全体が一覧できる方が
よい場合が多いので、文字領域と倍率を変更する方がよ
い。
【0114】次に、入力画像に図・写真領域を含む他の
形態の場合について説明する。この場合のブロック図
は、図31に示したようになる。図31は、図1のブロ
ック図に、図領域検出手段50と出力画像サイズ算出手
段51とが付加されたもので、他の符号は図1と同様で
あるので、説明を省略する。なお、図領域検出手段50
も、図25と同様であるので、説明を省略する。
【0115】出力画像サイズ算出手段52では、図領域
検出手段50から得られる図・写真領域の大きさを、拡
大縮小情報指定手段3から得られる拡大縮小率で拡大縮
小した大きさと、拡大縮小情報指定手段3から得られる
出力画像の大きさ(以降、旧出力画像サイズと呼ぶ)を
比較する。比較して大きい方の大きさを新しい出力画像
の大きさ(以降、新出力画像サイズと呼ぶ)とする。旧
出力画像サイズは配置決定手段4へ送られ、新出力画像
サイズは、拡大縮小配置手段5へ送られる。配置決定手
段4では、旧出力画像サイズを使って、配置計算され
る。図・写真領域は、基本的に文字の行分割領域と同様
に配置計算されるが、行頭に配置しても旧出力画像サイ
ズをはみだす場合でも、配置不可能とせず、そのまま行
頭に配置させておく。出力画像格納手段6上の出力画像
は、拡大縮小配置手段5での新出力画像サイズで作成さ
れるので、旧出力画像サイズで配置計算しても、拡大縮
小配置手段5で実際に配置される時には、出力画像から
はみだすことはない。つまり、図・写真領域は、新出力
画像サイズで拡大して再配置され、行分割領域の文字部
分は旧出力画像サイズで拡大して再配置されます。
【0116】以上の処理の具体例を図32に示す。図3
2では、拡大縮小情報指定手段による入力画像の倍率指
定が2倍であり、各行と図・写真領域Pを2倍にされて
おり、出力画像内に拡大された図・写真領域が収まるよ
うになされ、各行は、入力画像と同一幅で再配置されて
いる。従って、この場合、図・写真領域を見る場合、縦
横の両スクロール操作が必要となりますが、文章は縦方
向のスクロール操作で済みます。
【0117】次に、本を本文領域と周辺領域とに分けて
処理する形態の場合について説明する。この場合のブロ
ック図は、図33に示したようになる。図33は、図2
5のブロック図に、本体周辺領域検出手段53が付加さ
れたもので、他の符号は図25と同様であるので、説明
を省略する。
【0118】本体周辺領域検出手段53は、行分割領域
抽出手段2と図領域検出手段50から得られる情報か
ら、本体(本文)領域と周辺領域を検出する。この検出
は、位置で判断する方法が簡単である。すなわち、入力
画像中の上下端や隅に位置するものは、ページ番号や章
タイトルなどであるとみなして、周辺領域としてしま
う。上下端の判別は、例えば、上下端から大きさで10
%の範囲に領域が収まるものは、上下端に位置すると判
断する。隅の場合は、さらに横方向に関しても、端から
10%に収まるかどうかを判別する。また、1枚の入力
画像からだけでは判別しにくいこともあるので、複数の
入力画像を処理する場合は、前の入力画像の処理結果を
記録しておいて、それと照らし合わせて周辺領域を検出
してもよい。例えば、前の入力画像の行分割領域や図・
写真領域の位置、大きさを記録しておき、次の入力画像
の行分割領域、図・写真領域の位置、大きさと比較す
る。もし、位置や大きさがほとんど変わらない領域があ
り、かつ、それが中心近くでないならば、周辺領域と判
断できる。例えば、位置のずれがTp画素以内、大きさ
の差がTr3%以内、位置が周辺からTr4%以内であ
れば周辺領域と判断する(Tp,Tr3,Tr4は閾
値)。
【0119】本体周辺領域検出手段53で得られた情報
は配置決定手段4へ送られる。配置決定手段4では、本
体周辺領域検出手段53で周辺と判断された領域は、本
体領域の配置とは別にする。周辺領域は、ページ番号や
章タイトルなどであり、ページ中の相対位置は変わらな
いようにする。例えば、位置(X9,Y9)、大きさ
(W9,H9)の周辺領域があったとし、入力画像の大
きさ(Win,Hin)、出力画像の大きさが(Wo,
Ho)、拡大縮小率(Rx,Ry)とすると、出力位置
(X10,Y10)は、X10=(Wo−X9×Rx)
×(X9/(Win−W9)),Y10=(Ho−Y9
×Ry)×(Y9/(Hin−H9))で表される。つ
まり、本体領域と本体周辺領域とを区別せずに拡大縮小
を行うと、周辺領域にあるページ番号等が予期せぬ領域
に現れてしまうという不具合をなくすためである。
【0120】以上の処理の具体例を図34に示す。図3
4では、拡大縮小情報指定手段による入力画像の倍率指
定が2倍であり、2分割された各行が本体領域であり、
「13」というページ番号は周辺領域である。ここで
は、本体領域は再配置されるが、周辺領域は本体領域と
の相対的な位置関係を変化させずに倍率を2倍にしてい
る。なお、周辺領域は本体領域と異なる倍率でも構わな
い。また、図2の切替え手段101は、本来、入力画像
全体を一覧したい場合などに切替えるものだが、行分割
処理、再配置処理などが誤っていた時にも、入力画像に
切替えることで、誤りを容易にカバーすることができ
る。
【0121】また、入力画像の大きさと拡大縮小率の積
が出力画像の大きさの小整数分の小整数となる時、効率
良い再配置計算を単純にできる利点がある。この分数の
分母は、出力画像上の1行中の固定幅行分割領域数を、
分子は入力画像上の1行中の固定幅行分割領域数を表
す。単なる整数でなく、小整数としたのは、数が大きい
とそれだけの数の行分割領域が作れるとは限らないの
と、行分割領域数が少ない方が再配置計算が単純になる
からである。行分割領域を固定幅にしているのも、再配
置計算が単純になるからである。
【0122】例えば、図34のように、入力画像と出力
画像の横幅が同じで拡大縮小率が2の時、小整数分の小
整数の分母は1で分子が2なので、出力画像上の1行中
の固定幅行分割領域数は1個で、入力画像上の1行中の
固定幅行分割領域が2個となる。つまり、入力画像と出
力画像との行分割領域の数を分数で表現した倍率に対応
させれば、再配置計算が単純になる。次に、図38のよ
うに、入力画像と出力画像の横幅が同じで拡大縮小率が
2/3の時、小整数分の小整数の分母は3で分子が2な
ので、出力画像上の1行中の固定幅行分割領域数は3個
で、入力画像上の1行中の固定幅行分割領域が2個とな
る。従って、入力画像上の1行中の固定幅行分割領域を
2個とり、出力画像の1行ごとに3個ずつ再配置でき
る。
【0123】〔実施の形態2〕実施の形態1では、原則
として入力画像をページごとに処理していたが、本実施
の形態では、入力画像を複数ページで処理する。本実施
の形態に係るブロック図を図35に示す。図35におい
て、図1と同一符号については同様であるので説明を省
略する。また、本装置の外観も図2と同様のため、説明
は省略する。
【0124】本体領域検出手段60は、入力画像中の本
体領域を抽出する。本体領域の抽出は、図33で説明し
たのと同様の手法で、周辺領域を抽出し、その残りを本
体領域とすればよい。但し、行分割領域まで使わなくて
も、行領域だけでも本体領域を求めることはできるの
で、その部分を省いて実現することもできる。本体領域
は、一つの矩形として表され、左上位置と大きさで表現
される。
【0125】拡大率算定手段62は、本体領域抽出手段
60から得られた本体領域の情報が、入力画像と同じ大
きさになるように拡大率を求める。入力画像の大きさを
W10×H10、本体領域が位置(X11,Y11)、
大きさが(W11,H11)とする。横の拡大率Rx
は、Rx=W11/W10、縦の拡大率Ryは、Ry=
H11/H10で表される。RxとRyの値の小さい方
を拡大率Raとする。求めた拡大率Raは、拡大率共通
化手段62へ送られる。
【0126】拡大率共通化手段62では、拡大率算定手
段61から得られた複数の入力画像の拡大率から共通の
拡大率を算出する。これは得られた拡大率を配列の形で
格納しておき、平均値もしくはメジアン値などで共通拡
大率を得れば良い。平均値もしくはメジアン値などを計
算する時、すべての入力画像の拡大率を使ってもよい
し、過去数枚分の入力画像の拡大率だけを使っても良
い。最初の数枚の画像では、サンプル数が少ないので、
平均値などが安定しないことがある。その場合、一定枚
数だけ入力画像を予め処理して拡大率を求めて、サンプ
ル数を増やしておき、その後、1枚目から改めて処理す
るようにすると、共通拡大率が安定する利点がある。得
られた共通拡大率は、拡大手段63へ送られる。
【0127】拡大手段63では、拡大率共通化手段62
から得られた共通拡大率で、本体領域検出手段60から
得られた本体領域を拡大して、出力画像に出力する。拡
大は、図17のステップS73の説明と同様にして実現
できる。
【0128】このように拡大率を共通化する利点につい
て図36で説明する。図36は、本文領域の拡大率を合
わせずに出力画像一杯に出力した結果であり、図36
(a)は1.4倍、図36(b)は1.9倍に拡大され
ている。入力画像中でほぼ同じ大きさの文字が出力画像
中で異なる大きさになると、本の各ページの文字が異な
る大きさになり、非常に読みにくいものになってしま
う。そこで、上述した処理を行うことにより、図37の
ように出力画像が得られるようになり、どの出力画像で
も、同じ大きさの文字になっているため、違和感なく本
をよむことができる。
【0129】また、ここでは入力画像中の本文領域のみ
を拡大処理して出力画像に出力して表示しているが、入
力画像全体を求めた拡大率で拡大処理して出力画像に表
示し、拡大した本文領域が表示画面上にちょうど収まる
ような位置に上下左右のスクロール位置を調整して表示
しても良い。この場合、実装上は、単なる拡大表示と組
み合わすだけで良く、また、仮に本文領域抽出処理など
が誤っていたとしても、スクロール位置を調整したり、
拡大率を調整したりすることで、誤りを容易にカバーす
ることができる。また、図2の切替え手段101は、本
来、入力画像全体を一覧したい場合などに切替えるもの
だが、行分割処理、再配置処理などが誤っていた時に
も、入力画像に切替えることで、誤りを容易にカバーす
ることができる。
【0130】以上、各実施の形態について説明してきた
が、行分割領域の再配置を事前に実行してうまく再配置
できないときに、その再配置を停止したり、ユーザに警
告したり、再配置のヒントを与えたりしてもよい。ま
た、拡大縮小した文字のフォントをスムージングしても
よい。
【0131】以上説明した各実施の形態での処理は、プ
ログラムにより実行されるが、このプログラムの全部ま
たは一部を、直接あるいは通信回線を介してフロッピー
ディスクやハードディスク等のコンピュータ読み取り可
能な記録媒体に予め格納しておき、必要に応じてインス
トールして用いてもよい。
【0132】
【発明の効果】請求項1に記載の発明によれば、画像デ
ータである入力画像の行領域を複数に分割した行分割領
域を単位に拡大または縮小するため、入力画像中の文章
の順番を崩さず、拡大または縮小された文章を出力画像
領域を有効に利用して再配置することができる。
【0133】また、出力画像を本装置の表示の際に一方
向のみとなるように設定しておけば、スクロール操作も
一方向のみでよく、操作性が向上する。
【0134】請求項2に記載の発明によれば、再配置の
最小単位として使う行分割領域を文字領域を使って作る
ことで再配置の際に文字を分断してしまったりすること
を防ぎ、また行分割領域の再配置を柔軟にし、空白の少
ない再配置を行なえる。
【0135】請求項3に記載の発明によれば、再配置し
て出力画像内に収まらない場合は、連続する別の出力画
像に分けて出力できる。この場合、出力画像が所定単位
で記憶されているため、所定単位ごとの出力画像の切り
替え操作により、表示内容を見ることができ、操作性が
向上する。
【0136】請求項4に記載の発明によれば、1行その
ままを行分割領域として扱ったり、1行を設定された倍
率の整数等分するだけで行分割領域として扱え、行分割
領域の抽出処理が簡単になり、また、再配置処理が簡単
になる。
【0137】請求項5に記載の発明によれば、組版処理
を入れることで、入力画像中の文書構造を崩さずにで
き、禁則処理によって禁則文字が行頭に来ることを防
げ、行末単語の分割や接続処理によって再配置後も自然
な文章とできる。
【0138】請求項6に記載の発明によれば、入力画像
中の背景画像を除去して処理することで、薄い背景模様
などがある入力画像を再配置しても、背景の不連続など
が現れることを防ぐことができる。
【0139】請求項7に記載の発明によれば、入力画像
と出力画像とを表示する際にその表示画面の大きさを変
えずに一定にしているので、所定単位ごとの出力画像の
切り替え操作で表示内容を見ることができ、表示画面の
サイズが変わらないため見やすくできる。
【0140】請求項8に記載の発明によれば、図・写真
領域を拡大または縮小した画像が出力画像より大きくな
らないようにできるので、行分割領域の倍率を図・写真
領域の倍率と独立に設定でき、行分割領域を所望の倍率
にて拡大または縮小できるようになる。
【0141】請求項9に記載の発明によれば、図・写真
領域を拡大または縮小した画像に応じた出力画像にでき
るので、図・写真領域の倍率指定に自由度が増える。ま
た、文字のある行分割領域を見る時は一方向のスクロー
ル操作で済み、図・写真領域を見る時は、異なる方向の
スクロール操作となる。
【0142】請求項10に記載の発明によれば、例え
ば、1つのページの入力画像が複数ページの出力画像に
分かれた時、周辺領域にあるページ番号や章タイトル名
などを出力画像の各ページにそれぞれ配置せずにまとめ
ることができ、ページ番号や章タイトルの重複を防ぐこ
とができ、複数のページの入力画像が1つのページの出
力画像になった時、例えばページ番号や章タイトル名な
どをページごとに保持することができる。
【0143】請求項11に記載の発明によれば、本体領
域を出力画像一杯になるように拡大率を計算し、複数の
入力画像間で拡大率を平均化することで、多少のレイア
ウトの変更があっても、ページ間で拡大率が急激に変化
することを防ぐことができ、拡大画像を見る時に違和感
を減らすことができる。
【0144】請求項12に記載の発明によれば、入力画
像で内容を確認できるため、出力画像作成時のミスを早
期に見つけることができ、操作性が向上する。
【図面の簡単な説明】
【図1】実施の形態1に係る要部ブロック図である。
【図2】実施の形態に係る表示装置の外観図である。
【図3】図1の行分割領域抽出手段2の動作を説明する
フローチャートである。
【図4】画像の縦軸、横軸への投影結果である。
【図5】画像中の文字列が縦行かどうかを判断するフロ
ーチャートである。
【図6】図4の一番上の横行の画像と横軸への投影結果
である。
【図7】矩形に関する情報の格納の様子を模式的に説明
する図である。
【図8】図4の画像の各行を分割する例を示した図であ
る。
【図9】外接矩形領域とその併合処理を説明するための
図である。
【図10】行分割領域の情報の格納の様子を模式的に説
明する図である。
【図11】図1の配置決定手段4の動作を説明するフロ
ーチャートである。
【図12】図11のステップS21の詳細を説明するフ
ローチャートである。
【図13】図12のステップS30の詳細を説明フロー
チャートである。
【図14】図11のステップS27の詳細を説明するフ
ローチャートである。
【図15】図11のステップS23の縦位置を求める詳
細を説明するフローチャートである。
【図16】図11のステップS23の横位置を求める詳
細を説明するフローチャートである。
【図17】図1の拡大縮小配置手段5の動作を説明する
フローチャートである。
【図18】図8(a)からの出力画像例である。
【図19】図8(b)からの出力画像例である。
【図20】図8(a)からの他の出力画像例である。
【図21】単純に画像を拡大した場合の問題点を説明す
るための図である。
【図22】入力画像と得られる出力画像との関係を示す
図である。
【図23】組版処理の例である。
【図24】背景除去処理の例である。
【図25】実施の形態1に係る他の要部ブロック図であ
る。
【図26】図領域検出手段50の動作を説明するフロー
チャートである。
【図27】図26のステップS92の詳細を説明するフ
ローチャートである。
【図28】図26のステップS93の詳細を説明するフ
ローチャートである。
【図29】図26のステップS94の詳細を説明するフ
ローチャートである。
【図30】図25の構成により得られる入力画像と出力
画像との関係を示す図である。
【図31】実施の形態1に係るさらに他の要部ブロック
図である。
【図32】図31の構成により得られる入力画像と出力
画像との関係を示す図である。
【図33】実施の形態1に係るさらに別の要部ブロック
図である。
【図34】図33の構成により得られる入力画像と出力
画像との関係を示す図である。
【図35】実施の形態2に係る要部ブロック図である。
【図36】図35の構成を取らなかった場合の問題点を
説明するための図である。
【図37】図35の構成により得られる入力画像と出力
画像との関係を示す図である。
【図38】再配置の計算が簡単になるのを説明するため
の図である。
【符号の説明】
1 入力画像格納手段 2 行分割領域抽出手段 3 拡大縮小情報指定手段 4 配置決定手段(処理手段) 5 拡大縮小配置手段(処理手段) 6 出力画像格納手段

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 所定単位で記憶された入力画像を拡大ま
    たは縮小して出力画像上に再配置して表示する画像表示
    装置であって、 上記入力画像中の行領域を行方向に複数分割した行分割
    領域を抽出する行分割領域抽出手段と、 上記抽出された行分割領域を単位として、行分割領域の
    並び順を保持したまま拡大または縮小し、上記出力画像
    上に再配置する処理手段と、を有することを特徴とする
    画像表示装置。
  2. 【請求項2】 上記行分割領域抽出手段が抽出した行分
    割領域は、文字領域であることを特徴とする請求項1に
    記載の画像表示装置。
  3. 【請求項3】 上記出力画像は所定単位で記憶され、上
    記入力画像は順次拡大または縮小されて、上記出力画像
    に再配置した時に再配置できない行分割領域を上記出力
    画像に連続する他の出力画像に再配置することを特徴と
    する請求項1に記載の画像表示装置。
  4. 【請求項4】 上記入力画像の縦あるいは横方向の少な
    くとも一方の寸法と拡大または縮小の倍率との積が、上
    記出力画像の縦あるいは横方向の少なくとも一方の寸法
    の小整数分の小整数倍になるように設定されていること
    を特徴とする請求項1に記載の画像表示装置。
  5. 【請求項5】 上記処理手段は、組版処理を入れて再配
    置することを特徴とする請求項1に記載の画像表示装
    置。
  6. 【請求項6】 上記入力画像は、背景画像を除去されて
    いることを特徴とする請求項1に記載の画像表示装置。
  7. 【請求項7】 表示の際の上記入力画像の所定単位と上
    記出力画像の所定単位とが等しいことを特徴とする請求
    項1に記載の画像表示装置。
  8. 【請求項8】 上記入力画像から図・写真領域を検出す
    る図領域検出手段と、検出した図・写真領域を行分割領
    域と同一の倍率で拡大または縮小された時に上記出力画
    像より大きくならないように制限した倍率を求める図拡
    大縮小率算出手段と、を有し、 上記処理手段は、上記制限された倍率で拡大または縮小
    された図・写真領域が拡大または縮小された行分割領域
    と重ならないように上記出力画像上に再配置することを
    特徴とする請求項1に記載の画像表示装置。
  9. 【請求項9】 上記入力画像から図・写真領域を検出す
    る図領域検出手段と、検出した図・写真領域を拡大また
    は縮小した時に上記出力画像より大きくなる時に、検出
    した図・写真領域を拡大または縮小された時の大きさが
    収まるよう上記出力画像の大きさを新たに設定する出力
    画像サイズ算出手段を有し、 上記処理手段は、新たに設定された出力画像上に拡大ま
    たは縮小された図・写真領域と拡大または縮小された行
    分割領域とが重ならないように上記出力画像上に再配置
    することを特徴とする請求項1に記載の画像表示装置。
  10. 【請求項10】 上記入力画像から本体領域と周辺領域
    を検出する本体周辺領域検出手段を有し、 上記処理手段は、上記入力画像での本体領域と周辺領域
    との相対位置と上記出力画像での本体領域と周辺領域と
    の相対位置とが変わらないように、上記本体領域と周辺
    領域とを再配置することを特徴とする請求項1に記載の
    画像表示装置。
  11. 【請求項11】 所定単位で記憶された入力画像を拡大
    して出力画像上に再配置して表示する画像表示装置であ
    って、 上記入力画像から本体領域を抽出する本体領域抽出手段
    と、 抽出された本体領域が上記出力画像と同じ大きさになる
    ように拡大率を求める拡大率算定手段と、 複数の上記入力画像で求めた拡大率から共通の拡大率を
    算出する拡大率共通化手段と、 上記入力画像を共通の拡大率で拡大し、上記出力画像上
    に出力する処理手段と、を有することを特徴とする画像
    表示装置。
  12. 【請求項12】 上記入力画像と上記出力画像との表示
    切替えを指示する切替え手段を有することを特徴とする
    請求項1または請求項11のいづれかに記載の画像表示
    装置。
JP10338654A 1998-11-30 1998-11-30 画像表示装置 Pending JP2000163044A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP10338654A JP2000163044A (ja) 1998-11-30 1998-11-30 画像表示装置
KR10-2001-7006689A KR100396728B1 (ko) 1998-11-30 1999-11-25 화상 표시 장치
US09/857,398 US6720965B1 (en) 1998-11-30 1999-11-25 Image display device
CNB998138363A CN1167043C (zh) 1998-11-30 1999-11-25 图像显示设备
PCT/JP1999/006561 WO2000033289A1 (fr) 1998-11-30 1999-11-25 Afficheur d'images
EP99973155.7A EP1136980A4 (en) 1998-11-30 1999-11-25 IMAGE DISPLAY DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10338654A JP2000163044A (ja) 1998-11-30 1998-11-30 画像表示装置

Publications (1)

Publication Number Publication Date
JP2000163044A true JP2000163044A (ja) 2000-06-16

Family

ID=18320221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10338654A Pending JP2000163044A (ja) 1998-11-30 1998-11-30 画像表示装置

Country Status (6)

Country Link
US (1) US6720965B1 (ja)
EP (1) EP1136980A4 (ja)
JP (1) JP2000163044A (ja)
KR (1) KR100396728B1 (ja)
CN (1) CN1167043C (ja)
WO (1) WO2000033289A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199919A (ja) * 2006-01-25 2007-08-09 Infocity Inc 画像処理装置および方法
JP2009153067A (ja) * 2007-12-21 2009-07-09 Canon Inc 画像処理方法及び画像処理装置
US7853873B2 (en) 2005-06-30 2010-12-14 Canon Kabushiki Kaisha Data processing apparatus, data processing method, and computer program for generating electronic data from a paper document
JP2012083500A (ja) * 2010-10-08 2012-04-26 Canon Inc 表示制御装置及び表示制御方法、プログラム、並びに記憶媒体
US8275203B2 (en) 2007-12-21 2012-09-25 Canon Kabushiki Kaisha Sheet music processing method and image processing apparatus
JP2013114266A (ja) * 2011-11-24 2013-06-10 Sharp Corp 表示制御装置、表示方法、制御プログラム、および記録媒体
JP2014092824A (ja) * 2012-10-31 2014-05-19 Dainippon Printing Co Ltd 表示制御装置及びプログラム
JP2015142263A (ja) * 2014-01-29 2015-08-03 シャープ株式会社 画像処理装置及び画像形成装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4454789B2 (ja) * 1999-05-13 2010-04-21 キヤノン株式会社 帳票分類方法及び装置
KR20040069865A (ko) * 2003-01-30 2004-08-06 삼성전자주식회사 영상화면 내의 글자영역 확장장치 및 방법
KR20040076649A (ko) * 2003-02-26 2004-09-03 삼성전자주식회사 종횡비별 브라우저 그래픽 표시 장치 및 방법
JP4079366B2 (ja) * 2003-06-10 2008-04-23 シャープ株式会社 文字発生装置、文字発生方法、文字発生プログラムおよび記憶媒体
JP4242796B2 (ja) * 2004-03-12 2009-03-25 パナソニック株式会社 画像認識方法及び画像認識装置
US7664751B2 (en) * 2004-09-30 2010-02-16 Google Inc. Variable user interface based on document access privileges
US7603355B2 (en) 2004-10-01 2009-10-13 Google Inc. Variably controlling access to content
JP2006163651A (ja) * 2004-12-03 2006-06-22 Sony Computer Entertainment Inc 表示装置、表示装置の制御方法、プログラム及びフォントデータ
JP4720529B2 (ja) * 2005-03-10 2011-07-13 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
KR100735262B1 (ko) * 2005-12-29 2007-07-03 삼성전자주식회사 휴대단말기의 자동표시방법
JP2007256529A (ja) * 2006-03-22 2007-10-04 Ricoh Co Ltd 文書画像表示装置、情報処理装置、文書画像表示方法、情報処理方法、文書画像表示プログラム、記録媒体及びデータ構造
KR100787977B1 (ko) * 2006-03-30 2007-12-24 삼성전자주식회사 이동 단말기에서 사용자 데이터 크기 조절 장치 및 방법
JP4956202B2 (ja) * 2007-01-16 2012-06-20 キヤノン株式会社 情報処理装置及び情報処理方法及びプログラム
US20090025066A1 (en) * 2007-07-17 2009-01-22 Protectia Corporation Systems and methods for first and second party authentication
US8238662B2 (en) * 2007-07-17 2012-08-07 Smart Technologies Ulc Method for manipulating regions of a digital image
CN101471064B (zh) * 2007-12-24 2012-01-18 康佳集团股份有限公司 一种显示装置图象连续缩放的方法及其系统
CN102111661B (zh) * 2009-12-29 2014-12-24 康佳集团股份有限公司 一种机顶盒逐行解压显示图片的方法
CN101783900A (zh) * 2010-03-10 2010-07-21 华为终端有限公司 一种图像分区缩放的方法和装置
JP5743443B2 (ja) * 2010-07-08 2015-07-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
CN102982326B (zh) * 2011-09-02 2016-05-25 汉王科技股份有限公司 文字处理方法、装置和电子翻译笔
US9489121B2 (en) * 2011-11-02 2016-11-08 Microsoft Technology Licensing, Llc Optimal display and zoom of objects and text in a document
US8855427B2 (en) 2011-12-16 2014-10-07 Harris Corporation Systems and methods for efficiently and accurately detecting changes in spatial feature data
US8755606B2 (en) 2011-12-16 2014-06-17 Harris Corporation Systems and methods for efficient feature extraction accuracy using imperfect extractors
US8832593B2 (en) * 2011-12-16 2014-09-09 Harris Corporation Systems and methods for efficient spatial feature analysis
US10257525B2 (en) * 2016-10-31 2019-04-09 Futurewei Technologies, Inc. Image storage and reconstruction based on sub-images
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
KR102570760B1 (ko) * 2018-12-12 2023-08-25 삼성전자주식회사 고전압 센싱 회로, 이를 포함하는 디스플레이 구동 집적 회로 및 디스플레이 장치
CN110109546A (zh) * 2019-05-05 2019-08-09 南京信息职业技术学院 一种基于视力强弱的字符缩放装置及方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JP2635311B2 (ja) 1986-03-31 1997-07-30 キヤノン 株式会社 文書処理装置
JP2667435B2 (ja) * 1987-05-01 1997-10-27 株式会社リコー 領域抽出方法
US4939670A (en) * 1988-11-18 1990-07-03 Unisys Corporation PC driven print file utilities for mainframe computer printing
JP3016515B2 (ja) * 1989-01-31 2000-03-06 キヤノン株式会社 文字処理装置および方法
JPH0378020A (ja) 1989-08-22 1991-04-03 Nec Corp 情報処理装置
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
JP3244768B2 (ja) 1992-05-18 2002-01-07 株式会社リコー 画像方向指定機能付き複写機
JPH06309468A (ja) 1993-04-20 1994-11-04 Yokogawa Electric Corp データ表示装置
US5774110A (en) * 1994-01-04 1998-06-30 Edelson; Steven D. Filter RAMDAC with hardware 11/2-D zoom function
JP3400151B2 (ja) * 1994-12-08 2003-04-28 株式会社東芝 文字列領域抽出装置および方法
JP3476595B2 (ja) 1995-06-26 2003-12-10 シャープ株式会社 画像領域分割方法、および画像2値化方法
JP3354754B2 (ja) * 1995-07-10 2002-12-09 大日本スクリーン製造株式会社 カーニング処理方法
US6367080B1 (en) 1996-08-02 2002-04-02 Sanyo Electric Co., Ltd. Internet information displaying apparatus
JPH1051701A (ja) 1996-08-02 1998-02-20 Sanyo Electric Co Ltd インターネットテレビジョン
JPH10193735A (ja) 1996-12-28 1998-07-28 Casio Comput Co Ltd イメージデータ出力方法、イメージデータ出力装置、及び記憶媒体
JPH10207887A (ja) 1997-01-08 1998-08-07 Kano Densan Hongkong Yugenkoshi 電子メール表示方法および装置
JPH1125222A (ja) * 1997-07-08 1999-01-29 Sharp Corp 文字切り出し方法及び文字切り出し装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7853873B2 (en) 2005-06-30 2010-12-14 Canon Kabushiki Kaisha Data processing apparatus, data processing method, and computer program for generating electronic data from a paper document
JP2007199919A (ja) * 2006-01-25 2007-08-09 Infocity Inc 画像処理装置および方法
JP2009153067A (ja) * 2007-12-21 2009-07-09 Canon Inc 画像処理方法及び画像処理装置
US8275203B2 (en) 2007-12-21 2012-09-25 Canon Kabushiki Kaisha Sheet music processing method and image processing apparatus
US8514443B2 (en) 2007-12-21 2013-08-20 Canon Kabushiki Kaisha Sheet music editing method and image processing apparatus
JP2012083500A (ja) * 2010-10-08 2012-04-26 Canon Inc 表示制御装置及び表示制御方法、プログラム、並びに記憶媒体
JP2013114266A (ja) * 2011-11-24 2013-06-10 Sharp Corp 表示制御装置、表示方法、制御プログラム、および記録媒体
JP2014092824A (ja) * 2012-10-31 2014-05-19 Dainippon Printing Co Ltd 表示制御装置及びプログラム
JP2015142263A (ja) * 2014-01-29 2015-08-03 シャープ株式会社 画像処理装置及び画像形成装置

Also Published As

Publication number Publication date
EP1136980A1 (en) 2001-09-26
CN1167043C (zh) 2004-09-15
US6720965B1 (en) 2004-04-13
CN1328677A (zh) 2001-12-26
EP1136980A4 (en) 2013-05-08
KR100396728B1 (ko) 2003-09-02
KR20020003855A (ko) 2002-01-15
WO2000033289A1 (fr) 2000-06-08

Similar Documents

Publication Publication Date Title
JP2000163044A (ja) 画像表示装置
US5943679A (en) Multi-page document viewer having a focus image and recursively nested images of varying resolutions less than the resolution of the focus image
US8117565B2 (en) Digital image magnification for internet appliance
JP5376795B2 (ja) 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
US8302029B2 (en) Presentation of large objects on small displays
US7930634B2 (en) Document display apparatus and document display program
US4785296A (en) Method and system for displaying image data
US8745515B2 (en) Presentation of large pages on small displays
US5933843A (en) Document processing apparatus displaying and processing a plurality of successive contiguous pages of the same document in overlapping windows
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
EP0690415B1 (en) Editing scanned document images using simple interpretations
CN1007937B (zh) 显示处理器
US5334994A (en) Image display device having multi-window system
US20020080152A1 (en) Event-for-change oriented information display method and information processing system using the same method
JPS6075873A (ja) 表示装置
JP6322086B2 (ja) 表示制御装置、表示装置、プログラム、記録媒体
JP4094512B2 (ja) 画面スクロール制御装置
US5795048A (en) Over head projector apparatus and control method
JP3993025B2 (ja) 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
JP4741916B2 (ja) 画像処理装置、画像処理方法及び該方法を実行するための画像処理プログラムを格納したコンピュータ読み取り可能な記録媒体
JP3257116B2 (ja) 電子ファイリングシステム
JPH0521266B2 (ja)
WO1998022910A1 (en) Method of and apparatus for displaying an image of a document on a display
JPH10112834A (ja) 映像検索方法および装置
JPH0465758A (ja) 文書処理装置における文章表示方式

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041210

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051122