JP4035228B2 - 画像処理方法及び画像処理装置 - Google Patents
画像処理方法及び画像処理装置 Download PDFInfo
- Publication number
- JP4035228B2 JP4035228B2 JP12784698A JP12784698A JP4035228B2 JP 4035228 B2 JP4035228 B2 JP 4035228B2 JP 12784698 A JP12784698 A JP 12784698A JP 12784698 A JP12784698 A JP 12784698A JP 4035228 B2 JP4035228 B2 JP 4035228B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- display
- dividing
- page
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3872—Repositioning or masking
- H04N1/3873—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
- H04N1/3875—Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming combined with enlarging or reducing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は画像処理装置及び画像処理方法に関し、特に、画像の属性を識別可能な画像処理装置及び画像処理方法に関するものである。
【0002】
【従来の技術】
従来、入力した画像に対し処理を加えて出力する画像処理装置において、処理対象画像が属性の異なる複数の画像領域の集合である場合でも、入力された画像領域の配置のまま出力することが一般的であった。
【0003】
例えば、入力した文書画像を表示する画像処理装置においては、その表示方法は入力した文書画像の中から1ページをそのまま表示器に表示する、あるいは、各ページを縮小処理し、表示器に複数のページを表示するサムネイル表示などの方法がある。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の技術において、出力した画像中に望まない属性を有する画像領域が含まれることがあった。
【0005】
例えば、文書画像を縮小処理して表示した場合、文書内に書かれた文字が非常に小さくなるため、読むことが不可能となる。従って、文書が読める大きさまで画像を拡大する必要があるが、この場合、文書全体が表示器に収まらない可能性があり、この時操作者は文書画像を上下左右に動かすことにより文書内の所望の位置を表示する必要があった。
【0006】
また、その文書画像に写真、図、表等が含まれている場合、文のみを必要とする操作者にとっては表示に無駄が生じるという問題点があった。
【0007】
更に、プリンタから出力を行う場合に、ページ内の文のみが必要であるにもかかわらず、そのページに写真や図などが含まれることにより、出力に時間がかかると言った問題も生じていた。
【0008】
本発明は上記従来技術の課題を解決するためになされたもので、その目的とするところは、効率のよい画像出力を行うことのできる画像処理装置及び画像処理方法を提供することにある。
【0009】
【課題を解決するための手段】
上記目的を達成するため、本発明に係る画像処理方法にあっては、領域の属性に基づいて、画像を複数の画像領域に分割する分割工程と、前記分割工程で分割された複数の画像領域のうち、操作者により指定された属性を有する画像領域を抽出する抽出工程と、前記抽出工程で抽出された複数の画像領域を表示するように制御する第1表示工程と、前記第1表示工程で表示された複数の画像領域の中から操作者により選択指示された画像領域を選択する選択工程と、前記選択工程で選択された画像領域を含む前記分割工程で分割される前の画像を表示するように制御する第2表示工程と、を有することを特徴とする。
【0010】
上記目的を達成するため、本発明に係る画像処理装置にあっては、領域の属性に基づいて、画像を複数の画像領域に分割する分割手段と、前記分割手段で分割された複数の画像領域のうち、操作者により指定された属性を有する画像領域を抽出する抽出手段と、前記抽出手段で抽出された複数の画像領域を表示するように制御する第1表示手段と、前記第1表示手段で表示された複数の画像領域の中から操作者により選択指示された画像領域を選択する選択手段と、前記選択手段で選択された画像領域を含む前記分割手段で分割される前の画像を表示するように制御する第2表示手段と、を有することを特徴とする。
【0011】
上記目的を達成するため、本発明に係るコンピュータ可読記憶媒体にあっては、領域の属性に基づいて、画像を複数の画像領域に分割する分割工程と、前記分割工程で分割された複数の画像領域のうち、操作者により指定された属性を有する画像領域を抽出する抽出工程と、前記抽出工程で抽出された複数の画像領域を表示するように制御する表示工程と、前記表示工程で表示された複数の画像領域の中から操作者により選択指示された画像領域を選択する選択工程と、前記選択工程で選択された画像領域を含む前記分割工程で分割される前の画像を表示するように制御する第2の表示工程と、の各工程をコンピュータに実行させるためのプログラムコードを格納する。
【0012】
【発明の実施の形態】
以下に図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。ただし、この実施の形態に記載されている構成要素、プログラムモジュール等の相対配置、解像度等の数値などについては特に特定的な記載がない限りは、本発明の範囲をそれらのみに限定する趣旨のものではない。
【0013】
[第1の実施の形態]
図1から図10を用いて本発明の第1の実施の形態に係る画像処理装置について説明する。本実施の形態に係る画像処理装置は、読込んだ原稿画像を、検索用の情報と共に光磁気ディスクに格納し、また、光磁気ディスクに格納された画像データを検索情報を元に読み出して表示、印刷出力を行うものである。この際、画像中の文字領域のみ抽出して出力可能である点をその特徴とする。
【0014】
図1は本実施の形態に係る画像処理装置の全体構成を示すブロック図、図2は本装置の読み取り手段の光学系及び駆動系の概略構成を示す断面図、図3は本装置の外観図である。
【0015】
図1において、10はCPUとしてのマイクロプロセッサ、11はCPUの作動プログラムを記録しているROM、12はCPUのワークエリア及び光磁気ディスク記憶装置からのデータやプログラムのロードエリアを含むRAM、15はシステムバス30に接続した計時ユニット、16はキーボード7とシステムバス30を接続するキーボードインターフェース回路、17は他のコンピュータ等と接続し画像データを入出力するための通信用インターフェース回路、50は液晶ディスプレイ32、LBP31、テキストRAM14、グラフィックRAM13、システムバス30等の間でのデータの流れを制御するデータフローコントローラ、18は画像読取装置の駆動系19とシステムバス30を接続する駆動系インターフェース回路、111aは原稿の一方の面を読み取るCCD(チャンネルA)、111bは原稿の他方の面を読み取るCCD(チャンネルB)、20a,20bはアンプ、36はチャンネルAの画像信号とチャンネルBの画像信号を合成する合成部、21はCCDの画像信号をデジタル信号に変換するA/D変換部、22は画像信号の濃度、コントラストを調整する画像処理部、23は画像処理部の出力信号を2値の画像データに変換する2値化回路、28は2値化された画像データを蓄積し、画像解析を行う画像解析メモリである。
【0016】
さらに、34はファンクションキー、24は画像解析メモリ上のビットマップ画像データを圧縮する圧縮部、25は圧縮画像データを伸長する伸長部、33a,33bは圧縮データを蓄積する圧縮データバッファである。また、27は、光磁気ディスク35を読取るための光磁気ディスクドライブ115a,bとシステムバス30との間でデータの入出力を行うディスクインターフェース回路であり、圧縮部24、伸長部25、圧縮データバッファ33a,33bはディスクデータフローコントローラ26に接続される。
【0017】
図2、図3において、1は画像情報を保持した原稿、2,101は原稿台、102,105a,105bは送りローラー、106a,106bは原稿を照明する蛍光燈、107a,107b,108a,108b,109a,109bはミラー、110a,110bはレンズ、111a,111bは読取り素子としてのCCDである。112a,112bは排紙ローラー、116a,116bは原稿搬送ベルトである。図1で説明したように、7はキーボード、32は液晶ディスプレイ、34はファンクションキー、115は光磁気ディスクドライブである。
【0018】
本実施の形態の動作を図1、図2、及び図3を参照しつつ、(1)電源の投入、(2)原稿画像の読み込み、(3)画像の記録処理、(4)テキストブロックの表示処理及び表示テキストブロックの変更処理、の順に説明する。
【0019】
(1)電源の投入
まず操作者が、電源スイッチ(不図示)を投入すると、CPU10はROM11に記録されたプログラムに従って、RAMのチェック、内部パラメータの初期化、液晶ディスプレイのクリアを行う。これらの処理の後、操作者のファンクションキー34或いはキーボード7の操作待ちとなる。
【0020】
(2)原稿画像の読み込み
次に、原稿画像の読み込みを行う。図3に示すように、原稿を原稿積載台2へ積載された状態で、ファンクションキー34により読み取りを指示されると、送りローラ102等で原稿が1枚ずつ給送され、蛍光燈106、ミラー107等によって原稿画像がCCD111に送られ、読取りが行われる。読取りを終了した原稿は排紙ローラ112等によって装置外に排出される。
【0021】
(3)画像の記録処理
読み込んだ原稿画像は、自動的に圧縮部24に送られ、MH、MR、MMR、等の周知の画像圧縮方法で圧縮された後、圧縮データバッファー33a,33bに格納される。格納された圧縮画像データは、操作者の指示に従い、ディスクインターフェース回路27を介して光磁気ディスクドライブ115へ送られ、光磁気ディスク35に書き込まれる。検索のためのインデックスデータが入力されていた場合には、その検索情報も光磁気ディスク35上に画像、あるいは文書と関連付けられて記録される。
【0022】
ここで、本実施の形態において、読込んだ原稿画像がどのように管理されるかについて説明する。
【0023】
読込んだ原稿画像は、光磁気ディスクの中で複数ページ(或いは1ページでもよい)ひとまとめとしたファイル単位で管理される。各々のファイルに関する情報は、図4に示すような文書管理ファイルに記録され、記録された文書の各々のページに関する情報が、図5のページ管理ファイルに記録されている。光磁気ディスク上の画像データの位置、すなわち前述した圧縮画像データの位置は、図6に示したnodeテーブルというデータテーブルを光磁気ディスク35上に保持することによって管理する。このnodeテーブルは、周知のFAT(ファイルアロケーションテーブル)のどの位置がそのページの圧縮画像データの格納されている位置であるかを示すFATエントリと、その圧縮画像データのサイズ(バイト数)とを1レコードとするテーブルである。このnodeテーブルの何レコード目か、という値を“node番号”と称しており、図5のページ管理ファイルに、ページ毎に記録する。
【0024】
このような3つのテーブルをたどることにより、操作者が望むページの画像を光磁気ディスクから読み出し、表示することができる。
【0025】
(4)テキストブロックの表示処理及び表示テキストブロックの変更処理
次に、操作者が、テキストブロック表示を指示した場合の本実施の形態における処理について説明する。
【0026】
テキストブロックの表示は、表示すべき文書画像ファイルが選択されている状態において指示可能であり、例えば、求める文書が記載されたページの画像表示を見て、テキストブロック表示が望ましいと判断した上で指示できる。テキストブロック表示処理は、操作者がファンクションキー34からテキストブロック表示を指示することにより実行される。
【0027】
図7はテキストブロック表示の指示があった場合の、テキストブロック表示処理の概要を示すフローチャートである。そのフローの各処理を分けて説明する。
【0028】
{S701}:テキストブロック表示指示があると、文書画像に対してブロック選択技術を用いて領域分割を行う。領域分割はROM11のプログラムに基づいてCPU10が行う。
【0029】
上記技術は特開平6−68301に開示されている。上記技術から各領域の属性(テキスト、タイトル、ハーフトーン図形、表など)、画像上の位置、大きさなどをレイアウト解析データとして得ることができる。詳しくは、画像データ上で読み取り画像の黒画素に対し、連続している画素を検出することにより矩形を認識し、前記矩形により示される領域の幅、高さ、面積、画素密度を用いて該矩形の属性を識別し、前記領域の部分的なヒストグラムを算出し、比較することにより、その領域その属性を確定する。
【0030】
レイアウト解析結果のデータ・フォーマットを図8に示す。
【0031】
図8において、「対象矩形ヘッダ」、「レイアウトデータ」の各項目は以下のような意味を有する。
[対象矩形ヘッダ]
nrect : 対象矩形内の枠数
status : 対象矩形のレイアウト結果の状態
[レイアウトデータ]
order : 順序
att : 属性
x1 : 左上X座標
y1 : 左上Y座標
w : 幅
h : 高さ
direction: 組方向
selfID : 自己ブロック識別番号
upperID: 親ブロック識別番号
upperAtt: 親ブロック属性
また、識別可能なブロックの属性としては以下のようなものがある。
[属性]
・ルート
・テキスト
・ホワイト
・アンノウン
・ノイズ
・ピクチャー・ノイズ
・無効
・図中の小テキスト
・縦長セパレータ
・横長セパレータ
・アンダーライン
・フレーム
・変形セパレータ
・表
・セル
・空のセル
・ハーフトーン図形
・線図形
・図形またはハーフトーン図形中の図形
・図形またはハーフトーン図形中のハーフトーン図形
・タイトル
・キャプション
{S702}:レイアウト解析結果のデータから、原稿画像内のブロック数を調べる。ブロック数が1以上であればブロックは存在するので{S703}を実行する。ブロック数が0であれば{S708}を実行する。
【0032】
{S703}:1枠分のブロックデータを得る。
【0033】
{S704}:{S703}で得たブロックデータの属性がテキスト属性であるか調べる。得たブロックデータがテキストデータである場合は、{S705}を実行する。ブロックデータの属性がテキストデータでない場合は、{S707}を実行する。
【0034】
{S705}:{S704}にてテキストと判断されたブロックの表示処理を行う。表示処理は、まず選出されたブロックが存在するページのページ番号及び、選出されたブロックのブロックデータにより、図5のページ管理ファイルから、その文書の該当ページのレコードが選択されて、更にnode番号が特定されることにより、nodeテーブルから該当ページのFATエントリーを得る。次いで、上記のFATをたどることによって、論理アドレス列を得て、光磁気ディスク上の所望の圧縮画像データの特定が行われた後、CPU10がディスクインターフェース27を制御することにより光磁気ディスクドライブ115より圧縮画像データが読み出される。
【0035】
このとき、やはりCPU10の制御によって、ディスクデータフローコントローラ26はディスクインターフェース27からの圧縮画像データを伸長部25へと送るように機能する状態となっている。データフローコントローラ50は、伸長部25からの画像データをグラフィックRAM13へと格納し、選出されたブロックデータの位置情報(x1,y1,w,h)からテキストブロックをディスプレイ32に表示するようにCPU10により制御される。
【0036】
このようにして光磁気ディスクからテキストブロックの画像データが読み出され、液晶ディスプレイ32に表示される。この時点で、操作者からのテキストブロック表示指示に対する処理は終了し、次の表示テキストブロックの変更指示待ち状態となる。
【0037】
{S706}:表示ブロック変更の指示がされたかどうか調べる。操作者により表示ブロック変更の指示を受けた場合、{S707}を実行する。それ以外の指示の場合は、この処理を終了する。
【0038】
{S707}:次のブロックデータが存在するか調べる。存在する場合は{S703}の処理に戻り、存在しない場合は{S708}を実行する。
【0039】
{S708}:次のページが存在するか調べる。存在する場合は{S709}を実行し、存在しない場合は処理を終了する。
【0040】
{S709}:ページ番号を更新し、次のページのレイアウト解析結果のデータを得て、{S702}の処理に戻る。
【0041】
以上の処理から、テキストブロックの表示及び表示テキストブロックの変更が行われる。
【0042】
次に、具体的に例を挙げて上記テキストブロックの表示処理について説明する。例えば、図9のような文書画像が入力されており、操作者がこれを選択し、図10上のファンクションキー34によりテキストブロック表示を指示した場合、最初に画像91がディスプレイ32に表示され、操作者がファンクションキー34により表示テキストブロック変更の指示を行うごとに画像92、画像93、の順にテキストブロックを表示する。
【0043】
上記のように、図形や表などが混在した複数ページ文書に対し、テキストのみを抽出して表示し、読まれるべき順に表示テキストブロックを変更することが可能であるため、効率的に文書の内容が把握でき、かつ表示器が小さい場合でも操作を軽減することができるという効果を有する。
【0044】
なお、本実施の形態では、テキストブロックの表示指示がなされた時点で領域分割処理を行っているが、文書画像を入力してから外部からのテキストブロックの表示指示がなされるまでの間で領域分割処理を行うようにしてもよい。
【0045】
また、領域分割処理によって得られたレイアウト解析結果を光磁気ディスク等の記録媒体に記録していないが、レイアウト解析結果のデータを画像と関連付けて記録し、テキストブロック表示の指示を受けたときに、記録されているレイアウト解析.結果のデータを呼び出してテキストブロックの表示処理を行うような形態としてもよい。
【0046】
さらに、表示ブロックの変更指示により次に読まれるべきブロックの表示を行うこととしているが、同様の処理で、1つ前に読んだテキストブロックの表示、あるいは任意の数値分先のテキストブロックの表示、各ページの最初のテキストブロックの表示等を指示し、実行させることも可能である。
【0047】
[第2の実施の形態]
次に図11乃至図17を用いて本発明の第2の実施の形態に係る画像形成装置について説明する。本実施の形態に係る画像処理装置は、抽出した複数のテキストブロックをディスプレイ上に同時に表示可能であり、その表示されたテキストブロックの内、任意の1つを選択することにより、そのブロックが存在するページを表示できる点において前記第1の実施の形態と相違する。その他の構成及び作用については第1の実施の形態と同一なので、同一の構成部分については同一の符号を付してその説明は省略する。特に画像処理装置のハードウェア構成については、全く同一であって図1乃至3を用いて説明した通りである。
【0048】
本実施の形態の動作を以下に説明する。電源の投入、原稿画像の読み込みについては、実施の形態1と同一であるので割愛する。
【0049】
読込まれた、或いは外部から入力された画像データから、操作者が、表示したい文書ファイルを選択し、複数テキストブロック表示を指示すると、テキストブロックの記録の処理を行った後、その表示処理が行われる。そして、更に操作者が表示されたテキストブロックから1つのブロックを選択し、ページ表示指示を行うと、選択されたブロックを含むページの表示処理が行われることになる。
【0050】
以下に、これらの処理について分けて説明する。
【0051】
(1)テキストブロックの記録処理
図11はテキストブロックの記録処理の概要を示すフローチャートである。このフローの各処理を分けて説明する。
【0052】
{S1101}:まず、入力された原稿画像を実施の形態1と同様にブロック選択技術を用いて領域分割し、レイアウト解析結果のデータを得る。
【0053】
{S1102}:レイアウト解析結果のデータを用いて、原稿画像内のブロック数を調べる。ブロック数が1以上であればブロックは存在し{S1103}を実行する。ブロック数が0であればブロックは存在せず、{S1107}を実行する。
【0054】
{S1103}:1ブロック目のデータを得る。
【0055】
{S1104}:ブロックデータの属性を調べる。ブロックデータの属性がテキストである場合は{S1105}を実行する。ブロックデータの属性がテキストでない場合は{S1106}を実行する。
【0056】
{S1105}:テキスト属性が付与されたブロックデータは、図12に示すテキストブロック管理ファイルとしてRAM12に記憶する。
【0057】
{S1106}:次のブロックデータが存在するかどうか調べる。存在する場合は{S1103}の処理に戻り、存在しない場合は{S1107}を実行する。
【0058】
{S1107}:次のページデータが存在するかどうか調べる。存在する場合は{S1108}を実行し、存在しない場合は処理を終了する。
【0059】
{S1108}:ページ番号を更新し、次のページのレイアウト解析結果のデータを得て、{S1102}の処理に戻る。
【0060】
全てのブロックデータに対して上記の処理を行った結果、テキスト属性が付与されたブロックデータのみがメモリに記憶される。
【0061】
ここでは、このテキストブロック記録処理は、操作者が複数テキストブロックの表示指示に応じて行うこととしたが、画像の入力後、複数テキストブロックの表示指示があるまでの間に行ってもよい。
【0062】
(2)複数テキストブロックの表示
図13は複数テキストブロックの表示処理の概要を示すフローチャートである。このフローの各処理を分けて説明する。
【0063】
{S1301}:まず、テキストブロック管理ファイルから1番目のテキストブロックのデータを得る。
【0064】
{S1302}:テキストブロックがディスプレイに表示可能であるか調べる。本実施の形態では、ディスプレイに表示可能なテキストブロック数を8とする。現在表示しているブロック数が8ブロックに満たない場合、{S1303}を実行する。すでに8ブロックが表示されている場合は、処理を終了する。
【0065】
{S1303}:テキストブロックを表示する。まず{S1301}により得たブロックが存在するページのページ番号、及び、そのブロックデータにより、図14のページ管理ファイルから、その文書の該当ページのレコードが選択される。更に、node番号が特定されることにより、図15のnodeテーブルから該当ページのFATエントリーを得る。次いで、上記のFATをたどることによって、論理アドレス列を得て、光磁気ディスク上の所望の圧縮画像データの特定を行う。その後、CPU10がディスクインターフェース27を制御することにより光磁気ディスクドライブ115が光磁気ディスク35から特定した圧縮画像データを読み出す。このとき、やはりCPU10の制御によって、ディスクコントローラ26はディスクインターフェース27からの圧縮画像データを伸長部25へと送るように機能する状態となっている。出力データフローコントローラ30は、伸長部25からの画像データをグラフィックRAM13へと格納し、{S1301}より得たブロックデータの位置情報(x1,y1,w,h)からテキストブロックをディスプレイ32に表示するようにCPU10により制御される。
【0066】
{S1304}:テキストブロック管理ファイルに次のテキストブロックが存在するか調べる。存在する場合は{S1305}を実行する。存在しない場合は処理を終了する。
【0067】
{S1305}:テキストブロック管理ファイルから次のテキストブロックデータを得て、{S1302}の処理に戻る。
【0068】
(3)テキストブロックの選択によるページの表示
操作者が表示する文書を選択し、複数テキストブロックの表示を指示すると、図16に示すようにディスプレイ32には、複数のテキストブロックが表示される。
【0069】
次に操作者が、ディスプレイ上に表示されているテキストブロックから任意の1つを選択する。ディスプレイ上に表示されているテキストブロックは個々に選択できるようになっており、選択されたテキストブロックは太枠で囲まれる、あるいはカラー表示される。
【0070】
選択されたテキストブロックに対応するデータをテキストブロック管理ファイルにより調べ、ブロックデータ及びページ番号を獲得する。そして、これらのデータから選択されたブロックを含むページの表示処理を行う。
【0071】
例えば、図17のように画像171から画像175まで5ページある文書を操作者が選択し、複数テキストブロック表示を指示することにより、ディスプレイには図16のようにテキストブロックが表示されたとする。表示されているのは画像171(1ページ目)中のテキストブロック161,162,163、画像172(2ページ目)中のテキストブロック164,165、画像173中のテキストブロック166,167,168である。この状態で操作者がポインティングデバイスにより表示中のテキストブロックからテキストブロック165を選択すると、このテキストブロックが存在する画像172がディスプレイに表示される。
【0072】
このように、文書画像内のテキストブロックのみを複数表示できれば、図形、表、などを必要としない場合に効率的な表示が可能であり、また、テキストブロックを選択することにより所望のページを表示することができるので、効果的な文書検索が行えるという効果を有する。
【0073】
なお、本実施の形態では、ディスプレイ上に表示可能なテキストブロック数を8個としたが、これは一意ではなくディスプレイの大きさに合わせて他の数を設定してもよい。
【0074】
更に、本実施の形態では、テキストブロックを文書画像の先頭ページから現れた順に表示しているが、各ページから1テキストブロックのみを抽出し、ディスプレイに表示する等の変更も可能である。
【0075】
[その他の実施形態]
なお、上記実施の形態では複数種類のブロックから、テキストブロックを抽出して表示することとしているが、抽出するブロックの属性はテキストに限らず、同様の構成で写真等のハーフトーンの図形でも、タイトルでも抽出可能である。その場合も、その属性を有するブロックの抽出により、効率的に求める内容が把握でき、かつ表示器が小さい場合でも操作を軽減することができるという効果を有する。また、上記実施の形態では、表示出力を行う場合に所定の属性を有するブロックを抽出する処理について説明したが、表示出力に限定されず、印刷出力でもよい。
【0076】
また、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0077】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、図1に示したようなシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。特に図1に示す装置に適用する場合、ROM11をここで言う記憶媒体としてもよいし、別途、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録したハードディスク等の記憶装置を設けてもよい。
【0078】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0079】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0080】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0081】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0082】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードを格納することになる。すなわち、少なくとも、
画像及び画像の属性の選択指示、及び、選択された属性を持つ画像領域の抽出出力の指示を取得する「指示取得モジュール」と、
前記指示取得工程において取得した選択指示に基づく画像を、異なる属性を持つ画像領域に分割し、分割された画像領域から、前記指示取得工程おいて取得した選択指示に基づく属性を有する画像領域を抽出して出力する「抽出出力モジュール」、の各モジュールのプログラムコードを記憶媒体に格納すればよい。
【0083】
【発明の効果】
以上説明したように、本発明によれば、効率のよい画像出力を行うことのできる画像処理装置及び画像処理方法を提供することができる。特に、本発明に係る画像処理装置及び画像処理方法によれば、限られた出力範囲を有効に利用することができ、かつ容易に内容を把握することができるという効果がある。また、必要とする属性を有する画像領域のみを効果的に出力することができ、かつ効率的な画像検索を行うことができる。
【0084】
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る画像処理装置の全体構成図である。
【図2】本発明の第1の実施の形態に係る画像処理装置の光学系及び駆動系の構成図である。
【図3】本発明の第1の実施の形態に係る画像処理装置の外観図である。
【図4】本発明の第1の実施の形態に係る画像処理装置の文書管理ファイルの説明図である。
【図5】本発明の第1の実施の形態に係る画像処理装置のページ管理ファイルの説明図である。
【図6】本発明の第1の実施の形態に係る画像処理装置のnodeテーブルの説明図である。
【図7】本発明の第1の実施の形態に係る画像処理装置のテキストブロック表示処理を示すフローチャートである。
【図8】本発明第1の実施の形態に係るに画像処理装置の領域分割におけるレイアウト解析結果のデータ・フォーマットを示す図である。
【図9】本発明の第1の実施の形態に係る画像処理装置のテキストブロック表示処理を行う入力画像例を示す説明図である。
【図10】本発明の第1の実施の形態に係る画像処理装置のテキストブロック表示画面の説明図である。
【図11】本発明の第2の実施の形態に係る画像処理装置のテキストブロック抽出処理を示すフローチャートである。
【図12】本発明の第2の実施の形態に係る画像処理装置のテキストブロック管理ファイルの説明図である。
【図13】本発明の第2の実施の形態に係る画像処理装置のテキストブロック複数表示処理を示すフローチャートである。
【図14】本発明の第2の実施の形態に係る画像処理装置のページ管理ファイルの説明図である。
【図15】本発明の第2の実施の形態に係る画像処理装置のnodeテーブルの説明図である。
【図16】本発明の第2の実施の形態に係る画像処理装置の複数のテキストブロックを表示する画面の説明図である。
【図17】本発明の第2の実施の形態に係る画像処理装置のテキストブロックによるページ検索を示す説明図である。
Claims (6)
- 領域の属性に基づいて、画像を複数の画像領域に分割する分割工程と、
前記分割工程で分割された複数の画像領域のうち、操作者により指定された属性を有する画像領域を抽出する抽出工程と、
前記抽出工程で抽出された複数の画像領域を表示するように制御する第1表示工程と、
前記第1表示工程で表示された複数の画像領域の中から操作者により選択指示された画像領域を選択する選択工程と、
前記選択工程で選択された画像領域を含む前記分割工程で分割される前の画像を表示するように制御する第2表示工程と、
を有することを特徴とする画像処理方法。 - 前記画像は複数ページで構成される文書の画像であり、
前記分割工程では、前記画像の各ページを複数の画像領域に分割し、
前記第2表示工程では、前記選択工程で選択された画像領域を含むページの画像を表示するように制御することを特徴とする請求項1に記載の画像処理方法。 - 前記分割工程で分割される前記画像は、複数ページからなる文書のうちの各ページであり、
前記第2表示工程で表示されるように制御される前記分割される前の画像は、前記選択工程で選択された画像領域を含むページであって、前記分割工程で分割される前のページであることを特徴とする請求項1に記載の画像処理方法。 - 領域の属性に基づいて、画像を複数の画像領域に分割する分割手段と、
前記分割手段で分割された複数の画像領域のうち、操作者により指定された属性を有する画像領域を抽出する抽出手段と、
前記抽出手段で抽出された複数の画像領域を表示するように制御する第1表示手段と、
前記第1表示手段で表示された複数の画像領域の中から操作者により選択指示された画像領域を選択する選択手段と、
前記選択手段で選択された画像領域を含む前記分割手段で分割される前の画像を表示するように制御する第2表示手段と、
を有することを特徴とする画像処理装置。 - 前記画像は複数ページで構成される文書の画像であり、
前記分割手段では、前記画像の各ページを複数の画像領域に分割し、
前記第2表示手段では、前記選択手段で選択された画像領域を含むページの画像を表示するように制御することを特徴とする請求項4に記載の画像処理装置。 - 領域の属性に基づいて、画像を複数の画像領域に分割する分割工程と、
前記分割工程で分割された複数の画像領域のうち、操作者により指定された属性を有する画像領域を抽出する抽出工程と、
前記抽出工程で抽出された複数の画像領域を表示するように制御する表示工程と、
前記表示工程で表示された複数の画像領域の中から操作者により選択指示された画像領域を選択する選択工程と、
前記選択工程で選択された画像領域を含む前記分割工程で分割される前の画像を表示するように制御する第2の表示工程と、
の各工程をコンピュータに実行させるためのプログラムコードを格納したコンピュータ可読記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12784698A JP4035228B2 (ja) | 1998-05-11 | 1998-05-11 | 画像処理方法及び画像処理装置 |
US09/304,982 US6690492B2 (en) | 1998-05-11 | 1999-05-04 | Image processing method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12784698A JP4035228B2 (ja) | 1998-05-11 | 1998-05-11 | 画像処理方法及び画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11331571A JPH11331571A (ja) | 1999-11-30 |
JP4035228B2 true JP4035228B2 (ja) | 2008-01-16 |
Family
ID=14970125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12784698A Expired - Fee Related JP4035228B2 (ja) | 1998-05-11 | 1998-05-11 | 画像処理方法及び画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6690492B2 (ja) |
JP (1) | JP4035228B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7596755B2 (en) * | 1997-12-22 | 2009-09-29 | Ricoh Company, Ltd. | Multimedia visualization and integration environment |
EP1089163B1 (en) * | 1999-09-30 | 2003-04-23 | Brother Kogyo Kabushiki Kaisha | Data processing for arranging text and image data on a substrate |
JP2001236287A (ja) * | 2000-02-24 | 2001-08-31 | Matsushita Electric Ind Co Ltd | 画像表示方法及び該方法により画像を表示する携帯端末 |
JP5033277B2 (ja) * | 2000-09-12 | 2012-09-26 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体 |
US7015401B2 (en) * | 2001-11-23 | 2006-03-21 | Aiptek International, Inc. | Image processing system with handwriting input function and the method for forming the same |
US7340092B2 (en) | 2001-12-21 | 2008-03-04 | Minolta Co., Ltd. | Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored |
JP4152927B2 (ja) * | 2004-08-02 | 2008-09-17 | シャープ株式会社 | 画像処理装置、画像形成装置、処理原稿検索方法、処理原稿検索プログラム、記録媒体 |
US20070030502A1 (en) * | 2005-08-02 | 2007-02-08 | Van Cauwenberghe Jean-Thomas F | Zebratext |
US20070143660A1 (en) * | 2005-12-19 | 2007-06-21 | Huey John M | System and method for indexing image-based information |
US9160572B2 (en) * | 2006-10-17 | 2015-10-13 | Telecommunication Systems, Inc. | Automated location determination to support VoIP E911 using self-surveying techniques for ad hoc wireless network |
JP4510056B2 (ja) * | 2007-06-05 | 2010-07-21 | シャープ株式会社 | 画像形成装置及びコンピュータプログラム |
CN103020020B (zh) * | 2007-11-20 | 2016-02-03 | 日本电气株式会社 | 电子文本阅览装置、方法以及移动电话 |
US9019568B2 (en) * | 2012-03-22 | 2015-04-28 | Intuit Inc. | Accurately extracting information based on orthogonal images |
US9310983B2 (en) * | 2013-10-16 | 2016-04-12 | 3M Innovative Properties Company | Adding, deleting digital notes from a group of digital notes |
WO2015057804A1 (en) | 2013-10-16 | 2015-04-23 | 3M Innovative Properties Company | Organizing digital notes on a user interface |
DE102015006902B3 (de) * | 2015-06-04 | 2016-06-30 | Drägerwerk AG & Co. KGaA | Vorrichtung zur Verarbeitung und Visualisierung von Daten eines Elektro-lmpedanz-Tomographie-Gerätes zu einer Ermittlung und Visualisierung von regionalen Verzögerungen der Ventilation in der Lunge |
US10754541B2 (en) * | 2015-09-18 | 2020-08-25 | Adobe Inc. | Expandable drawing surface |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5369716A (en) * | 1989-08-31 | 1994-11-29 | Kabushiki Kaisha Toshiba | Document reader and reading processing method therefor |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
EP0587450B1 (en) * | 1992-09-11 | 2004-11-17 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JPH07131641A (ja) * | 1993-11-08 | 1995-05-19 | Canon Inc | 画像処理装置 |
US6005679A (en) * | 1994-08-22 | 1999-12-21 | Fuji Photo Film Co., Ltd. | Image data filing system for quickly retrieving an area of interest of an image from a reduced amount of image data |
JP3380831B2 (ja) * | 1996-03-08 | 2003-02-24 | シャープ株式会社 | 画像形成装置 |
-
1998
- 1998-05-11 JP JP12784698A patent/JP4035228B2/ja not_active Expired - Fee Related
-
1999
- 1999-05-04 US US09/304,982 patent/US6690492B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH11331571A (ja) | 1999-11-30 |
US20030076539A1 (en) | 2003-04-24 |
US6690492B2 (en) | 2004-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4035228B2 (ja) | 画像処理方法及び画像処理装置 | |
US8203748B2 (en) | Image processing apparatus, control method therefor, and program | |
US8320019B2 (en) | Image processing apparatus, image processing method, and computer program thereof | |
US7272269B2 (en) | Image processing apparatus and method therefor | |
US8542953B2 (en) | Image processing apparatus and image processing method | |
JP2000067155A (ja) | 画像処理装置及びその方法、コンピュ―タ可読メモリ | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
CN1838725B (zh) | 记录数据记录装置和记录数据记录方法 | |
JP6254002B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
US8818110B2 (en) | Image processing apparatus that groups object images based on object attribute, and method for controlling the same | |
US6714682B2 (en) | Image processing device and method and memory medium | |
JP2005107691A (ja) | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 | |
US9858513B2 (en) | Document file output apparatus, document file output method, and computer readable medium | |
JP4101052B2 (ja) | 文書管理装置、文書管理装置の制御方法、及び、コンピュータプログラム | |
JP2001307109A (ja) | 画像処理方法、装置および記録媒体 | |
EP1061460B1 (en) | Partial image forming method and apparatus for filing documents | |
US20090290797A1 (en) | Image processing for storing objects separated from an image in a storage device | |
JP3997696B2 (ja) | 画像処理のための装置、方法及び記録媒体 | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP4569162B2 (ja) | 画像処理方法、画像処理プログラムおよび画像処理装置 | |
US20020031270A1 (en) | Image processing apparatus, image processing method, and computer readable storage medium | |
JP2002024799A (ja) | 画像処理のための装置、方法および記録媒体 | |
JPH11224259A (ja) | 画像処理装置、画像処理方法および記憶媒体 | |
JP2000188676A (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050511 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20050511 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050511 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070615 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071029 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101102 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101102 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111102 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121102 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131102 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |